Информация об изменениях

Сообщение Re[5]: Видеокодек на основе ИИ - будет ли? от 17.11.2025 9:48

Изменено 17.11.2025 11:12 vdimas

Старый текст
Новый текст
Разница

Re[5]: Видеокодек на основе ИИ - будет ли?

Здравствуйте, Shmj, Вы писали:

S>Здравствуйте, vdimas, Вы писали:

V>>Угу...
V>>Ну вот опиши словами несколько пусть даже периодических узоров на народном платье, надетом на одного из персонажей киношки.
V>>С указанием точного цвета, особенностей материалов и т.д.

S>Можно для ключевых сцен делать 1 фото, а уже ИИ пусть на основе фото додумывает

Во-от!

Итого, ты предлагаешь гнать ключевые кадры, как в современных кодеках сжатия видео?
Это уже львиная доля трафика, бо разностные кадры сжимаются чудовищно сильно, в сравнении с ключевым кадром, особенно с motion detection.

А потом ты обнаружишь, что трудно в каждый момент времени алгоритмически понять — на каком фото узор выглядит достаточно хорошо и одновременно так и требуется требуется зрителю, чтобы узор выглядел именно в этом кадре хорошо, а на каком искажённо (складки, угол зрения к плоскости узора, тени и т.д.). И еще увидишь, что разные части экрана требуют подробностей в разные моменты времени.

В общем, upscaling хорош тем, что действует относительно независимо на различных участках кадра и сохраняет особенности изображения на каждом участке.

Если включить здравый смысл и порассуждать, то некий баланс видится в том, что ключевые кадры могут гнаться в хорошем разрешении — они будут как бы "настраивать" ИИ на характер изображения, плюс задавать общее качество передачи, а разностные кадры могут гнать в кратно меньшем разрешении, полагаясь на ИИ-upscaling.

При этом сам телек дополнительно преобразует из, допустим, 4k описанной передачи в 16k через тот же ИИ-upscaling.
Эта схема выглядит вполне себе рабочей.

Re[5]: Видеокодек на основе ИИ - будет ли?

Во-от!

Итого, ты предлагаешь гнать ключевые кадры, как в современных кодеках сжатия видео?
Это уже львиная доля трафика, бо разностные кадры сжимаются чудовищно сильно, в сравнении с ключевым кадром, особенно с motion detection.

А потом ты обнаружишь, что трудно в каждый момент времени алгоритмически понять — на каком фото узор выглядит достаточно хорошо и одновременно так и требуется требуется зрителю, чтобы узор выглядел именно в этом кадре хорошо, а на каком искажённо (складки, угол зрения к плоскости узора, тени и т.д.). И еще увидишь, что разные части экрана требуют разных подробностей в разные моменты времени.

В общем, upscaling хорош тем, что действует относительно независимо на различных участках кадра и сохраняет особенности изображения на каждом участке.

Если включить здравый смысл и порассуждать, то некий баланс видится в том, что ключевые кадры могут гнаться в хорошем разрешении — они будут как бы "настраивать" ИИ на характер изображения, плюс задавать общее качество передачи, а разностные кадры могут гнать в кратно меньшем разрешении, полагаясь на ИИ-upscaling.

При этом сам телек дополнительно преобразует из, допустим, 4k описанной передачи в 16k через тот же ИИ-upscaling.
Эта схема выглядит вполне себе рабочей.