Сообщение Re[5]: Видеокодек на основе ИИ - будет ли? от 17.11.2025 9:48
Изменено 17.11.2025 11:12 vdimas
Re[5]: Видеокодек на основе ИИ - будет ли?
Здравствуйте, Shmj, Вы писали:
S>Здравствуйте, vdimas, Вы писали:
V>>Угу...
V>>Ну вот опиши словами несколько пусть даже периодических узоров на народном платье, надетом на одного из персонажей киношки.
V>>С указанием точного цвета, особенностей материалов и т.д.
S>Можно для ключевых сцен делать 1 фото, а уже ИИ пусть на основе фото додумывает
Во-от!
Итого, ты предлагаешь гнать ключевые кадры, как в современных кодеках сжатия видео?
Это уже львиная доля трафика, бо разностные кадры сжимаются чудовищно сильно, в сравнении с ключевым кадром, особенно с motion detection.
А потом ты обнаружишь, что трудно в каждый момент времени алгоритмически понять — на каком фото узор выглядит достаточно хорошо и одновременно так и требуется требуется зрителю, чтобы узор выглядел именно в этом кадре хорошо, а на каком искажённо (складки, угол зрения к плоскости узора, тени и т.д.). И еще увидишь, что разные части экрана требуют подробностей в разные моменты времени.
В общем, upscaling хорош тем, что действует относительно независимо на различных участках кадра и сохраняет особенности изображения на каждом участке.
Если включить здравый смысл и порассуждать, то некий баланс видится в том, что ключевые кадры могут гнаться в хорошем разрешении — они будут как бы "настраивать" ИИ на характер изображения, плюс задавать общее качество передачи, а разностные кадры могут гнать в кратно меньшем разрешении, полагаясь на ИИ-upscaling.
При этом сам телек дополнительно преобразует из, допустим, 4k описанной передачи в 16k через тот же ИИ-upscaling.
Эта схема выглядит вполне себе рабочей.
S>Здравствуйте, vdimas, Вы писали:
V>>Угу...
V>>Ну вот опиши словами несколько пусть даже периодических узоров на народном платье, надетом на одного из персонажей киношки.
V>>С указанием точного цвета, особенностей материалов и т.д.
S>Можно для ключевых сцен делать 1 фото, а уже ИИ пусть на основе фото додумывает
Во-от!
Итого, ты предлагаешь гнать ключевые кадры, как в современных кодеках сжатия видео?
Это уже львиная доля трафика, бо разностные кадры сжимаются чудовищно сильно, в сравнении с ключевым кадром, особенно с motion detection.
А потом ты обнаружишь, что трудно в каждый момент времени алгоритмически понять — на каком фото узор выглядит достаточно хорошо и одновременно так и требуется требуется зрителю, чтобы узор выглядел именно в этом кадре хорошо, а на каком искажённо (складки, угол зрения к плоскости узора, тени и т.д.). И еще увидишь, что разные части экрана требуют подробностей в разные моменты времени.
В общем, upscaling хорош тем, что действует относительно независимо на различных участках кадра и сохраняет особенности изображения на каждом участке.
Если включить здравый смысл и порассуждать, то некий баланс видится в том, что ключевые кадры могут гнаться в хорошем разрешении — они будут как бы "настраивать" ИИ на характер изображения, плюс задавать общее качество передачи, а разностные кадры могут гнать в кратно меньшем разрешении, полагаясь на ИИ-upscaling.
При этом сам телек дополнительно преобразует из, допустим, 4k описанной передачи в 16k через тот же ИИ-upscaling.
Эта схема выглядит вполне себе рабочей.
Re[5]: Видеокодек на основе ИИ - будет ли?
Здравствуйте, Shmj, Вы писали:
S>Здравствуйте, vdimas, Вы писали:
V>>Угу...
V>>Ну вот опиши словами несколько пусть даже периодических узоров на народном платье, надетом на одного из персонажей киношки.
V>>С указанием точного цвета, особенностей материалов и т.д.
S>Можно для ключевых сцен делать 1 фото, а уже ИИ пусть на основе фото додумывает
Во-от!
Итого, ты предлагаешь гнать ключевые кадры, как в современных кодеках сжатия видео?
Это уже львиная доля трафика, бо разностные кадры сжимаются чудовищно сильно, в сравнении с ключевым кадром, особенно с motion detection.
А потом ты обнаружишь, что трудно в каждый момент времени алгоритмически понять — на каком фото узор выглядит достаточно хорошо и одновременно так и требуется требуется зрителю, чтобы узор выглядел именно в этом кадре хорошо, а на каком искажённо (складки, угол зрения к плоскости узора, тени и т.д.). И еще увидишь, что разные части экрана требуют разных подробностей в разные моменты времени.
В общем, upscaling хорош тем, что действует относительно независимо на различных участках кадра и сохраняет особенности изображения на каждом участке.
Если включить здравый смысл и порассуждать, то некий баланс видится в том, что ключевые кадры могут гнаться в хорошем разрешении — они будут как бы "настраивать" ИИ на характер изображения, плюс задавать общее качество передачи, а разностные кадры могут гнать в кратно меньшем разрешении, полагаясь на ИИ-upscaling.
При этом сам телек дополнительно преобразует из, допустим, 4k описанной передачи в 16k через тот же ИИ-upscaling.
Эта схема выглядит вполне себе рабочей.
S>Здравствуйте, vdimas, Вы писали:
V>>Угу...
V>>Ну вот опиши словами несколько пусть даже периодических узоров на народном платье, надетом на одного из персонажей киношки.
V>>С указанием точного цвета, особенностей материалов и т.д.
S>Можно для ключевых сцен делать 1 фото, а уже ИИ пусть на основе фото додумывает
Во-от!
Итого, ты предлагаешь гнать ключевые кадры, как в современных кодеках сжатия видео?
Это уже львиная доля трафика, бо разностные кадры сжимаются чудовищно сильно, в сравнении с ключевым кадром, особенно с motion detection.
А потом ты обнаружишь, что трудно в каждый момент времени алгоритмически понять — на каком фото узор выглядит достаточно хорошо и одновременно так и требуется требуется зрителю, чтобы узор выглядел именно в этом кадре хорошо, а на каком искажённо (складки, угол зрения к плоскости узора, тени и т.д.). И еще увидишь, что разные части экрана требуют разных подробностей в разные моменты времени.
В общем, upscaling хорош тем, что действует относительно независимо на различных участках кадра и сохраняет особенности изображения на каждом участке.
Если включить здравый смысл и порассуждать, то некий баланс видится в том, что ключевые кадры могут гнаться в хорошем разрешении — они будут как бы "настраивать" ИИ на характер изображения, плюс задавать общее качество передачи, а разностные кадры могут гнать в кратно меньшем разрешении, полагаясь на ИИ-upscaling.
При этом сам телек дополнительно преобразует из, допустим, 4k описанной передачи в 16k через тот же ИИ-upscaling.
Эта схема выглядит вполне себе рабочей.