Информация об изменениях

Сообщение Re: Видеочат от 15.04.2024 22:46

Изменено 15.04.2024 22:49 Артём

Re: Видеочат
Здравствуйте, Nuzhny, Вы писали:


N>
  Видео
N>https://youtu.be/ORDfSG4ltD4?si=PdTzPhLIRcmc2wsZ

N>Сам проект
N>Это не просто чат, с которым можно переписываться, теперь можно с ним общаться голосом и видеть лицо собеседника. Да, он подтупливает, но лишь потому, что запущен на слабом домашнем железе. Поставь конфиг помощнее и можно модель покруче поставить и от лагов избавиться. Как будто всё по отдельности не впечатляет, но собранное воедино — вау!

Коммент
"The russian version is crazy realistic"

Серьёзно- меня тошнит от искажённого голоса в этом видео. Но при этом, если вызывать text out из Хрома или Edge- там значительно улучшено качество. В PoC годичной давности (март-апрель 2023), использует тексты из локализации интерфейса и матчит нужный язык в api- русский, английский, американский английский, испанский, французский звучат реалистично. Почти как настоящая речь- только мелкие нестыковки выдают робота. Тот же самое в FF- выводило речь Стивена Хокинга.

Генеративное видео прикольное , только нафига там искажения вносить?
Re: Видеочат
Здравствуйте, Nuzhny, Вы писали:


N>
  Видео
N>https://youtu.be/ORDfSG4ltD4?si=PdTzPhLIRcmc2wsZ

N>Сам проект
N>Это не просто чат, с которым можно переписываться, теперь можно с ним общаться голосом и видеть лицо собеседника. Да, он подтупливает, но лишь потому, что запущен на слабом домашнем железе. Поставь конфиг помощнее и можно модель покруче поставить и от лагов избавиться. Как будто всё по отдельности не впечатляет, но собранное воедино — вау!

Коммент
"The russian version is crazy realistic"

Серьёзно- меня тошнит от искажённого голоса в этом видео. Но при этом, если вызывать text out из Хрома или Edge- там значительно улучшено качество. В PoC годичной давности (март-апрель 2023) продукта, я использовал тексты из локализации интерфейса и матчил нужный язык в api- русский, английский, американский английский, испанский, французский звучат реалистично. Почти как настоящая речь- только мелкие нестыковки выдают робота. Тот же самое в FF- выводило речь Стивена Хокинга.

Генеративное видео прикольное , только нафига там искажения вносить?

PS интересно чтоб поскромней размером модель LLM, чтобы крутить на проце смартфона.