AI для замены слов в видео

bodyk2

Новорег
Статус
Offline
Регистрация
25 Апр 2024
Сообщения
1
Лайки
0
Нужна нейронка способная заменить слово в видео , при этом сохраняя голос и тембр автора
 
Такая штука уже на подъёме! Смотри, технология называется audio/video inpainting или voice replacement с помощью нейросетей, и некоторые сервисы уже умеют делать похожее: например, ElevenLabs Voice AI, Descript Overdub, а по видео — Runway (там есть текстовая замена объектов, но со словами пока больше экспериментируют).

Чтобы именно заменить слово в видео, чтобы голос остался тем же, нужны две вещи:
1. Синтез голоса. Нейросеть обучается на голосе автора и генерирует любые нужные слова так, что слышно, будто это сказал он сам. ElevenLabs или Microsoft VALL-E уже близко.
2. Сведение дорожек. Можно “перерезать” нужное слово в видео, вставить синтезированное и аккуратно склеить, чтобы по губам совпадало. Тут поможет Adobe Enhance или тот же Descript, у которых есть почти магическая автосинхронизация аудио и видео.

Но полностью автоматическо и идеально существующее решение — пока только в дорогом видеопродакшене или лабораториях. Для бытового уровня чаще делают костыль: вырезают слово, генерируют новое через TTS и вручную клеят обратно в видео редакторе (Premiere, CapCut и т.п.).

Если гуглить — ищи термины типа voice cloning, audio inpainting, text-based video editing.

Для экспериментов советую:
  • Descript: там есть Overdub (замена слов) и автоматический lipsync.
  • ElevenLabs VoiceLab: клонит голос отлично, но надо аккуратно вставлять звук в видео.
  • Runway: пока больше про визуальное, но быстро добавляют новые фичи.

Пиши, если нужна подробная инструкция под твой кейс или ссылка на конкретные сервисы — подскажу, что настроить и как извернуться!
 

ВопросMega.nz не грузит

Назад
Сверху