AI для замены слов в видео

Статус
В этой теме нельзя размещать новые ответы.

bodyk2

Новорег
Статус
Offline
Регистрация
25 Апр 2024
Сообщения
1
Лайки
0
Нужна нейронка способная заменить слово в видео , при этом сохраняя голос и тембр автора
 
Такая штука уже на подъёме! Смотри, технология называется audio/video inpainting или voice replacement с помощью нейросетей, и некоторые сервисы уже умеют делать похожее: например, ElevenLabs Voice AI, Descript Overdub, а по видео — Runway (там есть текстовая замена объектов, но со словами пока больше экспериментируют).

Чтобы именно заменить слово в видео, чтобы голос остался тем же, нужны две вещи:
1. Синтез голоса. Нейросеть обучается на голосе автора и генерирует любые нужные слова так, что слышно, будто это сказал он сам. ElevenLabs или Microsoft VALL-E уже близко.
2. Сведение дорожек. Можно “перерезать” нужное слово в видео, вставить синтезированное и аккуратно склеить, чтобы по губам совпадало. Тут поможет Adobe Enhance или тот же Descript, у которых есть почти магическая автосинхронизация аудио и видео.

Но полностью автоматическо и идеально существующее решение — пока только в дорогом видеопродакшене или лабораториях. Для бытового уровня чаще делают костыль: вырезают слово, генерируют новое через TTS и вручную клеят обратно в видео редакторе (Premiere, CapCut и т.п.).

Если гуглить — ищи термины типа voice cloning, audio inpainting, text-based video editing.

Для экспериментов советую:
  • Descript: там есть Overdub (замена слов) и автоматический lipsync.
  • ElevenLabs VoiceLab: клонит голос отлично, но надо аккуратно вставлять звук в видео.
  • Runway: пока больше про визуальное, но быстро добавляют новые фичи.

Пиши, если нужна подробная инструкция под твой кейс или ссылка на конкретные сервисы — подскажу, что настроить и как извернуться!
 
1. Vrew — редактирует аудио через текст: просто выбери слово в автоматической транскрипции и напиши новое — система пересинтезирует его в том же голосе.

2.Descript (Video Regenerate) — работает с видео и текстом: исправляешь слово в транскрипте, а ИИ генерирует новый звук и подстраивает движение губ, чтобы всё выглядело естественно.

3. Wavel AI — онлайн-редактор с клонированием голоса и заменой озвучки (можно загрузить видео, выбрать свой клон голоса и заменить произнесённые слова/фразы).

Vrew и Descript удобнее для именно замены слов/фраз, Wavel полезен, если нужно полностью заменить аудио в видео, сохранив голос похожим на оригинальный.
 
Обратите внимание, если вы хотите провести сделку с этим пользователем, то он заблокирован, настоятельно рекомендуем ее не производить до окончания блокировки.
Попробуй Sora - очень хороший
 
Статус
В этой теме нельзя размещать новые ответы.

ВопросMega.nz не грузит

ВопросКак сменить регион google аккаунта?

Назад
Сверху