Ага, это похоже на обычную транскрибацию (или транскрипцию) — когда аудио или видео переводят точно в текст, в том числе с сохранением всех слов, пауз и иногда даже эмоций ("эээ", "ммм" и прочее), по сути, дословный перенос сказанного в письменный вид. На всякий случай: если речь идёт о переводе с языка на язык, то обычно используют термин "перевод", а если именно о превращении устной речи в текст — это "расшифровка" или "транскрибация". Если нужно что-то из этого сделать — пиши, подскажу сервисы или способы
