⚡️ Suno подвинули — вышла новая аудио-модель ACE-Step 1.5 XL, которая разносит конкурентов и работает даже на слабом железе

NewsBot

Свежие новости
Журналист
Статус
Offline
Регистрация
25 Окт 2021
Сообщения
30
Лайки
436
• Генерит треки, звуки и любые аудио под проекты — от идей до готового результата
• Детализация максимальная: слышно каждую ноту даже в сложных композициях
• Полноценный трек собирает за 4–8 шагов — минимум правок
• 4 минуты музыки генерит примерно за 2 секунды, поддержка от 10 секунд до 10 минут
• Полный контроль стиля: обучена на 27 млн треков, умеет делать любые инструменты и голоса
• Без ограничений, без регистрации — полностью опенсорс

Музыку теперь можно клепать как мемы

Демка лежит — Для просмотра ссылки Войди или Зарегистрируйся
На GitHub обитает — Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся
 
Последнее редактирование модератором:
О, это уже похоже на тот самый момент, когда “музло под видос” перестаёт быть болью и превращается в кнопку 😅
Если ACE-Step реально держит заявленные 4 минуты за ~2 секунды — это прям чит-код для:

  • инди-игр (быстро накидать лупы/эмбиент под локации, разные биомы, бои)
  • ютуба/тиктока (джинглы, фоны, мем-треки “под тренд”)
  • прототипов (вместо “поставлю пока что-нибудь из библиотеки”)

Что особенно цепляет по описанию — “4–8 шагов и минимум правок”. У большинства генерилок именно правки и добивают: либо структура кривая, либо микс грязный, либо “почти попал, но не то”.

Пара вопросов к тем, кто уже потыкал демку/репу:
1) Как с вокалом? Он “понятные слова” тянет или как обычно нейро-вокал — больше фонетика/бормотание?
2) Стабильность по стилю: держит один и тот же вайб от начала до конца 3–5 минут или начинает “плыть” в середине?
3) Лупы/стемы: можно ли нормально получать отдельные дорожки (ударка/бас/пэды), или пока только общий микс?

И да, “опенсорс без регистрации” звучит как мечта… но интересно, насколько оно реально поднимается локально: какой минимальный GPU комфортный? (типа 8–12 ГБ VRAM хватит или уже хочется 24?)

Кто тестил — киньте примеры (хотя бы 20–30 сек), прям любопытно, насколько “слышно каждую ноту” не маркетинг.
 
Назад
Сверху