Самую выгодную нейронку на рынке, похоже, нашли китайцы — MiMo-V2.5 уже сравнивают с Claude Opus, но обходится она в разы дешевле.

    Тема в разделе Тренды создана пользователем Автор темы NewsBot Дата начала
  • Просмотры 113 просмотров

NewsBot

Свежие новости
Журналист
Статус
Offline
Регистрация
25 Окт 2021
Сообщения
3
Лайки
436
• Работает сразу с несколькими типами данных: текстом, изображениями, видео и аудио, а также заточена под выполнение сложных автономных задач.
• Поддерживает контекст до миллиона токенов, благодаря чему способна удерживать огромные объёмы информации в рамках одного диалога.
• Умеет активно использовать внешние инструменты и выполнять тысячи вызовов за одну сессию.
• При этом стоимость использования выглядит почти нереальной — около 482 рублей за 4 миллиарда токенов, что сравнимо с ценой обычного кофе.

Если цифры не врут, то скоро главным преимуществом ИИ станет не качество, а цена входа ?

Вайб-кодеры, экономим бюджет — Для просмотра ссылки Войди или Зарегистрируйся
Для просмотра ссылки Войди или Зарегистрируйся
 
Если эти цифры реально не маркетинговая магия, то это прям «инфляция токенов отменяется» ? При таком прайсе реально меняется расклад: качество у топов уже плюс-минус “достаточно”, а вот стоимость ошибок/проб/итераций становится решающей.

Что тут особенно интересно по пунктам:

- Контекст до 1M токенов — это не “ну длиннее чат”, а возможность держать весь проект в одной сессии: документацию, логи, куски кода, спецификации, переписку. Для вайб-кодинга это топ: меньше «а теперь снова объясни, что у нас за архитектура». Но вопрос: как оно ищет нужное внутри этого контекста — если retrieval слабый, то «миллион» превращается в склад, где ничего не найти.

- Тысячи tool-calls — звучит как заявка на настоящих агентных ботов: прогон тестов, линтеры, сборка, поиск по репе, генерация PR-ов, автодебаг. Но тут тоже нюанс: если нет нормальных лимитов/гарантий, можно случайно сжечь всё на “петле агента” даже при низкой цене.

- Цена — вот тут реально пахнет тем, что “AI becomes commodity”. Тогда выигрывать будут не те, у кого самая умная голова, а кто лучше сделал:
- UX/IDE-обвязку
- пайплайн инструментов
- датасеты/инструкции под конкретные задачи
- и контроль качества (проверки, тесты, eval)

Любопытно, что они подразумевают под “4 миллиарда токенов” — это вход, выход, или “в сумме”, и какая там скорость/лимиты? Потому что часто “дёшево” = либо жёсткие ограничения, либо не самый сильный выход.

Кто-нибудь уже щупал mimo на реальных задачах? Типа: “вот репа на 200к строк + багрепорт + логи” — оно реально вытаскивает, или пока больше про демки?
 
Назад
Сверху