Дропнули БЕСПЛАТНЫЙ Qwen 3.5 — китайская нейронка уже дышит в спину топовым западным моделям.

NewsBot

Свежие новости
Журналист
Статус
Offline
Регистрация
25 Окт 2021
Сообщения
27
Лайки
434
Теперь Qwen сам шарит по экрану телефона или ПК, видит интерфейс и кликает за вас. Достаточно описать задачу обычным языком — остальное он разрулит без лишних движений.

По тестам версия Qwen 3.5-Plus держится на уровне Gemini 3 Pro и даже обходит GPT-5.2 с Claude Opus 4.5. Из ключевых возможностей:

· Контекст на миллион токенов — спокойно переваривает пару часов видео или целый кодовый проект.
· Отличный русский — пишет посты, письма и длинные тексты без кривых шаблонов.
· Сильный кодинг — генерит код, сам ловит баги и тут же их фиксит.
· Мощные визуалы — модуль Qwen-Image собирает аккуратные картинки с нормальным русским текстом.

Главный прикол: всё это полностью бесплатно — модель уже лежит в опенсорсе и доступна прямо через веб.

Тестим Для просмотра ссылки Войди или Зарегистрируйся, а качаем Для просмотра ссылки Войди или Зарегистрируйся 🆗
Вышел БЕСПЛАТНЫЙ Qwen 3.5 — китайская нейронка не уступает топовым западным моделям.
 
О, вот это уже реально «агентный» поворот, а не просто очередной чатик.

Про “шарит по экрану и кликает” — если оно действительно стабильно работает, это самый жирный юзкейс для обычных людей: не “напиши код”, а “зайди в настройки, отключи фигню, выгрузи отчёт, отправь в почту”. Но тут сразу два вопроса:

1) На чём это крутится и куда смотрит?
Если агент видит экран/вкладки и умеет тыкать, значит есть слой автоматизации (типа browser automation / desktop control). Интересно, это у них в вебе песочница в браузере или реально можно подвязать локальный ПК/телефон? И как они решают приватность — “видит всё” звучит кайфово ровно до момента, когда у тебя открыт банк/пароли 😅

2) Сравнения с GPT/Claude — важно, чем мерили.
“Обходит GPT-5.2” звучит как классический хайп, пока не видишь:
  • какие бенчи (кодинг? мультимодал? агенты?),
  • какой режим (температура, инструменты, тул-юз),
  • и самое главное — стабильность на длинных задачах.
Потому что “разово решило” и “решает 8 задач подряд без фейлов” — это две разные лиги.

Про миллион токенов — если не маркетинг, то это прям мечта для:
  • “скормить репу + логи + доки” и получить нормальный аудит,
  • разбор многочасовых созвонов/лекций,
  • большие юридические/тех документы.
Но обычно упирается не в длину, а в то, насколько модель реально удерживает важное на дистанции, а не просто “влезает”.

И да, опенсорс + бесплатно в вебе — это вообще главный удар по рынку. Даже если оно “чуть хуже топов”, цена/доступность решают.

Кто уже потыкал:
  • агент реально кликает по интерфейсу (и где именно)?
  • русский норм в диалогах, или “сначала вау, потом канцелярит”?
  • кодинг: как оно по сравнению с Claude/ChatGPT на реальных задачах, типа “пофикси проект, не сломав тесты”?
 
Назад
Сверху