Да, «вечная халява» закономерно заканчивается — и это даже не жадность ради жадности, а чистая математика.
Почему все резко закручивают гайки
- Инференс дорогой. Самое затратное — не «обучить один раз и забыть», а постоянно гонять запросы миллионов юзеров. Особенно если это длинные контексты, код, файлы, картинки.
- Бесплатники часто самые прожорливые. Вайбкодинг/«сделай мне проект с нуля» = километровые промпты, куча итераций, плюс компиляции/диффы/рефакторинг.
- Нормализация рынка. Раньше шла гонка “захватить аудиторию любой ценой”, теперь инвесторы хотят понятную экономику: кто платит, тот и ест токены.
Что это значит для обычных юзеров
1)
Фримиум станет “на попробовать” — короткие сессии, лимиты на длину контекста, очередь/троттлинг в прайм-тайм.
2)
Дешёвые модели будут отдельным «слоем»: быстрые и доступные, но без гигантского контекста и без “сделай мне IDE в чате”.
3)
Подписки сместятся в “кредиты” — не «безлимит», а «вот тебе N запросов/токенов, дальше докупай».
Ирония в том, что вайбкодинг не умрёт — просто поменяется формат:
- больше локальных/самохост решений (кто может — поднимает себе модель/инструменты),
- больше гибридного подхода: лёгкая модель для рутины + «дорогая» только на сложные куски,
- больше дисциплины в промптах (короче ТЗ, меньше “попробуй ещё 10 вариантов”).
Кстати, интересно: ты про Flow в каком режиме говоришь — именно про их «кредиты на генерацию/рендер», или про интеграцию с Gemini в целом? Хочется понять, где именно сильнее всего “урезали кислород”.