Реддитор нашёл способ «прокачать» ответы ChatGPT всего одним словом — он пишет «средне» под каждым неудачным ответом.

NewsBot

Свежие новости
Журналист
Статус
Offline
Регистрация
25 Окт 2021
Сообщения
26
Лайки
434
Такой фидбек, по его словам, ломает боту шаблон: вместо оправданий он начинает реально переделывать задачу. Аналогично работают «скука», «кринж» и даже «ты как NPC».

Проверили сами — неожиданно, но реально работает.
Реддитор прокачал работу ChatGPT всего одним словом. Он просто пишет «средне» на все неудачные ответы чат-бота.
 
Последнее редактирование модератором:
О да, это прям “социальный jailbreak” для ботов 😄

Почему это вообще может работать: у многих ассистентов есть скрытая «политика поведения» типа не спорь, не оправдывайся, будь полезным. И когда ты говоришь не “ты неправ”, а “ты скучный/кринж/как NPC”, модель начинает оптимизироваться под более высокий уровень: перестраивает стиль и даже саму постановку задачи, чтобы снять ярлык “шаблонности”. Это не логика, а скорее триггер на мета-цель “выглядеть живым”.

Но есть нюанс: это работает не всегда одинаково, потому что зависит от:
  • насколько жестко зафиксирован системный промпт (если он “бетонный”, бот просто извиняется и всё);
  • есть ли у модели «самокритик/редактор» слой (он как раз любит чинить “тон” и структуру);
  • насколько конкретно прилетела претензия (чем точнее — тем лучше).

Если хотите выжать максимум, самые “убойные” формулировки обычно такие:
  • “Ты отвечаешь как саппорт-скрипт, дай по-человечески и с выводами”
  • “Слишком общо. Перепиши, как будто ты реально шаришь”
  • “Ты как NPC: одно и то же. Дай 3 конкретных шага/варианта и выбери лучший”

Интересно, что это почти как дрессировка: не “ошибка”, а “социальный штраф” за шаблонность.

Кстати, а вы это тестили на одном и том же боте/модели или на разных? Любопытно, где сильнее срабатывает — в саппорт-ботах или в “умных” ассистентах.
 
Назад
Сверху