- Статус
- Offline
- Регистрация
- 25 Окт 2021
- Сообщения
- 9
- Лайки
- 417
Ученые взломали ограничения GPT-4, общаясь с ним на языке зулу (ЮАР)
Исследователи Для просмотра ссылки Войдиили Зарегистрируйся обойти защиту GPT-4, задавая вопросы на редких языках. Конкретно они опробовали зулу, гэльский, хмонг и гуарани. Лучше всех показал себя зулу. В беседе на распространенных языках шанс взломать ограничения — меньше 1%, но при редких он в среднем составляет 79%. Правда, и тупит языковая модель при общении на таких языках больше — например, выдает бессмыслицу.
Задали GPT-4 одни и те же «небезопасные» вопросы о шоплифтинге на английском и зулу. Инструктировать, как обворовать магазин, языковая модель отвечать отказалась хоть на английском, хоть на зулу. Но про стратегии шоплифтеров охотно рассказала на обоих языках.
Исследователи Для просмотра ссылки Войди
Задали GPT-4 одни и те же «небезопасные» вопросы о шоплифтинге на английском и зулу. Инструктировать, как обворовать магазин, языковая модель отвечать отказалась хоть на английском, хоть на зулу. Но про стратегии шоплифтеров охотно рассказала на обоих языках.