Поддержать команду Зеркала
Беларусы на войне
  1. В России рассказали, где в Беларуси может появиться вторая АЭС. Рассказываем, какие регионы рассматривают
  2. «Только сволочь так может поступать». Россия ударила по центру Сум, местные власти заявили о более 30 погибших
  3. «Это недопустимо». Лукашенко в очередной раз потребовал разобраться с вечной проблемой Минска
  4. «Просто фамилия — повод». Витебская сторонница «русского мира» рассказала, как силовики допрашивали ее дочь в поезде
  5. Власти анонсировали новое возможное ограничение для нанимателей
  6. Легко ли беларусу устроиться на фабрику, куда Лукашенко пригласил мигрантов из Пакистана
  7. В Беларуси начинают отключать отопление — когда и в каких городах
  8. Самый известный беларусский агент под прикрытием стал причиной смерти десятков беларусов, но его ждал страшный конец. Рассказываем
  9. «Они совершили ошибку». Трампа спросили об ударе России по Сумам
  10. В Дроздах третий год продают дом, который принадлежал экс-охраннику Лукашенко (не исключено, что и сейчас). Как выглядит жилье
  11. Клиентам некоторых банков нужно приготовиться к новшествам, которые появятся в мае
  12. «Говорят, что мы собираем деньги на бомбы, на ракеты». Одиозный минский священник посетовал на прессинг монастыря, помогающего военным РФ
  13. Десятки случаев. Узнали, как проходят проверки КГБ на железной дороге
  14. ISW: Тактика российского командования приводит к большим потерям, наступление России замедлится
  15. Такого дешевого доллара не видели давно: куда курс двинется дальше? Прогноз по валютам


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.