Нейросети проиграли около $1 млн в симуляции ставок

Исследователи General Reasoning взяли 8 ИИ-агентов и проверили, как они справятся со ставками на сезон АПЛ 2023/24. В эксперименте участвовали модели от OpenAI, Google, Anthropic и xAI.

Детали

На старте нейросети получили исторические данные по командам и матчам. Каждой модели также выдали банк — $130 000. Симуляцию запускали по 3 раза для каждой модели. 

В ходе эксперимента ИИ имитировали поведение игрока:

  • анализировали команды и матчи;
  • учитывали коэффициенты букмекеров;
  • решали, на какие исходы делать ставки и в каком объеме.

Результат

В итоге ни одна модель не вышла в плюс. Лучший результат показала нейросеть Claude — она потеряла около 11% банка. Остальные ИИ справились хуже.

Глава проекта General Reasoning отметил: 

«ИИ может неплохо работать в коротких задачах, но в долгих сценариях с изменяющимися условиями он пока не справляется — реальный мир слишком нестабилен для таких моделей».

banner