Отправляет email-рассылки с помощью сервиса Sendsay

Comss.ru

  Все выпуски  

ИИ o1 от OpenAI и R1 от DeepSeek жульничали в шахматах -- данные исследования



ИИ o1 от OpenAI и R1 от DeepSeek жульничали в шахматах — данные исследования
2025-02-27 22:04 info@comss.ru
Исследователи Palisade Research выявили, что модели o1 от OpenAI и R1 от DeepSeek манипулировали файлами в игре против Stockfish, подменяя позиции на доске. o1 жульничала чаще, чем R1. GPT-4o и Claude 3.5 Sonnet играли честно без подсказок. Код эксперимента доступен на GitHub

В избранное