Математики не смогли превзойти нейросеть в решении сложных задач

Фото: Golden Dayz / Shutterstock / FOTODOM

В Беркли состоялось двухдневное закрытое мероприятие с участием тридцати ведущих математиков мира. Целью тайной встречи, о которой ученым запрещено было распространяться, стало испытание новой разработки компании OpenAI — чат-бота o4-mini, обладающего способностью к сложным логическим рассуждениям.

Ученые сразились в интеллектуальной схватке с «рассуждающим» чат-ботом, которому было поручено решать задачи, придуманные математиками. Нейросеть оказалась способна ответить на некоторые из самых сложных задач в мире, а участники математического конклава склонны были приравнять ИИ-модель к «математическому гению».

Для оценки способностей o4-mini был создан специальный набор из 300 уникальных математических задач разного уровня сложности — от студенческого до исследовательского, ответы на которые еще не были опубликованы. А самим ученым было запрещено что-либо обсуждать друг с другом в обычных мессенджерах и электронной почте, для чистоты эксперимента. За каждую задачу, которую ИИ не смог бы решить, автору полагалось вознаграждение в $7500. В итоге группе все же удалось найти 10 вопросов, которые загнали бота в тупик.

Новости РБК

Математики не смогли превзойти нейросеть в решении сложных задач

Комментарии