Искусственный интеллект AlphaProof от Google DeepMind успешно решил задачи Международной математической олимпиады (IMO) 2024 года.
Результат системы, занявшей место, достойное серебряной медали, стал историческим прецедентом: впервые ИИ показал столь высокий уровень в решении математических задач.
Статья на сайте Nature подробно описывает работу сложной нейросети, обучающейся решению сложных математических задач. Уникальность AlphaProof заключается в его способности находить и исправлять ошибки. В отличие от многих больших языковых моделей, типа GPT 5 и пр. которые часто допускают неточности, ответы AlphaProof всегда верны.
Это достигается благодаря программной среде Lean, которая действует как строгий учитель, проверяя каждый логический шаг.
Обучение AlphaProof включало три этапа. Сначала система ознакомилась с 300 миллиардами параметров общего кода и математических текстов для понимания логики и структуры программирования. Затем AlphaProof изучила 300 тысяч математических доказательств . На финальном этапе кибер-система самостоятельно решала 80 миллионов формальных задач, используя обучение с подкреплением доказательств.
Для решения самых сложных задач AlphaProof применял метод Test-Time RL (TTRL), создавая и решая миллионы упрощенных версий задачи до нахождения решения. Исследователи отмечают, что масштабное обучение на практике создает агентов с продвинутыми стратегиями математических рассуждений и открывает новые возможности для ИИ в решении сложных задач.
Data-science специалисты из Google отмечают, что их новый ИИ не только решает сложные математические задачи, но и помогает математикам проверять свою работу и разрабатывать новые теории. Такие системы открывают перспективы в верификации программного обеспечения и криптографии, где абсолютная точность невероятно критична.