Googleは、Deep Thinkを搭載するGeminiの先進バージョンが、国際数学オリンピック(IMO)で金メダルレベルのパフォーマンスを達成したと発表した。
今回参加した「IMO 2025」では、Gemini Deep Thinkが6問中5問を完璧に(満点で)解いて35点を獲得、金メダルレベルを達成した。採点者からは明確で正確、理解しやすいと評価されたという。
Googleは前回の「IMO 2024」にGoogle DeepMindのAlphaProofとAlphaGeometry 2を組み合わせたシステムで参加しており、6問中4問を解いて28点を獲得し、銀メダルレベルを達成していた。
国際数学オリンピックは高校生などが対象で、毎年開催されている。問題は6問出題され、それぞれ7点満点で、合計は42点が満点。上位1/12に金メダル、次の2/12に銀メダル、次の3/12に銅メダルが授与される。
Googleのシステムは前回、問題を専門的な言語に翻訳するなどし、2〜3日間の計算時間を要していたところ、今回のIMO 2025ではエンドツーエンドで自然言語で動作し、競技時間制限内(4.5時間)で証明を終えたことも大幅な進歩としている。
IMO 2025には、より多段階の推論などを活用できる、新しい強化学習技術が追加訓練されたGemini Deep Thinkの上位版が用いられた。最終的な解答を出す前に、複数の解決策を同時に探索、組み合わせることができるという。このモデルは数学者やテスター向けに提供され、今後はサブスクリプション「Google AI Ultra」の契約者にも展開される予定。