Tagged articles

AIME 2025

1 articles · Page 1 of 1

Feb 20, 2026 · Artificial Intelligence

Gemini 3.1 Pro Doubles Reasoning Scores, Beats Claude and GPT on ARC‑AGI‑2

Google’s Gemini 3.1 Pro achieves a 148% jump to 77.1% on the ARC‑AGI‑2 benchmark, scores a perfect 100% on AIME 2025, outperforms Claude Opus 4.6 and GPT‑5.2 on abstract reasoning, while offering 1 M‑token context, real‑time code demos, and immediate platform rollout.

AI benchmarksAIME 2025ARC-AGI-2

0 likes · 7 min read

Gemini 3.1 Pro Doubles Reasoning Scores, Beats Claude and GPT on ARC‑AGI‑2