Gemini 3 Deep Think (2/26) Évaluation Semi-Privée - ARC-AGI-1 : 96,0 %, 7,17 $/tâche - ARC-AGI-2 : 84,6 % 13,62 $/tâche Nouveau modèle ARC-AGI SOTA de @GoogleDeepMind
Classement ARC-AGI-1
- Classement : - Reproduire les résultats : - Politique de test :
184