Gemini 3 Deep Think (2/26) Semi Private Eval - ARC-AGI-1: 96,0%, $7,17/task - ARC-AGI-2: 84,6% $13,62/task Nieuw ARC-AGI SOTA-model van @GoogleDeepMind
ARC-AGI-1 Ranglijst
- Ranglijst: - Resultaten reproduceren: - Testbeleid:
182