Reasoning

How well can each AI model solve complex logical and mathematical problems? Ranked by Artificial Analysis Math Index.

RankModelScore

GPT-5openai/gpt-5-2

GPT-5openai/gpt-5-codex

Gemini 3 Flashgoogle/gemini-3-flash-reasoning

DeepSeek V3deepseek/deepseek-v3-2-speciale

MiMo V2 Flashxiaomi/mimo-v2-flash-reasoning

GPT-5openai/gpt-5-1-codex

Gemini 3 Progoogle/gemini-3-pro

GLM 4.7zai/glm-4-7

KAT Coder Pro V1kwaikat/kat-coder-pro-v1

Kimi K2kimi/kimi-k2-thinking

Nova 2.0 Liteaws/nova-2-0-lite-reasoning

GPT-5openai/gpt-5

GPT-5openai/gpt-5-1

gpt oss 120bopenai/gpt-oss-120b

Grok 4xai/grok-4

DeepSeek V3deepseek/deepseek-v3-2-reasoning

Claude Opus 4.5anthropic/claude-opus-4-5-thinking

NVIDIA Nemotron 3 Nano 30B A3Bnvidia/nvidia-nemotron-3-nano-30b-a3b-reasoning

Qwen3 235B A22B 2507alibaba/qwen3-235b-a22b-instruct-2507-reasoning

o4 Miniopenai/o4-mini

K EXAONElg/k-exaone

Nova 2.0 Omniaws/nova-2-0-omni-reasoning-medium

DeepSeek V3deepseek/deepseek-v3-1-terminus-reasoning

DeepSeek V3deepseek/deepseek-v3-1-reasoning

Grok 4xai/grok-4-fast-reasoning

gpt oss 20bopenai/gpt-oss-20b

Grok 4xai/grok-4-1-fast-reasoning

Ring 1Tinclusionai/ring-1t

Nova 2.0 Proaws/nova-2-0-pro-reasoning-medium

194 models tested