Coding

How well can each AI model write, debug, and refactor code? Ranked by Artificial Analysis Coding Index.

RankModelScore

GPT-5openai/gpt-5-6-sol-xhigh

GPT-5openai/gpt-5-6-terra

Claude Fable 5anthropic/claude-fable-5

Kimi K3kimi/kimi-k3

GPT-5openai/gpt-5-5

Claude Opus 4.8anthropic/claude-opus-4-8

Claude Opus 4.7anthropic/claude-opus-4-7

Grok 4xai/grok-4-5

Claude Sonnet 5anthropic/claude-sonnet-5

GPT-5openai/gpt-5-6-luna

Muse Sparkmeta/muse-spark-1-1

GPT-5openai/gpt-5-4

Gemini 3.5 Flashgoogle/gemini-3-5-flash

Gemini 3.1 Progoogle/gemini-3-1-pro-preview

GLM 5.2zai/glm-5-2

Qwen3.7 Maxalibaba/qwen3-7-max

Claude Sonnet 4.6anthropic/claude-sonnet-4-6-adaptive

Kimi K2.6kimi/kimi-k2-6

Kimi K2.7 Codekimi/kimi-k2-7-code

MiMo V2.5 Proxiaomi/mimo-v2-5-pro

KAT Coder Pro V2kwaikat/kat-coder-pro-v2

DeepSeek V4 Prodeepseek/deepseek-v4-pro

Nex N2 Pronex/nex-n2-pro

Muse Sparkmeta/muse-spark

MiniMax M3minimax/minimax-m3

MiMo V2.5xiaomi/mimo-v2-5-0424

DeepSeek V4 Flashdeepseek/deepseek-v4-flash

GPT-5openai/gpt-5-4-nano

Qwen3.7 Plusalibaba/qwen3-7-plus

135 models tested