Model Profile

anthropic/claude-sonnet-4.6

Name: anthropic/claude-sonnet-4.6
Rating: 3.9 (281 reviews)
Author: anthropic

External Benchmark Shadowexternal_benchmark_shadowpublic

4,096 ctx

Use this page to decide where this model is a strong fit. Rankings below are benchmark-backed by use case, with explicit confidence and contributor metrics.

Identity

ID: external/anthropic/claude-sonnet-4-6

Author: anthropic

Origin: external_benchmark_shadow

Arch: unknown

Benchmark Coverage

Scored use cases: 12

Avg confidence: 39.2%

Evidence points: 281

Raw rows: 559

Weighted rows: 65

Catalog Metadata

Parameters: unknown

Context window: 4096

Downloads: 0

Price / 1M tokens: $6.00 (blended 3:1)

Intelligence Profile

Dimension Breakdown

IQ21 benchmarks

85.1%

EQ1 benchmark

71.4%*

Accuracy6 benchmarks

68.4%*

Creativity2 benchmarks

86.4%*

Based1 benchmark

94.0%*

* Low confidence — limited benchmark evidence for this dimension

5/5 dimensions scored · Last updated Apr 21, 2026

Benchmark Signals

Click through to the benchmark source behind this model profile.

Vals Finance Agent

overall_accuracy_pct

4.0%

Normalized value 100.0% · confidence 100.0%

Strongest impact in Thesis red teaming

vals_finance_agent.overall_accuracy_pct · Mar 31, 2026

BasedAGI Log Triage Eval

overall_score_pct

3.6%

Normalized value 73.3% · confidence 100.0%

Strongest impact in Log triage

basedagi_log_triage_eval.overall_score_pct · Apr 1, 2026

Vals CorpFin v2

overall_accuracy_pct

3.5%

Normalized value 91.5% · confidence 100.0%

Strongest impact in Thesis red teaming

vals_corp_fin_v2.overall_accuracy_pct · Mar 31, 2026

BasedAGI Document Summarization Eval

overall_score_pct

2.8%

Normalized value 80.0% · confidence 100.0%

Strongest impact in Document summarization

basedagi_doc_summarization_eval.overall_score_pct · Apr 1, 2026

Vals Finance Agent

complex_retrieval_accuracy_pct

2.6%

Normalized value 90.9% · confidence 100.0%

Strongest impact in Thesis red teaming

vals_finance_agent.complex_retrieval_accuracy_pct · Mar 31, 2026

Vals Tax Eval v2

overall_accuracy_pct

2.5%

Normalized value 100.0% · confidence 100.0%

Strongest impact in Accounts payable invoice extraction (text)

vals_tax_eval_v2.overall_accuracy_pct · Mar 31, 2026

Coverage Diagnostics

actively scored

Use-Case Scores

140

Total Measurements

559

Weighted Measurements

Weighted Sources

Raw Source Coverage

vals_mmlu_pro 60ugi_main 57vals_finance_agent 40vals_multimodal_index 32corpfin_taxeval_public 28vals_medqa 28

Weighted Source Coverage

vectara_hhem_leaderboard 12openhands_index 5vals_finance_agent 5basedagi_doc_summarization_eval 4basedagi_kb_qna_eval 4basedagi_log_triage_eval 4

Best Use Cases for This Model

Use Case	Vertical	Score	Confidence	Evidence	Top Contributor
Thesis red teaming use_case.fin.thesis_red_team	finance	38.7%	46.1%	23	Vals Finance Agent: overall_accuracy_pct
Earnings call synthesis use_case.fin.earnings_call_synthesis	finance	35.0%	41.6%	23	Vals Finance Agent: overall_accuracy_pct
Transaction anomaly narrative use_case.fin.transaction_anomaly_narrative	finance	34.3%	40.8%	23	Vals Finance Agent: overall_accuracy_pct
Accounts payable invoice extraction (text) use_case.fin.ap_invoice_extraction	finance	33.0%	37.9%	23	Vals Finance Agent: overall_accuracy_pct
KYC profile synthesis use_case.fin.kyc_profile_synthesis	finance	32.9%	39.2%	23	Vals Finance Agent: overall_accuracy_pct
AML alert triage use_case.fin.aml_alert_triage	finance	32.9%	39.2%	23	Vals Finance Agent: overall_accuracy_pct
Filings summarization (10-K/10-Q) use_case.fin.filings_summarization	finance	30.5%	36.3%	23	Vals Finance Agent: overall_accuracy_pct
Log triage use_case.sre.log_triage	devops_sre	30.3%	39.3%	21	BasedAGI Log Triage Eval: overall_score_pct
Quant research code generation use_case.fin.alpha_research_codegen	finance	29.4%	37.6%	32	Vals Finance Agent: overall_accuracy_pct
Knowledge base Q&A (with citations) use_case.business.kb_qna_with_citations	business_productivity	29.1%	39.9%	23	Vals Finance Agent: overall_accuracy_pct
Document summarization use_case.business.doc_summarization	business_productivity	28.9%	37.2%	23	Vals Finance Agent: overall_accuracy_pct
Support bot (RAG grounded) use_case.cx.support_rag_bot	customer_experience	26.5%	35.6%	21	Vals Finance Agent: overall_accuracy_pct