Model Profile

z-ai/glm-4.7

Name: z-ai/glm-4.7
Rating: 2.1 (219 reviews)
Author: z-ai

External Benchmark Shadowexternal_benchmark_shadowpublic

4,096 ctx

Use this page to decide where this model is a strong fit. Rankings below are benchmark-backed by use case, with explicit confidence and contributor metrics.

Identity

ID: external/z-ai/glm-4-7

Author: z-ai

Origin: external_benchmark_shadow

Arch: unknown

Benchmark Coverage

Scored use cases: 12

Avg confidence: 27.5%

Evidence points: 219

Raw rows: 411

Weighted rows: 22

Catalog Metadata

Parameters: unknown

Context window: 4096

Downloads: 0

Intelligence Profile

Dimension Breakdown

IQ19 benchmarks

61.3%

EQ0 benchmarks

No eq benchmarks found

Insufficient data

Accuracy0 benchmarks

No accuracy benchmarks found

Insufficient data

Creativity0 benchmarks

No creativity benchmarks found

Insufficient data

Based0 benchmarks

No based benchmarks found

Insufficient data

1/5 dimensions scored · Last updated Apr 23, 2026

Benchmark Signals

Click through to the benchmark source behind this model profile.

Vals Finance Agent

overall_accuracy_pct

2.9%

Normalized value 72.4% · confidence 100.0%

Strongest impact in Thesis red teaming

vals_finance_agent.overall_accuracy_pct · Mar 31, 2026

Sonar Java Quality Leaderboard

functional_skill_pct

2.4%

Normalized value 68.4% · confidence 100.0%

Strongest impact in Code Review Assistant

sonar_java_quality.functional_skill_pct · Apr 1, 2026

Vals Tax Eval v2

overall_accuracy_pct

1.9%

Normalized value 76.3% · confidence 100.0%

Strongest impact in Accounts payable invoice extraction (text)

vals_tax_eval_v2.overall_accuracy_pct · Mar 31, 2026

Vals CorpFin v2

shared_max_context_accuracy_pct

1.7%

Normalized value 74.9% · confidence 100.0%

Strongest impact in Thesis red teaming

vals_corp_fin_v2.shared_max_context_accuracy_pct · Mar 31, 2026

Sonar Java Quality Leaderboard

issue_density_error_per_kloc

1.6%

Normalized value 65.2% · confidence 100.0%

Strongest impact in Code Review Assistant

sonar_java_quality.issue_density_error_per_kloc · Apr 1, 2026

Vals Finance Agent

complex_retrieval_accuracy_pct

1.6%

Normalized value 54.5% · confidence 100.0%

Strongest impact in Thesis red teaming

vals_finance_agent.complex_retrieval_accuracy_pct · Mar 31, 2026

Some fit rows have limited benchmark evidence.

2 of 12 scored use cases have low confidence or thin contributor coverage.

Coverage Diagnostics

actively scored

Use-Case Scores

125

Total Measurements

411

Weighted Measurements

Weighted Sources

Raw Source Coverage

vals_mmlu_pro 60vals_mgsm 48vals_finance_agent 40corpfin_taxeval_public 28vals_medqa 28vals_legal_bench 24

Weighted Source Coverage

vals_finance_agent 5sonar_java_quality 4vals_corp_fin_v2 3vals_case_law_v2 1vals_gpqa 1vals_lcb 1

Best Use Cases for This Model

Use Case	Vertical	Score	Confidence	Evidence	Top Contributor
Thesis red teaming use_case.fin.thesis_red_team	finance	20.5%	32.0%	19	Vals Finance Agent: overall_accuracy_pct
Quant research code generation use_case.fin.alpha_research_codegen	finance	19.7%	29.8%	22	Sonar Java Quality Leaderboard: functional_skill_pct
Accounts payable invoice extraction (text) use_case.fin.ap_invoice_extraction	finance	19.6%	29.9%	19	Vals Finance Agent: overall_accuracy_pct
Earnings call synthesis use_case.fin.earnings_call_synthesis	finance	18.5%	28.9%	19	Vals Finance Agent: overall_accuracy_pct
Refactoring assistant use_case.dev.refactoring	developer_tools	18.4%	27.0%	16	Sonar Java Quality Leaderboard: functional_skill_pct
Transaction anomaly narrative use_case.fin.transaction_anomaly_narrative	finance	18.2%	28.4%	19	Vals Finance Agent: overall_accuracy_pct
Debugging assistant use_case.dev.debugging	developer_tools	17.6%	25.7%	16	Sonar Java Quality Leaderboard: functional_skill_pct
AML alert triage use_case.fin.aml_alert_triage	finance	17.5%	27.3%	19	Vals Finance Agent: overall_accuracy_pct
KYC profile synthesis use_case.fin.kyc_profile_synthesis	finance	17.5%	27.3%	19	Vals Finance Agent: overall_accuracy_pct
Verilog/VHDL generation use_case.eda.verilog_generation	engineering	17.1%	25.0%	16	Sonar Java Quality Leaderboard: functional_skill_pct
Code Review Assistant use_case.dev.code_review_assistant	developer_tools	16.4%	24.1%	16	Sonar Java Quality Leaderboard: functional_skill_pct
Filings summarization (10-K/10-Q) use_case.fin.filings_summarization	finance	16.2%	25.2%	19	Vals Finance Agent: overall_accuracy_pct