Model Profile

Qwen2.5-32B-Instruct

Name: Qwen2.5-32B-Instruct
Rating: 1.0 (47 reviews)
Author: Qwen

4,096 ctxOpen weights

Use this page to decide where this model is a strong fit. Rankings below are benchmark-backed by use case, with explicit confidence and contributor metrics.

Identity

ID: Qwen/Qwen2.5-32B-Instruct

Author: Qwen

Origin: huggingface_catalog

Arch: unknown

Benchmark Coverage

Scored use cases: 12

Avg confidence: 10.8%

Evidence points: 47

Raw rows: 101

Weighted rows: 11

Catalog Metadata

Parameters: unknown

Context window: 4096

Downloads: 4,588,189

Intelligence Profile

Dimension Breakdown

IQ1 benchmark

19.7%*

EQ1 benchmark

89.1%*

Accuracy0 benchmarks

No accuracy benchmarks found

Insufficient data

Creativity2 benchmarks

30.5%*

Based1 benchmark

18.0%*

* Low confidence — limited benchmark evidence for this dimension

4/5 dimensions scored · Last updated Apr 21, 2026

Benchmark Signals

Click through to the benchmark source behind this model profile.

JSONSchemaBench Leaderboard

medium_schema_compliance_pct

4.7%

Normalized value 95.2% · confidence 100.0%

Strongest impact in Metric definition workshop

jsonschemabench_leaderboard.medium_schema_compliance_pct · Mar 31, 2026

EQ-Bench Leaderboard

eq_bench_score

3.9%

Normalized value 89.1% · confidence 100.0%

Strongest impact in Social post generation

eq_bench.eq_bench_score · Apr 1, 2026

JSONSchemaBench Leaderboard

hard_schema_compliance_pct

2.8%

Normalized value 84.1% · confidence 100.0%

Strongest impact in Metric definition workshop

jsonschemabench_leaderboard.hard_schema_compliance_pct · Mar 31, 2026

BigCodeBench Official

bigcodebench_complete_pct

1.8%

Normalized value 81.5% · confidence 100.0%

Strongest impact in Verilog/VHDL generation

bigcodebench_official.bigcodebench_complete_pct · Apr 1, 2026

UGI Leaderboard

Writing ✍️

1.6%

Normalized value 43.9% · confidence 100.0%

Strongest impact in Adult ERP roleplay (explicit)

ugi_main.writing · Apr 1, 2026

BigCodeBench Official

bigcodebench_instruct_pct

1.5%

Normalized value 86.2% · confidence 100.0%

Strongest impact in Integration test generation

bigcodebench_official.bigcodebench_instruct_pct · Apr 1, 2026

Some fit rows have limited benchmark evidence.

12 of 12 scored use cases have low confidence or thin contributor coverage.

Coverage Diagnostics

actively scored

Use-Case Scores

Total Measurements

101

Weighted Measurements

Weighted Sources

Raw Source Coverage

ugi_main 60jsonschemabench_leaderboard 12artifactsbenchmark_leaderboard 11bridge_medical_leaderboard 9bigcodebench_official 8eq_bench 1

Weighted Source Coverage

bigcodebench_official 3ugi_main 3bridge_medical_leaderboard 2jsonschemabench_leaderboard 2eq_bench 1

Best Use Cases for This Model

Use Case	Vertical	Score	Confidence	Evidence	Top Contributor
Metric definition workshop use_case.data.metric_definition_workshop	data_analytics	10.4%	11.5%	4	JSONSchemaBench Leaderboard: medium_schema_compliance_pct
Verilog/VHDL generation use_case.eda.verilog_generation	engineering	8.7%	11.0%	5	BigCodeBench Official: bigcodebench_complete_pct
Integration test generation use_case.dev.integration_tests	developer_tools	8.5%	10.6%	5	BigCodeBench Official: bigcodebench_complete_pct
Social post generation use_case.mkt.social_post_generation	marketing_sales	7.9%	10.6%	3	EQ-Bench Leaderboard: eq_bench_score
Campaign brief use_case.mkt.campaign_brief	marketing_sales	7.9%	10.6%	3	EQ-Bench Leaderboard: eq_bench_score
Product positioning and messaging use_case.mkt.product_positioning	marketing_sales	7.9%	10.6%	3	EQ-Bench Leaderboard: eq_bench_score
Ad copy variants use_case.mkt.ad_copy_variants	marketing_sales	7.5%	10.0%	3	EQ-Bench Leaderboard: eq_bench_score
Personalized sales outreach use_case.mkt.sales_outreach_personalized	marketing_sales	7.5%	10.0%	3	EQ-Bench Leaderboard: eq_bench_score
Lore bible generator use_case.creative.lore_bible	creative	6.1%	10.6%	6	JSONSchemaBench Leaderboard: medium_schema_compliance_pct
Screenplay scene writing use_case.creative.screenplay_scene	creative	4.7%	11.8%	4	UGI Leaderboard: Writing ✍️
Poetry and lyrics use_case.creative.poetry_lyrics	creative	4.7%	11.8%	4	UGI Leaderboard: Writing ✍️
Adult ERP roleplay (explicit) use_case.adult.erp_roleplay	adult	4.0%	10.4%	4	UGI Leaderboard: Writing ✍️