Model Profile

Llama-3.3-70B-Instruct

Name: Llama-3.3-70B-Instruct
Rating: 1.8 (63 reviews)
Author: meta-llama

4,096 ctxOpen weights

Use this page to decide where this model is a strong fit. Rankings below are benchmark-backed by use case, with explicit confidence and contributor metrics.

Identity

ID: meta-llama/Llama-3.3-70B-Instruct

Author: meta-llama

Origin: huggingface_catalog

Arch: unknown

Benchmark Coverage

Scored use cases: 12

Avg confidence: 18.0%

Evidence points: 63

Raw rows: 40

Weighted rows: 10

Catalog Metadata

Parameters: unknown

Context window: 4096

Downloads: 717,694

Intelligence Profile

Dimension Breakdown

IQ6 benchmarks

58.8%*

EQ0 benchmarks

No eq benchmarks found

Insufficient data

Accuracy2 benchmarks

100.0%*

Creativity0 benchmarks

No creativity benchmarks found

Insufficient data

Based1 benchmark

70.2%*

* Low confidence — limited benchmark evidence for this dimension

3/5 dimensions scored · Last updated Apr 2, 2026

Benchmark Signals

Click through to the benchmark source behind this model profile.

DuckDB NSQL Leaderboard

all_execution_accuracy

8.9%

Normalized value 84.6% · confidence 100.0%

Strongest impact in Metric definition workshop

duckdb_nsql_leaderboard.all_execution_accuracy · Apr 1, 2026

LanguageBench Translation Official (Split)

translation_to:bleu

4.2%

Normalized value 55.2% · confidence 100.0%

Strongest impact in Archaic and historical translation

languagebench_translation_official.translation_to_bleu · Apr 1, 2026

LanguageBench

overall:mean

3.9%

Normalized value 75.2% · confidence 100.0%

Strongest impact in Archaic and historical translation

languagebench.overall_mean · Apr 1, 2026

LanguageBench Grammar/Clarity Official (Split)

grammar_clarity_score_pct

3.0%

Normalized value 83.3% · confidence 100.0%

Strongest impact in Translation and localization

languagebench_grammar_clarity_official.grammar_clarity_score_pct · Apr 1, 2026

LanguageBench Translation Official (Split)

translation_to:chrf

2.0%

Normalized value 69.8% · confidence 100.0%

Strongest impact in Legal translation

languagebench_translation_official.translation_to_chrf · Apr 1, 2026

LanguageBench

translation_to:bleu

1.6%

Normalized value 55.2% · confidence 100.0%

Strongest impact in Archaic and historical translation

languagebench.translation_to_bleu · Apr 1, 2026

Some fit rows have limited benchmark evidence.

11 of 12 scored use cases have low confidence or thin contributor coverage.

Coverage Diagnostics

actively scored

Use-Case Scores

Total Measurements

Weighted Measurements

Weighted Sources

Raw Source Coverage

duckdb_nsql_leaderboard 12languagebench 10icelandic_llm_leaderboard 7languagebench_grammar_clarity_official 4languagebench_translation_official 4openrouter_models 3

Weighted Source Coverage

languagebench 3languagebench_translation_official 3duckdb_nsql_leaderboard 2icelandic_llm_leaderboard 1languagebench_grammar_clarity_official 1

Best Use Cases for This Model

Use Case	Vertical	Score	Confidence	Evidence	Top Contributor
Archaic and historical translation use_case.history.archaic_translation	history_linguistics	18.3%	28.3%	8	LanguageBench Translation Official (Split): translation_to:bleu
Historical document summarization use_case.history.historical_doc_summarization	history_linguistics	14.3%	22.1%	7	LanguageBench: overall:mean
Metric definition workshop use_case.data.metric_definition_workshop	data_analytics	13.6%	20.0%	4	DuckDB NSQL Leaderboard: all_execution_accuracy
Legal translation use_case.legal.legal_translation	legal	13.2%	20.1%	6	LanguageBench Translation Official (Split): translation_to:bleu
Grammar and writing coach use_case.lang.grammar_coach	education	11.6%	16.3%	6	LanguageBench Translation Official (Split): translation_to:bleu
Brand voice localization use_case.mkt.brand_voice_localization	marketing_sales	11.4%	16.7%	5	LanguageBench Translation Official (Split): translation_to:bleu
Data quality assistant use_case.data.data_quality_assistant	data_analytics	11.4%	16.3%	4	DuckDB NSQL Leaderboard: all_execution_accuracy
SQL debugging use_case.data.sql_debugging	data_analytics	11.2%	18.4%	4	DuckDB NSQL Leaderboard: all_execution_accuracy
Language conversation partner use_case.lang.conversation_partner	education	10.6%	14.9%	6	LanguageBench Translation Official (Split): translation_to:bleu
Executive brief from metrics use_case.data.exec_brief_from_metrics	data_analytics	10.3%	14.6%	4	DuckDB NSQL Leaderboard: all_execution_accuracy
Translation and localization use_case.business.translation_localization	business_productivity	10.1%	14.3%	5	LanguageBench Grammar/Clarity Official (Split): grammar_clarity_score_pct
Insight mining from text corpora use_case.data.insight_mining	data_analytics	10.0%	13.9%	4	DuckDB NSQL Leaderboard: all_execution_accuracy