Model Profile

google/gemini-2.0-flash-001

Name: google/gemini-2.0-flash-001
Rating: 2.7 (165 reviews)
Author: google

External Benchmark Shadowexternal_benchmark_shadowpublic

4,096 ctx

Use this page to decide where this model is a strong fit. Rankings below are benchmark-backed by use case, with explicit confidence and contributor metrics.

Identity

ID: external/google/gemini-2-0-flash-001

Author: google

Origin: external_benchmark_shadow

Arch: unknown

Benchmark Coverage

Scored use cases: 12

Avg confidence: 21.1%

Evidence points: 165

Raw rows: 327

Weighted rows: 22

Catalog Metadata

Parameters: unknown

Context window: 4096

Downloads: 0

Intelligence Profile

Dimension Breakdown

IQ12 benchmarks

59.4%

EQ0 benchmarks

No eq benchmarks found

Insufficient data

Accuracy0 benchmarks

No accuracy benchmarks found

Insufficient data

Creativity0 benchmarks

No creativity benchmarks found

Insufficient data

Based0 benchmarks

No based benchmarks found

Insufficient data

1/5 dimensions scored · Last updated Apr 21, 2026

Benchmark Signals

Click through to the benchmark source behind this model profile.

LanguageBench Translation Official (Split)

translation_to:bleu

6.6%

Normalized value 88.0% · confidence 100.0%

Strongest impact in Archaic and historical translation

languagebench_translation_official.translation_to_bleu · Apr 1, 2026

LanguageBench

overall:mean

5.2%

Normalized value 99.9% · confidence 100.0%

Strongest impact in Archaic and historical translation

languagebench.overall_mean · Apr 1, 2026

LanguageBench Grammar/Clarity Official (Split)

grammar_clarity_score_pct

3.5%

Normalized value 95.9% · confidence 100.0%

Strongest impact in Translation and localization

languagebench_grammar_clarity_official.grammar_clarity_score_pct · Apr 1, 2026

BRIDGE Medical Leaderboard

average_performance_pct

2.9%

Normalized value 97.0% · confidence 100.0%

Strongest impact in Patient-friendly explanations

bridge_medical_leaderboard.average_performance_pct · Apr 1, 2026

LanguageBench Translation Official (Split)

translation_to:chrf

2.7%

Normalized value 93.3% · confidence 100.0%

Strongest impact in Legal translation

languagebench_translation_official.translation_to_chrf · Apr 1, 2026

LanguageBench

translation_to:bleu

2.5%

Normalized value 88.0% · confidence 100.0%

Strongest impact in Archaic and historical translation

languagebench.translation_to_bleu · Apr 1, 2026

Some fit rows have limited benchmark evidence.

10 of 12 scored use cases have low confidence or thin contributor coverage.

Coverage Diagnostics

actively scored

Use-Case Scores

103

Total Measurements

327

Weighted Measurements

Weighted Sources

Raw Source Coverage

vals_mmlu_pro 60vals_mgsm 48corpfin_taxeval_public 28vals_medqa 28vals_legal_bench 18vals_corp_fin_v2 16

Weighted Source Coverage

languagebench 3languagebench_translation_official 3vals_corp_fin_v2 3bridge_medical_leaderboard 2duckdb_nsql_leaderboard 2arena_hard_auto_v2 1

Best Use Cases for This Model

Use Case	Vertical	Score	Confidence	Evidence	Top Contributor
Archaic and historical translation use_case.history.archaic_translation	history_linguistics	26.7%	31.0%	15	LanguageBench Translation Official (Split): translation_to:bleu
Legal translation use_case.legal.legal_translation	legal	22.6%	26.4%	14	LanguageBench Translation Official (Split): translation_to:bleu
Historical document summarization use_case.history.historical_doc_summarization	history_linguistics	20.2%	24.5%	14	LanguageBench: overall:mean
Brand voice localization use_case.mkt.brand_voice_localization	marketing_sales	18.3%	22.1%	13	LanguageBench Translation Official (Split): translation_to:bleu
Patient-friendly explanations use_case.health.patient_friendly_summaries	healthcare	18.2%	21.6%	14	LanguageBench Translation Official (Split): translation_to:bleu
Grammar and writing coach use_case.lang.grammar_coach	education	17.7%	21.1%	14	LanguageBench Translation Official (Split): translation_to:bleu
Language conversation partner use_case.lang.conversation_partner	education	16.3%	19.4%	14	LanguageBench Translation Official (Split): translation_to:bleu
Translation and localization use_case.business.translation_localization	business_productivity	16.3%	19.2%	13	LanguageBench Grammar/Clarity Official (Split): grammar_clarity_score_pct
Cross-lingual summary use_case.business.cross_lingual_summary	business_productivity	14.3%	17.2%	13	LanguageBench: overall:mean
Lesson plan generator use_case.edu.lesson_plan_generator	education	13.6%	16.9%	13	LanguageBench Grammar/Clarity Official (Split): grammar_clarity_score_pct
Socratic tutor use_case.edu.socratic_tutor	education	13.6%	16.9%	13	LanguageBench Grammar/Clarity Official (Split): grammar_clarity_score_pct
Multilingual Customer Support use_case.cx.multilingual_support	customer_experience	13.4%	17.5%	15	LanguageBench: overall:mean