Model Profile

falcon-7b-instruct

Name: falcon-7b-instruct
Rating: 1.8 (45 reviews)
Author: tiiuae

4,096 ctxOpen weights

Use this page to decide where this model is a strong fit. Rankings below are benchmark-backed by use case, with explicit confidence and contributor metrics.

Identity

ID: tiiuae/falcon-7b-instruct

Author: tiiuae

Origin: huggingface_catalog

Arch: unknown

Benchmark Coverage

Scored use cases: 12

Avg confidence: 19.5%

Evidence points: 45

Raw rows: 8

Weighted rows: 5

Catalog Metadata

Parameters: unknown

Context window: 4096

Downloads: 42,600

Intelligence Profile

Dimension Breakdown

IQ0 benchmarks

No iq benchmarks found

Insufficient data

EQ0 benchmarks

No eq benchmarks found

Insufficient data

Accuracy0 benchmarks

No accuracy benchmarks found

Insufficient data

Creativity0 benchmarks

No creativity benchmarks found

Insufficient data

Based1 benchmark

42.4%*

* Low confidence — limited benchmark evidence for this dimension

1/5 dimensions scored · Last updated Apr 21, 2026

Benchmark Signals

Click through to the benchmark source behind this model profile.

LLM Trustworthy Leaderboard

fairness

5.7%

Normalized value 100.0% · confidence 100.0%

Strongest impact in Crisis escalation protocol (eval)

llm_trustworthy_leaderboard.fairness · Mar 31, 2026

LLM Trustworthy Leaderboard

privacy

2.2%

Normalized value 46.8% · confidence 100.0%

Strongest impact in Crisis escalation protocol (eval)

llm_trustworthy_leaderboard.privacy · Mar 31, 2026

LLM Trustworthy Leaderboard

adv

1.8%

Normalized value 42.4% · confidence 100.0%

Strongest impact in Crisis escalation protocol (eval)

llm_trustworthy_leaderboard.adv · Mar 31, 2026

LLM Trustworthy Leaderboard

toxicity

1.5%

Normalized value 50.0% · confidence 100.0%

Strongest impact in Crisis escalation protocol (eval)

llm_trustworthy_leaderboard.toxicity · Mar 31, 2026

Some fit rows have limited benchmark evidence.

7 of 12 scored use cases have low confidence or thin contributor coverage.

Coverage Diagnostics

actively scored

Use-Case Scores

Total Measurements

Weighted Measurements

Weighted Sources

Raw Source Coverage

llm_trustworthy_leaderboard 8

Weighted Source Coverage

llm_trustworthy_leaderboard 5

Best Use Cases for This Model

Use Case	Vertical	Score	Confidence	Evidence	Top Contributor
Crisis escalation protocol (eval) use_case.safety.crisis_escalation_protocol	risk_eval	18.2%	28.8%	4	LLM Trustworthy Leaderboard: fairness
Scam and social engineering resistance (eval) use_case.security.scam_social_engineering_resistance_eval	risk_eval	18.2%	28.8%	4	LLM Trustworthy Leaderboard: fairness
Overrefusal (eval) use_case.security.overrefusal_eval	risk_eval	18.2%	28.8%	4	LLM Trustworthy Leaderboard: fairness
Refusal profile (eval) use_case.security.refusal_profile_eval	risk_eval	18.2%	28.8%	4	LLM Trustworthy Leaderboard: fairness
Jailbreak resistance (eval) use_case.security.jailbreak_resistance_eval	risk_eval	18.2%	28.8%	4	LLM Trustworthy Leaderboard: fairness
Vulnerability-oriented code review use_case.cyber.vulnerability_review	cybersecurity	10.7%	17.1%	4	LLM Trustworthy Leaderboard: fairness
Disinformation and manipulation resistance (eval) use_case.security.disinformation_resistance_eval	risk_eval	9.7%	15.3%	4	LLM Trustworthy Leaderboard: fairness
Config debugging use_case.sre.config_debugging	devops_sre	8.0%	11.2%	3	LLM Trustworthy Leaderboard: fairness
Terraform generation use_case.sre.iac_terraform	devops_sre	8.0%	11.2%	3	LLM Trustworthy Leaderboard: fairness
Kubernetes manifest generation use_case.sre.iac_k8s	devops_sre	8.0%	11.2%	3	LLM Trustworthy Leaderboard: fairness
Security incident triage use_case.cyber.incident_triage	cybersecurity	7.6%	12.2%	4	LLM Trustworthy Leaderboard: fairness
Malware analysis report (defensive) use_case.cyber.malware_analysis_report	cybersecurity	7.5%	11.9%	4	LLM Trustworthy Leaderboard: fairness