「あなたは専門家です」がAIの精度を下げる?USC研究が示すプロンプト設計の落とし穴
AIを使いこなすための「プロンプトエンジニアリング」が注目される中、広く普及しているテクニックのひとつが「あなたは〇〇の専門家です」という**役割設定(ペルソナ指示)**です。
しかし最新の研究によると、このアプローチがかえってAIの精度を低下させるケースがあることが明らかになっています。
直感に反するこの結果には、AIの学習構造に関わる重要なメカニズムが隠されています。今回は、その研究内容と、現場で使える「正しいプロンプト設計」の考え方を詳しく解説します。
USC研究が明かした「専門家ペルソナ」の落とし穴
2026年、南カリフォルニア大学(USC)の研究チームは、**「Expert Personas Improve LLM Alignment but Damage Accuracy」**と題したプレプリント論文を発表しました。
この研究では、Llama-3.1-8BやQwen2.5-7Bを含む6つのAIモデルに対し、さまざまなペルソナプロンプトを与えてベンチマーク性能を比較しました。
衝撃の結果:専門家設定でスコアが下がった
論文によると、数学・コーディングなどの正確性が求められるタスクにおいて、専門家ペルソナを設定した場合の正答率(約68.0%)が、何も設定しないベースライン(約71.6%)を下回るという結果が出ています。
「専門家と伝えればより高い精度が出るはず」という多くのユーザーの期待とは、真逆の結果です。
「ペルソナのプレフィックスは、本来ファクト検索に使われるべきモデルの処理を、指示追従モードへと切り替えてしまう」
— USC博士課程 Zizhao Hu氏(論文リードオーサー)
なぜ「専門家」という指示が裏目に出るのか
この現象を理解するには、AIが2段階のトレーニングで異なる能力を獲得していることを把握する必要があります。
AIの能力は「2層構造」になっている
第1層:事前学習で獲得する能力
- 数学的推論・論理的思考
- プログラミング・コーディング
- 事実知識・百科事典的情報
これらは、大量のテキストデータを学習する「プレトレーニング」の段階で身につく能力です。
第2層:ファインチューニングで獲得する能力
- 文体・トーンの調整
- 指示への追従
- 安全性フィルタリング(有害コンテンツの拒否)
これらは、人間のフィードバックを用いた「RLHF(人間のフィードバックによる強化学習)」などで後から調整される能力です。
ペルソナ指示が「間違ったスイッチ」を押す
「あなたは専門家です」という指示は、第2層の指示追従モードを強く起動させます。
その結果、モデルは第1層に蓄積されている事実知識を引き出す代わりに、「それらしい文章を生成すること」に注力してしまいます。
プロンプトで「専門知識」を付与することはできません。モデルが持っていない知識を追加することは不可能であり、むしろ本来持っている知識の引き出しを邪魔してしまうのです。
ペルソナ指示が「効く」ケースと「効かない」ケース
重要なのは、専門家ペルソナがすべての場面で悪いわけではないという点です。研究では、タスクの性質によって効果が大きく異なることも示されています。
❌ ペルソナ指示が逆効果になるタスク
これらは「プレトレーニング依存型」のタスクです。
- 数学の問題を解く
- コードを書く・デバッグする
- 事実確認・ファクトチェック
- 論理パズルへの回答
✅ ペルソナ指示が有効なタスク
これらは「アライメント依存型」のタスクです。
- 特定のトーンやスタイルで文章を書く(例:「プロフェッショナルなメール」)
- ロールプレイング・シミュレーション
- データの構造化・整形
- 安全性・倫理的な応答の制御
また、JailbreakBench(倫理的なコンテンツフィルターの評価指標)では、専門家ペルソナを使うことでモデルの安全性スコアが大幅に向上することも確認されています。
では、どう書けばいい?「正しい専門性の与え方」
研究の知見を踏まえると、プロンプトで目指すべきは「肩書き」ではなく「行動の基準」を与えることです。
Before(効果が低いプロンプト)
あなたは熟練した弁護士です。完璧な法律意見を提供してください。
このプロンプトは「役割」は与えていますが、何をどう出力すべきかが不明確です。モデルは「弁護士らしさ」を演じることに注力し、事実の正確性より「それっぽい文体」を優先しがちになります。
After(効果が高いプロンプト)
以下の質問に回答する際は、次の基準に従ってください:
- 法律用語を正確に使用すること
- 定義があいまいな場合は、その旨を明示すること
- 断定できない場合は「〜の可能性があります」と注記すること
- 参照すべき法令・条文がある場合は、それを具体的に示すこと
「専門家」という肩書きではなく、出力の質を担保する具体的な行動指示に変えるのがポイントです。
実践的な書き換えパターン
| NG(役割の付与) | OK(行動基準の明示) |
|---|---|
| あなたはプログラマーです | コードには必ずコメントを入れ、エラー処理を含めてください |
| 医療の専門家として答えてください | 医学的に確認された情報のみ回答し、不確かな場合は「医師への相談を推奨します」と明記してください |
| マーケティングの専門家です | ターゲット層・訴求ポイント・行動喚起(CTA)を必ず含めてください |
実務での活用:判断フローチャート
プロンプトを設計する際には、次の問いを自分に投げかけてみましょう。
① そのタスクは「正確さ」が求められるか、「スタイル」が求められるか?
- 正確さが必要(数学・コード・事実確認)→ ペルソナ指示を避ける。具体的な出力基準を書く
- スタイルが必要(文体・トーン・構成)→ ペルソナ指示は有効。ただし過度なプレッシャーはかけない
② 「専門家として完璧に」という表現は入っていないか?
「完璧に」「プロとして」といった過度なプレッシャーワードは、モデルを「それらしさの演技モード」に誘導しやすいため、避けることを推奨します。
まとめ:「肩書き」より「基準」を与えよう
USC研究のポイントを整理すると、以下のようになります。
- 「あなたは専門家です」という指示は、数学・コーディングなどのタスクでは精度を下げることがある
- その理由は、ペルソナ指示がモデルの「指示追従モード」を起動し、事実検索能力を妨げるため
- 一方、文体やトーンの調整など「アライメント依存型」のタスクでは有効
- 肩書きの付与ではなく、「何を・どういう基準で出力するか」という具体的な行動指示が効果的
プロンプトの書き方一つで、AIのアウトプット品質は大きく変わります。「専門家設定すれば質が上がる」という思い込みを一度手放し、出力基準の言語化に意識を向けてみてください。
それが、AIを本当に使いこなすための第一歩です。
参考文献
- Zizhao Hu et al., “Expert Personas Improve LLM Alignment but Damage Accuracy: Bootstrapping Intent-Based Persona Routing with PRISM,” USC preprint (2026)
- The Register, “Telling an AI model that it’s an expert makes it worse” (March 2026)