AI時代の文章品質管理

ハルシネーションを「仕組み」で抑える方法（運用プロトコル）

AIで文章を作るのが当たり前になりました。

速い。安い。便利。

ただ、実務で一番怖いのは「派手な間違い」ではありません。

それっぽく正しい文章で、重要なところだけズレること。

条件が微妙に違う
例外が抜ける
料金や規約のニュアンスが変わる
断定してはいけない箇所を断定する
出典がないのに数字が出る

これが起きると、文章の品質が落ちるだけでは済みません。

信頼の資産が削れます。

だから私たちは、AI活用を「プロンプトの腕前」で解決しません。

First byte Method として、こう扱います。

不確実性を前提に、

事故が起きない条件（前提）を揃え、

仕組みとして再現する。

この記事が想定する読者：AIで文章を作るが、それっぽくて重要なところだけズレる事故を防ぎたい担当者。ハルシネーションを「仕組み」で抑える判断軸がほしい方。

判断を誤るとどうなるか：プロンプトの腕前だけで対処すると、条件のズレ・例外の抜け・断定ミスで信頼を削る。一次情報の固定・不確実性ルール・二段階生成・レビュー条件化の4原則を先に揃えると失敗しにくい。

この記事は、AIで文章を作る人に向けた

"品質管理のプロトコル"です。

ハルシネーションは「嘘」ではなく「仕様」

まず前提を揃えます。

AIは、分からない箇所があるとき、

空欄のまま返さず「完成形」にしようとします。

これは悪意ではなく、仕様です。

つまり、事故が起きるのはAIの人格ではなく、

一次情報がない
情報が散らばっている
例外が多いのに整理されていない
断定してはいけない領域が曖昧
「いい感じに仕上げろ」という依頼

など、入力環境が事故りやすいからです。

なら、対策は明確です。

モデルより先に、運用を設計する。

結論：事故率は「4つの原則」で下げられる

ハルシネーションをゼロにはしません。

現実的ではないからです。

代わりに、実務で効く目標を置きます。

重要領域の事故率を下げ、
再発を止め、
最終責任は必ず人が担保する。

そのための原則は4つです。

原則	内容
1. 一次情報を固定する	入口を1つにする
2. 不確実性のルールを決める	分からない時の振る舞い
3. 二段階生成にする	設計→確認→本文
4. レビューを条件化する	好みではなくチェック

順番も重要です。

1がないと、2〜4を頑張っても安定しません。

原則1：一次情報を固定する（Single Source of Truth）

AIが迷走する最大要因は、参照元の分散です。

料金はスプレッドシート
規約はPDF
サービス仕様は口頭
FAQは別ページ
例外は担当者の頭の中

この状態でAIに「書いて」と言えば、

それっぽく整った"想像の文章"が生まれます。

だから、最初にやることはこれです。

一次情報の入口を1つに固定する。

規約はここ
料金はここ
サービス仕様はここ
最新はここ

更新日を明記し、矛盾があるときは「最新」を優先する。

これだけで事故が一段減ります。

原則2：不確実性のルールを決める

AIに義務化するルールは、最小でこれです。

分からないことは分からないと言う
推測するなら推測と明示
数字・条件・固有名詞は出典 or 前提を添える
情報が不足しているなら質問する

このルールがないと、AIは「仕上げる方向」に働きます。

逆に言えば、このルールがあるだけで

"それっぽい嘘"が減ります。

原則3：二段階生成にする（事故率が落ちる鉄板）

一発で本文を書かせると、事故ります。

理由は簡単で、「穴が空いたまま仕上げようとする」から。

そこで、二段階にします。

STEP1：設計だけ（本文禁止）

目的・読者・前提の確認
見出し構造
参照すべき一次情報の箇所
不明点（質問）最大5つ

STEP2：本文を書く

STEP1を人が確認
OKなら本文生成
"要確認"が必要な箇所にはタグを残す（後で照合）

この運用にすると、AIが勝手に埋める前に

人が穴を潰せるようになります。

原則4：レビューを条件化する（属人化を止める）

品質が落ちる最大要因は「レビューが好みになる」ことです。

この言い回しが好き
なんか違和感
いつもより弱い

これだと、AIの品質は安定しません。

安定させるには、判定を"条件"にします。

一次情報と整合しているか
未確認の断定がないか
出典が必要なところに出典があるか
不確実性が明示されているか

このチェックが通れば公開。

通らなければ差し戻し。

それだけで運用は回ります。

「AIは優秀な新人」を戦力化する、という考え方

ここまでをまとめると、AIの扱いはこうなります。

要素	この記事での対応
栄養（データ）	一次情報の固定
規律（前提）	不確実性ルール＋禁止事項
評価（基準）	レビュー条件
権限（範囲）	任せる領域の線引き

これは、優秀な新人の育て方と同じです。

才能に頼らず、環境で品質を作る。

First byte Method は、ここを「前提設計」として扱います。

そのまま使える：品質管理チェックリスト（コピペOK）

1) 重大事故チェック（最優先）

[ ] 料金・規約・条件を未確認で断定していない
[ ] 数字・相場を出典なしで提示していない
[ ] "必ず/絶対"の断定が連発されていない
[ ] 一次情報と矛盾していない
[ ] 不明点は「不明」と書かれている（推測なら推測明示）

2) 出力品質チェック

[ ] 目的・読者・前提が冒頭で明示されている
[ ] 判断軸→手順→チェックの順になっている
[ ] 抽象語で逃げていない（具体例がある）
[ ] 読者の次の行動が明確
[ ] 煽り・不安喚起の文章になっていない

3) "要確認タグ"運用（推奨）

要確認： 料金 / 規約 / 法務 / 医療 / 数値 / 例外

→ 公開前に人が一次情報で照合して外す

まとめ：AI時代は「文章力」より「品質管理」が競争力になる

AIで文章が作れる時代に、差が出るのは制作速度ではありません。

信頼を削らずに、継続して出せるかです。

そのために必要なのは、プロンプトではなく仕組みです。

一次情報を固定する
不確実性のルールを決める
二段階生成にする
レビューを条件化する
例外を資産化する（例外集の作り方【汎用版】）

判断の土台として押さえておくこと

ハルシネーションは「仕様」で、4原則で抑える：一次情報を固定する→不確実性のルールを決める→二段階生成（設計→確認→本文）→レビューを条件化する。1がないと2〜4を頑張っても安定しない。
二段階生成で「AIが穴を埋める前」に人が穴を潰す：一発で本文を書かせず、STEP1で目的・読者・見出し・参照・不明点だけ出させ、確認してからSTEP2で本文。
次の一手：栄養と規律の設計はAIは優秀な新人、権限設計はAIに任せる範囲の決め方、質問設計はAIの質問力を設計する、前提設計全体は前提設計：成果を出す前に、判断を壊さない土台を作るを参照する。

AIの性能を「栄養と規律」で設計する考え方は、AIは優秀な新人で解説しています。STEP1の「不明点（質問）」を型で固定する方法は、AIの質問力を設計するで扱っています。レビューを条件化する具体的な設計（3層・要確認タグ・コメントの型）は、AIレビューの設計で解説しています。運用が改善しているかを数字で見るには、AI運用のKPI設計をご覧ください。前提設計の4ブロック全体は、前提設計：成果を出す前に、判断を壊さない土台を作るをご覧ください。