知能ドメインとは?
知能ドメインとは
Shiraitoでは、「知能ドメイン(Intelligence Domain)」という概念があります。これは、1人の担当者(オペレーター)に例えて考えると理解しやすくなります。
ある知能ドメインは、
- 「○○について詳しく答えてくれる担当者」のような役割を持ちます。
- Tutorは、この「AI上の担当者」を育てる(Teachする)役割を担います。
- 具体的には、その担当者に対して
- どの範囲の知識を持たせるのか(知識ドメイン)
- どのような方針で返答させるのか(対応方針・ガードレール)
- 分からない場合にどう振る舞うか(誘導先)
を設計・調整していきます。
以降では、知能ドメインを構成する要素を「知識(Knowledge)」と「知恵(Wisdom)」に分けて説明します。
知識(Knowledge)レイヤー:RAGによる「マニュアル担当者」
知識ドメインの内包
知能ドメインの中には、まず「どんな分野について答えるのか」という知識ドメインが含まれます。
例)
- 製品Aの使い方に答える知能ドメイン
- 社内規程に関する問い合わせに答える知能ドメイン
- 自社サービスの契約・料金について答える知能ドメイン など
Tutorは、この知識ドメインに属するドキュメント(マニュアル、FAQ、規程、Webページなど)を整理し、RAG(ベクタ検索)で参照できる形にして登録することができます。
RAG(ベクタ検索)とは
InfiniCloud AIでは、RAG(Retrieval-Augmented Generation)を使って、質問のたびに「参考書を開いて調べてから答える」ような動作をします。
- ユーザーが質問をすると、その内容に近い文書をベクタ検索で探します。
- 見つかった該当箇所(マニュアルやFAQ)をもとに、回答文を組み立てます。
- これにより、その時点で登録されているマニュアルを反映した回答が可能になります。
イメージとしては、
「マニュアルを横に置いて、それを見ながら回答するサポートセンター担当者」
をAIで実現している状態です。
RAGの性質
RAGは、あくまで登録されたドキュメントに基づいて、もっともらしい回答を生成する仕組みです。
- 経験則や感覚的な判断は持ちません。
- ドキュメントを更新すれば、その内容は次の質問からすぐに反映されます。
- この段階(RAGのみ)でも、多くの業務では十分な回答品質が得られます。
そのため、Shiraitoでは
「まずはRAGで“マニュアル対応サポセン担当者”を作る」
という使い方が基本になります。これは、計算資源的にも比較的省電力・軽量で運用できるため、広い範囲のFAQやマニュアル対応を行うには適した方式です。
対応方針・ガードレール:何をどう答えるか/分からないときの振る舞い
知能ドメインは「何を知っているか」だけでなく、「どう振る舞うか」も含めて設計します。
これが対応方針(ポリシー)やガードレールです。
対応方針の例
口調:
- 敬体で丁寧に答える
- 社内向けカジュアルトーンで答える詳細度:
- 初心者にも分かるように噛み砕いて説明する
- 専門家向けに専門用語を使ってもよい禁止事項:
- 法律・医療などの判断は行わない
- 推測で断言しない
- 社内未公開情報については回答しない など
Tutorは、これらをプロンプトテンプレートや設定項目として定義し、知能ドメインごとに調整します。
分からない場合の誘導
知能ドメインに「分からない」「情報が不足している」状況も必ず発生します。このときの振る舞いを、あらかじめ決めておきます。
代表的な誘導先の例
- お問い合わせフォームのURLを案内する
- 担当窓口のメールアドレスを提示する
- 「この内容はAIでは確定できないため、○○部署にご確認ください」と明示する
Tutorの役割は、
「分からないときに誤魔化さず、適切な人間の窓口につなげる」というルールを、知能ドメインのガードレールとして組み込むことです。
知恵(Wisdom)レイヤー:ファインチューンによる長期記憶
RAGだけでは表現しきれない「判断のクセ」や「言い回し」「高度なタスク遂行能力」などをより深く身につけさせたい場合、InfiniCloud AIではファインチューン(Fine-tuning, FT)「新しい知恵を生成」を利用します。
ファインチューン(FT)「新しい知恵を生成」とは
学習用データセットを使い、同じパターンの入出力を何度もモデルに刷り込むことで、モデル内部に長期的な知識や振る舞いを定着させる仕組みです。
- RAGが「その都度、参考書を見る」方式なのに対し、
- FTは「何度も勉強して体で覚えた状態」に近いイメージ
となります。
InfiniCloud AIにおけるFTの位置づけ
InfiniCloud AIは、RAG用に整備されたデータセットから、FT用の学習セットを自動的に生成することができます。
まずRAGで
- 文書構造を整理し
- 適切な粒度に分割し
- 質の高い回答例を作る
そのうえで、選別した入出力ペアをLoRAなどの手法でファインチューンし、モデルの「知恵」として定着させます。
「新しい知恵を生成」が成功すると、「知能ドメイン」を選択するだけで、RAGの「知識」だけでなく「知恵」が搭載されたランゲージモデルを自動的に使うようになります。
知識(RAG)と知恵(FT)の関係
RAG(Knowledge)で十分なケース
- マニュアルやFAQがしっかり整備されている
- ドキュメント構造が素直で、その参照だけで正しい回答が得られる
- 内容が頻繁に更新される(規程類、商品情報など)FT(Wisdom)が有効なケース
- 特定の文体・トーン・表現ルールを高い一貫性で守りたい
- 長い手順書や複雑な運用フローを「自然に展開できる回答」として返したい
- RAGだけだと毎回答がブレやすい高度なタスク(例:特定フォーマットの議事録生成)
- 文化を抽出したい
Tutorとしては、
「まずはRAGで知識を整える → 必要に応じてFTで知恵を定着させる」という二段構えで知能ドメインを育てていく、というイメージを持つとよいでしょう。
Tutorの役割のまとめ
知能ドメインを「AI上の担当者」と考えると、Tutorの役割は次のように整理できます。
- 担当範囲(知識ドメイン)の設計
- どの分野を担当させるかを決める
- どのドキュメントをRAGに登録するかを選ぶ
- 対応方針・ガードレールの設定
- どのようなトーンで答えるか
- どこまで答えてよいか/答えてはいけないか
- 分からない場合にどこへ誘導するか
- 知識(RAG)の整備
- ソース文書の整形・構造化
- 検索しやすい形への変換
- PDFのように印刷直前のデータよりも、HTMLのようにhタグなどのドキュメント構造があるデータの方が、意味を捉えやすくなります。
- 更新フローの整備
- 知恵(FT)の設計・評価(必要に応じて)
- 学習データセットの設計
- 学習後の回答品質の確認
- RAG/FTの役割分担の見直し
このように、Tutorは
「知能ドメイン担当者を採用し、マニュアルを整え、仕事の方針を示し、必要に応じて高度な訓練(FT)を施す人」
という立ち位置になります。