ナレッジベースとスキルの比較
Genieアーキテクチャでは、ナレッジベースまたはスキルのどちらを通じてデータにアクセスするかを判断する必要があります。 Genieを正しく設計するには、データにどのような取得が必要かを判断する必要があります。
ナレッジベースとスキルの違い
ナレッジベースは、非構造化コンテンツに対するセマンティック検索に使用します。 ベクトルストアは、クエリとの意味的類似性に基づいて最も関連性の高いフラグメントを取得します。 一致するすべてのレコードを取得したり、カウントしたり、集計したりすることはありません。 検索では、質問に対して最も関連性の高いコンテンツを見つけて返します。
スキルは、構造化された決定論的なデータアクセスに使用します。 スキルはAPIを呼び出すかデータベースにクエリを実行し、指定された条件に正確に一致するレコードを返します。 必要に応じて、結果はフィルタリングおよび集計されます。 結果は決定論的であるため、同じクエリは毎回同じデータを返します。
ナレッジベースを使用する場合
次のシナリオではナレッジベースを使用します。
- データが非構造化の参照コンテンツである:このコンテンツはセマンティック取得の恩恵を受けます。 これには、ポリシー、FAQ、プロセスドキュメント、終了したサポートチケット、製品ガイド、競合情報、社内Wikiが含まれます。
what is the process for requesting a software license?と尋ねるユーザーは、ドキュメントから回答を受け取ります。 適切な取得メカニズムはセマンティック検索です。 - 質問が自由回答形式である:ユーザーは回答がどこにあるかを正確には把握していません。
What are my options for parental leave?は、ユーザーが知識のある同僚に尋ねるような質問です。 その同僚は人事ポリシーに関する自分の知識を検索し、関連情報を見つけるでしょう。 ナレッジベースも同じことを行います。 - コンテンツの変更頻度が低い:これにより、コンテンツを事前に取り込めます。 ポリシー、手順、参照ドキュメントは通常、定期的に取り込み、取得に利用できる程度に安定しています。 古くなった参照コンテンツは管理可能な問題です。 デルタ取り込みプロセスによって最新の状態に保たれます。
- コンテンツが大きすぎる、または多様すぎて構造化されたAPI呼び出しではクエリできない:3年分にわたる終了したサポートチケットのライブラリ、数十件の顧客通話の会議メモ集、複数のバージョンにわたる製品ドキュメントのセット。 この種類のコンテンツは、構造化されたAPIを通じて有用な方法でクエリできません。 セマンティック検索が適切なアクセスメカニズムです。
一般的なナレッジベースのユースケース
- 人事ポリシーのQ&A:休暇タイプ、資格、発生ルール
- ITトラブルシューティング:既知の問題、解決手順、回避策
- 営業ナレッジ:競合バトルカード、製品ポジショニング、反論対応
- コンプライアンス参照:規制要件、社内ポリシー、監査手順
- 顧客向けナレッジ:製品ドキュメント、サポート記事、FAQ
スキルを使用する場合
次のシナリオではスキルを使用します。
- データがトランザクション性を持ち、頻繁に変更される:未解決のサポートチケット、現在の商談パイプライン、ライブ在庫レベル、有効なユーザーアカウントは常に更新されます。 昨日取り込まれたナレッジベースは、今日の状態を反映していない場合があります。 ソースシステムAPIを呼び出すスキルは、毎回最新データを返します。
- クエリに構造化されたフィルタリング、カウント、または集計が必要である:
How many P1 tickets were opened last month?には、日付と優先度のフィルターを含むCOUNTクエリが必要です。What is the total value of opportunities closing this quarter?には、日付フィルターを含むSUMが必要です。 ナレッジベースは、これらの機能のいずれも確実には実行できません。 一致するすべてのレコードを把握する必要がある質問には、スキルを使用します。 - 結果が完全である必要がある:一致するレコードが1つでも欠けると誤った回答になる場合、ナレッジベースは不適切なツールです。 ナレッジベースの取得は確率的です。 関連するすべてのフラグメントではなく、最も関連性の高いフラグメントを返します。 完全性が重要な場合は、一致するすべてのレコードを返すフィルタリング済みAPIクエリを使用するスキルを使用します。
- データに要求ユーザーとしての認証が必要である:返されるデータが、ユーザー自身のチケット、商談、休暇残高など、個々のユーザーにスコープ設定される必要がある場合は、検証済みユーザーアクセスを備えたスキルを使用します。 ナレッジベースレシピを通じて取り込まれたナレッジベースは権限を認識せず、ユーザーの権限に関係なく、すべてのユーザーに同じコンテンツを返します。
- データの作成、更新、または削除が必要である 書き込み操作は常にスキルです。 ナレッジベースは読み取り専用です。
一般的なスキルのユースケース
- 識別子で特定のレコードを取得:キーによるチケット、IDによる商談、名前によるアカウント
- ユーザーの現在の状態を取得:休暇残高、割り当てられたチケット、未解決の商談
- レコードの作成または更新:チケット作成、休暇申請、商談更新
- 集計クエリの実行:データセットに対する件数、合計、平均
- リアルタイムデータの取得:ライブシステムステータス、現在のキュー長、有効なインシデント
データタイプの境界
いくつかのデータタイプはナレッジベースとスキルの境界にあり、最も一般的な誤分類エラーを引き起こします。 これらのデータタイプの境界に関するガイダンスについては、次のセクションを参照してください。
終了したチケットと解決済みの問題
よくある間違い:Genieが過去の問題に関する質問に回答できるように、終了したチケットをナレッジベースに取り込むこと。
正しい場合:チケットデフレクションで、has anyone seen this issue before?に回答する場合、終了したチケットのナレッジベースは適切です。 クエリはセマンティックです。 回答は完全または正確である必要はありません。
誤りである場合:how many tickets did we close last month in this category?のような質問では、ナレッジベースは誤った回答を生成します。 日付とカテゴリのフィルターに一致するすべてのチケットではなく、最も類似した上位N件のチケットを取得します。 終了したチケットのデータセットに対してカウントまたは完全性が必要な質問には、スキルを使用します。
適切なアプローチ:終了したチケットに対する意味的類似性検索にはナレッジベースを使用します。 件数、日付またはカテゴリによるフィルター、完全性を必要とする構造化クエリにはスキルを使用します。
設定データとビジネスルール
よくある間違い:承認しきい値、ルーティングルール、有効な値などの設定データを、Genieが参照できるようにナレッジベースに入れること。
通常は誤りである理由:設定データは構造化され、具体的であり、近似ではなく正確に取得する必要があります。 What is the approval threshold for discounts?は、ポリシーの別のバージョンからの意味的に類似したフラグメントではなく、正確な数値を返す必要があります。 設定データは、スキルを通じてアクセスされるData tableに格納するか、小規模で十分に安定している場合はジョブ記述に直接含めます。
適切なアプローチ:設定データをData tableに保存します。 キーによってデータを取得するスキルを構築します。 ハードコーディングできるほど小さい場合は、ジョブ記述でデータを参照します。 構造化された設定データをナレッジベースに入れないでください。
製品カタログと価格設定
よくある間違い:CPQ Genieが見積もりを作成するときに使用できるように、製品カタログをナレッジベースに取り込むこと。
正しい場合:what does Product X do?やwhat are the differences between Plan A and Plan B?など、一般的な製品情報に関する質問には、このデータをナレッジベースで使用します。 クエリはセマンティックで、回答は情報提供を目的としています。
誤りである場合:Genieが見積もりを提供するために正確な製品ID、価格階層、SKUを取得する必要がある場合は、このデータをスキルで使用します。 これらの値は、近似ではなく正確である必要があります。 価格データをナレッジベースで取得すると、誤った階層、誤った価格ポイント、または古い価格が返されるリスクがあります。
適切なアプローチ:製品情報とポジショニングにはナレッジベースを使用します。 見積もりを作成するときは、正確な価格設定とSKUデータを取得するために価格システムに直接クエリを実行するスキルを使用します。
ファイル取得
特定の契約書、特定のポリシードキュメント、名前付きスプレッドシートなど、Genieが特定のファイルにアクセスする必要があるユースケースでは、判断はファイルの特性によって決まります。
ファイルが250KB未満で、一意の識別子によって取得でき、関連コンテンツを抽出およびフィルタリングしてからGenieに返せる場合は、スキルを使用します。 特定のファイルを取得してそのテキストコンテンツを返すスキルは、既知のドキュメントに対するナレッジベース取得よりも高速で正確です。
ファイルを構造化された識別子で簡単に取得できない場合、コンテンツが非構造化でセマンティックチャンク化の恩恵を受ける場合、またはユーザーのクエリが十分に自由回答形式で、全文書取得よりもセマンティック取得の方が適切な場合は、ナレッジベースを使用します。
ナレッジベースとスキルの判断ガイド
| 質問タイプ | データの特性 | ナレッジベースまたはスキル |
|---|---|---|
| Xに関するポリシーとは | 非構造化ドキュメント、更新頻度が低い | ナレッジベース |
| Xはどのように機能するか | 参照ドキュメント、説明コンテンツ | ナレッジベース |
| これまでにこの問題を見た人はいるか | 過去のチケット、意味的類似性 | ナレッジベース |
| 現在の休暇残高はいくらか | 構造化、ユーザースコープ、リアルタイム | 検証済みユーザーアクセスを備えたスキル |
| 今週未解決のチケットは何件か | カウント、構造化フィルターが必要 | スキル |
| 自分の未解決の商談は何か | トランザクション性、ユーザースコープ、完全性が必要 | 検証済みユーザーアクセスを備えたスキル |
| この問題のチケットを作成する | 書き込み操作 | スキル |
| 割引の承認しきい値はいくらか | 正確な設定値 | スキルまたはジョブ記述 |
| Product Xには何が含まれるか | 参照ドキュメント、情報提供 | ナレッジベース |
| エンタープライズ階層でのProduct Xの価格はいくらか | 正確な価格設定、構造化データ | スキル |
| Acmeとの直近3回の通話を要約する | トランザクション性、アカウントと日付でフィルタリング済み | スキル |
| Yに対する当社の競合ポジショニングとは | 非構造化の参照コンテンツ | ナレッジベース |
Last updated: