Agent Studioデータ
Agent Studio Genieは、ワークフローを処理するためにデータを使用します。 これには、重要なレシピ情報をData tablesに保存し、knowledge basesおよびskillsでデータをアップロードして維持することが必要です。
データレジデンシー
Data residencyとは、Genieのインタラクションに関連付けられたデータを処理し保存する地理的リージョンを指します。 Data residencyは、GDPR、国別のデータ主権ルール、または国境を越えたデータ転送を管理する金融サービス規制などのデータローカライゼーション要件の対象となる組織にとって、重要な考慮事項です。
データセンターの所在地
Genieは、US、EU、AU、SG、JPのデータセンターのすべてのユーザーが利用できます。 GenieモデルはUS、EU、APACリージョンでホストされ、可能な限りデータレジデンシー要件に準拠します。 Genieの使用に関心がある場合、または追加情報が必要な場合は、カスタマーサクセス担当者にお問い合わせください。
つまり、ワークスペースに適切なWorkatoデータセンターを選択することが、model inferenceを正しいリージョンで実行するための主要なメカニズムです。 組織がEUデータローカライゼーション要件の対象となる場合、ワークスペースはEUデータセンターに配置する必要があります。これにより、model inferenceがEUでホストされるモデルにルーティングされます。
データセキュリティ
DevelopmentおよびステージングEnvironmentは、プロダクションにデプロイする前にGenieの動作をテストするために存在します。 テストには、会話、Skill呼び出し、Knowledge Baseクエリが必要です。 顧客レコード、従業員の個人情報、財務データ、患者レコードなど、実際のプロダクションデータを使用しないでください。 Workatoでは、テストに合成データを使用することを推奨しています。
下位Environmentでプロダクションデータを使用するリスクには、次が含まれます:
データ露出: 下位Environmentは通常、プロダクションよりもアクセス制御の制限が緩やかです。 下位Environmentへの正当なアクセス権を持つ開発者、テスター、請負業者が、プロダクションデータへの正当なアクセス権を持っていない場合があります。 下位Environmentでプロダクションデータを使用すると、意図した範囲よりも広い対象者にデータが露出します。
規制違反: データがGDPR、HIPAA、CCPA、またはその他のプライバシー規制の対象である場合、適切な統制なしに下位Environmentで実際の個人データを使用すると、規制のデータ処理要件に違反する可能性があります。 特に、下位EnvironmentがプロダクションEnvironmentとは異なるリージョンでホストされている場合です。
データ品質の汚染: プロダクションデータを使用してレコードを作成、更新、または削除するテスト操作は、分離されたEnvironmentであっても、Environmentの境界が正しく適用されていない場合、プロダクションデータの品質を汚染する可能性があります。
DevelopmentおよびステージングEnvironmentで合成データを使用する: 合成データは、現実的な名前、妥当な値、代表的なデータ構造など、Genieの動作をテストするのに十分現実的である必要があります。 現実的なテストデータを大量に必要とするGenieでは、プロダクションデータをコピーするのではなく、合成データ生成プロセスに投資してください。
会話データリテンション
会話レコードの保持期間は、Genieの利用状況における有用性とリスクレベルに影響します。 保持期間が長いほど、デバッグ、QA、コンプライアンス証跡のための履歴が増えます。 また、より多くの個人データがより長期間保持されることを意味し、データ侵害のリスク面とプライバシー規制下でのコンプライアンス負担が増加します。
適切な保持期間は、次によって異なります:
運用上の必要性: ビルダーが問題をデバッグするために、どの程度過去まで確認する必要がありますか。 ほとんどのGenieでは、運用目的には90日間の会話履歴で十分です。 さらに過去まで確認する必要があるエッジケースはまれであり、無期限に長い保持期間を正当化するものではありません。
コンプライアンス要件: 一部の規制フレームワークでは、AIシステムのインタラクションレコードについて、最小または最大の保持期間を指定しています。 MiFID IIの対象となる金融サービス企業は、顧客とのコミュニケーションレコードを5~7年間保持することが求められる場合があります。 HIPAAの対象となる医療機関には、患者データを含むレコードに関する特定の保持要件がある場合があります。 保持を構成する前に、適用される要件を特定してください。
プライバシー義務: GDPRおよび類似のフレームワークの下では、個人データは収集目的に必要な期間を超えて保持すべきではありません。 デバッグ目的で会話を保持する場合、保持期間はデバッグに必要な最小限の期間にする必要があります。無期限ではありません。 必要な場合は、Genieのデータ保護影響評価の一部として、保持の目的と期間を文書化してください。
データ主体の権利: ユーザーは、GDPR、CCPA、または類似の規制に基づいて、自身の個人データの削除を要求する場合があります。 これらの要求に対応するため、会話履歴を含むプロセスを用意してください。 特定のユーザーのすべての会話レコードを特定する方法、データ主体アクセス要求のためにエクスポートする方法、消去要求のために削除する方法を把握してください。 Workatoプラットフォームの保持および削除機能が、これらの要件に対応していることを確認してください。
Last updated: