データ変換
データ変換は、特定の要件や目的を満たすために、データをある形式、構造、または表現から別のものに変換します。 このプロセスでは、データを操作、エンリッチ化、クリーニング、または再構造化し、分析、保存、提示、または交換に適した状態にします。
ETLの抽出ステップとロードステップの間でデータ変換を実行するか、ELTで宛先にロードした後にデータを変換します。
ELT(Extract、Load、Transform)
データベースまたはデータウェアハウスのコネクターでカスタムSQLクエリアクションを使用し、宛先システムにすでにロードされているデータに対して変換を実行します。 WorkatoはSQLクエリを宛先システムに渡すことでこのプロセスをOrchestrateし、宛先システムがクエリを実行して結果を返します。
ETL(Extract、Transform、Load)
SQL変換またはSQLコレクションを使用してプラットフォーム内で直接変換を実行するには、Workatoのデータオーケストレーション機能を活用します。 Workatoのサービスはデータに対して変換を実行し、さまざまなダウンストリームの宛先に転送できる出力をレシピ内で提供します。
ビジネスユースケースの例
さまざまなビジネスシナリオにおいて、データ変換はデータを効果的に使用するための最適化と準備において重要な役割を果たします。 主な例は次のとおりです。
正規化
正規化では、データを標準形式または標準構造に整理することで、データの一貫性を確保し、冗長性を排除します。 このステップは、データセット全体で均一性を維持するために不可欠であり、分析とレポートを簡素化します。
集約
集約では、ファイルシステム、アプリケーション、データベースなど、複数のソースからのデータを組み合わせます。 この統合データは、分析またはレポートの目的で特定の宛先に送信でき、ビジネスメトリクスの包括的なビューを提供します。
エンリッチ化
エンリッチ化では、外部ソースから追加情報、属性、または派生値を追加することでデータを強化します。 このプロセスにより、データの品質と価値が向上し、より有益でアクションにつながるものになります。
変換
変換とは、データをあるデータ型、形式、またはエンコーディングから別のものに変更するプロセスです。 例として、テキストを数値形式に変換したり、CSVファイルをJSON形式に変換したりすることが挙げられます。 このステップにより、異なるシステム間でデータの互換性と使いやすさが確保されます。
検証とクリーニング
検証とクリーニングでは、データの整合性、正確性、完全性を確認します。 これには、データの高い品質を維持するために必要な事前定義済みの標準または基準をデータが満たすように、エラー、不整合、または外れ値を削除または修正することが含まれます。
リバースETL
リバースETLとは、データ標準化変換を適用した後に、データウェアハウスからソースアプリケーションへデータを再同期することを指します。 このアプローチにより、ソースアプリケーションは運用で使用するための最新かつ標準化されたデータを常に保持できます。
さらに詳しく
データ変換についてさらに詳しく知るには、特定の手法とツールを扱う次のセクションを確認してください。
変換手法
データ操作と変換タスクにWorkatoの組み込みFormulaを使用する方法を学びます。 より複雑なニーズについては、特定の要件に合わせたデータ変換にカスタムコードを活用する方法を確認してください。 変換手法について詳しく確認する。
変換でのSQLの使用
SQL変換とSQLコレクションメソッドの概要を含め、SQLを使用してデータ変換を実行する方法を確認してください。 SQLクエリを使用すると、データベースまたはデータウェアハウス上で複雑な変換を直接実行できます。 データ変換のニーズにSQLを活用する方法について詳細を見る。
Last updated: