Google Vision - 画像からテキストを読み取るアクション

このページは機械翻訳により提供されています。翻訳内容と英語版に相違がある場合は、英語版が優先されます。

画像からテキストを読み取るアクションでは、画像からテキストを読み取ることができます。 サポートされる画像には次が含まれます:

  • 写真: たとえば、写真には道路標識や交通標識が含まれる場合があります。 Google Visionは、抽出された文字列、個々の単語、およびそれらの境界ボックスを返します。

    アビー・ロードの写真

  • スキャンされたドキュメント: Google Visionは、抽出されたテキストをページ、ブロック、段落、単語、および改行情報とともに返します。

    スキャンされたドキュメント

入力

入力フィールド説明
画像コンテンツファイルコンテンツのデータピル、文字列、公開URL、またはGoogle Cloud Storage URIを指定します。
画像タイプ画像タイプを選択します。 Google Visionは、画像タイプに応じて出力を最適化します。

出力

出力フィールド説明
テキストアノテーション画像から抽出されたすべての個々の単語のリスト。
ロケール抽出された単語のロケール。
テキスト抽出された単語。
境界ポリゴン画像上の単語の位置。 X座標とY座標が含まれます。
全文テキストアノテーション画像から抽出された全文テキスト。
ページ幅、高さ、段落位置など、ページに関する詳細が含まれます。
全文テキスト画像から抽出された全文テキスト。

Last updated: