# Google Vision アクション - Read text from image (画像からのテキストの読み取り)

このアクションは、画像からテキストを読み取ります。画像は以下の2種類のいずれかを使用できます。

  • 写真 : たとえば、写真には道路標識や交通標識が含まれる場合があります。Google Vision は抽出された文字列、個々の単語、およびそれらの境界ボックスを返します。

    Abbey Road の写真

  • スキャンされたドキュメント : Google Vision は抽出されたテキストとともに、ページ、ブロック、段落、単語、および改行の情報を返します。

    スキャンされたドキュメント

# 入力項目

項目名 説明
Image content ファイルコンテンツのデータピル、文字列、パブリック URL、または Google Cloud Storage の URI を受け付けます。
Image type 選択された画像の種類 (写真またはスキャンされたドキュメント) に応じて、Google Vision は出力を最適化します。

# 出力項目

項目名 説明
Text annotations 画像から抽出された個々の単語すべてを含むリスト。
Locale 抽出された単語のロケール。
Text 抽出された単語。
Bounding poly 画像上での単語の位置。X 座標と Y 座標が含まれます。
Full text annotation 画像から抽出されたテキスト全文。
Pages 幅、高さ、段落の位置といった、ページについての詳細情報が含まれます。
Full text 画像から抽出されたテキスト全文。


Last updated: 2023/8/31 1:07:14