PR

【Windows】OneNoteを使って画像から英語のテキストを抽出する

Windowsに入っているMicrosoftのOneNoteを使って画像から英語のテキストを抽出する方法について説明する

スポンサーリンク

はじめに

Windowsに入っているMicrosoftのOneNoteを使って画像から英語のテキストを抽出する

こんな感じのスキャンされた文章から

https://ntrs.nasa.gov/citations/19800020753

こんな感じでテキストを抽出する

OneNoteで画像からテキストをコピーする

やり方は以下の通り

  1. スクリーンショットを取る
  2. OneNoteに貼り付ける
  3. 画像内のテキストを検索可能にする
  4. 画像からテキストをコピーする
  5. 適当なブラウザの検索バーにペーストして改行を削除する

スクリーンショットを取る

「Windowsキー+Shift+S」を押してスクリーンショットのモードにして,ドラッグで範囲を指定する

OneNoteに貼り付ける

OneNoteを開き,適当な場所を選択して「Ctrl+V」で貼り付ける

画像内のテキストを検索可能にする

貼り付けた画像を右クリックして「画像内のテキストを検索可能にする>英語」をクリックする

デフォルトだと「日本語」になっており,次のステップの英語のテキスト抽出がうまくいかない

ちなみに英語以外の言語を追加したい場合は「ファイル>オプション>言語」から追加できる

Office で編集言語または作成言語を追加する、または言語設定を行う - Microsoft サポート
言語を追加するか、または表示、ヘルプ、ポップ ヒント言語を選択します。

画像からテキストをコピーする

再び貼り付けた画像を右クリックし,「画像からテキストをコピー」する

適当なブラウザの検索バーにペーストして改行を削除する

いまコピーしたテキストには不必要な改行が含まれているので,適当なブラウザを開いて検索窓に貼り付け&切り取りする

これで不必要な改行やフォント/フォントサイズなどの無駄な情報がそぎ落とされる

最終的にこのようにテキストが抽出できた

A conformal—mapping method for the design of airfoils with prescribed velocity— distribution characteristics, a panel method for the analysis of the potential flow about given airfoils, and a boundary—layer method have been combined. With this combined method, airfoils with prescribed boundary—layer characteristics can be designed and airfoils with prescribed shapes can be analyzed. All three methods are described briefly. A FORTRAN IV computer program for the numerical evaluation of these methods is available through COSMIC. The program and its input options are described in detail. A complete listing is given as an appendix .

おわりに

Windowsに入っているMicrosoftのOneNoteを使って画像から英語のテキストを抽出する方法について説明した

画像からテキストを抽出する方法はいろいろがあるが,Microsoft製品しか使えない人,ネットにあげられないような文章を対象にしている人にとってはOneNoteは非常に役に立つと思う

コメント