こんにちは、munejyukaです。
今日、仕事でOCRという言葉を聞きました。
私は聞いたことがなかったのですが、まわりの人たちはフムフムという感じで…
私だけ知らない感じだったので、少しだけでも知っておいた方がいいなと思い、調べてみました。
OCRとは何の略?
まず、最初にOCRという文字は何の略なのかを調べました。
OCRとは、
Optical=光学的な Character=文字 Recognition=認識
の頭文字をとって出来た言葉のようです。
もう少し調べてみると、
手書きの文字や印刷された文字を読み取り、データと照らし合わせ文字を判断し、電子テキスト化する装置のこと。
画像をスキャナで読み取り、文字を識別して文書にするソフトもある。
と書いてありました。
要は、
手書きのものを電子テキストに置き換える
ことですね。
現代社会ならではといったところでしょうか。
文字をデジタル化にして紙の書類を削減!かつ、それだけでなく…
OCRで紙に書かれた文字をデジタル化することにより、物理的な保管スペースを縮小することができます。
また、画像としての文字をテキストデータに変換することで、ファイルサイズが圧倒的に軽くなる他、流用や転用などデータの再利用が容易になったり、キーワード検索が可能になったりと、扱いやすさが向上します。
また、紙の削減にとどまらず、音声読み上げソフトとの連携など応用の範囲も広がるとのことです。
ここまでとなると凄いですよね。
まとめ
このOCRは少し前からあるようですが、従来のOCRでは、漢字やひらがな、カタカナなどが混在する日本語の文章や手書きのものが苦手とされていたようです。
ここにきてようやく技術が進化して使えるレベルにまできているようです。
本当に凄いですね!
これから需要は増えるに違いないと思いますので、これからも注目していきたいですね!!
コメントを残す