JP2008282095A - OCR(OpticalCharacterRecognize)ソフトウエア - Google Patents

OCR(OpticalCharacterRecognize)ソフトウエア Download PDF

Info

Publication number
JP2008282095A
JP2008282095A JP2007123565A JP2007123565A JP2008282095A JP 2008282095 A JP2008282095 A JP 2008282095A JP 2007123565 A JP2007123565 A JP 2007123565A JP 2007123565 A JP2007123565 A JP 2007123565A JP 2008282095 A JP2008282095 A JP 2008282095A
Authority
JP
Japan
Prior art keywords
ocr
character
software
recognize
recognizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007123565A
Other languages
English (en)
Inventor
Koichiro Otsuka
広一郎 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007123565A priority Critical patent/JP2008282095A/ja
Publication of JP2008282095A publication Critical patent/JP2008282095A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 OCRソフトウエアにおいて、文字認識だけでなく、表や図を認識しドキュメント作成効率を簡素化することを目的とする。
【解決手段】 読み取り手段によって読み取られた画像から、縦の線と横の線を認識する手段、平行している縦線同士の間隔と、平行している横線同士の間隔とから表の縦横の間隔を認識、表作成する手段と、縦の線と横の線内にある文字を認識し、キャラクタコードとして処理する手段を有し、電子ファイルを作成するOCRソフトウエアとすることである。
【選択図】 図1

Description

本発明は、読み取り手段によって読み取られた画像から、文字を認識し、キャラクタコードとして処理するOCR(Optical Character Recognize)ソフトウエアに関する。
読み取り手段によって読み取られた画像から、文字を認識し、キャラクタコードとして処理するOCR(Optical Character Recognize)ソフトウエアは手書き文字を認識し、ドキュメント作成を助けるツールとして非常に有用なソフトウエアである。
しかし、手書きで書かれた原稿は文字だけであるとは限らず、表や図、描画なども含まれることが多く、OCR(Optical Character Recognize)ソフトウエアでは手書き文字のみしか自動で処理できないため、表や図、描画は結局、表作成ソフト、図形・描画作成ソフトを使用し、作成せねばならなかった。
また、OCR(Optical Character Recognize)ソフトウエアは手書き文字のラスタデータから文字を認識し、キャラクタコードに変換するものでしかなかった。
従来例としては、例えば特許文献1をあげることが出来る。
特開2003-108923号公報
本発明ではこのような不具合を解消するために読み取り手段によって読み取られた画像から、縦の線と横の線を認識し、平行している縦線同士の間隔と、平行している横線同士の間隔とから表の縦横の間隔を認識、表作成、そして、縦の線と横の線内にある文字を認識し、キャラクタコードとして処理、また、線・図形・描画を認識することであらゆる原稿を処理し電子ファイルを作成するOCR(Optical Character Recognize)ソフトウエアを提供することを目的とするものである。
いいかえると、手書き文字のラスタデータから文字を認識し、キャラクタコードに変換するものでしかなかったOCRソフトウエアの機能を、表・図形・描画のラスタデータから表・図形・描画を認識し、ベクタイメージデータを作成するよう機能拡張することを目的とするものである。
上記目的を達成するために、本請求項1に係る発明のOCRソフトウエアは、
読み取り手段によって読み取られた画像から、縦の線と横の線を認識する手段、
平行している縦線同士の間隔と、平行している横線同士の間隔とから表の縦横の間隔を認識、表作成する手段と、
縦の線と横の線内にある文字を認識し、キャラクタコードとして処理する手段
を有し、電子ファイルを作成するOCR(Optical Character Recognize)ソフトウエアである。
本請求項2に係る発明のOCRソフトウエアは、
読み取り手段によって読み取られた画像から、線・図形・描画を認識する手段、
を有し、電子ファイルを作成するOCR(Optical Character Recognize)ソフトウエアである。
本請求項3に係る発明のOCRソフトウエアは
請求項1または請求項2において、電子ファイル作成のプロセス時に色を識別し、電子ファイル上で表現可能ななるべく近い色で電子ファイルを作成する手段を有するOCR(Optical Character Recognize)ソフトウエアである。
本請求項4に係る発明のOCRソフトウエアは請求項1、請求項2において、文字認識、表認識、図・描画認識を効率よくするために、文字認識エリア、表認識エリア、図・描画認識エリアをユーザが指定することができる手段を有するOCR(Optical Character Recognize)ソフトウエアである。
本請求項5に係る発明のOCRソフトウエアは請求項1、請求項2において、文字認識、表認識、図・描画の文字または線の濃淡により処理後の文字のフォントまたは線の太さを決める手段を有するOCR(Optical Character Recognize)ソフトウエアである。
本請求項6に係る発明のOCRソフトウエアはOCR処理された文字をもとに音声へ変換する手段を有するOCR(Optical Character Recognize)ソフトウエアである。
以上説明したように、本発明では、文字認識できない部分について描画・図・表として認識するものである。OCRの文字認識と同様、間違った描画認識をする場合もありうるが、ラフスケッチをもとに清書する場合にまずOCRでスキャンしたドキュメントをもとに作成でき、プレゼン資料や電子ファイル作成負荷を大幅に減らすことができる。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
図1は本発明の実施形態における構成例である。
図1において、001は、フラットベッドスキャナやMultifunction Peripheralといったスキャナ機能を持った装置であり、PCとUSBのようなIFで接続される。
PCはシステムバス(002)を中心にCPU(003), RAM(004), Keyboard(005), Display(006), CD-ROMドライブ(007)からなる。PCのHDD(008)にはアプリケーションソフトがインストールされていて、その中に本特許の機能をもつOCRソフトもインストールされている。
図8は請求項1に関するフローチャートである。
まず最初に図2のような手書きの表原稿をスキャンし(101)、
読み取り画像内のすべての線を認識する(102)。線を認識したら(103)、
すべての線から平行している縦線と横線を認識(104)することで表を認識し(105)、
平行している縦線同士の間隔と、平行している横線同士の間隔とから表の縦横の間隔を算出、表作成する(106)。(読み取り解像度と平行した線同士の間の画素数を計数することで算出)
次に縦の線と横の線内にある文字を認識し、キャラクタコードとしてOCR処理(107)する。
そのあと、表外の部分をOCR処理し(108)、
Excel等の表作成ソフトフォーマットの電子ファイルへ変換して(109)、
保存することにより図3のような表フォーマットの電子ファイルが作成される(110)。
図9は請求項2に関するフローチャートである。
まず最初に図4のような手書きの原稿を読み取り手段によって原稿スキャン(111)し、
読み取られた画像から、まず文字を認識、OCR処理したあと、
文字として認識できなかった部分について線(矢印、破線、曲線含む)として認識(112)する。
線として認識したものから線が閉じられているものを認識しそれを図形(四角、三角、丸、ひし形含む)と認識、閉じられていないものを描画として認識する(115)。
すべての文字・図形・描画を認識したらあと、MS PowerPoint(登録商標), Visio(登録商標)等の図形・描画作成ソフトフォーマットの電子ファイルへ変換し(118)、
保存することにより図5のような図形・描画フォーマットの電子ファイルが作成される(119)。
図10は請求項3に関するフローチャートである。
読み取り手段によって原稿スキャン(121)された図6のような画像から、
読み取り画像内のすべての線を認識する(122)。線を認識したら、
すべての線から平行している縦線と横線を認識(123)することで表を認識し、
平行している縦線同士の間隔と、平行している横線同士の間隔とから表の縦横の間隔を算出、表作成する。この際に色も識別し、表現可能なもっとも近い色で表作成する(124)。
次に縦の線と横の線内にある文字を認識し、キャラクタコードとしている識別とOCR処理(125)する。
そのあと、表外の部分の文字の色識別とOCR処理を行う(126)。
それから、表外の文字以外の部分について、
線(矢印、破線、曲線含む)として認識(127)する。
線として認識したものから線が閉じられているものを認識しそれを図形(四角、三角、丸、ひし形含む)と認識(129)、閉じられていないものを描画として認識する(128)。
認識した図形・描画の色認識ののち(130)、
MS PowerPoint(登録商標), Visio(登録商標)等の図形・描画作成ソフトフォーマットの電子ファイルへ変換し、
保存することにより図7のような色の図形・描画フォーマットの電子ファイルが作成される。
図11は請求項4に関するフローチャートである。
請求項1、請求項2において、原稿スキャン後、文字認識エリアとして処理したい部分を文字認識エリアとしてユーザが指定し(132)、OCR処理し(133)、
表認識エリアとして処理したい部分を表認識エリアとしてユーザが指定(134)、OCR処理し(135)、
図・描画認識エリアとして処理したい部分を図・描画認識エリアとしてユーザが指定し(136)、
OCR処理(137)することで認識精度を高め、より原稿に近い電子ファイルを作成することが可能になる。
図12は請求項5に関するフローチャートである。
読み取り手段によって原稿スキャン(141)された画像から、
読み取り画像内のすべての線を認識する(142)。線を認識したら、
すべての線から平行している縦線と横線を認識(143)することで表を認識し、
平行している縦線同士の間隔と、平行している横線同士の間隔とから表の縦横の間隔を算出、表作成する。この際に線の識別し、その線の濃淡により処理後線の太さを表作成する(144)。
次に縦の線と横の線内にある文字を認識し、キャラクタコードとしてOCR処理(145)する。
この際、文字の線の濃淡から文字フォントを変える。
そのあと、表外の部分の文字の色識別とOCR処理を行う(146)。
それから、表外の文字以外の部分について、線(矢印、破線、曲線含む)として認識(147)する。
線として認識したものから線が閉じられているものを認識しそれを図形(四角、三角、丸、ひし形含む)と認識(149)、閉じられていないものを描画として認識する(148)。
認識した図形・描画の濃淡により線の太さを決定したのち(150)、
MS PowerPoint(登録商標), Visio(登録商標)等の図形・描画作成ソフトフォーマットの電子ファイルへ変換し、
保存することにより図5のような図形・描画フォーマットの電子ファイルが作成される。
図13は請求項6に関するフローチャートである。
読み取り手段によって原稿スキャン(151)された画像から、文字を認識後(152)、
認識された文字をもとに音声へ変換する(153)。
本特許の概略構成を示すブロック図。 請求項1におけるOCR処理前の手書きの表の図。 請求項1におけるOCR処理後の図。 請求項2におけるOCR処理前の手書きの図。 請求項2におけるOCR処理後の図。 請求項3におけるOCR処理前の手書きの図。 請求項3におけるOCR処理後の図。 請求項1におけるOCR処理のフローチャート。 請求項2におけるOCR処理のフローチャート。 請求項3におけるOCR処理のフローチャート。 請求項4におけるOCR処理のフローチャート。 請求項5におけるOCR処理のフローチャート。 請求項6におけるOCR処理のフローチャート。
符号の説明
001 Scanner
002 System Bus
003 CPU
004 RAM
005 Keyboard
006 Display
007 CD-ROM Drive
008 HDD+OCRソフトウェア

Claims (6)

  1. 読み取り手段によって読み取られた画像から、縦の線と横の線を認識する手段、平行している縦線同士の間隔と、平行している横線同士の間隔とから表の縦横の間隔を認識、表作成する手段と、縦の線と横の線内にある文字を認識し、キャラクタコードとして処理する手段を有し、電子ファイルを作成するOCR(Optical Character Recognize)ソフトウエア。
  2. 読み取り手段によって読み取られた画像から、線・図形・描画を認識する手段を有し、電子ファイルを作成するOCR(Optical Character Recognize)ソフトウエア。
  3. 請求項1または請求項2において、電子ファイル作成のプロセス時に色を識別し、電子ファイル上で表現可能ななるべく近い色で電子ファイルを作成するOCR(Optical Character Recognize)ソフトウエア。
  4. 請求項1、請求項2において、文字認識、表認識、図・描画認識を効率よくするために、文字認識エリア、表認識エリア、図・描画認識エリアをユーザが指定することができるOCR(Optical Character Recognize)ソフトウエア。
  5. 請求項1、請求項2において、文字認識、表認識、図・描画の文字または線の濃淡により処理後の文字のフォントまたは線の太さを決めることを特徴とするOCR(Optical Character Recognize)ソフトウエア。
  6. OCR処理された文字をもとに音声へ変換することができるOCR(Optical Character Recognize)ソフトウエア。
JP2007123565A 2007-05-08 2007-05-08 OCR(OpticalCharacterRecognize)ソフトウエア Pending JP2008282095A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007123565A JP2008282095A (ja) 2007-05-08 2007-05-08 OCR(OpticalCharacterRecognize)ソフトウエア

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007123565A JP2008282095A (ja) 2007-05-08 2007-05-08 OCR(OpticalCharacterRecognize)ソフトウエア

Publications (1)

Publication Number Publication Date
JP2008282095A true JP2008282095A (ja) 2008-11-20

Family

ID=40142881

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007123565A Pending JP2008282095A (ja) 2007-05-08 2007-05-08 OCR(OpticalCharacterRecognize)ソフトウエア

Country Status (1)

Country Link
JP (1) JP2008282095A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8570619B2 (en) 2011-03-18 2013-10-29 Brother Kogyo Kabushiki Kaisha Control devices for scanning documents, systems including such control devices, and non-transitory, computer-readable media storing instructions for such control devices
JP2014048851A (ja) * 2012-08-30 2014-03-17 Konica Minolta Inc 表計算ソフトのレイアウト保持装置
US8792719B2 (en) 2011-07-29 2014-07-29 Brother Kogyo Kabushiki Kaisha Image processing device determining attributes of regions
US8830529B2 (en) 2011-07-29 2014-09-09 Brother Kogyo Kabushiki Kaisha Image processing device for accurately identifying region in image without increase in memory requirement
US8837836B2 (en) 2011-07-29 2014-09-16 Brother Kogyo Kabushiki Kaisha Image processing device identifying attribute of region included in image
US8929663B2 (en) 2011-07-29 2015-01-06 Brother Kogyo Kabushiki Kaisha Image processing device identifying region in image as one of uniform region and nonuniform region
JP2015090671A (ja) * 2013-11-07 2015-05-11 株式会社東芝 電子機器、方法及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8570619B2 (en) 2011-03-18 2013-10-29 Brother Kogyo Kabushiki Kaisha Control devices for scanning documents, systems including such control devices, and non-transitory, computer-readable media storing instructions for such control devices
US8792719B2 (en) 2011-07-29 2014-07-29 Brother Kogyo Kabushiki Kaisha Image processing device determining attributes of regions
US8830529B2 (en) 2011-07-29 2014-09-09 Brother Kogyo Kabushiki Kaisha Image processing device for accurately identifying region in image without increase in memory requirement
US8837836B2 (en) 2011-07-29 2014-09-16 Brother Kogyo Kabushiki Kaisha Image processing device identifying attribute of region included in image
US8929663B2 (en) 2011-07-29 2015-01-06 Brother Kogyo Kabushiki Kaisha Image processing device identifying region in image as one of uniform region and nonuniform region
JP2014048851A (ja) * 2012-08-30 2014-03-17 Konica Minolta Inc 表計算ソフトのレイアウト保持装置
JP2015090671A (ja) * 2013-11-07 2015-05-11 株式会社東芝 電子機器、方法及びプログラム

Similar Documents

Publication Publication Date Title
JP2008282095A (ja) OCR(OpticalCharacterRecognize)ソフトウエア
US20170011732A1 (en) Low-vision reading vision assisting system based on ocr and tts
JP7387339B2 (ja) 画像処理システム、画像処理方法、及びプログラム
JP5121599B2 (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP4582204B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP2007004621A (ja) 文書管理支援装置、文書管理支援方法およびプログラム
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP4544315B2 (ja) 紙文書処理装置及びプログラム
JP2009296150A (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP6452657B2 (ja) 画像処理装置、その制御方法、及びプログラム
JP2006196976A (ja) Ocrによる自動清書機能を持つ複写システム
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
CN102833449B (zh) 一种基于多功能机的文档自动处理方法
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
US8902481B2 (en) Method and apparatus for document digitization
JP2008244545A (ja) 画像処理装置
JP4998176B2 (ja) 翻訳装置及びプログラム
JP2008193234A (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP2020025218A (ja) 画像処理装置及び画像処理プログラム
JP2015102934A (ja) 画像形成装置
JP4083723B2 (ja) 画像処理装置
US11336793B2 (en) Scanning system for generating scan data for vocal output, non-transitory computer-readable storage medium storing program for generating scan data for vocal output, and method for generating scan data for vocal output in scanning system
JP2009071781A (ja) 画像処理装置及び画像処理プログラム
CN101140621A (zh) 图文影像处理装置及其影像处理方法
JP2021185653A (ja) 画像処理装置、画像処理プログラム及び画像処理方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201