JP5753828B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP5753828B2 JP5753828B2 JP2012214138A JP2012214138A JP5753828B2 JP 5753828 B2 JP5753828 B2 JP 5753828B2 JP 2012214138 A JP2012214138 A JP 2012214138A JP 2012214138 A JP2012214138 A JP 2012214138A JP 5753828 B2 JP5753828 B2 JP 5753828B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- unit
- character string
- image
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Description
本発明の画像処理装置は、情報を画像データとして読み込む画像読込部と、画像データに含まれる文字を認識する文字認識部と、文字認識部により認識された個々の文字を文字の形態を示す文字情報に基づいて文字列ごとにグループ化するグループ化部と、グループ化された文字列の重要度に基づいて、リンクの対象となる文字列を抽出する文字抽出部と、文字抽出部により抽出された文字列のうち、字体が共通する文字列を文字が認識された画像データの中から検索する文字検索部と、文字検索部により検索された字体が共通する文字列を重要度に基づいて相互にリンクさせるリンク設定部とを備える。
このため、画像データを閲覧するユーザは、複数のページにそれぞれ記載された文字列からダイレクトに重要度の高い文字列を参照することができる。
上記の構成によれば、ユーザの要望に応じて文字列のリンク先を変更したり、リンクさせる文字列を制限したりすることができる。
上記の構成によれば、文字列の重要度を変更することによりリンク先を変更したり、あるいは、文字列をリンクの対象から除外したりすることができる。
上記の構成によれば、字体が共通する複数の文字列のうち、一部の文字列をリンクの対象から除外することができる。したがって、ユーザの要望に応じて不要なリンクの設定を制限することができるため、その分リンクの設定を効率的に行うことができる。
本発明の画像処理プログラムは、画像処理装置のコンピュータに、情報を画像データとして読み込む手順と、画像データに含まれる文字を認識する手順と、認識された個々の文字を文字の形態を示す文字情報に基づいて文字列ごとにグループ化する手順と、グループ化された文字列の重要度に基づいて、リンクの対象となる文字列を抽出する手順と、抽出された文字列のうち、字体が相互に共通する文字列を文字が認識された画像データの中から検索する手順と、検索された文字列を重要度に基づいて相互にリンクさせる手順とを実行させるためのものである。
このため、画像データを閲覧するユーザに対して、複数のページにそれぞれ記載された文字列からダイレクトに重要度の高い文字列を参照させることができる。
図1は、本実施形態における画像処理装置1の構成を概略的に示す図である。図1には、画像処理装置1が右前上方から示されており、ユーザに相対する画像処理装置1の前面と、この画像処理装置1の右側面とがみえている。
スキャナー部16の手前側には操作パネル18が設置されている。この操作パネル18には、ユーザの各種操作に供される複数の操作キー(操作部)18aが配置され、各種情報を表示する表示画面(表示部)18bが設けられている。
制御部24は、コンピュータとして機能する要素であり、CPU(中央演算処理装置)やROM(リードオンリーメモリ)等のハードウエア資源を有している。制御部24は、このハードウエア資源を用いてプログラムを実行しており、上述のスキャナー部16、操作パネル18、文字認識部28、グループ化部30、文字抽出部32、文字検索部34、リンク設定部36及びデータ保存部26を制御する。
文字認識部28は、スキャナー部16で読み取られた画像データに含まれる文字を認識する。文字を認識するための処理は、例えば、上記のOCR機能による文字の認識手順に従って行われる。
グループ化部30は、文字認識部28により認識された個々の文字を文字の形態を示す文字情報に基づいて文字列ごとにグループ化する。グループ化された文字列は、例えば、単語や語句等であり、文字の組み合わせによって所定の意味を有するものである。この文字情報は、例えば、フォントの種類や、フォントサイズ、文字色、マーカー設定、太字、斜体、下線、空白等を示している。
文字抽出部32は、グループ化された文字列の重要度に基づいて、リンクの対象となる文字列を抽出する。この重要度は、例えば、文字列のフォントサイズや、文字色、マーカー設定、太字、斜体、下線、インデント、段落番号等によって決定される。
文字検索部34は、文字抽出部32により抽出された文字列のうち、字体が相互に共通する文字列を文字が認識された画像データの中から検索する。
リンク設定部36は、文字検索部34により検索された文字列を重要度に基づいて相互にリンクさせる。具体的には、文字検索部34により検索された文字列のうち、各文字列に対する重要度が高い方の文字列をリンク先として設定する。
データ保存部26は、文字認識部28により認識された画像データ中の文字に関する情報、グループ化部30によりグループ化された文字列に関する情報、文字抽出部32により抽出された文字列に関する情報、及び、文字検索部34による文字列の検索結果を保存する。
操作パネル(操作表示部)18は、上記の操作部18a及び表示部18bにより構成されている。本実施形態において、表示部18bは、文字列をリンクさせるための設定情報を表示する。表示部18bは、設定情報として、文字抽出部32により抽出された文字列のリストを更新するための画像を表示する。あるいは、文字検索部34により検索された文字列のリンク先を指定するための画像を表示する。
これに対して、操作部18aは、表示部18bに表示された設定情報に対するユーザの操作を受け付ける。操作部18aは、ユーザにより直接操作されるものであり、上記の操作キーのほかにも、タッチパネル上の操作領域等が操作部18aの構成に相当する。
図3は、スキャナー部16により読み込まれた画像データの一例を概略的に示す図である。図3では、文字認識部28により画像データに含まれる文字を認識するための手法について説明する。
(1)ページごとに画像のレイアウト解析を行い、画像を文字領域、画像領域及び枠線領域に分割する。
(2)各領域について画像の解析を行い、解析した情報をデータ保存部26に保存する。
(3)文字領域を行、列、及び斜めに分解する。
(4)分解された行及び列の各ライン単位で画素をカウントすることにより、文字を抽出する。
(5)抽出された文字の大きさや、字体、文字のつぶれ、かすれ等を特定した上で、正規化や、特徴抽出、マッチング、文字認識等の処理を行う。
このように、文字認識部28は、上記(1)〜(5)の手順によって文字領域に含まれる文字を1文字ずつ認識することができる。
図4は、グループ化部30によりグループ化された文字列の一覧を示す表である。図4では、図3中に示す1ページ目(P1)の画像データに含まれる文字列を示す。
図4中に示す重要度は、値が上昇するにつれて、文字列の重要度が高くなることを示している。これに対して、文字抽出部32は、文字列の重要度に基づいてリンクの対象となる文字列を重要語として抽出する。
図5は、グループ化された文字列の中から文字抽出部32により抽出された文字列を示す表である。以下では、文字抽出部32により抽出された文字列を適宜「重要語」と呼称する。
文字検索部34は、文字抽出部32により抽出された重要語のうち、字体が相互に共通する文字列を文字が認識された画像データの中から検索する。ここで、「字体」とは、文字の骨格を示しており、共通する字体の文字列を様々な形態(フォントの種類、フォントスタイル、フォントサイズ、文字色、マーカー設定、太字、斜体、下線、空白等)で表すことが可能である。例えば、文字検索部34は、文字抽出部32により重要語として抽出された図5中に示す「用語解説」を図3中に示す3ページ分の画像データの中から検索する。
またリンク設定部36は、各ページに含まれる文字列のリンクに関して、文字検索部34により検索された字体が共通する文字列のうち、各文字列に対する重要度が高い方の文字列をリンク先として設定している。例えば、1ページ目及び2ページ目に含まれる「用語説明」の重要度は、それぞれ「2」と「4」であり、2ページ目に含まれる文字列に対する重要度の方が、1ページ目に含まれる文字列の重要度よりも高い。このとき、リンク設定部36は、重要度が高い方の文字列、すなわち、2ページ目に含まれる「用語説明」を、1ページ目に含まれる「用語説明」のリンク先として設定する。
図8は、第1実施形態の画像処理装置1により画像データに含まれる文字列をリンクさせるための手順を示すフローチャートである。以下、手順を追って説明する。
ステップS102:制御部24は、次のページの原稿が原稿送り装置14に載置されているか否かを判断する。原稿が載置されている場合(Yes)、再びステップS100の手順を実行する。これらの手順は、全てのページの原稿を読み取るまで繰り返し行われる。
次に、第2実施形態の画像処理装置1及び画像処理プログラムについて説明する。第2実施形態では、ユーザの操作に応じて、抽出された重要語の変更及びリンク先の設定が行われる。画像処理装置1の基本的な構成については、第1実施形態と共通しており、共通する部材について同一の符号を付すとともに、重複する説明については適宜省略する。
各画像データは、イメージビューとして、「ハイパーリンク」の文字列とともに、その周囲の文字を含めた領域が切り取られた状態で表示されている。また、各イメージビューに対応して数字が割り振られている。
ユーザの操作が完了すると、リンク設定部36は、指定された文字列をリンク先として設定する。
図10は、第2実施形態の画像処理装置1により画像データに含まれる文字列をリンクさせるための手順を示すフローチャートである。以下では、図8中のフローチャートに示す手順と重複する説明については適宜省略する。
次に、第3実施形態の画像処理装置1及び画像処理プログラムについて説明する。第3実施形態では、ユーザの操作に応じて重要度を変更したり、重要度の値によってリンクの対象となる文字列を制限したりする。画像処理装置1の基本的な構成については、第1実施形態及び第2実施形態と共通しており、共通する部材について同一の符号を付すとともに、重複する説明については適宜省略する。
ユーザは、文字検索部34により検索された文字列の重要度を変更するための画像が表示された操作パネル18を操作することにより、各文字列の重要度を変更することができる。
例えば、操作パネル18の表示部18bには、図6中に示す検索結果に関する情報及びリンク制限に関する情報が表示される。これに対して、ユーザは、各文字列の重要度を変更することができる。また、リンク設定部36は、ユーザの操作に応じて変更された重要度に基づいてリンク先を設定する。
また第3実施形態では、重要度に応じてリンクを制限する。このリンクの制限は、上記の重要度の変更と同様に、ユーザの操作に応じて設定することができる。あるいは、自動で設定してもよい。
16 スキャナー部(画像読取部)
18 操作パネル
18a 操作部
18b 表示部
24 制御部
28 文字認識部
30 グループ化部
32 文字抽出部
34 文字検索部
36 リンク設定部
Claims (6)
- 情報を画像データとして読み込む画像読込部と、
前記画像データに含まれる文字を認識する文字認識部と、
前記文字認識部により認識された個々の前記文字を前記文字の形態を示す文字情報に基づいて文字列ごとにグループ化するグループ化部と、
前記グループ化された前記文字列の重要度に基づいて、リンクの対象となる前記文字列を抽出する文字抽出部と、
前記文字抽出部により抽出された前記文字列のうち、字体が共通する前記文字列を前記文字が認識された前記画像データから検索する文字検索部と、
前記文字検索部により検索された前記字体が共通する前記各文字列を前記重要度に基づいて相互にリンクさせるリンク設定部と、
前記各文字列をリンクさせるための設定情報を表示する表示部と、
前記表示部に表示された前記設定情報に対するユーザの操作を受け付ける操作部と
を備え、
前記表示部は、
前記設定情報として、前記画像データの全領域から前記文字検索部により検索された前記文字列及びその周囲を含む領域を切り抜いた部分画像のリストを表示し、
前記リンク設定部は、
前記ユーザの操作に応じて指定された前記部分画像に含まれる前記文字列を前記文字検索部により検索された前記文字列のリンク先として設定することを特徴とする画像処理装置。 - 請求項1に記載の画像処理装置において、
前記リンク設定部は、
前記文字検索部により検索された前記字体が共通する前記文字列のうち、各文字列に対する前記重要度が高い方の前記文字列をリンク先として設定することを特徴とする画像処理装置。 - 請求項1又は2に記載の画像処理装置において、
前記表示部は、
前記設定情報として、前記文字抽出部により抽出された前記文字列のリストを更新するための画像をさらに表示し、
前記文字検索部は、
前記ユーザの操作に応じて更新された前記リストに含まれる前記文字列を検索することを特徴とする画像処理装置。 - 請求項1から3のいずれかに記載の画像処理装置において、
前記表示部は、
前記設定情報として、前記文字列の前記重要度を変更するための画像をさらに表示し、
前記リンク設定部は、
前記ユーザの操作に応じて変更された前記重要度に基づいて、前記リンクを設定することを特徴とする画像処理装置。 - 請求項1から4のいずれかに記載の画像処理装置において、
前記リンク設定部は、
前記文字列に対する前記リンク先の設定を前記重要度に基づいて制限することを特徴とする画像処理装置。 - 画像処理装置のコンピュータに、
情報を画像データとして読み込む手順と、
前記画像データに含まれる文字を認識する手順と、
認識された個々の前記文字を前記文字の形態を示す文字情報に基づいて文字列ごとにグループ化する手順と、
前記グループ化された前記文字列の重要度に基づいて、リンクの対象となる前記文字列を抽出する手順と、
抽出された前記文字列のリストをユーザに更新させるための画像を表示部に表示する手順と、
前記表示部に表示された前記画像に対して、ユーザの操作による前記リストの更新を受け付ける手順と、
更新された前記リストに含まれる前記文字列のうち、字体が相互に共通する前記文字列を前記文字が認識された前記画像データから検索する手順と、
検索された文字列及びその周囲を含む領域を前記画像データから切り抜いた部分画像のリストを前記表示部に表示する手順と、
前記表示部に表示された前記部分画像のリストのうち、ユーザの操作により指定された前記部分画像に含まれる文字列を受け付ける手順と、
受け付けた前記部分画像に含まれる文字列を検索された前記文字列のリンク先として設定する手順と
を実行させるための画像処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012214138A JP5753828B2 (ja) | 2012-09-27 | 2012-09-27 | 画像処理装置及び画像処理プログラム |
US14/030,407 US8773704B2 (en) | 2012-09-27 | 2013-09-18 | Image processing apparatus that generates hyperlink structure data |
CN201310435947.0A CN103699891B (zh) | 2012-09-27 | 2013-09-23 | 图像处理装置及图像处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012214138A JP5753828B2 (ja) | 2012-09-27 | 2012-09-27 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014067370A JP2014067370A (ja) | 2014-04-17 |
JP5753828B2 true JP5753828B2 (ja) | 2015-07-22 |
Family
ID=50338557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012214138A Expired - Fee Related JP5753828B2 (ja) | 2012-09-27 | 2012-09-27 | 画像処理装置及び画像処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8773704B2 (ja) |
JP (1) | JP5753828B2 (ja) |
CN (1) | CN103699891B (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6394069B2 (ja) * | 2014-05-26 | 2018-09-26 | 京セラドキュメントソリューションズ株式会社 | 文書処理装置及び文書処理プログラム |
JP6447066B2 (ja) * | 2014-12-01 | 2019-01-09 | 株式会社リコー | 画像処理装置、画像処理方法、及びプログラム |
CN105260381A (zh) * | 2015-09-08 | 2016-01-20 | 百度在线网络技术(北京)有限公司 | 基于图像识别的数据维护方法和装置 |
CN106469132A (zh) * | 2016-08-31 | 2017-03-01 | 深圳天珑无线科技有限公司 | 数据处理的方法及装置 |
JP7016612B2 (ja) * | 2017-02-10 | 2022-02-07 | 株式会社東芝 | 画像処理装置及びプログラム |
CN107220648B (zh) * | 2017-04-11 | 2018-06-22 | 平安科技(深圳)有限公司 | 理赔单据的字符识别方法及服务器 |
JP7135446B2 (ja) * | 2018-05-30 | 2022-09-13 | 京セラドキュメントソリューションズ株式会社 | 電子機器 |
US11184493B2 (en) * | 2019-07-10 | 2021-11-23 | Ricoh Company, Ltd. | Information processing system, information processing method, and apparatus for extending a workflow |
JP2023023590A (ja) * | 2021-08-05 | 2023-02-16 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7756869B2 (en) * | 2004-04-30 | 2010-07-13 | The Boeing Company | Methods and apparatus for extracting referential keys from a document |
JP2006065588A (ja) * | 2004-08-26 | 2006-03-09 | Sharp Corp | 情報閲覧装置、情報閲覧プログラム及び情報閲覧プログラム記録媒体 |
JP2006085234A (ja) * | 2004-09-14 | 2006-03-30 | Fuji Xerox Co Ltd | 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム |
JP4590433B2 (ja) * | 2007-06-29 | 2010-12-01 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP4780169B2 (ja) | 2008-09-30 | 2011-09-28 | ブラザー工業株式会社 | データ生成装置、スキャナ、及びコンピュータプログラム |
JP5733907B2 (ja) * | 2010-04-07 | 2015-06-10 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP5676942B2 (ja) * | 2010-07-06 | 2015-02-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
-
2012
- 2012-09-27 JP JP2012214138A patent/JP5753828B2/ja not_active Expired - Fee Related
-
2013
- 2013-09-18 US US14/030,407 patent/US8773704B2/en active Active
- 2013-09-23 CN CN201310435947.0A patent/CN103699891B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014067370A (ja) | 2014-04-17 |
US20140085669A1 (en) | 2014-03-27 |
US8773704B2 (en) | 2014-07-08 |
CN103699891B (zh) | 2017-04-12 |
CN103699891A (zh) | 2014-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5753828B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2005108254A (ja) | アイコン生成方法、アイコン選択方法及び文書検索方法 | |
US20090110288A1 (en) | Document processing apparatus and document processing method | |
JP2007317034A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
US8854635B2 (en) | Document processing device, method, and recording medium for creating and correcting formats for extracting characters strings | |
JP2006221569A (ja) | 文書処理システム、文書処理方法、プログラムおよび記憶媒体 | |
US20130339002A1 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
JP2008040753A (ja) | 画像処理装置、方法、プログラムおよび記録媒体 | |
JP6322086B2 (ja) | 表示制御装置、表示装置、プログラム、記録媒体 | |
JP2012190314A (ja) | 画像処理装置およびプログラム | |
JP7268389B2 (ja) | 情報処理装置及びプログラム | |
JP7031465B2 (ja) | 情報処理装置及びプログラム | |
JP5721052B2 (ja) | 画像処理装置およびプログラム | |
JP2016212626A (ja) | Webを介した外字・異体字含有文字群入力利用システム | |
JP2007018158A (ja) | 文字処理装置、文字処理方法及び記録媒体 | |
US11206335B2 (en) | Information processing apparatus, method and non-transitory computer readable medium | |
US20230108505A1 (en) | Information processing apparatus | |
JP7383882B2 (ja) | 情報処理装置、及び情報処理プログラム | |
US20210295032A1 (en) | Information processing device and non-transitory computer readable medium | |
JP5259764B2 (ja) | 拾い読み支援システム、拾い読み支援方法及びプログラム | |
JP4906044B2 (ja) | 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体 | |
JP2006092207A (ja) | 文書属性取得装置、文書属性取得方法および文書属性取得プログラム | |
JPH0969098A (ja) | 文書作成装置 | |
JP2017068307A (ja) | 情報検索装置及びその制御方法、情報検索用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150409 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150428 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150525 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5753828 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |