JP5753828B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP5753828B2
JP5753828B2 JP2012214138A JP2012214138A JP5753828B2 JP 5753828 B2 JP5753828 B2 JP 5753828B2 JP 2012214138 A JP2012214138 A JP 2012214138A JP 2012214138 A JP2012214138 A JP 2012214138A JP 5753828 B2 JP5753828 B2 JP 5753828B2
Authority
JP
Japan
Prior art keywords
character
unit
character string
image
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012214138A
Other languages
English (en)
Other versions
JP2014067370A (ja
Inventor
陽介 樫本
陽介 樫本
村上 隆
隆 村上
雅彰 相場
雅彰 相場
良輔 大岸
良輔 大岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2012214138A priority Critical patent/JP5753828B2/ja
Priority to US14/030,407 priority patent/US8773704B2/en
Priority to CN201310435947.0A priority patent/CN103699891B/zh
Publication of JP2014067370A publication Critical patent/JP2014067370A/ja
Application granted granted Critical
Publication of JP5753828B2 publication Critical patent/JP5753828B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Description

本発明は、スキャナーで読み込まれた画像データからハイパーリンク構造のデータを生成する画像処理装置及び画像処理プログラムに関する。
この種のデータの生成手法として、目次及び索引ページのデータに基づいてハイパーリンクを生成する技術が知られている(例えば、特許文献1参照。)。この先行技術は、目次や索引ページに記された用語の参照先となるページ番号と、その用語が記載されている通常ページのページ番号とを相互にリンクさせるものである。
上記の先行技術によれば、画像データを閲覧するユーザは、目次及び索引ページから参照先の通常ページへダイレクトにページを移動させることができる。
特開2010−086151号公報
しかしながら、上述した先行技術では、目次(索引ページ)と通常ページに示されたページ番号同士を相互にリンクさせているだけである。このため、目次や索引ページに記載されていない用語やユーザが選択した任意の用語などをリンクさせることができない。
そこで本発明は、画像データ中に含まれる用語を効率的にリンクさせる技術の提供を課題とする。
上記の課題を解決するため、本発明は第1に画像処理装置を提供する。第2に本発明は画像処理プログラムを提供する。
〔画像処理装置〕
本発明の画像処理装置は、情報を画像データとして読み込む画像読込部と、画像データに含まれる文字を認識する文字認識部と、文字認識部により認識された個々の文字を文字の形態を示す文字情報に基づいて文字列ごとにグループ化するグループ化部と、グループ化された文字列の重要度に基づいて、リンクの対象となる文字列を抽出する文字抽出部と、文字抽出部により抽出された文字列のうち、字体が共通する文字列を文字が認識された画像データの中から検索する文字検索部と、文字検索部により検索された字体が共通する文字列を重要度に基づいて相互にリンクさせるリンク設定部とを備える。
本発明の画像処理装置によれば、画像データ中に含まれる文字列を相互にリンクさせている。このため、目次や索引ページのみ記載された単語や語句に限定されることなく、各ページに記載された文字列を相互にリンクさせることができる。また、重要度に基づいてリンクの対象となる文字列を抽出しているため、不要な文字列に対してリンクが設定されてしまうことを防止することができる。
また上記の構成において、リンク設定部は、文字検索部により検索された字体が共通する文字列のうち、各文字列に対する重要度が高い方の文字列をリンク先として設定する。
このため、画像データを閲覧するユーザは、複数のページにそれぞれ記載された文字列からダイレクトに重要度の高い文字列を参照することができる。
また本発明の画像処理装置は、文字列にリンクを設定するための設定情報を表示する表示部と、表示部に表示された設定情報に対するユーザの操作を受け付ける操作部とを備える。
上記の構成において、表示部は、設定情報として、文字抽出部により抽出された文字列のリストを編集するための画像を表示し、文字検索部は、ユーザの操作に応じて編集されたリストに含まれる文字列を検索する。
本発明の画像処理装置によれば、文字抽出部により重要であると判断された文字列(重要語)を表示部に表示しており、これに対してユーザは、表示された文字列を参照しながら操作部を操作することによりリストを更新することができる。また、文字検索部では、更新されたリストに含まれる文字列を検索している。これに対して、リンク設定部は、ユーザにより選択された文字列をリンクさせている。したがって、ユーザの意思により重要であると判断された単語や語句に対してもリンクさせることができる。
また上述した構成の別の態様として、表示部は、設定情報として、文字検索部により検索された文字列のリンク先を指定するための画像を表示し、リンク設定部は、ユーザの操作に応じて指定された文字列をリンク先として設定する。
上記の構成によれば、ユーザの要望に応じて文字列のリンク先を変更したり、リンクさせる文字列を制限したりすることができる。
本発明の画像処理装置において、表示部は、設定情報として、文字列の重要度を変更するための画像を表示し、リンク設定部は、ユーザの操作に応じて変更された重要度に基づいて、リンクを設定する。
上記の構成によれば、文字列の重要度を変更することによりリンク先を変更したり、あるいは、文字列をリンクの対象から除外したりすることができる。
また本発明の画像処理装置において、リンク設定部は、文字列に対するリンク先の設定を重要度に基づいて制限する。
上記の構成によれば、字体が共通する複数の文字列のうち、一部の文字列をリンクの対象から除外することができる。したがって、ユーザの要望に応じて不要なリンクの設定を制限することができるため、その分リンクの設定を効率的に行うことができる。
〔画像処理プログラム〕
本発明の画像処理プログラムは、画像処理装置のコンピュータに、情報を画像データとして読み込む手順と、画像データに含まれる文字を認識する手順と、認識された個々の文字を文字の形態を示す文字情報に基づいて文字列ごとにグループ化する手順と、グループ化された文字列の重要度に基づいて、リンクの対象となる文字列を抽出する手順と、抽出された文字列のうち、字体が相互に共通する文字列を文字が認識された画像データの中から検索する手順と、検索された文字列を重要度に基づいて相互にリンクさせる手順とを実行させるためのものである。
本発明の画像処理プログラムによれば、画像データ中に含まれる文字列を相互にリンクさせている。このため、目次や索引ページのみ記載された単語や語句に限定されること無く、各ページに記載された文字列を相互にリンクさせることができる。また、重要度に基づいてリンクの対象となる文字列を抽出しているため、不要な文字列に対するリンクの設定が効果的に抑制される。
また本発明の画像処理プログラムの構成として、リンクさせる手順では、検索された字体が相互に共通する文字列のうち、各文字列に対する重要度が高い方の文字列をリンク先として設定する。
このため、画像データを閲覧するユーザに対して、複数のページにそれぞれ記載された文字列からダイレクトに重要度の高い文字列を参照させることができる。
また上述した構成の別の態様として、本発明の画像処理プログラムは、画像処理装置のコンピュータに、情報を画像データとして読み込む手順と、画像データに含まれる文字を認識する手順と、認識された個々の文字を文字の形態を示す文字情報に基づいて文字列ごとにグループ化する手順と、グループ化された文字列の重要度に基づいて、リンクの対象となる文字列を抽出する手順と、抽出された文字列のリストを更新するための画像を表示部に表示する手順と、表示部に表示された画像に対して、ユーザの操作によるリストの更新を操作部にて受け付ける手順と、更新されたリストに含まれる文字列のうち、字体が相互に共通する前記文字列を前記文字が認識された前記画像データの中から検索する手順と、検索された各文字列のリンク先をそれぞれ指定するための画像を表示部に表示する手順と、表示部に表示された画像に対して、ユーザの操作により指定された各文字列のリンク先を操作部にて受け付ける手順と、検索された各文字列に対してそれぞれ指定された文字列をリンク先として設定する手順とを実行させるためのものである。
上記の構成によれば、本発明の画像処理プログラムに従って重要であると判断された文字列、及び、文字列のリンク先をユーザに編集させることができる。したがってユーザにより重要であると判断された単語や語句についても、ユーザの要望に応じてリンクさせることができる。
本発明によれば、目次や索引に記された単語や語句だけでなく、様々なページに記載された重要語をリンクの対象として抽出しているため、画像データ中に含まれる文字列の中から重要な文字列を効率的にリンクさせることができる。
本実施形態における画像処理装置の構成を概略的に示す図である。 画像処理装置の機能的な構成を概略的に示すブロック図である。 スキャナー部により読み込まれた画像データの一例を概略的に示す図である。 グループ化部によりグループ化された文字列の一覧を示す表である。 グループ化された文字列の中から文字抽出部により抽出された文字列を示す表である。 文字検索部により検索された文字列を示す表である。 リンク設定部により画像データ中に含まれる文字列がリンクされた状態を示す図である。 第1実施形態の画像処理装置により画像データに含まれる文字列をリンクさせるための手順を示すフローチャートである。 文字列のリンク先を指定するための画像が表示された状態の操作パネルを概略的に示す図である。 第2実施形態の画像処理装置により画像データに含まれる文字列をリンクさせるための手順を示すフローチャートである。 ユーザの操作に応じて重要度の変更及びリンクの制限がなされた後の文字検索部による文字列の検索結果を概略的に示す表である。 図11に示す検索結果に基づいてリンク設定部により画像データ中に含まれる文字列がリンクされた状態を示す図である。
以下、本発明の画像処理装置及び画像処理プログラムの実施形態について説明する。以下ではまず、画像処理装置の基本的な構成について説明する。
〔第1実施形態〕
図1は、本実施形態における画像処理装置1の構成を概略的に示す図である。図1には、画像処理装置1が右前上方から示されており、ユーザに相対する画像処理装置1の前面と、この画像処理装置1の右側面とがみえている。
画像処理装置1は、例えば、デジタル複合機、いわゆる多機能周辺機器(Multiple Function Peripheral)である。画像処理装置1は胴内排紙型の装置本体10を備え、この装置本体10の中央部分には排紙トレイ12が形成されている。
装置本体10の上側には原稿送り装置14が搭載されており、画像処理装置1を複写機やファクシミリ、ネットワークスキャナーとして利用するときには、原稿送り装置14から原稿を搬送し、その画像面は光学式のスキャナー部(画像読込部)16にて光学的に読み取られる。
スキャナー部16の手前側には操作パネル18が設置されている。この操作パネル18には、ユーザの各種操作に供される複数の操作キー(操作部)18aが配置され、各種情報を表示する表示画面(表示部)18bが設けられている。
一方、装置本体10の下部にはフロントローディング式の用紙供給装置20が配置されている。詳しくは、装置本体10の高さ方向に沿って上下2段の給紙カセット20a,20bが備えられ、各給紙カセット20a,20bはいずれも装置本体10に対して着脱可能に構成される。装置本体10の右側面には開閉式の手差しトレイ22も備えられている。
本実施形態の画像処理装置1は、OCR(Optical Character Reader)機能を有しており、スキャナー部16で読み取られた画像から文字を認識することができる。
図2は、画像処理装置1の機能的な構成を概略的に示すブロック図である。図2では、OCR機能を利用して画像処理を実現するための構成を中心に説明する。
画像処理装置1は、上記の画像処理を実現するための構成として、スキャナー部16、操作パネル(操作表示部)18、制御部24及びデータ保存部26を備えている。制御部24は、文字認識部28、グループ化部30、文字抽出部32、文字検索部34、リンク設定部36を有している。
〔制御部〕
制御部24は、コンピュータとして機能する要素であり、CPU(中央演算処理装置)やROM(リードオンリーメモリ)等のハードウエア資源を有している。制御部24は、このハードウエア資源を用いてプログラムを実行しており、上述のスキャナー部16、操作パネル18、文字認識部28、グループ化部30、文字抽出部32、文字検索部34、リンク設定部36及びデータ保存部26を制御する。
〔文字認識部〕
文字認識部28は、スキャナー部16で読み取られた画像データに含まれる文字を認識する。文字を認識するための処理は、例えば、上記のOCR機能による文字の認識手順に従って行われる。
〔グループ化部〕
グループ化部30は、文字認識部28により認識された個々の文字を文字の形態を示す文字情報に基づいて文字列ごとにグループ化する。グループ化された文字列は、例えば、単語や語句等であり、文字の組み合わせによって所定の意味を有するものである。この文字情報は、例えば、フォントの種類や、フォントサイズ、文字色、マーカー設定、太字、斜体、下線、空白等を示している。
〔文字抽出部〕
文字抽出部32は、グループ化された文字列の重要度に基づいて、リンクの対象となる文字列を抽出する。この重要度は、例えば、文字列のフォントサイズや、文字色、マーカー設定、太字、斜体、下線、インデント、段落番号等によって決定される。
〔文字検索部、リンク設定部〕
文字検索部34は、文字抽出部32により抽出された文字列のうち、字体が相互に共通する文字列を文字が認識された画像データの中から検索する。
リンク設定部36は、文字検索部34により検索された文字列を重要度に基づいて相互にリンクさせる。具体的には、文字検索部34により検索された文字列のうち、各文字列に対する重要度が高い方の文字列をリンク先として設定する。
〔データ保存部〕
データ保存部26は、文字認識部28により認識された画像データ中の文字に関する情報、グループ化部30によりグループ化された文字列に関する情報、文字抽出部32により抽出された文字列に関する情報、及び、文字検索部34による文字列の検索結果を保存する。
〔表示部〕
操作パネル(操作表示部)18は、上記の操作部18a及び表示部18bにより構成されている。本実施形態において、表示部18bは、文字列をリンクさせるための設定情報を表示する。表示部18bは、設定情報として、文字抽出部32により抽出された文字列のリストを更新するための画像を表示する。あるいは、文字検索部34により検索された文字列のリンク先を指定するための画像を表示する。
〔操作部〕
これに対して、操作部18aは、表示部18bに表示された設定情報に対するユーザの操作を受け付ける。操作部18aは、ユーザにより直接操作されるものであり、上記の操作キーのほかにも、タッチパネル上の操作領域等が操作部18aの構成に相当する。
〔文字の認識〕
図3は、スキャナー部16により読み込まれた画像データの一例を概略的に示す図である。図3では、文字認識部28により画像データに含まれる文字を認識するための手法について説明する。
図3には、スキャナー部16に読み込まれた画像データの一例として、3ページ分の画像を示している。この画像データには、「用語説明」や「HP作成」、「ハイパーリンク」等の単語が複数のページに示されている。図3中に示す単語は、ページごとに文字の大きさやフォント等の文字情報が相互に異なっている。
文字認識部28は、画像データに示された文字を一文字ずつ認識する。文字認識部28による文字を認識する手法は、例えば、OCR機能による文字を認識するための手順(OCR処理)に従って行われる。
文字認識部28による文字を認識する手法は、例えば以下の手順によって行われる。
(1)ページごとに画像のレイアウト解析を行い、画像を文字領域、画像領域及び枠線領域に分割する。
(2)各領域について画像の解析を行い、解析した情報をデータ保存部26に保存する。
(3)文字領域を行、列、及び斜めに分解する。
(4)分解された行及び列の各ライン単位で画素をカウントすることにより、文字を抽出する。
(5)抽出された文字の大きさや、字体、文字のつぶれ、かすれ等を特定した上で、正規化や、特徴抽出、マッチング、文字認識等の処理を行う。
このように、文字認識部28は、上記(1)〜(5)の手順によって文字領域に含まれる文字を1文字ずつ認識することができる。
〔グループ化〕
図4は、グループ化部30によりグループ化された文字列の一覧を示す表である。図4では、図3中に示す1ページ目(P1)の画像データに含まれる文字列を示す。
文字認識部28により認識された個々の文字は、グループ化部30により文字列ごとにグループ化される。このグループ化は、文字の形態を示す文字情報に基づいて行われる。具体的には、グループ化部30は、フォントの種類や、フォントスタイル、フォントサイズ、文字色、マーカー設定、太字、斜体、下線、空白等、文字の形態を示す文字情報を基準にして画像データ中に含まれる文字の配列を1つの文字列としてグループ化する。
図3中の画像データにおいて、1ページ目(P1)の上から1行目には、「目」と「次」の2文字が示されている。グループ化部30は、これらの文字情報がいずれも共通している場合、これら「目」及び「次」の配列を1つの文字列としてグループ化する。
グループ化された文字列は、データ保存部26に保存される。またデータ保存部26には、文字列に関連する情報が保存される。データ保持部26は、文字列及びこれに関連する情報を、例えば、図4中に示す「グループ化リスト」に登録することでこれらの情報を保存する。
グループ化リストには、文字列に対して、例えば「ページ番号」や、「ページ内位置」、「グループ番号」、「文字情報」、「重要度」等の関連情報が対応付けられて登録されている。
図4中の「文字情報」の欄には、文字情報として、フォントスタイル(太字、斜体及び標準)及びフォントサイズ(pt)が示されている。文字情報は、これらの組み合わせ以外にも、フォントの種類(ゴシック体、明朝体等)や、文字色、マーカー設定、太字、斜体、下線、空白等を種々に組み合わせて構成することができる。
また、図4中の「重要度」の欄には、グループごとに文字列の重要度を示す値が数字で示されている。この重要度は、各文字列のフォントサイズや、文字色、マーカー設定、太字、斜体、下線、インデント、段落番号等に基づいて決定されている。
図4中に示す重要度は、値が上昇するにつれて、文字列の重要度が高くなることを示している。これに対して、文字抽出部32は、文字列の重要度に基づいてリンクの対象となる文字列を重要語として抽出する。
〔重要語の抽出〕
図5は、グループ化された文字列の中から文字抽出部32により抽出された文字列を示す表である。以下では、文字抽出部32により抽出された文字列を適宜「重要語」と呼称する。
文字抽出部32は、図4中に示す文字列の重要度に基づいて、文字列を抽出するか否かを判断する。例えば、文字抽出部32は、図4中に示す重要度「2」に対応する「用語説明」及び「HP作成」の文字列をそれぞれ重要語として抽出する。一方、重要度「0」が示された「目次」の文字列については、重要語として抽出しない。文字抽出部32により抽出された文字列は、データ保存部26に保存される。
図6は、文字検索部34により検索された文字列を示す表である。また図7は、リンク設定部36により画像データ中に含まれる文字列がリンクされた状態を示す図である。なお、図6では、図3中に示す3ページ分の画像データに含まれる重要語の検索結果を示している。また、図7中に示す矢印は、文字列のリンク先を示している。
〔重要語の検索〕
文字検索部34は、文字抽出部32により抽出された重要語のうち、字体が相互に共通する文字列を文字が認識された画像データの中から検索する。ここで、「字体」とは、文字の骨格を示しており、共通する字体の文字列を様々な形態(フォントの種類、フォントスタイル、フォントサイズ、文字色、マーカー設定、太字、斜体、下線、空白等)で表すことが可能である。例えば、文字検索部34は、文字抽出部32により重要語として抽出された図5中に示す「用語解説」を図3中に示す3ページ分の画像データの中から検索する。
上記の例では、文字検索部34の検索により、抽出された重要語と字体が共通する文字列が1ページ目(P1)及び2ページ目(P2)に含まれていることが特定される。文字検索部34は、この検索結果をデータ保存部26に保存する。
データ保存部26では、例えば、上記の検索結果を図6中に示す「検索結果リスト」で管理しており、検索された各ページに含まれる文字列と、これに関連する情報を相互に対応付けて検索結果リストに登録する。
検索結果リストには、文字列に対して、例えば「ページ番号」や、「ページ内位置」、「グループ番号」、「文字情報」、「重要度」等の関連情報が対応付けられて登録されている。
文字検索部34による検索結果に対して、リンク設定部36は、検索された文字列を重要度に基づいて相互にリンクさせる。具体的には、リンク設定部36は、図6中に示す重要語のうち、画像データの1ページ目と2ページ目に含まれる「用語説明」を相互にリンクさせる。また、1ページ目と3ページ目に含まれる「HP作成」を相互にリンクさせる。またリンク設定部36は、画像データの2ページ目と3ページ目に含まれる「ハイパーリンク」を相互にリンクさせる。
〔リンクの設定〕
またリンク設定部36は、各ページに含まれる文字列のリンクに関して、文字検索部34により検索された字体が共通する文字列のうち、各文字列に対する重要度が高い方の文字列をリンク先として設定している。例えば、1ページ目及び2ページ目に含まれる「用語説明」の重要度は、それぞれ「2」と「4」であり、2ページ目に含まれる文字列に対する重要度の方が、1ページ目に含まれる文字列の重要度よりも高い。このとき、リンク設定部36は、重要度が高い方の文字列、すなわち、2ページ目に含まれる「用語説明」を、1ページ目に含まれる「用語説明」のリンク先として設定する。
またリンク設定部36は、検索結果リストに登録された「HP作成」及び「ハイパーリンク」の文字列についても、「用語説明」と同様に、重要度に基づいてリンク先を設定する。なお、図6中に示す「リンクフリー」については、リンク先が存在しないためリンクの設定は行われない。
このように、各ページに含まれる重要語を相互にリンクさせることにより、例えば、画像データを操作パネル18の表示部18bや、画像処理装置1に接続された図示しないPCのディスプレイ等に表示させた際、ユーザは、重要語をクリックするだけで、リンク先の重要語を参照することができる。
第1実施形態の画像処理装置1によれば、画像データ中に含まれる文字列を相互にリンクさせている。このため、目次や索引ページのみ記載された単語や語句に限定されること無く、各ページに記載された文字列を相互にリンクさせることができる。また、重要度に基づいてリンクの対象となる文字列を抽出しているため、不要な文字列に対してリンクが設定されてしまうことを防止することができる。
以上が第1実施形態における画像処理装置1の基本的な構成である。加えて本実施形態では、画像処理装置1にインストールされたプログラムをコンピュータ(制御部24)で実行することで、上述した画像処理装置1を動作させることができる。また以下の説明により、画像処理装置1のコンピュータに実行させる手順例が明らかとなる。
〔画像処理プログラムの手順〕
図8は、第1実施形態の画像処理装置1により画像データに含まれる文字列をリンクさせるための手順を示すフローチャートである。以下、手順を追って説明する。
ステップS100:スキャナー部16は、原稿送り装置14に載置された原稿の画像面(情報)を画像データとして読み込む。読み込まれた画像データは、データ保存部26に保存される。
ステップS102:制御部24は、次のページの原稿が原稿送り装置14に載置されているか否かを判断する。原稿が載置されている場合(Yes)、再びステップS100の手順を実行する。これらの手順は、全てのページの原稿を読み取るまで繰り返し行われる。
ステップS104:また、原稿が原稿送り装置14に載置されていない場合(ステップS102「No」)、すなわち全てのページの原稿に対する読み込みが完了した場合、制御部24は、読み込まれた画像データの解析を文字認識部28に対して実行させる。文字認識部28は、OCR処理の手順に従って画像データに含まれる文字を認識する。
ステップS106:文字認識部28により認識された文字に対して、グループ化部30は、個々の文字を文字情報に基づいて文字列ごとにグループ化する。グループ化された文字列は、データ保存部26(グループ化リスト)に保存される。
ステップS108:文字抽出部32は、グループ化された文字列の重要度に基づいて、リンクの対象となる文字列を抽出する。抽出された文字列(重要語)は、データ保存部26に保存される。制御部24は、ステップS104からステップS108までの手順を画像データのページごとに実行させる。これらの手順は、全てのページに対して完了するまで実行される(ステップS110「Yes」)。
ステップS112:ステップS104からステップS108までの手順について、次のページがない場合(ステップS110「No」)、すなわち、上記の手順が全てのページに対して実行された場合、文字検索部34は、文字抽出部32により抽出された文字列のうち、字体が相互に共通する文字列を文字が認識された画像データの中から検索する。この手順に関しても、画像データのページごとに行い、全てのページに対して実行される(ステップS114「Yes」)。
ステップS116:ステップS112の手順について、次のページがない場合(ステップS114「No」)、すなわち、上記の手順が全てのページに対して実行された場合、リンク設定部36は、文字検索部34により検索された文字列を重要度に基づいて相互にリンクさせる。具体的には、文字検索部34により検索された文字列のうち、各文字列に対する重要度が高い方の文字列をリンク先として設定する。
このように、第1実施形態の画像処理装置1及び画像処理プログラムによれば、ページ番号同士をリンクさせるのではなく、画像データの各ページに含まれている文字列を相互にリンクさせている。このため、目次や索引に記載された単語や語句だけでなく、様々なページに記載された文字列を相互にリンクさせることができる。
また、リンク設定部36では、各文字列に対する重要度が高い方の文字列をリンク先として設定している。その結果、画像データを閲覧するユーザは、重要な単語や語句が書かれた箇所を迅速に参照することができる。
〔第2実施形態〕
次に、第2実施形態の画像処理装置1及び画像処理プログラムについて説明する。第2実施形態では、ユーザの操作に応じて、抽出された重要語の変更及びリンク先の設定が行われる。画像処理装置1の基本的な構成については、第1実施形態と共通しており、共通する部材について同一の符号を付すとともに、重複する説明については適宜省略する。
図9は、文字列のリンク先を指定するための画像が表示された状態の操作パネル18を概略的に示す図である。
操作パネル18の表示部18bには、文字検索部34により検索された文字列のリンク先を指定するための画像が表示されている。図9中に示す表示部18bには、検索された「ハイパーリンク」の文字列を含む画像データが3つ表示されている。
各画像データは、イメージビューとして、「ハイパーリンク」の文字列とともに、その周囲の文字を含めた領域が切り取られた状態で表示されている。また、各イメージビューに対応して数字が割り振られている。
またイメージビューの隣(右側)には、各画像データに含まれる「ハイパーリンク」の文字列に関するページ番号及び文字情報が「Information」として表示されている。この「Information」の隣には、リンク先を指定するためのリンク先情報が各イメージビューに対応してプルダウン形式で表示されている。図9では、リンク先情報として、各イメージビューに割り振られた番号「No1」及び「No2」や「リンクしない」などの情報が示されている。
ユーザは、プルダウンを操作して、各イメージビューに表示された「ハイパーリンク」のリンク先を個別に指定することができる。このため、図9中に示す各プルダウンメニューは、操作部18aとしての構成に相当する。
操作パネル18の上下方向に配列された3つのイメージビューのうち、真ん中(No2)のイメージビューに対応するプルダウンメニューには、リンク先情報として、「No1」が表示されている。これは、「No2」のイメージビューに含まれる文字列のリンク先として、「No1」のイメージビューに含まれる文字列が指定されていることを意味する。
ユーザは、上記「No2」のイメージビューに含まれる文字列と同様に、「No1」、「No3」のイメージビューに含まれる文字列に対しても、リンク先を指定することができる。また、各文字列のリンク先を一括して指定してもよい。
ユーザの操作が完了すると、リンク設定部36は、指定された文字列をリンク先として設定する。
以上が第2実施形態におけるリンク先を指定するための基本的な手法である。なお、この手法は、ユーザの操作に応じて重要語を抽出するための手法と共通している。すなわち、操作パネル18の表示部18bには、文字抽出部32により抽出された文字列を更新するための画像が表示される。
表示された画像に対して、ユーザは、操作パネル18を操作することにより、表示部18bに表示された重要語を削除したり、あるいは、新たに重要語を追加したりして重要語リストを更新することができる。更新後の情報はデータ保存部26に保存される。これに対して、文字検索部34は、データ保存部26に保存された更新後の重要語リストに含まれる文字列を検索する。
次に、第2実施形態の画像処理装置1のコンピュータに実行させる手順例を説明する。
図10は、第2実施形態の画像処理装置1により画像データに含まれる文字列をリンクさせるための手順を示すフローチャートである。以下では、図8中のフローチャートに示す手順と重複する説明については適宜省略する。
ステップS212:文字抽出部32により重要語が抽出されると、制御部24は、抽出された文字列の重要語リストを更新するための画像を表示部18bに表示させる。これより、ユーザは操作パネル18を操作して重要語リストを更新することができる。また、ユーザによる操作が完了することにより更新された重要語リストはデータ保存部26に保存(更新)される。
ステップS214:文字検索部34は、ユーザの操作に応じて更新された重要語リストに含まれる文字列を検索する。検索された結果は、データ保存部26に保存される。この手順は、画像データのページごとに行われ、全てのページに対する検索が完了するまで繰り返される(ステップS216「Yes」)。
ステップS218:全てのページに対して文字検索部34による重要語の検索が完了すると(ステップS216「No」)、制御部24は、文字検索部34により検索された文字列のリンク先を指定するための画像を表示部18bに表示させる。これより、ユーザは操作パネル18を操作して重要語のリンク先を指定することができる。
ステップS220:ユーザによる操作が完了すると、リンク設定部36は、指定された文字列をリンク先として設定する。
第2実施形態の画像処理装置1及び画像処理プログラムによれば、自動的に抽出された重要語に対して、ユーザはこれを削除したり、あるいは、抽出されていない単語や語句を追加したりすることができる。またユーザは、重要語のリンク先を自由に変更することができる。したがってユーザにより重要であると判断された単語や語句についても、ユーザの要望に応じてリンクさせることができる。また、自動的に重要語の抽出やリンク先の設定を行いつつも、ユーザの要望を反映させることができるため、画像データを閲覧するユーザの操作性を向上させることができる。
〔第3実施形態〕
次に、第3実施形態の画像処理装置1及び画像処理プログラムについて説明する。第3実施形態では、ユーザの操作に応じて重要度を変更したり、重要度の値によってリンクの対象となる文字列を制限したりする。画像処理装置1の基本的な構成については、第1実施形態及び第2実施形態と共通しており、共通する部材について同一の符号を付すとともに、重複する説明については適宜省略する。
図11は、ユーザの操作に応じて重要度の変更及びリンクの制限がなされた後の文字検索部34による文字列の検索結果を概略的に示す表である。また図12は、図11に示す検索結果に基づいてリンク設定部36により画像データ中に含まれる文字列がリンクされた状態を示す図である。
〔重要度の変更〕
ユーザは、文字検索部34により検索された文字列の重要度を変更するための画像が表示された操作パネル18を操作することにより、各文字列の重要度を変更することができる。
例えば、操作パネル18の表示部18bには、図6中に示す検索結果に関する情報及びリンク制限に関する情報が表示される。これに対して、ユーザは、各文字列の重要度を変更することができる。また、リンク設定部36は、ユーザの操作に応じて変更された重要度に基づいてリンク先を設定する。
図11中に示す検索結果リストには、変更後の重要度が反映されており、上から2行目の「用語説明」の重要度が「2」から「4」に変更されている。これに対して、上から3行目の「用語説明」の重要度が「4」から「3」に変更されている。この場合、リンク設定部36は、図12に示すように、1ページ目の画像データに含まれる「用語説明」を2ページ目の画像データに含まれる「用語説明」のリンク先に設定する。このように、重要度を変更することで、ユーザの要望に応じて文字列のリンク先を変更することができる。
〔リンクの制限〕
また第3実施形態では、重要度に応じてリンクを制限する。このリンクの制限は、上記の重要度の変更と同様に、ユーザの操作に応じて設定することができる。あるいは、自動で設定してもよい。
図11中に示す検索結果リストには、「リンク制限」の欄が設けられており、リンクを制限しない文字列に対しては、「無」が示されており、リンクを制限する文字列に対しては「有」が示されている。
図11中の「リンク制限」の欄には、重要度が「2」以上の文字列に対しては「無」が示されており、「2」未満、すなわち重要度が「1」の文字列に対しては「有」が示されている。図11中に示す検索結果リストにおいて、下から1行目に示された「ハイパーリンク」の文字列は、重要度が「1」であるため、リンクが制限される。このため、図12に示すように、2ページ目と3ページ目の画像データに含まれる「ハイパーリンク」の文字列は相互にリンクされていない。
第3実施形態では、文字列の重要度を変更することによって文字列のリンク先を変更することができる。また、重要度に応じてリンクを制限することで、重要語に対するリンクの数が多くなり過ぎてしまうことを抑制することができる。
本発明は上述した実施形態に制約されることなく、種々に変形して実施することができる。例えば、第1実施形態〜第3実施形態に示された画像処理装置1は、複合機に限らず、OCR機能を備えたスキャナーやパソコン等であってもよい。
また第2実施形態において、画像データに含まれる文字列をリンクさせるための手順では、表示部18bに重要語のリストを更新するための画像を表示する手順(ステップS212)を省略したり、あるいは、リンク先を指定するための画像を表示する手順(ステップS218)を省略したりしてもよい。
1 画像処理装置
16 スキャナー部(画像読取部)
18 操作パネル
18a 操作部
18b 表示部
24 制御部
28 文字認識部
30 グループ化部
32 文字抽出部
34 文字検索部
36 リンク設定部

Claims (6)

  1. 情報を画像データとして読み込む画像読込部と、
    前記画像データに含まれる文字を認識する文字認識部と、
    前記文字認識部により認識された個々の前記文字を前記文字の形態を示す文字情報に基づいて文字列ごとにグループ化するグループ化部と、
    前記グループ化された前記文字列の重要度に基づいて、リンクの対象となる前記文字列を抽出する文字抽出部と、
    前記文字抽出部により抽出された前記文字列のうち、字体が共通する前記文字列を前記文字が認識された前記画像データから検索する文字検索部と、
    前記文字検索部により検索された前記字体が共通する前記文字列を前記重要度に基づいて相互にリンクさせるリンク設定部と
    前記各文字列をリンクさせるための設定情報を表示する表示部と、
    前記表示部に表示された前記設定情報に対するユーザの操作を受け付ける操作部と
    を備え
    前記表示部は、
    前記設定情報として、前記画像データの全領域から前記文字検索部により検索された前記文字列及びその周囲を含む領域を切り抜いた部分画像のリストを表示し、
    前記リンク設定部は、
    前記ユーザの操作に応じて指定された前記部分画像に含まれる前記文字列を前記文字検索部により検索された前記文字列のリンク先として設定することを特徴とする画像処理装置。
  2. 請求項1に記載の画像処理装置において、
    前記リンク設定部は、
    前記文字検索部により検索された前記字体が共通する前記文字列のうち、各文字列に対する前記重要度が高い方の前記文字列をリンク先として設定することを特徴とする画像処理装置。
  3. 請求項1又は2に記載の画像処理装置において、
    前記表示部は、
    前記設定情報として、前記文字抽出部により抽出された前記文字列のリストを更新するための画像をさらに表示し、
    前記文字検索部は、
    前記ユーザの操作に応じて更新された前記リストに含まれる前記文字列を検索することを特徴とする画像処理装置。
  4. 請求項からのいずれかに記載の画像処理装置において、
    前記表示部は、
    前記設定情報として、前記文字列の前記重要度を変更するための画像をさらに表示し、
    前記リンク設定部は、
    前記ユーザの操作に応じて変更された前記重要度に基づいて、前記リンクを設定することを特徴とする画像処理装置。
  5. 請求項1からのいずれかに記載の画像処理装置において、
    前記リンク設定部は、
    前記文字列に対する前記リンク先の設定を前記重要度に基づいて制限することを特徴とする画像処理装置。
  6. 画像処理装置のコンピュータに、
    情報を画像データとして読み込む手順と、
    前記画像データに含まれる文字を認識する手順と、
    認識された個々の前記文字を前記文字の形態を示す文字情報に基づいて文字列ごとにグループ化する手順と、
    前記グループ化された前記文字列の重要度に基づいて、リンクの対象となる前記文字列を抽出する手順と、
    抽出された前記文字列のリストをユーザに更新させるための画像を表示部に表示する手順と、
    前記表示部に表示された前記画像に対して、ユーザの操作による前記リストの更新を受け付ける手順と、
    更新された前記リストに含まれる前記文字列のうち、字体が相互に共通する前記文字列を前記文字が認識された前記画像データから検索する手順と、
    検索された文字列及びその周囲を含む領域を前記画像データから切り抜いた部分画像のリストを前記表示部に表示する手順と、
    前記表示部に表示された前記部分画像のリストのうち、ユーザの操作により指定された前記部分画像に含まれる文字列受け付ける手順と、
    受け付けた前記部分画像に含まれる文字列を検索された前記文字列リンク先として設定する手順と
    を実行させるための画像処理プログラム。
JP2012214138A 2012-09-27 2012-09-27 画像処理装置及び画像処理プログラム Expired - Fee Related JP5753828B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012214138A JP5753828B2 (ja) 2012-09-27 2012-09-27 画像処理装置及び画像処理プログラム
US14/030,407 US8773704B2 (en) 2012-09-27 2013-09-18 Image processing apparatus that generates hyperlink structure data
CN201310435947.0A CN103699891B (zh) 2012-09-27 2013-09-23 图像处理装置及图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012214138A JP5753828B2 (ja) 2012-09-27 2012-09-27 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2014067370A JP2014067370A (ja) 2014-04-17
JP5753828B2 true JP5753828B2 (ja) 2015-07-22

Family

ID=50338557

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012214138A Expired - Fee Related JP5753828B2 (ja) 2012-09-27 2012-09-27 画像処理装置及び画像処理プログラム

Country Status (3)

Country Link
US (1) US8773704B2 (ja)
JP (1) JP5753828B2 (ja)
CN (1) CN103699891B (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6394069B2 (ja) * 2014-05-26 2018-09-26 京セラドキュメントソリューションズ株式会社 文書処理装置及び文書処理プログラム
JP6447066B2 (ja) * 2014-12-01 2019-01-09 株式会社リコー 画像処理装置、画像処理方法、及びプログラム
CN105260381A (zh) * 2015-09-08 2016-01-20 百度在线网络技术(北京)有限公司 基于图像识别的数据维护方法和装置
CN106469132A (zh) * 2016-08-31 2017-03-01 深圳天珑无线科技有限公司 数据处理的方法及装置
JP7016612B2 (ja) * 2017-02-10 2022-02-07 株式会社東芝 画像処理装置及びプログラム
CN107220648B (zh) * 2017-04-11 2018-06-22 平安科技(深圳)有限公司 理赔单据的字符识别方法及服务器
JP7135446B2 (ja) * 2018-05-30 2022-09-13 京セラドキュメントソリューションズ株式会社 電子機器
US11184493B2 (en) * 2019-07-10 2021-11-23 Ricoh Company, Ltd. Information processing system, information processing method, and apparatus for extending a workflow
JP2023023590A (ja) * 2021-08-05 2023-02-16 京セラドキュメントソリューションズ株式会社 画像処理装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7756869B2 (en) * 2004-04-30 2010-07-13 The Boeing Company Methods and apparatus for extracting referential keys from a document
JP2006065588A (ja) * 2004-08-26 2006-03-09 Sharp Corp 情報閲覧装置、情報閲覧プログラム及び情報閲覧プログラム記録媒体
JP2006085234A (ja) * 2004-09-14 2006-03-30 Fuji Xerox Co Ltd 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
JP4590433B2 (ja) * 2007-06-29 2010-12-01 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP4780169B2 (ja) 2008-09-30 2011-09-28 ブラザー工業株式会社 データ生成装置、スキャナ、及びコンピュータプログラム
JP5733907B2 (ja) * 2010-04-07 2015-06-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5676942B2 (ja) * 2010-07-06 2015-02-25 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
JP2014067370A (ja) 2014-04-17
US20140085669A1 (en) 2014-03-27
US8773704B2 (en) 2014-07-08
CN103699891B (zh) 2017-04-12
CN103699891A (zh) 2014-04-02

Similar Documents

Publication Publication Date Title
JP5753828B2 (ja) 画像処理装置及び画像処理プログラム
JP2005108254A (ja) アイコン生成方法、アイコン選択方法及び文書検索方法
US20090110288A1 (en) Document processing apparatus and document processing method
JP2007317034A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
US8854635B2 (en) Document processing device, method, and recording medium for creating and correcting formats for extracting characters strings
JP2006221569A (ja) 文書処理システム、文書処理方法、プログラムおよび記憶媒体
US20130339002A1 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2008040753A (ja) 画像処理装置、方法、プログラムおよび記録媒体
JP6322086B2 (ja) 表示制御装置、表示装置、プログラム、記録媒体
JP2012190314A (ja) 画像処理装置およびプログラム
JP7268389B2 (ja) 情報処理装置及びプログラム
JP7031465B2 (ja) 情報処理装置及びプログラム
JP5721052B2 (ja) 画像処理装置およびプログラム
JP2016212626A (ja) Webを介した外字・異体字含有文字群入力利用システム
JP2007018158A (ja) 文字処理装置、文字処理方法及び記録媒体
US11206335B2 (en) Information processing apparatus, method and non-transitory computer readable medium
US20230108505A1 (en) Information processing apparatus
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
US20210295032A1 (en) Information processing device and non-transitory computer readable medium
JP5259764B2 (ja) 拾い読み支援システム、拾い読み支援方法及びプログラム
JP4906044B2 (ja) 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体
JP2006092207A (ja) 文書属性取得装置、文書属性取得方法および文書属性取得プログラム
JPH0969098A (ja) 文書作成装置
JP2017068307A (ja) 情報検索装置及びその制御方法、情報検索用プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150428

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150525

R150 Certificate of patent or registration of utility model

Ref document number: 5753828

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees