JP2021039494A - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP2021039494A JP2021039494A JP2019159616A JP2019159616A JP2021039494A JP 2021039494 A JP2021039494 A JP 2021039494A JP 2019159616 A JP2019159616 A JP 2019159616A JP 2019159616 A JP2019159616 A JP 2019159616A JP 2021039494 A JP2021039494 A JP 2021039494A
- Authority
- JP
- Japan
- Prior art keywords
- document
- image
- specific
- processed
- specific character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims description 15
- 239000003086 colorant Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 14
- 239000000284 extract Substances 0.000 abstract description 7
- 238000000034 method Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00336—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing pattern recognition, e.g. of a face or a geographic feature
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Collating Specific Patterns (AREA)
Abstract
【課題】文書ファイルを開くことなく文書内に存在すべき特定の画像の有無を確認できるようにする。【解決手段】画像形成装置10は、文書の読取画像から文書の種類を特定する文書種類特定部13と、特定された文書の種類に対応するキーをキー情報記憶部22から取得するキー取得部14と、各キーに対応して設定されている探索条件に合致する画像を印影として抽出する画像抽出部15と、画像抽出部15による画像の抽出結果に応じて印影の有無を判定する判定部16と、判定部16によるキー毎の判定結果を、文書のファイル名に含めることで判定結果を出力する判定結果出力部17と、を有する。【選択図】図1
Description
本発明は、情報処理装置及びプログラムに関する。
近年では、文字列と同様に検索語を指定して画像を検索する画像検索技術が一般化されている。画像に対してキーワードを設定する技術として、例えば、文字列と画像とが混在する文書に含まれる画像について、文書から抽出した画像について記述されているパラグラフから特徴度の上位の単語をキーワードとして抽出してインデックスを作成し、入力された検索語と一致するインデックス内のキーワードに対応する画像を取得する技術が提案されている(例えば、特許文献1)。また、HTML文章を解析して、各画像情報に対し、当該画像情報の近傍にある単語ほど高い点数を付与しておき、画像情報を、指定された検索キーと合致する単語の点数の高い順に表示する技術が提案されている(例えば、特許文献2)。
ところで、上記従来技術では、文書等に画像が存在することを前提とし、その画像を探し出すためにキーワード等を利用する技術であるが、その逆に、所定のキーワードに対応させて文書に存在すべき特定の画像、例えば、印章が押印されて形成される印影があるかどうかを確認したい場合がある。この場合、文書ファイルを開き画面に表示させて画像が文書に含まれているかどうかを確認する必要があった。
しかしながら、文書内に存在すべき特定の画像の有無を確認するために文書ファイルを開き画面に表示させることは、手間がかかり面倒であった。
本発明は、文書ファイルを開くことなく文書内に存在すべき特定の画像の有無を確認できるようにすることを目的とする。
本発明に係る情報処理装置は、プロセッサを備え、前記プロセッサは、処理対象の文書の読取画像から当該文書の種類を特定し、文書の種類毎に設定されており、文書内に存在すべき特定の画像に紐づく特定の文字に関する情報である特定文字情報を参照することによって、前記処理対象の文書の種類において当該文書内に存在すべき特定の画像に紐付く特定の文字を取得し、取得した前記特定の文字に対応して予め設定されている探索条件に合致する画像が前記読取画像から抽出できるか否かによって、前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像の有無を判定することを特徴とする。
また、前記プロセッサは、前記処理対象の文書内における、取得した前記特定の文字に紐付いて存在すべき特定の画像の有無の判定結果を提示することを特徴とする。
また、前記プロセッサは、取得した前記特定の文字と、前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像の有無の判定結果と、を組にして、前記文書のファイル名に含めることを特徴とする。
また、前記プロセッサは、取得した前記特定の文字と、前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像の有無の判定結果と、の組を含むファイルを生成することを特徴とする。
また、前記プロセッサは、取得した前記特定の文字に対応して予め設定されている探索条件に合致する画像が前記文書の読取画像から抽出できる場合、当該画像を前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像として抽出し、取得した前記特定の文字及び抽出した前記画像の組を含むファイルを生成することを特徴とする。
また、前記探索条件には、前記処理対象の文書内に、取得した前記特定の文字に紐付いて存在すべき特定の画像を特定するための条件、又は当該特定の文字と前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像との位置関係を示す条件の少なくとも一方が含まれることを特徴とする。
また、前記特定の画像を特定するための条件には、当該特定の画像に含まれる色又は形状の少なくとも一方に関する条件が含まれることを特徴とする。
また、前記特定の画像は、印影であることを特徴とする。
本発明に係るプログラムは、コンピュータに、処理対象の文書の読取画像を解析することによって前記処理対象の文書の種類を特定する機能、文書内に存在すべき特定の画像に紐付く特定の文字が文書の種類毎に設定されている特定文字情報を参照することによって、前記処理対象の文書の種類において当該文書内に存在すべき特定の画像に紐付く特定の文字を取得する機能、取得した前記特定の文字に対応して予め設定されている探索条件に合致する画像が前記読取画像から抽出できるか否かによって、前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像の有無を判定する機能、を実現させる。
請求項1に記載の発明によれば、文書ファイルを開くことなく文書内に存在すべき特定の画像の有無を確認することができる。
請求項2に記載の発明によれば、特定の文字に紐付いて文書内に存在すべき特定の画像の有無の判定結果を確認させることができる。
請求項3に記載の発明によれば、特定の文字に紐付いて文書内に存在すべき特定の画像の有無の判定結果を、文書ファイルを開かせることなくファイル名にて確認させることができる。
請求項4に記載の発明によれば、文書の種類に対応する特定の文字が複数存在する場合、あるいは処理対象とする文書が複数存在する場合に、特定の画像の有無の判定結果をまとめて確認させることができる。
請求項5に記載の発明によれば、特定の文字に紐付く特定の画像が存在する場合、特定の画像有りという判定結果として特定の画像を提示することができる。
請求項6に記載の発明によれば、特定の文字に紐付いて存在すべき特定の画像を特定することができる。
請求項7に記載の発明によれば、特定の文字に紐付いて存在すべき特定の画像を、色や形状によって特定することができる。
請求項8に記載の発明によれば、文書に存在すべき印影の有無を判定することができる。
請求項9に記載の発明によれば、文書ファイルを開くことなく文書内に存在すべき特定の画像の有無を確認することができる。
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
図1は、本発明に係る情報処理装置の一実施の形態を示すブロック構成図である。本実施の形態では、情報処理装置であるコンピュータを内蔵する画像形成装置を例にして説明する。
図2は、本実施の形態における画像形成装置10のハードウェア構成図である。画像形成装置10は、コピー機能、スキャナ機能等各種機能を搭載した複合機で形成可能である。図2において、CPU31は、ROM39に格納されたプログラムに従ってスキャナ34やプリンタエンジン36等本装置に搭載された各種機構の動作制御を行う。アドレスデータバス32は、CPU31の制御対象となる各種機構と接続してデータの通信を行う。操作パネル33は、ユーザからの指示の受け付け、情報の表示を行う。スキャナ34は、ユーザがセットした原稿を読み取る。HDD35は、スキャナ34を使用して読み取った電子文書などを格納する。プリンタエンジン36は、CPU31で実行される制御プログラムからの指示に従い出力用紙上に画像を印字する。ネットワークインタフェース(I/F)37は、ネットワーク1を接続し、本装置が生成した電子データの送信、本装置宛に送信されてきた電子メールの受信、またブラウザ経由による本装置へのアクセスなどに利用される。RAM38は、プログラム実行時のワークメモリや電子データ送受信時の通信バッファとして利用される。ROM39は、本装置の制御や電子データの送受信に関する各種プログラムが格納されている。各種プログラムが実行されることで後述する各構成要素が所定の処理機能を発揮する。外部メディアインタフェース(I/F)40は、USBメモリ、フラッシュメモリ等の外部メモリ機器とのインタフェースである。本実施の形態おける画像形成装置10のハードウェア構成は、従前からある構成と同様でよい。
図1に戻り、本実施の形態における画像形成装置10は、スキャンデータ取得部11、文字認識処理部12、文書種類特定部13、キー取得部14、画像抽出部15、判定部16、判定結果出力部17、文書種類情報記憶部21、キー情報記憶部22、探索条件情報記憶部23及び出力形式情報記憶部24を有している。なお、本実施の形態において説明に用いない構成要素については、図から省略している。
スキャンデータ取得部11は、スキャナ34を使用して読み取ったスキャンデータ(以下、「読取画像」ともいう)を取得する。本実施の形態において取り扱う文書は、特定の文字を含むテキスト文字と特定の画像とが混在する文書である。「特定の文字」というのは、文書の種類毎に設定されており、文書内に存在すべき特定の画像に紐づくテキスト文字である。本実施の形態では、特定の文字を「キー」と称している。また、本実施の形態では、「特定の画像」として印影の画像を想定して説明する。本実施の形態において取り扱う文書には、押印されることで印影が含まれているはずであるが、押印されることが忘れられて含まれていない場合もあり得る。なお、厳密には、紙文書にあるのは印影であり、紙文書の読取画像に含まれているのは印影の画像なので、「特定の画像」に対応するのは印影の画像であるが、説明の便宜上、「特定の画像」に対応するのは印影と記載して説明する場合もある。
文字認識処理部12は、OCR(Optical Character Reader)機能を利用して文字認識を行うことによって、読み取った文書に記載されている文字列(すなわち、テキスト文字)を抽出する。文書種類特定部13は、読み取った文書の読取画像から当該文書の種類を特定する。キー取得部14は、文書内に存在すべき特定の画像(すなわち、印影)に紐づく特定の文字(すなわち、キー)に関する情報である特定文字情報を参照することによって、当該文書の種類において当該文書内に存在すべき印影に紐付くキーを取得する。特定文字情報は、キー情報としてキー情報記憶部22に記憶される。
画像抽出部15は、キー取得部14が取得したキーに対応して探索条件に合致する画像を読取画像から抽出する。探索条件に関する探索条件情報は、探索条件情報記憶部23に予め設定されている。判定部16は、画像抽出部15が画像を抽出できるか否かによって、処理対象の文書内に当該キーに紐付いて存在すべき印影の有無を判定する。判定結果出力部17は、指定された出力形式に従い判定結果を出力する。出力形式に関する出力形式情報は、出力形式情報記憶部24に予め設定されている。
図3は、本実施の形態におけるキー情報記憶部22に記憶されるキー情報のデータ構成例を示す図である。キー情報は、文書の種類毎に、当該文書の種類に対応する1又は複数のキーを含む。
図4は、本実施の形態における探索条件情報記憶部23に記憶される探索条件情報のデータ構成例を示す図である。探索条件情報は、文書の種類毎に設定される。図4には、文書の種類が図面の場合の探索条件情報の設定例が示されている。探索条件情報には、当該文書の種類に対応するキー毎に対応付けして探索条件が設定される。文書の種類が図面の場合のキーは、図3に例示したように承認者、製図、構造、設計及び検図であるが、図4に例示するように、文書の種類が図面の場合、キー毎に探索条件が設定される。各キーに対応する探索条件には、処理対象の文書内に、取得したキーに紐付いて存在すべき印影を特定するための条件である「画像に対する条件」と、当該キーと処理対象の文書内に当該機キーに紐付いて存在すべき印影との位置関係を示す条件である「位置関係」とが含まれている。なお、「画像に対する条件」と「位置関係」との少なくとも一方が含まれるようにしてもよい。図4に示す設定例では、各キーとも同じ項目値を設定しているが、文書のレイアウトに従って異なる探索条件が指定される場合もあり得る。「画像に対する条件」には、当該印影に含まれる色又は形状の少なくとも一方に関する条件が含めてよい。図4に示す設定例では、「赤丸」と赤色及び丸形状の双方が含まれている。
なお、文書種類情報記憶部21及び出力形式情報記憶部24については、動作の説明と合わせて説明する。
画像形成装置10における各構成要素11〜17は、画像形成装置10に内蔵されるコンピュータと、コンピュータに搭載されたCPU31で動作するプログラムとの協調動作により実現される。また、各記憶部21〜24は、画像形成装置10に搭載されたHDD35にて実現される。あるいは、RAM38又は外部にある記憶手段をネットワーク経由で利用してもよい。
また、本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、CD−ROMやUSBメモリ等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのCPUがプログラムを順次実行することで各種処理が実現される。
文書の種類や文書のフォームによって押印される位置は異なってくるかもしれないが、本実施の形態において取り扱う文書には、押印されることで印影が含まれる。しかしながら、場合によっては、押印が忘れられ、そのため文書を正式な文書として取り扱うことができない場合が起こりうる。そこで、本実施の形態においては、押印が忘れられていないかを、文書ファイルを個々に開いて確認しなくてもすむようにしたことを特徴としている。
次に、本実施の形態における動作について説明するが、以下、本実施の形態において特徴的な特定の画像(すなわち、印影)の有無の判定を行う処理について図5に示すフローチャートを用いて説明する。
まず、ユーザが処理対象とする文書をスキャナ54に読み取らせると、スキャンデータ取得部11は、その文書の読取画像を取得する(ステップ101)。続いて、文字認識処理部12は、OCR機能を利用して文字認識を行うことによって、読み取った文書に記載されている文字列を抽出する(ステップ102)。OCRを実行する際、読取画像の正立や背景色を除去するクレンジング等の前処理を行うようにしてもよい。
次に、文書種類特定部13は、文書の種類を特定する(ステップ103)。具体的には、以下に例示するいずれかの手法を用いて文書の種類を特定する。
第1に、例えば文書のフォーム若しくは文書の識別情報を特定するQRコード(登録商標)等のデータコードが文書に付されている場合、そのデータコードを読み取る。この場合、文書種類情報記憶部21には、データコードに、当該データコードに対応する文書の種類が対応付けして文書種類情報として記憶されており、文書種類特定部13は、読取画像から得たデータコードを文書種類情報に含まれるデータコードと照合することで文書の種類を特定する。
第2に、文書の読取画像、特にレイアウトを解析することによって文書の種類を推定により特定する。例えば、文書上の罫線の位置を検出し、その罫線のレイアウトを取得する。この罫線のレイアウトから文書の種類を推定する。あるいは、罫線が表を形成している場合、表に含まれる項目の名称を抽出する。この場合、文書種類情報記憶部21には、文書の種類に、表の項目名が対応付けして文書種類情報として記憶されており、文書種類特定部13は、読取画像から得た表の項目名のリストを、文書種類情報に含まれる項目名のリストと照合することで、項目名の合致率等を参照に文書の種類を推定により特定する。
第3に、文書の読取画像を解析することによって文書における書類名を抽出する。一般に、文書には、書類名が記載されており、その記載位置は、文書の最上段や上方の中央である。また括弧が付されていたり、文字サイズが大きかったりする。そこで、そのような特徴のある文字列を書類名と推定して抽出する。この場合、文書種類情報記憶部21には、文書の種類に、書類名が対応付けして文書種類情報として記憶されており、文書種類特定部13は、読取画像から得た書類名を、文書種類情報に含まれる書類名と照合することで、文書の種類を推定により特定する。
第4に、文書をスキャナ54に読み取らせる際に、文書の種類をユーザに指定させる。より具体的には、スキャンデータ取得部11が文書を読み取ると、文書種類特定部13は、文書の種類の入力画面を操作パネル53に表示させ、その入力画面から文書の種類をユーザに入力させる。あるいは、文書種類情報記憶部21には、文書の種類の選択候補が記憶されており、文書種類特定部13は、スキャンデータ取得部11が文書を読み取ると、文書の種類の選択画面を操作パネル53に表示させる。選択画面には、文書種類情報記憶部21から読み出した文書の種類がリスト表示される。そして、文書種類特定部13は、ユーザに選択より選択された文書の種類に特定する。
文書種類特定部13がいずれかの手法にて文書の種類を特定すると、キー取得部14は、特定された文書の種類に対応して設定されているキーをキー情報記憶部22から取得する(ステップ104)。図3に示す設定例によると、文書種類特定部13が特定した文書の種類が図面の場合、キー取得部14は、キー情報記憶部22から承認者、製図、構造、設計及び検図を取得することになる。
次に、画像抽出部15は、取得されたキー毎に以下の処理を繰り返し実行する。まず、以下の処理を実施していない未処理のキーを1つ選出する(ステップ105)。選出するキーの順番は、特に限定する必要はない。続いて、画像抽出部15は、選出したキーを、ステップ102で実施した文字認識処理で得た文字列と照合して、文書上におけるキーの位置を特定する。なお、ステップ102で実施した文字認識処理の結果を利用せずに、この時点で改めて文字認識処理を実施してもよい。続いて、画像抽出部15は、文書の種類が図面であって処理対象のキーに対応する探索条件を探索条件情報記憶部23から取得する。例えば、キーが“承認者”の場合、画像抽出部15は、“承認者”と印字されている文書の位置を特定する。そして、図4に示す探索条件の設定例によると、その文書のキー“承認者”の印字位置から下側に3cm以内にある画像であって、色が赤色で形状が丸(つまり、円形状)の画像を抽出する(ステップ106)。そして、その中に人名があることを確認する。なお、本実施の形態では、丸の中に文字列があれば、その文字列は人名であると推定するが、人名辞典等を照合することによって企業名や日付などではなく、実在する人名であることを厳格に検証してもよい。
判定部16は、画像抽出部15による画像の抽出結果を参照して、文書内のキーに紐付く印影の有無を判定する。すなわち、判定部16は、画像抽出部15により探索条件に合致する画像が抽出できると(ステップ107でY)、その画像は印影であるとみなして印影有りと判定する(ステップ108)。一方、探索条件に合致する画像が抽出できない場合(ステップ107でN)、印影無しと判定する(ステップ109)。
図6は、文書の種類が図面に分類される文書の概略的なレイアウトを示す図である。図6には、文書上の右下に所定の押印欄が設けられており、押印すべき者は、所定の押印欄に押印することになる。押印欄の中の上方には、キーが印字されており、ユーザは、キーによって押印する位置を確認できる。なお、図6には、押印されている押印欄2と、押印されていない押印欄3が示されている。押印欄のサイズを参照に設定された位置、例えば下側3cm以内に印影が確認されるはずなので、押印欄2のように画像が存在すれば、印影有りと判定される。一方、押印欄3(キー“製図”の位置を想定)のように画像が存在しなければ、印影無しと判定される。
以上説明した処理を実施していないキーに対しても同様に処理を行い(ステップ110でN,ステップ105〜109)、キー取得部14が取得した全てのキーに対して処理を実施すると(ステップ110でY)、判定結果出力部17は、判定部16による印影の有無の判定結果を提示する(ステップ111)。具体的には、以下に例示するいずれかの手法を用いて判定結果を出力する。
まず、第1に、判定結果を文書のファイル名に含める。出力形式情報記憶部24に記憶される出力形式情報には、文書ファイルの命名規則が定義されている。例えば、“元ファイル名+キー+判定結果”というように、キーと当該キーに紐付いて存在すべき印影の有無の判定結果と、を組にしてファイル名に含めるという命名規則が出力形式情報に設定されていた場合、元ファイル名が“ABC”であり、キーが“承認者”であり、印影が確認された場合、命名規則に従って“ABC_承認者_有”と文書ファイルが命名される。一方、元ファイル名が“ABC”であり、キーが“製図”であり、印影が確認されなかった場合、“ABC_製図_無”と文書ファイルが命名される。なお、“_”は各項目値を区切る区切り文字であるが、区切り文字はこれに限る必要はない。また、区切り文字をファイル名に必ずしも含めなくてもよい。また、キーが複数ある場合は、“ABC_承認者_有_製図_無_・・・”と、キーと当該キーに紐付いて存在すべき印影の有無の判定結果との複数の組をファイル名に含める。
このように、文書のファイル名に判定結果を含めると、文書を開いて文書の内容を参照するまでもなく印影の有無の判定結果を確認させることができる。
第2に、判定結果を含むファイルを生成する。出力形式情報記憶部24に記憶される出力形式情報には、キーと当該キーに紐付いて存在すべき印影の有無の判定結果と、の組を含むファイル(以下、「判定結果ファイル」と称する)を生成することが定義されている。前述したように、キーと判定結果との組をファイル名に含める場合、キーの数が多いとファイル名が非常に長くなる可能性がある。そこで、この第2の出力形式を採用することでファイル名が長くなりすぎてしまうことを回避できる。判定結果を確認するためには、判定結果ファイルを開く必要が生じてくるかもしれない。しかしながら、判定結果ファイルに、複数の文書に対する判定結果を含めると、複数の文書に対する判定結果を確認する際にはただ1つの判定結果ファイルを開けばよく、複数の文書ファイルを個々に開く必要はない。また、判定結果ファイルを文書ファイルとは別に生成しておくと、印影の有無の管理上、便利である。判定結果ファイルは、例えばCSV(Comma Separated Values)ファイルで作成する。なお、複数の文書に共通した判定結果ファイルを生成する場合、キー及び判定結果に文書名を対応付けて判定結果ファイルに登録することが好ましい。
第3の出力形式は、第2の出力形式とほぼ同様である。ただ、第2の出力形式では、判定結果として“有”又は“無”を含めるのに対し、第3の出力形式では、判定結果として印影有りの場合は、その印影の画像そのものをファイルに含めるようにする。すなわち、キーの探索条件に合致する画像が存在する場合、その画像を印影とみなして文書の読取画像から抽出し、キーと、当該キーに紐付く印影とを組にしてファイルに含めるようにする。このようにすれば、印影の有無だけでなく、印影有りの場合には印影そのものを確認させることができる。また、印影と誤認して他の画像を抽出してしまった場合、誤認であることをユーザに確認させることができる。なお、印影の画像がない場合には、キーに紐付く画像がないことで判定結果は“無”と確認できる。
ここで、探索条件の設定について説明を補充する。
探索条件情報記憶部23には、探索条件情報を予め設定しておく必要があるが、本実施の形態では、探索条件情報に含める探索条件の設定方法として3種類用意している。
第1に、探索条件として指定可能な条件を予め用意しておき(これを「プリセット」ともいう)、プリセットの中から探索条件を選択する。図7には、プリセットされている探索条件が示されている。プリセットされている探索条件には、やや汎用的な条件が組み合わせて設定されている。例えば、データ印の場合、印影の外形は円形状であること、円形状の中は3段に別れていること、真ん中の段は日付であること、という具体的な条件が予め設定されている。ユーザは、この具体的な条件でよければ、プリセットされているデータ印を探索条件として選択すればよい。これにより、印影の外形は円形状であることなどの詳細な条件を個々に設定しなくてもすむので探索条件の設定を効率的に行うことができる。
第2に、探索条件を個々に設定する。第1の設定方法では、個別具体的な設定を行うことができないので、第2の設定方法では、それをできるようにしている。図8には、探索条件を個別的に設定する場合の例が示されている。設定する条件項目としては、色、キーに対する位置等を印影毎に設定できる。図4に示した設定例は、この設定方法に準じている。
第3に、探索条件をより具体的に設定する。設定する探索条件の項目の例は、図7と同じでよいが、設定するのは、より具体的となる。例えば、キーが承認者の場合、ある程度重要なポストにいる管理者が承認者となり、責任も重大なので、承認者のキーに対しては印鑑(個人)の探索条件として、当該管理者の印章の画像を予め設定登録する。このように、あるキーに対して押印されるべき印章が特定されている場合には、その印章の印影を予め登録しておくことで、より高精度な判定結果を得ることができる。つまり、印影と推定される画像がキー“承認者”の近傍に押印されていても、設定登録されている管理者の印章の印影と合致しなければ、判定結果は“無”となる。
以上説明したように、本実施の形態においては、文書の読取画像から文書の種類を特定し、その特定した文書の種類に対応するキーを取得し、探索条件の設定に依存するが、キーの近傍に画像が存在すれば、それはキーに紐付く印影と推定して印影有りという判定結果を得るようにした。このように、本実施の形態においては、文書の種類が特定でき、そして印影に紐付くキーが特定できれば印影の有無の判定を行うことができるので、どのようなフォームの文書にも適応することが可能となる。つまり、文書のフォームの影響を受けないので、多種類に及ぶ文書のフォームに個別に対処することなく印影の有無の判定結果を得ることができる。
なお、キーと同じ文字列が文書に複数存在する場合も想定できる。この場合、複数の文字列の中から印影と紐付くキーを特定するための条件を予め設定して自動的に選出できるようにしたり、ユーザに選択させたりして対応してもよい。
上記説明では、特定の画像として印影を例にして説明したが、印影に限る必要はなく、例えばロゴ、写真、地図等種々の画像にも適用することができる。
また、本実施の形態では、文書の読取画像を利用するので、情報処理装置として画像形成装置10を例にして説明したが、文書の読取画像を受け取って処理する汎用的なPC等のコンピュータでもよい。
上記実施の形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU:Central Processing Unit等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、ASIC:Application Specific Integrated Circuit、FPGA:Field Programmable Gate Array、プログラマブル論理デバイス等)を含むものである。
また上記実施の形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記実施の形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
1 ネットワーク、10 画像形成装置、11 スキャンデータ取得部、12 文字認識処理部、13 文書種類特定部、14 キー取得部、15 画像抽出部、16 判定部、17 判定結果出力部、21 文書種類情報記憶部、22 キー情報記憶部、23 探索条件情報記憶部、24 出力形式情報記憶部、31 CPU、32 アドレスデータバス、33 操作パネル、34 スキャナ、35 ハードディスクドライブ(HDD)、36 プリンタエンジン、37 ネットワークインタフェース(I/F)、38 RAM、39 ROM、40 外部メディアインタフェース(I/F)。
Claims (9)
- プロセッサを備え、
前記プロセッサは、
処理対象の文書の読取画像から当該文書の種類を特定し、
文書の種類毎に設定されており、文書内に存在すべき特定の画像に紐づく特定の文字に関する情報である特定文字情報を参照することによって、前記処理対象の文書の種類において当該文書内に存在すべき特定の画像に紐付く特定の文字を取得し、
取得した前記特定の文字に対応して予め設定されている探索条件に合致する画像が前記読取画像から抽出できるか否かによって、前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像の有無を判定する、
ことを特徴とする情報処理装置。 - 前記プロセッサは、前記処理対象の文書内における、取得した前記特定の文字に紐付いて存在すべき特定の画像の有無の判定結果を提示することを特徴とする、
請求項1に記載の情報処理装置。 - 前記プロセッサは、取得した前記特定の文字と、前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像の有無の判定結果と、を組にして、前記文書のファイル名に含めることを特徴とする、
請求項2に記載の情報処理装置。 - 前記プロセッサは、取得した前記特定の文字と、前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像の有無の判定結果と、の組を含むファイルを生成することを特徴とする、
請求項2に記載の情報処理装置。 - 前記プロセッサは、
取得した前記特定の文字に対応して予め設定されている探索条件に合致する画像が前記文書の読取画像から抽出できる場合、当該画像を前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像として抽出し、
取得した前記特定の文字及び抽出した前記画像の組を含むファイルを生成することを特徴とする、
請求項2に記載の情報処理装置。 - 前記探索条件には、前記処理対象の文書内に、取得した前記特定の文字に紐付いて存在すべき特定の画像を特定するための条件、又は当該特定の文字と前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像との位置関係を示す条件の少なくとも一方が含まれることを特徴とする、
請求項1に記載の情報処理装置。 - 前記特定の画像を特定するための条件には、当該特定の画像に含まれる色又は形状の少なくとも一方に関する条件が含まれることを特徴とする、
請求項6に記載の情報処理装置。 - 前記特定の画像は、印影であることを特徴とする請求項1乃至8のいずれか1項に記載の情報処理装置。
- コンピュータに、
処理対象の文書の読取画像を解析することによって前記処理対象の文書の種類を特定する機能、
文書内に存在すべき特定の画像に紐付く特定の文字が文書の種類毎に設定されている特定文字情報を参照することによって、前記処理対象の文書の種類において当該文書内に存在すべき特定の画像に紐付く特定の文字を取得する機能、
取得した前記特定の文字に対応して予め設定されている探索条件に合致する画像が前記読取画像から抽出できるか否かによって、前記処理対象の文書内に当該特定の文字に紐付いて存在すべき特定の画像の有無を判定する機能、
を実現させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019159616A JP2021039494A (ja) | 2019-09-02 | 2019-09-02 | 情報処理装置及びプログラム |
CN202010045792.XA CN112446273A (zh) | 2019-09-02 | 2020-01-16 | 信息处理装置以及存储介质 |
US16/744,205 US11206335B2 (en) | 2019-09-02 | 2020-01-16 | Information processing apparatus, method and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019159616A JP2021039494A (ja) | 2019-09-02 | 2019-09-02 | 情報処理装置及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021039494A true JP2021039494A (ja) | 2021-03-11 |
Family
ID=74680377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019159616A Pending JP2021039494A (ja) | 2019-09-02 | 2019-09-02 | 情報処理装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11206335B2 (ja) |
JP (1) | JP2021039494A (ja) |
CN (1) | CN112446273A (ja) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06162107A (ja) | 1992-11-24 | 1994-06-10 | Seiko Epson Corp | 電子ファイリングシステム |
JPH11224256A (ja) | 1998-02-05 | 1999-08-17 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法および情報検索プログラムを記録した記録媒体 |
JP3917349B2 (ja) | 2000-05-30 | 2007-05-23 | 富士通株式会社 | 文字認識結果を利用して情報を検索する検索装置および方法 |
JP2010205060A (ja) | 2009-03-04 | 2010-09-16 | Nomura Research Institute Ltd | 文書内画像検索方法および文書内画像検索システム |
JP5407572B2 (ja) | 2009-06-09 | 2014-02-05 | 三菱電機株式会社 | プログラマブル表示器、ドキュメント表示方法とその方法を実行するプログラムおよびそれを記録した記録媒体、並びにキーワード位置情報作成方法とその方法を実行するプログラムおよびそれを記録した記録媒体 |
JP5365360B2 (ja) * | 2009-06-19 | 2013-12-11 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP2011003116A (ja) * | 2009-06-22 | 2011-01-06 | Fuji Xerox Co Ltd | 情報処理装置及びプログラム |
US10409900B2 (en) * | 2013-02-11 | 2019-09-10 | Ipquants Limited | Method and system for displaying and searching information in an electronic document |
JP2018092459A (ja) | 2016-12-06 | 2018-06-14 | 株式会社アイリックコーポレーション | 画像分析装置、画像分析方法および画像分析プログラム |
-
2019
- 2019-09-02 JP JP2019159616A patent/JP2021039494A/ja active Pending
-
2020
- 2020-01-16 US US16/744,205 patent/US11206335B2/en active Active
- 2020-01-16 CN CN202010045792.XA patent/CN112446273A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US11206335B2 (en) | 2021-12-21 |
CN112446273A (zh) | 2021-03-05 |
US20210067640A1 (en) | 2021-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5623079B2 (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
US8213717B2 (en) | Document processing apparatus, document processing method, recording medium and data signal | |
US20190294912A1 (en) | Image processing device, image processing method, and image processing program | |
JP5938393B2 (ja) | 画像処理装置 | |
JP2008059157A (ja) | 書類確認支援システム、書類確認支援装置およびプログラム | |
JP7379987B2 (ja) | 情報処理装置及びプログラム | |
JP4811133B2 (ja) | 画像形成装置及び画像処理装置 | |
JP2008282094A (ja) | 文字認識処理装置 | |
JP2021056722A (ja) | 情報処理装置及びプログラム | |
JP2021039494A (ja) | 情報処理装置及びプログラム | |
JP2007241355A (ja) | 画像処理装置及び画像処理プログラム | |
JP5445740B2 (ja) | 画像処理装置、画像処理システムおよび処理プログラム | |
JP2021043500A (ja) | 情報処理装置及びプログラム | |
JP2001005831A (ja) | ファイリング方法及びそれを格納した記録媒体 | |
JP7268764B1 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US20230102476A1 (en) | Information processing apparatus, non-transitory computer readable medium storing program, and information processing method | |
US10659654B2 (en) | Information processing apparatus for generating an image surrounded by a marking on a document, and non-transitory computer readable recording medium that records an information processing program for generating an image surrounded by a marking on a document | |
JP2004164376A (ja) | 識別コード添付帳票、帳票読取プログラム、及び帳票作成プログラム | |
JP4788205B2 (ja) | 文書検索装置及び文書検索プログラム | |
JP2007004429A (ja) | 文書処理装置 | |
JP2021157627A (ja) | 情報処理装置 | |
JP2022045172A (ja) | 情報処理装置及びプログラム | |
CN115690813A (zh) | 水印信息处理方法、装置、图像形成设备及存储介质 | |
CN113392285A (zh) | 票单处理装置以及记录介质 | |
JP2002312346A (ja) | 印字データ入力作成装置及びコンピュータ・ソフトウエア |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230711 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240109 |