JP2021149741A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2021149741A
JP2021149741A JP2020050658A JP2020050658A JP2021149741A JP 2021149741 A JP2021149741 A JP 2021149741A JP 2020050658 A JP2020050658 A JP 2020050658A JP 2020050658 A JP2020050658 A JP 2020050658A JP 2021149741 A JP2021149741 A JP 2021149741A
Authority
JP
Japan
Prior art keywords
character string
target
information
key
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020050658A
Other languages
English (en)
Inventor
史 小坂
Chikashi Kosaka
史 小坂
聡之 山口
Satoyuki Yamaguchi
聡之 山口
淳一 清水
Junichi Shimizu
淳一 清水
慎也 中村
Shinya Nakamura
慎也 中村
惇 安藤
Andojun
惇 安藤
公則 吉塚
Kiminori Yoshizuka
公則 吉塚
茜 阿部
Akane Abe
茜 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Priority to JP2020050658A priority Critical patent/JP2021149741A/ja
Priority to US16/933,957 priority patent/US11995908B2/en
Priority to CN202010909651.8A priority patent/CN113438379A/zh
Publication of JP2021149741A publication Critical patent/JP2021149741A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書画像において対象文字列の位置を基準とする領域に対象情報が存在しない場合にも、対象文字列に対する対象情報を抽出する。【解決手段】情報処理装置は、プロセッサを備え、プロセッサは、文書を示す文書画像100を取得し、文書画像100に含まれる対象文字列(キー111)に関連付けられた関連文字列(文字列122〜125)を取得し、文書画像100において関連文字列(文字列122〜125)の位置を基準とする領域から、対象文字列に対する対象情報(情報126〜129)を抽出する。【選択図】図2

Description

本発明は、情報処理装置及びプログラムに関する。
キーバリュー抽出技術を用いて、文書から対象情報を抽出する技術が知られている。例えば特許文献1には、キーワードを含む領域を特定し、特定された領域に対して文字認識処理を行ってバリューを抽出する技術が記載されている。
特開2018−128996号公報
従来のキーバリュー抽出技術では、対象文字列の周辺から対象情報を抽出している。しかし、契約書等の文書においては、対象文字列の周辺には対象情報が存在せず、対象文字列とは異なる文字列の周辺に対象情報が記載されている場合がある。例えば対象文字列が「本件土地」であり、対象文字列に対する対象情報が本件土地の属性情報である場合には、「所在」、「地番」、「地積」、「地目」という属性を示す文字列の周辺に対象文字列に対する対象情報が記載されている場合がある。この場合、対象文字列の周辺に対象情報が存在しないため、従来のキーバリュー抽出技術では対象情報を抽出することができない。
本発明は、文書画像において対象文字列の位置を基準とする領域に対象情報が存在しない場合にも、対象文字列に対する対象情報を抽出することを目的とする。
請求項1に係る発明は、プロセッサを備え、前記プロセッサは、文書を示す文書画像を取得し、前記文書画像に含まれる対象文字列に関連付けられた関連文字列を取得し、前記文書画像において前記関連文字列の位置を基準とする領域から、前記対象文字列に対する対象情報を抽出することを特徴とする情報処理装置である。
請求項2に係る発明は、請求項1に記載の情報処理装置において、前記プロセッサは、前記文書画像において前記対象文字列の位置を基準とした領域に参照先を示す参照文字列が含まれる場合には、前記参照先において前記関連文字列の位置を基準とする領域から前記対象情報を抽出することを特徴とする。
請求項3に係る発明は、請求項2に記載の情報処理装置において、前記プロセッサは、前記対象文字列と前記関連文字列とが関連付けられていない場合には、前記参照先に含まれる文字列を前記関連文字列として前記対象文字列に関連付けることを特徴とする。
請求項4に係る発明は、請求項3に記載の情報処理装置において、前記プロセッサは、前記対象文字列に前記関連文字列が関連付けられていない場合には、前記参照先に含まれる少なくとも一の文字列から利用者の操作により選択された文字列を前記関連文字列として前記対象文字列に関連付けることを特徴とする。
請求項5に係る発明は、請求項1に記載の情報処理装置において、前記プロセッサは、前記対象文字列に関連付けられた複数の関連文字列を取得し、前記複数の関連文字列の位置を基準とした複数の領域から、前記対象文字列に対する複数の対象情報を抽出することを特徴とする。
請求項6に係る発明は、請求項5に記載の情報処理装置において、前記プロセッサは、前記複数の領域に含まれる前記複数の対象情報のうち利用者の操作により選択された対象情報を抽出し、前記複数の関連文字列のうち、前記選択された対象情報に対応する関連文字列以外の関連文字列と前記対象文字列との関連付けを解除することを特徴とする。
請求項7に係る発明は、請求項1に記載の情報処理装置において、前記対象文字列には複数の関連文字列が関連付けられており、前記プロセッサは、属性情報を取得し、前記属性情報によって前記対象文字列と関連付けられた異なる関連文字列を取得することを特徴とする。
請求項8に係る発明は、請求項7に記載の情報処理装置において、前記属性情報は、前記文書の種別、前記文書の内容、利用者の識別子、又は前記利用者が属する組織の識別子を含むことを特徴とする。
請求項9に係る発明は、コンピュータに、文書を示す文書画像を取得するステップと、前記文書画像に含まれる対象文字列に関連付けられた関連文字列を取得するステップと、前記文書画像に含まれる前記関連文字列の位置を基準とする領域から、前記対象文字列に対応する対象情報を抽出するステップとを実行させるためのプログラムである。
請求項1に係る発明によれば、文書画像において対象文字列の位置を基準とする領域に対象情報が存在しない場合にも、対象文字列に対する対象情報を抽出できる。
請求項2に係る発明によれば、対象文字列に対する対象情報が参照先に含まれる場合にも対象情報を抽出できる。
請求項3に係る発明によれば、予め対象文字列に関連文字列が関連付けられていない場合でも、関連文字列の位置を基準とする領域にある対象情報を抽出できる。
請求項4に係る発明によれば、参照先に含まれる文字列であっても利用者が所望しない文字列については関連文字列から除外できる。
請求項5に係る発明によれば、対象文字列に対して複数の対象情報が存在する場合にも、これらの対象情報を抽出できる。
請求項6に係る発明によれば、利用者が所望しない対象情報については、次回から抽出されないようにすることができる。
請求項7に係る発明によれば、属性情報によって異なる対象情報を抽出できる。
請求項8に係る発明によれば、文書の種別、文書の内容、利用者、又は利用者が属する組織によって異なる対象情報を抽出できる。
請求項9に係る発明によれば、文書画像において対象文字列の位置を基準とする領域に対象情報が存在しない場合にも、対象文字列に対する対象情報を抽出できる。
実施形態に係る画像処理装置10の構成の一例を示す図である。 文書画像100の一例を示す図である。 画像処理装置10の動作の一例を示すフローチャートである。 画像処理装置10の動作の一例を示すフローチャートである。 参照先からバリューを抽出する処理の一例を示すフローチャートである。 関連辞書130の一例を示す図である。 選択画面135の一例を示す図である。 選択画面140の一例を示す図である。
1.構成
図1は、本実施形態に係る画像処理装置10の構成の一例を示す図である。画像処理装置10は、本発明に係る情報処理装置の一例である。画像処理装置10は、スキャンし、文書を読み取って文書画像を取得する。この文書には、帳票等の定形の文書や見積書や契約書等の非定形の文書が含まれる。また、画像処理装置10は、文字認識機能を有し、文書画像に含まれるキーに基づいてバリューを抽出する。このキーは、バリューの目印となる文字列である。このキーには、文字、数字、及び記号のうち少なくともいずれかが含まれる。キーは、本発明に係る「対象文字列」の一例である。バリューは、利用者が所望する情報である。バリューには、文字、数字、記号、及び画像のうち少なくともいずれかが含まれる。この画像は、写真や印影、図形であってもよい。バリューは、本発明に係る「対象情報」の一例である。なお、ここでいう「文字列」には、文字だけでなく、数字や記号も含み得るものとする。文書画像から抽出されたバリューは、様々な処理に用いられる。例えば文書画像から抽出されたバリューが文書画像のファイル名やフォルダ名に用いられたり、バリューに対して定められた宛先に送信されたりしてもよい。
画像処理装置10は、プロセッサ11と、メモリ12と、画像読取部13と、記憶部14と、操作部15と、表示部16とを備える。これらのハードウェア要素は、バス17を介して接続されている。プロセッサ11は、プログラムを実行することにより、画像処理装置10の各部を制御し、文書画像からキーに対応するバリューを抽出する処理を行う。プロセッサ11には、例えばCPU(Central Processing Unit)が用いられる。メモリ12は、プロセッサ11により実行されるプログラムを記憶する。メモリ12には、例えばROM(Read Only Memory)及びRAM(Random Access Memory)が用いられる。画像読取部13は、文書を読み取って文書画像を生成する。画像読取部13には、例えばイメージスキャナが用いられる。記憶部14は、画像読取部13により生成された文書画像や文書画像から抽出されたバリューを記憶する。記憶部14には、例えばハードディスクドライブ又はSSD(Solid State Drive)が用いられる。操作部15は、利用者による画像処理装置10の操作に用いられる。操作部15には、例えばタッチパネルとボタンとが用いられる。表示部16は、利用者の操作に用いられる各種の画面を表示する。表示部16には、例えば液晶ディスプレイが用いられる。
図2は、文書画像100の一例を示す図である。図2に示す文書画像100は土地売買契約書を示す画像であり、複数のページを有する。文書画像100には、最初のページ110と、4頁目のページ120とが含まれる。ここでは、キーが「(以下、『本件土地』という。)」であり、バリューが本件土地の内容を特定し得る詳細情報であるものとする。
ページ110には、「(以下、『本件土地』という。)」というキー111が記載されている。しかし、キー111の周辺にはキー111に対するバリュー、すなわち本件土地の詳細情報は記載されていない。その代わりに、キー111の位置を基準に定められた領域(以下、「周辺範囲」という。)には、「別紙物件目録の土地」という参照先を示す参照文字列112が記載されている。これは、キー111に対応するバリューが、「物件目録」というタイトルの別のページ120に記載されていることを示す。
ページ120の上方には、基準のフォントサイズより大きいフォントサイズで「物件目録」というタイトル121が記載されている。しかし、ページ120には、「(以下、『本件土地』という。)」というキー111、参照文字列112、及びそれらの部分文字列のいずれも記載されていない。その代わりに、ページ120には、キー111に関連する「所在」という文字列122、「地番」という文字列123、「地目」という文字列124、「地積」という文字列125が記載されている。これらの文字列122〜125はいずれも本件土地の属性情報の項目を示す。また、ページ120において、これらの文字列122〜125の周辺範囲には、本件土地の詳細情報、すなわち本件土地の所在である「横浜市西区みなとみらい〇〇丁目」という情報126と、本件土地の地番である「××××番」という情報127と、本件土地の地目である「宅地」という情報128と、本件土地の地積である「80・21平方メートル」という情報129とが記載されている。これらの情報126〜129は、本件土地の内容を特定し得る詳細情報であるため、キー111に対するバリューである。このように、キー111には4つのバリューが存在する。
2.動作
以下の説明において、プロセッサ11を処理の主体として記載する場合、これは、メモリ12に記憶されたプログラムと、このプログラムを実行するプロセッサ11との協働により、プロセッサ11が演算を行い又は他のハードウェア要素の動作を制御することにより、処理が行われることを意味する。
図3及び4は、画像処理装置10の動作の一例を示すフローチャートである。図3に示す処理は、例えば利用者が画像処理装置10に文書をセットし、操作部15を用いて読み取りの開始を指示する操作を行ったことに応じて開始される。ステップS11において、プロセッサ11は、この操作に応じて、画像読取部13に文書を読み取らせる。これにより、文書を示す文書画像が取得される。図2に示す例では、土地売買契約書が読み取られ、この土地売買契約書を示す文書画像100が取得される。
ステップS12において、プロセッサ11は、ステップS11において得られた文書画像に含まれる文字を認識する。この文字認識には、例えばOCR(Optical character recognition)が用いられる。
ステップS13において、プロセッサ11は、文書画像の対象ページにおいて対象キーを検索する。初期状態においては、対象ページは最初のページであり、対象キーは最初のキーである。ここでは、最初のキーが「(以下、『本件土地』という。)」であるものとする。このキーは、予め登録されている。この場合、最初のページにおいて「(以下、『本件土地』という。)」というキーが検索される。
ステップS14において、プロセッサ11は、ステップS13の検索の結果、対象キーが検出されたか否かを判定する。対象キーが検出されなかった場合には(ステップS14の判定がNO)、ステップS15に進み、プロセッサ11は、対象ページが最後のページであるか否かを判定する。対象ページが最後のページである場合には(ステップS15の判定がYES)、図4に進むステップS21に進む。一方、対象ページが最後のページではない場合には(ステップS15の判定がNO)、ステップS16に進み、プロセッサ11は、次のページを対象ページに設定した後、上述したステップS13に戻る。これにより、次のページについてステップS13からS14の処理が繰り返される。一方、対象キーが検出された場合には(ステップS14の判定がYES)、ステップS17に進む。図2に示す例では、最初のページ110に「(以下、『本件土地』という。)」というキー111が記載されているため、このキー111が検出され、ステップS17に進む。検出されたキー111はメモリ12に記憶される。
ステップS17において、プロセッサ11は、ステップS14において検出された対象キーの周辺範囲において参照文字列を検索する。ここでは、周辺範囲は、対象キーより前にある最も近い読点と対象キーとの間であるものとする。また、参照文字列は、「別紙」を含む文字列であるものとする。ステップS18において、プロセッサ11は、ステップS17の検索の結果、参照文字列が検出されたか否かを判定する。参照文字列が検出されない場合には(ステップS18の判定がNO)、ステップS19に進み、プロセッサ11は、対象キーの周辺範囲からバリューを抽出する。バリューの形式が予め定められている場合には、周辺範囲に含まれる予め定められた形式の情報がバリューとして抽出される。そして、抽出されたバリューは、メモリ12に記憶される。
一方、上述したステップS18において、参照文字列が検出された場合には(ステップS18の判定がYES)、ステップS20に進み、プロセッサ11は、ステップS18において検出された参照文字列が示す参照先から対象キーに対応するバリューを抽出する処理を行う。ここでは、キー111の周辺範囲が、キー111より前にある最も近い読点とキー111との間であるものとする。図2に示す例では、キー111の周辺範囲には、「別紙物件目録の土地」という参照文字列112が記載されている。そのため、上述したステップS18ではこの参照文字列112が検出される。そして、上述したステップS20において、参照文字列112が示す参照先から対象キーに対応するバリューを抽出する処理が行われる。
図5は、ステップS20において行われる参照先からバリューを抽出する処理の一例を示すフローチャートである。ステップS31において、プロセッサ11は、文書画像の各ページからタイトルを検出する。なお、このタイトルの検出は、必ずしも全てのページに対して行われなくてもよく、例えば対象ページより後ろのページに対して行われ、対象ページに対しては行われなくてもよい。このタイトルの検出は、例えばページにおいてタイトルが記載されていると考えられる位置及びタイトルに用いられていると考えられるフォントサイズに基づいて行われる。図2に示す文書画像100では、各ページの上方に、基準のフォントサイズより大きいフォントサイズでタイトルが記載されている。この場合、各ページの上方に記載された基準のフォントサイズより大きいフォントサイズの文字列がタイトルとして検出される。ページ120については、「物件目録」という文字列がタイトル121として検出される。文書画像100に含まれる他のページについても、同様の方法でタイトルが検出される。なお、タイトルが検出されない場合には、ページの一行目に記載された文字列がタイトルとして用いられてもよい。また、上述したステップS12において既にタイトルが検出されている場合には、ステップS31を飛ばしてもよい。
ステップS32において、プロセッサ11は、ステップS31において検出されたタイトルに応じて参照先を特定する。例えば参照文字列112と対応するタイトルを有するページが参照先として特定される。この参照文字列112と対応するタイトルには、参照文字列112の少なくとも一部の文字列を含むタイトル又は参照文字列112と類似するタイトルが含まれてもよい。図2に示す例では、ページ120のタイトル121には、「別紙物件目録の土地」という参照文字列112の一部である「物件目録」という文字列が含まれる。この場合、このタイトル121を有するページ120が参照先として特定される。
ステップS33において、プロセッサ11は、ステップS32において特定された参照先に参照文字列112のパターンが含まれるか否かを判定する。例えば図2に示すページ120に移動し、パターンマッチングを用いて「別紙物件目録の土地」という参照文字列112が検索される。このパターンマッチングには、例えば参照文字列112の正規表現で表される部分文字列、例えば「物件」、「目録」、「土地」等が用いられる。そして、参照先のページ120において参照文字列112の部分文字列が検索され、この検索の結果、参照文字列112の部分文字列が検出された場合には、ページ120において参照文字列112のパターンが含まれると判定され(ステップS33の判定がYES)、ステップS34に進む。
ステップS34において、プロセッサ11は、ステップS32において特定された参照先において、参照文字列112のパターンの周辺範囲からバリューを抽出する。バリューの形式が予め定められている場合には、周辺範囲に含まれる予め定められた形式の情報がバリューとして抽出される。そして、抽出されたバリューは、メモリ12に記憶される。
一方、図2に示す例では、ページ120の本文(タイトル121を除く)には「物件」、「目録」、「土地」等の参照文字列112のパターンは含まれていない(ステップS33の判定がNO)。この場合、ステップS35に進む。ステップS35において、プロセッサ11は、対象キーに関連文字列が関連付けられているか否かを判定する。例えば対象キーと関連文字列とを関連付ける関連辞書130が記憶部14に記憶されている場合、対象キーに対応する関連辞書130があると判定され(ステップS35の判定がYES)、ステップS39に進む。
図6は、関連辞書130の一例を示す図である。関連辞書130には、キーと、関連文字列とが含まれる。各キーに対して、1又は複数の関連文字列が関連付けられている。図6に示す例では、「(以下、『本件土地』という。)」というキー111に対して、「所在」という文字列122と、「地番」という文字列123と、「地目」という文字列124と、「地積」という文字列125とが関連付けられている。キーと関連文字列との関連付けは、例えば利用者又は管理者の操作により行われる。或いは、辞書を用いてキーの下位概念の用語を抽出し、抽出した用語が関連文字列としてキーに関連付けられてもよい。この場合、キーの下位概念の用語の中から利用者の操作に応じて選択された用語だけが、関連文字列としてキーに関連付けられてもよい。
ステップS39において、プロセッサ11は、関連辞書130を用いて、ステップS32において特定された参照先において関連文字列を検索する。図2に示す例では、まず参照先のページ120に移動される。図6に示す関連辞書130においては、「(以下、『本件土地』という。)」というキー111に対して、「所在」、「地番」、「地目」、「地積」という文字列122〜125が関連文字列として関連付けられている。この場合、関連辞書130からこれらの文字列122〜125が関連文字列として取得される。そして、参照先のページ120において、これらの文字列122〜125が検索される。
ステップS40において、プロセッサ11は、ステップS39の検索の結果、関連文字列が検出されたか否かを判定する。関連文字列が検出されなかった場合には(ステップS40の判定がNO)、ステップS41に進み、プロセッサ11は、参照先が最後のページであるか否かを判定する。参照先が最後のページである場合には(ステップS41の判定がYES)、図5に示すステップS21に進む。一方、参照先が最後のページではない場合には(ステップS41の判定がNO)、ステップS42に進み、プロセッサ11は次のページを参照先に設定した後、上述したステップS39に戻る。これにより、次のページについてステップS39からS40の処理が繰り返される。一方、上述したステップS40において、関連文字列が検出された場合には(ステップS40の判定がYES)、ステップS43に進む。図2に示す例では、ページ120には関連文字列である文字列122〜125が記載されているため、これらの文字列122〜125が検出される。そして、ステップS43に進む。
ステップS43において、プロセッサ11は、ステップS40において検出された関連文字列の周辺範囲からバリューを抽出する。ここでは、周辺範囲は、関連文字列の位置から左右方向に延びる定められた距離以下の大きさの領域であるものとする。なお、周辺範囲の延びる方向及び距離は関連文字列によって異なっていてもよい。バリューの形式が予め定められている場合には、周辺範囲に含まれる予め定められた形式の情報がバリューとして抽出される。図2に示す例では、ページ120に記載された「所在」という文字列122の周辺範囲から「横浜市西区みなとみらい〇〇丁目」という情報126が抽出される。また、ページ120に記載された「地番」という文字列123の周辺範囲から「××××番」という情報127が抽出される。さらに、ページ120に記載された「地目」という文字列124の周辺範囲から「宅地」という情報128が抽出される。さらに、ページ120に記載された「地積」という文字列125の周辺範囲から「80・21平方メートル」という情報129が抽出される。抽出された情報126〜129は、キー111に対するバリューとしてメモリ12に記憶される。
一方、上述したステップS35において、例えば関連辞書130が記憶部14に記憶されていない場合には、対象キーに関連文字列が関連付けられていないと判定され(ステップS35の判定がNO)、ステップS36に進む。ステップS36において、プロセッサ11は、ステップS32において特定された参照先から文字列を抽出する。このとき、ページ120に含まれる全ての文字列が抽出されてもよいし、予め定められた条件に従ってページ120に含まれる一部の文字列だけが抽出されてもよい。また、文字列とともに、その文字列の周辺範囲にある情報が抽出されてもよい。
予め定められた条件は、例えば対象キーに対して予め定められた文字列であることを示す条件であってもよい。この場合、ページ120に含まれる文字列のうち対象キーに対して予め定められた文字列だけが抽出される。他の例において、予め定められた条件は、対象キーの下位概念の文字列であることを示す条件であってもよい。この場合、ページ120に含まれる文字列のうち対象キーの下位概念の文字列だけが抽出される。この下位概念の文字列は、例えば辞書を用いて特定されてもよい。他の例において、予め定められた条件は、名詞の文字列であることを示す条件であってもよい。この場合、例えばページ120に含まれる文書を解析することにより、ページ120に含まれる文字列のうち名詞の文字列だけが抽出される。この文書の解析には、例えば形態素解析が用いられてもよい。他の例において、予め定められた条件は、ページ120に表が含まれる場合には、表の定められた列又は行に記載の文字列を示す条件であってもよい。この場合、ページ120に含まれる文字列のうち表の定められた列又は行に記載の文字列だけが抽出される。図2に示す例では、ページ120から「所在」、「地番」、「地目」、「地積」を含む文字列が抽出される。
ステップS37において、プロセッサ11は、ステップS36において抽出された文字列の中から関連文字列を選択する操作に用いられる選択画面135を表示部16に表示させる。図7は、選択画面135の一例を示す図である。選択画面135には、ステップS36において抽出された「所在」、「地番」、「地目」、「地積」という文字列122〜125と、それらの文字列122〜125の周辺範囲にある「横浜市西区みなとみらい〇〇丁目」、「××××番」、「宅地」、「80・21平方メートル」という情報126〜129とが含まれる。利用者は、操作部15を用いて、これらの文字列122〜125の中からキー111に対応する関連文字列を選択する操作を行う。例えば「所在」、「地番」、「地目」、「地積」という文字列122〜125の周辺範囲にある情報126〜129をキー111に対するバリューとして使用したい場合、利用者は、操作部15を用いてこれらの文字列122〜125を選択する操作を行った後、「OK」ボタン136を押す操作を行う。これにより、これらの文字列122〜125が関連文字列として選択される。なお、選択画面135においては、利用者の操作に応じてステップS36において抽出された文字列以外の文字列が追加され、選択されてもよい。
ステップS38において、プロセッサ11は、選択画面135において利用者の操作により選択された関連文字列を用いて関連辞書130を作成する。例えば「所在」、「地番」、「地目」、「地積」という文字列122〜125が選択された場合には、図6に示されるように、「(以下、「本件土地」という。)」というキー111と、「所在」、「地番」、「地目」、「地積」という文字列122〜125とが関連付けられた関連辞書130が作成される。このようにして作成された関連辞書130は、記憶部14に記憶される。この場合、ステップS39では、ステップS38において作成された関連辞書130を用いて、参照先において関連文字列が検索される。
参照先からバリューを抽出する処理が終了すると、図4に示すステップS21に進み、プロセッサ11は、全てのキーに対応するバリューが抽出されたか否かを判定する。全てのキーに対応するバリューが抽出されていない場合には(ステップS21の判定がNO)、ステップS22に進み、プロセッサ11は次のキーを対象キーに設定した後、図3に示すステップS13に戻る。これにより、次のキーについて上述したステップS13からS21の処理が繰り返される。一方、全てのキーに対応するバリューが抽出された場合には(ステップS21の判定がYES)、ステップS23に進む。
ステップS23において、プロセッサ11は、複数のバリューが抽出されたキーが存在するか否かを判定する。例えば全てのキーに対してバリューが1つずつ抽出された場合には(ステップS23の判定がNO)、ステップS26に進む。一方、少なくとも1のキーに対して複数のバリューが抽出された場合には(ステップS23の判定がYES)、ステップS24に進む。図2に示す例では、キー111に対して情報126〜129がバリューとして抽出されるため、ステップS24に進む。
ステップS24において、プロセッサ11は、複数のバリューの中から所望のバリューを選択する操作に用いられる選択画面140を表示部16に表示させる。図8は、選択画面140の一例を示す図である。この選択画面140には、図2に示すキー111に対して抽出されたバリューである「横浜市西区みなとみらい〇〇丁目」という情報126と、「××××番」という情報127と、「宅地」という情報128と、「80・21平方メートル」という情報129とが含まれる。例えばこれらの情報126〜129のうち情報126、128、及び129を選択する場合、利用者は、これらの情報126、128、及び129を選択する操作を行った後、「OK」ボタン141を押す操作を行う。なお、利用者は必ずしも情報126〜129の一部を選択する必要はなく、情報126〜129を全て選択してもよい。
ステップS25において、プロセッサ11は、利用者の操作に従って複数のバリューの中からバリューを選択する。例えば図8に示すように情報126、128、及び129を選択する操作が行われた場合には、これらの情報126、128、及び129が選択される。この場合、情報126、128、及び129はキー111に対するバリューとして用いられるが、情報127はキー111に対するバリューとして用いられない。
ステップS26において、プロセッサ11は、各キーとステップS19、S34、又はS43において抽出されたバリューとの組を記憶部14に記憶させる。図8に示す例では、「(以下、「本件土地」という。)」というキー111と、「横浜市西区みなとみらい〇〇丁目」という情報126と、「宅地」という情報128と、「80・21平方メートル」という情報129との組が記憶される。この組には、情報126、128、129と関連付けて「所在」、「地目」、「地積」という文字列122、124、125が含まれてもよい。また、このキーとバリューとの組が属性情報として文書画像100に付加されてもよい。ステップS26の後、この処理は終了する。
以上説明した実施形態によれば、キーの周辺範囲にバリューが存在せず、キーの関連文字列の周辺範囲にバリューが存在する場合には、この関連文字列の周辺範囲からバリューが抽出されるため、このような場合にも、キーに対するバリューを抽出できる。また、参照先にキー、参照文字列、又はそれらの部分文字列が含まれない場合にも、キーに対するバリューを抽出できる。さらに、キーの周辺範囲に参照先を示す参照文字列が存在する場合には、参照先においてキーに対するバリューが抽出されるため、このような場合にもバリューを抽出できる。この場合において、参照先に移動して参照先において関連文字列が検索されるため、文書画像全体を対象に関連文字列を検索する場合に比べて、関連文字列を迅速に検出でき、関連文字列の検出精度も向上する。さらに、予めキーに関連文字列が関連付けられていない場合には、関連辞書130が作成され、関連辞書130を用いて関連文字列の周辺範囲にあるバリューが抽出されるため、このような場合でも、関連文字列の位置を基準とする領域にあるバリューを抽出できる。さらに、関連辞書130が作成される際に、参照先に含まれる文字列の中から利用者の操作により選択された文字列だけが関連文字列として関連辞書130に含まれるため、参照先に含まれる文字列であっても利用者が所望しない文字列については関連文字列から除外できる。さらに、一のキーに対して複数の関連文字列を関連付けられている場合には、複数のバリューが抽出されるため、一のキーに対して複数のバリューが存在する場合にも、これらのバリューを抽出できる。
3.変形例
上述した実施形態は、本発明の一例である。本発明は、上述した実施形態に限定されない。また、上述した実施形態が以下の例のように変形して実施されてもよい。このとき、以下の2以上の変形例が組み合わせて用いられてもよい。
上述した実施形態において、上述したステップS25においてバリューが選択された場合、キーに関連付けられた関連文字列のうち、選択されたバリューに対応する関連文字列以外の関連文字列については、キーとの関連付けが解除されてもよい。例えば図8に示されるように、「××××番」という情報127が選択されなかった場合には、図6に示される関連辞書130において、この情報127に対応する「地番」という文字列123と、キー111との関連付けが解除されてもよい。この場合、次回からは、キー111に対するバリューを抽出する際に、「地番」という文字列123が関連文字列として使用されなくなるため、キー111に対するバリューとして「××××番」という情報127が抽出されなくなる。この変形例によれば、利用者が所望しないバリューについては、次回から抽出されないようにすることができる。
上述した実施形態において、プロセッサ11は、属性情報を取得し、この属性情報によってキーと関連付けられた異なる関連文字列を取得してもよい。この属性情報には、例えば文書の種別、文書の内容、利用者の識別子、又は利用者が属する組織の識別子が含まれる。文書の種別には、例えば契約書や注文書が含まれる。文署の種別は、例えば利用者の操作により入力される。例えば文書の種別が契約書である場合と注文書である場合とで、異なる関連文字列が取得されてもよい。文書の内容には、例えば派遣委託契約を対象とした内容と売買契約を対象とした内容とが含まれる。文書の内容は、例えば利用者の操作により入力される。或いは、文書の内容は、文書の内容を解析することにより判定されてもよい。例えば文書の内容が派遣委託契約を対象とした内容である場合と売買契約を対象とした内容である場合とで、異なる関連文字列が取得されてもよい。利用者の識別子には、例えばユーザIDが含まれる。利用者の識別子は、例えば利用者の操作により入力される。例えばライセンスに関する業務を行う利用者と派遣委託契約に関する業務を行う利用者とで異なる関連文字列が取得されてもよい。利用者の属する組織の識別子には、例えば部門IDが含まれる。組織の識別子は、例えば利用者の操作により入力された利用者の識別子を用いて、利用者の識別子と利用者が属する組織の識別子とが関連付けられたデータベースから取得されてもよい。例えばライセンスに関する業務を行う部門に属する利用者と派遣委託契約に関する業務を行う部門に属する利用者とで異なる関連文字列が取得されてもよい。属性情報によって異なる関連文字列を取得する方法としては、例えば属性情報毎に異なる関連辞書130が作成され、属性情報に対応する関連辞書130から関連文字列が取得されてもよい。或いは、関連辞書130において属性情報と対応する関連文字列とが関連付けられており、属性情報に関連付けられた関連文字列が取得されてもよい。この変形例によれば、属性情報によって異なるバリューを抽出できる。また、文書の種別、文書の内容、利用者、又は利用者が属する組織によって異なるバリューを抽出できる。
上述した実施形態において、必ずしも参照先への移動が行われなくてもよい。例えば文書画像100全体を対象に関連文字列が検索されてもよい。このような方法であっても、関連文字列の周辺範囲からキーに対するバリューを抽出できる。
上述した実施形態において、関連辞書130には優先順位が含まれてもよい。例えば関連文字列には、「住所」と「所在」のように互いに類似する文字列が含まれる場合がある。この場合、例えば「住所」という文字列に「1」という優先順位が付与され、「所在」という文字列に「1」より低い「2」という優先順位が付与されてもよい。この場合、「住所」という文字列の周辺範囲にある情報はバリューとして抽出されるが、「所在」という文字列の周辺範囲にある情報はバリューとして抽出されない。
上述した実施形態において、関連辞書130は常に使用されなくてもよい。例えば利用者の操作により、関連辞書130を使用するか否かが選択されてもよい。
上述した実施形態において、「(以下、『本件土地』という。)」というキー111そのものに関連付けられた関連文字列は存在しないが、キー111の部分文字列に関連付けられた関連文字列が存在する場合には、キー111の部分文字列に関連付けられた関連文字列を用いてキー111に対するバリューが抽出されてもよい。
上述した実施形態において、対象キーワードや参照文字列、関連文字列を検索する際にも、パターンマッチングが用いられてもよい。例えばパターンマッチングを用いて関連文字列が検索される場合には、参照先に関連文字列の一部しか記載されていない場合であっても、関連文字列が検出される。
上述した実施形態において、キーとバリューとは必ずしも異なるページに記載されていなくてもよい。例えば単一のページにおいてキーから離れた箇所に関連文字列及びバリューが記載されていてもよい。例えばキーと関連文字列及びバリューとは、単一のページにおいて異なる行、段落、又は章に記載されていてもよい。この場合、例えば対象ページにおいて対象キーの周辺範囲において参照文字列が検出されなかった場合に(ステップS18の判定がNO)、対象ページにおいて対象キーの関連文字列が検索され、その関連文字列の周辺範囲からバリューが抽出されてもよい。
上述した実施形態において、キー及びバリューは上述した例に限定されない。例えばバリューは、契約の対象となる建物を特定し得る情報であり、キーは、このバリューの目印となる文字列であってもよい。すなわち、バリューは、文書に記載された情報であれば、どのような情報であってもよい。また、キーは、バリューの目印となる文字列であればどのような文字列であってもよい。
上述した実施形態において、画像処理装置10の機能の一部を外部装置が備えていてもよい。例えば画像処理装置10と通信回線を介して接続されたサーバ装置が文書画像に含まれる文字を認識する処理を行ってもよい。
上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU:Central Processing Unit等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、ASIC:Application Specific Integrated Circuit、FPGA:Field Programmable Gate Array、プログラマブル論理デバイス等)を含むものである。
また上記実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
本発明は、画像処理装置10において実行されるプログラムとして提供されてもよい。画像処理装置10は、本発明に係るコンピュータの一例である。このプログラムは、インターネットなどの通信回線を介してダウンロードされてもよいし、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどの、コンピュータが読取可能な記録媒体に記録した状態で提供されてもよい。
10:画像処理装置、11:プロセッサ、12:メモリ、13:画像読取部、14:記憶部、15:操作部、16:表示部

Claims (9)

  1. プロセッサを備え、
    前記プロセッサは、
    文書を示す文書画像を取得し、
    前記文書画像に含まれる対象文字列に関連付けられた関連文字列を取得し、
    前記文書画像において前記関連文字列の位置を基準とする領域から、前記対象文字列に対する対象情報を抽出する
    ことを特徴とする情報処理装置。
  2. 前記プロセッサは、前記文書画像において前記対象文字列の位置を基準とした領域に参照先を示す参照文字列が含まれる場合には、前記参照先において前記関連文字列の位置を基準とする領域から前記対象情報を抽出する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記プロセッサは、前記対象文字列と前記関連文字列とが関連付けられていない場合には、前記参照先に含まれる文字列を前記関連文字列として前記対象文字列に関連付ける
    ことを特徴とする請求項2に記載の情報処理装置。
  4. 前記プロセッサは、前記対象文字列に前記関連文字列が関連付けられていない場合には、前記参照先に含まれる少なくとも一の文字列から利用者の操作により選択された文字列を前記関連文字列として前記対象文字列に関連付ける
    ことを特徴とする請求項3に記載の情報処理装置。
  5. 前記プロセッサは、
    前記対象文字列に関連付けられた複数の関連文字列を取得し、
    前記複数の関連文字列の位置を基準とした複数の領域から、前記対象文字列に対する複数の対象情報を抽出する
    ことを特徴とする請求項1に記載の情報処理装置。
  6. 前記プロセッサは、
    前記複数の領域に含まれる前記複数の対象情報のうち利用者の操作により選択された対象情報を抽出し、
    前記複数の関連文字列のうち、前記選択された対象情報に対応する関連文字列以外の関連文字列と前記対象文字列との関連付けを解除する
    ことを特徴とする請求項5に記載の情報処理装置。
  7. 前記対象文字列には複数の関連文字列が関連付けられており、
    前記プロセッサは、
    属性情報を取得し、
    前記属性情報によって前記対象文字列と関連付けられた異なる関連文字列を取得する
    ことを特徴とする請求項1に記載の情報処理装置。
  8. 前記属性情報は、前記文書の種別、前記文書の内容、利用者の識別子、又は前記利用者が属する組織の識別子を含む
    ことを特徴とする請求項7に記載の情報処理装置。
  9. コンピュータに、
    文書を示す文書画像を取得するステップと、
    前記文書画像に含まれる対象文字列に関連付けられた関連文字列を取得するステップと、
    前記文書画像に含まれる前記関連文字列の位置を基準とする領域から、前記対象文字列に対応する対象情報を抽出するステップと
    を実行させるためのプログラム。
JP2020050658A 2020-03-23 2020-03-23 情報処理装置及びプログラム Pending JP2021149741A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020050658A JP2021149741A (ja) 2020-03-23 2020-03-23 情報処理装置及びプログラム
US16/933,957 US11995908B2 (en) 2020-03-23 2020-07-20 Information processing device and non-transitory computer readable medium
CN202010909651.8A CN113438379A (zh) 2020-03-23 2020-09-02 信息处理装置以及记录媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020050658A JP2021149741A (ja) 2020-03-23 2020-03-23 情報処理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2021149741A true JP2021149741A (ja) 2021-09-27

Family

ID=77748186

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020050658A Pending JP2021149741A (ja) 2020-03-23 2020-03-23 情報処理装置及びプログラム

Country Status (3)

Country Link
US (1) US11995908B2 (ja)
JP (1) JP2021149741A (ja)
CN (1) CN113438379A (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5523945A (en) * 1993-09-17 1996-06-04 Nec Corporation Related information presentation method in document processing system
JP3940491B2 (ja) 1998-02-27 2007-07-04 株式会社東芝 文書処理装置および文書処理方法
JP6878034B2 (ja) 2017-02-10 2021-05-26 キヤノン株式会社 情報処理装置、制御方法、およびプログラム
JP2019204399A (ja) 2018-05-25 2019-11-28 富士ゼロックス株式会社 情報処理装置及びプログラム
US10867171B1 (en) * 2018-10-22 2020-12-15 Omniscience Corporation Systems and methods for machine learning based content extraction from document images
JP2021043478A (ja) * 2019-09-06 2021-03-18 キヤノン株式会社 情報処理装置、その制御方法及びプログラム

Also Published As

Publication number Publication date
CN113438379A (zh) 2021-09-24
US20210295032A1 (en) 2021-09-23
US11995908B2 (en) 2024-05-28

Similar Documents

Publication Publication Date Title
JP3694149B2 (ja) 画像検索装置、画像検索用キーテキストの生成方法、並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
US20070171473A1 (en) Information processing apparatus, Information processing method, and computer program product
JP6826293B2 (ja) 情報処理システムと、その処理方法及びプログラム
US20090183115A1 (en) Document searching apparatus, document searching method, and computer-readable recording medium
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
JP2007317034A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
US20150169510A1 (en) Method and system of extracting structured data from a document
JP2015187846A (ja) 文書処理システム、及び文書処理装置
JP2021149741A (ja) 情報処理装置及びプログラム
JP4518212B2 (ja) 画像処理装置及びプログラム
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2021140831A (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
CN113111881A (zh) 信息处理装置及记录媒体
JP2007034924A (ja) ネットワークシステム
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JP6303742B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JPS62106574A (ja) 文書画像フアイル登録検索方式
JP6028905B2 (ja) 帳票管理装置及び帳票管理方法並びに帳票管理プログラム
JPH10162024A (ja) 電子ファイリング方法及び電子ファイリング装置
JP4391157B2 (ja) 文書処理装置、文書処理方法、文書処理プログラム、および記録媒体
JP7377565B2 (ja) 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム
JP2021051364A (ja) 情報処理装置及びプログラム
JP7504674B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP7314627B2 (ja) 制御装置、画像形成装置、制御方法および制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240523