JP2012198684A - Information processing device, business form type estimation method, and business form type estimation program - Google Patents
Information processing device, business form type estimation method, and business form type estimation program Download PDFInfo
- Publication number
- JP2012198684A JP2012198684A JP2011061567A JP2011061567A JP2012198684A JP 2012198684 A JP2012198684 A JP 2012198684A JP 2011061567 A JP2011061567 A JP 2011061567A JP 2011061567 A JP2011061567 A JP 2011061567A JP 2012198684 A JP2012198684 A JP 2012198684A
- Authority
- JP
- Japan
- Prior art keywords
- feature data
- feature
- processing target
- image data
- form type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、帳票種別を推定するための情報処理装置、方法およびプログラムに関する。 The present invention relates to an information processing apparatus, method, and program for estimating a form type.
従来、入力画像データを取得するデータ取得部と、登録画像データまたは登録画像の特徴量を記憶したメモリと、上記入力画像データが上記登録画像に対応する画像データであるか否かの判定処理を行う類似度判定処理部とを備えた画像処理装置であって、類似度判定処理部は、入力画像データの付帯情報に応じて判定処理の処理内容を変更する画像処理装置がある(特許文献1を参照)。 Conventionally, a data acquisition unit that acquires input image data, a memory that stores registered image data or a feature amount of a registered image, and a determination process that determines whether the input image data is image data corresponding to the registered image There is an image processing apparatus including a similarity determination processing unit to perform, and the similarity determination processing unit includes an image processing apparatus that changes processing contents of determination processing according to incidental information of input image data (Patent Document 1). See).
また、文書タイプ識別処理部が登録画像の文書タイプの属性(帳票、図面など)を識別し、その属性を画像情報DBに登録し、登録画像を画像DBに登録する画像処理装置であって、文書検索時には、文書タイプにより分類された表示画面を作成して表示デバイスに表示し、ユーザは入力デバイスを使用して表示画面上から「帳票」などのカテゴリを選択し、選択された「帳票」のサムネイル一覧が表示される画像処理装置がある(特許文献2を参照)。その他、帳票等から得られた画像を処理するための技術が種々提案されている(特許文献3から6を参照)。
The document type identification processing unit is an image processing apparatus that identifies a document type attribute (form, drawing, etc.) of a registered image, registers the attribute in the image information DB, and registers the registered image in the image DB. When searching for a document, a display screen classified according to the document type is created and displayed on the display device. The user selects a category such as “form” on the display screen using the input device, and the selected “form” is selected. There is an image processing apparatus that displays a list of thumbnails (see Patent Document 2). In addition, various techniques for processing an image obtained from a form or the like have been proposed (see
従来、スキャナ等を用いて、紙媒体として発生した帳票の画像データを生成して帳票の種別を識別し、OCR(Optical Character Recognition)処理を行う技術がある。このような技術では、帳票の種別を識別し、OCR処理を行うために、全ての帳票の種別について、帳票種別毎に予め書式定義(帳票定義)を作成しておく必要があった。 Conventionally, there is a technique of generating image data of a form generated as a paper medium using a scanner or the like, identifying the type of the form, and performing OCR (Optical Character Recognition) processing. In such a technique, in order to identify a form type and perform OCR processing, it is necessary to create a format definition (form definition) for each form type in advance for all form types.
しかし、このような書式定義の作成は難しく、書式定義を予め作成するには、帳票種別の識別サービスの利用者または提供者に手間をかけるものであった。 However, it is difficult to create such a format definition. To create a format definition in advance, it takes time and effort for the user or provider of the form type identification service.
本発明は、上記した問題に鑑み、予め書式定義を作成することなく、帳票種別を推定することを課題とする。 In view of the above-described problems, an object of the present invention is to estimate a form type without creating a format definition in advance.
本発明では、上記課題を解決するために、以下の手段を採用した。即ち、本発明は、帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する特徴データ蓄積手段に接続される情報処理装置であって、処理対象帳票の画像データを取得する画像データ取得手段と、前記画像データから、前記処理対象帳票に係る特徴データを取得する特徴データ取得手段と、前記特徴データ蓄積手段に蓄積されている特徴データから、前記処理対象帳票に
係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定手段と、前記推定手段によって前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加手段と、を備える情報処理装置である。
The present invention employs the following means in order to solve the above-described problems. That is, the present invention is an information processing apparatus connected to feature data storage means for storing feature data relating to appearance characteristics of a form for each form type, and image data for acquiring image data of a processing target form The feature data acquisition means for acquiring the feature data related to the processing target form from the image data, and the feature data stored in the feature data storage means match the feature data related to the processing target form Or, by specifying similar feature data, an estimation unit that estimates a form type of the processing target form, and a case where the form type of the processing target form is not estimated by the estimation unit, An information processing apparatus comprising: feature data adding means for adding feature data to the feature data storage means.
ここで、帳票種別とは、帳票の外観から区別可能な帳票の種類である。特徴データ蓄積手段は、このような帳票種別を推定可能とするために、帳票の外観上の特徴に係る特徴データを、帳票種別毎に蓄積する。特徴データ蓄積手段によって蓄積され、または特徴データ取得手段によって取得される特徴データとしては、例えば、罫線、罫線の数、特徴点、特徴点の数、色情報(色具合)、およびこれらに関連する画像の特徴量が含まれてよい。また、特徴データは、帳票の外観に基づいて取得可能な情報であればよく、先述の具体例に限定されない。 Here, the form type is a form type that can be distinguished from the appearance of the form. The feature data accumulating unit accumulates the feature data related to the appearance characteristics of the form for each form type so that the form type can be estimated. The feature data stored by the feature data storage unit or acquired by the feature data acquisition unit includes, for example, ruled lines, the number of ruled lines, feature points, the number of feature points, color information (color condition), and the like. Image feature quantities may be included. The feature data may be any information that can be acquired based on the appearance of the form, and is not limited to the specific example described above.
本発明によれば、推定手段によって、処理対象帳票の帳票種別が推定され、帳票種別の推定に失敗した場合、特徴データ追加手段によって、処理対象帳票に係る特徴データが特徴データ蓄積手段に追加されることで、帳票種別の推定、および学習が可能となる。 According to the present invention, when the form type of the processing target form is estimated by the estimation unit and the estimation of the form type fails, the feature data related to the processing target form is added to the feature data storage unit by the feature data addition unit. This makes it possible to estimate and learn the form type.
また、前記特徴データ追加手段は、前記推定手段によって前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを、新たな帳票種別に係る特徴データとして前記特徴データ蓄積手段に追加してもよい。 Further, the feature data adding means, when the form type of the processing target form is not estimated by the estimating means, the feature data related to the processing target form as the feature data related to a new form type. You may add to a storage means.
帳票種別の推定に失敗した場合に、処理対象帳票に係る特徴データを、新たな帳票種別に係る特徴データとして特徴データ蓄積手段に追加することで、以後の帳票種別推定において、学習された帳票データを用いることが可能となる。 When the form type estimation fails, the feature data related to the processing target form is added to the feature data storage means as the feature data related to the new form type, so that the form data learned in the subsequent form type estimation Can be used.
また、前記情報処理装置は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる所定のパラメータが、前記画像データから取得された所定のパラメータを基準とする所定の範囲内にある1または複数の特徴データを抽出する抽出手段を更に備え、前記推定手段は、前記抽出手段によって抽出された特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定してもよい。 In addition, the information processing apparatus has a predetermined range in which the predetermined parameter included in the feature data is based on the predetermined parameter acquired from the image data from the feature data stored in the feature data storage unit. Extraction means for extracting one or a plurality of feature data included therein, and the estimation means extracts feature data that matches or is similar to the feature data related to the processing target form from the feature data extracted by the extraction means. By specifying, the form type of the processing target form may be estimated.
即ち、抽出手段によって第一段階の絞り込みが行われ、推定手段によって第二段階の絞り込みが行われる。この際、何れかの段階における絞り込み手法を、他の段階における絞り込み手法に比べて負荷の軽いものとすることで、帳票種別推定に係る全体の負荷を軽減し、処理を高速化することが出来る。特に、絞り込みの対象となる母数が大きい第一段階の絞り込みにおいて、インデックス検索等の比較的負荷の軽い絞り込み手法を採用し、第二段階の絞り込みにおいて、最近傍探索等の比較的正確性の高い絞り込み手法を採用することで、処理速度を損なうことなく、正確性の高い帳票種別推定を行うことが可能となる。なお、絞り込み処理のステージは、二段階に限定されない。絞り込み処理は、三段階以上のステージに分割されて実行されてもよい。 That is, the first stage of narrowing is performed by the extracting means, and the second stage of narrowing is performed by the estimating means. At this time, by making the narrowing-down method at any stage lighter than the narrowing-down technique at other stages, it is possible to reduce the overall load related to form type estimation and to speed up the processing. . In particular, in the first-stage narrowing with a large parameter to be narrowed down, a relatively light-weight narrowing-down method such as index search is adopted, and in the second-stage narrowing down, the nearest neighbor search or the like is relatively accurate. By adopting a high narrowing-down method, it is possible to estimate the form type with high accuracy without impairing the processing speed. Note that the stage of the narrowing process is not limited to two stages. The narrowing-down process may be executed by being divided into three or more stages.
また、前記所定のパラメータは、前記画像データから取得された特徴点の数を特定可能な情報を含み、前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる特徴点の数が、前記画像データから取得された特徴点の数を基準とする所定の範囲内にある1または複数の特徴データを抽出してもよい。 The predetermined parameter includes information capable of specifying the number of feature points acquired from the image data, and the extraction unit converts the feature data stored in the feature data storage unit into the feature data. One or a plurality of feature data in which the number of feature points included is within a predetermined range based on the number of feature points acquired from the image data may be extracted.
また、前記所定のパラメータは、前記画像データから取得された罫線の数を特定可能な情報を含み、前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる罫線の数が、前記画像データから取得された罫線の数を基準と
する所定の範囲内にある1または複数の特徴データを抽出してもよい。
The predetermined parameter includes information capable of specifying the number of ruled lines acquired from the image data, and the extraction unit includes the feature data stored in the feature data storage unit. One or more feature data may be extracted in which the number of ruled lines is within a predetermined range based on the number of ruled lines acquired from the image data.
ここで、所定のパラメータは、特徴点の数または罫線の数を特定可能な情報を含んでいればよい。即ち、所定のパラメータは、特徴点の数または罫線の数そのものであってもよいし、取得された特徴点または罫線毎の情報であってもよい。所定のパラメータが、取得された特徴点または罫線毎の情報である場合には、この特徴点または罫線毎の情報の数をカウントすることによって、特徴点の数または罫線の数を特定することが出来る。 Here, the predetermined parameter only needs to include information capable of specifying the number of feature points or the number of ruled lines. That is, the predetermined parameter may be the number of feature points or the number of ruled lines themselves, or may be information for each acquired feature point or ruled line. When the predetermined parameter is information for each acquired feature point or ruled line, the number of feature points or the number of ruled lines can be specified by counting the number of information for each feature point or ruled line. I can do it.
また、前記所定のパラメータは、前記画像データから取得された色具合を特定可能な情報を含み、前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる色具合が、前記画像データから取得された色具合を基準とする所定の範囲内にある1または複数の特徴データを抽出してもよい。 The predetermined parameter includes information capable of specifying a color condition acquired from the image data, and the extraction unit is included in the feature data from the feature data stored in the feature data storage unit. One or a plurality of feature data whose color condition is within a predetermined range based on the color condition acquired from the image data may be extracted.
ここで、色具合とは、画像データに基づいて取得された、該画像データの色に関する傾向を示す情報である。色具合としては、例えば、RGBカラーヒストグラムを用いることが出来る。 Here, the color condition is information indicating a tendency regarding the color of the image data acquired based on the image data. As the color condition, for example, an RGB color histogram can be used.
また、前記特徴データは、前記画像データから算出された特徴量を含み、前記推定手段は、前記抽出手段によって抽出された特徴データに含まれる特徴量に対して、前記画像データから取得された特徴量を用いた最近傍探索を行うことで、該抽出された特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定し、該処理対象帳票の帳票種別を推定してもよい。 The feature data includes a feature amount calculated from the image data, and the estimation unit obtains a feature amount acquired from the image data with respect to a feature amount included in the feature data extracted by the extraction unit. By performing nearest neighbor search using a quantity, the feature data that matches or resembles the feature data related to the processing target form is identified from the extracted feature data, and the form type of the processing target form is estimated. Also good.
また、本発明は、コンピュータによって実行される方法、またはコンピュータに実行させるプログラムとしても把握することが可能である。また、本発明は、そのようなプログラムをコンピュータその他の装置、機械等が読み取り可能な記録媒体に記録したものでもよい。ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。 The present invention can also be understood as a method executed by a computer or a program executed by the computer. Further, the present invention may be a program in which such a program is recorded on a recording medium readable by a computer, other devices, machines, or the like. Here, a computer-readable recording medium is a recording medium that stores information such as data and programs by electrical, magnetic, optical, mechanical, or chemical action and can be read from a computer or the like. Say.
本発明によれば、予め書式定義を作成することなく、帳票種別を推定することが可能となる。 According to the present invention, it is possible to estimate a form type without creating a format definition in advance.
以下、本発明に係る情報処理装置の実施の形態について、図面に基づいて説明する。なお、以下に説明する実施の形態は、本発明を実施する一例を示すものであって、本発明を以下に説明する具体的構成に限定するものではない。本発明を実施するにあたっては、実施の形態に応じた具体的構成が適宜採用されることが好ましい。 Embodiments of an information processing apparatus according to the present invention will be described below with reference to the drawings. The embodiment described below shows an example for carrying out the present invention, and the present invention is not limited to the specific configuration described below. In practicing the present invention, it is preferable to adopt a specific configuration according to the embodiment as appropriate.
本実施形態において、本発明に係る情報処理装置は、帳票種別検索システム100において帳票種別検索サービスを提供するアプリケーションサーバ1として実施される。但し、本発明の適用対象は、帳票種別を推定するための情報処理装置であればよく、アプリケーションサーバ1に限定されない。たとえば、情報処理装置は、ユーザ端末9として実施されてもよいし、所謂クラウド等として実施されてもよい。
In the present embodiment, the information processing apparatus according to the present invention is implemented as the
<帳票種別検索システムの構成>
図1は、本実施形態に係る帳票種別検索システム100の構成の概略を示す図である。帳票種別検索システム100は、ユーザ端末9とのインターフェースを提供するためのWebサーバ2と、帳票種別検索サービスを提供するためのアプリケーションサーバ1と、特徴データや画像データ等の各種情報が蓄積されるデータベース3(特徴データベース31および画像データベース32)と、が互いに接続されたシステムである。
<Configuration of form type search system>
FIG. 1 is a diagram showing an outline of the configuration of a form
Webサーバ2は、ユーザ端末9に対して帳票種別検索サービスのためのインターフェースを提供するためのサーバである。本実施形態に係る帳票種別検索システム100において、ユーザは、スキャナ等を用いて作成した帳票の画像データを、Webサーバ2に対して送信する。但し、帳票が初めから画像データとして業務において用いられている場合には、ユーザは、紙媒体のスキャンを行う必要はない。Webサーバ2は、ユーザ端末9から送信された画像データを受け付け、アプリケーションサーバ1に対して送信する。
The
アプリケーションサーバ1は、Webサーバ2を介して、ユーザ端末9から送信された画像データを受信し、後述する帳票種別識別・学習処理を実行する。アプリケーションサーバ1によって帳票種別識別・学習処理が実行されることで、ユーザ端末9から送信された画像データに係る帳票の帳票種別が推定される。そして、アプリケーションサーバ1は、推定結果(画像データに係る帳票の帳票種別)を、Webサーバ2を介してユーザ端末9に送信する。具体的には、アプリケーションサーバ1は、画像データに係る帳票の帳票種別が「AAA社の見積書」であると推定された場合、この推定結果をWebサーバ2に通知し、Webサーバ2は、Webインターフェースを介して、ユーザに対して、「AAA社の見積書です」等のメッセージを通知する。
The
即ち、本実施形態に係る帳票種別検索システム100によれば、ユーザは、帳票の画像データを送信するのみで、当該帳票の帳票種別を知ることが可能となる。更に、このような帳票種別検索システム100を用いることで、帳票種別検索サービスを利用したユーザに対して、「AAA社の見積書なので購買部に送付する」、「BBB社の納品確認書なので受入部門に転送する」等の業務フローを構築したり、「AAA社の見積書です。OCR対応しているのは、CCC社のOCRソフトウェアであり、書式定義はRX0001で、1円/1枚で利用できます」等の付加サービスを提供したりすることが出来る。
That is, according to the form
アプリケーションサーバ1は、CPU(Central Processing Unit)11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、補助記憶装置19と、ネットワークを介した外部との通信を行うためのネットワークインターフェース16と、が電気的に接続された情報処理装置である。
The
但し、情報処理装置の具体的なハードウェア構成に関しては、実施の形態に応じて適宜
構成要素の省略や置換、追加が可能である。例えば、アプリケーションサーバ1には、必要に応じてディスプレイやマウス、キーボード等の入出力装置が接続されてもよい。
However, regarding a specific hardware configuration of the information processing apparatus, components can be appropriately omitted, replaced, or added according to the embodiment. For example, input / output devices such as a display, a mouse, and a keyboard may be connected to the
CPU11は、中央処理装置であり、RAM12およびROM13等に展開された命令及びデータを処理することで、RAM12、補助記憶装置19、入出力装置等の、アプリケーションサーバ1に備えられた各構成を制御する。また、RAM12は、主記憶装置であり、CPU11によって制御され、各種命令やデータが書き込まれ、読み出される。即ち、CPU11、RAM12、およびROM13は、アプリケーションサーバ1の制御部を構成する。
The
補助記憶装置19は、不揮発性の記憶装置であり、主にアプリケーションサーバ1の電源を落としても保持したい情報、例えば、RAM12にロードされるアプリケーションサーバ1のOS(Operating System)や、後述するフローチャートに示された処理を実行するための各種プログラムの他、アプリケーションサーバ1によって使用される各種データが書き込まれ、読み出される。補助記憶装置19としては、例えば、EEPROM(Electrically Erasable Programmable
ROM)やHDD(Hard Disk Drive)等を用いることが出来る。
The
ROM), HDD (Hard Disk Drive), etc. can be used.
なお、Webサーバ2、データベース3およびユーザ端末9は、アプリケーションサーバ1と同じく、一般的なコンピュータとしての構成であるCPU、RAM、ROM、補助記憶装置、ネットワークインターフェース等を備える(図示は省略する)。また、ユーザ端末9は、例えばパーソナルコンピュータであり、処理対象の帳票の画像データを取得するためのスキャナに接続されていてもよい。
The
図2は、本実施形態に係るアプリケーションサーバ1の機能構成の概略を示す図である。本実施形態に係る情報処理装置は、CPU11が、RAM12に展開された各種プログラムを解釈および実行することで、画像データ取得部21、特徴データ取得部22、抽出部23、推定部24および特徴データ追加部25を備えるアプリケーションサーバ1として機能する。これらの機能部は、夫々、本発明に係る情報処理装置が備える各手段に相当する機能を実行する。また、本実施形態では、これらの機能がいずれも汎用のCPU11によって実行される例について説明しているが、これらの機能は、その一部または全部が、1または複数の専用のプロセッサによって実現されてもよい。
FIG. 2 is a diagram illustrating an outline of a functional configuration of the
画像データ取得部21は、処理対象帳票の画像データを取得する。
The image
特徴データ取得部22は、画像データから、処理対象帳票に係る特徴データを取得することで、帳票の画像データの符号化を行う。本実施形態において、特徴データには、罫線、罫線の数、特徴点、特徴点の数、色情報およびこれらの情報から算出された特徴量(例えば、特徴量ベクトル)が含まれる。特徴データ取得の詳細については、フローチャートを用いて後述する。
The feature
抽出部23は、インデックス検索による第一段階の絞り込みを行う。より具体的には、抽出部23は、特徴データベース31に蓄積されている特徴データから、当該特徴データに含まれる罫線の数、特徴点の数および色具合が、画像データから取得された罫線の数、特徴点の数および色具合を基準とする所定の範囲内にある(即ち、特徴点等のパラメータが近似する)1または複数の特徴データを抽出する。
The
図3および図4は、本実施形態に係る特徴データベース31の構成を示す図である。特徴データベース31は、帳票の外観上の特徴に係る特徴データを、帳票種別(帳票種別ID)毎に蓄積するデータベースであり、本実施形態では、特徴データベース31には、帳
票種別毎に、罫線の数、特徴点の数および色具合(RGBカラーヒストグラム)を保持するテーブルA(図3を参照)と、帳票の画像データに基づいて、罫線、特徴点および色具合について算出された特徴量を、当該帳票の帳票種別(帳票種別ID)に関連づけて保持するテーブルB(図4を参照)とが含まれる。
3 and 4 are diagrams showing the configuration of the
推定部24は、最近傍探索による第二段階の絞り込みを行う。より具体的には、推定部24は、抽出部23によって抽出された特徴データに含まれる特徴量に対して、画像データから取得された特徴量を用いた最近傍探索を行うことで、抽出された特徴データから、処理対象帳票に係る特徴データに一致または類似する特徴データを特定し、処理対象帳票の帳票種別を推定する。但し、帳票種別の推定には、一致または類似する特徴データを特定することが可能な手法であれば、最近傍探索以外の手法が用いられてもよい。
The
特徴データ追加部25は、推定部24によって処理対象帳票の帳票種別が推定されなかった場合に、処理対象帳票に係る特徴データを、新たな帳票種別に係る特徴データとして特徴データベース31に追加する。
The feature
<処理の流れ>
図5は、本実施形態に係る帳票種別識別・学習処理の流れを示すフローチャートである。本フローチャートに示された処理は、ユーザ端末9から送信された帳票の画像データが、Webサーバ2を介して受信されたことを契機として実行される。但し、本フローチャートに示された処理は予め蓄積された帳票の画像データに対して、バッチ処理されてもよい。なお、本実施形態においてフローチャートを用いて説明される処理の具体的な内容および順序等は、本発明を実施する上での一例である。具体的な処理内容および順序等は、実施の形態に応じて適宜選択されてよい。
<Process flow>
FIG. 5 is a flowchart showing the flow of the form type identification / learning process according to the present embodiment. The processing shown in this flowchart is executed when the image data of the form transmitted from the
ステップS101では、画像データが取得される。アプリケーションサーバ1の画像データ取得部21は、ユーザ端末9から送信された、処理対象帳票の画像データを、Webサーバ2を介して取得する。その後、処理はステップS102へ進む。
In step S101, image data is acquired. The image
ステップS102では、罫線が抽出される。アプリケーションサーバ1の特徴データ取得部22は、ステップS101において取得された画像データから、罫線を抽出する。罫線の抽出については、従来一般的に用いられている画像解析技術を用いることで可能であるため、詳細な説明は省略する。罫線抽出のための具体的な方法には、どのような方法が採用されてもよい。本実施形態では、帳票に係る画像データから、罫線に係る部分と罫線以外の部分(文字や記号、写真等)とを、画像解析によって峻別し、罫線のみの画像データを生成する。ここで生成される罫線のみの画像データは、本ステップにおける罫線の特定およびステップS103における特徴点の抽出を容易にするため、グレースケール画像または2値画像であることが好ましい。
In step S102, ruled lines are extracted. The feature
図6Aは、本実施形態に係る処理対象帳票の画像データの例を示す図である。また、図6Bは、図6Aに例示した処理対象帳票から抽出された、罫線のみのグレースケール画像の例を示す図である。図6Aおよび図6Bによれば、本実施形態において、帳票に係る画像データから、罫線に係る部分と罫線以外の部分とが峻別され、罫線のみの画像データが生成されていることが分かる。 FIG. 6A is a diagram illustrating an example of image data of a processing target form according to the present embodiment. FIG. 6B is a diagram illustrating an example of a grayscale image with only ruled lines extracted from the processing target form illustrated in FIG. 6A. According to FIGS. 6A and 6B, it can be seen that in the present embodiment, from the image data related to the form, the part related to the ruled line and the part other than the ruled line are distinguished and image data including only the ruled line is generated.
特徴データ取得部22は、生成された罫線のみの画像データから、罫線を1本1本特定していくことで、罫線を抽出する。更に、特徴データ取得部22は、抽出された罫線の数をカウントする。一般的に罫線には縦方向に延びる罫線と横方向に延びる罫線とがあり、本数が異なるが、本実施形態では、縦方向の罫線と横方向の罫線とを区別せず、罫線の総数をカウントする。これは、本実施形態に係る帳票種別識別・学習処理では、ステップS
103において後述するように、縦方向の罫線と横方向の罫線との交点が特徴点として抽出されるため、後述する特徴データの抽出および帳票種別の推定において、罫線同士の交点の重み付けが、罫線の縦横本数と交点とで二重に考慮されてしまわないようにするためである。その後、処理はステップS103へ進む。
The feature
As will be described later in 103, the intersection of the vertical ruled line and the horizontal ruled line is extracted as a feature point. Therefore, in the feature data extraction and form type estimation described later, the weight of the intersection of ruled lines is determined by the ruled line. This is so that the vertical and horizontal numbers and intersections are not considered twice. Thereafter, the process proceeds to step S103.
ステップS103では、特徴点が抽出される。アプリケーションサーバ1の特徴データ取得部22は、ステップS102において取得された画像データから、特徴点を抽出する。特徴点の抽出については、従来一般的に用いられている画像分析技術を用いることで可能であるため、詳細な説明は省略する。本実施形態では、ステップS102において生成された罫線のみの画像データから、罫線やその交点に係る特徴点を抽出する方法が用いられる。
In step S103, feature points are extracted. The feature
図6Cは、図6Bに例示した罫線のみのグレースケール画像において、特徴点が抽出された様子を例示する図である。図6には、抽出された特徴点が、丸印をもって示されている。図6Aおよび図6Cによれば、本実施形態において、帳票に係る画像データから、画像データの一致不一致を判定するために参照可能な特徴的な点(例えば、縦方向の罫線と横方向の罫線との交点)が抽出されていることが分かる。但し、特徴点は、画像データの一致不一致を判定するために参照可能な特徴的な点であればよく、罫線同士の交点に限定されない。特徴点抽出のための具体的な方法には、どのような方法が採用されてもよい。更に、特徴データ取得部22は、抽出された特徴点の数をカウントする。その後、処理はステップS104へ進む。
FIG. 6C is a diagram illustrating a state in which feature points are extracted from the grayscale image having only the ruled lines illustrated in FIG. 6B. In FIG. 6, the extracted feature points are indicated by circles. According to FIGS. 6A and 6C, in the present embodiment, characteristic points (for example, vertical ruled lines and horizontal ruled lines that can be referred to in order to determine whether the image data matches or not from the image data related to the form). It can be seen that the intersection point is extracted. However, the feature point may be a feature point that can be referred to in order to determine whether or not the image data matches, and is not limited to the intersection of ruled lines. As a specific method for extracting feature points, any method may be adopted. Furthermore, the feature
ステップS104では、色具合が取得される。アプリケーションサーバ1の特徴データ取得部22は、ステップS102において取得された画像データから、色具合を取得する。色具合の取得については、従来一般的に用いられている画像分析技術を用いることで可能であるため、詳細な説明は省略する。色具合の取得のための具体的な方法には、どのような方法が採用されてもよい。本実施形態では、ステップS102において取得された画像データの、RGBカラーヒストグラムを生成し、これを色具合として取得する。本実施形態に係る帳票種別識別・学習処理では、罫線および特徴点の抽出を、グレースケールの画像データを用いて行っているため、色具合を取得し、後述する絞り込みに用いることで、罫線や特徴点において一致または類似しているが色違いである等の帳票を区別することが出来る。その後、処理はステップS105へ進む。
In step S104, the color condition is acquired. The feature
ステップS105では、特徴量が算出される。アプリケーションサーバ1の特徴データ取得部22は、ステップS102からステップS104において取得された特徴データ(本実施形態では、罫線、特徴点および色具合)に関する特徴量を算出する。特徴量の算出については、従来一般的に用いられている特徴量算出技術を用いることで可能である。画像の特徴量としては、画像のモーメントやテクスチャ、エッジ量等があり、例えば、特徴データ取得部22は、ステップS103で抽出された特徴点を用いて、画像の回転、平行移動、拡大、縮小等の幾何学的変形に対して不変な量(不変量)としての特徴量を算出することが出来る。また、特徴データ取得部22は、ステップS102で得られる2値画像に対して、高次局所自己相関特徴計算を行うことで、特徴量を算出することが出来る。その後、処理はステップS106へ進む。
In step S105, a feature amount is calculated. The feature
ステップS106では、第一段階の絞り込みが行われる。第一段階の絞り込みは、ステップS102からステップS104において得られた特徴データのうち、罫線の数、特徴点の数および色具合を用いた、特徴データベース31のインデックス検索によって行われる。アプリケーションサーバ1の抽出部23は、ステップS102からステップS104において得られた罫線の数、特徴点の数および色具合の夫々を検索キーとして特徴データベース31を検索する。但し、この検索では、罫線の数、特徴点の数および色具合の夫々
について所定の許容範囲が設定されることで、完全一致しないが、近似する値を含むレコード、即ち、値がステップS102からステップS104において得られた値を基準とする所定の許容範囲内にあるレコードも抽出される。本ステップでは、罫線の数、特徴点の数および色具合の全てについて一致または近似する値を含むレコードのみが抽出される。但し、抽出の条件としては、罫線の数、特徴点の数および色具合の各パラメータについて、異なる重み付けが設定されていてもよい。本ステップにおける第一段階の絞り込みの結果、特徴データベース31から、1または複数のレコード(特徴データ)が抽出される。その後、処理はステップS107へ進む。
In step S106, a first-stage narrowing is performed. The first stage of narrowing down is performed by index search of the
ステップS107では、第二段階の絞り込みが行われる。第二段階の絞り込みは、ステップS105において算出された特徴量を用いた、最近傍探索によって行われる。アプリケーションサーバ1の推定部24は、ステップS105において算出された特徴点を用いて、ステップS106において抽出されたレコードに対して、最近傍探索を行う。本フローチャートに示す帳票種別識別・学習処理によれば、ステップS106で説明した第一段階の絞り込みによって、比較的処理負荷の軽いインデックス検索によってレコードが絞り込まれている。このため、ステップS107の最近傍探索の対象となるレコード(特徴データ)は、特徴データベース31の総サイズに対して小さくなっており、特徴データベース31の全体に対して最近傍探索を行う場合に比べて、処理負荷が低減されている。最近傍探索によって、ステップS101において取得された画像データの特徴データに最も近い特徴データを有するレコードが特定される。そして、推定部24は、この特定されたレコードに係る帳票種別を、ステップS101において取得された画像データに係る帳票の帳票種別であると推定する。その後、処理はステップS108へ進む。
In step S107, second-stage narrowing is performed. The second-stage narrowing is performed by nearest neighbor search using the feature amount calculated in step S105. The
ステップS108では、推定結果の有無が判定される。アプリケーションサーバ1の制御部は、ステップS107において、1のレコード(特徴データ)が、ステップS101において取得された画像データの特徴データとして特定されたか否か、換言すれば、帳票種別の推定結果が得られたか否かを判定する。帳票種別の推定結果が得られなかったと判定された場合、処理はステップS109へ進む。一方、帳票種別の推定結果が得られたと判定された場合、処理はステップS110へ進む。
In step S108, the presence or absence of an estimation result is determined. In step S107, the control unit of the
ステップS109では、特徴データベース31への登録が行われる。アプリケーションサーバ1の特徴データ追加部25は、ステップS102からステップS105において取得された罫線の数、特徴点の数、色具合および特徴量を、新たな帳票種別に係る特徴データとして、特徴データベース31に蓄積させる。但し、特徴データベース31には、取得されたその他の特徴データ(特徴点、罫線等)についても蓄積されてよい。また、特徴データ追加部25は、蓄積された特徴データに関連づけて、ステップS101において取得された画像データを、画像データベース32に蓄積する。即ち、本実施形態に係る帳票種別識別・学習処理によれば、推定結果が得られなかった帳票の画像データおよび特徴データが、新たな帳票種別に係る画像データおよび特徴データとして学習される。ここで学習された特徴データは、次回以降に帳票種別識別・学習処理が実行される際に、帳票種別識別のために参照される。その後、本フローチャートに示された処理は終了する。
In step S109, registration in the
ステップS110およびステップS111では、推定結果がユーザに対して提示され、推定結果の正否が判定される。帳票種別の推定結果が得られたとステップS108において判定された場合、アプリケーションサーバ1の制御部は、推定結果に係る帳票種別を特徴データベース31から取得し、Webサーバ2を介してユーザ端末9に送信する(ステップS110)。ユーザ端末9によって受信された推定結果に係る帳票種別は、ユーザ端末9によって表示されることでユーザに対して提示される。ユーザは、ユーザ端末9に表示された推定結果を参照し、正しい結果が得られているか否かを、Webサーバ2に対して返信する。アプリケーションサーバ1は、ユーザ端末からの返信の内容に従って、推定
結果が正しい結果であったか否か、即ち、推定結果に係る帳票種別が、ステップS101において取得された画像データに係る帳票の帳票種別を正しく示しているか否か、を判定する(ステップS111)。
In step S110 and step S111, the estimation result is presented to the user, and whether the estimation result is correct or not is determined. When it is determined in step S108 that the estimation result of the form type is obtained, the control unit of the
推定結果が正しい結果ではなかったと判定された場合、処理はステップS109へ進む。即ち、推定結果が正しい結果ではなかったと判定された場合、得られた情報は新たな帳票種別に係る情報であるとして、特徴データベース31および画像データベース32に蓄積される。ステップS109における処理の詳細については先述の通りであるため、説明を省略する。その後、本フローチャートに示された処理は終了する。一方、推定結果が正しい結果であったと判定された場合、処理はステップS112へ進む。
If it is determined that the estimation result is not correct, the process proceeds to step S109. That is, when it is determined that the estimation result is not a correct result, the obtained information is stored in the
ステップS112およびステップS113では、OCR処理が行われ、結果が送信される。アプリケーションサーバ1の制御部は、OCR処理のための書式定義が蓄積された書式定義データベース(図示は省略する)から、推定された帳票種別に係る書式定義を取得する。そして、アプリケーションサーバ1の制御部は、当該書式定義に従って、ステップS101において取得された画像データに対するOCR処理を行う(ステップS112)。OCR処理が完了すると、アプリケーションサーバ1の制御部は、Webサーバ2を介して、ユーザ端末9に対して、帳票の画像データに含まれていた文字情報を含むOCR処理の結果を送信する(ステップS113)。また、制御部は、この際、帳票種別も併せてユーザ端末9に送信してもよい。その後、本フローチャートに示された処理は終了する。
In step S112 and step S113, an OCR process is performed and the result is transmitted. The control unit of the
<効果>
本実施形態に係る帳票種別検索システム100によれば、予め書式定義を作成することなく、帳票種別を推定することが出来る。また、未知の帳票種別については学習を行い、以後の帳票種別推定において、学習された帳票データを用いることが可能となる。
<Effect>
According to the form
更に、本実施形態に係る帳票種別検索システム100によれば、抽出部23による第一段階の絞り込みにおいて比較的負荷の軽いインデックス検索を採用し、推定部24による第二段階の絞り込みにおいて比較的正確性の高い最近傍探索を採用することで、処理速度を損なうことなく、正確性の高い帳票種別推定を行うことが可能となる。
Furthermore, according to the form
1 アプリケーションサーバ
2 Webサーバ
3 データベース
9 ユーザ端末
21 画像データ取得部
22 特徴データ取得部
23 抽出部
24 推定部
25 特徴データ追加部
31 特徴データベース
32 画像データベース
DESCRIPTION OF
Claims (9)
処理対象帳票の画像データを取得する画像データ取得手段と、
前記画像データから、前記処理対象帳票に係る特徴データを取得する特徴データ取得手段と、
前記特徴データ蓄積手段に蓄積されている特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定手段と、
前記推定手段によって前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加手段と、
を備える情報処理装置。 An information processing apparatus connected to feature data storage means for storing feature data relating to appearance features of a form for each form type,
Image data acquisition means for acquiring image data of a processing target form;
Feature data acquisition means for acquiring feature data related to the processing target form from the image data;
Estimation means for estimating the form type of the processing target form by identifying feature data that matches or is similar to the characteristic data related to the processing target form from the feature data stored in the feature data storage means;
Feature data adding means for adding feature data related to the processing target form to the feature data accumulating means when the form type of the processing target form is not estimated by the estimating means;
An information processing apparatus comprising:
請求項1に記載の情報処理装置。 If the form type of the processing target form is not estimated by the estimating means, the feature data adding means uses the feature data relating to the processing form as feature data relating to a new form type. To add to the
The information processing apparatus according to claim 1.
前記推定手段は、前記抽出手段によって抽出された特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する、
請求項1または2に記載の情報処理装置。 From the feature data stored in the feature data storage means, one or more features in which a predetermined parameter included in the feature data is within a predetermined range based on the predetermined parameter acquired from the image data It further comprises extraction means for extracting data,
The estimation means estimates the form type of the processing target form by specifying feature data that matches or is similar to the characteristic data related to the processing target form from the feature data extracted by the extraction means.
The information processing apparatus according to claim 1 or 2.
前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる特徴点の数が、前記画像データから取得された特徴点の数を基準とする所定の範囲内にある1または複数の特徴データを抽出する、
請求項3に記載の情報処理装置。 The predetermined parameter includes information capable of specifying the number of feature points acquired from the image data,
The extraction unit is configured such that, from the feature data stored in the feature data storage unit, the number of feature points included in the feature data is within a predetermined range based on the number of feature points acquired from the image data. Extract one or more feature data in
The information processing apparatus according to claim 3.
前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる罫線の数が、前記画像データから取得された罫線の数を基準とする所定の範囲内にある1または複数の特徴データを抽出する、
請求項3または4に記載の情報処理装置。 The predetermined parameter includes information capable of specifying the number of ruled lines acquired from the image data,
The extraction means includes, based on the feature data stored in the feature data storage means, the number of ruled lines included in the feature data is within a predetermined range based on the number of ruled lines acquired from the image data. Extract one or more feature data;
The information processing apparatus according to claim 3 or 4.
前記抽出手段は、前記特徴データ蓄積手段に蓄積されている特徴データから、該特徴データに含まれる色具合が、前記画像データから取得された色具合を基準とする所定の範囲内にある1または複数の特徴データを抽出する、
請求項3から5の何れか一項に記載の情報処理装置。 The predetermined parameter includes information that can specify the color condition acquired from the image data,
The extraction unit is configured such that, from the feature data stored in the feature data storage unit, the color condition included in the feature data is within a predetermined range based on the color condition acquired from the image data. Extract multiple feature data,
The information processing apparatus according to any one of claims 3 to 5.
前記推定手段は、前記抽出手段によって抽出された特徴データに含まれる特徴量に対し
て、前記画像データから取得された特徴量を用いた最近傍探索を行うことで、該抽出された特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定し、該処理対象帳票の帳票種別を推定する、
請求項1から6の何れか一項に記載の情報処理装置。 The feature data includes a feature amount calculated from the image data,
The estimation unit performs a nearest neighbor search using the feature amount acquired from the image data with respect to the feature amount included in the feature data extracted by the extraction unit, thereby obtaining the feature amount from the extracted feature data. , Identifying feature data that matches or resembles the feature data related to the processing target form, and estimates the form type of the processing target form.
The information processing apparatus according to any one of claims 1 to 6.
処理対象帳票の画像データを取得する画像データ取得ステップと、
前記画像データから、前記処理対象帳票に係る特徴データを取得する特徴データ取得ステップと、
前記特徴データ蓄積手段に蓄積されている特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定ステップと、
前記推定ステップにおいて前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加ステップと、
を実行する帳票種別推定方法。 A computer connected to the feature data storage means for storing the feature data relating to the appearance features of the form for each form type,
An image data acquisition step for acquiring image data of a processing target form;
A feature data acquisition step of acquiring feature data related to the processing target form from the image data;
An estimation step for estimating a form type of the processing target form by specifying feature data that matches or is similar to the characteristic data related to the processing target form from the feature data stored in the feature data storage unit;
A feature data adding step of adding feature data relating to the processing target form to the feature data storage means when the form type of the processing target form is not estimated in the estimating step;
Form type estimation method that executes.
処理対象帳票の画像データを取得する画像データ取得ステップと、
前記画像データから、前記処理対象帳票に係る特徴データを取得する特徴データ取得ステップと、
前記特徴データ蓄積手段に蓄積されている特徴データから、前記処理対象帳票に係る特徴データに一致または類似する特徴データを特定することで、該処理対象帳票の帳票種別を推定する推定ステップと、
前記推定ステップにおいて前記処理対象帳票の帳票種別が推定されなかった場合に、該処理対象帳票に係る特徴データを前記特徴データ蓄積手段に追加する特徴データ追加ステップと、
を実行させるための帳票種別推定用プログラム。 To the computer connected to the feature data storage means for storing the feature data relating to the appearance features of the form for each form type,
An image data acquisition step for acquiring image data of a processing target form;
A feature data acquisition step of acquiring feature data related to the processing target form from the image data;
An estimation step for estimating a form type of the processing target form by specifying feature data that matches or is similar to the characteristic data related to the processing target form from the feature data stored in the feature data storage unit;
A feature data adding step of adding feature data relating to the processing target form to the feature data storage means when the form type of the processing target form is not estimated in the estimating step;
Form type estimation program to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011061567A JP5670787B2 (en) | 2011-03-18 | 2011-03-18 | Information processing apparatus, form type estimation method, and form type estimation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011061567A JP5670787B2 (en) | 2011-03-18 | 2011-03-18 | Information processing apparatus, form type estimation method, and form type estimation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012198684A true JP2012198684A (en) | 2012-10-18 |
JP5670787B2 JP5670787B2 (en) | 2015-02-18 |
Family
ID=47180851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011061567A Active JP5670787B2 (en) | 2011-03-18 | 2011-03-18 | Information processing apparatus, form type estimation method, and form type estimation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5670787B2 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014170452A (en) * | 2013-03-05 | 2014-09-18 | Fuji Xerox Co Ltd | Image processing device and program |
JP2019101647A (en) * | 2017-11-30 | 2019-06-24 | キヤノンマーケティングジャパン株式会社 | Information processing device, control method therefor, and program |
JP2019169025A (en) * | 2018-03-26 | 2019-10-03 | 株式会社Pfu | Information processing device, character recognition engine selection method, and program |
JP2019185142A (en) * | 2018-04-02 | 2019-10-24 | 日本電気株式会社 | Image processing device, image processing method, and program |
JP2021068378A (en) * | 2019-10-28 | 2021-04-30 | Tis株式会社 | Business form processing program, business form processing apparatus, and business form processing method |
US11438477B2 (en) | 2020-01-16 | 2022-09-06 | Fujifilm Business Innovation Corp. | Information processing device, information processing system and computer readable medium |
JP7420578B2 (en) | 2020-02-06 | 2024-01-23 | 株式会社Nttデータ | Form sorting system, form sorting method, and program |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020160947A (en) | 2019-03-27 | 2020-10-01 | キヤノン株式会社 | Print system, print setting estimation method, and program |
JP2020170968A (en) | 2019-04-04 | 2020-10-15 | キヤノン株式会社 | Management system, information processing device, data destination estimation method, data transmission method, and program |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08335247A (en) * | 1995-06-08 | 1996-12-17 | Oki Electric Ind Co Ltd | Method and device for generating format information |
JP2000285190A (en) * | 1999-03-31 | 2000-10-13 | Toshiba Corp | Method and device for identifying slip and storage medium |
JP2001325563A (en) * | 2000-03-10 | 2001-11-22 | Fujitsu Ltd | Device and method for image collation and image collation program |
JP2007115280A (en) * | 2007-01-19 | 2007-05-10 | Fujitsu Ltd | Slip-identifying apparatus and its identifying method |
JP2007193678A (en) * | 2006-01-20 | 2007-08-02 | Fujitsu Ltd | Medium distinction information database production device and medium distinction information database management device |
-
2011
- 2011-03-18 JP JP2011061567A patent/JP5670787B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08335247A (en) * | 1995-06-08 | 1996-12-17 | Oki Electric Ind Co Ltd | Method and device for generating format information |
JP2000285190A (en) * | 1999-03-31 | 2000-10-13 | Toshiba Corp | Method and device for identifying slip and storage medium |
JP2001325563A (en) * | 2000-03-10 | 2001-11-22 | Fujitsu Ltd | Device and method for image collation and image collation program |
JP2007193678A (en) * | 2006-01-20 | 2007-08-02 | Fujitsu Ltd | Medium distinction information database production device and medium distinction information database management device |
JP2007115280A (en) * | 2007-01-19 | 2007-05-10 | Fujitsu Ltd | Slip-identifying apparatus and its identifying method |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014170452A (en) * | 2013-03-05 | 2014-09-18 | Fuji Xerox Co Ltd | Image processing device and program |
JP2019101647A (en) * | 2017-11-30 | 2019-06-24 | キヤノンマーケティングジャパン株式会社 | Information processing device, control method therefor, and program |
JP7181445B2 (en) | 2017-11-30 | 2022-12-01 | キヤノンマーケティングジャパン株式会社 | Information processing device, its control method and program |
JP2019169025A (en) * | 2018-03-26 | 2019-10-03 | 株式会社Pfu | Information processing device, character recognition engine selection method, and program |
JP2019185142A (en) * | 2018-04-02 | 2019-10-24 | 日本電気株式会社 | Image processing device, image processing method, and program |
JP7160432B2 (en) | 2018-04-02 | 2022-10-25 | 日本電気株式会社 | Image processing device, image processing method, program |
JP2021068378A (en) * | 2019-10-28 | 2021-04-30 | Tis株式会社 | Business form processing program, business form processing apparatus, and business form processing method |
US11438477B2 (en) | 2020-01-16 | 2022-09-06 | Fujifilm Business Innovation Corp. | Information processing device, information processing system and computer readable medium |
JP7420578B2 (en) | 2020-02-06 | 2024-01-23 | 株式会社Nttデータ | Form sorting system, form sorting method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP5670787B2 (en) | 2015-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5670787B2 (en) | Information processing apparatus, form type estimation method, and form type estimation program | |
JP6629678B2 (en) | Machine learning device | |
US20120136812A1 (en) | Method and system for machine-learning based optimization and customization of document similarities calculation | |
US20120330662A1 (en) | Input supporting system, method and program | |
CN103136228A (en) | Image search method and image search device | |
US20190266619A1 (en) | Behavior pattern search system and behavior pattern search method | |
US20190294912A1 (en) | Image processing device, image processing method, and image processing program | |
CN111177507B (en) | Method and device for processing multi-mark service | |
JP2011198364A (en) | Method of adding label to medium document and system using the same | |
US11803872B2 (en) | Creating meta-descriptors of marketing messages to facilitate in delivery performance analysis, delivery performance prediction and offer selection | |
CN108734159B (en) | Method and system for detecting sensitive information in image | |
US9710769B2 (en) | Methods and systems for crowdsourcing a task | |
CN112541077B (en) | Processing method and system for power grid user service evaluation | |
US9471676B1 (en) | System and method for suggesting keywords based on image contents | |
JP6377917B2 (en) | Image search apparatus and image search program | |
JP5423380B2 (en) | Information processing program and information processing method | |
CN116484109B (en) | Customer portrait analysis system and method based on artificial intelligence | |
KR102163125B1 (en) | Marketing method using image contest based hash-tag | |
KR102028356B1 (en) | Advertisement recommendation apparatus and method based on comments | |
US20120226550A1 (en) | Method, server, and computer-readable recording medium for providing advertisement using collection information | |
CN110580297A (en) | Merchant and dish matching method and device based on dish image and electronic equipment | |
WO2021059848A1 (en) | Information processing device, information processing method, and information processing program | |
JP7272037B2 (en) | Information processing device and program | |
KR102393517B1 (en) | Method of providing a fulfillment service and service system therefor | |
KR102078541B1 (en) | Issue interest based news value evaluation apparatus and method, storage media storing the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130618 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140509 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5670787 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |