JP2016126796A - 活字ocrシステム - Google Patents
活字ocrシステム Download PDFInfo
- Publication number
- JP2016126796A JP2016126796A JP2015255533A JP2015255533A JP2016126796A JP 2016126796 A JP2016126796 A JP 2016126796A JP 2015255533 A JP2015255533 A JP 2015255533A JP 2015255533 A JP2015255533 A JP 2015255533A JP 2016126796 A JP2016126796 A JP 2016126796A
- Authority
- JP
- Japan
- Prior art keywords
- function
- document
- ocr
- dictionary
- received
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
- Facsimiles In General (AREA)
- Storing Facsimile Image Data (AREA)
Abstract
【解決手段】 発信元からFAXにより受信した受信書面を目的書面と非目的書面に分類する分類機能と、目的書面に分類された受信書面をOCR処理し、グローバルルールとローカルルールとを備えた抽出用データベースを用いて、当該受信書面から「項目名」「値」「座標」を抽出する抽出機能と、「値」と「OCR領域」を確認する確認・修正機能と、確定された抽出結果をエクスポートするデータ出力機能と、確認・修正機能によって再度OCR処理するために指定されたOCR領域を、抽出用データベースのローカルルールに反映させる学習機能と、を備えたことを特徴とする。
【選択図】 図1
Description
詳しくは、受信したFAXの相手先を自動認識する相手先認識手段2と、自動認識された相手先の情報と関連付けして受信したFAXのイメージデータを格納するイメージデータベース3と、受信したFAXのイメージデータからOCR機能により読み取られた文字情報を格納する文字情報データベース4と、相手先を指定してイメージデータベース3または文字情報データベース4を検索する検索手段5とで受信FAX管理システムを構成するものである。
また、第2の発明は、請求項2記載の活字OCRシステムによって様々なレイアウトを持つ目的書面を個々の目的書面のレイアウトに依存せずにデータ化に必要な項目の値を抽出するためにひとつの仮想帳票として論理的に定義し、この仮想帳票に基づいて抽出機能と確認・修正機能とデータ出力機能とを一括して設定可能とすることを特徴とした設計機能をを備えてもよい。
(1)多く(例えば、70〜80%)のFAX受信書面は、標準的に適用される「グローバルルール」によってOCR処理できる。
(2)それ以外(例えば、20〜30%)のFAX受信書面は、「グローバルルール」によってOCR処理できないものであるが、特定の受信書面にのみ適用される「ローカルルール」によってOCR処理できる。
(3)従って、結果的に全てのFAX受信書面を効率良く且つ確実にOCR処理できる。
(4)しかも、本願発明は、形式の異なるFAX受信書面ごとにそのフォーマットを登録するものではないので、処理するFAX受信書面が増えてもシステムに負荷がかからず、むしろ、学習機能を備えているので、OCR処理をすればするほどその精度が高くなるという効果を有する。
(1)FAX受信書面のレイアウトが変わってもその都度設計し直す必要がなく(再設計することなく)、様々なレイアウトのFAX受信書面であっても、データ化に必要な項目の値を確実に取り出す(抽出する)ことができる。
(2)すなわち、従来の帳票OCRでは、次のような場合には、そのままでは目的とする値を抽出できず、設計し直す必要があるが、本願発明では、FAX受信書面のレイアウト座標に依存しないので、データ化に必要な項目の値を確実に取り出せる(抽出できる)。
・異なる取引先で似たレイアウトだが、微妙に配置やフォントが違う。
・登録した通りのレイアウトでFAX受信できない。
・取引先の拠点毎に、微妙に配置・フォント・印刷設定が異なる。
・枠数・枠幅が増減する。
・NO行の中の行が増減する。
・行が増減する。
(3)また、本願発明の活字OCRシステムによって様々なレイアウトを持つ目的書面を個々の目的書面のレイアウトに依存せずにデータ化に必要な項目の値を抽出するためにひとつの仮想帳票として論理的に定義することで、抽出機能と確認・修正機能とデータ出力機能とを一括して設定することが可能となる(設計機能)。
(4)すなわち、特別なプログラム知識を持たなくても、この設計機能を使用することで、抽出機能と確認・修正機能とデータ出力機能における設定を簡単に行うことができる。そして、それによって、活字OCRシステムの活用の場が広がる。
[構造辞書」
構造辞書には、以下のような情報が含まれている。
□文書のレイアウト情報(ゾーン情報)
・座標(左上の座標、幅、高さ)
・含まれる項目の項目ID一覧
□項目と値の位置関係と値の数
・右、下、右下、表示なし
・別カラム/同一カラム/カラムなし
・単一/複数(最大数)
[項目辞書]
項目辞書には、以下のような情報が含まれている。
□項目情報
・項目ID
・項目の属性
・同義語グループID
□値の形式
・文字種指定
・テンプレート
・正規表現
□同義語情報
・同義語グループID
・項目1,項目2,項目3…
例)同義語グループID 氏名
項目1 氏名
項目2 ご氏名
項目3 御氏名
項目4 おなまえ
項目5 お名前
項目6 御名前
項目7 ご芳名
[補完用辞書]
補完用辞書には、以下のような情報が含まれている。
□項目ごとに、誤認識しやすい文字とその場所の情報が保存されている。
・項目名
・文字位置
・御認識文字
例)項目名 日付
文字位置 1
正しい文字 日
御認識文字 口
口付→日付
FAXの受信書面を分類するために使用する情報が含まれているデータベースである。実際には、抽出用データベースと同じに、構造辞書・項目辞書・補完用辞書を使用することになるので、分類用データベースというものが抽出用データベースと別に存在するわけではない。分類機能の具体的な処理を説明する場合において、分類しようする情報を蓄えてある場所という程度の意味である。
[抽出用データベース]
目的書面内にある項目を抽出するために使用する情報が含まれているデータベースである。実際には、分類用データベースと同じに、構造辞書・項目辞書・補完用辞書を使用することになるので、抽出用データベースというものが分類用データベースと別に存在するわけではない。抽出機能の具体的な処理を説明する場合において、抽出しようする項目と値の情報を蓄えてある場所という程度の意味である。
[補完用データベース]
補完用辞書とほぼ同じ意味で使われている。データベースという言葉が器を指すニュアンスが強く、辞書は器の中に入る内容を指すニュアンスが強い。
得意先の品番と自社の品番が異なるとき、得意先の品番を自社の品番に置き換える必要があり、製品名についても同様である。得意先の品番や商品名と自社の品番や製品名の対応付けを行っているのが得意先翻訳マスタである。
[得意先別いつものマスタ]
得意先が発注時に指定する際に、製品名ではなく得意先で使用されている通称などが使用される場合がある。また、色や形状などの細かい仕様については記述されていない場合もある。その際に過去の購入情報をもとにいつも購入している製品の製品名、品番、枝版、仕様を特定して置き換える必要がある。そのような情報を保持しているのかが得意先別いつものマスタである。
構造辞書、項目辞書、補完用辞書の中で、特定の得意先に依存しない情報の属性を「グローバル」としている。このグローバルの属性をもった辞書の内容を総称してグローバルルールと称する。
[ローカルルール]
構造辞書、項目辞書、補完用辞書の中で、特定の得意先のための情報の属性を「ローカル」としている。このローカルの属性をもった辞書の内容を総称しローカルルールと称する。
図1は、本願発明の第1の発明に関するシステム概念図を図示したものである。本願発明の活字OCRシステムは、大きく「分類機能」「抽出機能」「確認・修正機能」「データ出力機能」「学習機能」から構成される。以下、各機能ごとに説明する。
分類の作業としては、発信元からFAXにより受信した発信元属性データ(TSIコード又はFAX番号等)の付随した受信書面を全体的にOCR処理する。
そして、分類用データベースを用いて、「目的書面」と「非目的書面」に分類する。
ここで、「分類用データベース」は、受信書面を目的書面又は非目的書面に分類できる「用語の定義」や「分類のルール」等を備えたものである。例えば、目的書面が「注文書」の場合に、注文書を定義し、注文書と同義語の書面(「発注書」「依頼書」等)を目的書面として分類できるようにする。
抽出の作業としては、目的書面をOCR処理する。そして、抽出用データベースおよび補完用データベースを用いて、「項目名」「値」「座標」を抽出する。
ここで、抽出用データベースは、受信書面から「項目名」「値」を抽出できる「同義語辞書」や「項目名と値の配置」「項目別の値パターン」等を備えたものである。すなわち、目的書面から「項目名」を抽出する場合、項目名の表現にバラツキがあるので、「同義語辞書」で吸収して正規化を行う。例えば、「氏名」「なまえ」「名前」「お名前」「ご芳名」といったものを「氏名」という項目で代表する。また、「項目名」に対応した「値(数量・品名)」を抽出する場合、その抽出方法は「項目名」をテキストアンカーという目印として使い、その周辺(上下左右と斜め方向:項目名と値の配置で定義・設定)で「項目名」に対応する「値」のパターン(項目別の値パターン)から検索して抽出する。なお、「項目名」と「値」が同じ矩形領域の箱に含まれている場合にも対応する。
また、この抽出用データベースは、標準的に適用される「グローバルルール」と特定の属性データを有する発信元からの受信書面にのみ適用される「ローカルルール」とに分けられる。グローバルルールは、FAX受信書面の7割〜8割方で適用され得るルールで、このグローバルルールを適用できない残りの2割〜3割のFAX受信書面に適用されるのがローカルルールである。ローカルルールは、FAXを受信する際に画像とともに受信する発信元属性データ(TSIコード又はFAX番号等)ごとに蓄積される。すなわち、同じ発信元からの受信書面であれば、同じフォーマットの書面であり、同じルールが適用できるからである。
その確認・修正機能は、「確認・修正画面」で行われる(図2)。「確認・修正画面」は、目的書面の受信画像と、抽出機能によって当該受信画像から抽出した「項目名」と「値」のデータを表示する抽出表示とを並記したものである。
確認機能は、抽出表示の抽出された「項目名」や「値」の欄を指定すると、これに対応する受信画像の該当部分が識別できるようになり(色枠で表示、背景や文字・数字を別 色で表示など)、確認が極めて容易になる。
修正機能は、抽出した「値」と抽出した「エリア(領域)」で異なる処理を行う。抽出対象の「エリア(領域)」は間違っていないが、そこから抽出された「値」が間違えていた場合(例えば、「3」と読み取るところを「8」と読み取っていた場合)は、正しい「値」を抽出表示に入力し直す(オペレータの手作業)。
一方、抽出対象の「エリア(領域)」を間違えた場合は、正しい「エリア(領域)」を受信画像上で指定(選択)し、その指定領域をOCR処理させて正しい「項目名」又は「値」を抽出し、抽出表示に自動的に入力させるようにする。
また、抽出する「値」を間違えた場合は、正しい「値」に修正するが、このとき、この修正された「値」の情報は補完用データベースに蓄積される。以後、抽出機能において、この補完用データベースが用いられて「値」が自動的に補完され抽出される。
本願発明の第2の発明は、全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面(FAX受信書面)を、構造辞書・項目辞書・補完用辞書を用いて分析・抽出する。例えば、図の文書を例に説明すると、図示するようにFAX受信書面を「表題ゾーン」「発注先ゾーン」「発注元ゾーン」「メイン明細ゾーン」「共通ゾーン1」「共通ゾーン2」「共通ゾーン3」「共通ゾーン4」「共通ゾーン5」と分析する。分析の方法としては、「表題ゾーン」を例に挙げると、表題は一般的に書面の上段中央部に配置されて、文書名が記載されることが多い(これらの情報は、構造辞書・項目辞書等に蓄積されている)。図3のFAX受信書面では、書面の上段中央部に「注文書」と記載されていることから、構造辞書及び項目辞書等を用いることで、この「注文書」と記載されている領域が「表題ゾーン」であると分析する。同様に、「発注先ゾーン」〜「共通ゾーン5」について分析する。
そして、「表題ゾーン」に記載されている表題(値)によって、目的書面と非目的書面に分類する。目的書面を「注文書」とするならば、「表題ゾーン」に「注文書」又は注文書と同義語で記載されているもの(これは項目辞書を用いることで、「発注書」「御注文書」などを同義語と認識できる)を目的書面と判断する。
次に、目的書面から「項目名」「値」「信頼性」「座標」を抽出する。「注文書」であれば、例えば「項目名」は商品番号、「値」は数量となる。商品番号や数量は、メイン明細ゾーンに記載されているので(その情報は構造辞書に蓄積)、メイン明細ゾーンに記載されている記載内容から(「座標」と構造辞書で認識できる)、文字種(商品番号であれば数字や英字による表記、数量であれば数字のみ又は数字と単位による表記)、テンプレート(A会社の商品番号であれば、XXXNNNN−XNなど)、「項目名」と「値」の位置関係(数量は商品番号の右側又は下側:構造辞書に蓄積)などの情報を用いて、抽出される。
なお、数量などは、一般的に(各社共通で)算用数字で表記されるので、標準的に適用されるグローバルルールとして「数量は算用数字で表記されたもの」と構造辞書・項目辞書・補完用辞書に備えることになる。
一方、注文書番号などは、取引各社による共通ルールとして表記が一致することは期待できないが、会社・部署ごとに共通する場合もあるので、特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとして「A会社の注文書番号はANNNN−N」などと構造辞書・項目辞書・補完用辞書に備えることになる。
なお、図8に図示するように、「項目名」の背景に着色や網掛けがされている場合に、一般的なOCR技術であれば、そこから項目名を認識し、値を抽出することは極めて困難であるが、本願発明では補完用辞書やローカルルール等を適用して値の抽出を可能にしている。
また、補完用辞書や得意先別翻訳マスタ・得意先別いつものマスタなどを用いて、OCR認識を自動的に補完・置き換えなどをして、その結果を抽出結果とすることで、OCR認識を支援する。万一、OCRの結果、「信頼性」の低いものがあれば、次の確認・修正機能でそれが分かるように表示する。
確認・修正機能については、モニター画面に受信書面の画像(左)と抽出機能によって抽出された当該受信書面の抽出表示(右)とを並列して表示し、「項目名」に対する「値」を確認し、不適切であれば正しい「値」に修正する(図2参照)。
ここでは、目的書面の種類を「注文書」として説明する。なお、「分類機能」については、図1に示す第1の発明と同じであるので、その説明を省略するが、目的書面が「注文書」であるため、注文書、発注書、オーダーフォームとよばれる文書のみを抽出する必要がある。
抽出機能では、OCR結果を、「項目名、値、信頼性、座標」のセットして取り扱う。例としては、「得意先名、○×商事、85%、(972, 246)-(1331,308)」などである。OCRエンジンによって信頼性の解釈が異なり、画像の解像度によって座標の返す値の範囲が異なることを考慮する必要はあるものの、これらの4つの情報は何らかの方法で取得できるはずのものとして取り扱う。
図示するように、分類機能で行った1回目のOCR処理或いは1回目のOCR処理では不十分であれば2回目のOCR処理に対して、ゾーン情報を基にして、ゾーンと項目との関係から項目と値の関係を抽出する。例えば、ゾーンAは、注文書の中段より上側の右端に配置されており、項目として「会社名」「TEL」「FAX」があるので、これを発注元として抽出し、項目と値の関係を抽出する。また、ゾーンBは、注文書の下半分に位置しており、これを注文数量として抽出する。
例えば、「発 シ 主 日 目 寺」→「発注日時」などである。
また、得意先別翻訳マスタを使用して、得意先の品番や製品名を自社の品番や製品名に置き換える機能(標準化・正規化機能)を備えても良い。
また「データ出力機能」は、OCR認識、確認修正作業などを経た後、最終的に出力される形式を指定して、リレーショナルデータベースやCSVファイルなどに出力する。
更に「学習機能」は、確認・修正機能において、修正した内容を補完用データベース(補完用辞書)に蓄積し、以降のOCR認識結果を補完する際に有効活用する。
図10及び図11において、「仮想帳票」について説明する。
図10に図示するように、従来は、各文書(同一レイアウトの文書)ごとに設定された処理内容で作業が進められていた。
これに対して、本願発明(第2の発明)は、各文書を論理的に定義された「仮想帳票」に集約することを技術思想としており、この仮想帳票に落とし込むために上記した構造辞書・項目辞書・補完用辞書を或いはグローバルルール・ローカルルールを用いて各文書のレイアウトに依存せずにデータ化に必要な項目の値を抽出している(図11:仮想帳票と各種辞書の連関図)。
従って、従来は、各文書(同一レイアウトの文書)ごとそして各作業(例えば、抽出、確認・修正、出力)ごとに設定が必要であったが、本願発明では、理論的に定義された仮想帳票の定義内容を設定するだけで、各文書(各レイアウト)ごと及び各作業ごとの設定が当然に不要となる。換言すれば、本願発明では、仮想帳票を中心にして仮想帳票を作成するために各作業が進められているので、仮想帳票の定義(設定)が決まれば、その他の設定は基本的にいらないのである。
□文書の種類(注文書、見積依頼書、連絡票など)
・文書種別ID
・文書種別名
・文書種別の説明
□使用する項目の一覧
仮想帳票を定義する場合に中心となるのが項目の情報である。「注文書」であれば、文書名、注文書番号、注文書日付、発注元、発注元電話番号、発注元FAX番号、品番、品名、単価、数量、合計金額、消費税などの項目が必要となり、これらの項目の情報を項目辞書への参照方法(項目ID)として保持する。
□対応する構造辞書
仮想帳票には、書面のレイアウトについての情報や、項目の値の配置に関する情報がない。これらの情報は構造辞書にあるため、対応する構造辞書への参照情報(文書種別IDEA)を保持する。
□確認修正用画面レイアウト
具体的な個々の帳票の項目の物理的な配置に依存しない、一般的な帳票の項目の配置をして、目視で内容をチェックする効率があがるようなレイアウト
□出力フォーマット
具体的な個々の帳票に記載されている項目の形式に依存しない、日付や金額の形式が統一された形でリレーショナルデータベースやCSVファイルに出力される設定
□ロジカルチェック
明細に書かれた金額の合計と合計金額欄に書かれた金額が一致するか、希望納期が注文日時よりも充分な日数分後になっているかなど論理的なチェックロジックの設定
□DBルックアップ
入力する項目がいくつかの選択肢に限られる場合に、選択可能な項目を設定。支払い方法が「現金、クレジットカード、代引、納品後振込み」から選択できるなどの設定
Claims (3)
- 全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面をOCR処理する活字OCRシステムであって、
発信元からFAXにより受信した発信元属性データの付随した受信書面をOCR処理し、分類用データベースを用いて、当該受信書面を目的書面と非目的書面に分類する分類機能と、
目的書面に分類された受信書面をOCR処理し、標準的に適用されるグローバルルールと特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとを備えた抽出用データベース及びOCR処理を補完する補完用データベースを用いて、当該受信書面から「項目名」「値」「座標」を抽出する抽出機能と、
モニター画面に受信書面の画像と抽出機能によって抽出された当該受信書面の抽出表示とを並列して表示し、「項目名」に対する「値」を確認し、不適切であれば正しい「値」に修正し、また、抽出機能によるOCR領域を確認し、不適切であれば正しいOCR領域を指定し、指定されたOCR領域で再度OCR処理し、改めて「項目名」に対する「値」を確認する確認・修正機能と、
確認・修正機能によって確定された抽出結果を所定の出力フォーマットで出力し、これを目的書面のデータベースへエクスポートするデータ出力機能と、
確認・修正機能によって指定されたOCR領域及び修正された値を、抽出用データベース及び補完用データベースに反映させる学習機能と、
を備えたことを特徴とする活字OCRシステム。 - 全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面をOCR処理する活字OCRシステムであって、
当該活字OCRシステムは、標準的に適用されるグローバルルールと特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとをそれぞれ備えた構造辞書・項目辞書・補完用辞書を有し、
構造辞書は、文書の種類、文書のレイアウト情報(ゾーン情報)、項目と値の位置関係と値の数に関する情報を含み、
項目辞書は、同義語、値の形式に関する情報を含み、
補完用辞書は、項目ごとに、誤認識しやすい文字とその場所の情報を含み、
発信元からFAXにより受信した発信元属性データの付随した受信書面をOCR処理し、構造辞書・項目辞書・補完用辞書を用いて、当該受信書面を目的書面と非目的書面に分類する分類機能と、
目的書面に分類された受信書面のOCR処理に対して、構造辞書・項目辞書・補完用辞書を用いて、当該受信書面から「項目名」「値」「信頼性」「座標」を抽出する抽出機能と、
モニター画面に受信書面の画像と抽出機能によって抽出された当該受信書面の抽出表示とを並列して表示し、「項目名」に対する「値」を確認し、不適切であれば正しい「値」に修正する確認・修正機能と、
確認・修正機能によって確定された抽出結果を所定の出力フォーマットで出力し、これを目的書面のデータベースへエクスポートするデータ出力機能と、
確認・修正機能によって修正された値を、構造辞書・項目辞書・補完用辞書に反映させる学習機能と、
を備え、目的書面のレイアウトに依存せずにデータ化に必要な項目の値の抽出を可能とすることを特徴とした活字OCRシステム。 - 請求項2記載の活字OCRシステムによって様々なレイアウトを持つ目的書面を個々の目的書面のレイアウトに依存せずにデータ化に必要な項目の値を抽出するためにひとつの仮想帳票として論理的に定義し、この仮想帳票に基づいて抽出機能と確認・修正機能とデータ出力機能とを一括して設定可能とすることを特徴とした設計機能を備えた活字OCRシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014266871 | 2014-12-27 | ||
JP2014266871 | 2014-12-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016126796A true JP2016126796A (ja) | 2016-07-11 |
JP6702629B2 JP6702629B2 (ja) | 2020-06-03 |
Family
ID=56357039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015255533A Active JP6702629B2 (ja) | 2014-12-27 | 2015-12-27 | 活字ocrシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6702629B2 (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111507230A (zh) * | 2020-04-11 | 2020-08-07 | 创景未来(北京)科技有限公司 | 一种文档和表格数据的识别和提取方法及系统 |
JP6818923B1 (ja) * | 2020-04-02 | 2021-01-27 | 株式会社スカイコム | 情報処理装置、データ連携システム、方法およびプログラム |
JP6856916B1 (ja) * | 2020-01-08 | 2021-04-14 | ジーニアルテクノロジー,インク. | 情報処理装置、情報処理方法及び情報処理プログラム |
JP2021135671A (ja) * | 2020-02-26 | 2021-09-13 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP2021135670A (ja) * | 2020-02-26 | 2021-09-13 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
CN113468886A (zh) * | 2021-07-28 | 2021-10-01 | 拉扎斯网络科技(上海)有限公司 | 工单处理方法、装置及计算机设备 |
US20210319248A1 (en) * | 2018-08-27 | 2021-10-14 | Kyocera Document Solutions Inc. | Ocr system |
US11321558B2 (en) | 2019-09-12 | 2022-05-03 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium |
US11568276B1 (en) | 2021-08-25 | 2023-01-31 | International Business Machines Corporation | Adaptive document understanding |
JP2023522360A (ja) * | 2020-04-24 | 2023-05-30 | アジャイルソーダ インコーポレイテッド | Ocrベース文書分析システム及び方法 |
JP7420578B2 (ja) | 2020-02-06 | 2024-01-23 | 株式会社Nttデータ | 帳票仕分システム、帳票仕分方法、及びプログラム |
JP7486760B1 (ja) | 2023-08-31 | 2024-05-20 | 株式会社日本ブレーン | 管理装置、管理システム、及び、管理方法 |
JP7491107B2 (ja) | 2020-07-14 | 2024-05-28 | 株式会社リコー | 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム |
-
2015
- 2015-12-27 JP JP2015255533A patent/JP6702629B2/ja active Active
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210319248A1 (en) * | 2018-08-27 | 2021-10-14 | Kyocera Document Solutions Inc. | Ocr system |
US11972197B2 (en) * | 2018-08-27 | 2024-04-30 | Kyocera Document Solutions Inc. | OCR system |
US11321558B2 (en) | 2019-09-12 | 2022-05-03 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium |
JP6856916B1 (ja) * | 2020-01-08 | 2021-04-14 | ジーニアルテクノロジー,インク. | 情報処理装置、情報処理方法及び情報処理プログラム |
JP7420578B2 (ja) | 2020-02-06 | 2024-01-23 | 株式会社Nttデータ | 帳票仕分システム、帳票仕分方法、及びプログラム |
JP2021135670A (ja) * | 2020-02-26 | 2021-09-13 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP2021135671A (ja) * | 2020-02-26 | 2021-09-13 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP7380319B2 (ja) | 2020-02-26 | 2023-11-15 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP2021163363A (ja) * | 2020-04-02 | 2021-10-11 | 株式会社スカイコム | 情報処理装置、データ連携システム、方法およびプログラム |
JP6818923B1 (ja) * | 2020-04-02 | 2021-01-27 | 株式会社スカイコム | 情報処理装置、データ連携システム、方法およびプログラム |
CN111507230A (zh) * | 2020-04-11 | 2020-08-07 | 创景未来(北京)科技有限公司 | 一种文档和表格数据的识别和提取方法及系统 |
JP2023522360A (ja) * | 2020-04-24 | 2023-05-30 | アジャイルソーダ インコーポレイテッド | Ocrベース文書分析システム及び方法 |
JP7444495B2 (ja) | 2020-04-24 | 2024-03-06 | アジャイルソーダ インコーポレイテッド | Ocrベース文書分析システム及び方法 |
JP7491107B2 (ja) | 2020-07-14 | 2024-05-28 | 株式会社リコー | 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム |
CN113468886A (zh) * | 2021-07-28 | 2021-10-01 | 拉扎斯网络科技(上海)有限公司 | 工单处理方法、装置及计算机设备 |
US11568276B1 (en) | 2021-08-25 | 2023-01-31 | International Business Machines Corporation | Adaptive document understanding |
JP7486760B1 (ja) | 2023-08-31 | 2024-05-20 | 株式会社日本ブレーン | 管理装置、管理システム、及び、管理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6702629B2 (ja) | 2020-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6702629B2 (ja) | 活字ocrシステム | |
US10127209B2 (en) | Transforming unstructured documents | |
US7886219B2 (en) | Automatic form generation | |
US20100128922A1 (en) | Automated generation of form definitions from hard-copy forms | |
US20080205742A1 (en) | Generation of randomly structured forms | |
WO2006002009A2 (en) | Document management system with enhanced intelligent document recognition capabilities | |
JP6357621B1 (ja) | 会計処理装置、会計処理システム、会計処理方法及びプログラム | |
WO2007049270A2 (en) | Form data extraction without customization | |
US20150310269A1 (en) | System and Method of Using Dynamic Variance Networks | |
US11321558B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US10430760B2 (en) | Enhancing communications based on physical trade documents | |
EP4168901A1 (en) | System and method for detection and auto-validation of key data in any non-handwritten document | |
US10410168B2 (en) | Preventing restricted trades using physical documents | |
JP2003242441A (ja) | 帳票処理方法および装置並びにプログラム | |
US20170147978A1 (en) | Executing shipments based on physical trade documents | |
JP2018032178A (ja) | 画像形成装置 | |
US20100023517A1 (en) | Method and system for extracting data-points from a data file | |
US20230162517A1 (en) | Interactive visual representation of semantically related extracted data | |
JP2018190064A (ja) | 会計処理システム | |
US9727287B2 (en) | Data transfer system, method of transferring data, and system | |
US10319025B2 (en) | Executing terms of physical trade documents | |
JP2017033296A (ja) | 伝票検索方法、情報処理装置、および伝票検索プログラム | |
JP7484176B2 (ja) | 情報処理装置、情報処理システムおよびプログラム | |
US20240112483A1 (en) | Method and apparatus for form identification and registration | |
CN112823357B (zh) | 对图形图稿文件进行印前检查的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AA64 | Notification of invalidation of claim of internal priority (with term) |
Free format text: JAPANESE INTERMEDIATE CODE: A241764 Effective date: 20160129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160225 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191122 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200403 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200503 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6702629 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |