JP5669044B2 - 文書検定システム及び文書検定方法 - Google Patents
文書検定システム及び文書検定方法 Download PDFInfo
- Publication number
- JP5669044B2 JP5669044B2 JP2011059988A JP2011059988A JP5669044B2 JP 5669044 B2 JP5669044 B2 JP 5669044B2 JP 2011059988 A JP2011059988 A JP 2011059988A JP 2011059988 A JP2011059988 A JP 2011059988A JP 5669044 B2 JP5669044 B2 JP 5669044B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- document
- coordinate
- character string
- coordinates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
次に、第1の実施形態の変形例について説明する。この変形例では、図2のチェックマーク付与時間抽出処理(ステップ204)、及び、直近筆記箇所の活字文字行を抽出する処理(ステップ212)において、項目定義辞書163を用いて比較対象の文書・図面間の文字を対応付ける。
次に、第2の実施形態について説明する。
次に、第3の実施形態について説明する。
12 表示装置
13 プロセッサ(CPU)
14 印刷装置
15 ワークエリア
16 データ保持手段
17 通信インターフェース
21 ファイルサーバ
110 入力装置
Claims (14)
- 文書中の座標を取得する座標取得装置と、
二つの文書を照合するサーバと、を備えた文書検定システムであって、
前記サーバは、プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、インターフェースとを備え、
前記サーバは、
第1の文書から取得された第1の座標と、第2の文書から取得された第2の座標とを対応付ける座標対応付け部と、
前記第1の文書において前記第1の座標の近傍の第1の文字列、及び、前記第2の文書において前記第2の座標の近傍の第2の文字列を抽出する文字抽出部と、
前記抽出された第1及び第2の文字列から文字を認識する文字認識部と、
前記第1の文字列の認識結果に基づいて、前記第2の文字列の認識精度を検定する検定部とを備え、
前記検定部は、
前記第1の文字列から認識された文字から文字候補を切り出して、仮説候補ネットワークを生成し、
前記第2の文字列から認識された文字を用いて、前記生成された仮説候補ネットワークのスコアを計算し、
前記計算された仮説候補ネットワークのスコアを所定の閾値と比較することによって、前記第2の文字列の文字の認識精度を検定することを特徴とする文書検定システム。 - 前記文字抽出部は、
前記第1及び第2の座標から所定の距離の領域内の画素の連結成分を抽出し、
前記抽出された連結成分のうち、所定長を超える長さの連結成分を除去したものを、第1及び第2の文字列として抽出することを特徴とする請求項1に記載の文書検定システム。 - 前記文字抽出部が、前記除去された連結成分の角度を測定し、前記測定された角度だけ前記抽出された文字列を回転させた後、前記文字認識部が、前記回転された文字列を認識することを特徴とする請求項2に記載の文書検定システム。
- 前記文字抽出部は、複数の前記連結成分が除去された場合、前記除去された連結成分毎に当該連結成分の角度を測定し、前記測定された複数の角度だけ前記抽出された文字列を回転させ、その後、前記文字認識部が、前記複数の角度回転された文字列を認識することを特徴とする請求項3に記載の文字検定システム。
- 前記文書検定システムは、前記抽出された文字に対応する単位を特定し、当該単位によって表される数値を変換する単位変換部を備え、
前記文字認識部は、前記変換された数値を認識することを特徴とする請求項1に記載の文書検定システム。 - 前記座標取得装置は、前記文書中の座標を、該座標を取得した時刻と共に取得し、
前記座標対応付け部は、前記座標取得時刻が当該第1の座標の取得時刻の直前又は直後に取得された、及び、前記座標取得時刻が当該第1の座標の取得時刻から所定の時間内に取得された、の少なくとも一つの条件を満たすものを前記第2の座標とすることを特徴とする請求項1に記載の文書検定システム。 - 前記文書検定システムは、前記第1及び第2の文書の記載項目レイアウトの情報を含む定義情報にアクセス可能であって、
前記座標対応付け部は、前記定義情報を参照して、前記第1の座標と前記第2の座標とのペアを作成することを特徴とする請求項1に記載の文書検定システム。 - プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、文書中の座標を取得する座標取得装置と接続されるインターフェースとを備える文書検定システムにおける文書検定方法であって、
前記プロセッサが、第1の文書から取得された第1の座標と、第2の文書から取得された第2の座標とを対応付けるステップと、
前記プロセッサが、前記第1の文書において前記第1の座標の近傍の第1の文字列、及び、前記第2の文書において前記第2の座標の近傍の第2の文字列を抽出するステップと、
前記プロセッサが、前記抽出された第1及び第2の文字列から文字を認識するステップと、
前記プロセッサが、前記第1の文字列の認識結果に基づいて、前記第2の文字列の認識精度を検定するステップと、を含み、
前記認識精度を検定するステップでは、
前記第1の文字列から認識された文字から文字候補を切り出して、仮説候補ネットワークを生成し、
前記第2の文字列から認識された文字を用いて、前記生成された仮説候補ネットワークのスコアを計算し、
前記計算された仮説候補ネットワークのスコアを所定の閾値と比較することによって、前記第2の文字列の文字の認識精度を検定することを特徴とする文書検定方法。 - 前記文字列を抽出するステップでは、
前記第1及び第2の座標から所定の距離の領域内の画素の連結成分を抽出し、
前記抽出された連結成分のうち、所定長を超える長さの連結成分を除去したものを、第1及び第2の文字列として抽出することを特徴とする請求項8に記載の文書検定方法。 - 前記文字列を抽出するステップでは、前記除去された連結成分の角度を測定し、前記測定された角度だけ前記抽出された文字列を回転させ、
その後、前記文字を認識するステップでは、前記回転された文字列を認識することを特徴とする請求項9に記載の文書検定方法。 - 前記文字列を抽出するステップでは、複数の前記連結成分が除去された場合、前記除去された連結成分毎に当該連結成分の角度を測定し、前記測定された複数の角度だけ前記抽出された文字列を回転させ、
その後、前記文字を認識するステップでは、前記複数の角度回転された文字列を認識することを特徴とする請求項10に記載の文字検定方法。 - 前記方法は、さらに、前記抽出された文字に対応する単位を特定し、当該単位によって表される数値を変換するステップを含み、
前記文字を認識するステップでは、前記変換された数値を認識することを特徴とする請求項8に記載の文書検定方法。 - 前記座標取得装置は、前記文書中の座標を、該座標を取得した時刻と共に取得し、
前記座標を対応付るステップでは、前記座標取得時刻が当該第1の座標の取得時刻の直前又は直後に取得された、及び、前記座標取得時刻が当該第1の座標の取得時刻から所定の時間内に取得された、の少なくとも一つの条件を満たすものを前記第2の座標とすることを特徴とする請求項8に記載の文書検定方法。 - 前記文書検定システムは、前記第1及び第2の文書の記載項目レイアウトの情報を含む定義情報にアクセス可能であって、
前記座標を対応付けるステップでは、前記定義情報を参照して、前記第1の座標と前記第2の座標とのペアを作成することを特徴とする請求項8に記載の文書検定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011059988A JP5669044B2 (ja) | 2011-03-18 | 2011-03-18 | 文書検定システム及び文書検定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011059988A JP5669044B2 (ja) | 2011-03-18 | 2011-03-18 | 文書検定システム及び文書検定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012194932A JP2012194932A (ja) | 2012-10-11 |
JP5669044B2 true JP5669044B2 (ja) | 2015-02-12 |
Family
ID=47086726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011059988A Expired - Fee Related JP5669044B2 (ja) | 2011-03-18 | 2011-03-18 | 文書検定システム及び文書検定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5669044B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7122896B2 (ja) * | 2018-07-17 | 2022-08-22 | 株式会社豆蔵 | 帳票情報処理装置、帳票情報構造化処理方法及び帳票情報構造化処理プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06131466A (ja) * | 1992-10-21 | 1994-05-13 | Meidensha Corp | パターン認識方法および装置 |
JP3768743B2 (ja) * | 1999-09-20 | 2006-04-19 | 株式会社東芝 | ドキュメント画像処理装置及びドキュメント画像処理方法 |
JP2004259076A (ja) * | 2003-02-27 | 2004-09-16 | Hitachi Ltd | 画像認識方法及び装置 |
JP2005352582A (ja) * | 2004-06-08 | 2005-12-22 | Matsushita Electric Ind Co Ltd | スライド同定装置、スライド同定方法、スライド同定用プログラム |
JP2008134683A (ja) * | 2006-11-27 | 2008-06-12 | Fuji Xerox Co Ltd | 画像処理装置および画像処理プログラム |
-
2011
- 2011-03-18 JP JP2011059988A patent/JP5669044B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012194932A (ja) | 2012-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI321294B (en) | Method and device for determining at least one recognition candidate for a handwritten pattern | |
US10049096B2 (en) | System and method of template creation for a data extraction tool | |
JP4661921B2 (ja) | 文書処理装置およびプログラム | |
JP2012083951A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN111310426A (zh) | 基于ocr的表格版式恢复方法、装置及存储介质 | |
JP2021043775A (ja) | 情報処理装置及びプログラム | |
CN111340020A (zh) | 一种公式识别方法、装置、设备及存储介质 | |
JP2008021068A (ja) | 帳票認識装置及び帳票認識プログラム | |
JP4834351B2 (ja) | 文字認識装置及び文字認識方法 | |
JP4672692B2 (ja) | 単語認識システムおよび単語認識プログラム | |
JP2008234291A (ja) | 文字認識装置及び文字認識方法 | |
JP5669044B2 (ja) | 文書検定システム及び文書検定方法 | |
JP5669041B2 (ja) | 文書処理装置及び文書処理方法 | |
JP5677139B2 (ja) | 帳票文字認識装置 | |
JP6624120B2 (ja) | 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体 | |
JP6310155B2 (ja) | 文字認識装置、文字認識方法及び文字認識プログラム | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP5712415B2 (ja) | 帳票処理システム及び帳票処理方法 | |
JP5169648B2 (ja) | 原画像探索装置及び原画像探索プログラム | |
JP6007720B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2022095391A (ja) | 情報処理装置、及び情報処理プログラム | |
JPWO2020044537A1 (ja) | 画像照合装置、画像照合方法、及びプログラム | |
US20230123071A1 (en) | Techniques for modifying markings on a digitized document | |
US11710331B2 (en) | Systems and methods for separating ligature characters in digitized document images | |
EP4036871A1 (en) | Image processing apparatus, image processing method, program and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130612 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140625 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141118 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5669044 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |