JP4466241B2 - 文書処理手法及び文書処理装置 - Google Patents
文書処理手法及び文書処理装置 Download PDFInfo
- Publication number
- JP4466241B2 JP4466241B2 JP2004205361A JP2004205361A JP4466241B2 JP 4466241 B2 JP4466241 B2 JP 4466241B2 JP 2004205361 A JP2004205361 A JP 2004205361A JP 2004205361 A JP2004205361 A JP 2004205361A JP 4466241 B2 JP4466241 B2 JP 4466241B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- document
- recognition
- string block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
ここまでで説明した処理は、以下の手順においてユーザが選択する領域・認識モードなどに基づく認識処理のいわば前処理であり、ユーザが選択する可能性のある領域全体に対して非選択的に行われる。
文字列表記解析処理と文字列仮説については、図8及び図9に概要がある。図8は文字列仮説と表記知識を使った文字列認識の流れを説明した図である。また、図9は、文字列仮説の概念とデータの詳細を示した図である。
0201…認識対象領域(文字列ブロック群)選択部、0202…文字切出部、0203…文字識別部、0204…表記解析部、0205…認識結果統合部、0206…文字識別辞書、0207…表記知識辞書、
0301…業務関連処理制御部、0302…曖昧性対応部、0303…文書検索部、0304…文書データベース、0305…曖昧性対応部、0306…情報検索部、0307…業務データベース、
0401…文書表示装置における画像入力装置、0402…文書表示装置における操作端末装置、0403…文書表示装置における表示端末装置、0404…文書表示装置における外部記憶装置、0405…文書表示装置におけるメモリ、0406…文書表示装置における中央演算装置、0407…文書表示装置における通信装置、0408…文書表示装置における内部バス、0409…データ通信線、0410…業務処理装置における外部記憶装置、0411…業務処理装置におけるメモリ、0412…業務処理装置における中央演算装置、0413…業務処理装置における通信装置、0414…業務処理装置における内部バス、
0501…処理対象とする文書画像の例、0502…文書画像から抽出された罫線、0503…文書画像から抽出された文字列ブロック、0504…配置構造解析の結果タグが付けられた文字列ブロック、0505…マウス・電子ペン等のカーソル、0506…クリック認識の結果、
0601…マウス・電子ペン等のカーソル、0602…カーソルの動きを表す矢印、0603…選択領域をGUIで表示した横線、0604…選択領域をGUIで表示した縦線、0605…選択領域をGUIで外接矩形として表示した囲み線、0606…選択領域をGUIで丸として表示した囲み線、0607…ジェスチャを行った場合の動線、0608…ジェスチャの結果選択された領域を示す囲み線、
0701…配置構造情報、0702…配置構造情報のAカテゴリ、0703…配置構造情報のBカテゴリ、0704…配置構造情報のCカテゴリ、0705…配置構造情報のDカテゴリ、0706…カーソルの動き(当該場所でクリック)、0707…認識モード指定とカーソルのクリック位置による領域選択1、0708…認識モード指定とカーソルのクリック位置による領域選択2、0709…認識モード指定とカーソルのクリック位置による領域選択3、0710…カーソルの動き(当該場所でのドラッグ・ライン)、0711…認識モード指定とカーソルのドラッグ・ライン位置による領域選択、
0901…切り出された文字パタン及び識別候補(グラフアーク)、0902…文字切出の境界(グラフノード)、0903…文字識別候補群、0904…文字識別候補に対応する識別類似度群、0905…知識処理の結果選択された文字識別候補。
Claims (2)
- 文字が記載された文書画像の入力を受付ける画像入力装置と、中央演算装置と、配置構造定義および記載内容カテゴリに対応して用意される表記知識を保持する記憶装置と、表示デバイスとユーザ入力デバイスとを有する操作端末装置と、通信装置とを備えた対話型の文書処理装置であって、上記中央演算装置では、入力された文書画像から複数の文字列ブロックを抽出し、各文字列ブロックの文書上における二次元的な配置構造を解析して該配置構造をもとに上記配置構造定義を参照することで該文字列ブロックの記載内容を表す記載内容カテゴリを推定し、更に上記操作端末装置の入力部において上記対話型文書処理装置の利用者から認識処理の起動を指示する操作の入力を受けた場合に、指定対象である文字列ブロックを選択し、該文字列ブロックより文字の切出候補を抽出し、さらに上記文字切出候補を文字識別し、該文字識別結果および該文字切出候補に対して、上記に選択した該文字列ブロックに対応する記載内容カテゴリに関連する表記知識を参照して該文字列ブロックの認識を行うことを特徴とする文書処理装置であって、
上記中央演算装置ではさらに、マウス、電子ペン、及びタッチパッドなどのユーザ入力デバイスと、および、ブラウン管ディスプレイ、液晶ディスプレイ、携帯表示端末などの表示デバイスから成る上記表示操作端末装置を通して、カーソル移動、クリック、ドラッグ、ジェスチャ等のイベントを認識処理の起動指示として受理し、更に上記記憶装置に記憶された認識モードの指定状況によって、認識対象とする文字列ブロックの選択方法の切り替えを行い、選択された該文字列ブロックに対応する表記知識を該文字列ブロックの記載内容カテゴリに応じて切り替えて文字列の認識を行い、上記表示デバイスによる読取結果の出力形式を上記認識モードに応じて切り替えることを特徴とする文書処理装置。 - 文字が記載された文書画像の入力を受付ける画像入力装置と、中央演算装置と、配置構造定義および記載内容カテゴリに対応して用意される表記知識を保持する記憶装置と、表示デバイスとユーザ入力デバイスとを有する操作端末装置と、通信装置とを備えた対話型の文書処理装置であって、上記中央演算装置では、入力された文書画像から複数の文字列ブロックを抽出し、各文字列ブロックの文書上における二次元的な配置構造を解析して該配置構造をもとに上記配置構造定義を参照することで該文字列ブロックの記載内容を表す記載内容カテゴリを推定し、更に上記操作端末装置の入力部において上記対話型文書処理装置の利用者から認識処理の起動を指示する操作の入力を受けた場合に、指定対象である文字列ブロックを選択し、該文字列ブロックより文字の切出候補を抽出し、さらに上記文字切出候補を文字識別し、該文字識別結果および該文字切出候補に対して、上記に選択した該文字列ブロックに対応する記載内容カテゴリに関連する表記知識を参照して該文字列ブロックの認識を行うことを特徴とする文書処理装置であって、
上記中央演算装置ではさらに、上記文字列ブロックの記載内容の推定により記載内容カテゴリの候補を複数列挙し、該記載内容カテゴリの尤度を計算し、上記文字切出候補を抽出し、上記文字識別により文字識別結果及び当該識別結果の類似度の計算を行い、推定された該文字列ブロックの該記載内容カテゴリの尤度、および該文字識別結果の類似度、及び該記載内容カテゴリに対応する表記知識を適用することにより得られた文字列ブロックの読取結果であるテキストを併せて文字列ブロックの読取結果とし、該文字列ブロックの該読取結果を尤度の順に整列し、複数の読取結果として上記記憶装置に記憶する、もしくは上記通信装置を通して別の文書処理装置に読取結果をデータ送付することを特徴とする文書処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004205361A JP4466241B2 (ja) | 2004-07-13 | 2004-07-13 | 文書処理手法及び文書処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004205361A JP4466241B2 (ja) | 2004-07-13 | 2004-07-13 | 文書処理手法及び文書処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006031129A JP2006031129A (ja) | 2006-02-02 |
JP4466241B2 true JP4466241B2 (ja) | 2010-05-26 |
Family
ID=35897440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004205361A Expired - Fee Related JP4466241B2 (ja) | 2004-07-13 | 2004-07-13 | 文書処理手法及び文書処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4466241B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6038215B2 (ja) * | 2015-03-25 | 2016-12-07 | 株式会社リクルートホールディングス | コンピュータプログラム、情報検索システム、及びその制御方法 |
US11494588B2 (en) | 2020-03-06 | 2022-11-08 | International Business Machines Corporation | Ground truth generation for image segmentation |
US11361146B2 (en) | 2020-03-06 | 2022-06-14 | International Business Machines Corporation | Memory-efficient document processing |
US11495038B2 (en) * | 2020-03-06 | 2022-11-08 | International Business Machines Corporation | Digital image processing |
US11556852B2 (en) | 2020-03-06 | 2023-01-17 | International Business Machines Corporation | Efficient ground truth annotation |
-
2004
- 2004-07-13 JP JP2004205361A patent/JP4466241B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006031129A (ja) | 2006-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20070098263A1 (en) | Data entry apparatus and program therefor | |
US5669007A (en) | Method and system for analyzing the logical structure of a document | |
US5850490A (en) | Analyzing an image of a document using alternative positionings of a class of segments | |
KR102473543B1 (ko) | 디지털 잉크 상호작용을 위한 시스템 및 방법 | |
US8015203B2 (en) | Document recognizing apparatus and method | |
NO20161728A1 (en) | Written text transformer | |
US8224090B2 (en) | Apparatus and method for analyzing and determining correlation of information in a document | |
US20080025618A1 (en) | Form processing method, form processing device, and computer product | |
KR20180077152A (ko) | 핸드라이팅 입력을 가이드하는 시스템 및 방법 | |
CN112434691A (zh) | 基于智能解析识别的hs编码匹配、展示方法、系统及存储介质 | |
JP2005135041A (ja) | 文書検索・閲覧手法及び文書検索・閲覧装置 | |
US10699112B1 (en) | Identification of key segments in document images | |
JP2021043478A (ja) | 情報処理装置、その制御方法及びプログラム | |
He et al. | User-assisted archive document image analysis for digital library construction | |
US20110013806A1 (en) | Methods of object search and recognition | |
Hoffswell et al. | Interactive repair of tables extracted from pdf documents on mobile devices | |
JP4466241B2 (ja) | 文書処理手法及び文書処理装置 | |
Dölek et al. | A deep learning model for Ottoman OCR | |
RU2398276C2 (ru) | Альтернативы анализа в контекстных деревьях | |
JP2022035594A (ja) | 表構造認識装置及び表構造認識方法 | |
US20230023636A1 (en) | Methods and systems for preparing unstructured data for statistical analysis using electronic characters | |
WO2014068770A1 (ja) | データ抽出方法、データ抽出装置及びそのプログラム | |
Alzuru et al. | Cooperative human-machine data extraction from biological collections | |
US20220198127A1 (en) | Enhancement aware text transition | |
Wu et al. | Automatic semantic knowledge extraction from electronic forms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060424 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070629 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091117 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100202 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100215 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |