JP2015069256A - 文字識別システム - Google Patents
文字識別システム Download PDFInfo
- Publication number
- JP2015069256A JP2015069256A JP2013200753A JP2013200753A JP2015069256A JP 2015069256 A JP2015069256 A JP 2015069256A JP 2013200753 A JP2013200753 A JP 2013200753A JP 2013200753 A JP2013200753 A JP 2013200753A JP 2015069256 A JP2015069256 A JP 2015069256A
- Authority
- JP
- Japan
- Prior art keywords
- character
- identification
- unit
- recognition
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
Description
疑似モデル生成には、学習するべきパラメータがある。これらのパラメータの学習を実現する一例として自動微分がある。自動微分を用いた学習の構成を図8、図9に示す。
パラメータ学習においては、自動微分と回帰分析や構造化モデリングとの組合せを用いることができる。
更に具体的な処理プロセスを述べるため、学習において、自動微分機構と回帰分析とを併用するための仕組みについて記す。自動微分では「数」と「演算」を独自に定義する。自動微分(Automatic Differentiation)で用いる演算関数例を図9に示す。ここで、プログラム中にある全変数の内、n個の変数が偏微分の対象であるとする。このとき「数」の構造は次のベクトルで表される。
このような機構を導入するのは、学習でのパラメータ調整を柔軟に構成するためである。後述するように、ルール計算を行う上では暗黙的なパラメータが利用される。例えば、文字認識の高次識別として二次判別関数を利用したとする、この時、高次識別辞書に記憶されるパラメータは各カテゴリの分布を表現した二次関数の係数である。図1の文書認識サービスにおいて、申請書の認識を処理した場合、認識辞書(0106)として、この高次識別辞書が使われる。その結果、文字認識が行われ、結果をユーザに提示して、そのフィードバックを得る。その結果、どの文字が認識を間違えたかが分かることになる。その場合、学習プロセス0108において、辞書を更新する。文字認識が間違えたということは、本来正しい判別関数Aの出した尤度を、間違えた判別関数Bが出力した尤度が上回ったことであると解釈できるので、この間違えた判別関数Bを計算するために使ったパラメータを、尤度が下がるように微修正すれば良い。その際に、値の計算と導関数値の計算が同時に処理できる自動微分機構が役に立つ。自動微分機構により、計算値(この場合の尤度)が下げるように、導関数値の値からパラメータの微調整量が計算できる。この結果として、微調整されたパラメータを格納した学習辞書(0109)が作成され、認識辞書(0106)に反映されることとなる。
一般に、勾配法による学習を実装する場合は、固定の関数の定義式(例えばニューロの中間層の計算式や、多項式識別関数のパラメータ重畳など)から、手計算により偏微分方程式を導き、これを元に学習するプログラムを実装する。しかし、ルールの追加、削除は動的に行われ得る。さらに、目標関数についても文字識別精度向上重視か、件数重視かなど変わりえる。目標関数の計算式が動的に変更され得て、それに合せて勾配法によるパラメータ学習を行う必要がある場合は、偏微分方程式も動的に変更しなければならない。
0601…画像入力部、0602…文書構造解析部、0603…文字行抽出部、0604…文字列仮説作成部、0605…文字列表記解析部、0606…テキスト出力部、0601…従来の文書処理システムに入力される紙文書
Claims (6)
- 見本文字画像の入力を受け付ける見本文字画像入力受付部と、
前記見本文字画像に基づいて文字部品を抽出する文字部品抽出部と、
前記文字部品に基づいて擬似文字モデルを生成する擬似文字モデル生成部と、
前記擬似文字モデルに基づいて文字識別パターンを生成して識別辞書を生成する識別辞書生成部と、
を有することを特徴とする文字識別システム。 - 請求項1に記載の文字識別システムであって、
文字画像の入力を受け付ける文字画像入力受付部と、
前記識別辞書を用いて前記文字画像を識別し識別結果を生成する識別部と、
をさらに有することを特徴とする文字識別システム。 - 請求項2に記載の文字識別システムであって、
前記識別結果を出力する識別結果出力と、
前記識別結果の成否情報の入力を受け付ける識別結果成否受付部と、
前記成否情報に基づいて前記識別辞書の前記文字識別パターンを更新するフィードバック部と、
をさらに有することを特徴とする文字識別システム。 - 請求項1に記載の文字識別システムであって、
文字パタンを構成する部品情報を格納した部品情報データベースをさらに有し、
前記文字部品は、筆順情報を含み、
前記文字部品抽出部は、前記筆順情報に基づいて前記文字部品を抽出することを特徴とする文字識別システム。 - 請求項2に記載の文字識別システムであって、
扁旁と文字の関係を示す扁旁情報を格納する扁旁情報データベースと、
前記扁旁情報を用いて前記識別結果に関連する文字を文字候補として抽出する文字候補補間部と、
をさらに有することを特徴とする文字識別システム。 - 請求項2に記載の文字識別システムであって、
文書を撮像して電子画像データに変換するOCR部と、
前記電子画像データに基づいて前記文書の文書構造を特定する文書構造解析部と、
前記文書構造に基づいて読み取り対象となる文字画像を抽出して前記文字画像入力受付部へ入力する文字抽出部と、
をさらに有することを特徴とする文字識別システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013200753A JP2015069256A (ja) | 2013-09-27 | 2013-09-27 | 文字識別システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013200753A JP2015069256A (ja) | 2013-09-27 | 2013-09-27 | 文字識別システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2015069256A true JP2015069256A (ja) | 2015-04-13 |
Family
ID=52835901
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013200753A Pending JP2015069256A (ja) | 2013-09-27 | 2013-09-27 | 文字識別システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2015069256A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019074807A (ja) * | 2017-10-12 | 2019-05-16 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
| JP2019117520A (ja) * | 2017-12-27 | 2019-07-18 | AI inside株式会社 | 文字認識装置、方法およびプログラム |
| JP2020091656A (ja) * | 2018-12-05 | 2020-06-11 | Kddi株式会社 | 学習装置、学習システム、学習方法及び学習プログラム |
| WO2020218512A1 (ja) * | 2019-04-26 | 2020-10-29 | Arithmer株式会社 | 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム |
| JPWO2021059329A1 (ja) * | 2019-09-24 | 2021-04-01 | ||
| US20220406082A1 (en) * | 2021-06-16 | 2022-12-22 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58151685A (ja) * | 1982-03-04 | 1983-09-08 | Ricoh Co Ltd | 文字認識装置 |
| JPS62271191A (ja) * | 1986-05-20 | 1987-11-25 | Canon Inc | パタ−ン認識装置 |
| JPH01189788A (ja) * | 1988-01-25 | 1989-07-28 | Toshiba Corp | 文字読取装置 |
| JPH0757046A (ja) * | 1993-08-11 | 1995-03-03 | Nec Corp | 文字認識装置における文書画像記憶方式 |
| JP2001265317A (ja) * | 2000-03-23 | 2001-09-28 | Riso Kagaku Corp | ビットマップフォント、ビットマップフォント作成方法および装置、専用フォント文字を用いた文書データ作成方法および装置並びに文字認識方法および装置 |
| JP2002216075A (ja) * | 2001-01-17 | 2002-08-02 | Nippon Digital Kenkyusho:Kk | 辞書学習方法及び辞書学習プログラム |
-
2013
- 2013-09-27 JP JP2013200753A patent/JP2015069256A/ja active Pending
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58151685A (ja) * | 1982-03-04 | 1983-09-08 | Ricoh Co Ltd | 文字認識装置 |
| JPS62271191A (ja) * | 1986-05-20 | 1987-11-25 | Canon Inc | パタ−ン認識装置 |
| JPH01189788A (ja) * | 1988-01-25 | 1989-07-28 | Toshiba Corp | 文字読取装置 |
| JPH0757046A (ja) * | 1993-08-11 | 1995-03-03 | Nec Corp | 文字認識装置における文書画像記憶方式 |
| JP2001265317A (ja) * | 2000-03-23 | 2001-09-28 | Riso Kagaku Corp | ビットマップフォント、ビットマップフォント作成方法および装置、専用フォント文字を用いた文書データ作成方法および装置並びに文字認識方法および装置 |
| JP2002216075A (ja) * | 2001-01-17 | 2002-08-02 | Nippon Digital Kenkyusho:Kk | 辞書学習方法及び辞書学習プログラム |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019074807A (ja) * | 2017-10-12 | 2019-05-16 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
| JP7021496B2 (ja) | 2017-10-12 | 2022-02-17 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
| JP2019117520A (ja) * | 2017-12-27 | 2019-07-18 | AI inside株式会社 | 文字認識装置、方法およびプログラム |
| JP2020091656A (ja) * | 2018-12-05 | 2020-06-11 | Kddi株式会社 | 学習装置、学習システム、学習方法及び学習プログラム |
| WO2020218512A1 (ja) * | 2019-04-26 | 2020-10-29 | Arithmer株式会社 | 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム |
| JPWO2021059329A1 (ja) * | 2019-09-24 | 2021-04-01 | ||
| JP7342961B2 (ja) | 2019-09-24 | 2023-09-12 | 日本電気株式会社 | 情報収集装置、情報収集方法、及びプログラム |
| US20220406082A1 (en) * | 2021-06-16 | 2022-12-22 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium |
| US12300010B2 (en) | 2021-06-16 | 2025-05-13 | Canon Kabushiki Kaisha | Training of neural networks in which deformation processing of training data is adjusted so that deformed character images are not too similar to character images of another class |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11501061B2 (en) | Extracting structured information from a document containing filled form images | |
| US20210366055A1 (en) | Systems and methods for generating accurate transaction data and manipulation | |
| US9152883B2 (en) | System and method for increasing the accuracy of optical character recognition (OCR) | |
| CN110135427A (zh) | 用于识别图像中的字符的方法、装置、设备和介质 | |
| CN108984578A (zh) | 计算机、文档识别方法以及系统 | |
| CN110178139A (zh) | 使用具有注意力机制的全卷积神经网络的字符识别的系统和方法 | |
| CN113469067B (zh) | 一种文档解析方法、装置、计算机设备和存储介质 | |
| US20250061278A1 (en) | Adaptive natural language processing model training with quality assessment | |
| US20210256052A1 (en) | Image search method, apparatus, and device | |
| JP2015069256A (ja) | 文字識別システム | |
| CN114612921A (zh) | 表单识别方法、装置、电子设备和计算机可读介质 | |
| WO2022038821A1 (ja) | 表構造認識装置及び方法 | |
| WO2014068770A1 (ja) | データ抽出方法、データ抽出装置及びそのプログラム | |
| CN114418124A (zh) | 生成图神经网络模型的方法、装置、设备及存储介质 | |
| Ganai et al. | A novel holistic unconstrained handwritten urdu recognition system using convolutional neural networks | |
| CN116311298A (zh) | 信息生成方法、信息处理方法、装置、电子设备以及介质 | |
| US20250225804A1 (en) | Method of extracting information from an image of a document | |
| CN117009595A (zh) | 文本段落获取方法及其装置、存储介质、程序产品 | |
| CN120470165A (zh) | 一种保险证件的数据管理方法、系统及智能终端 | |
| Khan et al. | Analysis of cursive text recognition systems: A systematic literature review | |
| CN118070789A (zh) | 一种信息抽取方法及装置 | |
| Alzuru et al. | Cooperative human-machine data extraction from biological collections | |
| Pillai et al. | Document layout analysis using detection transformers | |
| Koushik et al. | Equation detection in the camera captured handwritten document | |
| JP2007280413A (ja) | 財務諸表自動入力装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160517 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20170110 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20170112 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170407 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170509 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20171121 |
