JP2021152689A - 情報処理装置、情報処理方法、プログラムおよび順序情報 - Google Patents
情報処理装置、情報処理方法、プログラムおよび順序情報 Download PDFInfo
- Publication number
- JP2021152689A JP2021152689A JP2020052183A JP2020052183A JP2021152689A JP 2021152689 A JP2021152689 A JP 2021152689A JP 2020052183 A JP2020052183 A JP 2020052183A JP 2020052183 A JP2020052183 A JP 2020052183A JP 2021152689 A JP2021152689 A JP 2021152689A
- Authority
- JP
- Japan
- Prior art keywords
- meta information
- information
- recognition
- order
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/803—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/10—Recognition assisted with metadata
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
Abstract
Description
メタ情報を用いた認識精度の低下は、以下のような場合に生じうる。例えばカタカナ名フィールドに「マイケル」と記入され、メタ情報として「カタカナ名」が指定されたとする。しかし、カタカナ名に紐づけられた認識処理が「マイケル」のような外国人の名前を想定していなかった場合、認識精度が低下する。
(M1)メタ情報ごとに文字列認識モデルを用意する。文字列認識モデルは、例えばニューラルネットワークおよび隠れマルコフモデル(HMM:Hidden Markov Model)である。
(M2)字形の認識にはメタ情報によらない共通のアルゴリズムを用いて複数の候補を推定し、事後的な文字列候補の選択時にメタ情報によって異なる順位付け処理を行う。
(M3)文字列画像に加えてメタ情報をベクトルとして入力可能な文字列認識モデルを用いる。例えばメタ情報と文字列画像とを入力し、認識結果を出力するニューラルネットワークを文字列認識モデルとして用いることができる。
メタ情報を示す順序情報は、1つのみでなく、N個以上(Nは2以上の整数)であってもよい。例えば、図2(図3)に示す順序情報と、図6に示す順序情報との2つの順序情報が用いられてもよい。この場合、記憶部121は、2種類のメタ情報(フィールドタイム、字形)にそれぞれ対応する、有向非巡回グラフで表された2つの順序情報を記憶する。
ユーザの入力するメタ情報は、重みづけされた複数のメタ情報であってもよい。例えば図2では、「住所」の重みとして「1.0」、「カタカナ名」の重みとして「0.6」のようにメタ情報に重みが付与される。
第1の実施形態では、1つのメタ情報の接続先が1つ以下である場合を説明した。第2の実施形態では、1つのメタ情報の接続先が2つ以上の場合について説明する。
g(wi、si)=w×s ・・・(1)
m*=argmaxi(g(wi、si)) ・・・(2)
第3の実施形態にかかる情報処理装置は、メタ情報の順序を示す順序情報を修正する機能を備える。
これまでは、順序情報を用いてメタ情報を修正することにより、メタ情報を用いた文字認識処理の精度を向上させる例を説明した。順序情報を用いる処理は認識処理に限られない。第4の実施形態にかかる情報処理装置は、順序情報を用いてメタ情報を推定する推定処理の精度を向上させる例を説明する。
第1の実施形態の変形例1と同様に、メタ情報を示す順序情報は、1つのみでなく、N個以上(Nは2以上の整数)であってもよい。推定部106−4は、N個の順序情報それぞれについて、先端ノードから順にメタ情報を選択し、認識部102に入力する。推定部106−4は、N個の順序情報それぞれについて確信度が最良となるメタ情報を推定して出力する。
101 受付部
102、102−2 認識部
103、103−2,103−3 更新部
104 出力制御部
105−3 修正部
106−4 推定部
111 表示部
121、121−2、121−3 記憶部
Claims (19)
- 認識対象とする文字に対する複数のメタ情報間の順序を定めた順序情報を記憶する記憶部と、
複数の前記メタ情報のうち指定された第1メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識部と、
前記文字認識の確信度が予め定められた条件を満たす場合に、前記順序情報に従って、前記第1メタ情報を第2メタ情報に更新する更新部と、を備え、
前記認識部は、更新された前記第2メタ情報を用いて前記文字認識を実行する、
情報処理装置。 - 前記順序情報は、複数の前記メタ情報をノードとし、有向エッジで前記ノード間を接続した有向非巡回グラフで表され、
前記更新部は、前記第1メタ情報を、前記第1メタ情報と前記有向エッジで接続される前記第2メタ情報に更新する、
請求項1に記載の情報処理装置。 - 前記認識部は、前記第1メタ情報と前記画像とを入力し、認識結果を出力するニューラルネットワークを用いて前記文字認識を実行する、
請求項1に記載の情報処理装置。 - 前記記憶部は、N個(Nは2以上の整数)の順序情報を記憶し、
前記認識部は、N個の前記順序情報で定められるN個のメタ情報のそれぞれから指定されたN個の第1メタ情報を用いて前記文字認識を実行する、
請求項1に記載の情報処理装置。 - 前記順序情報は、複数の前記メタ情報をノードとし、重みが付与された有向エッジで前記ノード間を接続した有向非巡回グラフで表され、
前記更新部は、前記重みと前記確信度とから求められる評価値に基づいて、前記第1メタ情報を第2メタ情報に更新する、
請求項1に記載の情報処理装置。 - 前記認識部は、重みが付与された複数の前記メタ情報のうち指定された第1メタ情報を用いて前記文字認識を実行し、
前記更新部は、前記重みと前記確信度とから求められる評価値が予め定められた条件を満たす場合に、前記順序情報に従って、前記第1メタ情報を前記第2メタ情報に更新する、
請求項1に記載の情報処理装置。 - 前記更新部による更新の履歴に基づいて、前記順序情報が定める複数のメタ情報間の順序の少なくとも一部を修正する修正部をさらに備える、
請求項1に記載の情報処理装置。 - 前記順序情報が定める順序に従い前記メタ情報を表示部に表示する出力制御部をさらに備える、
請求項1に記載の情報処理装置。 - 認識対象とする文字に対する複数のメタ情報のうち指定された第1メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
前記文字認識の確信度が予め定められた条件を満たす場合に、複数の前記メタ情報間の順序を定めた順序情報に従って、前記第1メタ情報を第2メタ情報に更新する更新ステップと、を含み、
前記認識ステップは、更新された前記第2メタ情報を用いて前記文字認識を実行する、
情報処理方法。 - コンピュータに、
認識対象とする文字に対する複数のメタ情報のうち指定された第1メタ情報を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
前記文字認識の確信度が予め定められた条件を満たす場合に、複数の前記メタ情報間の順序を定めた順序情報に従って、前記第1メタ情報を第2メタ情報に更新する更新ステップと、を実行させ、
前記認識ステップは、更新された前記第2メタ情報を用いて前記文字認識を実行する、
プログラム。 - 認識対象とする文字に対する複数のメタ情報間の順序を定めた順序情報を記憶する記憶部と、
複数の前記メタ情報のうち指定された第1メタ情報と、前記順序情報および前記第1メタ情報に基づいて選択された1以上の第2メタ情報と、を用いて、文字列を含む画像に対して文字認識を実行する認識部と、
前記第1メタ情報に対する前記文字認識の確信度と、前記第2メタ情報に対する前記文字認識の確信度と、に基づいて、前記画像に含まれる前記文字列のメタ情報を推定する推定部と、
を備える情報処理装置。 - 前記推定部は、前記第1メタ情報に対する前記文字認識の確信度および前記第2メタ情報に対する前記文字認識の確信度のうち、他の確信度より良い確信度に対応するメタ情報を、前記画像に含まれる前記文字列のメタ情報として推定する、
請求項11に記載の情報処理装置。 - 前記認識部は、前記メタ情報と前記画像とを入力し、認識結果を出力するニューラルネットワークを用いて前記文字認識を実行する、
請求項11に記載の情報処理装置。 - 前記記憶部は、N個(Nは2以上の整数)の順序情報を記憶し、
前記認識部は、N個の前記順序情報で定められるN個のメタ情報のそれぞれから指定されたN個の第1メタ情報を用いて前記文字認識を実行する、
請求項11に記載の情報処理装置。 - 認識対象とする文字に対する複数のメタ情報のうち指定された第1メタ情報と、複数の前記メタ情報の順序を定めた順序情報および前記第1メタ情報に基づいて選択された1以上の第2メタ情報と、を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
前記第1メタ情報に対する前記文字認識の確信度と、前記第2メタ情報に対する前記文字認識の確信度と、に基づいて、前記画像に含まれる前記文字列のメタ情報を推定する推定ステップと、
を含む情報処理方法。 - コンピュータに、
認識対象とする文字に対する複数のメタ情報のうち指定された第1メタ情報と、複数の前記メタ情報の順序を定めた順序情報および前記第1メタ情報に基づいて選択された1以上の第2メタ情報と、を用いて、文字列を含む画像に対して文字認識を実行する認識ステップと、
前記第1メタ情報に対する前記文字認識の確信度と、前記第2メタ情報に対する前記文字認識の確信度と、に基づいて、前記画像に含まれる前記文字列のメタ情報を推定する推定ステップと、
を実行させるためのプログラム。 - ハードウェア回路および記憶部を備える情報処理装置に用いられ、前記記憶部に記憶される文字認識用の順序情報であって、
認識対象とする文字に対する複数のメタ情報をノードとし、有向エッジで前記ノード間を接続した有向非巡回グラフで表される、
順序情報。 - 前記ハードウェア回路が、
複数の前記メタ情報のうち指定された第1メタ情報を用いて、文字列を含む画像に対して前記文字認識を実行する、
請求項17に記載の順序情報。 - 前記ハードウェア回路が、
前記文字認識の確信度が予め定められた条件を満たす場合に、前記順序情報に従って、前記第1メタ情報を、前記第1メタ情報から有向エッジで接続される第2メタ情報に更新する、
請求項18に記載の順序情報。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020052183A JP6798055B1 (ja) | 2020-03-24 | 2020-03-24 | 情報処理装置、情報処理方法、プログラムおよび順序情報 |
CN202180020395.XA CN115298707A (zh) | 2020-03-24 | 2021-02-26 | 信息处理装置、信息处理方法、程序及顺序信息 |
PCT/JP2021/007410 WO2021192818A1 (ja) | 2020-03-24 | 2021-02-26 | 情報処理装置、情報処理方法、プログラムおよび順序情報 |
US17/942,858 US20230005282A1 (en) | 2020-03-24 | 2022-09-12 | Information processing apparatus, information processing method, computer program product, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020052183A JP6798055B1 (ja) | 2020-03-24 | 2020-03-24 | 情報処理装置、情報処理方法、プログラムおよび順序情報 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6798055B1 JP6798055B1 (ja) | 2020-12-09 |
JP2021152689A true JP2021152689A (ja) | 2021-09-30 |
Family
ID=73646807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020052183A Active JP6798055B1 (ja) | 2020-03-24 | 2020-03-24 | 情報処理装置、情報処理方法、プログラムおよび順序情報 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230005282A1 (ja) |
JP (1) | JP6798055B1 (ja) |
CN (1) | CN115298707A (ja) |
WO (1) | WO2021192818A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6118080A (ja) * | 1984-07-05 | 1986-01-25 | Fujitsu Ltd | 文字認識装置 |
JPH06150061A (ja) * | 1992-11-04 | 1994-05-31 | Sharp Corp | 文書認識装置 |
JPH08190603A (ja) * | 1995-01-10 | 1996-07-23 | Sanyo Electric Co Ltd | 文字認識装置及びその候補文字表示方法 |
JP2003044785A (ja) * | 2001-07-30 | 2003-02-14 | Toshiba Corp | 文字認識装置、文字認識方法およびプログラム |
JP2013164728A (ja) * | 2012-02-10 | 2013-08-22 | Canon Inc | 画像内の文字に係る言語を判定する情報処理装置 |
-
2020
- 2020-03-24 JP JP2020052183A patent/JP6798055B1/ja active Active
-
2021
- 2021-02-26 CN CN202180020395.XA patent/CN115298707A/zh active Pending
- 2021-02-26 WO PCT/JP2021/007410 patent/WO2021192818A1/ja active Application Filing
-
2022
- 2022-09-12 US US17/942,858 patent/US20230005282A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6118080A (ja) * | 1984-07-05 | 1986-01-25 | Fujitsu Ltd | 文字認識装置 |
JPH06150061A (ja) * | 1992-11-04 | 1994-05-31 | Sharp Corp | 文書認識装置 |
JPH08190603A (ja) * | 1995-01-10 | 1996-07-23 | Sanyo Electric Co Ltd | 文字認識装置及びその候補文字表示方法 |
JP2003044785A (ja) * | 2001-07-30 | 2003-02-14 | Toshiba Corp | 文字認識装置、文字認識方法およびプログラム |
JP2013164728A (ja) * | 2012-02-10 | 2013-08-22 | Canon Inc | 画像内の文字に係る言語を判定する情報処理装置 |
Non-Patent Citations (1)
Title |
---|
丹羽 寿男: "パターンと記号の統合化処理による文字認識", 電子情報通信学会論文誌 (J78−D−II) 第2号, vol. 78, no. 2, JPN6020031871, 25 February 1995 (1995-02-25), JP, pages 263 - 271, ISSN: 0004334559 * |
Also Published As
Publication number | Publication date |
---|---|
CN115298707A (zh) | 2022-11-04 |
JP6798055B1 (ja) | 2020-12-09 |
US20230005282A1 (en) | 2023-01-05 |
WO2021192818A1 (ja) | 2021-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6492239B2 (ja) | テキスト入力のためのシステム及び方法 | |
JP3998668B2 (ja) | 形態素解析装置、方法及びプログラム | |
WO2018005203A1 (en) | Leveraging information available in a corpus for data parsing and predicting | |
CN111368918B (zh) | 文本纠错方法、装置、电子设备及存储介质 | |
JP7149721B2 (ja) | 情報処理装置、文字認識エンジン最適化方法及びプログラム | |
CN109885180B (zh) | 纠错方法和装置、计算机可读介质 | |
US9280725B2 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
TWI567569B (zh) | Natural language processing systems, natural language processing methods, and natural language processing programs | |
JP2019169025A (ja) | 情報処理装置、文字認識エンジン選択方法及びプログラム | |
JP2018194919A (ja) | 学習プログラム、学習方法及び学習装置 | |
JP2019204214A (ja) | 学習装置、学習方法、プログラム及び推定装置 | |
EP2138959A1 (en) | Word recognizing method and word recognizing program | |
US11797551B2 (en) | Document retrieval apparatus, document retrieval system, document retrieval program, and document retrieval method | |
WO2016181470A1 (ja) | 認識装置、認識方法およびプログラム | |
US7756872B2 (en) | Searching device and program product | |
JP6798055B1 (ja) | 情報処理装置、情報処理方法、プログラムおよび順序情報 | |
CN112000495A (zh) | 用于兴趣点信息管理的方法、电子设备和存储介质 | |
CN116433474A (zh) | 模型训练方法、字体迁移方法、装置及介质 | |
CN114580391A (zh) | 中文错误检测模型训练方法、装置、设备及存储介质 | |
CN115917527A (zh) | 文档检索装置、文档检索系统、文档检索程序、以及文档检索方法 | |
JP6320089B2 (ja) | 認識装置、認識方法およびプログラム | |
CN107203512B (zh) | 用于从用户的自然语言输入中提取关键元素的方法 | |
CN116738973B (zh) | 一种搜索意图识别方法、构建预测模型的方法和电子设备 | |
JPH06223121A (ja) | 情報検索装置 | |
JP2002008000A (ja) | データ分類学習方法、データ分類方法、データ分類学習装置、データ分類装置、データ分類学習プログラムを記録した記録媒体、データ分類プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200324 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200324 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200813 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201009 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201020 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6798055 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |