JP2023044206A - 文字認識装置、文字認識方法、および文字認識プログラム - Google Patents
文字認識装置、文字認識方法、および文字認識プログラム Download PDFInfo
- Publication number
- JP2023044206A JP2023044206A JP2021152112A JP2021152112A JP2023044206A JP 2023044206 A JP2023044206 A JP 2023044206A JP 2021152112 A JP2021152112 A JP 2021152112A JP 2021152112 A JP2021152112 A JP 2021152112A JP 2023044206 A JP2023044206 A JP 2023044206A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- likeness
- proofreading
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 19
- 238000012937 correction Methods 0.000 claims abstract description 30
- 238000003780 insertion Methods 0.000 claims abstract description 16
- 230000037431 insertion Effects 0.000 claims abstract description 16
- 230000001915 proofreading effect Effects 0.000 claims description 151
- 238000013528 artificial neural network Methods 0.000 claims description 89
- 238000009795 derivation Methods 0.000 claims description 70
- 238000000605 extraction Methods 0.000 claims description 44
- 239000000284 extract Substances 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 12
- 238000011144 upstream manufacturing Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 30
- 230000006870 function Effects 0.000 description 26
- 238000012545 processing Methods 0.000 description 14
- 230000010365 information processing Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 239000013067 intermediate product Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
Description
22 行抽出部
22A 第1導出部
22B 抽出部
24 文字列認識部
Claims (10)
- 文字を記入された記録媒体の画像に含まれる、文字列と前記文字列に付帯された訂正文字および挿入文字の少なくとも一方である校正用文字とを同一行とした行ごとの第1行画像領域から、前記校正用文字によって校正された前記文字列の文字認識結果を出力する文字列認識部、
を備える文字認識装置。 - 前記文字列認識部は、
前記第1行画像領域に含まれる校正記号を付与された校正対象文字と、該校正対象文字に対して文字列方向の上流側および下流側の少なくとも一方に配置された文字との関係に基づいて、前記校正対象文字を文字認識対象とした、前記文字認識結果を出力する、
請求項1に記載の文字認識装置。 - 前記文字列認識部は、
前記第1行画像領域を入力とし前記文字認識結果を出力とする第1ニューラルネットワークを用いて、前記文字認識結果を出力する、
請求項1または請求項2に記載の文字認識装置。 - 前記画像から前記第1行画像領域を抽出する行抽出部を備え、
前記文字列認識部は、
抽出された前記第1行画像領域から前記文字認識結果を出力する、
請求項1~請求項3の何れか1項に記載の文字認識装置。 - 前記行抽出部は、
第2ニューラルネットワークを用いて、前記画像の画素領域ごとに文字領域らしさを導出する第1導出部と、
前記文字領域らしさに応じて前記画像から前記第1行画像領域を抽出する抽出部と、
を有し、
前記第2ニューラルネットワークは、
前記抽出部において前記画像から前記第1行画像領域が抽出される前記文字領域らしさを出力するように、予め学習されてなる、
請求項4に記載の文字認識装置。 - 前記行抽出部は、
第3ニューラルネットワークを用いて、前記画像の画素領域ごとに、校正記号らしさを導出する第2導出部を更に有し、
前記第2ニューラルネットワークは、
前記画像および前記校正記号らしさまたは前記画像から前記校正記号らしさを算出する過程で計算される特徴量ベクトルから、前記抽出部において前記画像から前記第1行画像領域が抽出される前記文字領域らしさを出力するように、予め学習されてなる、
請求項5に記載の文字認識装置。 - 前記第2導出部は、
前記第3ニューラルネットワークを用いて、前記画像の画素領域ごとに、前記校正記号らしさと、推定認識文字らしさおよび背景領域らしさの少なくとも一方と、を導出し、
前記第2ニューラルネットワークは、
前記画像と、前記校正記号らしさと、前記推定認識文字らしさおよび前記背景領域らしさの少なくとも一方または前記画像から前記校正記号らしさと、推定認識文字らしさおよび背景領域らしさの少なくとも一方とを算出する過程で計算される特徴量ベクトルと、から、前記抽出部において前記画像から前記第1行画像領域が抽出される前記文字領域らしさを出力するように、予め学習されてなる、
請求項6に記載の文字認識装置。 - 前記第2ニューラルネットワークは、
校正文字機能が有効状態に設定されている場合、
前記抽出部において前記画像から前記第1行画像領域が抽出される前記文字領域らしさである第1文字領域らしさを出力し、
校正用文字機能が無効状態に設定されている場合、
前記抽出部において前記画像から前記文字列と前記文字列に付帯された前記校正用文字とを異なる行とした行ごとの第2行画像領域が抽出される第2文字領域らしさを出力するように、あらかじめ学習されてなる、
請求項5~請求項7の何れか1項に記載の文字認識装置。 - 文字を記入された記録媒体の画像に含まれる、文字列と前記文字列に付帯された訂正文字および挿入文字の少なくとも一方である校正用文字とを同一行とした行ごとの第1行画像領域から、前記校正用文字によって校正された前記文字列の文字認識結果を出力するステップ、
を含む文字認識方法。 - 文字を記入された記録媒体の画像に含まれる、文字列と前記文字列に付帯された訂正文字および挿入文字の少なくとも一方である校正用文字とを同一行とした行ごとの第1行画像領域から、前記校正用文字によって校正された前記文字列の文字認識結果を出力するステップをコンピュータに実行させるための文字認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021152112A JP7098808B1 (ja) | 2021-09-17 | 2021-09-17 | 文字認識装置、文字認識方法、および文字認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021152112A JP7098808B1 (ja) | 2021-09-17 | 2021-09-17 | 文字認識装置、文字認識方法、および文字認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7098808B1 JP7098808B1 (ja) | 2022-07-11 |
JP2023044206A true JP2023044206A (ja) | 2023-03-30 |
Family
ID=82361474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021152112A Active JP7098808B1 (ja) | 2021-09-17 | 2021-09-17 | 文字認識装置、文字認識方法、および文字認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7098808B1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6136874A (ja) * | 1984-07-30 | 1986-02-21 | Hitachi Ltd | 光学文字読取装置における訂正文字処理方法 |
JPH07282186A (ja) * | 1994-04-14 | 1995-10-27 | Hitachi Ltd | 訂正部処理方法 |
JPH0916712A (ja) * | 1995-06-27 | 1997-01-17 | Oki Electric Ind Co Ltd | 文書読取装置 |
JPH10116315A (ja) * | 1996-10-11 | 1998-05-06 | Nec Eng Ltd | 帳票及びそれを用いる光学的文字読取装置 |
JP2002170077A (ja) * | 2000-11-30 | 2002-06-14 | Toshiba Corp | 文字認識装置及び文字認識方法 |
JP2020123811A (ja) * | 2019-01-30 | 2020-08-13 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置及び画像処理装置の制御方法 |
-
2021
- 2021-09-17 JP JP2021152112A patent/JP7098808B1/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6136874A (ja) * | 1984-07-30 | 1986-02-21 | Hitachi Ltd | 光学文字読取装置における訂正文字処理方法 |
JPH07282186A (ja) * | 1994-04-14 | 1995-10-27 | Hitachi Ltd | 訂正部処理方法 |
JPH0916712A (ja) * | 1995-06-27 | 1997-01-17 | Oki Electric Ind Co Ltd | 文書読取装置 |
JPH10116315A (ja) * | 1996-10-11 | 1998-05-06 | Nec Eng Ltd | 帳票及びそれを用いる光学的文字読取装置 |
JP2002170077A (ja) * | 2000-11-30 | 2002-06-14 | Toshiba Corp | 文字認識装置及び文字認識方法 |
JP2020123811A (ja) * | 2019-01-30 | 2020-08-13 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置及び画像処理装置の制御方法 |
Also Published As
Publication number | Publication date |
---|---|
JP7098808B1 (ja) | 2022-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106570456B (zh) | 基于全卷积递归网络的手写汉字文本识别方法 | |
CN109190131B (zh) | 一种基于神经机器翻译的英语单词及其大小写联合预测方法 | |
CN111226222B (zh) | 使用人工神经网络的基于深度上下文的语法错误校正 | |
Akmeliawati et al. | Real-time Malaysian sign language translation using colour segmentation and neural network | |
JP4331219B2 (ja) | 二言語単語対応付けの方法および装置、二言語単語対応モデルを訓練する方法および装置 | |
CN109858488B (zh) | 一种基于样本增强的手写样本识别方法与系统 | |
Kaluri et al. | Optimized feature extraction for precise sign gesture recognition using self-improved genetic algorithm | |
CN111914825B (zh) | 文字识别方法、装置及电子设备 | |
CN113657098B (zh) | 文本纠错方法、装置、设备及存储介质 | |
CN111598087A (zh) | 不规则文字的识别方法、装置、计算机设备及存储介质 | |
CN113408535A (zh) | 一种基于中文字符级特征和语言模型的ocr纠错方法 | |
KR20200132619A (ko) | 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법 및 그 장치 | |
CN110263631B (zh) | 一种手写化学公式识别与配平方法 | |
JP2023044206A (ja) | 文字認識装置、文字認識方法、および文字認識プログラム | |
WO2019092868A1 (ja) | 情報処理装置、情報処理方法及びコンピュータ読み取り可能な記録媒体 | |
CN102646201A (zh) | 字符识别设备和字符识别方法 | |
Shwetha et al. | Comparison of smoothing techniques and recognition methods for online Kannada character recognition system | |
CN112070793A (zh) | 一种目标提取方法及装置 | |
KR102542220B1 (ko) | 자가 지식 증류법 기반 의미론적 영상 분할 방법 및 자가 지식 증류법 기반 의미론적 영상 분할 장치 | |
CN110929013A (zh) | 一种基于bottom-up attention和定位信息融合的图片问答实现方法 | |
JP2023043910A (ja) | 文字列抽出装置、文字列抽出方法、および文字列抽出プログラム | |
CN115620314A (zh) | 文本识别方法、答案文本的验证方法、装置、设备及介质 | |
US20220207900A1 (en) | Information processing apparatus, information processing method, and storage medium | |
CN113392772B (zh) | 一种面向文字识别的文字图像收缩变形增强方法 | |
JP7422535B2 (ja) | 変換装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210922 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210922 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220531 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7098808 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |