JP2000357207A5 - 文字認識方法及び文字認識装置 - Google Patents
文字認識方法及び文字認識装置 Download PDFInfo
- Publication number
- JP2000357207A5 JP2000357207A5 JP1999168573A JP16857399A JP2000357207A5 JP 2000357207 A5 JP2000357207 A5 JP 2000357207A5 JP 1999168573 A JP1999168573 A JP 1999168573A JP 16857399 A JP16857399 A JP 16857399A JP 2000357207 A5 JP2000357207 A5 JP 2000357207A5
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- unit
- recognition
- continuous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007781 pre-processing Methods 0.000 claims 6
- 238000000605 extraction Methods 0.000 claims 3
- 230000000875 corresponding Effects 0.000 claims 2
- 239000000284 extract Substances 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000009499 grossing Methods 0.000 claims 1
- 238000000034 method Methods 0.000 claims 1
- 239000000203 mixture Substances 0.000 claims 1
- 230000011218 segmentation Effects 0.000 claims 1
Description
【0001】
【発明の属する技術分野】
本発明は、2文字以上が連続して書かれた続き文字を認識する文字認識方法及び文字認識装置に係り、特に前記続き文字の自動学習を行うことができる文字認識方法及び文字認識装置に関する。
【発明の属する技術分野】
本発明は、2文字以上が連続して書かれた続き文字を認識する文字認識方法及び文字認識装置に係り、特に前記続き文字の自動学習を行うことができる文字認識方法及び文字認識装置に関する。
本発明の目的は、前記従来技術による不具合を除去することであり、多種の連続文字パターンを人手により辞書に登録することなく続き文字の認識を行うことができる文字認識方法及び文字認識装置を提供することである。
次に本装置は、認識辞書105を用いて1文字単位の文字認識を行い、1文字単位の文字認識が不明な場合、前記認識辞書105の接続文字辞書部に格納した連続文字パターンを用いて連続文字の文字パターンの文字認識を行う。
Claims (6)
- 文字を認識するための認識辞書と光学的にスキャンした文字パターンとを比較することにより文字を認識する文字認識方法であって、帳票上に記載された文字が他の文字と接触した部分を含む連続文字群を光学的にスキャンした画像から連続文字パターンを入力し、該連続文字パターンを1文字単位に分割した接触部分を含む接触文字パターンを抽出し、該接触文字パターンの組み合わせにより新たな連続文字パターンを学習して認識辞書に登録し、該認識辞書に登録した連続文字パターンを用いて文字の認識を行うことを特徴とする文字認識方法。
- 前記連続文字パターンを入力する際、前記接続文字群の個々の文字の正解カテゴリと、該カテゴリ対応の接続文字群の文字間の前後の接続有無と接続位置とを含む接続情報とを入力することを特徴とする請求項1記載の文字認識方法。
- 文字を認識するための認識辞書と光学的にスキャンした文字パターンとを比較することにより文字を認識する文字認識装置において、帳票上に記載された文字が他の文字と接触した部分を含む連続文字群を光学的にスキャンした画像から連続文字パターンを入力する画像入力部と、該画像入力部から入力した連続文字パターンを1文字単位に分割した接触部分を含む接触文字パターンを抽出し、該接触文字パターンの組み合わせにより新たな連続文字パターンを学習する接続パターン学習部と、該学習部により学習した連続文字パターンを記憶する認識辞書とを備えることを特徴とする文字認識装置。
- 文字を認識するために標準となる複数の1文字毎の標準文字パターン及び前後の文字と接続する連続部分を含む接続文字パターン他を記憶した認識辞書と、
帳票上に記載された文字が他の文字と接触した部分を含む連続文字群を光学的にスキャンした画像から連続文字パターンを入力する画像入力部と、
前記画像入力部により入力した画像から文字部分の切り出しやノイズ除去を行う前処理部と、
前記切り出した文字パターンから文字の特徴を抽出する特徴抽出部と、
前記入力した文字パターンと前記認識辞書に登録した文字パターンとを比較する整合部と、
前記整合部によって選択された文字を認識結果として出力する結果出力部と、
ユーザーによる書き癖のある文字パターンや続き文字等を入力するためのユーザーインターフェイス部と、
前記ユーザーインターフェイス部から入力された接続文字群の連続文字パターンを元に学習を行う接続パターン学習部とを備え、
前記認識辞書は、認識の基準となる文字について予め当該文字の特徴を取り出し、その特徴を記憶していると共に、続き文字の部分を前記認識辞書に含まれる接続文字辞書部へ登録しており、
前記接続パターン学習部は、前記続き文字の部分の連続文字パターンの登録を行う際、選択した範囲の任意のn個の文字画像を辞書登録ユーザーインターフェイスに表示した状態で、この文字画像における接続文字群の画像を入力すると共に、この接続文字群に対応した接続文字情報をユーザーにより入力し、前記入力した文字画像の文字枠毎の分割を行い、さらに、前記入力した文字パターンを元に他の文字パターンの類推を行い、前記類推が行われた連続文字パターンを前記認識辞書に登録して学習の処理を終了するよう構成され、
前記接続文字情報は、文字の桁数に応じた文字毎の正解カテゴリと、各文字が前の文字と接続するか否かの前接続情報と、各文字が後の文字と接続するか否かの後接続情報と、文字間の接続位置と、記入者氏名と、出現頻度と、連続性と、その他の情報とを含む、
ことを特徴とする文字認識装置。 - 請求項4記載の文字認識装置において、
前記接続パターン学習部は、前記登録時の学習とは別に、読取り業務にて蓄積されたデータを元に登録されたマスクの使用頻度及び記入者毎の接続文字出現頻度等の学習も業務単位毎に自動で行うことを特徴とする文字認識装置。 - 請求項4または5記載の文字認識装置を用いて文字認識を行う文字認識方法であって、
帳票上に書かれた文字を光電変換により電気信号に変換した文字パターンを含む帳票の画像イメージを前記画像入力部より入力し、
この画像イメージを多値のパターンとして前記前処理部に供給し、
前記前処理部は、多値パターンとして供給された帳票イメージを2値化し、1文字毎に文字パターンを切り出し、その際、前記前処理部は、前記切り出した文字パターンの大きさや傾きの正規化並びにノイズを除去するための平滑化等の処理を行い、
前記前処理部により必要な前処理を施された文字パターンは、前記特徴抽出部に送られ、前記特徴抽出部は、前記送られた文字パターンから文字の形状を表す特徴を抽出し、
次に、前記認識辞書を用いて1文字単位の文字認識を行い、1文字単位の文字認識が不明な場合、前記接続文字辞書部に格納した連続文字パターンを用いて連続文字の文字パターンの文字認識を行う、
ことを特徴とする文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11168573A JP2000357207A (ja) | 1999-06-15 | 1999-06-15 | 文字認識方法及び該認識方法を使用した文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11168573A JP2000357207A (ja) | 1999-06-15 | 1999-06-15 | 文字認識方法及び該認識方法を使用した文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000357207A JP2000357207A (ja) | 2000-12-26 |
JP2000357207A5 true JP2000357207A5 (ja) | 2005-07-21 |
Family
ID=15870560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11168573A Pending JP2000357207A (ja) | 1999-06-15 | 1999-06-15 | 文字認識方法及び該認識方法を使用した文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000357207A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102169992B1 (ko) * | 2014-03-17 | 2020-10-26 | 삼성전자주식회사 | 문서의 미 회수를 통지하는 방법 및 장치 |
-
1999
- 1999-06-15 JP JP11168573A patent/JP2000357207A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH08235341A (ja) | ドキュメントファイリング装置および方法 | |
JP2000207489A (ja) | 文字抽出方法、装置および記録媒体 | |
Espinosa-Duro | Fingerprints thinning algorithm | |
JP2000357207A5 (ja) | 文字認識方法及び文字認識装置 | |
KR100449486B1 (ko) | 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법 | |
WO2021192315A1 (ja) | 縞模様画像照合装置、縞模様照合方法、及び、そのプログラムが格納されたコンピュータ可読媒体 | |
JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
RU2340941C2 (ru) | Способ оценки сходства образцов почерка и способы верификации личности и идентификации почерка с использованием данного способа оценки | |
JPS6316795B2 (ja) | ||
JP3199033B2 (ja) | 光学式文字読取方法、及び光学式文字読取装置 | |
JP3645403B2 (ja) | 文字読取装置および文字読取方法 | |
Somyat et al. | Thai Lottery Number Reader App for Blind Lottery Ticket Sellers | |
JP2000357207A (ja) | 文字認識方法及び該認識方法を使用した文字認識装置 | |
WO2012090033A1 (en) | A system and a method for visually aided telephone calls | |
JP2868909B2 (ja) | 指紋照合装置 | |
JP2720995B2 (ja) | 個人照合装置 | |
JP2023034823A (ja) | 画像処理装置、画像処理装置の制御方法およびプログラム | |
Yoo et al. | Mask matching for low resolution musical note recognition | |
JPH1185994A (ja) | 指紋照合方法及び指紋照合装置 | |
Hu et al. | Automatic reading of the white pages in a telephone directory | |
JP2634666B2 (ja) | 個人照合装置 | |
JP2001175808A (ja) | 画像処理装置、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体 | |
JPH02196380A (ja) | 指紋登録装置 | |
JP2004280530A (ja) | 帳票処理システム及び帳票処理方法 | |
JPH08272970A (ja) | 画像認識装置 |