JPH02101596A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH02101596A JPH02101596A JP63253914A JP25391488A JPH02101596A JP H02101596 A JPH02101596 A JP H02101596A JP 63253914 A JP63253914 A JP 63253914A JP 25391488 A JP25391488 A JP 25391488A JP H02101596 A JPH02101596 A JP H02101596A
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- processing
- characters
- special character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000012805 post-processing Methods 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 4
- 238000001514 detection method Methods 0.000 abstract description 16
- 238000006467 substitution reaction Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 9
- 238000012790 confirmation Methods 0.000 description 7
- 238000000034 method Methods 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[4a 要1
漢字、かな、カタカナ、英数字、記号などが混在した文
字列を対象とする文字認識装置に関し、 従来の単語間字種統一処理を行う文字認識装置において
は、「第〜」や「〜号」といった番号情報が文字の前後
に伴う場合、該番号情報が誤読されやすかったという問
題の解決を目的とし、 番号情報を伴う文字として予め選択された文字群を保有
する特殊文字テーブルと、該特殊文字テーブルに基づき
、上記単語辞書との照合により確定し得なかった部分の
文字から特殊文字を抽出する特殊文字抽出部と、該特殊
文字抽出部により抽出された文字の前部又は後部の文字
を対象とする後処理部とを設けて構成する。
字列を対象とする文字認識装置に関し、 従来の単語間字種統一処理を行う文字認識装置において
は、「第〜」や「〜号」といった番号情報が文字の前後
に伴う場合、該番号情報が誤読されやすかったという問
題の解決を目的とし、 番号情報を伴う文字として予め選択された文字群を保有
する特殊文字テーブルと、該特殊文字テーブルに基づき
、上記単語辞書との照合により確定し得なかった部分の
文字から特殊文字を抽出する特殊文字抽出部と、該特殊
文字抽出部により抽出された文字の前部又は後部の文字
を対象とする後処理部とを設けて構成する。
[産業上の利用分野]
本発明は、漢字、かな、カタカナ、英数字及び記号など
が混在する文字列を対象とする文字認識装置に関し、特
に文字列中の番号情報(数字及び順番を示すアルファベ
ット等の記号を意味する)の認識結果の正続率を向上さ
せる後処理方式に関する。
が混在する文字列を対象とする文字認識装置に関し、特
に文字列中の番号情報(数字及び順番を示すアルファベ
ット等の記号を意味する)の認識結果の正続率を向上さ
せる後処理方式に関する。
[従来の技術]
近年、オンライン手書き文字認識技術の向上とともに、
文字認識技術を利用した住所入力システムなどが開発さ
れている。このようなシステムでは、一般ユーザが対象
であるため、入力文字の品質が低い上に、高認識率が要
求される。
文字認識技術を利用した住所入力システムなどが開発さ
れている。このようなシステムでは、一般ユーザが対象
であるため、入力文字の品質が低い上に、高認識率が要
求される。
そのため、効率的な後処理方式の開発が望まれている。
従来の処理方式としては、単語間字種統一を行う文字認
識装置があり、 第5図はこの従来の単語間字種統一による後処理部を有
する文字認識装置の原理説明図を示しており、51は単
語辞書照合部、52は単語辞書、53は単語間検出部、
54は統一字種検出部、55は候補置換部を表わしてい
る。
識装置があり、 第5図はこの従来の単語間字種統一による後処理部を有
する文字認識装置の原理説明図を示しており、51は単
語辞書照合部、52は単語辞書、53は単語間検出部、
54は統一字種検出部、55は候補置換部を表わしてい
る。
入力部より入力された文字列はまず特徴抽出部(図示せ
ず)により特徴抽出がなされ、認識部(図示せず)によ
り認識結果としての候補テーブルが得られる。
ず)により特徴抽出がなされ、認識部(図示せず)によ
り認識結果としての候補テーブルが得られる。
該認識結果の候補テーブルは、単語辞書照合部51に入
力され、該単語辞書照合部51は認識結果の候補テーブ
ルと単語辞書52を照合し、照合度の高い単語が1位に
くるように候補を入れ換える。その際、単語辞書と照合
した部分については、確定フラグをたてる。
力され、該単語辞書照合部51は認識結果の候補テーブ
ルと単語辞書52を照合し、照合度の高い単語が1位に
くるように候補を入れ換える。その際、単語辞書と照合
した部分については、確定フラグをたてる。
次に単語間検出部53は、連続して確定フラグがたって
いない部分を検出する。
いない部分を検出する。
統一字種検出部54は、単語間検出部53が検出した部
分の1位の候補の字種で、最も頻度の高い字種を検出す
る。
分の1位の候補の字種で、最も頻度の高い字種を検出す
る。
候補置換部55は、統一字種検出部54が検出した字種
の候補が1位にくるように候補テーブルの候補を入れ換
える。
の候補が1位にくるように候補テーブルの候補を入れ換
える。
以上説明したごとく、従来の単語間字種統一処理を用い
た文字認識装置においては、単語辞書に含まれないため
に今まで救済できなかった誤読文字を、前後の文字の字
種と統一を図ることにより、誤読から救済し得るという
利点があり優れた方式であるが、一部問題点も残ってい
る。
た文字認識装置においては、単語辞書に含まれないため
に今まで救済できなかった誤読文字を、前後の文字の字
種と統一を図ることにより、誤読から救済し得るという
利点があり優れた方式であるが、一部問題点も残ってい
る。
(例)第2中川ビル:第2中川ピル
(2) 誤読の方が多いと悪化してしまう。
(例)メグロバウス202号:メグロバウス202号
→ メグロバウス702号 という問題点があった。
→ メグロバウス702号 という問題点があった。
本発明は上記問題点に濫みなされたものであり、従来番
号情報が誤読されやすかったという問題を解決し得る文
字認識装置を提供することを目的とする。
号情報が誤読されやすかったという問題を解決し得る文
字認識装置を提供することを目的とする。
[発明が解決しようとする課題]
例えば、住所入力を例に考えると、方書き部分には、「
第〜」や「〜号」といった番号情報が多く含まれるが、
この番号の部分が誤読されやすく、しかも全ての組合わ
せを単語辞書として整備することはできない。
第〜」や「〜号」といった番号情報が多く含まれるが、
この番号の部分が誤読されやすく、しかも全ての組合わ
せを単語辞書として整備することはできない。
そのため字種情報を利用した処理が施されることになる
が、前述した従来の単語間字種統一処理では、 (1) 1文字の誤読は救済できない。
が、前述した従来の単語間字種統一処理では、 (1) 1文字の誤読は救済できない。
[課題を解決するための手段]
認識結果に対して、先ず単語辞書による後処理を実施し
、辞書内の単語と照合した文字については、確定フラグ
をたてる。その結果に対して、確定フラグが立っていな
い文字について、「第」、「号」等の番号情報を伴なう
特殊文字を第1位の候補に持つ文字を抽出し、各特殊文
字に与えられている属性に従って前または後ろの文字に
対して後処理を施す。
、辞書内の単語と照合した文字については、確定フラグ
をたてる。その結果に対して、確定フラグが立っていな
い文字について、「第」、「号」等の番号情報を伴なう
特殊文字を第1位の候補に持つ文字を抽出し、各特殊文
字に与えられている属性に従って前または後ろの文字に
対して後処理を施す。
第1図に本発明による原理図を示す。
■は単語辞書照合部、2は単語辞書、3は特殊文字抽出
部、4は特殊文字テーブル、5は特殊文字に対する後処
理部、5aは番号情報検出部、5bは候補置換部である
。
部、4は特殊文字テーブル、5は特殊文字に対する後処
理部、5aは番号情報検出部、5bは候補置換部である
。
単語辞書照合部lは認識結果の候補テーブルと単語辞書
2を照合し、照合度の高い単語が1位にくるように候補
を入れ換える。
2を照合し、照合度の高い単語が1位にくるように候補
を入れ換える。
その際、単語辞書と照合した部分については、確定フラ
グをたてる。
グをたてる。
次に特殊文字抽出部3は、確定フラグがたっていない文
字について順次、特殊文字テーブル4に予め与えられて
いる特殊文字を第1位の候補に持つ文字を検出する。
字について順次、特殊文字テーブル4に予め与えられて
いる特殊文字を第1位の候補に持つ文字を検出する。
第2図に特殊文字テーブルのデータ例を示す。
テーブルには、特殊文字処理を行う対象の文字コードと
、処理の属性(前向き、後ろ向き、漢数字有効、アルフ
ァベット有効)が与えられている。例えば、「第」は「
第二」といった漢数字表記、「棟」は「A棟」のごとく
アルファベットが使用されろため、通常の数字以外の字
種も番号として検出可能にする必要がある。
、処理の属性(前向き、後ろ向き、漢数字有効、アルフ
ァベット有効)が与えられている。例えば、「第」は「
第二」といった漢数字表記、「棟」は「A棟」のごとく
アルファベットが使用されろため、通常の数字以外の字
種も番号として検出可能にする必要がある。
次に特殊文字に対する後処理部5について説明する。
後処理部5は番号情報検出部5a及び候補置換部5bで
構成され、番号情報検出部5aは特殊文字テーブル4に
与えられている属性に従って、該特殊文字の前あるいは
、後ろの文字が確定フラグが立っていない場合に、属性
で与えられた字種(数字漢数字、アルファベット)の候
補を検出する。
構成され、番号情報検出部5aは特殊文字テーブル4に
与えられている属性に従って、該特殊文字の前あるいは
、後ろの文字が確定フラグが立っていない場合に、属性
で与えられた字種(数字漢数字、アルファベット)の候
補を検出する。
候補置換部5bは、番号情報検出部5aで検出した候補
が1位となるように候補の入れ換えを行う。
が1位となるように候補の入れ換えを行う。
該番号情報検出は、確定フラグが立っている文字に到達
するか、あるいは所定の候補が検出されなくなるまで、
連続して行なわれる。
するか、あるいは所定の候補が検出されなくなるまで、
連続して行なわれる。
[作 用コ
本発明による処理の一例を第3図に示す。
第3図(a)は認識結果の候補テーブル、わ)は単語辞
書による後処理結果の候補テーブル、(C)は特殊文字
処理の後処理結果の候補テーブルである。
書による後処理結果の候補テーブル、(C)は特殊文字
処理の後処理結果の候補テーブルである。
単語照合部1は、(a)の候補テーブルと単語辞書2を
照合して、単語「メグ口」、「ハウス」を検出する。こ
こでは、各単語ともすべての文字が1位にあるため、候
補の交換は行わないが、確定フラグを立てる。
照合して、単語「メグ口」、「ハウス」を検出する。こ
こでは、各単語ともすべての文字が1位にあるため、候
補の交換は行わないが、確定フラグを立てる。
特殊文字検出部3は、わ)の候補テーブルの確定フラグ
が立っていない文字の1位の候補を、順次、テーブル4
のコードと照合し、「号」を検出する。
が立っていない文字の1位の候補を、順次、テーブル4
のコードと照合し、「号」を検出する。
特殊文字テーブルの「号」の属性には、第2図に示すご
とく前向き処理が指定されているため、番号情報検出部
5aは「号」の前の文字について番号検出を行う。「号
」の直前の文字の確定フラグが立っていないので、候補
の検出を行う。この場合、特殊文字テーブルには属性と
して何も与えられていないため、数字の候補として、第
2位の「2」を検出し、候補置換部5hにおいて候補の
入れ換えを行い、確定フラグを立てる。
とく前向き処理が指定されているため、番号情報検出部
5aは「号」の前の文字について番号検出を行う。「号
」の直前の文字の確定フラグが立っていないので、候補
の検出を行う。この場合、特殊文字テーブルには属性と
して何も与えられていないため、数字の候補として、第
2位の「2」を検出し、候補置換部5hにおいて候補の
入れ換えを行い、確定フラグを立てる。
以下同様に「0」、「2」の後処理を実施し、確定フラ
グが立っている「ス」で処理を終了する。
グが立っている「ス」で処理を終了する。
番号検出が成功した場合に、特殊文字「号」の確定フラ
グを立てて、処理を終了する。
グを立てて、処理を終了する。
[実施例]
第4図に、本発明の一実施例を示す。
6は入力部、7は特徴抽出部、8は照合部、9は認識辞
書、10は後処理部、11は表示部である。
書、10は後処理部、11は表示部である。
入力部6より入力されたストロークデータに対して、特
徴抽出部7により特徴を抽出した結果を、認識辞書9と
照合し、認識候補列を生成する。後処理部lOでは、ま
ず単語辞書による後処理を実施し、次に第1図で説明し
た本発明の原理に基づき、認識候補の置換を実施し、表
示部11に認識結果として第1位の候補を表示する。
徴抽出部7により特徴を抽出した結果を、認識辞書9と
照合し、認識候補列を生成する。後処理部lOでは、ま
ず単語辞書による後処理を実施し、次に第1図で説明し
た本発明の原理に基づき、認識候補の置換を実施し、表
示部11に認識結果として第1位の候補を表示する。
[効 果]
本発明によれば、単語長1文字で誤読した番号情報や、
誤読の方が多いために悪化した番号情報の誤読からの救
済が可能となる。
誤読の方が多いために悪化した番号情報の誤読からの救
済が可能となる。
第1図は本発明の原理説明図、
第2図は特殊文字テーブルのデータ例を示す図、第3図
は本発明による後処理例を示す図、第4図は本発明の一
実施例を示す図、 第5図は従来の文字認識装置の原理説明図である。 ■・・・・・・単語辞書照合部、2・・・・・・単語辞
書、3・・・・・・特殊文字抽出部、4・・・・・・特
殊文字テーブル、5・・・・・・特殊文字に対する後処
理部、5a・・・・・・番号情報検出部、5b・・・・
・・候補置換部、6・・・・・・入力部、7・・・・・
・特徴抽出部、8・・・・・・照合部、9・・・・・・
認識辞書、10・・・・・・後処理部、11・・・・・
・表示部、本発明の原理図 第1因 特殊文字テーブルのデータ例を示す口 筒2図 本発明の一実施例を示す図 第4図 従来の文字認2カ置の原理説明図 第5図
は本発明による後処理例を示す図、第4図は本発明の一
実施例を示す図、 第5図は従来の文字認識装置の原理説明図である。 ■・・・・・・単語辞書照合部、2・・・・・・単語辞
書、3・・・・・・特殊文字抽出部、4・・・・・・特
殊文字テーブル、5・・・・・・特殊文字に対する後処
理部、5a・・・・・・番号情報検出部、5b・・・・
・・候補置換部、6・・・・・・入力部、7・・・・・
・特徴抽出部、8・・・・・・照合部、9・・・・・・
認識辞書、10・・・・・・後処理部、11・・・・・
・表示部、本発明の原理図 第1因 特殊文字テーブルのデータ例を示す口 筒2図 本発明の一実施例を示す図 第4図 従来の文字認2カ置の原理説明図 第5図
Claims (1)
- 【特許請求の範囲】 1、入力される文字列中の各入力文字について複数の候
補の認識結果を生成する認識部と、単語辞書との照合に
より上記複数の候補の認識結果の順位を確定するための
後処理部とを有する文字認識装置において、 番号情報を伴う文字として予め選択された文字群を保有
する特殊文字テーブルと、 該特殊文字テーブルに基づき、上記単語辞書との照合に
より確定し得なかった部分の文字から特殊文字を抽出す
る特殊文字抽出部と、該特殊文字抽出部により抽出され
た文字の前部又は後部の文字を対象とする後処理部とを
設けたことを特徴とする文字認識装置。 2、特殊文字テーブル中の各文字に対しては、該文字と
番号情報との処理関係を規定する1または複数の属性を
選択付与することを特徴とする請求項1記載の文字認識
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63253914A JPH02101596A (ja) | 1988-10-11 | 1988-10-11 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63253914A JPH02101596A (ja) | 1988-10-11 | 1988-10-11 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH02101596A true JPH02101596A (ja) | 1990-04-13 |
Family
ID=17257793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63253914A Pending JPH02101596A (ja) | 1988-10-11 | 1988-10-11 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH02101596A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11120293A (ja) * | 1997-10-16 | 1999-04-30 | Fujitsu Ltd | 文字認識/修正方式 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61107486A (ja) * | 1984-10-31 | 1986-05-26 | Fujitsu Ltd | 文字認識後処理方式 |
JPS63153689A (ja) * | 1986-08-26 | 1988-06-27 | Nec Corp | 住所読取装置 |
-
1988
- 1988-10-11 JP JP63253914A patent/JPH02101596A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61107486A (ja) * | 1984-10-31 | 1986-05-26 | Fujitsu Ltd | 文字認識後処理方式 |
JPS63153689A (ja) * | 1986-08-26 | 1988-06-27 | Nec Corp | 住所読取装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11120293A (ja) * | 1997-10-16 | 1999-04-30 | Fujitsu Ltd | 文字認識/修正方式 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5161245A (en) | Pattern recognition system having inter-pattern spacing correction | |
US4991094A (en) | Method for language-independent text tokenization using a character categorization | |
CN104933030B (zh) | 一种维吾尔语拼写检查方法及装置 | |
JPH02101596A (ja) | 文字認識装置 | |
JPS6239793B2 (ja) | ||
JPH0520794B2 (ja) | ||
KR940007345B1 (ko) | 온라인 한글 필기체 문자의 인식방법 | |
JPS5842904B2 (ja) | 手書きカナ・漢字の文字認識装置 | |
JPH0366704B2 (ja) | ||
KR100258934B1 (ko) | 군집화된 알파벳 추출에 의한 온라인 영문 단어 인식장치 및방법 | |
JP2503259B2 (ja) | 全角,半角文字の決定方法 | |
JPH0282380A (ja) | 文字認識方法 | |
JPS63268082A (ja) | パタ−ン認識装置 | |
JPH11120294A (ja) | 文字認識装置および媒体 | |
KR940003828B1 (ko) | 온라인 필기체 한글인식 방법 | |
JP3365537B2 (ja) | オンライン文字認識方法および装置 | |
JPS6356756A (ja) | コレクト機能付欧文作成装置 | |
JPS6059487A (ja) | 手書文字認識装置 | |
JPH0391094A (ja) | 文字認識装置 | |
JPS60225987A (ja) | パタ−ン認識装置 | |
JPS60128579A (ja) | 情報認識方法 | |
JPS62285189A (ja) | 文字認識後処理方式 | |
JP2002149641A (ja) | 手書文字認識装置、及び手書文字認識プログラムを記録した記録媒体 | |
JPS6398767A (ja) | 中文入力チエツク方式 | |
JPS6293776A (ja) | 情報認識装置 |