JPH0711820B2 - オンライン文字認識装置 - Google Patents

オンライン文字認識装置

Info

Publication number
JPH0711820B2
JPH0711820B2 JP60278893A JP27889385A JPH0711820B2 JP H0711820 B2 JPH0711820 B2 JP H0711820B2 JP 60278893 A JP60278893 A JP 60278893A JP 27889385 A JP27889385 A JP 27889385A JP H0711820 B2 JPH0711820 B2 JP H0711820B2
Authority
JP
Japan
Prior art keywords
character
character type
type
symbol string
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60278893A
Other languages
English (en)
Other versions
JPS62138989A (ja
Inventor
鉄郎 関
安雄 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP60278893A priority Critical patent/JPH0711820B2/ja
Publication of JPS62138989A publication Critical patent/JPS62138989A/ja
Publication of JPH0711820B2 publication Critical patent/JPH0711820B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は漢字かな混りの手書文字日本文を実時間で認識
するオンライン文字認識装置に関し、特に異なる字種で
形状の類似した文字を容易かつ、正確に判別することの
できるオンライン文字認識装置に関する。
(従来の技術) 異なる字種で形状の類似した文字には例えば次のような
ものがある。
従来、漢字、ひらがな、カタカナ、英字、数字、記号等
が混在する手書文字列を実時間で認識するオンライン文
字認識装置において、上記のような異なる字種で形状の
類似した文字を判別するには、次のような方法が用いら
れた。
(1)筆記者は文字の入力直後に表示部をチェックし、
もし入力意図と異なる字種の文字が表示されれば、次候
補キーを押下して目的の文字を入力する。
(2)筆記者に目的の文字または文章の入力以外にその
文字または文体がいずれの字種に属するかを入力させ
る。
(3)入力された文字列を文章構造より解析し、その文
字が漢字であるか、ひらがなであるか、カタカナである
か、記号であるか等を判別する。
(発明が解決しようとする問題点) しかしながら、上記述べた方法のうち(1)及び(2)
の方法には筆記者の操作が面倒であるという欠点があ
り、(3)の方法には解析を行うためのソフトウェアが
複雑となり装置価格が高くなるという欠点があった。
本発明は、このような従来技術の欠点を解消するために
なされたものであって、操作上のわずらわしさがなく、
複雑なソフトウェアを用いることなく、簡単な方法で、
“異なる字種で形状の類似した文字”を容易に判別する
ことのできるオンライン文字認識装置を提供することを
目的とする。
(問題点を解決するための手段) 本発明は、手書文字を入力するためのタブレットと、該
タブレットからの文字データを予め定められた基準文字
データと比較照合することにより入力文字の認識を行う
認識部と、該認識部による認識結果を記憶する認識文字
メモリと、該認識文字メモリの情報を外部に出力するイ
ンタフェース部とを有し、漢字、ひらがな、カタカナ、
英数字、記号等の字種の異なる文字が混在した文章を実
時間で認識するオンライン文字認識装置を対象とするも
ので、前記従来技術の問題点を解決するため、入力され
た文字列を字種記号列で記憶する字種格納メモリと、異
なる字種で形状の類似した特定の文字の前後の文字の字
種別により当該特定の文字の字種を決定する記号列条件
に対応させて字種記号列を予め格納している字種記号列
辞書とを設けたことに特徴がある。
(作用) 筆記者がタブレット上に手書文字を筆記すると、タブレ
ットはその文字データを認識部に送る。認識部は送られ
てきた文字データを、予め定められた基準文字データす
なわち文字特徴辞書に格納されているデータと比較照合
することにより文字の認識を行うととも、認識した文字
の字種記号を決めてそれを字種格納メモリに記憶する。
一方、字種記号列辞書は“異なる字種で形状の類似した
特定の文字”についての字種記号列を、文章構造より考
え得る条件で設定して記憶している。そして認識部は特
定の文字の前の文字の字種と字種記号列辞書の字種記号
列とを比較照合して前記記号列条件に合う特定の文字の
字種を決定する。前の文字の字種と比較しても決定でき
ない場合は、特定の文字の後の文字の字種と比較照合し
て記号列条件に合う特定の文字の字種を決定し文字認識
を行う。そして認識された文字は認識文字メモリに格納
され、インタフェース部はその格納情報を外部に出力す
る。したがって、筆記者が上記のような特定文字を入力
した場合でも、面倒な操作は不要となり、容易にかつ正
確に文字の認識ができるようになる。
(実施例) 以下本発明の一実施例について説明する。第1図は本実
施例のオンライン文字認識装置の構成を示すブロック図
である。このオンライン文字認識装置は、タブレット
1、ストロークデータ抽出部2、ストローク認識部3、
ストローク番号辞書4、文字特徴認識部5、文字特徴辞
書6、字種記号列辞書7、字種格納メモリ8、決定文字
メモリ9、表示部10及びインタフェース部11より構成さ
れる。タブレット1は筆記者が文字を手書入力するため
のもので、方式としては静電結合方式、電磁結合方式、
抵抗膜方式等があるが本発明ではいずれの方式を用いて
も良い。ストロークデータ押出部2はタブレット1より
入力される文字のストロークデータを抽出する。ストロ
ーク認識部3はストロークデータ抽出部2で抽出された
ストロークデータとストローク番号辞書4に格納されて
いるストロークデータとを比較照合し、ストローク番号
を決定することによりストローク認識をする。文字特徴
認識部5はストローク認識部3によるストローク認識結
果を文字特徴辞書6に格納されているデータと比較照合
し文字の決定を行うとともに、文字認識結果からその文
字の字種を判断し、字種格納メモリ8に順次格納する。
この文字特徴認識部5はさらに“異なる字種で形状の類
似した特定の文字”について、文字特徴辞書6だけでは
決定しかねる場合に、その文字の前後の字種を字種格納
メモリ8より読み出し、前記特定の文字について字種の
番号を記述した字種記号列辞書7とつき合わせることに
より文字を決定する。決定文字メモリ9は文字特徴認識
部5が決定した文字を記憶する。決定文字メモリ9に記
憶された文字情報は表示部10及び外部への出力のための
インタフェース部11により利用される。上記各要素のう
ち文字特徴認識部5の一部と、字種記号列辞書7および
字種格納メモリ8以外の要素及びその機能については従
来行なわれているストローク特徴抽出法による漢字かな
混り日本文のオンライン文字認識装置と概ね同じであ
る。
これに対し本発明の特徴は“異なる字種で形状の類似し
た特定の文字”について字種記号列辞書7を追加して字
種を決定する点にある。
次に字種記号列辞書の内容例を第2図に示し、その辞書
を用いて字種を決定する手順について説明する。
上述したように、文字特徴認識部5は文字を認識すると
ともに、認識した漢字、ひらがな、カタカナ、英字、数
字、記号についてそれぞれ字種記号を決めて字種格納メ
モリ8に格納する。一方、“形状が類似しているが字種
が異なると言う文字”については文章構造より考え得る
記号列条件を第2の如く字種記号列辞書7に予め登録し
ておく。そしてその文字が候補として認識された場合、
字種記号列辞書7に登録されている文字記号列と、その
文字の前までの記入字種が格納されている字種格納メモ
リ8のデータとを照合することにより、当該文字が漢
字、ひらがな、カタカナ、英字、数字、記号の何れであ
るかを判別する。又、その文字の前までの記号列条件で
判定出来ない場合、その文字についてはマークをつけて
おき、その文字の後に書かれる文字字種と更に照合する
ことにより字種の判別を行う。
以下、上述の記号列条件の一例を示し、字種の判別方法
を具体的に説明する。
(1)カタカナの“カ”と漢字の“力”の判別 カタカナの“カ”はその文章列においてその文字の前又
は後がカタカナでない確率は小さい。前または後がカタ
カナでないものがカタカナの“カ”とせず漢字の“力”
とする。前又は後がカタカナであればカタカナの“カ”
とする。
従って、カタカナの”カ”又は漢字の“力”が文字特徴
認識部5で候補にあがると文字特徴認識部5は字種記号
列辞書7の内容に自動的にアクセスし、字種格納メモリ
8の内容とチェックを行う。
字種格納メモリ8の内容で1文字前の字種がカタカナで
あったら、第2図の如く文字字種を決定する字種記号列
条件が登録されている辞書のNo.1-1-に該当するので、
カタカナの”カ”と判別する。また、1文字前の字種が
カタカナ以外であったら、まだ判別できないので、仮に
例えば漢字として判別しておき、マークをつけて次の入
力文字の認識に行く。一定文字数認識後、再度前記のマ
ークした文字の認識に戻り、その後筆記された字種を字
種格納メモリ8の内容から読み出し、字種記号列辞書7
と比較照合しチェックする。この時、当該文字の次に書
かれた字種がカタカナであれば、カタカナの“カ”と判
定し、前に仮に漢字として認識した結果を訂正する。又
カタカナ以外であれば漢字として結果をそのままにして
マークを消す。
以上の説明においてマークをつけた特定文字を何文字後
に再度の認識に行くかは字種記号列辞書7に予め記述し
ておいてもよいし、第2図の如く最大3文字後までチェ
ックする必要がある場合は3文字と固定しておいてもよ
い。このチェックにおいて、第2図のNo.の親番(最も
左の記号)が等しい文字の1つでも候補に上った場合
は、親番の等しい文字(1-1-1,1-1-2,1-2)又は(2-1-
1,2-1-2,2-2)はすべて同様のチェックを行なう。
また字種記号列辞書7の形式は第2図に限定されるもの
ではなく字種が2種類の時の判別の場合は、どちらか1
種類の字種記号列を定義しておき、当該しない場合は他
の字種と判別するようにしてもよい。同様にして以下の
文字についても判別でき、その条件の一例を示す。
(2)カタカナの“エ”と漢字“工”の判別 (1)と同じ方法で処理する。
(3)カタカナの“ロ”と漢字の“口”の判別 (1)と同じ方法で処理する。
(4)カタカナの“ニ”と漢数字の“二の判別 3文字前までにまたは3文字後までにカタカナが含まれ
ていなければ漢数字の“二”とする。3文字前までに又
は3文字後までにカタカナが含まれているときはカタカ
ナの“ニ”とする。
(5)ひらがなの“り”とカタカナの“リ”の判別 前または後にカタカナがあればカタカナの“リ”とし、
なければひらがなの“り”とする。
(6)ひらがなの“へ”とカタカナの”ヘ”の判別 3文字前までに又は3文字後までにカタカナが含まれて
いればカタカナの“ヘ”とし、含まれていない場合には
ひらがなの“へ”とする。
以上挙げたものは一例であって他にも色々な条件が考え
られる。
たとえば「田舎ヘカエリマス」のように“異なる字種で
形状の類似した文字”が続くときはカタカナとする等。
要するに“異なる字種で形状の類似した文字”を予め、
その文字ごとに字種列の条件を字種記号列辞書7に記憶
し、入力の字種配列とその条件とを照合し、第1候補を
決定する。
(発明の効果) 以上詳細に説明したように、本発明によれば、筆記され
た文字列を字種記号列で記憶する字種格納メモリと、異
なる字種で形状の類似した特定の文字についての字種記
号列辞書を設け、特定の文字に対しては両手段のデータ
を比較照合して字種を決定するようにした。また特定の
文字の前の文字と字種と字種記号列辞書の字種記号列と
を比較照合して記号列条件に合う前記特定の文字の字種
を決定する。更に前の文字の字種と比較しても決定でき
ない場合は特定の文字の後の文字の字種と比較照合して
記号列条件に合う特定の文字の字種を決定するようにし
た。そのため、特定の文字を認識する場合、従来技術の
ように次候補キーを押下したり文字がいずれの字種に属
するかを別に入力したりする煩わしい操作をする必要が
なくなり、また文章解析のような複雑なソフトウェアが
不要となる。従って、簡単にかつ低価格で“異なる字種
で形状の類似した文字”の判別ができ、次候補キーをほ
とんど押さずに第1字候補の文字を自動的に得ることが
できる利点がある。
【図面の簡単な説明】
1.第1図は本発明に係るオンライン文字認識装置の実施
例の構成を示すブロック図、第2図は上記実施例の装置
における字種記号列辞書の内容例を示す図である。 1……タブレット、2……ストロークデータ抽出部、 3……ストローク認識部、 4……ストローク番号辞書、 5……文字特徴認識部、6……文字特徴辞書、 7……字種記号列辞書、8……字種格納メモリ、 9……決定文字メモリ、10……表示部、 11……インタフェース部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】手書文字を入力するためのタブレットと、 該タブレットからの文字データを予め定められた基準文
    字データと比較照合することにより入力文字の認識を行
    う認識部と、 該認識部による認識結果を記憶する認識文字メモリと、 該認識文字メモリの情報を外部に出力するインタフェー
    ス部とを有し、 漢字、ひらがな、カタカナ、英数字、記号等の字種の異
    なる文字が混在した文章を実時間で認識するオンライン
    文字認識装置において、 入力された文字列を字種記号列で記憶する字種格納メモ
    リと、 異なる字種で形状の類似した特定の文字の前後の文字の
    字種別により当該特定の文字の字種を決定する記号列条
    件に対応させて字種記号列を予め格納している字種記号
    列辞書とを設け、 入力された特定の文字を字種記号列で前記字種格納メモ
    リに格納し、格納した前記特定の文字の前の文字の字種
    と前記字種記号列辞書の字種記号列とを比較照合して前
    記記号列条件に合う前記特定の文字の字種を決定し、決
    定できない場合前記特定の文字の後の文字の字種と比較
    照合して前記記号列条件に合う前記特定の文字の字種を
    決定し文字認識を行うことを特徴とするオンライン文字
    認識装置。
JP60278893A 1985-12-13 1985-12-13 オンライン文字認識装置 Expired - Lifetime JPH0711820B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60278893A JPH0711820B2 (ja) 1985-12-13 1985-12-13 オンライン文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60278893A JPH0711820B2 (ja) 1985-12-13 1985-12-13 オンライン文字認識装置

Publications (2)

Publication Number Publication Date
JPS62138989A JPS62138989A (ja) 1987-06-22
JPH0711820B2 true JPH0711820B2 (ja) 1995-02-08

Family

ID=17603569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60278893A Expired - Lifetime JPH0711820B2 (ja) 1985-12-13 1985-12-13 オンライン文字認識装置

Country Status (1)

Country Link
JP (1) JPH0711820B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59121479A (ja) * 1982-12-27 1984-07-13 Casio Comput Co Ltd 文字認識装置

Also Published As

Publication number Publication date
JPS62138989A (ja) 1987-06-22

Similar Documents

Publication Publication Date Title
Nakagawa et al. Collection of on-line handwritten Japanese character pattern databases and their analyses
Ghosh et al. Script recognition—a review
Guo et al. Separating handwritten material from machine printed text using hidden markov models
JP3640972B2 (ja) ドキュメントの解読又は解釈を行う装置
JP3427692B2 (ja) 文字認識方法および文字認識装置
KR101312804B1 (ko) 텍스트 인식을 용이하게 하는 시스템 및 텍스트 인식 방법
EP2166488B1 (en) Handwritten word spotter using synthesized typed queries
Hussain et al. A comprehensive survey of handwritten document benchmarks: structure, usage and evaluation
EP1743275B1 (en) Apparatus and method for handwriting recognition
JP2713622B2 (ja) 表形式文書読取装置
JP3452774B2 (ja) 文字認識方法
Nakagawa et al. On-line handwritten character pattern database sampled in a sequence of sentences without any writing instructions
Mozaffari et al. IfN/Farsi-Database: a database of Farsi handwritten city names
CN113610068B (zh) 基于试卷图像的试题拆解方法、系统、存储介质及设备
US5909509A (en) Statistical-based recognition of similar characters
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
Madhvanath et al. Reading handwritten us census forms
JP3467437B2 (ja) 文字認識装置及びその方法とプログラム記録媒体
JPH0711820B2 (ja) オンライン文字認識装置
JP3159087B2 (ja) 文書照合装置および方法
Butala et al. Natural language parser for physician’s handwritten prescription
JPS592191A (ja) 手書き日本語文の認識処理方式
JPH05225399A (ja) 文書処理装置
Maheshwari et al. Offline handwriting recognition with emphasis on character recognition: A comprehensive survey
Balasooriya Improving and Measuring OCR Accuracy for Sinhala with Tesseract OCR Engine