JPH10124618A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH10124618A
JPH10124618A JP8275952A JP27595296A JPH10124618A JP H10124618 A JPH10124618 A JP H10124618A JP 8275952 A JP8275952 A JP 8275952A JP 27595296 A JP27595296 A JP 27595296A JP H10124618 A JPH10124618 A JP H10124618A
Authority
JP
Japan
Prior art keywords
character
recognition
candidate
characters
recognition candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8275952A
Other languages
English (en)
Inventor
Yutaka Yamada
山田  豊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP8275952A priority Critical patent/JPH10124618A/ja
Publication of JPH10124618A publication Critical patent/JPH10124618A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字の接続可能性に関する統計情報を備える
ことにより、正確且つ高速に文字認識を行うことができ
る文字認識装置を提供することである。 【解決手段】 文字入力枠101のi−1番目の文字、
即ち認識文字列中の直前の文字への接続可能性が高い文
字の集合を隣接候補リスト60から抽出する。そして、
i番目の枠に入力された文字と、前記文字の集合の各文
字とのパターンマッチングを、接続可能性の高い文字か
ら順に行い(S2)、その結果、認識距離が所定のしき
い値よりも小さい文字が見つかった場合には(S3:Y
es)、見つかった文字を第1の認識候補とする(S
6)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ペンによりタブレ
ットに入力した手書き文字や、OCR(光学式文字読み
取り装置)等を用いて入力した印刷原稿の文字等を認識
し、文字コードに変換することができる文字認識装置に
関する。
【0002】
【従来の技術】従来、文字を図形情報として入力して、
その入力した図形情報を文字認識して文字コードに変換
するように構成した文字認識装置が提案されている。
【0003】このような文字認識装置としては、ペンを
用いて手書きで文字を入力し、その入力した文字をリア
ルタイムに認識して表示するものが提案されており、例
えば、入力装置と表示装置とが積層一体化されて構成さ
れた液晶タブレットに制御装置が取り付けられて構成さ
れているものである。この文字認識装置は、前記液晶タ
ブレットに入力用のペンを用いて手書きで文字を入力す
ると、入力された手書き文字パターンと、文字認識装置
が内蔵する辞書に記憶された文字パターンとのパターン
マッチング処理を行い、その結果認識距離が最も小さい
文字を認識結果として前記液晶タブレット上に表示する
ものであり、何文字かの入力操作を繰り返すことにより
文字列を入力することができるものである。
【0004】しかしながら、前述したようなパターンマ
ッチング処理における認識距離のみにより認識処理を行
う方法では、認識距離が所定値以下の文字をすべて抽出
するために処理時間が多くかかり、応答性が悪いという
問題が生じていた。
【0005】そこで、このような問題点を解決するもの
として、特開平7−152750号公報において、最初
の1文字が認識された時点でその文字を先頭とする単語
等を抽出し、学習により得られた頻度情報を参照して前
記抽出した単語等を出現する可能性の高い順に並べるこ
とにより、前記最初の1文字に続く文字を予測し、その
予測された文字を前提として認識処理を行うようにした
情報処理装置が提案されている。
【0006】
【発明が解決しようとする課題】しかしながら、前述し
た情報処理装置では、かな漢字変換プログラム(FE
P)が有する通常の辞書を使用して単語の抽出を行うた
めに抽出処理に時間がかかるという問題があり、また、
前記装置の導入時点等において学習による頻度情報が十
分に蓄積されていない状態では前記頻度情報を活用でき
ないという問題もあった。
【0007】本発明は、上述した問題点を解決するため
になされたものであり、文字の接続可能性に関する統計
情報を備えることにより、正確且つ高速に文字認識を行
うことができる文字認識装置を提供することを目的とし
ている。
【0008】
【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の文字認識装置は、複数の
文字からなる文字列を図形情報として入力し、その入力
された各文字の図形情報を順次文字認識して文字コード
に変換することにより文字列を認識するように構成した
ものを対象として、特に、文字列中の直前の文字への接
続可能性が最も高い文字より順にパターンマッチングを
行い、その結果、認識距離が所定値以下となった文字を
認識候補として抽出する第1の認識候補抽出手段を備え
ている。従って、前記第1の認識候補抽出手段が、文字
列中の直前の文字への接続可能性が最も高い文字より順
にパターンマッチングを行い、その結果、認識距離が所
定値以下となった文字を認識候補として抽出するので、
精度の高い文字認識処理を高速に行うことができる。
【0009】また、請求項2に記載の文字認識装置は、
文字と文字との接続可能性に関する情報を記憶する文字
接続情報記憶手段を備え、前記第1の認識候補抽出手段
は、前記文字接続情報記憶手段より文字列中の直前の文
字への接続可能性が高い文字の集合を取得して、その取
得した文字の集合の中で最も接続可能性が高い文字より
順にパターンマッチングを行うように構成している。従
って、前記第1の認識候補抽出手段が、前記文字接続情
報記憶手段より文字列中の直前の文字への接続可能性が
高い文字の集合を取得し、その取得した文字の集合の中
で最も接続可能性が高い文字より順にパターンマッチン
グを行うので、より高速に文字認識処理を行うことがで
きる。
【0010】また、請求項3に記載の文字認識装置は、
前記第1の認識候補抽出手段が認識候補を抽出しなかっ
た場合に、認識可能なすべての文字とのパターンマッチ
ングを行い、その結果、認識距離が所定値以下となった
文字を認識候補として抽出する第2の認識候補抽出手段
を備えている。従って、前記第2の認識候補抽出手段
は、前記第1の認識候補抽出手段が認識候補を抽出しな
かった場合に、認識可能なすべての文字とのパターンマ
ッチングを行い、その結果、認識距離が所定値以下とな
った文字を認識候補として抽出するので、直前の文字に
対する接続可能性が低い文字が入力された場合でも、精
度の高い文字認識処理を行うことができる。
【0011】また、請求項4に記載の文字認識装置は、
前記第2の認識候補抽出手段が認識候補を抽出しなかっ
た場合に、認識距離が最も小さい文字を認識候補として
抽出する第3の認識候補抽出手段を備えている。従っ
て、前記第3の認識候補抽出手段は、前記第2の認識候
補抽出手段が認識候補を抽出しなかった場合に、認識距
離が最も小さい文字を認識候補として抽出するので、認
識距離が所定値以下とならない場合でも精度の高い文字
認識処理を行うことができる。
【0012】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。
【0013】本実施の形態の文字認識装置1の概略的構
成について、図1のブロック図を参照して説明する。
【0014】図1に示すように、文字入力手段であり、
且つ表示手段である入出力一体型の液晶タブレット10
が制御部20に接続されている。また、制御部20には
文字認識部40と隣接候補リスト60とが接続されてい
る。さらに、前記文字認識部40には文字認識辞書50
が接続されている。尚、隣接候補リスト60は本発明の
文字接続情報記憶手段を構成するものである。
【0015】液晶タブレット10は、図2に示すよう
に、文字入力枠101と、候補表示枠103と、別候補
表示枠104と、認識開始ボタン105と、OKボタン
107とを備えている。
【0016】文字入力枠101は、手書きで文字を入力
する領域であり、7個の文字を図示しない専用ペンで入
力できるもので、その入力された手書き文字をそのまま
表示するように構成されている。図3は、文字入力枠1
01に手書きにより文字列「認識をする」を入力した状
態を示している。
【0017】候補表示枠103は、前記文字入力枠10
1に入力された手書き文字を認識することにより得られ
た認識候補文字を表示する領域である。尚、前記候補表
示枠103の各表示枠は、それらの真上に配置された前
記文字入力枠101の各入力枠に入力された手書き文字
の認識結果をそれぞれ表示する。図4は、文字入力枠1
01に手書きで入力された文字列「認識をする」を認識
して、候補表示枠103に表示した状態を示している。
【0018】別候補表示枠104は、前記候補表示枠1
03に表示された認識候補が誤っている場合に、その表
示枠を押下すると認識処理により抽出されたすべての候
補を表示する領域である。使用者は表示されている候補
の中から正しい文字を選び、専用ペンで押下することに
より選択する。図5は、候補表示枠103の二番目の表
示枠を押下して、手書き文字「識」に対するすべての認
識候補「識」、「織」を表示した状態を示している。
【0019】認識開始ボタン105は、使用者が前記文
字入力枠101に手書き文字を入力した後、手書き文字
認識装置1に認識処理の開始を指示する場合に押下する
ボタンである。
【0020】OKボタン107は、前記候補表示枠10
3に表示された認識候補がすべて正しい場合に、文字列
を確定させるために押下するボタンである。
【0021】制御部20は、前記液晶タブレット10と
文字認識部40及び隣接候補リスト60との間のデータ
転送処理、前記文字入力枠101に入力された手書き文
字をその文字入力枠101に表示する処理、文字認識部
40により認識された文字を前記候補表示枠103に表
示する処理等を行う。
【0022】文字認識部40は、手書き入力データと、
前記文字認識辞書50に記憶された文字パターンとのパ
ターンマッチングを行う部分である。
【0023】文字認識辞書50は、文字認識装置1が認
識可能なすべての文字の文字パターン情報を記憶するも
のである。
【0024】隣接候補リスト60は、図6に示すよう
に、キーとなる文字とその文字に続く可能性(以下、接
続可能性と称する)が高い複数個の文字との集合のリス
トを記憶するものであり、例えば、「す」という文字に
対しては、接続可能性の高い文字として「。、が、る、
ね、か」等が記憶されている。同様に、「認」に対して
は「め、識、で、し」が、「識」に対しては「し、は、
が、を、の、的、で、に」がそれぞれ記憶されている。
【0025】次に、文字認識装置1により文字認識を行
う処理について、手書きで文字列「認識をする」を入力
して、認識する場合を例に説明する。
【0026】使用者は、専用ペンを用いて、液晶タブレ
ット10の文字入力枠101の各入力枠に1文字づつ文
字を書き込む。「認識をする」という文字列の入力が完
了したら、認識開始ボタン105を押して、文字認識処
理を開始する。以下、図7のフローチャートを参照して
説明する。
【0027】まず、文字入力枠101の一番左の枠に入
力された文字の認識を行う。すなわち、入力枠番号iを
1として(ステップ1、以下S1と称する。他のステッ
プも同様。)、文字認識辞書50に納められたすべての
文字パターンと前記枠内に入力された文字とのパターン
マッチングを行い(S4)、認識距離が所定のしきい値
より小さい文字が見つかった場合は(S5:Yes)、
見つかった文字を第1の認識候補とする(S6)。一
方、認識距離が所定のしきい値より小さい文字が見つか
らなかった場合は(S5:No)、認識距離が最も小さ
い文字を第1の認識候補とする(S7)。ここで、文字
「認」が認識されると、前記候補表示枠103の一番左
の枠に文字「認」が表示される。
【0028】次に、入力枠番号iを1増加させて(S
8)、文字入力枠101の二番目の枠に入力された文字
の認識を行う。まず、i−1番目の文字、即ち認識文字
列中の直前の文字への接続可能性が高い文字の集合を隣
接候補リスト60から抽出する。前記処理において一番
目の枠に入力された文字は、文字「認」であると認識さ
れたので、前記隣接候補リスト60から文字「認」への
接続可能性の高い文字の集合「め、識、で、し」を抽出
する。そして、二番目の枠に入力された文字と、前記文
字の集合の各文字とのパターンマッチングを、接続可能
性の高い文字から順に行い(S2)、その結果、認識距
離が所定のしきい値よりも小さい文字が見つかった場合
には(S3:Yes)、見つかった文字を第1の認識候
補とする(S6)。ここで、文字「識」が認識される
と、前記候補表示枠103の二番目の枠に文字「識」が
表示される。
【0029】一方、前記接続可能性が高い文字の集合の
各文字とのパターンマッチングにおいて、認識距離が所
定のしきい値よりも小さい文字が見つからなかった場合
には(S3:No)、文字認識辞書50に納められたす
べての文字パターンと前記枠内に入力された文字とのパ
ターンマッチングを行い(S4)、認識距離が所定のし
きい値より小さい文字が見つかった場合は(S5:Ye
s)、見つかった文字を第1の認識候補とする(S
6)。また、認識距離が所定のしきい値より小さい文字
が見つからなかった場合は(S5:No)、認識距離が
最も小さい文字を第1の認識候補とする(S7)。
【0030】以下、前記二番目の枠内の文字認識処理と
同様の処理(S2〜S8、S9:Yes)を繰り返し、
iが8に達すると(S9:No)、文字入力枠101の
すべての枠の文字認識処理を終了する。
【0031】尚、S2、S3:YES、S6は本発明の
第1の認識候補抽出手段として、S4、S5:YES、
S6は第2の認識候補抽出手段として、S4、S5:N
o、S7は第3の認識候補抽出手段としてそれぞれ機能
するものである。
【0032】また、本発明は以上詳述した実施の形態に
限定されるものではなく、その要旨を逸脱しない範囲に
おいて、種々の変更を加えることができる。
【0033】例えば、前記実施の形態においては、本発
明をペンとタブレットを用いたオンライン手書き文字認
識装置に適用した例を示したが、OCR等を用いたオフ
ライン文字認識装置に適用することも勿論可能である。
【0034】
【発明の効果】以上説明したことから明かなように、本
発明の請求項1に記載の文字認識装置は、複数の文字か
らなる文字列を図形情報として入力し、その入力された
各文字の図形情報を順次文字認識して文字コードに変換
することにより文字列を認識するように構成したものを
対象として、特に、文字列中の直前の文字への接続可能
性が最も高い文字より順にパターンマッチングを行い、
その結果、認識距離が所定値以下となった文字を認識候
補として抽出する第1の認識候補抽出手段を備えてい
る。従って、精度の高い文字認識処理を高速に行うこと
ができる。
【0035】また、請求項2に記載の文字認識装置は、
文字と文字との接続可能性に関する情報を記憶する文字
接続情報記憶手段を備え、前記第1の認識候補抽出手段
は、前記文字接続情報記憶手段より文字列中の直前の文
字への接続可能性が高い文字の集合を取得して、その取
得した文字の集合の中で最も接続可能性が高い文字より
順にパターンマッチングを行うように構成している。従
って、前記文字接続情報記憶手段より文字列中の直前の
文字への接続可能性が高い文字の集合を高速に取得する
ので、より高速に文字認識処理を行うことができる。
【0036】また、請求項3に記載の文字認識装置は、
前記第1の認識候補抽出手段が認識候補を抽出しなかっ
た場合に、認識可能なすべての文字とのパターンマッチ
ングを行い、その結果、認識距離が所定値以下となった
文字を認識候補として抽出する第2の認識候補抽出手段
を備えている。従って、前記第2の認識候補抽出手段
は、直前の文字に対する接続可能性が低い文字が入力さ
れた場合でも精度の高い文字認識処理を行うことができ
る。
【0037】また、請求項4に記載の文字認識装置は、
前記第2の認識候補抽出手段が認識候補を抽出しなかっ
た場合に、認識距離が最も小さい文字を認識候補として
抽出する第3の認識候補抽出手段を備えている。従っ
て、パターンマッチングにおける認識距離が所定値以下
とならない場合において、より精度の高い文字認識処理
を行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態の文字認識装置の概略構成
を示すブロック図である。
【図2】液晶タブレットの概略構成を示す説明図であ
る。
【図3】文字入力枠に文字列を入力した状態の液晶タブ
レットの表示状態を示す説明図である。
【図4】文字認識後の液晶タブレットの表示状態を示す
説明図である。
【図5】別候補表示枠に認識候補の一覧を表示した状態
の液晶タブレットの表示状態を示す説明図である。
【図6】隣接候補リストの記憶内容を示す説明図であ
る。
【図7】文字認識処理の内容を説明するフローチャート
である。
【符号の説明】
1 文字認識装置 10 液晶タブレット 40 文字認識部 60 隣接候補リスト

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 複数の文字からなる文字列を図形情報と
    して入力し、その入力された各文字の図形情報を順次文
    字認識して文字コードに変換することにより文字列を認
    識するように構成した文字認識装置において、 文字列中の直前の文字への接続可能性が最も高い文字よ
    り順にパターンマッチングを行い、その結果、認識距離
    が所定値以下となった文字を認識候補として抽出する第
    1の認識候補抽出手段を備えたことを特徴とする文字認
    識装置。
  2. 【請求項2】 文字と文字との接続可能性に関する情報
    を記憶する文字接続情報記憶手段を更に備え、 前記第1の認識候補抽出手段は、前記文字接続情報記憶
    手段より文字列中の直前の文字への接続可能性が高い文
    字の集合を取得して、その取得した文字の集合の中で最
    も接続可能性が高い文字より順にパターンマッチングを
    行うように構成したことを特徴とする請求項1に記載の
    文字認識装置。
  3. 【請求項3】 前記第1の認識候補抽出手段が認識候補
    を抽出しなかった場合に、認識可能なすべての文字との
    パターンマッチングを行い、その結果、認識距離が所定
    値以下となった文字を認識候補として抽出する第2の認
    識候補抽出手段を更に備えたことを特徴とする請求項2
    に記載の文字認識装置。
  4. 【請求項4】 前記第2の認識候補抽出手段が認識候補
    を抽出しなかった場合に、認識距離が最も小さい文字を
    認識候補として抽出する第3の認識候補抽出手段を更に
    備えたことを特徴とする請求項3に記載の文字認識装
    置。
JP8275952A 1996-10-18 1996-10-18 文字認識装置 Pending JPH10124618A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8275952A JPH10124618A (ja) 1996-10-18 1996-10-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8275952A JPH10124618A (ja) 1996-10-18 1996-10-18 文字認識装置

Publications (1)

Publication Number Publication Date
JPH10124618A true JPH10124618A (ja) 1998-05-15

Family

ID=17562721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8275952A Pending JPH10124618A (ja) 1996-10-18 1996-10-18 文字認識装置

Country Status (1)

Country Link
JP (1) JPH10124618A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6937762B2 (en) * 2000-06-20 2005-08-30 Minolta Co., Ltd. Image processing device and program product

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6937762B2 (en) * 2000-06-20 2005-08-30 Minolta Co., Ltd. Image processing device and program product

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
JPH0431988A (ja) 文字認識方法及び文字認識装置
JP2003162687A (ja) 手書き文字入力装置、手書き文字認識プログラム
US6799914B2 (en) Arabic-persian alphabeth input apparatus
JPS6126192A (ja) ハングル字母列からのハングル文字認識方法
JPH10124618A (ja) 文字認識装置
JPH0388062A (ja) 文書作成装置
KR100702483B1 (ko) 한자 입력 시스템 및 그 방법
JPS592191A (ja) 手書き日本語文の認識処理方式
JPH0896081A (ja) 文字認識装置及び文字認識方法
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JP3763262B2 (ja) 手書文字認識装置
JPH01137383A (ja) 文字認識装置
JPH07105217A (ja) 入力文字自動補正装置
JP2918579B2 (ja) 画像処理装置
JPH01103787A (ja) 個人辞書作成機能付手書文字認識装置
JPH053631B2 (ja)
KR100356503B1 (ko) 학습형문자인식장치
JP3022790B2 (ja) 手書き文字入力装置
JPS6293776A (ja) 情報認識装置
JPH10105645A (ja) 文字認識装置
JPS61220081A (ja) パタ−ン切り出し及び認識方式
JPH0520503A (ja) 文字認識装置
JP2002041509A (ja) 文字入力装置
JPS6059489A (ja) 文字認識装置