JPH07311818A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH07311818A
JPH07311818A JP6101351A JP10135194A JPH07311818A JP H07311818 A JPH07311818 A JP H07311818A JP 6101351 A JP6101351 A JP 6101351A JP 10135194 A JP10135194 A JP 10135194A JP H07311818 A JPH07311818 A JP H07311818A
Authority
JP
Japan
Prior art keywords
character
candidate
candidate character
characters
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6101351A
Other languages
English (en)
Other versions
JP3153704B2 (ja
Inventor
Isamu Haneda
勇 羽田
Takeshi Iwamoto
剛 岩本
Shigemutsu Matsuda
栄睦 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP10135194A priority Critical patent/JP3153704B2/ja
Publication of JPH07311818A publication Critical patent/JPH07311818A/ja
Application granted granted Critical
Publication of JP3153704B2 publication Critical patent/JP3153704B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 文字認識率を向上する。 【構成】 入力された画像データは(a1)、文字認識
され(a2)、予め定める認識対象となる複数の文字デ
ータを前記画像データに類似する度合の高い順に配列し
た候補文字列が作成される(a3)。候補文字は、文章
における一般的な文字の配列規則に従ってその順序が並
べかえられる(a4)。具体的には、1つ前の文字の
種類と同種類であり、画像データに類似する度合の最も
高い文字が第1候補文字とされる。1つ前の文字の種
類が句読点であれば並べかえをしない。1つ前の文字
の種類が助詞であれば並べかえをしない。1つ前の文
字がなければ並べかえをしない。第1候補文字が句読
点、または助詞であれば並べかえをしない。候補文字
列中に「)」があり、以前の文字の中に「(」があれ
ば、「)」が第1候補文字とされる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力手段から入力され
た画像データを文字として認識する文字認識装置に関
し、特に文章における一般的な文字の配列規則を考慮し
た文字認識率の高い文字認識装置に関する。
【0002】
【従来の技術】文字認識装置は、たとえば比較的大型の
ワードプロセッサやパーソナルコンピュータなどの電子
機器、あるいは携行可能な比較的小型の電子手帳などと
称される電子機器に好適に用いられる。入力手段から入
力された画像データは、文字認識手段で文字として認識
される。文字認識手段は予め定める認識対象となる複数
の文字を前記画像データに類似する度合の高い順に配列
した候補文字列を作成して出力する。候補文字列の中の
第1番目の候補文字、すなわち前記画像データに類似す
る度合の最も高い文字は、電子機器が備える表示手段に
表示される。操作者は、表示手段に表示された文字を見
て、認識結果の正誤を判断し、誤っていたときには、た
とえば前記文字認識手段が作成した候補文字列を表示さ
せて、該候補文字列の中から所望とする文字を選ぶ。
【0003】前記入力手段としては、CCD(電荷結合
素子)などを用いて画像(文字)を読取る方式、あるい
はタブレットやタッチパネルなどの入力面に所定の指示
手段を用いて画像(文字)を手書き入力する方式などを
採用することができ、前記CCD、タブレットあるいは
タッチパネルからの画像データが文字認識手段によって
文字として認識される。
【0004】前記第1番目の候補文字の選択の方法とし
ては、たとえば次の方法が挙げられる。すなわち、前述
したように予め定める認識対象となる複数の文字を画像
データに類似する度合の高い順に配列した候補文字列を
作成し、前記画像データに類似する度合の最も高い文字
を第1番目の候補文字とする方法である。この方法は、
1文字単位で文字認識する方法である。
【0005】また他の方法としては、前記方法と同様に
して作成した候補文字列を所定の数記憶する。文字認識
手段は、記憶された各候補文字列の中から前記画像デー
タに類似する度合の最も高い候補文字をそれぞれ選び、
認識した順番に並べた単語を作成する。当該単語と予め
記憶されている複数の単語との照合を行って、照合結果
に基づいて第1候補文字を選ぶ。このような方法は、単
語単位で文字認識する方法である。
【0006】
【発明が解決しようとする課題】前者の方法で第1番目
の候補文字を選んだ場合、形状が類似している文字や癖
のある文字の画像データが入力されたときに、前記画像
データに類似する度合の最も高い文字である第1番目の
候補文字が、所望とする文字でなくなる確率が高くな
り、文字認識率の低下を招く。所望とする文字でなかっ
たときには、前述したような操作によって文字の修正を
行わなければならない。
【0007】また、後者の方法で第1番目の候補文字を
選んだ場合、1文字単位の判断に加えて、単語としての
判断も行われるので、予め記憶されている単語と一致し
たときには、認識率が向上するけれども、記憶されてい
ない単語であったときには、認識率の向上は望めない。
また、記憶内容が増すことから装置の作成に対するコス
トが高くなる。さらに、2段階で文字認識を行うことか
ら認識に時間がかかる。またさらに、どれだけの文字数
で1つの単語とみなすかの判断基準が難しい。
【0008】本発明の目的は、文字認識率の高い文字認
識装置を提供することである。
【0009】
【課題を解決するための手段】本発明は、画像データを
入力する入力手段と、前記入力手段からの画像データを
文字として認識し、予め定める認識対象となる複数の文
字を前記画像データに類似する度合の高い順に配列した
候補文字列を作成して出力する文字認識手段と、前記文
字認識手段からの候補文字列を記憶する記憶手段とを含
み、前記文字認識手段は、前記記憶手段に記憶された内
容に基づいて、文章における一般的な文字の配列規則に
従って、作成した候補文字列の候補文字の順序を並べか
えて出力することを特徴とする文字認識装置である。
【0010】また本発明の前記文字認識手段は、前記記
憶手段に記憶された1つ前の候補文字列の第1番目の候
補文字の種類と同種類であって、前記画像データに類似
する度合の最も高い候補文字を第1番目の候補文字とし
た候補文字列を作成して出力することを特徴とする。
【0011】また本発明の前記文字認識手段は、前記記
憶手段に記憶された1つ前の候補文字列の第1番目の候
補文字の種類が句読点であった場合には、作成した候補
文字列をそのまま出力することを特徴とする。
【0012】また本発明の前記文字認識手段は、前記記
憶手段に記憶された1つ前の候補文字列の第1番目の候
補文字の種類が助詞であった場合には、作成した候補文
字列をそのまま出力することを特徴とする。
【0013】また本発明の前記文字認識手段は、前記記
憶手段に候補文字列が記憶されていなかった場合には、
作成した候補文字列をそのまま出力することを特徴とす
る。
【0014】また本発明の前記文字認識手段は、類似の
度合の最も高い文字の種類が句読点または助詞であった
場合には、作成した候補文字列をそのまま出力すること
を特徴とする。
【0015】また本発明の前記文字認識手段は、作成し
た候補文字列の中に文章中での配列の先後が定められて
いる一対の文字のうちの後に用いられる文字があり、前
記記憶手段に記憶された候補文字列の第1番目の候補文
字の中に前記一対の文字のうちの先に用いられる文字が
あった場合には、前記後に用いられる文字を第1番目の
候補文字とした候補文字列を作成して出力することを特
徴とする。
【0016】また本発明の前記候補文字列は、前記画像
データに類似する度合が予め定めるしきい値以上の文字
から成ることを特徴とする。
【0017】また本発明の前記候補文字列は、前記画像
データに類似する度合の高い方から予め定める文字数に
選ばれることを特徴とする。
【0018】
【作用】本発明に従えば、文字認識手段は、入力手段か
ら入力された画像データを文字として認識し、予め定め
る認識対象となる複数の文字を前記画像データに類似す
る度合の高い順に配列した候補文字列を作成して出力す
る。作成された候補文字列は、記憶手段に記憶される。
このとき前記文字認識手段は、前記記憶手段に記憶され
た内容に基づいて、文章における一般的な文字の配列規
則に従って、作成した候補文字列の候補文字の順序を並
べかえて出力する。
【0019】好ましくは、前記記憶手段に記憶された1
つ前の候補文字列の第1番目の候補文字の種類と同種類
であって、前記画像データに類似する度合の最も高い候
補文字を第1番目の候補文字とした候補文字列を作成し
て出力する。たとえば1つ前の候補文字列の第1番目の
候補文字が平仮名であった場合、平仮名であって画像デ
ータに類似する度合の最も高い候補文字を第1番目の候
補文字とする。
【0020】また好ましくは、作成した候補文字列の中
に、文章中での配列の先後が定められている一対の文字
のうちの後に用いられる文字があり、前記記憶手段に記
憶された候補文字列の第1番目の候補文字の中に前記一
対の文字のうちの先に用いられる文字があった場合に
は、前記後に用いられる文字を第1番目の候補文字とし
た候補文字列を作成して出力する。たとえば一対の文字
である「(」および「)」のうちの後で用いられる文字
「)」が候補文字列中にあり、先に用いられる文
字「(」が以前の候補文字列の第1番目の候補文字にあ
った場合には、前記後で用いられる文字「)」を第1番
目の候補文字とする。
【0021】複数種類の文字を含んで構成される文章、
たとえば日本語の文章では、一般的に同じ種類の文字が
続く確率が高い。また、一対で用いられる文字では、一
方の文字が用いられると必ず他方の文字が用いられる。
したがって、上述したように候補文字列の候補文字の順
序を並べかえることによって文字認識率が向上する。
【0022】なお、前記記憶手段に記憶された1つ前の
候補文字列の第1番目の候補文字の種類が句読点であっ
たときには、文章の区切りであると判断して、作成した
候補文字列をそのまま出力する。また、文字の種類が助
詞であったときには、1単位の文節であると判断して、
作成した候補文字列をそのまま出力する。さらに、前記
記憶手段に候補文字列が記憶されていなかったときに
は、文章の先頭文字であると判断して、作成した候補文
字列をそのまま出力する。またさらに、類似の度合の最
も高い文字の種類が句読点または助詞であったときに
は、作成した候補文字列をそのまま出力する。このよう
に文章中での文字の配列規則に従って、候補文字列の文
字の並べかえを行わないことによって、文字認識率が向
上する。
【0023】また本発明に従えば、前記候補文字列は前
記画像データに類似する度合が予め定めるしきい値以上
の文字から構成される。さらに本発明に従えば、候補文
字列は前記画像データに類似する度合の高い方から予め
定める文字数に選ばれる。したがって、類似の度合の低
い文字が並べかえの対象から除外される。また、並べか
えの対象となる文字の数が限定される。このため、文字
認識の精度および効率が向上する。
【0024】
【実施例】図1は、本発明の一実施例である文字認識装
置を備えた電子機器1の外観を示す平面図である。電子
機器1は、たとえば150mm×90mmのケース1a
の中央部に表示手段である表示パネル2が配置され、そ
の左右に機能選択キー部3およびメニューキー4などが
配置されている。表示パネル2は、たとえば液晶素子で
実現され、たとえば240ドット×170ドットの予め
定められる表示領域2aを備えている。また、表示パネ
ル2の上には後述する入力手段であるタブレット13が
積層されており、表示パネル2の表示領域2aに表示さ
れるアイコン、キーおよびボタンを入力ペン5で指示す
ることによって各種入力が行われる。なお、前記機能選
択キー部3およびメニューキー4からの入力も前記タブ
レットを用いることによって入力ペン5で実施すること
が可能である。
【0025】本実施例の電子機器1は、データファイル
作成機能としてスケジュール機能、電話帳機能、レポー
ト機能および手書きメモ機能を備えており、機能選択キ
ー部3が前記機能にそれぞれ対応したスケジュールキー
3a、電話帳キー3b、レポートキー3cおよび手書き
メモキー3dから構成される。本実施例では、機能選択
キー部3が4種類のキーから構成される例を説明するけ
れども、前記キーは4個に限定されるものではなく、電
子機器1が備える機能の種類に応じてキーの数が選ばれ
る。
【0026】図2は、前記電子機器1の電気的構成を示
すブロック図である。電子機器1は、前述の表示パネル
2、機能選択キー部3とメニューキー4とを含んで構成
されるキーボード、および入力ペン5の他に、中央演算
処理装置(以下、「CPU」という)6、リードオンリ
メモリ(以下、「ROM」という)7、ランダムアクセ
スメモリ(以下、「RAM」という)8、I/O(入力
/出力)ポート9、表示用メモリ10、制御回路11、
A/D(アナログ/デジタル)変換器12およびタブレ
ット13を含んで構成される。
【0027】CPU6は、ROM7に書込まれているプ
ログラムに従って電子機器1の動作を制御する。ROM
7には、前述したアイコン、キーおよびボタンなどに対
応した動作プログラムおよび表示データが予め記憶され
ている。また前記ROM7には、入力ペン5を用いてタ
ブレット13から入力された画像データを文字として認
識して所定の候補文字列を作成し、前記候補文字列を表
示したり、所望とする文字データをRAM8内に登録し
たりするための一連の動作プログラムが予め記憶されて
いる。RAM8は、読書き自在のメモリであり、CPU
6の内部処理用ワーク領域およびデータ格納メモリなど
として使用される。I/Oポート9は、前述の機能選択
キー部3およびメニューキー4を含んで構成されるキー
ボードとCPU6との間に介在され、前記キーの押圧状
況などをCPU6に伝達する。また前記I/Oポート9
は、他の機器との通信信号の入出力にも用いられる。
【0028】表示用メモリ10には、表示パネル2に表
示すべきデータが書込まれる。制御回路11は、表示パ
ネル2の上に積層されるタブレット13に印加する電圧
の制御を行う。タブレット13は、たとえば透光性を有
する抵抗膜式のものが選ばれ、入力面に予め設定される
直交座標上のX軸方向およびY軸方向にそれぞれ所定の
電圧が印加され、予め定める指示手段である入力ペン5
で指示した座標点を表すアナログ座標信号を出力する。
A/D変換器12は、前記アナログ座標信号を、CPU
6が処理可能なデジタル信号に変換する。
【0029】本実施例での操作者の行う入力動作は、特
に断りのない限り前記入力ペン5でタブレット13の入
力面を指示することによって行われる。前記透光性を有
する抵抗膜式のタブレット13は、たとえば可撓性を有
する一対の透光性基板上にITO(インジウム錫酸化
物)などで実現される抵抗膜を形成し、該抵抗膜が対向
するようにして、かつ互いに間隔をあけて配置して構成
されるものである。一方の抵抗膜には、所定の電圧が印
加されている。該印加電圧は、入力端部側から出力端部
側へ連続的に変化する。他方の抵抗膜は接地されず、該
抵抗膜側から電圧の検出が行われる。
【0030】前記入力ペン5でタブレット13に触れる
と、触れた位置の抵抗膜同士が互いに接触し、他方の抵
抗膜側から電圧が検出される。該電圧は、前記一方の抵
抗膜の入力および出力端部方向を、たとえば直交座標上
のX軸方向とすると、X軸方向の座標点を表す値とな
る。同様に、他方の抵抗膜の前記X軸方向とは直交する
Y軸方向に所定の電圧を印加し、一方の抵抗膜側から電
圧の検出を行うと、Y軸方向のペン入力による座標点を
得ることができる。
【0031】上述したような動作を予め定められるタイ
ミングで切換えて行うことによって、ペン入力による座
標点が随時検出される。CPU6は、検出した座標点を
含んで表示されるアイコン、キーあるいはボタンに対応
した処理を実行する。なお、本実施例では抵抗膜式のタ
ブレット13の例を説明したけれども、タブレット13
は抵抗膜式に限定されるものではなく、たとえば電磁誘
導式または静電誘導式を採用することも可能である。
【0032】続いて、電子機器1の文字認識の方法につ
いて説明する。図3は、レポート機能を用いてフリーノ
ートを作成する際に表示される表示画像を段階的に示す
平面図である。前記電子機器1は、スケジュールの記録
を行うスケジュール機能と、電話番号の記録を行う電話
帳機能と、レポートの作成を行うレポート機能と、イラ
ストや図形などの作成を行う手書きメモ機能とを備えて
おり、所望の機能が前記機能選択キー部3の中から選択
される。フリーノートの作成を行うためには、レポート
キー3cが選ばれて、図3(1)に示されるような表示
画像14aが表示される。この表示画像14aは、登録
されているファイルリストを示す画像であり、図示され
るものは登録されているファイルがないことを示してい
る。
【0033】前記表示画像14aの新規入力/用紙選択
ボタン15を入力ペン5で指示すると、図3(2)に示
されるような表示画像14bが表示される。この表示画
像14bは、レポートのフォーム(形式)を選択するた
めの画像であり、たとえば図示されるように議事録、日
報、出張報告、連絡書、レター、書類送付、FAX送付
状、フリーノート、オリジナルの各フォームを表すアイ
コン16a〜16iがそれぞれ表示される。アイコンと
は、予め設定される様々な処理をわかりやすく、たとえ
ば図形化して示すものであり、所望のアイコンを入力ペ
ン5で指示することによって、処理の選択を行うことが
できる。
【0034】アイコン16a〜16iの中から、フリー
ノートのアイコン16hを選択するとフリーノートを作
成するための表示画像14cが、図3(3)に示される
ように表示される。表示画像14cは、フリーノート入
力画像17と手書き入力ボード画像21とから成り、た
とえば表示画像14cの上半分に前記フリーノート入力
画像17が表示され、下半分に手書き入力ボード画像2
1が表示される。手書き入力ボード画像21は、フリー
ノート入力画像17中に文字を手書き入力するためのも
のである。フリーノート入力画像17には、たとえば図
3(3)に示されるように予め登録されている日付およ
び内容の項目が含まれており、さらに図示される紙面上
の右上方には、入力内容を編集するための編集ボタン1
8、入力内容を記憶するための登録ボタン19および実
行されている処理を中止するための中止ボタン20が表
示される。また、フリーノート入力画像17には入力位
置を指示するためのカーソル28が表示される。カーソ
ル28の位置は、入力ペン5で指示することによって自
由に移動することができる。
【0035】手書き入力ボード画像21には、複数(本
実施例では4)の手書き文字入力枠22a〜22d、第
1候補文字表示部23、候補文字列表示部24および認
識ボタン25と、採用ボタン26と、候補ボタン27と
を含む複数のボタンが表示される。入力枠22a〜22
dは、入力したい文字を入力ペン5を用いて記入するた
めのものであり、当該入力枠22a〜22dに文字が1
文字ずつ記入される。第1候補文字表示部23は、入力
枠22a〜22dから入力された画像データを文字とし
て認識し、得られた第1候補文字を入力枠22a〜22
dに文字入力された順に表示するためのものである。た
とえば10文字の第1候補文字を表示することができ
る。候補文字列表示部24は、文字認識し、得られた候
補文字列を表示するためのものである。
【0036】認識ボタン25は、入力された画像データ
の文字認識の開始を指示するためのボタンである。採用
ボタン26は、文字認識後の確定した文字をフリーノー
ト入力画像17のカーソル28の位置に入力し、採用す
ることを指示するためのボタンである。候補ボタン27
は、候補文字列を前記候補文字列表示部24に表示する
ことを指示するためのボタンであり、たとえば候補文字
列を表示しているときには、「候補」という表示が鮮明
に表示される。また、候補文字列を表示していないとき
には、「候補」という表示が不鮮明に表示される。
【0037】図4は、文字認識時に表示される表示画像
を段階的に示す平面図である。ここでは、「ディジタル
に変換する」と入力する例について説明する。まず、図
4(1)に示されるように、文字を入力したい位置にカ
ーソル28を表示させる。該カーソル28の位置から、
図4(1)の紙面上で右方向に文字が入力される。カー
ソル28を所望の位置に表示させた後、入力枠22a〜
22dに入力ペン5を用いて1文字ずつ文字を手書き入
力する。このとき、入力された文字が白色表示中に黒色
表示される。図4(1)に示されるように「ディジタ」
と入力した後、認識ボタン25から文字認識の開始を指
示すると、入力枠22a,22b,22c,22dの順
に入力された画像データが文字として認識される。
【0038】文字認識は、後述するストローク情報に基
づく所定の手順で行われ、第1候補文字が得られる毎
に、図4(2)に示されるように第1候補文字表示部2
3に表示される。このとき、入力枠22a〜22dに表
示された手書き入力文字は順に消去される。入力された
画像データの文字認識が終了すると、図4(3)に示さ
れるように、第1候補文字表示部23に「ディジタ」と
表示され、また入力枠22a〜22dに表示された手書
き入力文字が全て消去される。続いて、図4(4)に示
されるように入力枠22a〜22dに「ルに変換」と入
力した後、同様の手順で文字認識が実行される。
【0039】図5は、文字認識後の確定した文字をフリ
ーノート入力画像17に入力するときに表示される表示
画像を段階的に示す平面図である。上述した手順で文字
認識されて得られた第1候補文字は、図5(1)に示さ
れるように第1候補文字表示部23に表示される。該表
示部23に表示された第1候補文字に誤りがない場合に
は、採用ボタン26からの指示に基づいて、カーソル2
8の位置から図5(1)紙面上で右方向に順に入力され
て、図5(2)に示されるような表示画像が得られる。
このとき、第1候補文字表示部23に表示された文字は
消去される。なお、第1候補文字表示部23に表示され
た文字に誤りがあった場合には、候補ボタン27から候
補文字列の表示を指示して、所望とする文字への訂正が
行われる。
【0040】なお、上述した説明では、認識ボタン25
からの指示に基づいて文字認識を開始しているけれど
も、認識の開始の判断は認識ボタン25に基づくものに
限らず、たとえば異なる入力枠に文字が入力されたと
き、文字入力が所定の時間以上行われないとき、あるい
は入力枠以外の領域が入力ペン5で指示されたときを文
字認識の開始と判断することも可能である。
【0041】また前記第1候補文字表示部23に表示さ
れる文字数が所定の文字数、たとえば10文字となる
と、入力枠22a〜22dに新たに文字が手書き入力さ
れても、文字認識は行われない。たとえば採用ボタン2
6から採用が指示されると、上述したように第1候補文
字表示部23に表示された文字は消去され、新たに手書
き入力された文字の文字認識が行われる。
【0042】図6は、候補文字列の作成動作を示すフロ
ーチャートである。また、図7はRAM8内の候補文字
列メモリ31を示す図である。ステップa1では、画像
データが入力される。本実施例では、前述のように入力
ペン5を用いて入力枠22a〜22dに文字を手書き入
力することによって画像データが入力される。ステップ
a2では、予め定める複数の文字データと入力された画
像データとを照合して、入力画像データを文字として認
識する。ステップa3では、候補文字列が作成される。
候補文字列は、前記複数の文字データを画像データに類
似する度合の高い順に配列したものである。ステップa
4では、作成された候補文字列が候補文字列メモリ31
に一旦記憶される。候補文字列メモリ31は、第1候補
文字領域32と候補文字列領域33とを含んで構成され
る。第1候補文字領域32には第1候補文字が記憶さ
れ、候補文字列領域33には作成された候補文字列が記
憶される。記憶されるデータは、入力された順番に記憶
される。前記採用ボタン26から確定した文字の採用が
指示されると、前記領域32,33に記憶されたデータ
は消去される。
【0043】ステップa5では、作成された候補文字列
の候補文字の順序の並べかえが行われる。候補文字の順
序の並べかえは、第1候補文字領域32の内容に基づい
て、以下の表1に示されるような、文章における一般的
な文字の配列規則に従って行われる。
【0044】
【表1】
【0045】すなわち、1つ前の文字の種類と同じ種類
であり、画像データに類似する度合の最も高い文字が第
1候補文字となるように並べかえられる。また、文章中
での配列の先後が定められている一対の文字のうちの、
後で用いられる文字が候補文字列中にあり、先に用いら
れる文字が以前の候補文字列の第1候補文字となってい
たときには、前記後で用いられる文字が第1候補文字と
なるように並べかえられる。前記文字の種類としては、
たとえば平仮名、カタカナ、漢字、数字、記号およびア
ルファベット(大文字、小文字)などが挙げられる。ま
た前記一対の文字としては、表1中に示し
た「(」「)」の他に、「[」「]」、「{」「}」、
「「」「」」、「<」「>」などが挙げられる。
【0046】このとき例外として、1つ前の文字の種類
が句読点であった場合には、文章の区切りであると判断
して並べかえは行わない。また、1つ前の文字の種類が
助詞であった場合にも、1単位の文節であると判断して
並べかえは行わない。さらに、1つ前の文字がなけれ
ば、文章の先頭文字であると判断して、並べかえは行わ
ない。またさらに、第1候補文字が句読点、または助詞
であったときには、並べかえは行わない。
【0047】ステップa6では、上述した規則に従って
並べかえられて作成された候補文字列が先に記憶された
候補文字列に代わって新たに候補文字列メモリ31に記
憶される。
【0048】図8は、文字認識時における具体的な候補
文字の並べかえの動作を示すフローチャートである。ス
テップb1では、ポインタPおよび前記候補文字列メモ
リ31が初期化される。ポインタPとは、手書き入力さ
れた文字を文字認識し、得られた第1候補文字を第1候
補文字表示部23のどの位置に表示するかを示すもので
あり、CPU6内に設けられて前記初期化によってP=
0となる。ステップb2では、候補文字があるかどうか
が判断される。候補文字が有る場合にはステップb9に
移り、無い場合にはステップb3に移る。ステップb3
では、入力ペン5からの入力があったかどうかが判断さ
れる。有った場合にはステップb4に移り、無かった場
合にはステップb2に移る。ステップb4では、入力位
置に対応した処理が有るかどうかが判断される。処理が
有る場合にはステップb5に移り、無い場合にはステッ
プb2に移る。
【0049】ステップb5では、入力ペン5からの入力
が認識ボタン25の表示位置であるかどうかが判断され
る。認識ボタン25の位置である場合にはステップb6
に移り、認識ボタン25の位置でない場合にはステップ
b7に移る。ステップb6では、所定の手順で候補文字
列が作成される。すなわち入力された画像データと予め
定める認識対象となる複数の文字データとが照合され
て、前記文字データを画像データに類似する度合の高い
順に配列した候補文字列が作成される。ステップb6の
処理が終了すると、ステップb2に移る。
【0050】ステップb7では、入力ペン5からの入力
が採用ボタン26の表示位置であるかどうかが判断され
る。採用ボタン26の表示位置である場合にはステップ
b8に移り、採用ボタン26の表示位置でない場合には
入力位置に対応して設定される所定の処理が実行され
る。ステップb8では、第1候補文字表示部23に表示
された文字が、フリーノート入力画像17のカーソル2
8の位置に表示される。このとき、前記候補文字列メモ
リ31に記憶されたデータは消去される。ステップb8
の処理が終了すると、ステップb1に戻る。
【0051】前記ステップb2で候補文字が有ると判断
された場合、ステップb9では、ポインタP=0である
かどうかが判断される。ポインタP=0、すなわち第1
候補文字表示部23に表示される第1番目の文字であっ
た場合にはステップb10に移り、ポインタP≠0、す
なわち第1候補文字表示部23に表示される2番目以降
の文字であった場合にはステップb14に移る。ステッ
プb10では、前記画像データに類似する度合の最も高
い文字が第1候補文字に選ばれる。ステップb11で
は、ポインタPの値が確認されて、候補文字列メモリ3
1の第1候補文字領域32および候補文字列領域33に
データの記憶が可能であるかどうかが判断される。記憶
が可能であると判断された場合にはステップb12に移
り、記憶が不可能であると判断された場合にはステップ
b2に移る。ステップb12では、選ばれた第1候補文
字が第1候補文字領域32に記憶され、候補文字列が候
補文字列領域33に記憶される。このとき、第1候補文
字は第1候補文字表示部23に表示される。ステップb
13では、ポインタPの値がP=P+1とされる。ステ
ップb13の処理が終了すると、ステップb2に戻る。
【0052】前記ステップb9でポインタP≠0であっ
た場合、ステップb14では、前記画像データに類似す
る度合の最も高い文字が句読点あるいは平仮名の助詞で
あるかどうかが判断される。句読点あるいは平仮名の助
詞であった場合にはステップb11に移り、無かった場
合にはステップb15に移る。ステップb15では、入
力された文字の1つ前の文字が、句読点あるいは平仮名
の助詞であったかどうかが判断される。1つ前の文字が
句読点あるいは平仮名の助詞であった場合にはステップ
b11に移り、なかった場合にはステップb16に移
る。
【0053】ステップb16では、作成された候補文字
列の第1〜第5候補文字の中に「)」があるかどうかが
判断される。有る場合にはステップb17に移り、無い
場合にはステップb20に移る。ステップb17では、
ポインタP=0〜Pmax(本実施例では10)の間の
第1候補文字の中に「(」があるかどうかが判断され
る。有る場合にはステップb18に移り、無い場合には
ステップb20に移る。ステップb18では、「)」が
第1候補文字に選ばれる。ステップb19では、候補文
字の並べかえが行われる。ステップb19の処理が終了
すると、ステップb11に戻る。
【0054】前記ステップb16で作成された候補文字
列の第1〜第5候補文字の中に「)」がなかったとき、
および前記ステップb17で以前に作成された候補文字
列の第1候補文字の中に「(」がなかったときは、ステ
ップb20で、入力された文字の1つ前の文字が漢字あ
るいは平仮名であったかどうかが判断される。1つ前の
文字が漢字あるいは平仮名であった場合にはステップb
21に移り、なかった場合にはステップb23に移る。
ステップb21では、作成された候補文字列の第1〜第
5候補文字の中に漢字あるいは平仮名があるかどうかが
判断される。有る場合にはステップb22に移り、無い
場合にはステップb11に移る。ステップb22では、
前記第1〜第5候補文字の中の漢字あるいは平仮名が第
1候補文字に選ばれる。ステップb22の処理が終了す
ると、ステップb19に戻る。
【0055】前記ステップb20で入力された文字の1
つ前の文字が漢字あるいは平仮名でなかった場合のステ
ップb23では、1つ前の文字がカタカナであったかど
うかが判断される。1つ前の文字がカタカナであった場
合にはステップb24に移り、なかった場合にはステッ
プb26に移る。ステップb24では、作成された候補
文字列の第1〜第5候補文字の中にカタカナがあるかど
うかが判断される。カタカナが有る場合にはステップb
25に移り、無い場合にはステップb11に移る。ステ
ップb25では、前記第1〜第5候補文字の中のカタカ
ナが第1候補文字に選ばれる。ステップb25の処理が
終了すると、ステップb19に戻る。
【0056】前記ステップb23で入力された文字の1
つ前の文字がカタカナでなかった場合、ステップb26
では、作成された候補文字列の第1〜第5候補文字の中
に数字、記号あるいはアルファベット(英字)があるか
どうかが判断される。ある場合にはステップb27に移
り、ない場合にはステップb11に移る。ステップb2
7では、前記第1〜第5候補文字の中の数字、記号ある
いはアルファベットが第1候補文字に選ばれる。ステッ
プb27の処理が終了するとステップb19に戻る。
【0057】以上のように、本実施例の電子機器1で
は、手書き入力された文字の文字認識時において、選ば
れる第1候補文字は、入力された画像データに類似する
度合の最も高い文字のみが選ばれるのではなく、日本語
を記述する上で経験的に得られた文字の配列規則に基づ
いて選ばれる。したがって、文字認識率が向上する。
【0058】図9は、認識された文字を訂正する際に表
示される表示画像を段階的に示す平面図である。前述し
たのと同様に「ディジタルに変換する」と手書き文字入
力を行ったにもかかわらず、図9(1)に示されるよう
に全角文字の「ル」が半角文字の「N」と認識された場
合、半角文字の「N」を全角文字の「ル」に修正する処
理が行われる。
【0059】たとえば入力ペン5を用いて第1候補文字
表示部23に表示された半角文字の「N」を含む領域を
指示すると、図9(2)に示されるように候補文字列表
示部24に、作成された候補文字列が表示される。表示
された候補文字列の中から所望とする文字、すなわち全
角文字の「ル」を含む領域を入力ペン25で指示する
と、図9(3)に示されるように半角文字の「N」に代
わって全角文字の「ル」が表示される。このように誤っ
て認識された文字の修正操作は、操作者にとっては煩雑
な作業である。本実施例の電子機器1は文字認識率の高
いものであることから、上述したような修正作業を行う
回数が少なくなり、利便性が向上する。
【0060】なお、本実施例では、候補文字の並べかえ
時において、アルファベットであるかどうかの判断しか
行っていないけれども、アルファベットのうちの大文字
であるか、あるいは小文字であるかの判断を行う処理を
加えることも本発明の範囲に属する。たとえば1つ前の
文字がアルファベットの小文字であり、候補文字の中に
アルファベットの大文字と小文字とがある場合には、ア
ルファベットの小文字を第1候補文字に選ぶ。
【0061】また、外来語や英語などの種類の異なる文
字が混在する文章における文字認識率を向上させるため
に、文字の種類によって第1候補文字の選択の基準をか
えることも可能であり、このような方法で並べかえを行
うことも本発明の範囲に属するものである。
【0062】図10は、文字認識用メモリ35の構成を
示す図である。以下に具体的な文字認識方法の一例を簡
単に説明する。文字認識用メモリ35は、認識対象とな
る複数の文字データが記憶される文字データ群メモリ3
6と、手書き入力された画像データが記憶される取得画
像データメモリ37とから構成される。文字データ群メ
モリ36には、複数の文字データが特徴データ毎に分類
されて記憶されている。図示されるものは、特徴データ
A10〜A39をそれぞれ有する文字データB10〜B
39が、特徴データA1〜A3に分類されて記憶されて
いることを表している。取得画像データメモリ37に
は、入力された画像データCと、該画像データCから抽
出された特徴データDとが記憶される。
【0063】文字認識時には、まず得られた画像データ
Cから抽出された特徴データDと、前記文字データ群メ
モリ36の特徴データA1〜A3とが比較され、特徴デ
ータA1〜A3の中から最も類似の度合の高い特徴デー
タが選ばれる。たとえば特徴データA1が選ばれたとす
ると、続いて前記特徴データDと特徴データA10〜A
19とが比較され、類似の度合の最も高い文字が第1候
補文字とされるとともに、類似の度合の高い順に特徴デ
ータA10〜A19が並べられて候補文字列が作成され
る。
【0064】このように候補文字列を予め定める全ての
認識対象文字データで作成するのではなく、予め定める
しきい値以上の類似の度合を有する文字データで作成す
ることによって、類似の度合の低い文字データが並べか
えの対象から除外される。なお、前記しきい値で区切る
のではなく、類似の度合が高い方から所定の文字数まで
とすることも可能であり、図8を用いて説明した例は、
前記所定の文字数を5とした場合の一例である。
【0065】前記しきい値で区切った場合、しきい値以
上の文字数が多かったときには、並べかえを効率よく実
施することができないけれども、このような場合に文字
数で区切ることによって並べかえの対象となる文字数を
少なくして並べかえを効率よく行うことができる。ま
た、文字数で区切った場合、選ばれた文字の平均的な類
似の度合が低かったときには、文字認識精度が低下する
おそれがあるけれども、このような場合にしきい値で区
切ることによって、類似の度合を高くして文字認識の精
度を図ることができる。このように、しきい値で区切る
方法と、文字数で区切る方法とを使い分けることによっ
て、精度の高い認識結果を効率よく得ることが可能とな
る。
【0066】図11は、文字のストロークデータを座標
点の集合として抽出する場合の座標点抽出の一例を示す
図である。図11(1)は1ストロークのペンオン状態
の筆記情報を抽出する方法の一例を簡略化して示す図で
ある。1ストロークのペンオン状態の筆記情報は、ペン
オン状態を表すデータと、ペンの位置を表す座標点のデ
ータとから成る。筆記情報となるペンオン状態の座標点
は、一般に、ペンオン状態の期間、ペンの移動に伴っ
て、一定の時間間隔で座標上のペンの位置の座標点を検
出することによって得られる。
【0067】ペンオン状態になった瞬間の点R1をスト
ロークの始端とし、その座標点を検出してペンオン状態
の筆記情報とする。ペンオン状態となった瞬間から、一
定時間T秒をおいて、ペンオン状態かどうかを判断し、
ペンオン状態ならペンの位置R2の座標点を検出し、ペ
ンオン状態の筆記情報とする。このとき、ペンオフ状態
であれば、ペンオフ状態の筆記情報とする。
【0068】このようにして、ペンオフ状態が検出され
るまで、一定時間間隔T秒で、ペンの座標点を検出し、
ペンオン状態の筆記情報を繰返し得る。図11(1)で
は、「て」という文字のストローク上の点R1,R2,
…,Ri,…,Rmの座標点が、筆記情報とされている
ことを表している。
【0069】図11(2)は、前記点R1〜Rmの中か
ら、文字として認識するためのストロークの特徴を最も
よく表す点として点Q1,Q2,…,Qi,…,Q17
の17点が選び出された一例を示す図である。点Q1〜
Q17は、ストロークの始端、終端、屈曲点などを表す
点であり、これらの点に関する座標点などの特徴データ
が、文字認識の照合に用いられる。屈曲点は、曲線上の
点であり、たとえば点Ri,Qjなどのように、この点
の両側で各点を結ぶ線分が鋭角をなす尖点などを含む。
この文字認識のために選ばれる点の数は、認識プログラ
ムに応じて、任意に設定される。
【0070】なお本実施例では、画像データの入力をタ
ブレットを用いた手書き入力によって行う例について説
明したけれども、画像データの入力は、手書き入力に限
るものではなく、たとえばCCDなどを用いた画像を読
取ることによって入力する例も本発明の範囲に属するも
のである。本発明はこのような入力手段を備える、たと
えばワードプロセッサ、パーソナルコンピュータなどの
電子機器に好適に用いられる。
【0071】
【発明の効果】以上のように本発明によれば、文字認識
手段は、作成した候補文字列の候補文字の順序を、記憶
手段に記憶された内容に基づいて、文章における一般的
な文字の配列規則に従って並べかえて出力する。したが
って、文字認識率が向上する。
【0072】また本発明によれば、候補文字列は、画像
データに類似する度合が予め定めるしきい値以上の文字
から構成され、類似の度合の低い文字が並べかえの対象
から除外される。またあるいは、画像データに類似する
度合の高い方から予め定める文字数に選ばれ、並べかえ
の対象とされる文字の数が限定される。したがって、文
字認識の精度および効率が向上する。
【図面の簡単な説明】
【図1】本発明の一実施例である文字認識装置を備えた
電子機器1の外観を示す平面図である。
【図2】前記電子機器1の電気的構成を示すブロック図
である。
【図3】前記電気的機器1が備えるレポート機能を用い
てフリーノートを作成する際に表示される表示画像を段
階的に示す平面図である。
【図4】文字認識時に表示される表示画像を段階的に示
す平面図である。
【図5】文字認識後の確定した文字をフリーノート入力
画像17に入力するときに表示される表示画像を段階的
に示す平面図である。
【図6】候補文字列の作成動作を示すフローチャートで
ある。
【図7】RAM8内の候補文字列メモリ31を示す図で
ある。
【図8】文字認識時における具体的な候補文字の並べか
えの動作を示すフローチャートである。
【図9】認識された文字を訂正する際に表示される表示
画像を段階的に示す平面図である。
【図10】文字認識用メモリ35の構成を示す図であ
る。
【図11】文字のストロークデータを座標点の集合とし
て抽出する場合の座標点抽出の一例を示す図である。
【符号の説明】
1 電子機器 2 表示パネル 3 機能選択キー部 5 入力ペン 6 CPU 7 ROM 8 RAM 11 制御回路 12 A/D変換器 13 タブレット 21 手書き入力ボード画像 22a〜22d 入力枠 23 第1候補文字表示部 24 候補文字列表示部 25 認識ボタン 31 候補文字列メモリ 32 第1候補文字領域 33 候補文字列領域 35 文字認識用メモリ 36 文字データ群メモリ 37 取得画像データメモリ

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 画像データを入力する入力手段と、 前記入力手段からの画像データを文字として認識し、予
    め定める認識対象となる複数の文字を前記画像データに
    類似する度合の高い順に配列した候補文字列を作成して
    出力する文字認識手段と、 前記文字認識手段からの候補文字列を記憶する記憶手段
    とを含み、 前記文字認識手段は、前記記憶手段に記憶された内容に
    基づいて、文章における一般的な文字の配列規則に従っ
    て、作成した候補文字列の候補文字の順序を並べかえて
    出力することを特徴とする文字認識装置。
  2. 【請求項2】 前記文字認識手段は、前記記憶手段に記
    憶された1つ前の候補文字列の第1番目の候補文字の種
    類と同種類であって、前記画像データに類似する度合の
    最も高い候補文字を第1番目の候補文字とした候補文字
    列を作成して出力することを特徴とする請求項1記載の
    文字認識装置。
  3. 【請求項3】 前記文字認識手段は、前記記憶手段に記
    憶された1つ前の候補文字列の第1番目の候補文字の種
    類が句読点であった場合には、作成した候補文字列をそ
    のまま出力することを特徴とする請求項1記載の文字認
    識装置。
  4. 【請求項4】 前記文字認識手段は、前記記憶手段に記
    憶された1つ前の候補文字列の第1番目の候補文字の種
    類が助詞であった場合には、作成した候補文字列をその
    まま出力することを特徴とする請求項1記載の文字認識
    装置。
  5. 【請求項5】 前記文字認識手段は、前記記憶手段に候
    補文字列が記憶されていなかった場合には、作成した候
    補文字列をそのまま出力することを特徴とする請求項1
    記載の文字認識装置。
  6. 【請求項6】 前記文字認識手段は、類似の度合の最も
    高い文字の種類が句読点または助詞であった場合には、
    作成した候補文字列をそのまま出力することを特徴とす
    る請求項1記載の文字認識装置。
  7. 【請求項7】 前記文字認識手段は、作成した候補文字
    列の中に文章中での配列の先後が定められている一対の
    文字のうちの後に用いられる文字があり、前記記憶手段
    に記憶された候補文字列の第1番目の候補文字の中に前
    記一対の文字のうちの先に用いられる文字があった場合
    には、前記後に用いられる文字を第1番目の候補文字と
    した候補文字列を作成して出力することを特徴とする請
    求項1記載の文字認識装置。
  8. 【請求項8】 前記候補文字列は、前記画像データに類
    似する度合が予め定めるしきい値以上の文字から成るこ
    とを特徴とする請求項1記載の文字認識装置。
  9. 【請求項9】 前記候補文字列は、前記画像データに類
    似する度合の高い方から予め定める文字数に選ばれるこ
    とを特徴とする請求項1記載の文字認識装置。
JP10135194A 1994-05-16 1994-05-16 文字認識装置 Expired - Lifetime JP3153704B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10135194A JP3153704B2 (ja) 1994-05-16 1994-05-16 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10135194A JP3153704B2 (ja) 1994-05-16 1994-05-16 文字認識装置

Publications (2)

Publication Number Publication Date
JPH07311818A true JPH07311818A (ja) 1995-11-28
JP3153704B2 JP3153704B2 (ja) 2001-04-09

Family

ID=14298423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10135194A Expired - Lifetime JP3153704B2 (ja) 1994-05-16 1994-05-16 文字認識装置

Country Status (1)

Country Link
JP (1) JP3153704B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006330780A (ja) * 2005-05-23 2006-12-07 Sharp Corp 文字認識装置および文字認識プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006330780A (ja) * 2005-05-23 2006-12-07 Sharp Corp 文字認識装置および文字認識プログラム

Also Published As

Publication number Publication date
JP3153704B2 (ja) 2001-04-09

Similar Documents

Publication Publication Date Title
CN1205528C (zh) 计算机系统中提供提示的方法
US6944472B1 (en) Cellular phone allowing a hand-written character to be entered on the back
US6970599B2 (en) Chinese character handwriting recognition system
EP1435561B1 (en) Method and apparatus for recognizing and associating handwritten information in various languages
KR101006749B1 (ko) 전자 장치들 내에서 수기 인식
US6493464B1 (en) Multiple pen stroke character set and handwriting recognition system with immediate response
EP1683075B1 (en) Boxed and lined input panel
US20030099398A1 (en) Character recognition apparatus and character recognition method
KR100704093B1 (ko) 콤포넌트 기반의, 적응성 스트로크 명령 시스템
JPH0981320A (ja) ペン入力式選択入力装置及びその方法
US20080300861A1 (en) Word formation method and system
JPH06332610A (ja) 手書き情報入力処理方式
EP1513053A2 (en) Apparatus and method for character recognition
JPH07295940A (ja) 電子機器
KR100713407B1 (ko) 펜 컴퓨팅 시스템에서의 펜 입력 방법 및 장치
US6724936B1 (en) Handwriting input device and method using a single character set
US6792146B2 (en) Method and apparatus for entry of multi-stroke characters
JP2003196593A (ja) 文字認識装置および文字認識方法および文字認識プログラム
JP3153704B2 (ja) 文字認識装置
JP2003005902A (ja) 文字入力装置、情報処理装置、文字入力装置の制御方法、及び記憶媒体
JPH0744655A (ja) 手書き入力表示装置
AU2000248211A1 (en) Method and apparatus for entry of multi-stroke characters
JPH0562008A (ja) 文字認識方法
JP2825996B2 (ja) 端末装置
JP3022790B2 (ja) 手書き文字入力装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080126

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090126

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100126

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110126

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120126

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 12

EXPY Cancellation because of completion of term