JP2549831B2 - 文字認識装置の入力パターン・文字列登録方法 - Google Patents
文字認識装置の入力パターン・文字列登録方法Info
- Publication number
- JP2549831B2 JP2549831B2 JP7130644A JP13064495A JP2549831B2 JP 2549831 B2 JP2549831 B2 JP 2549831B2 JP 7130644 A JP7130644 A JP 7130644A JP 13064495 A JP13064495 A JP 13064495A JP 2549831 B2 JP2549831 B2 JP 2549831B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- input
- information
- pattern
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
【0001】
【産業上の利用分野】本発明は、入力パターンを文字認
識し、対応する文字列を認識結果として出力する文字認
識装置の入力パターン・文字列登録方法に関する。
識し、対応する文字列を認識結果として出力する文字認
識装置の入力パターン・文字列登録方法に関する。
【0002】
【従来の技術】情報処理技術の発達に伴い、計算機で取
扱われるデータ量が膨大化している。これ故、各種デー
タを如何に効率良く計算機に入力するかが大きな課題と
なっている。
扱われるデータ量が膨大化している。これ故、各種デー
タを如何に効率良く計算機に入力するかが大きな課題と
なっている。
【0003】これに対する解答として、近時、帳票等に
印刷あるいは手書きされた文字・記号を光学的に読取っ
て文字認識してデータ入力するOCRや、タブレット等
の座標入力装置を介して筆記入力される文字ストローク
の情報から実時間的に文字認識してデータ入力する文字
認識装置が各種開発されている。
印刷あるいは手書きされた文字・記号を光学的に読取っ
て文字認識してデータ入力するOCRや、タブレット等
の座標入力装置を介して筆記入力される文字ストローク
の情報から実時間的に文字認識してデータ入力する文字
認識装置が各種開発されている。
【0004】ところで、この種の文字認識装置は、基本
的には入力文字パターンを1文字毎に切出し、その文字
パターンの特徴を検出して認識辞書に予め登録された標
準辞書パターンの特徴と照合し、この照合結果から上記
文字パターンに対する認識結果を得る如く構成されてい
る。この為、例えば原稿の下書やメモ書き等で多く利用
されている略字や略記号等を入力することができないと
云う不具合があった。そして、必然的に正式な書体によ
る文字・記号の筆記が要求されることになり、筆記者に
大きな負担を掛けることのみならず、文字データ入力時
間の増大、入力ミスの増大等を招く問題があった。
的には入力文字パターンを1文字毎に切出し、その文字
パターンの特徴を検出して認識辞書に予め登録された標
準辞書パターンの特徴と照合し、この照合結果から上記
文字パターンに対する認識結果を得る如く構成されてい
る。この為、例えば原稿の下書やメモ書き等で多く利用
されている略字や略記号等を入力することができないと
云う不具合があった。そして、必然的に正式な書体によ
る文字・記号の筆記が要求されることになり、筆記者に
大きな負担を掛けることのみならず、文字データ入力時
間の増大、入力ミスの増大等を招く問題があった。
【0005】
【発明が解決しようとする課題】本発明は、上記事情を
考慮してなされたものであり、入力パターンを文字認識
し、対応する文字列を認識結果として出力する文字認識
装置に所望の入力パターンとこれに対応する所望の文字
列を簡易に登録する方法を提供することを目的とする。
考慮してなされたものであり、入力パターンを文字認識
し、対応する文字列を認識結果として出力する文字認識
装置に所望の入力パターンとこれに対応する所望の文字
列を簡易に登録する方法を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明は、筆記入力され
た入力パターンから得られる情報と文字列の情報とを対
応付けて登録しておき、登録されているいずれかの入力
パターンに該当するパターンが筆記入力されたとき、こ
の入力パターンに対応付けられた前記文字列を当該筆記
入力されたパターンに対する認識結果として出力する文
字認識装置に、所望の入力パターンから得られる情報と
これに対応する所望の文字列の情報を登録する方法にお
いて、外部からの指定に応じて登録モードに移行し、前
記登録モードに移行した後に既に入力された文字列の情
報のうちから選択指定された文字列の情報を、前記認識
結果として出力すべき文字列の情報として登録し、前記
選択指定の際に筆記入力された入力パターンから検出さ
れた筆記ストロークの時系列な座標データから得られる
情報を、前記選択指定された文字列の情報を前記認識結
果とする入力パターンから得られる情報として、当該所
定の文字列の情報に対応付けて登録することを特徴とす
る。
た入力パターンから得られる情報と文字列の情報とを対
応付けて登録しておき、登録されているいずれかの入力
パターンに該当するパターンが筆記入力されたとき、こ
の入力パターンに対応付けられた前記文字列を当該筆記
入力されたパターンに対する認識結果として出力する文
字認識装置に、所望の入力パターンから得られる情報と
これに対応する所望の文字列の情報を登録する方法にお
いて、外部からの指定に応じて登録モードに移行し、前
記登録モードに移行した後に既に入力された文字列の情
報のうちから選択指定された文字列の情報を、前記認識
結果として出力すべき文字列の情報として登録し、前記
選択指定の際に筆記入力された入力パターンから検出さ
れた筆記ストロークの時系列な座標データから得られる
情報を、前記選択指定された文字列の情報を前記認識結
果とする入力パターンから得られる情報として、当該所
定の文字列の情報に対応付けて登録することを特徴とす
る。
【0007】
【0008】
【0009】
【作用】本発明では、登録モードが指定されると、文字
認識装置は登録モードに移行し、登録する文字列の選択
指定を受け付ける状態に入る。既に入力された文字列の
情報のうちから、所望する文字列の情報が選択指定して
与えられると、これを認識結果として出力すべき文字列
として登録する。次に、所望するパターンが筆記入力さ
れると、この入力パターンから検出された筆記ストロー
クの時系列な座標データから得られる情報を、先に選択
指定された文字列の情報と対応付けて登録する。
認識装置は登録モードに移行し、登録する文字列の選択
指定を受け付ける状態に入る。既に入力された文字列の
情報のうちから、所望する文字列の情報が選択指定して
与えられると、これを認識結果として出力すべき文字列
として登録する。次に、所望するパターンが筆記入力さ
れると、この入力パターンから検出された筆記ストロー
クの時系列な座標データから得られる情報を、先に選択
指定された文字列の情報と対応付けて登録する。
【0010】
【実施例】以下、図面を参照して本発明の一実施例につ
き説明する。図1は実施例装置の概略構成図である。こ
の実施例装置はタブレッド装置1の座標面上にペン2を
用いて筆記入力された文字・記号パターンを筆記ストロ
ークの時系列な座標データとして検出し、その特徴を抽
出して上記入力文字・記号パターンを文字認識するもの
である。しかして、前記タブレット装置1から時系列座
標データとして入力される文字・記号パターンの情報
は、検切部3に導かれて所定の前処理がなされたのち、
1文字毎に切出される。上記前処理は、例えば筆記スト
ロークデータの中から雑音成分を除去したり、また入力
文字・記号パターン毎にその大きさを正規化する等して
行われる。その後、上記前処理が施された入力パターン
について、例えば各筆記ストロークの標本点を特徴情報
として抽出する等して上記入力パターンを表現する特徴
データが求められる。認識部4は、このようにして求め
られた前記入力パターンの特徴と、認識辞書5に予め登
録された標準辞書パターンの特徴とを照合し、その類似
度を求める等して入力パターンに最も類似している標準
辞書パターンを検出し、この標準辞書パターンを前記入
力パターンの文字認識結果として求めている。
き説明する。図1は実施例装置の概略構成図である。こ
の実施例装置はタブレッド装置1の座標面上にペン2を
用いて筆記入力された文字・記号パターンを筆記ストロ
ークの時系列な座標データとして検出し、その特徴を抽
出して上記入力文字・記号パターンを文字認識するもの
である。しかして、前記タブレット装置1から時系列座
標データとして入力される文字・記号パターンの情報
は、検切部3に導かれて所定の前処理がなされたのち、
1文字毎に切出される。上記前処理は、例えば筆記スト
ロークデータの中から雑音成分を除去したり、また入力
文字・記号パターン毎にその大きさを正規化する等して
行われる。その後、上記前処理が施された入力パターン
について、例えば各筆記ストロークの標本点を特徴情報
として抽出する等して上記入力パターンを表現する特徴
データが求められる。認識部4は、このようにして求め
られた前記入力パターンの特徴と、認識辞書5に予め登
録された標準辞書パターンの特徴とを照合し、その類似
度を求める等して入力パターンに最も類似している標準
辞書パターンを検出し、この標準辞書パターンを前記入
力パターンの文字認識結果として求めている。
【0011】尚、認識部4における認識処理方式は、従
来より知られている種々の方式を適宜用いれば良いもの
であり、また前記認識辞書5の構成もその認識方式に応
じて定められることは云うまでもない。
来より知られている種々の方式を適宜用いれば良いもの
であり、また前記認識辞書5の構成もその認識方式に応
じて定められることは云うまでもない。
【0012】ところで、前記認識辞書5には予め複数の
認識対象文字の各標準辞書パターンが登録されている
が、この認識辞書5に新たな辞書パターンの追加登録が
できるようになっている。この認識辞書5に追加登録さ
れる辞書パターンは、辞書作成部6にて作成されるもの
で、辞書登録モード設定時に前記タブレット装置1を介
して入力される入力パターンの特徴データを新たな辞書
パターンとする等して行われる。
認識対象文字の各標準辞書パターンが登録されている
が、この認識辞書5に新たな辞書パターンの追加登録が
できるようになっている。この認識辞書5に追加登録さ
れる辞書パターンは、辞書作成部6にて作成されるもの
で、辞書登録モード設定時に前記タブレット装置1を介
して入力される入力パターンの特徴データを新たな辞書
パターンとする等して行われる。
【0013】即ち、辞書登録モード設定時には、先ず辞
書登録すべき文字列が、例えばキーボード装置(図示せ
ず)を介して文字コード等として入力される。尚、前記
タブレット装置1を介して上記文字列を入力するように
しても良く、或いは既に入力された文字列を選択指定し
て与えるようにしても良い。しかる後、この指定された
文字列に対する登録辞書パターンを前記タブレット装置
1を介して入力する。この登録辞書パターンは、例えば
図2に示すように、文字列「電話」に対しては、その略
称である「tel」の筆記体パターンとして、或いは文
字列「オンライン手書文字認識装置」に対しては特殊記
号パターン等として与えられる。このようにして入力さ
れる登録辞書パターンに対して、例えば図3に示すよう
にその筆記ストロークを9つの標本座標位置データとし
て特徴抽出し、これを新たな辞書パターン(特殊辞書パ
ターン)とする。この特殊辞書パターンを前記指定され
た所定の文字または文字列に対応付けて前記認識辞書5
に追加登録することによって、上記指定された文字列に
対する辞書登録が完了する。
書登録すべき文字列が、例えばキーボード装置(図示せ
ず)を介して文字コード等として入力される。尚、前記
タブレット装置1を介して上記文字列を入力するように
しても良く、或いは既に入力された文字列を選択指定し
て与えるようにしても良い。しかる後、この指定された
文字列に対する登録辞書パターンを前記タブレット装置
1を介して入力する。この登録辞書パターンは、例えば
図2に示すように、文字列「電話」に対しては、その略
称である「tel」の筆記体パターンとして、或いは文
字列「オンライン手書文字認識装置」に対しては特殊記
号パターン等として与えられる。このようにして入力さ
れる登録辞書パターンに対して、例えば図3に示すよう
にその筆記ストロークを9つの標本座標位置データとし
て特徴抽出し、これを新たな辞書パターン(特殊辞書パ
ターン)とする。この特殊辞書パターンを前記指定され
た所定の文字または文字列に対応付けて前記認識辞書5
に追加登録することによって、上記指定された文字列に
対する辞書登録が完了する。
【0014】かくしてこのような特殊辞書パターンが認
識辞書5に追加登録されると、それ以降に前記タブレッ
ト装置1を介して上記特殊辞書パターンに該当する入力
パターンが入力されると、前述した認識処理によって認
識部4は上記入力パターンが前記追加登録された特殊辞
書パターンであることを認識する。この認識結果を得
て、認識部4は上記特殊辞書パターンに対応して記憶さ
れた前記所定の文字列を前記入力パターンに対する認識
結果として出力する。
識辞書5に追加登録されると、それ以降に前記タブレッ
ト装置1を介して上記特殊辞書パターンに該当する入力
パターンが入力されると、前述した認識処理によって認
識部4は上記入力パターンが前記追加登録された特殊辞
書パターンであることを認識する。この認識結果を得
て、認識部4は上記特殊辞書パターンに対応して記憶さ
れた前記所定の文字列を前記入力パターンに対する認識
結果として出力する。
【0015】かくして本装置によれば、前記特殊辞書パ
ターンを有効に利用して所定の文字列を極めて簡易に入
力することが可能となる。つまり、日常使用している略
字や記号を利用して所望とする文字列を効率良く入力す
ることが可能となり、筆記者に対する負担を大幅に軽減
することができる。またこの特殊辞書パターンを利用し
て文字数の多い文章等を簡易に入力することも可能とな
り、文字データ入力の高速化を図り得る等の効果も奏せ
られる。
ターンを有効に利用して所定の文字列を極めて簡易に入
力することが可能となる。つまり、日常使用している略
字や記号を利用して所望とする文字列を効率良く入力す
ることが可能となり、筆記者に対する負担を大幅に軽減
することができる。またこの特殊辞書パターンを利用し
て文字数の多い文章等を簡易に入力することも可能とな
り、文字データ入力の高速化を図り得る等の効果も奏せ
られる。
【0016】尚、本発明は上述した実施例に限定される
ものではない。文字認識の方式や、この文字認識で用い
る入力パターンの特徴情報等も装置仕様に応じて種々変
形することができる。要するに本発明はその要旨を逸脱
しない範囲で種々変形して実施することができる。
ものではない。文字認識の方式や、この文字認識で用い
る入力パターンの特徴情報等も装置仕様に応じて種々変
形することができる。要するに本発明はその要旨を逸脱
しない範囲で種々変形して実施することができる。
【0017】
【発明の効果】本発明によれば、文字認識装置に登録モ
ードを指定し、既に入力された文字列のうちから所望す
る文字列を選択指定し、その後、所望するパターンを入
力することで、文字認識装置に所望の入力パターンとこ
れに対応する所望の文字列を簡易に登録することができ
る。
ードを指定し、既に入力された文字列のうちから所望す
る文字列を選択指定し、その後、所望するパターンを入
力することで、文字認識装置に所望の入力パターンとこ
れに対応する所望の文字列を簡易に登録することができ
る。
【0018】
【図1】本発明の一実施例に係る文字認識装置の概略構
成を示す図
成を示す図
【図2】辞書登録する指定の文字列とこの文字列に対し
て辞書登録される特殊パターンの例を示す図
て辞書登録される特殊パターンの例を示す図
【図3】入力パターンに対する特殊辞書パターンデータ
の抽出例を示す図
の抽出例を示す図
1…タブレット装置、2…ペン、3…検切部、4…認識
部、5…認識辞書、6…辞書作成部
部、5…認識辞書、6…辞書作成部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 比田井 裕 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝総合研究所内 (56)参考文献 特開 昭57−206988(JP,A) 「東芝日本語ワードプロセッサTOS WORD JW−7操作説明書」(昭57 −6−25)東京芝浦電気株式会社オフィ スオートメーション事業部P.230−234
Claims (1)
- 【請求項1】筆記入力された入力パターンから得られる
情報と文字列の情報とを対応付けて登録しておき、登録
されているいずれかの入力パターンに該当するパターン
が筆記入力されたとき、この入力パターンに対応付けら
れた前記文字列を当該筆記入力されたパターンに対する
認識結果として出力する文字認識装置に、所望の入力パ
ターンから得られる情報とこれに対応する所望の文字列
の情報を登録する方法において、 外部からの指定に応じて登録モードに移行し、 前記登録モードに移行した後に既に入力された文字列の
情報のうちから選択指定された文字列の情報を、前記認
識結果として出力すべき文字列の情報として登録し、 前記選択指定の際に筆記入力された入力パターンから検
出された筆記ストロークの時系列な座標データから得ら
れる情報を、前記選択指定された文字列の情報を前記認
識結果とする入力パターンから得られる情報として、当
該所定の文字列の情報に対応付けて登録することを特徴
とする文字認識装置の入力パターン・文字列登録方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7130644A JP2549831B2 (ja) | 1995-05-29 | 1995-05-29 | 文字認識装置の入力パターン・文字列登録方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7130644A JP2549831B2 (ja) | 1995-05-29 | 1995-05-29 | 文字認識装置の入力パターン・文字列登録方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59073412A Division JPH0634259B2 (ja) | 1984-04-12 | 1984-04-12 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0844829A JPH0844829A (ja) | 1996-02-16 |
JP2549831B2 true JP2549831B2 (ja) | 1996-10-30 |
Family
ID=15039189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7130644A Expired - Lifetime JP2549831B2 (ja) | 1995-05-29 | 1995-05-29 | 文字認識装置の入力パターン・文字列登録方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2549831B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57206988A (en) * | 1981-06-15 | 1982-12-18 | Fujitsu Ltd | Data processor |
-
1995
- 1995-05-29 JP JP7130644A patent/JP2549831B2/ja not_active Expired - Lifetime
Non-Patent Citations (1)
Title |
---|
「東芝日本語ワードプロセッサTOSWORDJW−7操作説明書」(昭57−6−25)東京芝浦電気株式会社オフィスオートメーション事業部P.230−234 |
Also Published As
Publication number | Publication date |
---|---|
JPH0844829A (ja) | 1996-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chaudhuri et al. | A complete printed Bangla OCR system | |
US7630551B2 (en) | Method and system for line extraction in digital ink | |
JP2726568B2 (ja) | 文字認識方法及び装置 | |
Amin | Off line Arabic character recognition: a survey | |
JP3452774B2 (ja) | 文字認識方法 | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
Zeki | The segmentation problem in arabic character recognition the state of the art | |
Bukhari et al. | High performance layout analysis of Arabic and Urdu document images | |
Saba et al. | Online versus offline Arabic script classification | |
Murase | Online recognition of free-format Japanese handwritings. | |
Elaiwat | Holistic word descriptor for lexicon reduction in handwritten arabic documents | |
AbdulKader | A two-tier arabic offline handwriting recognition based on conditional joining rules | |
JP2549831B2 (ja) | 文字認識装置の入力パターン・文字列登録方法 | |
Ramteke et al. | Tesseract OCR Recognition Based on Arabic Machine-Printed Document | |
JPH0634259B2 (ja) | 文字認識装置 | |
JPH05225399A (ja) | 文書処理装置 | |
Iwayama | Interactive Character recognition technology for pen-based computers | |
JPH10302025A (ja) | 手書き文字認識装置およびそのプログラム記録媒体 | |
Amin | Recognition of printed Arabic text using machine learning | |
Sarnacki et al. | Character Recognition Based on Skeleton Analysis | |
JP3015137B2 (ja) | 手書文字認識装置 | |
JP3151866B2 (ja) | 英文字認識方法 | |
Srihari et al. | Written Language Input | |
Ramanaprasad et al. | Reading handprinted addresses on IRS tax forms | |
Breuel | Applying the OCRopus OCR System to Scholarly Sanskrit Literature |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |