JPS61131159A - 誤読文字修正装置 - Google Patents
誤読文字修正装置Info
- Publication number
- JPS61131159A JPS61131159A JP59252952A JP25295284A JPS61131159A JP S61131159 A JPS61131159 A JP S61131159A JP 59252952 A JP59252952 A JP 59252952A JP 25295284 A JP25295284 A JP 25295284A JP S61131159 A JPS61131159 A JP S61131159A
- Authority
- JP
- Japan
- Prior art keywords
- character
- kanji
- candidate
- recognizing
- misread
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は、文字認識装置により得られた読取結果が誤読
文字であった場合の修正を行なう誤読文字修正装置に関
するものである。
文字であった場合の修正を行なう誤読文字修正装置に関
するものである。
[従来の技術]
従来、誤読文字の修正方式としては、以下に述べるよう
な方式がある。
な方式がある。
■ 所望の漢字文字に対応したJISコードを入力する
ことにより誤読文字を修正する。
ことにより誤読文字を修正する。
■ 漢字辞書を「読み」で検索して、所望の漢字文字を
呼出して修正する(かな漢字変換)0■ 文字認識の際
に得られた複数の認識候補を上位から順次読み出して所
望の漢字文字に修正する。
呼出して修正する(かな漢字変換)0■ 文字認識の際
に得られた複数の認識候補を上位から順次読み出して所
望の漢字文字に修正する。
[発明が解決しようとする問題点コ
しかしながら、前述した方式■の場合はJISコードブ
ックを参照(漢字の場合、文字数が多いのでとても記憶
できない)してからJISコード(通常4文字種からな
る)を入力する必要があり、オペレータの操作が大変煩
わしいという欠点がある。次の方式■の場合は、同音異
字の漢字が多数あるため、修正に長時間を要する。更に
次の方式■の場合は、得られた複数の認識候補内に所望
(正続)の文字が存在しない場合がある。つ−まり漢字
文字の認識を行なう場合には例えば手書きの入力文字に
おいては、画数により認識用の辞書を分類しておき、所
定の画数の辞書内の文字パターンにしているため、必ず
しも正続文字が複数の認識候補中に存在するとは限らな
い。
ックを参照(漢字の場合、文字数が多いのでとても記憶
できない)してからJISコード(通常4文字種からな
る)を入力する必要があり、オペレータの操作が大変煩
わしいという欠点がある。次の方式■の場合は、同音異
字の漢字が多数あるため、修正に長時間を要する。更に
次の方式■の場合は、得られた複数の認識候補内に所望
(正続)の文字が存在しない場合がある。つ−まり漢字
文字の認識を行なう場合には例えば手書きの入力文字に
おいては、画数により認識用の辞書を分類しておき、所
定の画数の辞書内の文字パターンにしているため、必ず
しも正続文字が複数の認識候補中に存在するとは限らな
い。
従って、例えば、方式■、■等を併用して文字の修正を
行なう必要があるといった問題点を有する。
行なう必要があるといった問題点を有する。
[問題点を解決するための手段]
本発明は、前述した従来の欠点に鑑み、誤読文字の修正
を短時間で且つ簡単な操作で行なうことのできる誤読文
字修正装置を提供するもので、その手段は、入力文字パ
ターンと標準文字パターンとを比較することにより得ら
れた複数の認識候補のうち最も類似しているとして出力
された認識候補が誤読文字であった場合、前記入力文字
パターンの読み仮名を入力することにより、漢字辞書を
検索して得られた前記読み仮名に対応した複数個の同音
異字の漢字文字のうち前記入力文字パターンに対応する
漢字文字を選択して変換することによって誤読文字の修
正を行なう誤読文字修正装置であって、前記得られた複
数の同音異字の漢字の出力順序を前記複数の認識候補に
よって入換える順序入換え手段を設け、前記順序入換え
手段の出力する順に同音異字の漢字を出力することを特
徴とする誤読文字修正装置である。
を短時間で且つ簡単な操作で行なうことのできる誤読文
字修正装置を提供するもので、その手段は、入力文字パ
ターンと標準文字パターンとを比較することにより得ら
れた複数の認識候補のうち最も類似しているとして出力
された認識候補が誤読文字であった場合、前記入力文字
パターンの読み仮名を入力することにより、漢字辞書を
検索して得られた前記読み仮名に対応した複数個の同音
異字の漢字文字のうち前記入力文字パターンに対応する
漢字文字を選択して変換することによって誤読文字の修
正を行なう誤読文字修正装置であって、前記得られた複
数の同音異字の漢字の出力順序を前記複数の認識候補に
よって入換える順序入換え手段を設け、前記順序入換え
手段の出力する順に同音異字の漢字を出力することを特
徴とする誤読文字修正装置である。
[作 用]
本発明は、誤読文字を修正する際、基本的には漢字辞書
(いわゆる音訓辞書)を用いたかな漢字 l変
換方式(前述の方式■)をベースにするが、“読み°の
入力だけでは同音異字が多数発生するため、たくさんの
候補文字の中から特定の一字を目によって検索しなけれ
ばならない。
(いわゆる音訓辞書)を用いたかな漢字 l変
換方式(前述の方式■)をベースにするが、“読み°の
入力だけでは同音異字が多数発生するため、たくさんの
候補文字の中から特定の一字を目によって検索しなけれ
ばならない。
ところで、文字認識では、認識結果が誤読した場合(つ
まり、1位に正解のカテゴリがこなψつた場合)でも、
2位以下の認識候補中には正解のカテゴリが含まれる確
率が極めて高いという事実がある。すなわち、本発明は
、゛読み′から得られた同音異字例中に、認識候補に相
当する文字があれば、それを優先的に表示することにす
れば、より少ない変換操作で目的の文字にヒントする確
率が高まることを利用したものである。≠かか傘走±邊
伍りお一一一一′ −・−−・−ぐ−9−−m=と亨
[実施例] 第1図は本発明に係る誤読文字修正装置の実施例を説明
するための図である。
まり、1位に正解のカテゴリがこなψつた場合)でも、
2位以下の認識候補中には正解のカテゴリが含まれる確
率が極めて高いという事実がある。すなわち、本発明は
、゛読み′から得られた同音異字例中に、認識候補に相
当する文字があれば、それを優先的に表示することにす
れば、より少ない変換操作で目的の文字にヒントする確
率が高まることを利用したものである。≠かか傘走±邊
伍りお一一一一′ −・−−・−ぐ−9−−m=と亨
[実施例] 第1図は本発明に係る誤読文字修正装置の実施例を説明
するための図である。
第2図は認識候補の例を示す図、第3図は漢字辞書によ
る同音異字の例を示す図であって、夫々出力順に(11
,+21・・・等を付した例である。
る同音異字の例を示す図であって、夫々出力順に(11
,+21・・・等を付した例である。
第1図においてタブレット1から手書き入力された文字
パターンは特徴抽出部2に送られ、特徴系列に変換され
る。この特徴系列が照合部3において認識辞書4から読
み出された特徴系列と照合され、第2図に示すような入
力カテゴリ「失」に対する認識候補列(11〜(5)が
得られる。このうち第■候補の「失」が認識結果として
表示部9に表示される。(これは誤読の一例である) 一方、この認識結果を修正するために、タブレット1上
のキーボード(図示しない)より“読み′ (この場合
には「シラ」)を入力し、がな漢字変換部6に送る。か
な漢字変換部6では、漢字辞書7を検索し、例えば第3
図に示すようなかな漢字変換候補を得る。このうち第1
候補の「室」が認識結果として候補比較部5に送られ、
先にiMた認識候補列(1)〜(5)と比較される。
パターンは特徴抽出部2に送られ、特徴系列に変換され
る。この特徴系列が照合部3において認識辞書4から読
み出された特徴系列と照合され、第2図に示すような入
力カテゴリ「失」に対する認識候補列(11〜(5)が
得られる。このうち第■候補の「失」が認識結果として
表示部9に表示される。(これは誤読の一例である) 一方、この認識結果を修正するために、タブレット1上
のキーボード(図示しない)より“読み′ (この場合
には「シラ」)を入力し、がな漢字変換部6に送る。か
な漢字変換部6では、漢字辞書7を検索し、例えば第3
図に示すようなかな漢字変換候補を得る。このうち第1
候補の「室」が認識結果として候補比較部5に送られ、
先にiMた認識候補列(1)〜(5)と比較される。
比較の処理は、例えば次のようにして行なわれる。まず
、第1候補「室」に相当する文字が認識候補内に(但し
、1位を除く)存在するかを調べ、その結果を第4図に
示すデータ型式でソート部8に送る。ここで第4図に示
すデータ型式について説明する。
、第1候補「室」に相当する文字が認識候補内に(但し
、1位を除く)存在するかを調べ、その結果を第4図に
示すデータ型式でソート部8に送る。ここで第4図に示
すデータ型式について説明する。
データは、かな漢字変換候補((■)、 (21・・・
)の文字コードAと認識候補中における順位(1)〜(
5)を示す値Bとから成り、認識候補中に存在しない場
合は、「9」等の最大値が付与される。従って、第1候
補「室」の場合は、認識候補中に存在しないので、「室
」の文字コード+「9」というデータ型式でソート部8
に送られる。
)の文字コードAと認識候補中における順位(1)〜(
5)を示す値Bとから成り、認識候補中に存在しない場
合は、「9」等の最大値が付与される。従って、第1候
補「室」の場合は、認識候補中に存在しないので、「室
」の文字コード+「9」というデータ型式でソート部8
に送られる。
以下同様にして、「質」、「失」・・・と調べてゆき、
その結果をソート部8へ送る。ソート部8では、第4図
中のデータ型式の順位を示す値Bをソート・キーとして
昇順にソーティングする。第3図に示す側の場合では、
「失ゴのみに「2」という順位を示す値Bが付与され、
その他の文字はすべて「9」であるから、「失」が最上
位として出力される。ソート部8でのソーティング結果
は1文字づつ最上位の文字から順に表示部9にて表示さ
れる。尚最上位の文字が正続文字でない場合は、タブレ
ット1上の図示しないキーボード上の実行キーを繰返し
て押下することにより、順次下位の文字を表示せしめる
。正統文字の場合は、同様に図示しない修正キーを押下
して、誤読文字と置換えを行なう(図示されざる認識結
果を格納するバッファ内の値を換える)。
その結果をソート部8へ送る。ソート部8では、第4図
中のデータ型式の順位を示す値Bをソート・キーとして
昇順にソーティングする。第3図に示す側の場合では、
「失ゴのみに「2」という順位を示す値Bが付与され、
その他の文字はすべて「9」であるから、「失」が最上
位として出力される。ソート部8でのソーティング結果
は1文字づつ最上位の文字から順に表示部9にて表示さ
れる。尚最上位の文字が正続文字でない場合は、タブレ
ット1上の図示しないキーボード上の実行キーを繰返し
て押下することにより、順次下位の文字を表示せしめる
。正統文字の場合は、同様に図示しない修正キーを押下
して、誤読文字と置換えを行なう(図示されざる認識結
果を格納するバッファ内の値を換える)。
[発明の効果]
以上説明したように、本発明によれば、誤読文字の修正
を短時間で且つ簡単な操作により行なうことができる。
を短時間で且つ簡単な操作により行なうことができる。
第1図は、本発明に係る誤読文字装置の実施例を説明す
る図、第2図は認識候補の例を示す図、第3図は同音異
字の漢字の例を示す図、第4図はソート部に送られるデ
ータの型式を示す図である。 図において、3は照合部、4は認識辞書、5は候補比較
部、6はかな漢字変換部、7は漢字辞書、8はソート部
、9は表示部である。 、−ニアー’ニア、−′1 代理人 弁理士 検量 宏四部 ”、′ffyt回 %2121 第3121 第4I21
る図、第2図は認識候補の例を示す図、第3図は同音異
字の漢字の例を示す図、第4図はソート部に送られるデ
ータの型式を示す図である。 図において、3は照合部、4は認識辞書、5は候補比較
部、6はかな漢字変換部、7は漢字辞書、8はソート部
、9は表示部である。 、−ニアー’ニア、−′1 代理人 弁理士 検量 宏四部 ”、′ffyt回 %2121 第3121 第4I21
Claims (1)
- 入力文字パターンと標準文字パターンとを比較すること
により得られた複数の認識候補のうち最も類似している
として出力された認識候補が誤読文字であった場合、前
記入力文字パターンの読み仮名を入力することにより漢
字辞書を検索して得られた前記読み仮名に対応した複数
個の同音異字の漢字文字のうち前記入力文字パターンに
対応する漢字文字を選択して変換することによって誤読
文字の修正を行なう誤読文字修正装置であって、前記得
られた複数の同音異字の漢字の出力順序を前記複数の認
識候補によって入換える順序入換え手段を設け、前記順
序入換え手段の出力する順に同音異字の漢字を出力する
ことを特徴とする誤読文字修正装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59252952A JPS61131159A (ja) | 1984-11-30 | 1984-11-30 | 誤読文字修正装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59252952A JPS61131159A (ja) | 1984-11-30 | 1984-11-30 | 誤読文字修正装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61131159A true JPS61131159A (ja) | 1986-06-18 |
Family
ID=17244441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59252952A Pending JPS61131159A (ja) | 1984-11-30 | 1984-11-30 | 誤読文字修正装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61131159A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02136986A (ja) * | 1988-11-17 | 1990-05-25 | Sanyo Electric Co Ltd | 手書き文字認識装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58189777A (ja) * | 1982-04-30 | 1983-11-05 | Hitachi Ltd | 文字入力方式 |
JPS6149283A (ja) * | 1984-08-16 | 1986-03-11 | Toshiba Corp | 文字入力装置 |
-
1984
- 1984-11-30 JP JP59252952A patent/JPS61131159A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58189777A (ja) * | 1982-04-30 | 1983-11-05 | Hitachi Ltd | 文字入力方式 |
JPS6149283A (ja) * | 1984-08-16 | 1986-03-11 | Toshiba Corp | 文字入力装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02136986A (ja) * | 1988-11-17 | 1990-05-25 | Sanyo Electric Co Ltd | 手書き文字認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3560289B2 (ja) | 統合辞書ベースで、ありそうな文字列の手書き認識方法 | |
US6795579B2 (en) | Method and apparatus for recognizing handwritten chinese characters | |
US8539350B2 (en) | Automatic language selection for improving text accuracy | |
US20080294982A1 (en) | Providing relevant text auto-completions | |
JPH07160389A (ja) | データ入力ワークステーション | |
EP2202612B1 (en) | Automatic language selection for improving text accuracy | |
JPS60142792A (ja) | 多種文字認識装置 | |
JPS61131159A (ja) | 誤読文字修正装置 | |
AU726852B2 (en) | Method and device for handwritten character recognition | |
JP2003331214A (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
JP3022790B2 (ja) | 手書き文字入力装置 | |
JPS63198153A (ja) | 漢字入力処理方式 | |
JPH11120294A (ja) | 文字認識装置および媒体 | |
JPH06333083A (ja) | 光学式文字読取装置 | |
KR100258934B1 (ko) | 군집화된 알파벳 추출에 의한 온라인 영문 단어 인식장치 및방법 | |
JP2677271B2 (ja) | 文字認識装置 | |
JP2874815B2 (ja) | 日本語文字読取装置 | |
JPS6072089A (ja) | 認識装置 | |
JPH11282965A (ja) | 文字認識装置及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPS60254386A (ja) | 文字認識装置における文字修正方法 | |
JPH04138583A (ja) | 文字認識装置 | |
JPS60128578A (ja) | 情報認識装置 | |
JPH05135199A (ja) | 漢字ocr | |
JPH05314304A (ja) | 文字認識装置 | |
JPS61131089A (ja) | 手書き文字認識装置 |