JP2765712B2 - 文字認識入力装置 - Google Patents

文字認識入力装置

Info

Publication number
JP2765712B2
JP2765712B2 JP63265504A JP26550488A JP2765712B2 JP 2765712 B2 JP2765712 B2 JP 2765712B2 JP 63265504 A JP63265504 A JP 63265504A JP 26550488 A JP26550488 A JP 26550488A JP 2765712 B2 JP2765712 B2 JP 2765712B2
Authority
JP
Japan
Prior art keywords
kanji
kana
character string
input
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63265504A
Other languages
English (en)
Other versions
JPH02112058A (ja
Inventor
文雄 外川
斉志 広瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP63265504A priority Critical patent/JP2765712B2/ja
Publication of JPH02112058A publication Critical patent/JPH02112058A/ja
Application granted granted Critical
Publication of JP2765712B2 publication Critical patent/JP2765712B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 (イ)産業上の利用分野 この発明はタブレット装置を使用したオンライン文字
認識装置における文字認識入力方式に関し、詳しくはタ
ブレット入力装置に記入した手書き文字を認識し、認識
結果として得られる標準文字を入力しうる文字認識入力
装置に関する。
(ロ)従来の技術 漢字文字列を入力する場合、例えば日本語ワープロで
は平仮名(英数字・記号も含む)を、それと一対あるい
は疑似対応したキーボードから入力して、仮入力された
平仮名文字列を仮名漢字変換処理によって所望の漢字文
字列を選択入力する方式が主流となっている。この方式
では平仮名の入力が基本となっている。
一方、キーボード入力以外の入力方式としては、認識
機能を備えた入力手段を用いる音声入力方式、手書き文
字入力方式、OCR(光学的文字認識)入力方式などがあ
る。しかし現状では、音声で漢字を直接入力する音声入
力方式は技術的に完成されていない。これに対し手書き
文字入力方式では、直接、漢字や平仮名を入力できる
上、漢字と平仮名を書き分けて入力することもできる。
(ハ)発明が解決しようとする課題 しかし上述した従来の手書き文字入力では次のような
問題があった、すなわち文字を書くとき、漢字が思い出
せず書けないことはよくあることであり、また通常、出
版物や新聞、事務文に記載されている文章のレベルで漢
字をすらすら書ける人は少ない。例えば (1)よく使うが書けない漢字としては:挨拶(あいさ
つ)などがあり、 (2)意味も難しく余り使わないので書けない漢字とし
ては:誤謬(ごびゅう)などがあり、また、 (3)地名など漢字はやさしいが読めないものとして
は:各務原市(かかみがはらし)、不入斗町(いりやま
ずちょう)などがある。
また、書く作業の点からは、一般に複雑な漢字は労力
を要し漢字によっては略字で書いたりする。また、これ
とは反対にやさしい漢字は漢字で書くメリットが大き
い。例えば (4)複雑な漢字としては:会議(かいぎ)などがあ
り、 (5)やさしい漢字としては:入力(にゅうりょく)な
どがある。
このように、従来の手書き文字認識入力方式は、漢字
(教育漢字881種を含む常用漢字1946種他)、平仮名(8
3種)、カタカナ(83種)、英数字(36種)、記号その
他を、直接タブレット上に忠実に書いて入力する方法で
ある(後述する方法B参照)。そして我々が現在一般に
採用している入力方式は、手書き文字を仮名のみ(平仮
名、カタカナ、英数字、記号その他)に限定した入力方
式すなわちワープロの仮名漢字変換機能と同様の処理を
用いて漢字入力をおこなう方法である(後述する方法C
参照)。この方法は、仮名を認識入力した後はワープロ
のキーで仮名を入力する場合とほぼ同じであり、方法B
のように漢字を書かなくても仮名漢字変換機能を使って
最終的に漢字を入力することができる。しかし、この場
合、書けない漢字および労力を要する複雑な漢字につい
ても必然的に書くことが強いられるという問題があっ
た。
この発明は以上の事情を考慮してなされたもので、入
力装置より手書き記入された平仮名および漢字混在文字
列を認識し、単語単位で漢字に変換することのできる文
字認識入力装置を提供する。
(ニ)課題を解決するための手段および作用 この発明は、仮名漢字交じりの文字列を手書きにより
入力する入力手段と、入力された手書き文字列を順次認
識するオンライン手書き文字認識手段と、仮名のみの組
合せ文字列からなる仮名引きインデックスと、漢字の表
記のみの組合せ文字列からなる漢字引きインデックスと
からなり、同じ読みとなる仮名引きインデックスと漢字
引きインデックスとが対応づけられて記憶された仮名/
漢字相互変換辞書手段と、前記仮名/漢字相互変換辞書
手段の仮名引きインデックスを検索して、認識された仮
名漢字交じりの文字列の仮名部分が一致可能な仮名のみ
の組合せ文字列を抽出し、かつ前記仮名/漢字相互変換
辞書手段の漢字引きインデックスを検索して、認識され
た仮名漢字交じりの文字列の漢字部分が一致可能な漢字
の表記のみの組合せ文字列を抽出し、さらに抽出された
仮名のみの組合せ文字列及び漢字の表記のみの組合せ文
字列の中に、前記仮名/漢字相互変換辞書手段に対応づ
けられて記憶されたものがあるか否か判断し、対応づけ
られて記憶されたものがある場合にその漢字の表記のみ
の組合せ文字列を変換結果とする変換制御手段とを備え
ることを特徴とする文字認識入力装置である。
この発明の文字認識入力装置は、ユーザーが手書きで
書いた文字を入力として使用する場合、すなわち手書き
文字入力に特に効果がある(その手書き文字をオンライ
ン認識してもよい)。
(ホ)実施例 以下この発明をその実施例を示す図面に基づき説明す
る。
第1図はこの発明に係る手書き文字認識入力方式の一
実施例に係るフローチャート、第2図はその実施例に使
用する装置のブロック図である。第2図において10は手
書き文字列を記入する入力装置としてのタブレット装置
であり、記入された手書き文字列を制御部11に入力す
る。制御部11は手書き文字列を手書き文字認識部12に渡
す。手書き文字認識部12は記入された手書き文字列を順
次認識し、認識結果として得られた標準文字を再び制御
部11に戻す。この制御部11は仮名引きと漢字引き両用が
可能な漢字変換辞書および仮名漢字混じり文字列/漢字
変換処理部(図示しない)を備え、仮名漢字混じり文字
列を漢字文字列に変換する。そして制御部11は、読み出
された標準文字を標準文字記憶部13に記憶させるととも
に表示部14に表示させる。
制御部11および手書き文字認識部12は、マイクロプロ
セッサから構成され図示しないメモリに書き込まれてい
る制御プログラムに従い後述する処理を行う。
この実施例の入力方式(後述する方法D参照)は、手
書き文字認識の点では方法Bと同じであるが、必ずしも
忠実に漢字を書く必要はなく、手書き作業上の負担も軽
減され、上記した問題を解消する方式である。したがっ
てユーザーは、適材適所、漢字と仮名を自由に書いてい
けることに特徴がある。例えば、上記の各例では、 (1)平仮名で“あいさつを”と書き→“挨拶を”入力
でき、 (2)平仮名で“ごびゅう”と書き→“誤謬”を入力で
き、 (3)漢字で“各務原市”と書いて入力でき、(読み仮
名を知りたい場合には、仮名漢字変換の逆変換で読み
“かかみがはらし”を入力する事もできる。) (4)“会ぎ”と書き→“会議”を入力でき、 (5)“入力”と書いて入力することができる。
前述した各入力方式A〜Dの性質を整理すると表1の
ごとく表わされる。
次に、最終的に“会議では、挨拶が大切である。”と
いう文章を入力する場合を例にあげて、各方式での入力
を以下に説明する。
方式Bでの入力;“会議では、挨拶が大切である。” 方式Cでの入力;“かいぎでは、あいさつがたいせつ
である。” 方式Dでの入力;“会ぎでは、あいさつが大切であ
る。” これら3通りの入力方式に関し、手書きで文字を書く
ときのペン先の移動量を上記3通りの方式(方式B,C,
D)について比較するシュミュレーション実験を行っ
た。実験では、一筆書きストローク量を各方法について
算出した。その結果、ペン先の移動量(一筆書きストロ
ーク量がペン先の移動量に相当すると考えられる)はユ
ーザの肉体的負荷の量に相当すると考えられ、方法Bの
場合を1.0とすると、方法Cは0.8で、方法Dの本方式で
は0.75とかなり負担が小さいことがわかった。
また、ペン先の移動量(一筆書きのストローク量)の
比較は次の通りである。
・対象文字の種類:m(i),i=1〜2029(平仮名83種、
常用漢字1946種) ・対象文字の読みとその出現確率:h(i)(国立国語研
究所の調査資料「現代新聞の漢字」から抽出した。) ・対象文字の一筆書きストローク量:s(i) 上記のデータを使って文字の出現確率を掛け合わせた
一文字の平均(一筆書き)ストローク量を、3つの場合
について算出した。
(1)総てを漢字・仮名で忠実に書いた場合(方法Bで
の入力) (2)全てを平仮名で書いた場合(方法Cでの入力) (3)漢字か平仮名のどちらかで書いた場合(方法Dで
の入力)ただし(3)の場合、漢字とその複数の読みに
ついて、ストロークのトータル量が少ない方を書くとし
た。例えば、次のように判定した。“悪”の場合を例に
取ると、 そして算出された結果は以下の通りである。
この実施例のもう一つの特長は、基本的に漢字混在で
文字列を直接入力できるため、現在のワープロ等におけ
る仮名/漢字変換の変換性能を上回る漢字変換率(仮名
漢字混在/漢字変換)が期待できることである。例え
ば、“かいぎ”の同音語は“会議”と“懐疑”があり、
ワープロではこれらの2つの同音語候補の中からユーザ
は選択する必要がある。その点、この実施例では、“会
ぎ”という仮名漢字混在の文字列を漢字変換した場合、
最初の漢字“会”が既に確定されているため1回目の変
換結果で所望する漢字である“会議”が得られる。
次にこの実施例における制御部の動作を第1図に示す
フローチャートに従って説明する。
第1図において、タブレット10の手書き入力部から電
子ペンあるいはスキャナー等により入力された(ステッ
プ20)手書き文字(仮名漢字混じり文字列)は、手書き
文字認識部12で認識される(ステップ21)。認識された
仮名漢字混じり文字列は、仮名漢字混じり文字列/漢字
変換処理部で仮名引きと漢字引き両用が可能な漢字変換
辞書等を用いて、漢字文字列に変換される(ステップ2
2)。勿論、変換された漢字文字列はその読み仮名文字
列への逆変換も可能である。そして変換された漢字文字
列は表示部14に表示される(ステップ23)。
従来の仮名/漢字変換用の辞書は基本的に仮名引きで
漢字を引く形態をとるが、仮名漢字混在の文字列を漢字
文字列に変換する処理では、一つの辞書項目に対して仮
名引きと漢字引きの両用が可能な形態の辞書が必要とな
る。
次に、具体的な変換例として入力“会ぎに”を漢字
(単語)に変換する場合を説明する。従来の仮名漢字変
換は、入力されたレベル1の平仮名文字列を文法解析し
てあらゆる可能な解釈を行い、最終的にレベル3の漢字
文字列を獲得するものである。なお、レベル1〜3は変
換処理過程におけるステップを示す。レベル1において
仮名文字列“かいぎに”の切り出しは、“か・いぎ(語
幹)”+“に(助詞)”は単語として存在しないので単
語“かい・ぎ(語幹)”と単語“に(助詞)”に別れる
場合のみであり、その漢字列候補としては“会議に”と
“懐疑に”の2つがあることになる。次いで中間のレベ
ル2では個々の漢字とそれらの読みとの組み合せとして
表3に示すような4通りが存在しうる。この実施例の入
力方式では、レベル2のような文字列の入力も許容し、
レベル3に示す漢字列への変換を可能とする辞書が必要
となる。
以上のような入力方式で実現するには、次の3つの方
法が考えられる。
実現方法1 各辞書項目について仮名引きと漢字引き可能な新辞書
を備える方法。
表4に示すように、従来のワードプロセツサ等に搭載
されている仮名引き辞書において基本的には自立語の漢
字引き機能を追加すれば実現できる。仮名漢字文字列
「会ぎに」が手書き入力された場合には、前記したレベ
ル1の文法解析によってこの文字列「会ぎに」から「会
ぎ」という文字列が取り出される。
この後、この文字列「会ぎ」に対して、表4に示した
漢字引きインデックスと仮名引きインデックスによるい
わゆる辞書引きがそれぞれ行われる。
たとえば、表4の場合には、仮名引きインデックスに
よれば、仮名列の最後が「ぎ」と一致可能な候補として
2つの「かいぎ」(「かい(会)・ぎ(議)」と「かい
(懐)・ぎ(疑)」)が選択される。次に漢字引きイン
デックスによれば、漢字列の先頭が「会」と一致可能な
変換候補として「会議」、「会釈」、「会談」が選択さ
れる。
そして、仮名引きインデックスによって選択された2
つの候補の「かいぎ」の参照先を参照している漢字引き
インデックスによって選択された変換候補の検索を行
い、一致するものが変換結果として決定される。表4で
は、仮名引きインデックスによって選択された候補のう
ち、1番目の「かいぎ」の参照先が「かい(会)・ぎ
(議)」であり、同じ参照先を参照している漢字引きイ
ンデックスによって選択された候補を検索すると、「会
議」が「かい(会)・ぎ(議)」を参照している。従っ
て、参照先が一致しているため、漢字引きインデックス
によって選択された変換候補の漢字表記のみの文字列で
ある「会議」が変換結果と決定される。
実現方法2 従来のワードプロセッサの仮名/漢字変換(仮名引
き)辞書を利用する方法。
音訓辞書(読み仮名辞書)により一つ一つの漢字を総
てその読み仮名に直し、それらの組み合せから成る仮名
列を作る。そしてそれらの一個以上の仮名列について仮
名漢字変換を試み、各変換結果を元の仮名漢字混在の文
字列を用いて検証することによって、最終の漢字文字列
をうる。具体的な例として入力文字列“会ぎに”を変換
する処理を表5にもとづいて説明する。漢字の“会”の
読み仮名は、“あ“、“え”、“かい”の3通りあり、
この段階で読み仮名となりうる仮名文字列は3つある。
これらの仮名文字列をそれぞれ、仮名/漢字変換する。
この変換処理の結果、“あぎに”と“えぎに”は不適
当であることが明らかになり、変換候補が存在する“か
いぎに”の2つの変換候補について、入力文字列を比較
検証する。平仮名列と漢字列との文字対応関係が記述さ
れている仮名/漢字変換辞書においては、入力文字列
“会ぎに”と漢字候補“会議に”と“懐疑に”とのマッ
チングをとることができる。したがってマッチングの結
果、入力文字列“会ぎに”は“懐疑に”とは一致せず、
以下のように“会議に”という項目だけが一致すること
が分かり、一意に変換結果は“会議に”であると決定さ
れる。
実現方法3 漢字/仮名変換(漢字引き)辞書に特例集辞書を設け
て対応する方法。
特例集辞書とは、表6に示すように辞書項目について
可能性のある仮名漢字混在文字列を抽出して、それぞれ
混在文字列と漢字列をペアーで持たせたもの。
このように、本方式は手書き文字認識入力において
(1)ユーザの精神的負担、肉体的負担を軽減する、
(2)漢字変換率の向上が期待できるという特長をも
つ。
漢字を含む全文字の認識手段(漢字、仮名、英数字な
どの入力モードがあるものが現在主流であるが、ここで
はモードなし)および仮名漢字混在文字列/漢字変換手
段(現在では仮名文字列/漢字変換技術)を備えたこの
入力方式は、日本語文字入力において手書きの本質的な
特徴を生かす入力形態を提供するものである。
(ヘ)発明の効果 この発明によれば、仮名/漢字相互変換辞書手段を用
いて、仮名引きインデックス及び漢字引きインデックス
の検索によって抽出された仮名のみの組合せ文字列及び
漢字の表記のみの組合せ文字列の中に、仮名/漢字相互
変換辞書手段に対応づけられて記憶されたものがある場
合にその漢字の表記のみの組合せ文字列を変換結果とす
るので、ユーザがストローク量の多い複雑な漢字部分を
平易な仮名で表しストローク量の少ない仮名混じりの文
字列をオンライン的に入力することによって、漢字変換
率の高い仮名漢字変換ができ、ユーザの入力負荷の軽減
をはかることができる。また、平仮名と漢字を含む単語
を仮名漢字変換処理する際には既に変換単語の一部の漢
字が特定されているので、複数の変換候補が存在する場
合には漢字変換効率が高まるという効果がある。
【図面の簡単な説明】
第1図はこの発明の一実施例のフローチャート、第2図
はその実施例に使用する装置のブロック図である。 10……タブレット、11……制御部、 12……手書き文字認識部、 13……標準文字記憶部、14……表示部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 17/21 G06K 9/00

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】仮名漢字交じりの文字列を手書きにより入
    力する入力手段と、 入力された手書き文字列を順次認識するオンライン手書
    き文字認識手段と、 仮名のみの組合せ文字列からなる仮名引きインデックス
    と、漢字の表記のみの組合せ文字列からなる漢字引きイ
    ンデックスとからなり、同じ読みとなる仮名引きインデ
    ックスと漢字引きインデックスとが対応づけられて記憶
    された仮名/漢字相互変換辞書手段と、 前記仮名/漢字相互変換辞書手段の仮名引きインデック
    スを検索して、認識された仮名漢字交じりの文字列の仮
    名部分が一致可能な仮名のみの組合せ文字列を抽出し、
    かつ前記仮名/漢字相互変換辞書手段の漢字引きインデ
    ックスを検索して、認識された仮名漢字交じりの文字列
    の漢字部分が一致可能な漢字の表記のみの組合せ文字列
    を抽出し、さらに抽出された仮名のみの組合せ文字列及
    び漢字の表記のみの組合せ文字列の中に、前記仮名/漢
    字相互変換辞書手段に対応づけられて記憶されたものが
    あるか否か判断し、対応づけられて記憶されたものがあ
    る場合にその漢字の表記のみの組合せ文字列を変換結果
    とする変換制御手段とを備えることを特徴とする文字認
    識入力装置。
JP63265504A 1988-10-20 1988-10-20 文字認識入力装置 Expired - Fee Related JP2765712B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63265504A JP2765712B2 (ja) 1988-10-20 1988-10-20 文字認識入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63265504A JP2765712B2 (ja) 1988-10-20 1988-10-20 文字認識入力装置

Publications (2)

Publication Number Publication Date
JPH02112058A JPH02112058A (ja) 1990-04-24
JP2765712B2 true JP2765712B2 (ja) 1998-06-18

Family

ID=17418085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63265504A Expired - Fee Related JP2765712B2 (ja) 1988-10-20 1988-10-20 文字認識入力装置

Country Status (1)

Country Link
JP (1) JP2765712B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324614A (ja) * 1992-05-25 1993-12-07 Ibm Japan Ltd 日本語文処理装置および方法
JPH06223055A (ja) * 1993-01-22 1994-08-12 Nec Corp 文章入力装置
JPH0736884A (ja) * 1993-07-22 1995-02-07 Nec Corp 文字認識入力装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5847059B2 (ja) * 1978-10-27 1983-10-20 工業技術院長 画像フアイル作成装置
JPS5559578A (en) * 1978-10-27 1980-05-06 Fujitsu Ltd Character recognition/kana-chinese character conversion device
JPS61121159A (ja) * 1984-11-19 1986-06-09 Matsushita Electric Ind Co Ltd 文字入力装置
JPS62209667A (ja) * 1986-03-10 1987-09-14 Fujitsu Ltd 文章作成装置
JPH0677252B2 (ja) * 1988-05-16 1994-09-28 株式会社日立製作所 和文データ入力処理装置

Also Published As

Publication number Publication date
JPH02112058A (ja) 1990-04-24

Similar Documents

Publication Publication Date Title
KR20010088892A (ko) 한자입력장치 및 방법
WO2016197265A1 (zh) 一种输入生僻字的方法
Sunitha et al. A phoneme based model for english to malayalam transliteration
JP2765712B2 (ja) 文字認識入力装置
CN107679122A (zh) 一种模糊搜索方法及终端
JPH07230472A (ja) 人名誤読補正方法
JPH10232864A (ja) 文章入力装置、及び文章入力プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0652151A (ja) 共起学習装置及びこれを用いたかな漢字変換装置
JP3552750B2 (ja) 文書処理装置
JP2574741B2 (ja) 言語処理方法
JP2570784B2 (ja) 文書リーダ後処理装置
JP2968221B2 (ja) 手書き文字認識方法及び装置
JP3157995B2 (ja) 文字処理装置
JPH06223055A (ja) 文章入力装置
JPH0574867B2 (ja)
JPH0442350A (ja) 文字処理装置
JPH0350669A (ja) 情報処理装置
JPS60207983A (ja) 文字認識用辞書作成方式
JPH09319756A (ja) 手書き文字図書検索システム
JPH06332884A (ja) 文字変換装置
JPH1027173A (ja) 人名変換装置
JPH0736884A (ja) 文字認識入力装置
JPH0773279A (ja) 文字変換装置
JPS63133228A (ja) 情報抽出装置
JPS6162175A (ja) 日本語解析装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees