JPH02112058A - 文字認識入力装置 - Google Patents

文字認識入力装置

Info

Publication number
JPH02112058A
JPH02112058A JP63265504A JP26550488A JPH02112058A JP H02112058 A JPH02112058 A JP H02112058A JP 63265504 A JP63265504 A JP 63265504A JP 26550488 A JP26550488 A JP 26550488A JP H02112058 A JPH02112058 A JP H02112058A
Authority
JP
Japan
Prior art keywords
kanji
kana
input
character string
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63265504A
Other languages
English (en)
Other versions
JP2765712B2 (ja
Inventor
Fumio Togawa
外川 文雄
Tadashi Hirose
斉志 広瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP63265504A priority Critical patent/JP2765712B2/ja
Publication of JPH02112058A publication Critical patent/JPH02112058A/ja
Application granted granted Critical
Publication of JP2765712B2 publication Critical patent/JP2765712B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 この発明はタブレット装置を使用したオンライン文字認
識装置における文字認識入力方式に関し、詳しくはタブ
レット入力装置に記入した手書き文字を認識し、認識結
果として得られる標準文字を入力しうる文字認識入力方
式に関する。
(ロ)従来の技術 漢字文字列を入力する場合、例えば日本語ワープロでは
平仮名(英数字・記号も含む)を、それと一対あるいは
疑似対応したキーボードから入力して、仮入力された平
仮名文字列を仮名漢字変換処理によって所望の漢字文字
列を選択入力する方式が主流となっている。この方式で
は平仮名の入力が基本となっている。
一方、キーボード入力以外の入力方式としては、認識機
能を備えた入力手段を用いる音声入力方式、手書き文字
入力方式、0CR(光学的文字認識)入力方式などがあ
る。しかし現状では、音声で漢字を直接入力する音声入
力方式は技術的に完成されていない。これに対し手書き
文字入力方式では、直接、漢字や平仮名を入力できる上
、漢字と平仮名を書き分けて入力することもできる。
(ハ)発明が解決しようとする課題 しかし上述した従来の手書き文字入力では次のような問
題があった。すなわち文字を書くとき、漢字が思い出せ
ず書けないことはよくあることであり、また通常、出版
物や新聞、事務文に記載されている文章のレベルで漢字
をすらすら書ける人は少ない。例えば (1)よく使うが書けない漢字としては:挨拶(あいさ
つ)などがあり、 (2)意味も難しく余り使わないので書けない漢字とし
ては:誤謬(ごびゆう)などがあり、また、(3)地名
など漢字はやさしいが読めないものとしては:各務原布
(かがみがはらし)、不入斗町(いりやまずちょう)な
どがある。
また、書く作業の点からは、一般に複雑な漢字は労力を
要し漢字によっては略字で書いたりする。
また、これとは反対にやさしい漢字は漢字で書くメリッ
トが大きい。例えば (4)複雑な漢字としては二会議(かいぎ)などがあり
、 (5)やさしい漢字としては:入力(にゆうりよく)な
どがある。
このように、従来の手書き文字認識入力方式は、漢字(
教育漢字881種を含む常用漢字1946種他)1平仮
名(83種)、カタカナ(83種)、英数字(36種)
、記号その他を、直接タブレット上に忠実に書いて入力
する方法である(後述する方法B参照)。そして我々が
現在一般に採用している入力方式は、手書き文字を仮名
のみ(平仮名、カタカナ、英数字、記号その他)に限定
した入力方式すなわちワープロの仮名漢字変換機能と同
様の処理を用いて漢字入力をおこなう方法である(後述
する方法C参照)。この方法は、仮名を認識入力した後
はワープロのキーで仮名を入力する場合とほぼ同じであ
り、方法Bのように漢字を書かなくても仮名漢字変換機
能を使って最終的に漢字を入力することができる。しか
し、この場合、書けない漢字および労力を要する複雑な
漢字についても必然的に書くことが強いられるという問
題があった。
この発明は以上の事情を考慮してなされたもので、入力
装置より手書き記入された平仮名および漢字混在文字列
を認識し、単語単位で漢字に変換することのできる文字
認識入力方式を提供する。
(ニ)課題を解決するための手段および作用この発明は
、平仮名及び漢字の手書き文字認識機能を有し、入力装
置より手書きにて記入された文字列を認識し、認識結果
として得られる標準文字を漢字文字列として清書入力す
ることができる文字認識入力装置において、 平仮名と漢字などが混在して記入された文字列を認識し
、認識結果として得られる標準文字をさらに単語単位で
漢字に変換することにより漢字文字列を入力する手書き
文字認識入力方式である。
この発明の文字認識入力方式は、ユーザーが手書きで書
いた文字を入力として使用する場合、すなわち手書き文
字入力に特に効果がある(その手書き文字をオンライン
認識してもよいし、OCR入力してもよい)。
(ホ)実施例 以下この発明をその実施例を示す図面に基づき説明する
第1図はこの発明に係る手書き文字認識入力方式の一実
施例に係るフローチャート、第2図はその実施例に使用
する装置のブロック図である。第2図において10は手
書き文字列を記入する入力装置としてのタブレット装置
であり、記入された手書き文字列を制御部IIに入力す
る。制御部Ilは手書き文字列を手書き文字認識部12
に渡す。
手書き文字認識’1ffi 12は記入された手書き文
字列を順次認識し、認識結果として得られた標準文字を
再び制御部1−1に戻す。この制御部11は仮名引きと
漢字引き両用が可能な漢字変換辞書および仮名漢字混じ
り文字列/漢字変換処理部(図示しない)を備え、仮名
漢字混じり文字列を漢字文字列に変換する。そして制御
部11は、読み出された標準文字を標準文字記憶部13
に記憶させるとともに表示部14に表示させる。
制御部11および手書き文字認識部12は、マイクロプ
ロセッサから構成され図示しないメモリに書き込まれて
いる制御プログラムに従い後述する処理を行う。
この実施例の入力方式(後述する方法り参照)は、手書
き文字認識の点では方法Bと同じであるが、必ずしも忠
実に漢字を書く必要はなく、手書き作業上の負担も軽減
され、上記した問題を解消する方式である。したがって
ユーザーは、適材適所、漢字と仮名を自由に書いていけ
ることに特徴がある。例えば、上記の各側では、 (1)平仮名で“あいさつを゛と書き→“挨拶を”入力
でき、 (2)平仮名で“ごびゅう”と書き−“誤謬”を入力で
き、 (3)漢字で“各務原市”と書いて入力でき、(読み仮
名を知りたい場合には、仮名漢字変換の逆変換で読み“
かがみがはらし”を入力する事もできる。)(4)“会
ぎ°と書き→“会議”を入力でき、(5)“入力”と書
いて入力することができる。
前述した各入力方式A−Dの性質を整理すると表1のご
とく表わされる。
(以下余白) 次に、最終的に“会議では、挨拶が大切である。
“という文章を入力する場合を例にあげて、各方式での
入力を以下に説明する。
方式Bでのへカニ°会議では、挨拶が大切である。
方式Cでの入力;“かいぎでは、あいさつがたいせつで
ある。
方式りでの入カニ“会ぎでは、あいさつが大切である。
“ これら3通りの入力方式に関し、手書きで文字を書くと
きのペン先の移動量を上記3通りの方式(方式B、C,
D)について比較するシュミュレーション実験を行った
。実験では、−筆書きストローク量を各方法について算
出した。その結果、ペン先の移動量(−筆書きストロー
ク量がペン先の移動量に相当すると考えられる)はユー
ザの肉体的負荷の量に相当すると考えられ、方法Bの場
合を1.0とすると、方法Cは0.8で、方法りの本方
式では0.75とかなり負担が小さいことがわかった。
また、ペン先の移動量(−筆書きのストローク量)の比
較は次の通りである。
・対象文字の種類+ m(i)、 i= 1〜2029
 (平仮名83種、常用漢字1946種) ・対象文字の読みとその出現確率: h (i) (国
立国語研究所の調査資料「現代新聞の漢字」から抽出し
た。) ・対象文字の一筆書きストローク量: 5(i)上記の
データを使って文字の出現確率を掛は合わせた一文字の
平均(−筆書き)ストローク量を、3つの場合について
算出した。
(1)総てを漢字・仮名で忠実に書いた場合(方法Bで
の入力) (2)全てを平仮名で書いた場合(方法Cでの入力) (3)漢字か平仮名のどちらかで書いた場合(方法りで
の入力)ただしく3)の場合、漢字とその複数の読みに
ついて、ストロークのトータル量が少ない方を書くとし
た。例えば、次のように判定した。“悪”の場合を例に
取ると、 く漢字〉     〈読み〉    く結果〉sc’1
)=2530   > s(あ)+s(< )=251
0 −rあくJと書く>s(あ)+S(っ) = 22
00  →「あっ」と書く>s(お)     =17
00  →「お」と書く<s(わ)+8(る)=290
0  →「悪」と書く”議゛の場合を例に取ると、 5(jJり=3400   < s(ぎ)     =
1800 −rぎ」と書くそして算出された結果は以下
の通りである。
この実施例のもう一つの特長は、基本的に漢字混在で文
字列を直接入力できるため、現在のワープロ等における
仮名/漢字変換の変換性能を上回る漢字変換率(仮名漢
字混在/a字変換)が期待できることである。例えば、
“かいぎ°の同音語は“会議“と“懐疑”があり、ワー
プロではこれらの2つの同音語候補の中からユーザは選
択する必要がある。その点、この実施例では、°会ぎ°
という仮名漢字混在の文字列を漢字変換した場合、最初
の漢字“会”が既に確定されているため1回目の変換結
果で所望する漢字である“会議゛が得られる。
次にこの実施例における制御部の動作を第1図に示すフ
ローチャートに従って説明する。
第1図において、タブレットlOの手書き入力部から電
子ペンあるいはスキャナー等により入力された(ステッ
プ20)手書き文字(仮名漢字混じり文字列)は、手書
き文字認識部!2で認識される(ステップ21)。認識
された仮名漢字混じり文字列は、仮名漢字混じり文字列
/漢字変換処理部で仮名引きと漢字引き両用が可能な漢
字変換辞書等を用いて、漢字文字列に変換される(ステ
ップ22)。勿論、変換された漢字文字列はその読み仮
名文字列への逆変換も可能である。そして変換された漢
字文字列は表示部!4に表示される(ステップ23)。
従来の仮名/漢字変換用の辞書は基本的に仮名引きで漢
字を引く形態をとるが、仮名漢字混在の文字列を漢字文
字列に変換する処理では、一つの辞書項目に対して仮名
引きと漢字引きの両用が可能な形態の辞書が必要となる
次に、具体的な変換例として入力“会ぎに”を漢字(単
語)に変換する場合を説明する。従来の仮名漢字変換は
、入力されたレベル1の平仮名文字列を文法解析してあ
らゆる可能な解釈を行い、最終的にレベル3の漢字文字
列を獲得するものである。なお、レベル1〜3は変換処
理過程におけるステップを示す。レベル1において仮名
文字列“かいぎに”の切り出しは、“か・いぎ(語幹)
”+“に(助詞)”は単語として存在しないので単語“
かい・ぎ(ii幹)”と単語“に(助詞)”に別れる場
合のみであり、その漢字列候補としては“会議に′と“
懐疑に”の2つがあることになる。次いで中間のレベル
2では個々の漢字とそれらの読みとの組み合せとして表
3に示すような4通りが存在しうる。この実施例の入力
方式では、レベル2のような文字列の入力も許容し、レ
ベル3に示す漢字列への変換を可能とする辞書が必要と
なる。
表4 実現方法1 以上のような入力方式を実現するには、次の3つの方法
が考えられる。
実現方法l 各辞書項目について仮名引きと漢字引き可能な新辞書を
備える方法。
表4に示すように、従来のワードプロセッサ等に搭載さ
れている仮名引き辞書において基本的には自立語の漢字
引き機能を追加すれば実現できる。
実現方法2 従来のワードプロセッサの仮名/漢字変換(仮名引き)
辞書を利用する方法。
音訓辞書(読み仮名辞書)により一つ一つの漢字を総て
その読み仮名に直し、それらの組み合せから成る仮名列
を作る。そしてそれらの−個以上の仮名列について仮名
漢字変換を試み、各変換結果を元の仮名漢字混在の文字
列を用いて検証することによって、最終の漢字文字列を
うる。具体的な例として入力文字列“会ぎに”を変換す
る処理を表5にもとづいて説明する。漢字の“会”の読
み仮名は、“あ”、“え”、“かい”の3通りあり、こ
の段階で読み仮名となりうる仮名文字列は3つある。
これらの仮名文字列をそれぞれ、仮名/漢字変換する。
一意に変換結果は“会議に”であると決定される。
及叉友夾止 漢字/仮名変換(漢字引き)辞書に特例集辞書を設けて
対応する方法。
特例集辞書とは、表6に示すように辞書項目について可
能性のある仮名漢字混在文字列を抽出して、それぞれ混
在文字列と漢字列をペアーで持たせたもの。
この変換処理の結果、“あぎに“と“えぎに”は不適当
であることが明らかになり、変換候補が存在する“かい
ぎlごの2つの変換候補について、入力文字列を比較検
証する。平仮名列と漢字列との文字対応関係が記述され
ている仮名/漢字変換辞書においては、入力文字列“会
ぎに°と漢字候補“会議に”と“懐疑に”とのマツチン
グをとることができる。したがってマツチングの結果、
入力文字列“会ぎに”は“懐疑に”とは一致せず、以下
のように“会議に゛という項目だけが一致することが分
かり、・表6 実現方法3 漢字引き辞書の特例集辞書(仮名漢字混在/1fA字変
換辞このように、本方式は手書き文字認識入力において
(1)ユーザの精神的負担、肉体的負担を軽減する、(
2)漢字変換率の向上が期待できるという特長をもつ。
漢字を含む全文字の認識手段(漢字、仮名、英数字など
の入力モードがあるものが現在主流であるが、ここでは
モードなし)および仮名漢字混在文字列/漢字変換手段
(現在では仮名文字列/漢字変換技術)を備えたこの入
力方式は、日本語文字入力において手書きの本質的な特
徴を生かす入力形態を提供するものである。
(へ)発明の効果 この発明によれば入力装置から平仮名と漢字を混在して
人力することができるので、複雑な漢字を仮名混じりの
文字列により簡単に入力することができる。また、平仮
名と漢字を含む単語を仮名漢字変換処理する際には既に
変換単語の一部の漢字が特定されているので、漢字変換
効率が高まるという効果がめる。
【図面の簡単な説明】
第1図はこの発明の一実施例のフローチャート、第2図
はその実施例に使用する装置のブロック図である。 10・・・・・・タブレット、    11・・団・制
御部、!2・・・・・・手書き文字認識部、 13・・・・・・標準文字記憶部、14・・・・・・表
示部。 第 第 図

Claims (1)

  1. 【特許請求の範囲】 1、平仮名及び漢字の手書き文字認識機能を有し、入力
    装置より手書きにて記入された文字列を認識し、認識結
    果として得られる標準文字を漢字文字列として清書入力
    することができる文字認識入力装置において、 平仮名と漢字などが混在して記入された文字列を認識し
    、認識結果として得られる標準文字をさらに単語単位で
    漢字に変換することにより漢字文字列を入力する手書き
    文字認識入力方式。
JP63265504A 1988-10-20 1988-10-20 文字認識入力装置 Expired - Fee Related JP2765712B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63265504A JP2765712B2 (ja) 1988-10-20 1988-10-20 文字認識入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63265504A JP2765712B2 (ja) 1988-10-20 1988-10-20 文字認識入力装置

Publications (2)

Publication Number Publication Date
JPH02112058A true JPH02112058A (ja) 1990-04-24
JP2765712B2 JP2765712B2 (ja) 1998-06-18

Family

ID=17418085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63265504A Expired - Fee Related JP2765712B2 (ja) 1988-10-20 1988-10-20 文字認識入力装置

Country Status (1)

Country Link
JP (1) JP2765712B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324614A (ja) * 1992-05-25 1993-12-07 Ibm Japan Ltd 日本語文処理装置および方法
JPH06223055A (ja) * 1993-01-22 1994-08-12 Nec Corp 文章入力装置
JPH0736884A (ja) * 1993-07-22 1995-02-07 Nec Corp 文字認識入力装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5559578A (en) * 1978-10-27 1980-05-06 Fujitsu Ltd Character recognition/kana-chinese character conversion device
JPS5559573A (en) * 1978-10-27 1980-05-06 Agency Of Ind Science & Technol Picture file production device
JPS61121159A (ja) * 1984-11-19 1986-06-09 Matsushita Electric Ind Co Ltd 文字入力装置
JPS62209667A (ja) * 1986-03-10 1987-09-14 Fujitsu Ltd 文章作成装置
JPH01287774A (ja) * 1988-05-16 1989-11-20 Hitachi Ltd 和文データ入力処理装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5559578A (en) * 1978-10-27 1980-05-06 Fujitsu Ltd Character recognition/kana-chinese character conversion device
JPS5559573A (en) * 1978-10-27 1980-05-06 Agency Of Ind Science & Technol Picture file production device
JPS61121159A (ja) * 1984-11-19 1986-06-09 Matsushita Electric Ind Co Ltd 文字入力装置
JPS62209667A (ja) * 1986-03-10 1987-09-14 Fujitsu Ltd 文章作成装置
JPH01287774A (ja) * 1988-05-16 1989-11-20 Hitachi Ltd 和文データ入力処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324614A (ja) * 1992-05-25 1993-12-07 Ibm Japan Ltd 日本語文処理装置および方法
JPH06223055A (ja) * 1993-01-22 1994-08-12 Nec Corp 文章入力装置
JPH0736884A (ja) * 1993-07-22 1995-02-07 Nec Corp 文字認識入力装置

Also Published As

Publication number Publication date
JP2765712B2 (ja) 1998-06-18

Similar Documents

Publication Publication Date Title
US20050027534A1 (en) Phonetic and stroke input methods of Chinese characters and phrases
US20100106481A1 (en) Integrated system for recognizing comprehensive semantic information and the application thereof
CN104239289B (zh) 音节划分方法和音节划分设备
KR20010088892A (ko) 한자입력장치 및 방법
TW530223B (en) Chinese phonetic input system having functions of incomplete spelling and fuzzy phonetic comparing, and the method thereof
JPH02112058A (ja) 文字認識入力装置
Joshi et al. Input Scheme for Hindi Using Phonetic Mapping
CN110502128B (zh) 一种汉字多元输入方法及系统
WO2023124573A1 (zh) 数字化新语言及其输入方法、输入工具
CA2247359A1 (en) Method and device for handwritten character recognition
JP2000330984A (ja) 文書処理装置及び方法
JPH10232864A (ja) 文章入力装置、及び文章入力プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3552750B2 (ja) 文書処理装置
JPS63115264A (ja) 文書処理装置
TW552517B (en) Classified input method
JP3888701B2 (ja) 文字変換装置
JP3454895B2 (ja) 仮名漢字変換方法
JP2669437B2 (ja) 文字種変換方法および装置
JPH033064A (ja) 文字処理装置
JPS61292774A (ja) 手書き入力ワ−ドプロセツサ
JPH0574867B2 (ja)
JPS6327966A (ja) ワ−ドプロセツサにおけるカタカナ変換方式
JPS61184680A (ja) カナ漢字変換処理装置
JPS6120176A (ja) ロ−マ字−中国語変換装置
JPH01185766A (ja) かな漢字変換装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees