JP2997151B2 - 漢字変換装置 - Google Patents

漢字変換装置

Info

Publication number
JP2997151B2
JP2997151B2 JP5196371A JP19637193A JP2997151B2 JP 2997151 B2 JP2997151 B2 JP 2997151B2 JP 5196371 A JP5196371 A JP 5196371A JP 19637193 A JP19637193 A JP 19637193A JP 2997151 B2 JP2997151 B2 JP 2997151B2
Authority
JP
Japan
Prior art keywords
syllable
dictionary
word
unit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5196371A
Other languages
English (en)
Other versions
JPH0749858A (ja
Inventor
峻慧 周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP5196371A priority Critical patent/JP2997151B2/ja
Priority to CN 94104871 priority patent/CN1115884A/zh
Publication of JPH0749858A publication Critical patent/JPH0749858A/ja
Application granted granted Critical
Publication of JP2997151B2 publication Critical patent/JP2997151B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、漢字変換装置に関し、
特に中国語用の漢字変換装置に関する。
【0002】
【従来の技術】中国語文章に使用されている漢字の種類
は一万以上ある。その中から如何に漢字を正しく高速に
入力するかがワードプロセッサーを含む中国語の計算機
処理で最も重要な課題である。さて、従来の漢字入力手
段としては、音声認識、文字認識、キーボードなどがあ
る。それらの内、キーボードによる入力は最も確実であ
り、このため広く実用化されている。ところで、このキ
ーボードを利用する漢字の入力方式は更に漢字の読みに
よる入力方式と漢字の字形による入力方式に分けられ
る。そのうち、後者の漢字の字形による入力方式は、入
力するための規則を予め暗記しておかなければならず、
また、暗記するには相当の時間が必要であり、慣れるま
でに時間もかかる。一方、前者の漢字の読みによる入力
方式は最も自然であり、かつ習い易いため、現在広く採
用されているだけでなく将来においても、漢字入力方式
の主流になると思われる。
【0003】さて、この読みを入力とする漢字変換装置
としては、例えば、中華民国特許出願番号751058
38に示されているものがある。図6は、この従来の読
みを入力とする漢字変換装置の構成図である。本図にお
いて、100は任意の長さのへい音、注音、ローマ字な
どの表音文字列(ここに、表音文字列と複数的表現を使
用しているが、これは通常複数の表音文字が一の音節を
表示するからである。ただし、日本語では本来単数と複
数の区別が不明確なため、本明細書では一の表音文字も
表音文字列と記載する等、「列」には厳密な意味はな
い。)を入力する入力部である。180は、表音文字列
とこれに対応する単語を登録(永久記憶)している辞書
部である。140は入力された表音文字列の音節数を記
憶するNCHARレジスタである。(なお、中国語では
原則として漢字一字が一音節であるため、通常は音節数
=漢字数となる。)120、130はそれぞれ表音文字
列を単語(もちろん、漢字からなる中国語単語)に変換
する時に使用されるPTRレジスタとNPレジスタであ
り、PTRレジスタ120は入力された表音文字列のう
ち検索対象として切り出される部分の最先の音節の位置
を記憶するレジスタであり、NPレジスタは入力された
表音文字列を単語に変換する際に辞書内の検索の対象と
なる単語の長さ、すなわち単語を構成する漢字数ひいて
は音節数を記憶するレジスタである。150はある長さ
を持っている単語の検索や変換処理が行なわれた後に、
上記NPレジスタの値を1減らし、これにより構成する
漢字数の一つ少ない単語を次に検索させ、結果的に構成
文字数の多い単語を優先して変換する原則を採用可能と
する比較部である。160は上記PTRレジスタ120
の設定位置を入力表音文字列の最初の位置より順次後方
へずらすように制御し、併せて当該表音文字列中にすで
に漢字変換された音節があるか否かを検査し、もし、ど
の音節もまだ変換されておらず、且つ、辞書部180に
対応する単語があれば、当該表音文字列をその対応する
単語に変換させ、またこのことにより、結果的に先に入
力された表音文字列の漢字変換を優先させる原則を採用
可能とする変換制御部である。170は上記変換制御部
160から送ってきた音節列を検索のキー(鍵)とし、
辞書部180を検索し、該当する単語があればこれを変
換制御部160へ出力する辞書検索部である。190は
上記変換制御部160によって変換された結果を出力す
る出力部である。
【0004】なお、PTRレジスタ120とNPレジス
タ130と比較部150により、漢字変換に際しては第
1に構成する音節数の多い単語が優先され、第2に先に
入力された音節の漢字変換が優先されるという最長一致
法が採用されることとなるが、これについては例えば別
途本願出願人が出願済の特願平5−75911号、特願
平5−75912号等にて公開している周知の技術であ
るため、その説明は省略する。
【0005】なおまた、辞書部180におけるデータの
登録は、表音文字の所定の優先順位、構成する音節数の
少ない順に応じてなされ、更に同一の表音文字に該当す
る中国語単語が複数あれば、使用頻度の高い方が先に表
示されるべくなされていること、入力部100による入
力はCRTにおける既入力の表音文字の表示を入力者が
参照しつつキーボードを押すことによりなされること、
辞書部180は高速半導体メモリやディスクよりなるこ
と、出力部190はCRTや印刷部よりなされること、
検索部の検索は電子的な照合によりなされること等は日
本語ワードプロセッサーと同じである。このため、これ
らについての詳細な説明は省略する。
【0006】さらに、漢字変換が失敗して、入力者の意
図せざる漢字が出力された場合の処置や学習機能等が付
加されているのは勿論であるが、これらについてもいわ
ば周知の技術であるためその説明は省略する。
【0007】
【発明が解決しようとする課題】しかし、上記のような
漢字変換装置は最長一致法により漢字変換を行うもので
あるため、入力された表音文字列に対して、第1に変換
対象となる最大の単語長のもとで最初に入力された音節
から逐一後方へずらして漢字変換のための辞書部内での
検索対象となる音節を切り出し、第2にこの単語長を一
つずつ減少させた上で、また同じ検索をなさなければな
らない。このため、漢字変換の速度や正確率等の各種効
率があまりよくない。特に、入力された文に二文字以上
の単語がない場合には表音文字列で表された当該文の漢
字変換の正確率が下がる一方である。例えば、「wo3 de
5 jia1 zai4 shan1 de5 na4 tou2」を入力すると、も
し、辞書部に登録されている単語の長さが、ひいては漢
字変換の検索対象となる最大の単語長が7であれば、辞
書部から対応する単語を検出するため、まず長さ7であ
る音節列「wo3 de5 jia1 zai4 shan1 de5 na4 」、「de
5 jia1 zai4 shan1 de5na4 tou2」を前から順に切り出
し、そして該当する単語がなければ次に、長さが7より
1つ少ない6である音節列「wo3 de5 jia1 zai4 shan1
de5 」、「de5 jia1 zai4 shan1 de5 na4 」、「jia1 z
ai4 shan1 de5 na4 tou2」を切り出し、以下同様に、長
さ5である音節列「wo3 de5 jia1 zai4 shan1 」、「de
5 jia1 zai4 shan1 de5 」、…、長さ1である音節「wo
3 」、「de5 」、「jia1」、「zai4」、「shan1 」、
「de5 」、「na4 」、「tou2」まで切り出さないと、対
応する文字「我」、「的」、「家」、「在」、「山」、
「的」、「那」、「頭」を検出できないこととなる。そ
して、上記の該当する文字を検出した後に、やっと漢字
変換の結果たる「我的家在山的那頭」を出力する。この
場合、実際には同一の音節に対して該当する漢字が多数
存在することが多いため、変換速度の面からも正確率の
面からも変換効率が非常に悪くなる。本発明は、かかる
課題に鑑み、漢字変換効率の優れた漢字変換装置を提供
することを目的としてなされたものである。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、本発明は表音文字列を入力する入力部と、表音文字
列及びこれに対応する中国語の単語が登録されている辞
書部と、中国語のすべての読み音と上記辞書部に登録さ
れている該読み音で始まる中国語単語の単語長について
の情報とが対応づけて登録されている辞書単語長情報部
と、入力された表音文字列の各音節に対して前記辞書単
語長情報部から対応する単語長についての情報を取り出
す辞書単語長検索部と、入力された表音文字列の漢字変
換の対象としての音節の切り出しに際して、第1に前記
辞書単語長検索部により取り出された単語長の長い読み
音を優先し、第2にもし同じ単語長であれば先に入力さ
れた音節を優先し、この上で選択された音節を先頭とし
て取り出された単語長だけの長さの表音文字列を切り出
す音節切り出し部と、前記音節切り出し部により切り出
された表音文字列を検索キーとして、前記辞書部内のし
該当する中国語単語を検索する辞書検索部と、前記辞書
検索部により検索された中国語単語に基づき、前記表音
文字列を対応した漢字に変換する変換部とを備えること
を特徴とする漢字変換装置としている。
【0009】
【作用】上記構成により、入力部により漢字変換の対象
となる表音文字列が入力される。辞書部には表音文字列
及びこれに対応する中国語の単語が登録されている。辞
書単語長情報部には、あらかじめ中国語の全ての読み音
と辞書部に登録されている該読み音で始まる中国語単語
の単語長についての情報とが対応づけて登録されてい
る。辞書単語長検索部が、入力された表音文字列の各音
節に対して辞書単語長情報部から対応する単語長情報を
取り出す。音節切り出し部が、入力された表音文字列か
らの漢字変換の対象としての音節の切り出しに際して、
第1に辞書単語長検索部により取り出された単語長の長
い読み音を優先し、第2にもし同じ単語長であれば先に
入力された音節を優先し、この上で選択された読み音か
ら取り出された単語長だけの長さの後続する表音文字列
を切り出す。辞書検索部が音節切り出し部により切り出
された表音文字列を検索キーとして、辞書部内の該当す
る中国語単語を検索する。変換部が、この検索対象とな
った表音文字列を辞書検索部により検索された中国語単
語に基づき、対応する漢字に変換する。
【0010】
【実施例】以下、本発明を実施例に基づき説明する。図
1は、本発明に係る漢字変換装置の一実施例の構成図で
ある。図2は、本実施例における処理流れ図である。図
1において、10はへい音、注音、ローマ字などの表音
文字を入力する入力部である。15は、表音文字列及び
それに対応する中国語単語が登録されている辞書部であ
る。14は、表音文字列を検索キーとして、上記辞書部
15から対応する中国語単語を検出する辞書検索部であ
る。12は、中国語のすべての読み音(1音節からな
る)及びそれに対応する情報として、辞書部15に登録
されている該読み音で始まる中国語単語の単語長につい
ての情報が登録されている辞書単語長情報部である。1
1は、入力された表音文字列の各音節に対して上記辞書
単語長情報部12から対応する単語長についての情報を
取り出す辞書単語長検索部である。13は、入力された
表音文字列からの漢字変換の対象としての音節の切り出
しに際して、第1に上記辞書単語長検索部11により検
出された単語長の長い読み音(音節)、第2にもし同じ
単語長であれば先に入力された音節を優先し、次にこの
2つの原則に基づいて選択された音節を先頭として取り
出した単語長だけの長さの表音文字列を切り出した上
で、この切り出した表音文字列に対応する中国語単語を
辞書検索部14に検索させ、該当する単語があればこれ
をその単語を構成する漢字列に変換する変換制御部であ
る。(なお、ここに漢字列と複数形を使用しているが、
これは、単語は勿論のこと文章とまではいかないが文章
的な句も含めるため「列」としたものである。ただし、
表音文字列のところで説明したように、一の漢字の場合
もあるため「列」そして単数、複数には厳格な意味、区
別はない。)16は上記変換制御部13によって変換さ
れた結果を出力する出力部である。
【0011】図3は、本実施例の辞書部15内のデータ
構造の概念図である。基本的構成は、通常使用される表
音文字列及びこれに対応する中国語単語からなり、配列
順序は従来技術に係るものと同じである。図4は、本実
施例の辞書単語長情報部12のデータ構造の概念図であ
る。基本的には、中国語のすべての読み音について、こ
れを表わす表音文字列及び各読み音に対応するデータと
しての辞書部15に登録されている該読み音ではじまる
単語長、すなわちその単語を構成する音節数についての
情報が登録されている。もし、単語長が1であれば、該
読み音を始めとする二以上の漢字からなる単語がないこ
とを表わす。なお、中国語文ではある読み音、たとえ
ば、「men5」で始まる単語はまず使用されないので、も
し入力された表音文字列から「men5」で始まる音節列を
辞書部の検索の対象として切り出した場合には、その必
要がないこととなる。
【0012】以下、図2を参照しつつ本実施例の処理動
作の流れを説明する。S1では、表音文字列を入力す
る。そして、S2へ行く。S2では、現在入力された表
音文字が入力終了キーか否かを検査する。もし入力終了
キーであればS3へ行く。そうでなければS1へ戻り、
次の入力を待つ。S3では、入力された各音節により対
応する単語の単語長情報を検索する。
【0013】S4では、まだ変換されていない音節の対
応する単語長情報から、未処理の最大の単語長及びこの
単語長を有する音節を取り出し、また同一の単語長に複
数の音節があるならば先に入力された音節を優先して取
り出してからS5へ行く。S5では、入力された音節列
から該取り出された音節を切り出しの始点とし、同じく
取り出された単語長を切り出しの長さとして、後続する
音節列を切り出すことができるか否かを検討する。もし
切り出すことができればS6へ行く。できなければ、S
4へ行く。
【0014】S6では、切り出された音節列中に既に漢
字変換されたものがあるか否かを検査する。もし、すで
に変換された音節があればS7へ行き、なければS4へ
行く。S7では、辞書部内に現在切り出された音節列に
対応する単語が登録されているか否かを検索する。も
し、対応する単語があればS8へ行き、なければS4へ
行く。
【0015】S8では、現在、漢字変換における検索の
対象として切り出された音節列をS7で検索された対応
する単語に漢字変換してからS9へ行く。S9では、現
在切り出された音節はすべて漢字変換されたか否かを検
査する。もし、すべて漢字変換されているならばS10
へ行き、未変換の音節があればS4へ行く。
【0016】S10では、変換結果の漢字列を全て出力
し、これにより入力された表音文字列の漢字変換処理を
終える。次に、以上のように構成された本実施例につい
て、以下、具体的に「Wo3 men5da3 qiu2 qu4 ba5 」が
入力された場合を例にとってその動作を説明する。この
表音文字列が入力され(S1)、且つ入力終了を示す入
力終了キーが押されると(S2)、辞書単語長検索部は
各入力された音節に基づき対応する単語長情報を検出す
る(S3)。なお、この際入力された各音節に対応する
単語長情報を入力された順に図5に示す。図5に示すよ
うに、入力された各音節のうち「de3 」で始まる読み音
だけは最大の単語長「7」があり(辞書には、「打破沙
鍋問到底」という7つの音節からなる単語が登録されて
いる。)、また読み音「men5」、「ba5 」については、
これらで始まる二音節以上の単語はない。
【0017】辞書単語長検索部11により各入力された
音節について、その単語長情報を知らされた変換制御部
13は、まだ漢字変換されていない音節の対応する単語
長情報のなかから、最大の長さ「7」、及びこの「7」
に対応する音節として三番目に入力された音節「da3 」
を取り出してから(S4)、入力された音節列の3番目
の「da3 」から7個の連続した音節を切り出すことが可
能か否かを検査する(S5)。入力された音節数そのも
のが6個であり、これは不可能と判断されたので、次の
可能な音節の切り出しの始点及び長さを検出する(S
4)。
【0018】このとき、まだ変換されていない音節の対
応する単語長情報から未処理の最大の長さ「4」を取り
出す。そして長さ「4」に対応する音節のうち、最も優
先する、すなわち先に入力された音節、そしてこの場合
には一番目の「wo3 」を取り出す(S4)。当然、変換
制御部は、この音節から後続する4個の音節を切り出す
ことができると判定し(S5)、この切り出された音節
列「wo3 men5 da3 qiu2 」中に既に漢字変換された音節
があるか否かを検査する(S6)。すべて変換されてい
ない音節なので、これら全ての音節列を検索キーとして
辞書検索部により辞書部に対応する単語が登録されてい
るか否かを検索する(S7)。対応する単語がないた
め、次の可能な音節の切り出しの始点及び長さを検出す
ることとなる(S4)。
【0019】この場合、単語長情報の長さが「4」かつ
まだ検索対象とされていない音節があるため、かかる音
節のうち次に優先する音節として三番目に入力された
「da3」を取り出す(S4)。変換制御部は、この三番
目の音節から4個の連続した音節「da3 qiu2 qu4 ba5」
を切り出すことが可能と判断し(S5)、この切り出さ
れた音節中に、既に漢字変換された音節があるか否かを
検査する(S6)。すべての音節が変換されていないの
で、辞書検索部がこれら全ての音節を検索キーとして対
応する単語が登録されているか否か辞書部内を検索する
(S7)。対応する単語が存在しないため、次の可能な
音節の切り出しの始点及び長さを検討する(S4)。
【0020】続けて、同じく対象とする単語長情報は
「4」のまま次に優先する「qiu2」を取り出す(S
4)。変換制御部は、この音節が4番目に入力されたも
のであり、この音節から後に続く4個の連続した音節を
切り出すことはできないと判断する(S5)。このた
め、次の可能な単語長を検知する(S4)。「7」、
「4」の場合と同様の手順で、まだ漢字変換されていな
い音節について、処理対象となる単語長のうちから最大
の長さ「3」を取り出す。この「3」に対応する音節の
うち一番先に入力された「da3 」を優先して切り出す
(S4)。変換制御部によりこの三番目の音節たる「da
3 」から3個の連続した音節「da3 qiu2 qu4」を切り出
すことが可能であり(S5)、かつすべて変換されてい
ない音節であると判断される(S6)。辞書検索部がこ
の音節を検索キーとして対応する単語が登録されている
か否か辞書部内を検索する(S7)。対応する単語が存
在しないため、次の可能な音節の切り出しの始点及び長
さを検討することとなる(S4)。
【0021】続けて、処理対象の長さは「3」のまま、
次に優先する音節として五番目の「qu4 」を取り出す
(S4)。しかしながら、変換制御部はこの音節から該
当する3個の連続音節を切り出すことはできないと判定
し(S5)、次の可能な音節の切り出しの始点及び長さ
を検討することとなる(S4)。この時点では、処理対
象となる最大長は「2」となる。この上で、この長さ
「2」に対応する音節のうち、一番先に入力された、そ
して一番目の音節たる「wo3 」が取り出される(S
4)。変換制御部により、この一番目の音節から2個の
連続音節「wo3 men5」が切り出され(S5)、かつこれ
らの音節はすべて漢字変換されていないと判断されたの
で(S6)、辞書部がこれを検索キーとして辞書部15
内に対応する単語があるか否かを検索する(S7)。対
応する単語「我們」が存在するので、「wo3 men5」を
「我們」に変換する。
【0022】次に、処理対象の長さは「2」のまま、長
さに「2」に対応する次に入力された三番目の「da3 」
を取り出す(S4)。変換制御部により三番目の「da3
」から2個の連続した音節「da3 qiu2」が切り出され
(S5)、これらはすべて漢字変換されていない音節で
あると判断されたので(S6)、辞書検索部がこれらの
音節を検索キーとして辞書部内を検索した結果対応する
単語「打球」を検出し、この上で「da3 qiu2」を検出し
た「打球」に漢字変換する。
【0023】続けて、処理対象の長さは「2」のまま、
この「2」に対応する次に優先する音節として、五番目
に入力された「qu4 」を取り出す(S4)。変換制御部
により、この五番目の「qu4 」から2個の連続した音節
「qu4 ba5 」が切り出され(S5)、これはすべてまだ
漢字変換されていないと判断される(S6)。次いで、
辞書検索部がこれらの音節を検索キーとして対応する単
語があるか否か辞書部内を検索する(S7)。対応する
単語がないので、次の可能な音節の切り出しの始点及び
長さを検討することとなる(S4)。
【0024】この時点では、処理対象となる長さは
「1」である。この場合は、最初に入力されたかつまだ
漢字変換されていない音節から順に辞書部内の検索を経
て漢字変換されることとなる。五番目に入力された「qu
4 」が切り出されて(S5)、辞書検索部がこの「qu4
」を検索キーとして辞書部内を検索し、対応する使用
頻度が一番高い文字「去」を検出した上で(S7)漢字
変換する(S8)。
【0025】次に、六番目の「ba5 」が処理対象とされ
(S4)、発音が「ba5 」の漢字のうち使用される頻度
が一番高い文字「(外1)」
【0026】
【外1】 が辞書部から検出され(S7)、「(外1)」に漢字変
換される(S8)。この時点で、変換制御部は漢字変換
の対象として入力された音節はすべて漢字変換されたと
判定し、この上でこの変換結果「我們打球去(外1)」
を出力部に出力し、漢字変換処理を終えることとなる。
【0027】以上、本発明を実施例にもとづき説明して
きたが、本発明は何も上記実施例に限定されないのは勿
論であり、例えば以下のようなものも本発明に含まれ
る。 (1)図2に示すように、必ず入力終了キーが押されて
から、入力された表音文字列の全ての表音文字列を漢字
に変換し始める必要はなく、声調キーが入力されたら、
つまり、一つの音節が入力される度に、前回入力された
表音文字列の入力終了位置から、現在入力された表音文
字列までを変換する。 (2)辞書単語長情報部を独立のものとせず、辞書部と
一体的なものとする。 (3)「表音文字」とは、中国語の文章、句、単語、漢
字の発音を表現することにより、入力者が意図する文
章、句、単語、漢字を特定するのに使用される文字とい
う意味であり、中華民国の注音符号、同注音符号第二
式、大陸で使用されるローマ字へい音記号はもとより、
日本語のかなのごとき音素文字、その他朝鮮語における
オンモン等も含む。
【0028】また、「中国語文章」とは、表意文字を主
とする文章という意味であり、文書の構成要素は、漢字
や中国語単語に限定されず、アラビア数字、中国からみ
て外国たる日本製の漢字たる「峠」や外国語たる「東
京」等を含むものも含まれるのは勿論のこと、文章とし
ても日本語における漢文等をも包む。 (4)ある特定の音節には、その音節を先頭としては滅
多に若しくは全く単語に使用されないものがある(日本
語ならば「ん」)が、この場合にはたとえ該単語を構成
する文字数が多くても辞書部の検索はあとまわしとす
る、逆に特定の音節については、この音節で始まる使用
頻度の非常に高い単語が存在するため、この音節につい
てはたとえその単語長が小さくても検索を優先するとい
うような機能が付加されている。
【0029】これらの場合には、該当する単語長につい
ての情報に所定のフラグ(印)を付すことにより容易に
目的が達成される。 (5)製造等の都合で、本発明の一の構成要素(要件)
を物理的、機械的に複数の物に分割する、逆に複数の構
成要素を物理的、機械的に一体の物とする、あるいはこ
れらを適宜くみあわせたものとしている。
【0030】あるいはまた、既存の漢字変換装置に本発
明に係るプログラムやデータを記憶させることにより本
発明に係る機能を発揮するようにしている。 (6)入力者のクセや入力を意図している文章の都合
上、変換対象となる単語、漢字そのものや単語を構成す
る漢字数に顕著な特徴、頻度がみられる場合にはこれに
有効に対処すべく学習機能を付加する。
【0031】これらの場合にも、別途簡単な記憶装置、
計数装置を設け、それらの作用のもとで辞書単語長情報
部内のデータに優先フラグを設けたりすることにより、
そして結果的には単語長についての情報の登録の配列を
変更することにより容易に実現しえる。
【0032】
【発明の効果】以上説明したように本発明によれば、表
音文字の形式で入力された音節列を中国語の文字に変換
するときに、入力された音節列について変換できる最大
の単語長により逐次にずらしてすべての可能な音節を切
り出して辞書を検索する必要がなく、各音節の単語長に
ついての情報を参照して、第1に単語長の大きいものを
優先し、第2に先に入力さた音節を優先することにより
検索対象となる単語についての音節を切り出すこととな
るため、不必要な辞書検索を減らすことができる。この
ため、漢字変換装置の効率が向上し、その効果は非常に
高い。
【図面の簡単な説明】
【図1】本発明に係る漢字変換装置の一実施例の構成図
である。
【図2】上記実施例における漢字変換処理の動作流れ図
である。
【図3】上記実施例における辞書部のデータ構造の概念
図である。
【図4】上記実施例における辞書単語長情報部のデータ
構造の概念図である。
【図5】上記実施例における、具体例として示した入力
された音節についての辞書単語長情報の図である。
【図6】従来の漢字変換装置の構成図である。
【符号の説明】
10 入力部 11 辞書単語長検索部 12 辞書単語長情報部 13 変換制御部 14 辞書検索部 15 辞書部 16 出力部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/20 - 17/28

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 表音文字列を入力する入力部と、 表音文字列及びこれに対応する中国語の単語が登録され
    ている辞書部と、 中国語のすべての読み音と上記辞書部に登録されている
    該読み音で始まる中国語単語の単語長についての情報と
    が対応づけて登録されている辞書単語長情報部と、 入力された表音文字列の各音節に対して前記辞書単語長
    情報部から対応する単語長についての情報を取り出す辞
    書単語長検索部と、 入力された表音文字列の漢字変換の対象としての音節の
    切り出しに際して、第1に前記辞書単語長検索部により
    取り出された単語長の長い読み音を優先し、第2にもし
    同じ単語長であれば先に入力された音節を優先し、この
    上で選択された音節を先頭として取り出された単語長だ
    けの長さの表音文字列を切り出す音節切り出し部と、 前記音節切り出し部により切り出された表音文字列を検
    索キーとして、前記辞書部内の該当する中国語単語を検
    索する辞書検索部と、 前記辞書検索部により検索された中国語単語に基づき、
    前記表音文字列を対応した漢字に変換する変換部とを備
    えることを特徴とする漢字変換装置。
JP5196371A 1993-08-06 1993-08-06 漢字変換装置 Expired - Fee Related JP2997151B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5196371A JP2997151B2 (ja) 1993-08-06 1993-08-06 漢字変換装置
CN 94104871 CN1115884A (zh) 1993-08-06 1994-04-26 汉字变换装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5196371A JP2997151B2 (ja) 1993-08-06 1993-08-06 漢字変換装置

Publications (2)

Publication Number Publication Date
JPH0749858A JPH0749858A (ja) 1995-02-21
JP2997151B2 true JP2997151B2 (ja) 2000-01-11

Family

ID=16356752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5196371A Expired - Fee Related JP2997151B2 (ja) 1993-08-06 1993-08-06 漢字変換装置

Country Status (2)

Country Link
JP (1) JP2997151B2 (ja)
CN (1) CN1115884A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6622921B2 (ja) * 2016-09-02 2019-12-18 株式会社日立ハイテクノロジーズ 文字列辞書の構築方法、文字列辞書の検索方法、および、文字列辞書の処理システム

Also Published As

Publication number Publication date
CN1115884A (zh) 1996-01-31
JPH0749858A (ja) 1995-02-21

Similar Documents

Publication Publication Date Title
KR100656736B1 (ko) 표음 입력 모호성 제거 시스템 및 방법
KR19990078364A (ko) 문서처리장치 및 그의 방법
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JP2000298667A (ja) 構文情報による漢字変換装置
JPH08263478A (ja) 中国語簡繁体字文書変換装置
JP2997151B2 (ja) 漢字変換装置
JPH10269204A (ja) 中国語文書自動校正方法及びその装置
JP2004240859A (ja) 言い換えシステム
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPS60254367A (ja) 文章分析装置
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
Minghu et al. Segmentation of Mandarin Braille word and Braille translation based on multi-knowledge
US6327560B1 (en) Chinese character conversion apparatus with no need to input tone symbols
JP2580568B2 (ja) 発音辞書更新装置
JP3045886B2 (ja) 手書き入力機能付き文字処理装置
JPH01229369A (ja) 文字処理装置
JP2008140074A (ja) 例文検索装置および例文検索処理プログラム
JP3234338B2 (ja) 漢字変換装置
JP3888701B2 (ja) 文字変換装置
JPS63163956A (ja) 文書作成・校正支援装置
JPH11184854A (ja) 電子辞書
JP2575947B2 (ja) 文節切出し装置
JP3916792B2 (ja) 音声認識装置
JP2002117025A (ja) かな漢字変換装置およびかな漢字変換方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees