JPH096761A

JPH096761A - 中国語用漢字変換装置及び中国語用漢字変換方法

Info

Publication number: JPH096761A
Application number: JP7181099A
Authority: JP
Inventors: Takeshi O; 斌王
Original assignee: Casio Computer Co Ltd
Current assignee: Casio Computer Co Ltd
Priority date: 1995-06-23
Filing date: 1995-06-23
Publication date: 1997-01-10

Abstract

(57)【要約】【目的】複数の文節に対しても一つの文節と同様に同
音語学習を行うようにすることで、中国語の漢字変換入
力における変換効率の向上を図ることである。【構成】キー入力部１から入力すべき漢字列の発音を
示す発音記号列を入力する。ＣＰＵ２が変換辞書８及び
学習辞書９を参照して発音記号列を文節毎に候補となる
漢字列に変換する。候補の漢字列と入力すべき漢字列が
異なる場合、キー入力部１からＣＰＵ２に文節区切り位
置の変更や再変換等を指示する。候補となる漢字列と入
力すべき漢字列とが一致した場合にキー入力部１から確
定入力を指示する。ＣＰＵ２が確定された複数の文節か
らなる漢字列とその発音記号列と文節区切り位置を一つ
の漢字列として学習辞書に登録する。再び同じ発音記号
列が入力された場合に、上記学習辞書の複数の文節から
なる漢字列を第一候補として出力するとともに、登録さ
れた文節区切り位置で区切った状態とする。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、中国語の入力処理にお
いて、発音記号を入力可能なキーボードから入力された
発音記号列を漢字に変換する中国語用漢字変換装置及び
中国語用漢字変換方法に関する。

【０００２】

【従来の技術】一般に、中国語の文字の入力処理におい
ては、アルファベットで構成される発音記号（ピンイ
ン）列を入力し、入力された発音記号列に対応する漢字
を辞書から検索して出力するようになっている。すなわ
ち、日本語の文字の入力処理とほぼ同様に、中国語の文
字の入力処理においては、入力された発音記号列を漢字
に変換する漢字変換装置（いわゆるＦＥＰ（front end
processor））が必要となる。

【０００３】従来、中国語用の漢字変換装置において、
複数の漢字熟語からなる漢字列に対応する発音記号列を
入力した後に、一括して変換処理を行った場合には、辞
書を検索して、発音記号列の先頭から対応する漢字熟語
に順次変換するようになっている。

【０００４】この際には、まず、発音記号列の任意の長
さの先頭部分に対応する漢字熟語を辞書から検索する。
そして、複数の漢字熟語が検索され、かつ、検索された
漢字熟語の文字数が異なる場合には、文字数が最も多い
長い漢字熟語が優先的に選択される。そして、上記発音
記号列の選択された漢字熟語に対応する先頭部分が一つ
の文節とされる。

【０００５】次いで、上記発音記号列から検索された漢
字熟語に対応する先頭部分を除いた発音記号列におい
て、上述のような処理を行うとともに、発音記号列の全
ての部分を漢字に変換するまで上述の処理が繰り返し行
われる。

【０００６】すなわち、複数の漢字熟語からなる漢字列
に対応する発音記号列を一括変換した場合には、発音記
号列が複数の文節に分割されるとともに、各文節が漢字
熟語に変換されることになる。

【０００７】また、発音記号列の一つの文節に対して複
数の漢字熟語が選択された場合、すなわち、同音漢字熟
語が存在する場合には、オペレータが複数の漢字熟語か
ら一つの漢字熟語を選択して一つの文節に対応する一つ
の漢字熟語を確定するようになっている。

【０００８】また、上記漢字変換装置においては、同音
語学習機能として、上記文節に対応する一つの漢字熟語
を確定した際に、上記文節を構成する発音記号列と漢字
熟語とを定義づけて辞書に学習情報として登録するよう
になっており、次に、同じ発音記号列からなる文節が入
力された際には、前に確定されて学習情報として登録さ
れた漢字熟語が第一候補として出力されるようになって
いる。例えば、発音記号列として”ｇｏｎｇｓｉ”を
漢字変換装置に入力した場合には、辞書が検索されて以
下の二つの漢字熟語が出力されるものとする。

【０００９】１．公司２．公私この際に、辞書においては、”公司”の方が優先的に登
録されているので、漢字変換装置は、まず”公司”を出
力する。

【００１０】しかし、実際に入力したい漢字熟語が”公
私”であった場合には、オペレータがさらに候補となる
漢字熟語を出力させるように指示し、”公私”が出力さ
れたところで、入力される漢字熟語を”公私”に確定す
る。この際に、同音語学習機能により、”ｇｏｎｇｓ
ｉ”に対応する漢字熟語として”公私”を優先するとい
う学習情報が辞書に登録される。

【００１１】従って、次に、再び、発音記号列として”
ｇｏｎｇｓｉ”を入力した際には、漢字変換装置にお
いて、まず、”公私”が出力されることになる。そし
て、入力すべき漢字熟語が”公私”の場合には、このま
ま”公私”を確定すれば良いので、例えば、同じ文書内
で同じ言葉を多用するような場合に、変換効率を向上さ
せることができる。

【００１２】なお、上記漢字変換装置において、発音記
号列が文節に分割されることになるが、意図した文節の
区切り位置と異なる位置で文節に分割され、各文節に対
応する漢字熟語が出力された場合には、オペレータが文
節の区切り位置を変更し、変換処理を再び行う必要があ
る。また、中国語の発音においては、同じアルファベッ
トの発音記号で表される言葉でも、発音する際の音程の
上げ下げにより意味が異なる言葉となり、この言葉に対
応する漢字も異なるものとなっている。

【００１３】従って、中国語の発音記号には、上述のア
ルファベットで示される発音記号に、発音する際の音程
の上げ下げを示す声調記号が付されている。そして、漢
字変換装置において、アルファベットの発音記号ととも
に声調記号を入力するものとすれば、同音異義語を減ら
して変換効率の向上を図ることができるが、キーボード
から声調記号のついた発音記号を入力するものとした場
合には、中国語の発音記号用のキーボードが必要となる
とともに、入力速度が低下することになる。

【００１４】上述の漢字変換方法は、声調記号のない発
音記号を用いた場合の例である。また、上記漢字熟語と
は、辞書に登録された一つの発音記号列に対する一つの
漢字列であり、必ずしも日本の熟語と同一ものではな
く、例えば、辞書において、一つの発音記号列に対して
一文字の漢字が登録されていた場合には、この漢字一文
字も漢字熟語となる。

【００１５】

【発明が解決しようとする課題】ところで、中国語にお
いては、一つの発音記号列で表される同音漢字熟語が多
い。すなわち、上記漢字変換装置の辞書においては、一
文字からなる多数の単漢字熟語が登録されており、発音
記号列の数に対して多数の漢字熟語が存在し、多くの同
音漢字熟語が登録されている。

【００１６】従って、一つの文章において、二度同じ発
音記号列を入力した場合に、同じ発音記号列であっても
前の発音記号列と後の発音記号列とでは違う漢字熟語が
対応する可能性が高い。そこで、上記同音学語習機能に
より、前の発音記号列に対して確定された漢字熟語を、
後の発音記号列の変換の際に優先的に出力しても、優先
的に出力された漢字熟語が採用されない場合が多々ある
ことになり、同音語学習機能による変換効率の向上の効
果が少ない。

【００１７】また、上述のように文字数の多い漢字熟語
を優先して文節の区切り位置が決められ、あとから文節
の区切り位置を変更して文字数の少ない漢字熟語を確定
した場合に、同音語学習機能があまり機能しないといっ
た問題点がある。例えば、発音記号列”ｙｉｚｈｉ”で
表される辞書に登録されていない漢字熟語”一只”を入
力するものとする。

【００１８】そして、辞書には、”ｙｉｚｈｉ”に対応
する二字の漢字熟語”意志”が登録されているものとす
る。この場合には、漢字変換装置に発音記号列”ｙｉｚ
ｈｉ”を入力すると、単漢字熟語よりも長い二字の漢字
熟語が優先するので、”ｙｉｚｈｉ”が一つの文節とさ
れて”意志”が候補漢字熟語として出力される。

【００１９】ここでオペレータは、文節の区切り位置
を”意（ｙｉ）”と”志（ｚｈｉ）”との間とする。そ
して、”ｙｉ”に対する候補漢字熟語から”一”を選択
するとともに、”ｚｈｉ”に対する候補漢字熟語から”
只”を選択して、”一只”を確定する。

【００２０】この際には、上記同音語学習機能によ
り、”ｙｉ”に対して”一”が優先される漢字熟語とさ
れ、”ｚｈｉ”に対して”只”が優先される漢字熟語と
される。

【００２１】ここで再び、発音記号列”ｙｉｚｈｉ”を
入力すると、単漢字熟語よりも長い二字の漢字熟語が優
先するので、”ｙｉｚｈｉ”が一つの文節とされて”意
志”が候補漢字熟語として出力されてしまうことにな
り、オペレータは再び文節の区切り位置を変更すること
になる。

【００２２】従って、文節の区切り位置を変更した後
の”ｙｉ”、”ｚｈｉ”に対する”一”、”只”の選択
に関しては同音語学習機能が作用するが、文節の区切り
位置の変更を省略することができず、変換効率の大幅な
向上を望むことができない。

【００２３】本発明の課題は、複数の文節に対しても一
つの文節と同様に同音語学習を行うようにすることで、
中国語の漢字変換入力における変換効率の向上を図るこ
とである。

【００２４】

【課題を解決するための手段】本発明の請求項１記載の
中国語用漢字変換装置は、発音記号列に対応して漢字列
が登録された辞書と、漢字列の発音を示す発音記号列を
入力する入力手段と、上記辞書に基づいて入力された発
音記号列を文節毎に漢字列に変換して出力する変換手段
と、文節区切り位置の変更及び上記変換手段による再変
換、一つの発音記号列に対応する同音の複数の漢字列か
らの選択等の操作を指示する指示手段と、変換された漢
字列を確定して入力する確定手段と、入力された発音記
号列及び該発音記号列に対して確定された漢字列を対応
させて辞書に登録する学習手段とを具備してなり、上記
学習手段は、確定時に複数の文節からなる漢字列を一つ
の漢字列として上記辞書に登録可能とされ、上記変換手
段は、上記辞書に基づいて入力された発音記号列を漢字
列に変換する際に、上記発音記号列に対応し、かつ、上
記学習手段により登録された漢字列が上記辞書に登録さ
れている場合に、上記学習手段により登録された漢字列
を優先して出力することを特徴とする。

【００２５】本発明の請求項２記載の中国語用漢字変換
装置は、上記学習手段が、複数の文節からなる漢字列を
一つの漢字列として辞書に登録する際に、上記漢字列と
ともにその文節の区切り位置を上記辞書に登録し、上記
変換手段が、入力された発音記号列を複数の文節からな
る漢字列に変換する際に、上記漢字列に対応して上記辞
書に登録された文節区切り位置で上記漢字列を区切った
状態とすることを特徴とする。

【００２６】本発明の請求項３記載の中国語用漢字変換
装置は、上記学習手段が、上記変換手段の最初の変換時
の文節区切り位置と、上記確定手段に確定された漢字列
の文節区切り位置とで位置が一致する文節区切り位置を
共通区切り位置とするとともに、確定された漢字列を上
記共通区切り位置で分割し、各分割部分をそれぞれ一つ
の漢字列として辞書に登録することを特徴とする。

【００２７】本発明の請求項４記載の中国語用漢字変換
方法は、入力される発音記号列を、発音記号列と漢字列
とが対応させられて登録された辞書に基づいて漢字列に
変換する中国語用漢字変換装置における中国語用漢字変
換方法であって、入力された発音記号列により上記辞書
を検索して文節毎に漢字列に変換された候補漢字列を出
力し、上記候補漢字列と入力すべき漢字列とが異なる場
合に、文節区切り位置の変更及び候補漢字列の再出力、
一つの発音記号列に対応する同音の複数の漢字列からの
選択等の操作により候補漢字列を確定し、確定された漢
字列を学習するために、入力された発音記号列と確定さ
れた漢字列とを対応させて上記辞書に登録するに際し、
複数の文節からなる漢字列を一つの漢字列として登録す
るとともに、上記漢字列の文節区切り位置を登録し、上
記発音記号列が再び入力された際に、上記辞書に登録さ
れた複数の文節からなる漢字列を文節毎に区切った状態
で候補漢字列として出力することを特徴とする。

【００２８】本発明の請求項５記載の中国語用漢字変換
方法は、入力された発音記号列と確定された漢字列とを
対応させて辞書に登録するに際し、最初に出力された候
補漢字列の文節区切り位置と、確定された漢字列の文節
区切り位置とで位置が一致する文節区切り位置を共通区
切り位置とするとともに、入力された発音記号列及び確
定された漢字列を上記共通区切り位置で分割し、各分割
部分毎に発音記号列と漢字列とを対応させて辞書に登録
することを特徴とする。

【００２９】

【作用】上記請求項１記載の構成によれば、確定された
複数の文節からなる漢字列において同音語学習を行う際
に、文節毎に学習を行うのではなく、複数の文節からな
る漢字列を一つの漢字列として学習することが可能なの
で、上述のように辞書に登録された文字数の長い漢字列
を優先して文節を区切るようにしても、同音語学習され
た漢字列が優先的に出力される。例えば、上述のように
発音記号列”ｙｉｚｈｉ”で表される辞書に登録されて
いない漢字熟語”一只”を入力するものとする。

【００３０】そして、辞書には、”ｙｉｚｈｉ”に対応
する二字の漢字熟語”意志”が登録されているものとす
る。この場合には、漢字変換装置に発音記号列”ｙｉｚ
ｈｉ”を入力すると、単漢字熟語よりも長い二字の漢字
熟語が優先するので、”ｙｉｚｈｉ”が一つの文節とさ
れて”意志”が候補漢字熟語として出力される。ここで
オペレータは、文節の区切り位置を”意（ｙｉ）”と”
志（ｚｈｉ）”との間とする。

【００３１】そして、”ｙｉ”に対する候補漢字熟語か
ら”一”を選択するとともに、”ｚｈｉ”に対する候補
漢字熟語から”只”を選択して、”一只”を確定する。
この際には、本発明の同音語学習機能により、発音記号
列”ｙｉｚｈｉ”に対して上記のように二つの文節から
なる”一只”が一つの漢字列として辞書に登録される。

【００３２】ここで再び、発音記号列”ｙｉｚｈｉ”を
入力すると、”ｙｉｚｈｉ”に対して単漢字熟語よりも
長い二字の漢字熟語が優先して検索される。この際に、
二文字の”一只”が一つの漢字列として学習されて登録
されているので、二文字の漢字列である”一只”も検索
範囲に含まれ、学習された”一只”と辞書に登録されて
いる”意志”とが候補となるが、学習された方が優先さ
れるので”一只”が候補漢字熟語として出力される。

【００３３】また、上記請求項２記載の構成によれば、
複数の文節からなる漢字列を一つの漢字列として学習す
る際に、文節区切り位置も学習され、学習された複数の
文節からなる漢字列を出力する際に、漢字列を文節毎に
区切った状態で出力することができる。

【００３４】従って、学習機能により優先的に出力され
た漢字列を再変換する必要がある場合には、出力された
漢字列が文節毎に区切られた状態となっており、文節毎
に再変換を行うことができ、出力された漢字列の一部の
文節だけ変更する必要がある場合に、変換効率を向上す
ることができる。

【００３５】また、上記請求項３記載の構成によれば、
長い発音記号列を入力した後に、一括変換を行った場合
に、比較的多くの文節からなる長い漢字列が確定される
ことになるが、確定された漢字列をいくつかに分割して
辞書に登録することができる。

【００３６】なお、辞書に長い漢字列を登録しても、長
い漢字列に正確に対応する発音記号列が入力される頻度
が低いのであまり役に立たず、また、比較的長い漢字列
を極めて短い漢字列に分割して辞書に登録しても、上述
のように長い漢字列が優先されて文節が区切られた場合
に、変換効率の向上が望めない。

【００３７】また、変換手段から最初に変換されて出力
される漢字列は、辞書に登録された長い文字数の漢字列
を優先して文節を決めた場合に、比較的長い文節から構
成されることになるのに対して、確定された漢字列は、
適切な漢字熟語が辞書に登録されていない場合に、文節
の区切り位置を調整して単漢字熟語等の短い漢字熟語か
ら漢字列を再構成することになるので、比較的短い文節
から構成されることになる。

【００３８】そこで、上述のように最初の変換（初期変
換）時の文節区切り位置と、確定された漢字列の文節区
切り位置とで位置が一致する文節区切り位置を共通区切
り位置とするとともに、確定された漢字列を上記共通区
切り位置で分割した場合には、確定された漢字列が初期
変換時の文節よりも短く分割されることがなく、適度な
長さの漢字列に分割されて辞書に登録されることにな
り、学習結果により変換率の向上を図ることができる。

【００３９】また、初期変換時の文節区切り位置と、確
定された漢字列の文節区切り位置とで位置が一致する文
節区切り位置を共通区切り位置として、確定された漢字
列を上記共通区切り位置で分割した場合には、初期変換
時の文節区切り位置と、確定された漢字列の文節区切り
位置とで位置が異なる文節区切り位置がある場合に、確
定入力時の文節区切り位置で区切られた前後の文節は、
一つの漢字列として辞書に登録されることになり、文節
区切り位置も辞書に登録する場合に、初期変換時に対し
て確定入力時に位置が変更された文節区切り位置だけが
辞書に登録されることになり、文節区切り位置が効率的
に学習されることになる。

【００４０】上記請求項４記載の構成によれば、上記請
求項２記載の構成と同様に変換効率の向上を図ることが
できる。

【００４１】上記請求項５記載の構成によれば、上記請
求項３記載の構成と同様に変換効率の向上を図ることが
できる。

【００４２】

【実施例】以下に、本発明の中国語用漢字変換装置及び
中国語用漢字変換方法の一実施例を図面を参照して説明
する。図１は、この実施例の中国語用漢字変換装置を示
すものである。なお、この実施例の中国語用漢字変換装
置は、コンピュータ・システム（例えば、汎用のコンピ
ュータシステムやワードプロセッサ専用機やコンピュー
タ・タイプセッティング・システムや、その他のシステ
ム）に組み込まれ、例えばアスキーコードを入力可能な
キーボードを用いてコンピュータ・システムへの中国語
の入力を可能とするものである。

【００４３】図１に示すように、この実施例の中国語用
漢字変換装置は、アルファベットからなる中国語の発音
記号を入力可能なキー入力部１と、入力された発音記号
を中国語の漢字に変換して出力するＣＰＵ（central pr
ocessing unit）２と、ＣＰＵ２から出力される発音記
号や漢字等の文字の形状を画像データ（フォントデー
タ）として記憶する表示メモリ３と、表示メモリ３に記
憶された発音記号や漢字等の画像データを表示する表示
部４と、ＣＰＵ２から出力される発音記号や漢字等を印
字するための印字部５と、上記漢字や発音記号のフォン
トデータなどのＣＰＵ２の処理に必要なデータや、ＣＰ
Ｕ２から出力されるデータ等を記憶する外部記憶部６
と、同じくＣＰＵ２の処理に必要なデータやＣＰＵ２か
ら出力されるデータを一時的に記憶するワークメモリ７
と、発音記号列と該発音記号列に対応する漢字熟語とが
登録された変換辞書８と、ＣＰＵ２により変換された漢
字を確定した際に抽出される学習情報が登録された学習
辞書９とを有する。

【００４４】上記キー入力部１は、いわゆるアルファベ
ット用のキーボードであり、声調記号の無い中国語の発
音記号（ピンイン）を入力できるものである。また、キ
ー入力部１は、変換、文節区切り位置の変更、確定等の
指示を入力できるようになっている。

【００４５】上記ワークメモリ７は、発音記号を漢字に
変換する際に必要なデータを一時的に格納するものであ
り、図２に示すような領域が確保されている。すなわ
ち、ワークメモリ７には、キー入力部１から入力された
発音記号列が格納される入力バッファ領域ＩＢと、入力
された発音記号列のうちの変換辞書８及び学習辞書９を
検索するのに必要な部分が格納される検索発音記号領域
ＰＹと、表示部４に表示すべき候補漢字列が格納される
候補表示情報領域ＳＣと、初期変換時に第一候補とされ
た漢字列が格納される初期変換候補情報領域Ｔ１と、初
期変換時に入力された発音記号列に対応して出力される
漢字列の文節区切り位置が各文節の文字数として格納さ
れる初期変換文節情報領域Ｗ１と、確定された漢字列が
格納される確定入力時候補情報領域Ｔ２と、確定された
漢字列の文節区切り位置が各文節の文字数として格納さ
れる確定入力時文節情報領域Ｗ２とが確保されている。

【００４６】また、上記変換辞書８は、一般的な漢字変
換用の辞書であり、中国語において、有る程度の頻度で
用いられる漢字列が漢字熟語として登録されているとと
もに、登録された漢字熟語に対応して該漢字熟語の読み
となる発音記号列が登録されている。

【００４７】そして、発音記号列から漢字熟語が検索で
きるようになっている。なお、ここで、上記漢字列及び
漢字熟語には、一文字の漢字も含まれるものとする。

【００４８】すなわち、上記変換辞書においては、一つ
の漢字列（漢字熟語）として、一文字の漢字も登録され
ている。上記学習辞書は、図３に示すように、登録され
る各漢字列毎に、発音記号（列）と、漢字表記と、文節
情報と、その他の情報が登録されるようになっている。

【００４９】上記発音記号には、アルファベットで示さ
れる声調記号無しの発音記号が登録されるようになって
いる。上記文節情報には、上記ワークメモリ７の初期変
換文節情報領域Ｗ１及び確定入力時文節情報領域Ｗ２と
同様に、登録された漢字列の文節区切り位置が、各文節
の文字数として登録されるようになっている。

【００５０】例えば、一つの文節から構成される二文字
の漢字熟語の場合に文節情報が２とされ、一文字ずつの
二つの文節（漢字熟語）から構成される漢字列の場合に
文節情報が１、１とされ、一文字の文節の後に二文字の
文節がくる漢字列の場合に文節情報１、２とされるよう
になっている。そして、上記ＣＰＵ２は、後述するよう
に、キー入力部１から入力された発音記号列に基づいて
変換辞書８及び学習辞書９を検索して発音記号列を漢字
列に変換するとともに、変換された漢字列が確定された
際に、学習情報を抽出して学習辞書９に登録する機能を
有する。

【００５１】次に、上述のような中国語用漢字変換装置
による中国語用漢字変換方法について説明する。図４の
フローチャートは、この実施例の中国語用漢字変換方法
を示すものであり、この実施例において中国語用漢字変
換方法は、発音記号を漢字に変換して入力する漢字変換
方法と複数の文節を一括して同音語学習する一括学習方
法とからなるものである。

【００５２】まず、中国語用漢字変換方法においては、
キー入力部１から入力すべき任意の文字数の漢字列の読
みを示す発音記号列が入力される（ステップＳ１）。こ
こでは、図５（Ａ）に示すように漢字列”工死”の読み
としての”ｇｏｎｇｓｉ”が入力されたものとする。

【００５３】キー入力部１から入力された発音記号列
は、図６（Ａ）に示すように入力バッファ領域ＩＢに格
納される。また、入力された発音記号列の最初の文節部
分が、ワークメモリ７の検索発音記号の領域ＰＹに格納
される。

【００５４】この段階では、入力された発音記号列は文
節毎に分割されていないので、入力された発音記号列の
全部、すなわち、”ｇｏｎｇｓｉ”がそのまま格納され
る。また、入力バッファ領域ＩＢに格納された発音記号
列は、その形状の情報が表示メモリ３に格納されて図５
（Ａ）に示すように表示部４に表示される。

【００５５】なお、図５において矩形枠内は、表示部４
の表示画面上の表示を示すものである。次に、図５
（Ｂ）に示すように（変換）キーを入力することによ
り、検索発音記号領域ＰＹに格納された発音記号列に基
づいて変換辞書８及び学習辞書９が検索され、発音記号
列に対応する漢字熟語を検出するための漢字変換処理が
行われる（ステップＳ２）。

【００５６】なお、発音記号列全体に対応する漢字熟語
が変換辞書８及び学習辞書９に登録されていない場合に
は、発音記号列の任意の文字数の先頭部分に対応する漢
字熟語が検索される。この際に、複数の文字数の異なる
漢字熟語が検索される場合には、文字数の多い漢字熟語
が優先され、上記発音記号列の文字数の長い優先して検
索された漢字熟語に対応する部分が一つの文節とされ
る。

【００５７】また、上記発音記号列から上述のように設
定された文節（先頭部分）を除いた残りの発音記号列に
おいて、上述のような変換辞書の検索が行われる。この
際にも、残りの発音記号列全体に対応する漢字熟語が変
換辞書に登録されていない場合には、上述のように、発
音記号列の任意の文字数の先頭部分に対応する漢字熟語
が検索され、検索された漢字熟語に対応する部分が一つ
の文節とされる。

【００５８】そして、さらに、発音記号列に残りの部分
がある場合には、上述のような処理を繰り返し行い、発
音記号列を複数の文節に分割するとともに、各文節に対
して第一候補となる漢字熟語が検索される。また、上記
漢字変換処理においては、学習辞書９の学習情報が利用
される（ステップＳ２ａ）が、学習情報を利用した漢字
変換処理については後述する。

【００５９】そして、各文節毎に検索された第一候補と
なる漢字熟語からなる漢字列が図６（Ａ）の候補表示情
報領域ＳＣに格納される。ここでは、”ｇｏｎｇｓｉ”
が一つの文節とされ、”ｇｏｎｇｓｉ”に対応して変換
辞書８もしくは学習辞書９に登録された漢字熟語の中か
ら第一候補の”公私”が検出され、候補表示情報領域Ｓ
Ｃに格納される。

【００６０】なお、変換辞書８と学習辞書９にそれぞれ
同じ発音記号列に対する漢字列が登録されている場合に
は、学習辞書９に登録された漢字列が優先して第一候補
とされる。また、変換辞書８もしくは学習辞書９におい
て、同じ発音記号列に対する複数の漢字列が登録されて
いる場合には、優先順位が一位の漢字列が第一候補とさ
れる。

【００６１】そして、この第一候補の漢字列、すなわち
初期変換候補の情報が初期変換候補情報領域Ｔ１に格納
される（ステップＳ３）。ここでは、図６（Ａ）に示す
ように”公私”が初期変換候補情報領域Ｔ１に格納され
る。

【００６２】また、初期変換文節情報領域Ｗ１には、上
記初期変換候補情報領域Ｔ１に登録された漢字列の各文
節の文字数が順番に登録される。なお、初期変換候補情
報として登録された漢字列と後述するように確定された
漢字列が一致しない場合に、後述する学習情報の登録が
行われる。

【００６３】そして、候補表示情報領域ＳＣに格納され
た”公私”が図５（Ｂ）に示すように表示部４に表示さ
れる（ステップＳ４）ここで、入力すべき”工死”ではなく、”公私”が表示
されたので、オペレータは、再度（変換）キーを入力し
（ステップＳ５）、変換辞書に登録された”ｇｏｎｇｓ
ｉ”の候補となる漢字熟語として”工死”が出力される
か否か確認する。

【００６４】すなわち、変換辞書に”ｇｏｎｇｓｉ”と
して登録された漢字熟語の中に、”工死”が含まれる
か、否か（変換）キーを入力して第一候補以降の候補と
なる漢字熟語を出力させることにより確認する。ここで
は、”ｇｏｎｇｓｉ”の候補として”工死”が変換辞書
８及び学習辞書９に登録されていなものとする。

【００６５】次に、オペレータが、表示された候補とな
る漢字熟語を確定して入力処理を行うか否かを決める。
すなわち、選択された漢字熟語が表示された状態で（実
行）キーを押すかどうか決めることになるが（ステップ
Ｓ６）、ここでは”工死”が表示されないので、入力処
理を行わない。そして、その他の処理として、文節の区
切り位置の変更が行われる（ステップＳ７）。

【００６６】なお、確定入力処理が行われない場合に
は、その他の処理として、発音記号列の変更を行ってス
テップＳ２の漢字変換処理に戻る処理などが行われる場
合もある。ここでは、”ｇｏｎｇｓｉ”が一つの漢字熟
語、すなわち一つの文節として”公私”に変換された状
態となっているが、図５（Ｃ）に示すようにこの実施例
において文節変更を示す（ＥＳＣ）キーと矢印キーとを
入力することにより、文節の区切り位置を”公”と”
私”との間とする。

【００６７】次に、ステップＳ５に戻り、最初の文節で
ある”公”を指定した状態で、図５（Ｄ）に示すように
（変換）キーを入力して再変換を行う。この際には、図
６（Ｂ）に示すように、上記ワークメモリ７の検索発音
記号領域ＰＹの”ｇｏｎｇｓｉ”が最初の文節の発音記
号列となる”ｇｏｎｇ”に更新され、”ｇｏｎｇ”に対
応する漢字熟語が変換辞書８及び学習辞書９から検索さ
れる。

【００６８】そして、”ｇｏｎｇ”に対して”工”が検
索された場合には、候補表示情報領域ＳＣに”公私”に
変えて”工私”が格納される。そして、候補表示情報領
域ＳＣに格納された”工私”が図５（Ｄ）に示すように
表示部４に表示される。

【００６９】なお、”ｇｏｎｇ”に対して”工”が第一
候補として検索されない場合は、（変換）キーを再度入
力して、”ｇｏｎｇ”に対して変換辞書８もしくは学習
辞書９に登録されている”工”を検索する。この段階で
は、まだ、入力すべき”工死”が表示されていないの
で、確定処理を行わずその他の処理として、表示され
た”工私”の二つめの文節である”私”を指定し、、図
５（Ｅ）に示すように（変換）キーを入力して再変換を
行う。

【００７０】この際には、図６（Ｃ）に示すように、上
記ワークメモリ７の検索発音記号領域ＰＹの”ｇｏｎ
ｇ”が二番目の文節の発音記号列となる”ｓｉ”に更新
され、”ｓｉ”に対応する漢字熟語が変換辞書８及び学
習辞書９から検索される。そして、上記”工”の場合と
同様に、”ｓｉ”に対して”死”が検索された場合に
は、候補表示情報領域ＳＣに”工私”に変えて”工死”
が格納される。

【００７１】そして、候補表示情報領域ＳＣに格納され
た”工死”が図５（Ｅ）に示すように表示部４に表示さ
れる。ここで、入力すべき”工死”が表示部４上に表示
されたので、図５（Ｆ）に示すように（実行）キーを入
力することにより、”工死”を確定して入力する確定入
力処理を行う（ステップＳ８）。

【００７２】この際には、図６（Ｃ）に示すように、ワ
ークメモリ７の確定入力時候補情報領域Ｔ２に、”ｇｏ
ｎｇｓｉ”に対して確定された漢字列である”工死”が
格納される（ステップＳ９）。また、確定入力時文節情
報Ｗ２に確定された漢字列の文節毎の文字数が登録され
る。”工死”の場合には、文節”工”と文節”死”との
一文字の文節が二つあるので、図５（Ｆ）に示すよう
に、”工死”が確定し、図６（Ｃ）に示すように確定入
力時文節情報Ｗ２に１、１が格納される。

【００７３】次に、一括学習処理を行う。まず、初期変
換候補領域Ｔ１及び初期変換文節情報領域Ｔ２に登録さ
れた漢字列と各文節の文字数とから、初期変換時の漢字
列の文節区切り位置を求める。ここでは、登録された漢
字列が公私であり、文字数２の文節が一つとなる。ま
た、確定入力時候補領域Ｔ１及び確定入力時文節情報領
域Ｔ２に登録された漢字列と各文節の文字数とから、確
定された漢字列の文節の区切り位置を求める。

【００７４】ここでは、確定された漢字列が”工死”で
あり、文字数１の文節が二つとなる。すなわち、文節の
区切り位置を：で示した場合、初期変換時と確定入力時
では以下のようになる。

【００７５】：公私：：工：死：次に、初期変換時と確定入力時とで共通する文節区切り
位置を共通区切り位置とする（ステップＳ１０）。上
記”公私”と”工死”とにおいては、一文字目の前と二
文字目の後が共通区切り位置となる。ここで、上記ステ
ップＳ１０の処理をもう少し一般化して説明すると以下
のようになる。

【００７６】まず、ワークメモリ７の入力バッファに発
音記号列として、”--------------------------------
--”が格納され、初期変換候補情報領域Ｔ１に”ＡＢＣ
ＤＥＦＧＨＩＪＫＬ”が格納され、初期変換文節情報領
域Ｗ１に”２、２、３、５”が格納され、確定入力時候
補情報領域Ｔ２に”ＡＭＮＯＰＱＲＳＴＵＶＷ”が格納
され、確定入力時文節情報領域Ｗ２に”２、３、２、
３、２”が格納されたものとする。

【００７７】なお、”-”は仮に発音記号を示し、大文
字のアルファベットは仮に漢字を示すものとする。ここ
で、文節の区切り位置を：で示した場合には、ワークメ
モリ７に格納された各情報を以下のように示すことがで
きる。

【００７８】初期変換時：ＡＢ：ＣＤ：ＥＦＧ：ＨＩＪＫＬ：：------：------：----------：------------------：確定入力時：ＡＭ：ＮＯＰ：ＱＲ：ＳＴＵ：ＶＷ：：------：----------：------：----------：------：共通区切り位置：：：：この場合には、上記文節区切り位置のうち初期変換時と
確定入力時とで位置が一致するものが共通区切り位置と
される。

【００７９】そして、上記初期変換時の漢字列と確定入
力時の漢字列とを上記共通区切り位置で分割し、各分割
部分が初期変換時と確定入力時とで一致するか否かを順
次先頭の分割部分から判定する（ステップＳ１１）。

【００８０】上記”ｇｏｎｇｓｉ”の場合には、”公
私”が初期変換時の分割部分とされ、”工死”が確定入
力時の分割部分とされるので、一致しないことになる。
そして、分割部分が初期変換時と確定入力時とで一致し
ない場合（ステップＳ１２）には、確定入力時の上記共
通区切りによる分割部分の読みである発音記号列と、漢
字列と、文節区切り位置とを学習情報として、学習辞書
９に登録する（ステップＳ１３）。

【００８１】また、共通分割部分が初期変換時と確定入
力時とで一致する場合には、次の分割部分、すなわち残
りのデータが有るか否かを判定し（ステップＳ１４）、
ある場合には、ステップＳ１２に戻る。そして、入力さ
れた発音記号列の全ての共通分割部分について、初期変
換時と確定入力時とで漢字列が一致するか否かを判定す
るとともに、一致した場合に、確定入力時の上記共通分
割部分の発音記号列と、漢字列と、文節区切り位置とを
記憶する処理を行う。

【００８２】なお、図３に示すように、発音記号列（発
音記号）と、漢字列（漢字表示）と、文節区切り位置
（文節情報）は互いに対応して学習辞書９に登録され
る。すなわち、上記”工死”の場合の学習情報は、発音
記号列として”ｇｏｎｇｓｉ”、漢字列として”工
死”、文節区切り位置として”１、１”が登録される。

【００８３】なお、上記学習辞書９への登録処理におい
ては、初期変換時に、例えば、”ｇｏｎｇｓｉ”が公私
と変換され、オペレータにより再変換が行われ、”ｇｏ
ｎｇｓｉ”に対応する別の同音漢字熟語、例えば、”公
司”が選択されて確定入力された場合には、学習辞書９
に、発音記号列として”ｇｏｎｇｓｉ”、漢字列とし
て”公司”、文節区切り位置として”２”が登録される
ことになる。

【００８４】この場合には、従来と同様の同音語学習が
行われることになる。すなわち、本実施例においては、
従来と同様の同音語学習が行われるとともに、”工死”
の場合のように、複数の文節からなる漢字列が一つの文
節からなる漢字熟語と同様に登録され、かつ、文節区切
り位置も登録される。

【００８５】そして、中国語用漢字変換装置において、
図５（Ｇ）に示すように、再び発音記号列として”ｇｏ
ｎｇｓｉ”が入力された（ステップＳ１）場合には、ス
テップＳ２において、漢字変換処理が行われる際に、学
習辞書９の学習情報が利用されることになる（ステップ
Ｓ２ａ）。

【００８６】すなわち、漢字変換処理において、学習辞
書９から発音記号列”ｇｏｎｇｓｉ”が検索され、”工
死”と文節区切り位置”１、１”が検出される。そし
て、図５（Ｈ）に示すように、変換辞書８に登録された
二文字の公私等の漢字熟語よりも学習辞書９に登録され
た二文字の”工死”が優先して表示されるとともに、文
節区切り位置が”工”と”死”との間とされる。

【００８７】従って、従来のように、”工”と”死”と
が別々に同音語学習され、”工死”が学習されないこと
により、”ｇｏｎｇｓｉ”を再び入力した場合に、学習
辞書に”ｇｏｎｇ（工）”と”ｓｉ（死）”とが登録さ
れ、”ｇｏｎｇ”に対して”工”が検索可能な場合で
も、変換辞書の”ｇｏｎｇｓｉ（公私）”の方が文字数
が長いことから、変換辞書８に登録された”ｇｏｎｇｓ
ｉ”の第一候補である”公私”が出力されるような事態
を防止することができる。

【００８８】なお、上記処理においては、文節区切り位
置も記憶されているので、オペレータがもし、再変換を
行った場合には、”ｇｏｎｇ”もしくは”ｓｉ”のどち
らか指定された方の同音漢字熟語が再変換されることに
なり、どちらか一方だけを変換したい場合や、変換辞書
８において”ｇｏｎｇｓｉ”対応する二字の漢字熟語の
中に、入力すべき漢字熟語が無い場合に、変換効率を向
上することができる。

【００８９】次に、図７及び図８に示す別の発音記号列
の場合について説明する。まず、中国語用漢字変換装置
に、図７（Ａ）に示すように、”不董事”に対応する発
音記号列”ｂｕｄｏｎｇｓｈｉ”が入力される。な
お、”不董事”の”董”は、実際には、図７（Ｆ）に示
すように「りっしんべん」を有するものであるが、明細
書上では日本語に該当する漢字がないので、”董”とし
た。

【００９０】この際には、図８（Ａ）に示すように、ワ
ークメモリ７の入力バッファ領域ＩＢに”ｂｕｄｏｎｇ
ｓｈｉ”が登録される。そして、図（Ｂ）に示すよう
に、（変換）キーを入力した場合には、”ｂｕｄｏｎｇ
ｓｈｉ”を変換辞書及び学習辞書から検索する。この場
合には、発音記号列”ｂｕｄｏｎｇｓｈｉ”の先頭から
できるだけ長い漢字数の漢字熟語に対応する部分が優先
して検索されることになる。

【００９１】ここでは、”ｂｕｄｏｎｇｓｈｉ”に対応
する漢字熟語が変換辞書８にも学習辞書９にも登録され
ていなかったものとする。そして、変換辞書８及び学習
辞書９に登録され、”ｂｕｄｏｎｇｓｈｉ”の先頭部分
を含む任意の文字数の漢字列の中で最も長いものとして
は、”ｂｕｄｏｎｇ”に対応する第一候補として”不
動”が登録されているものとする。この際には、ワーク
メモリ７の検索発音記号領域ＰＹに”ｂｕｄｏｎｇ”が
格納され、”不動”が検出される。

【００９２】また、残りの”ｓｈｉ”に対応する漢字熟
語の第一候補として、変換辞書８もしくは学習辞書９か
ら”是”が検出されるものとする。この場合には、候補
表示情報領域ＳＣに”不動是”が格納され、表示部に図
７（Ｂ）に示すように”不動是”が表示される。

【００９３】また、初期変換候補情報領域Ｔ１に、上
記”不動是”が格納されるとともに、初期変換文節情報
領域Ｗ１に、文節の区切り位置を示す”２，１”が格納
される。次に、オペレータは、初期変換時の文節の区切
り位置が異なるので、図７（Ｃ）に示すように（ＥＳ
Ｃ）キーを入力して、文節区切り位置変更モードとし
て、矢印キーにより、文節区切り位置を”不”（ｂｕ）
と”動是（ｄｏｎｇｓｈｉ）”との間とする。

【００９４】そして、”不”の文節は、入力すべき漢字
列と一致するので、”不”を指定した状態で、図７
（Ｄ）のように（実行）キーを入力することにより、”
不”を確定する。次いで、”動是”の文節を指定した状
態で、図７（Ｅ）に示すように（変換）キーを入力する
ことにより、再変換を行う。

【００９５】この際には、図８（Ｂ）に示すように、検
索発音記号領域ＰＹに”ｄｏｎｇｓｈｉ”が格納さ
れ、”ｄｏｎｇｓｈｉ”が変換辞書８及び学習辞書９か
ら検索される。そして、ここでは、”ｄｏｎｇｓｈｉ”
に対する第一候補として”董事”が検出されたものとす
る。

【００９６】この場合には、図８（Ｂ）に示すように上
記”不”と”董事”とを合わせた”不董事”が候補表示
情報領域ＳＣに格納され、図７（Ｅ）に示すように”不
董事”が表示部４に表示される。そして、図７（Ｆ）に
示すように（実行）キーを入力することにより、”董
事”が確定され、先に確定された”不”と合わせて”不
董事”が確定入力される。この際には、図（Ｃ）に示す
ように確定入力時候補情報領域Ｔ２に”不董事”が格納
され、確定入力時文節情報Ｗ２に文節区切り位置を文字
数で示すものとして”１、２”が格納される。

【００９７】ここで、初期変換時のデータと確定入力時
のデータを比較すると、以下のようになる。

【００９８】：不動：是：：不：董事：この場合には、上記共通分割部分が、”ｂｕｄｏｎｇｓ
ｈｉ”全体となるので、学習情報は、発音記号列とし
て”ｂｕｄｏｎｇｓｈｉ”、漢字列として”不董事”、
文節位置として”１，２”となり、これが学習辞書９に
図３に示すように登録される。

【００９９】次に、図７（Ｇ）に示すように再び”ｂｕ
ｄｏｎｇｈｓｉ”を入力した場合には、学習辞書９に登
録された学習情報として、”ｂｕｄｏｎｇｓｈｉ”、”
不董事”、”１，２”が検出され、図７（Ｈ）に示すよ
うに初期変換により”不董事”が表示されることにな
る。また、この際の文節区切り位置は、”不”と”董
事”との間となる。

【０１００】すなわち、上記”工死”の場合と同様に複
数の文節からなる”不董事”が同音語学習され、複数の
文節のまま”ｂｕｄｏｎｇｈｓｉ”の第一候補となる。

【０１０１】この際には、通常の変換では、文字数の多
い候補が優先されるので、変換辞書８もしくは学習辞書
９に”不動（ｂｕｄｏｎｇ）”が登録されていれば、文
節区切り位置が二文字目と三文字目との間となるが、上
述のように学習辞書に”不董事（ｂｕｄｏｎｇｈｓ
ｉ）”が登録されているので、文字数が多いとともに学
習辞書９に登録されているということで、”不董事”が
優先的に表示されととともに、文節位置が上述のように
なる。

【０１０２】以上のように、この実施例の中国語用漢字
変換装置及び中国語用漢字変換方法によれば、上述のよ
うに、初期変換時と確定入力時とで、文節区切り位置の
変更がない場合、もしくは文節区切り位置が一致する文
節部分においては、学習辞書９に登録された漢字列が優
先されるので、従来の同音語学習と同様の作用効果を奏
することができる。

【０１０３】また、初期変換時から文節区切り位置を変
更した場合には、上述のよう共通分割部分内の複数の文
節がグループ化された状態で学習辞書に登録されるの
で、複数の文節からなる漢字列を一つの漢字熟語として
検索することが可能となる。

【０１０４】従って、任意の発音記号列を変換した場合
に文字数の長い漢字熟語を優先するものとしても、初期
変換時に一つの文節からなる漢字列に変換されたものを
確定入力時に複数の文節からなる漢字列に変換して確定
した場合に、従来の同音語学習のように、文節の文字数
の多い漢字列が優先され、初期変換時の漢字列が第一候
補とされるようなことがなく、複数の文節からなる漢字
列が、一つの文節の漢字列と同様の同音語学習の対象と
なり、二度目以降に同様の発音記号列を入力した場合に
は、複数の文節からなる漢字列が優先される。

【０１０５】また、この処理は、一種の未知語（辞書に
登録されていない漢字）登録としても作用する。すなわ
ち、辞書に登録されていない漢字熟語を、一文字の単漢
字熟語等から再構成するように、入力すべき未知語の初
期変換される発音記号列を複数の文節に区切り、各文節
において再変換を行い、漢字を選択していくことによ
り、上記未知語と同様の漢字列を確定入力した場合に
は、最初に入力された発音記号列と、上記未知語の漢字
列とが学習辞書９に登録されることになる。従って、上
記発音記号列を再び入力した場合には、変換辞書８に登
録されていない未知語を学習辞書９に基づいて一回の変
換により入力することが可能となる。

【０１０６】また、上記”不動是”と”不董事”との場
合のように、新たに文節区切り位置を設定するのではな
く、文節区切り位置を変更した場合には、文節区切り位
置の変更が学習されることになり、上述の不定詞の不が
一文字目にくるような場合に、一度確定入力された漢字
列においては、不の部分で文節が区切られるようにな
り、より中国語の文法に即した変換が可能となる。

【０１０７】以上のように、この実施例の中国語用漢字
変換装置及び中国語用漢字変換方法においては、確定時
結果に文節区切りがある場合に、文節毎の同音語学習に
代えて、上述のような未知語学習や文節区切り位置学習
が可能な複数の文節を一つの文節と同様に同音語学習す
るとともに、文節区切り位置を学習する機能を備えてい
るので、変換効率を向上することができる。

【０１０８】特に、複数の文節を一括して同音語学習す
ることにより、漢字列を文節単位で解析するのではな
く、文節の前後関係に基づいて解析するのと同様の状態
となり、変換効率の飛躍的向上を図ることが可能とな
る。なお、上記実施例では、声調記号なしの発音記号を
用いるものとしたが、声調記号有りの発音記号を用いる
ものとしても良い。

【０１０９】

【発明の効果】上記請求項１記載の中国語用漢字変換装
置によれば、確定された複数の文節からなる漢字列にお
いて同音語学習を行う際に、文節毎に学習を行うのでは
なく、複数の文節からなる漢字列を一つの漢字列として
学習することが可能なので、上述のように辞書に登録さ
れた文字数の長い漢字列を優先して文節を区切るように
しても、従来のように、入力される発音記号列に対して
一つの漢字列が登録された状態で、上記発音記号列に対
して複数の文節からなる漢字列を繰り返し入力する際
に、文節の区切り位置を変更する必要がなく、中国語の
漢字変換における変換効率の向上とそれに伴う漢字入力
の迅速化を図ることができる。

【０１１０】また、上記請求項２記載の中国語用漢字変
換装置によれば、複数の文節からなる漢字列を一つの漢
字列として学習する際に、文節区切り位置も学習され、
学習された複数の文節からなる漢字列を出力する際に、
漢字列を文節毎に区切った状態で出力することができる
ので、出力された漢字列の一部の文節だけ再変換する必
要がある場合に、変換効率を向上することができる。

【０１１１】また、上記請求項３記載の中国語用漢字変
換装置によれば、確定された漢字列が初期変換時の文節
よりも短く分割されることがなく、適度な長さの漢字列
に分割されて辞書に登録されることになり、発音記号列
に対応する辞書に登録された最も長い漢字列に基づいて
文節を区切るようにしても、学習結果による変換率の向
上を図ることができる。

【０１１２】また、初期変換時の文節区切り位置と、確
定された漢字列の文節区切り位置とで位置が異なる文節
区切り位置がある場合に、確定入力時の文節区切り位置
で区切られた前後の文節は、一つの漢字列として辞書に
登録されることになり、文節区切り位置も辞書に登録す
る場合に、初期変換時に対して確定入力時に位置が変更
された文節区切り位置だけが辞書に登録されることにな
り、文節区切り位置の学習を効率化することができる。

【０１１３】上記請求項４記載の中国語用漢字変換方法
によれば、上記請求項２記載の中国語変換装置と同様
に、変換効率の向上を図ることができる。

【０１１４】上記請求項５記載の中国語用漢字変換方法
によれば、上記請求項３記載の中国語変換装置と同様
に、効率的に文節区切り位置の学習が行えるとともに、
変換効率の向上を図ることができる。

【図面の簡単な説明】

【図１】本発明の一実施例の中国語用漢字変換装置の基
本構成を示すブロック図である。

【図２】上記実施例の中国語用漢字変換装置のワークメ
モリを説明するための図面である。

【図３】上記実施例の中国語用漢字変換装置の学習辞書
を説明するための図面である。

【図４】上記中国語用漢字変換装置における中国語用漢
字変換方法を説明するためのフローチャートである。

【図５】上記中国語用漢字変換装置における漢字変換操
作を説明するための図面である。

【図６】上記中国語用漢字変換装置のワークメモリにお
けるデータの格納状態を説明するための図面である。

【図７】上記中国語用漢字変換装置における漢字変換操
作を説明するための図面である。

【図８】上記中国語用漢字変換装置のワークメモリにお
けるデータの格納状態を説明するための図面である。

【符号の説明】

１キー入力部（入力手段、指示手段、確定手段）２ＣＰＵ（変換手段、学習手段）８変換辞書（辞書）９学習辞書（辞書）

Claims

【特許請求の範囲】

【請求項１】発音記号列に対応して漢字列が登録され
た辞書と、漢字列の発音を示す発音記号列を入力する入力手段と、上記辞書に基づいて入力された発音記号列を文節毎に漢
字列に変換して出力する変換手段と、文節区切り位置の変更及び上記変換手段による再変換、
一つの発音記号列に対応する同音の複数の漢字列からの
選択等の操作を指示する指示手段と、変換された漢字列を確定する確定手段と、入力された発音記号列及び該発音記号列に対して確定さ
れた漢字列を対応させて辞書に登録する学習手段とを具
備してなり、上記学習手段は、確定時に複数の文節からなる漢字列を
一つの漢字列として上記辞書に登録可能とされ、上記変換手段は、上記辞書に基づいて入力された発音記
号列を漢字列に変換する際に、上記発音記号列に対応
し、かつ、上記学習手段により登録された漢字列が上記
辞書に登録されている場合に、上記学習手段により登録
された漢字列を優先して出力させることを特徴とする中
国語用漢字変換装置。
【請求項２】上記学習手段は、複数の文節からなる漢
字列を一つの漢字列として辞書に登録する際に、上記漢
字列とともにその文節の区切り位置を上記辞書に登録
し、上記変換手段は、入力された発音記号列を複数の文節か
らなる漢字列に変換する際に、上記漢字列に対応して上
記辞書に登録された文節区切り位置で上記漢字列を区切
った状態とすることを特徴とする請求項１記載の中国語
用漢字変換装置。
【請求項３】上記学習手段は、上記変換手段の最初の
変換時の文節区切り位置と、上記確定手段に確定された
漢字列の文節区切り位置とで位置が一致する文節区切り
位置を共通区切り位置とするとともに、確定された漢字
列を上記共通区切り位置で分割し、各分割部分をそれぞ
れ一つの漢字列として辞書に登録することを特徴とする
請求項１または２記載の中国語用漢字変換装置。
【請求項４】入力される発音記号列を、発音記号列と
漢字列とが対応させられて登録された辞書に基づいて漢
字列に変換する中国語用漢字変換装置における中国語用
漢字変換方法であって、入力された発音記号列により上記辞書を検索して文節毎
に漢字列に変換された候補漢字列を出力し、上記候補漢字列と入力すべき漢字列とが異なる場合に、
文節区切り位置の変更及び候補漢字列の再出力、一つの
発音記号列に対応する同音の複数の漢字列からの選択等
の操作により候補漢字列を確定し、確定された漢字列を学習するために、入力された発音記
号列と確定された漢字列とを対応させて上記辞書に登録
するに際し、複数の文節からなる漢字列を一つの漢字列
として登録するとともに、上記漢字列の文節区切り位置
を登録し、上記発音記号列が再び入力された際に、上記辞書に登録
された複数の文節からなる漢字列を文節毎に区切った状
態で候補漢字列として出力することを特徴とする中国語
用漢字変換方法。
【請求項５】入力された発音記号列と確定された漢字
列とを対応させて辞書に登録するに際し、最初に出力さ
れた候補漢字列の文節区切り位置と、確定された漢字列
の文節区切り位置とで位置が一致する文節区切り位置を
共通区切り位置とするとともに、入力された発音記号列
及び確定された漢字列を上記共通区切り位置で分割し、
各分割部分毎に発音記号列と漢字列とを対応させて辞書
に登録することを特徴とする請求項４記載の中国語用漢
字変換方法。