JPH096761A - 中国語用漢字変換装置及び中国語用漢字変換方法 - Google Patents

中国語用漢字変換装置及び中国語用漢字変換方法

Info

Publication number
JPH096761A
JPH096761A JP7181099A JP18109995A JPH096761A JP H096761 A JPH096761 A JP H096761A JP 7181099 A JP7181099 A JP 7181099A JP 18109995 A JP18109995 A JP 18109995A JP H096761 A JPH096761 A JP H096761A
Authority
JP
Japan
Prior art keywords
kanji
string
dictionary
phonetic symbol
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7181099A
Other languages
English (en)
Inventor
Takeshi O
斌 王
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP7181099A priority Critical patent/JPH096761A/ja
Priority to CN 96107169 priority patent/CN1100301C/zh
Publication of JPH096761A publication Critical patent/JPH096761A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 複数の文節に対しても一つの文節と同様に同
音語学習を行うようにすることで、中国語の漢字変換入
力における変換効率の向上を図ることである。 【構成】 キー入力部1から入力すべき漢字列の発音を
示す発音記号列を入力する。CPU2が変換辞書8及び
学習辞書9を参照して発音記号列を文節毎に候補となる
漢字列に変換する。候補の漢字列と入力すべき漢字列が
異なる場合、キー入力部1からCPU2に文節区切り位
置の変更や再変換等を指示する。候補となる漢字列と入
力すべき漢字列とが一致した場合にキー入力部1から確
定入力を指示する。CPU2が確定された複数の文節か
らなる漢字列とその発音記号列と文節区切り位置を一つ
の漢字列として学習辞書に登録する。再び同じ発音記号
列が入力された場合に、上記学習辞書の複数の文節から
なる漢字列を第一候補として出力するとともに、登録さ
れた文節区切り位置で区切った状態とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、中国語の入力処理にお
いて、発音記号を入力可能なキーボードから入力された
発音記号列を漢字に変換する中国語用漢字変換装置及び
中国語用漢字変換方法に関する。
【0002】
【従来の技術】一般に、中国語の文字の入力処理におい
ては、アルファベットで構成される発音記号(ピンイ
ン)列を入力し、入力された発音記号列に対応する漢字
を辞書から検索して出力するようになっている。すなわ
ち、日本語の文字の入力処理とほぼ同様に、中国語の文
字の入力処理においては、入力された発音記号列を漢字
に変換する漢字変換装置(いわゆるFEP(front end
processor))が必要となる。
【0003】従来、中国語用の漢字変換装置において、
複数の漢字熟語からなる漢字列に対応する発音記号列を
入力した後に、一括して変換処理を行った場合には、辞
書を検索して、発音記号列の先頭から対応する漢字熟語
に順次変換するようになっている。
【0004】この際には、まず、発音記号列の任意の長
さの先頭部分に対応する漢字熟語を辞書から検索する。
そして、複数の漢字熟語が検索され、かつ、検索された
漢字熟語の文字数が異なる場合には、文字数が最も多い
長い漢字熟語が優先的に選択される。そして、上記発音
記号列の選択された漢字熟語に対応する先頭部分が一つ
の文節とされる。
【0005】次いで、上記発音記号列から検索された漢
字熟語に対応する先頭部分を除いた発音記号列におい
て、上述のような処理を行うとともに、発音記号列の全
ての部分を漢字に変換するまで上述の処理が繰り返し行
われる。
【0006】すなわち、複数の漢字熟語からなる漢字列
に対応する発音記号列を一括変換した場合には、発音記
号列が複数の文節に分割されるとともに、各文節が漢字
熟語に変換されることになる。
【0007】また、発音記号列の一つの文節に対して複
数の漢字熟語が選択された場合、すなわち、同音漢字熟
語が存在する場合には、オペレータが複数の漢字熟語か
ら一つの漢字熟語を選択して一つの文節に対応する一つ
の漢字熟語を確定するようになっている。
【0008】また、上記漢字変換装置においては、同音
語学習機能として、上記文節に対応する一つの漢字熟語
を確定した際に、上記文節を構成する発音記号列と漢字
熟語とを定義づけて辞書に学習情報として登録するよう
になっており、次に、同じ発音記号列からなる文節が入
力された際には、前に確定されて学習情報として登録さ
れた漢字熟語が第一候補として出力されるようになって
いる。例えば、発音記号列として”gong si”を
漢字変換装置に入力した場合には、辞書が検索されて以
下の二つの漢字熟語が出力されるものとする。
【0009】1.公司 2.公私 この際に、辞書においては、”公司”の方が優先的に登
録されているので、漢字変換装置は、まず”公司”を出
力する。
【0010】しかし、実際に入力したい漢字熟語が”公
私”であった場合には、オペレータがさらに候補となる
漢字熟語を出力させるように指示し、”公私”が出力さ
れたところで、入力される漢字熟語を”公私”に確定す
る。この際に、同音語学習機能により、”gong s
i”に対応する漢字熟語として”公私”を優先するとい
う学習情報が辞書に登録される。
【0011】従って、次に、再び、発音記号列として”
gong si”を入力した際には、漢字変換装置にお
いて、まず、”公私”が出力されることになる。そし
て、入力すべき漢字熟語が”公私”の場合には、このま
ま”公私”を確定すれば良いので、例えば、同じ文書内
で同じ言葉を多用するような場合に、変換効率を向上さ
せることができる。
【0012】なお、上記漢字変換装置において、発音記
号列が文節に分割されることになるが、意図した文節の
区切り位置と異なる位置で文節に分割され、各文節に対
応する漢字熟語が出力された場合には、オペレータが文
節の区切り位置を変更し、変換処理を再び行う必要があ
る。また、中国語の発音においては、同じアルファベッ
トの発音記号で表される言葉でも、発音する際の音程の
上げ下げにより意味が異なる言葉となり、この言葉に対
応する漢字も異なるものとなっている。
【0013】従って、中国語の発音記号には、上述のア
ルファベットで示される発音記号に、発音する際の音程
の上げ下げを示す声調記号が付されている。そして、漢
字変換装置において、アルファベットの発音記号ととも
に声調記号を入力するものとすれば、同音異義語を減ら
して変換効率の向上を図ることができるが、キーボード
から声調記号のついた発音記号を入力するものとした場
合には、中国語の発音記号用のキーボードが必要となる
とともに、入力速度が低下することになる。
【0014】上述の漢字変換方法は、声調記号のない発
音記号を用いた場合の例である。また、上記漢字熟語と
は、辞書に登録された一つの発音記号列に対する一つの
漢字列であり、必ずしも日本の熟語と同一ものではな
く、例えば、辞書において、一つの発音記号列に対して
一文字の漢字が登録されていた場合には、この漢字一文
字も漢字熟語となる。
【0015】
【発明が解決しようとする課題】ところで、中国語にお
いては、一つの発音記号列で表される同音漢字熟語が多
い。すなわち、上記漢字変換装置の辞書においては、一
文字からなる多数の単漢字熟語が登録されており、発音
記号列の数に対して多数の漢字熟語が存在し、多くの同
音漢字熟語が登録されている。
【0016】従って、一つの文章において、二度同じ発
音記号列を入力した場合に、同じ発音記号列であっても
前の発音記号列と後の発音記号列とでは違う漢字熟語が
対応する可能性が高い。そこで、上記同音学語習機能に
より、前の発音記号列に対して確定された漢字熟語を、
後の発音記号列の変換の際に優先的に出力しても、優先
的に出力された漢字熟語が採用されない場合が多々ある
ことになり、同音語学習機能による変換効率の向上の効
果が少ない。
【0017】また、上述のように文字数の多い漢字熟語
を優先して文節の区切り位置が決められ、あとから文節
の区切り位置を変更して文字数の少ない漢字熟語を確定
した場合に、同音語学習機能があまり機能しないといっ
た問題点がある。例えば、発音記号列”yizhi”で
表される辞書に登録されていない漢字熟語”一只”を入
力するものとする。
【0018】そして、辞書には、”yizhi”に対応
する二字の漢字熟語”意志”が登録されているものとす
る。この場合には、漢字変換装置に発音記号列”yiz
hi”を入力すると、単漢字熟語よりも長い二字の漢字
熟語が優先するので、”yizhi”が一つの文節とさ
れて”意志”が候補漢字熟語として出力される。
【0019】ここでオペレータは、文節の区切り位置
を”意(yi)”と”志(zhi)”との間とする。そ
して、”yi”に対する候補漢字熟語から”一”を選択
するとともに、”zhi”に対する候補漢字熟語から”
只”を選択して、”一只”を確定する。
【0020】この際には、上記同音語学習機能によ
り、”yi”に対して”一”が優先される漢字熟語とさ
れ、”zhi”に対して”只”が優先される漢字熟語と
される。
【0021】ここで再び、発音記号列”yizhi”を
入力すると、単漢字熟語よりも長い二字の漢字熟語が優
先するので、”yizhi”が一つの文節とされて”意
志”が候補漢字熟語として出力されてしまうことにな
り、オペレータは再び文節の区切り位置を変更すること
になる。
【0022】従って、文節の区切り位置を変更した後
の”yi”、”zhi”に対する”一”、”只”の選択
に関しては同音語学習機能が作用するが、文節の区切り
位置の変更を省略することができず、変換効率の大幅な
向上を望むことができない。
【0023】本発明の課題は、複数の文節に対しても一
つの文節と同様に同音語学習を行うようにすることで、
中国語の漢字変換入力における変換効率の向上を図るこ
とである。
【0024】
【課題を解決するための手段】本発明の請求項1記載の
中国語用漢字変換装置は、発音記号列に対応して漢字列
が登録された辞書と、漢字列の発音を示す発音記号列を
入力する入力手段と、上記辞書に基づいて入力された発
音記号列を文節毎に漢字列に変換して出力する変換手段
と、文節区切り位置の変更及び上記変換手段による再変
換、一つの発音記号列に対応する同音の複数の漢字列か
らの選択等の操作を指示する指示手段と、変換された漢
字列を確定して入力する確定手段と、入力された発音記
号列及び該発音記号列に対して確定された漢字列を対応
させて辞書に登録する学習手段とを具備してなり、上記
学習手段は、確定時に複数の文節からなる漢字列を一つ
の漢字列として上記辞書に登録可能とされ、上記変換手
段は、上記辞書に基づいて入力された発音記号列を漢字
列に変換する際に、上記発音記号列に対応し、かつ、上
記学習手段により登録された漢字列が上記辞書に登録さ
れている場合に、上記学習手段により登録された漢字列
を優先して出力することを特徴とする。
【0025】本発明の請求項2記載の中国語用漢字変換
装置は、上記学習手段が、複数の文節からなる漢字列を
一つの漢字列として辞書に登録する際に、上記漢字列と
ともにその文節の区切り位置を上記辞書に登録し、上記
変換手段が、入力された発音記号列を複数の文節からな
る漢字列に変換する際に、上記漢字列に対応して上記辞
書に登録された文節区切り位置で上記漢字列を区切った
状態とすることを特徴とする。
【0026】本発明の請求項3記載の中国語用漢字変換
装置は、上記学習手段が、上記変換手段の最初の変換時
の文節区切り位置と、上記確定手段に確定された漢字列
の文節区切り位置とで位置が一致する文節区切り位置を
共通区切り位置とするとともに、確定された漢字列を上
記共通区切り位置で分割し、各分割部分をそれぞれ一つ
の漢字列として辞書に登録することを特徴とする。
【0027】本発明の請求項4記載の中国語用漢字変換
方法は、入力される発音記号列を、発音記号列と漢字列
とが対応させられて登録された辞書に基づいて漢字列に
変換する中国語用漢字変換装置における中国語用漢字変
換方法であって、入力された発音記号列により上記辞書
を検索して文節毎に漢字列に変換された候補漢字列を出
力し、上記候補漢字列と入力すべき漢字列とが異なる場
合に、文節区切り位置の変更及び候補漢字列の再出力、
一つの発音記号列に対応する同音の複数の漢字列からの
選択等の操作により候補漢字列を確定し、確定された漢
字列を学習するために、入力された発音記号列と確定さ
れた漢字列とを対応させて上記辞書に登録するに際し、
複数の文節からなる漢字列を一つの漢字列として登録す
るとともに、上記漢字列の文節区切り位置を登録し、上
記発音記号列が再び入力された際に、上記辞書に登録さ
れた複数の文節からなる漢字列を文節毎に区切った状態
で候補漢字列として出力することを特徴とする。
【0028】本発明の請求項5記載の中国語用漢字変換
方法は、入力された発音記号列と確定された漢字列とを
対応させて辞書に登録するに際し、最初に出力された候
補漢字列の文節区切り位置と、確定された漢字列の文節
区切り位置とで位置が一致する文節区切り位置を共通区
切り位置とするとともに、入力された発音記号列及び確
定された漢字列を上記共通区切り位置で分割し、各分割
部分毎に発音記号列と漢字列とを対応させて辞書に登録
することを特徴とする。
【0029】
【作用】上記請求項1記載の構成によれば、確定された
複数の文節からなる漢字列において同音語学習を行う際
に、文節毎に学習を行うのではなく、複数の文節からな
る漢字列を一つの漢字列として学習することが可能なの
で、上述のように辞書に登録された文字数の長い漢字列
を優先して文節を区切るようにしても、同音語学習され
た漢字列が優先的に出力される。例えば、上述のように
発音記号列”yizhi”で表される辞書に登録されて
いない漢字熟語”一只”を入力するものとする。
【0030】そして、辞書には、”yizhi”に対応
する二字の漢字熟語”意志”が登録されているものとす
る。この場合には、漢字変換装置に発音記号列”yiz
hi”を入力すると、単漢字熟語よりも長い二字の漢字
熟語が優先するので、”yizhi”が一つの文節とさ
れて”意志”が候補漢字熟語として出力される。ここで
オペレータは、文節の区切り位置を”意(yi)”と”
志(zhi)”との間とする。
【0031】そして、”yi”に対する候補漢字熟語か
ら”一”を選択するとともに、”zhi”に対する候補
漢字熟語から”只”を選択して、”一只”を確定する。
この際には、本発明の同音語学習機能により、発音記号
列”yizhi”に対して上記のように二つの文節から
なる”一只”が一つの漢字列として辞書に登録される。
【0032】ここで再び、発音記号列”yizhi”を
入力すると、”yizhi”に対して単漢字熟語よりも
長い二字の漢字熟語が優先して検索される。この際に、
二文字の”一只”が一つの漢字列として学習されて登録
されているので、二文字の漢字列である”一只”も検索
範囲に含まれ、学習された”一只”と辞書に登録されて
いる”意志”とが候補となるが、学習された方が優先さ
れるので”一只”が候補漢字熟語として出力される。
【0033】また、上記請求項2記載の構成によれば、
複数の文節からなる漢字列を一つの漢字列として学習す
る際に、文節区切り位置も学習され、学習された複数の
文節からなる漢字列を出力する際に、漢字列を文節毎に
区切った状態で出力することができる。
【0034】従って、学習機能により優先的に出力され
た漢字列を再変換する必要がある場合には、出力された
漢字列が文節毎に区切られた状態となっており、文節毎
に再変換を行うことができ、出力された漢字列の一部の
文節だけ変更する必要がある場合に、変換効率を向上す
ることができる。
【0035】また、上記請求項3記載の構成によれば、
長い発音記号列を入力した後に、一括変換を行った場合
に、比較的多くの文節からなる長い漢字列が確定される
ことになるが、確定された漢字列をいくつかに分割して
辞書に登録することができる。
【0036】なお、辞書に長い漢字列を登録しても、長
い漢字列に正確に対応する発音記号列が入力される頻度
が低いのであまり役に立たず、また、比較的長い漢字列
を極めて短い漢字列に分割して辞書に登録しても、上述
のように長い漢字列が優先されて文節が区切られた場合
に、変換効率の向上が望めない。
【0037】また、変換手段から最初に変換されて出力
される漢字列は、辞書に登録された長い文字数の漢字列
を優先して文節を決めた場合に、比較的長い文節から構
成されることになるのに対して、確定された漢字列は、
適切な漢字熟語が辞書に登録されていない場合に、文節
の区切り位置を調整して単漢字熟語等の短い漢字熟語か
ら漢字列を再構成することになるので、比較的短い文節
から構成されることになる。
【0038】そこで、上述のように最初の変換(初期変
換)時の文節区切り位置と、確定された漢字列の文節区
切り位置とで位置が一致する文節区切り位置を共通区切
り位置とするとともに、確定された漢字列を上記共通区
切り位置で分割した場合には、確定された漢字列が初期
変換時の文節よりも短く分割されることがなく、適度な
長さの漢字列に分割されて辞書に登録されることにな
り、学習結果により変換率の向上を図ることができる。
【0039】また、初期変換時の文節区切り位置と、確
定された漢字列の文節区切り位置とで位置が一致する文
節区切り位置を共通区切り位置として、確定された漢字
列を上記共通区切り位置で分割した場合には、初期変換
時の文節区切り位置と、確定された漢字列の文節区切り
位置とで位置が異なる文節区切り位置がある場合に、確
定入力時の文節区切り位置で区切られた前後の文節は、
一つの漢字列として辞書に登録されることになり、文節
区切り位置も辞書に登録する場合に、初期変換時に対し
て確定入力時に位置が変更された文節区切り位置だけが
辞書に登録されることになり、文節区切り位置が効率的
に学習されることになる。
【0040】上記請求項4記載の構成によれば、上記請
求項2記載の構成と同様に変換効率の向上を図ることが
できる。
【0041】上記請求項5記載の構成によれば、上記請
求項3記載の構成と同様に変換効率の向上を図ることが
できる。
【0042】
【実施例】以下に、本発明の中国語用漢字変換装置及び
中国語用漢字変換方法の一実施例を図面を参照して説明
する。図1は、この実施例の中国語用漢字変換装置を示
すものである。なお、この実施例の中国語用漢字変換装
置は、コンピュータ・システム(例えば、汎用のコンピ
ュータシステムやワードプロセッサ専用機やコンピュー
タ・タイプセッティング・システムや、その他のシステ
ム)に組み込まれ、例えばアスキーコードを入力可能な
キーボードを用いてコンピュータ・システムへの中国語
の入力を可能とするものである。
【0043】図1に示すように、この実施例の中国語用
漢字変換装置は、アルファベットからなる中国語の発音
記号を入力可能なキー入力部1と、入力された発音記号
を中国語の漢字に変換して出力するCPU(central pr
ocessing unit)2と、CPU2から出力される発音記
号や漢字等の文字の形状を画像データ(フォントデー
タ)として記憶する表示メモリ3と、表示メモリ3に記
憶された発音記号や漢字等の画像データを表示する表示
部4と、CPU2から出力される発音記号や漢字等を印
字するための印字部5と、上記漢字や発音記号のフォン
トデータなどのCPU2の処理に必要なデータや、CP
U2から出力されるデータ等を記憶する外部記憶部6
と、同じくCPU2の処理に必要なデータやCPU2か
ら出力されるデータを一時的に記憶するワークメモリ7
と、発音記号列と該発音記号列に対応する漢字熟語とが
登録された変換辞書8と、CPU2により変換された漢
字を確定した際に抽出される学習情報が登録された学習
辞書9とを有する。
【0044】上記キー入力部1は、いわゆるアルファベ
ット用のキーボードであり、声調記号の無い中国語の発
音記号(ピンイン)を入力できるものである。また、キ
ー入力部1は、変換、文節区切り位置の変更、確定等の
指示を入力できるようになっている。
【0045】上記ワークメモリ7は、発音記号を漢字に
変換する際に必要なデータを一時的に格納するものであ
り、図2に示すような領域が確保されている。すなわ
ち、ワークメモリ7には、キー入力部1から入力された
発音記号列が格納される入力バッファ領域IBと、入力
された発音記号列のうちの変換辞書8及び学習辞書9を
検索するのに必要な部分が格納される検索発音記号領域
PYと、表示部4に表示すべき候補漢字列が格納される
候補表示情報領域SCと、初期変換時に第一候補とされ
た漢字列が格納される初期変換候補情報領域T1と、初
期変換時に入力された発音記号列に対応して出力される
漢字列の文節区切り位置が各文節の文字数として格納さ
れる初期変換文節情報領域W1と、確定された漢字列が
格納される確定入力時候補情報領域T2と、確定された
漢字列の文節区切り位置が各文節の文字数として格納さ
れる確定入力時文節情報領域W2とが確保されている。
【0046】また、上記変換辞書8は、一般的な漢字変
換用の辞書であり、中国語において、有る程度の頻度で
用いられる漢字列が漢字熟語として登録されているとと
もに、登録された漢字熟語に対応して該漢字熟語の読み
となる発音記号列が登録されている。
【0047】そして、発音記号列から漢字熟語が検索で
きるようになっている。なお、ここで、上記漢字列及び
漢字熟語には、一文字の漢字も含まれるものとする。
【0048】すなわち、上記変換辞書においては、一つ
の漢字列(漢字熟語)として、一文字の漢字も登録され
ている。上記学習辞書は、図3に示すように、登録され
る各漢字列毎に、発音記号(列)と、漢字表記と、文節
情報と、その他の情報が登録されるようになっている。
【0049】上記発音記号には、アルファベットで示さ
れる声調記号無しの発音記号が登録されるようになって
いる。上記文節情報には、上記ワークメモリ7の初期変
換文節情報領域W1及び確定入力時文節情報領域W2と
同様に、登録された漢字列の文節区切り位置が、各文節
の文字数として登録されるようになっている。
【0050】例えば、一つの文節から構成される二文字
の漢字熟語の場合に文節情報が2とされ、一文字ずつの
二つの文節(漢字熟語)から構成される漢字列の場合に
文節情報が1、1とされ、一文字の文節の後に二文字の
文節がくる漢字列の場合に文節情報1、2とされるよう
になっている。そして、上記CPU2は、後述するよう
に、キー入力部1から入力された発音記号列に基づいて
変換辞書8及び学習辞書9を検索して発音記号列を漢字
列に変換するとともに、変換された漢字列が確定された
際に、学習情報を抽出して学習辞書9に登録する機能を
有する。
【0051】次に、上述のような中国語用漢字変換装置
による中国語用漢字変換方法について説明する。図4の
フローチャートは、この実施例の中国語用漢字変換方法
を示すものであり、この実施例において中国語用漢字変
換方法は、発音記号を漢字に変換して入力する漢字変換
方法と複数の文節を一括して同音語学習する一括学習方
法とからなるものである。
【0052】まず、中国語用漢字変換方法においては、
キー入力部1から入力すべき任意の文字数の漢字列の読
みを示す発音記号列が入力される(ステップS1)。こ
こでは、図5(A)に示すように漢字列”工死”の読み
としての”gongsi”が入力されたものとする。
【0053】キー入力部1から入力された発音記号列
は、図6(A)に示すように入力バッファ領域IBに格
納される。また、入力された発音記号列の最初の文節部
分が、ワークメモリ7の検索発音記号の領域PYに格納
される。
【0054】この段階では、入力された発音記号列は文
節毎に分割されていないので、入力された発音記号列の
全部、すなわち、”gongsi”がそのまま格納され
る。また、入力バッファ領域IBに格納された発音記号
列は、その形状の情報が表示メモリ3に格納されて図5
(A)に示すように表示部4に表示される。
【0055】なお、図5において矩形枠内は、表示部4
の表示画面上の表示を示すものである。次に、図5
(B)に示すように(変換)キーを入力することによ
り、検索発音記号領域PYに格納された発音記号列に基
づいて変換辞書8及び学習辞書9が検索され、発音記号
列に対応する漢字熟語を検出するための漢字変換処理が
行われる(ステップS2)。
【0056】なお、発音記号列全体に対応する漢字熟語
が変換辞書8及び学習辞書9に登録されていない場合に
は、発音記号列の任意の文字数の先頭部分に対応する漢
字熟語が検索される。この際に、複数の文字数の異なる
漢字熟語が検索される場合には、文字数の多い漢字熟語
が優先され、上記発音記号列の文字数の長い優先して検
索された漢字熟語に対応する部分が一つの文節とされ
る。
【0057】また、上記発音記号列から上述のように設
定された文節(先頭部分)を除いた残りの発音記号列に
おいて、上述のような変換辞書の検索が行われる。この
際にも、残りの発音記号列全体に対応する漢字熟語が変
換辞書に登録されていない場合には、上述のように、発
音記号列の任意の文字数の先頭部分に対応する漢字熟語
が検索され、検索された漢字熟語に対応する部分が一つ
の文節とされる。
【0058】そして、さらに、発音記号列に残りの部分
がある場合には、上述のような処理を繰り返し行い、発
音記号列を複数の文節に分割するとともに、各文節に対
して第一候補となる漢字熟語が検索される。また、上記
漢字変換処理においては、学習辞書9の学習情報が利用
される(ステップS2a)が、学習情報を利用した漢字
変換処理については後述する。
【0059】そして、各文節毎に検索された第一候補と
なる漢字熟語からなる漢字列が図6(A)の候補表示情
報領域SCに格納される。ここでは、”gongsi”
が一つの文節とされ、”gongsi”に対応して変換
辞書8もしくは学習辞書9に登録された漢字熟語の中か
ら第一候補の”公私”が検出され、候補表示情報領域S
Cに格納される。
【0060】なお、変換辞書8と学習辞書9にそれぞれ
同じ発音記号列に対する漢字列が登録されている場合に
は、学習辞書9に登録された漢字列が優先して第一候補
とされる。また、変換辞書8もしくは学習辞書9におい
て、同じ発音記号列に対する複数の漢字列が登録されて
いる場合には、優先順位が一位の漢字列が第一候補とさ
れる。
【0061】そして、この第一候補の漢字列、すなわち
初期変換候補の情報が初期変換候補情報領域T1に格納
される(ステップS3)。ここでは、図6(A)に示す
ように”公私”が初期変換候補情報領域T1に格納され
る。
【0062】また、初期変換文節情報領域W1には、上
記初期変換候補情報領域T1に登録された漢字列の各文
節の文字数が順番に登録される。なお、初期変換候補情
報として登録された漢字列と後述するように確定された
漢字列が一致しない場合に、後述する学習情報の登録が
行われる。
【0063】そして、候補表示情報領域SCに格納され
た”公私”が図5(B)に示すように表示部4に表示さ
れる(ステップS4) ここで、入力すべき”工死”ではなく、”公私”が表示
されたので、オペレータは、再度(変換)キーを入力し
(ステップS5)、変換辞書に登録された”gongs
i”の候補となる漢字熟語として”工死”が出力される
か否か確認する。
【0064】すなわち、変換辞書に”gongsi”と
して登録された漢字熟語の中に、”工死”が含まれる
か、否か(変換)キーを入力して第一候補以降の候補と
なる漢字熟語を出力させることにより確認する。ここで
は、”gongsi”の候補として”工死”が変換辞書
8及び学習辞書9に登録されていなものとする。
【0065】次に、オペレータが、表示された候補とな
る漢字熟語を確定して入力処理を行うか否かを決める。
すなわち、選択された漢字熟語が表示された状態で(実
行)キーを押すかどうか決めることになるが(ステップ
S6)、ここでは”工死”が表示されないので、入力処
理を行わない。そして、その他の処理として、文節の区
切り位置の変更が行われる(ステップS7)。
【0066】なお、確定入力処理が行われない場合に
は、その他の処理として、発音記号列の変更を行ってス
テップS2の漢字変換処理に戻る処理などが行われる場
合もある。ここでは、”gongsi”が一つの漢字熟
語、すなわち一つの文節として”公私”に変換された状
態となっているが、図5(C)に示すようにこの実施例
において文節変更を示す(ESC)キーと矢印キーとを
入力することにより、文節の区切り位置を”公”と”
私”との間とする。
【0067】次に、ステップS5に戻り、最初の文節で
ある”公”を指定した状態で、図5(D)に示すように
(変換)キーを入力して再変換を行う。この際には、図
6(B)に示すように、上記ワークメモリ7の検索発音
記号領域PYの”gongsi”が最初の文節の発音記
号列となる”gong”に更新され、”gong”に対
応する漢字熟語が変換辞書8及び学習辞書9から検索さ
れる。
【0068】そして、”gong”に対して”工”が検
索された場合には、候補表示情報領域SCに”公私”に
変えて”工私”が格納される。そして、候補表示情報領
域SCに格納された”工私”が図5(D)に示すように
表示部4に表示される。
【0069】なお、”gong”に対して”工”が第一
候補として検索されない場合は、(変換)キーを再度入
力して、”gong”に対して変換辞書8もしくは学習
辞書9に登録されている”工”を検索する。この段階で
は、まだ、入力すべき”工死”が表示されていないの
で、確定処理を行わずその他の処理として、表示され
た”工私”の二つめの文節である”私”を指定し、、図
5(E)に示すように(変換)キーを入力して再変換を
行う。
【0070】この際には、図6(C)に示すように、上
記ワークメモリ7の検索発音記号領域PYの”gon
g”が二番目の文節の発音記号列となる”si”に更新
され、”si”に対応する漢字熟語が変換辞書8及び学
習辞書9から検索される。そして、上記”工”の場合と
同様に、”si”に対して”死”が検索された場合に
は、候補表示情報領域SCに”工私”に変えて”工死”
が格納される。
【0071】そして、候補表示情報領域SCに格納され
た”工死”が図5(E)に示すように表示部4に表示さ
れる。ここで、入力すべき”工死”が表示部4上に表示
されたので、図5(F)に示すように(実行)キーを入
力することにより、”工死”を確定して入力する確定入
力処理を行う(ステップS8)。
【0072】この際には、図6(C)に示すように、ワ
ークメモリ7の確定入力時候補情報領域T2に、”go
ngsi”に対して確定された漢字列である”工死”が
格納される(ステップS9)。また、確定入力時文節情
報W2に確定された漢字列の文節毎の文字数が登録され
る。”工死”の場合には、文節”工”と文節”死”との
一文字の文節が二つあるので、図5(F)に示すよう
に、”工死”が確定し、図6(C)に示すように確定入
力時文節情報W2に1、1が格納される。
【0073】次に、一括学習処理を行う。まず、初期変
換候補領域T1及び初期変換文節情報領域T2に登録さ
れた漢字列と各文節の文字数とから、初期変換時の漢字
列の文節区切り位置を求める。ここでは、登録された漢
字列が公私であり、文字数2の文節が一つとなる。ま
た、確定入力時候補領域T1及び確定入力時文節情報領
域T2に登録された漢字列と各文節の文字数とから、確
定された漢字列の文節の区切り位置を求める。
【0074】ここでは、確定された漢字列が”工死”で
あり、文字数1の文節が二つとなる。すなわち、文節の
区切り位置を:で示した場合、初期変換時と確定入力時
では以下のようになる。
【0075】:公 私: :工:死: 次に、初期変換時と確定入力時とで共通する文節区切り
位置を共通区切り位置とする(ステップS10)。上
記”公私”と”工死”とにおいては、一文字目の前と二
文字目の後が共通区切り位置となる。ここで、上記ステ
ップS10の処理をもう少し一般化して説明すると以下
のようになる。
【0076】まず、ワークメモリ7の入力バッファに発
音記号列として、”--------------------------------
--”が格納され、初期変換候補情報領域T1に”ABC
DEFGHIJKL”が格納され、初期変換文節情報領
域W1に”2、2、3、5”が格納され、確定入力時候
補情報領域T2に”AMNOPQRSTUVW”が格納
され、確定入力時文節情報領域W2に”2、3、2、
3、2”が格納されたものとする。
【0077】なお、”-”は仮に発音記号を示し、大文
字のアルファベットは仮に漢字を示すものとする。ここ
で、文節の区切り位置を:で示した場合には、ワークメ
モリ7に格納された各情報を以下のように示すことがで
きる。
【0078】 初期変換時 :A B:C D:E F G:H I J K L: :------:------:----------:------------------: 確定入力時 :A M:N O P:Q R:S T U:V W: :------:----------:------:----------:------: 共通区切り位置 : : : : この場合には、上記文節区切り位置のうち初期変換時と
確定入力時とで位置が一致するものが共通区切り位置と
される。
【0079】そして、上記初期変換時の漢字列と確定入
力時の漢字列とを上記共通区切り位置で分割し、各分割
部分が初期変換時と確定入力時とで一致するか否かを順
次先頭の分割部分から判定する(ステップS11)。
【0080】上記”gongsi”の場合には、”公
私”が初期変換時の分割部分とされ、”工死”が確定入
力時の分割部分とされるので、一致しないことになる。
そして、分割部分が初期変換時と確定入力時とで一致し
ない場合(ステップS12)には、確定入力時の上記共
通区切りによる分割部分の読みである発音記号列と、漢
字列と、文節区切り位置とを学習情報として、学習辞書
9に登録する(ステップS13)。
【0081】また、共通分割部分が初期変換時と確定入
力時とで一致する場合には、次の分割部分、すなわち残
りのデータが有るか否かを判定し(ステップS14)、
ある場合には、ステップS12に戻る。そして、入力さ
れた発音記号列の全ての共通分割部分について、初期変
換時と確定入力時とで漢字列が一致するか否かを判定す
るとともに、一致した場合に、確定入力時の上記共通分
割部分の発音記号列と、漢字列と、文節区切り位置とを
記憶する処理を行う。
【0082】なお、図3に示すように、発音記号列(発
音記号)と、漢字列(漢字表示)と、文節区切り位置
(文節情報)は互いに対応して学習辞書9に登録され
る。すなわち、上記”工死”の場合の学習情報は、発音
記号列として”gongsi”、漢字列として”工
死”、文節区切り位置として”1、1”が登録される。
【0083】なお、上記学習辞書9への登録処理におい
ては、初期変換時に、例えば、”gongsi”が公私
と変換され、オペレータにより再変換が行われ、”go
ngsi”に対応する別の同音漢字熟語、例えば、”公
司”が選択されて確定入力された場合には、学習辞書9
に、発音記号列として”gongsi”、漢字列とし
て”公司”、文節区切り位置として”2”が登録される
ことになる。
【0084】この場合には、従来と同様の同音語学習が
行われることになる。すなわち、本実施例においては、
従来と同様の同音語学習が行われるとともに、”工死”
の場合のように、複数の文節からなる漢字列が一つの文
節からなる漢字熟語と同様に登録され、かつ、文節区切
り位置も登録される。
【0085】そして、中国語用漢字変換装置において、
図5(G)に示すように、再び発音記号列として”go
ngsi”が入力された(ステップS1)場合には、ス
テップS2において、漢字変換処理が行われる際に、学
習辞書9の学習情報が利用されることになる(ステップ
S2a)。
【0086】すなわち、漢字変換処理において、学習辞
書9から発音記号列”gongsi”が検索され、”工
死”と文節区切り位置”1、1”が検出される。そし
て、図5(H)に示すように、変換辞書8に登録された
二文字の公私等の漢字熟語よりも学習辞書9に登録され
た二文字の”工死”が優先して表示されるとともに、文
節区切り位置が”工”と”死”との間とされる。
【0087】従って、従来のように、”工”と”死”と
が別々に同音語学習され、”工死”が学習されないこと
により、”gongsi”を再び入力した場合に、学習
辞書に”gong(工)”と”si(死)”とが登録さ
れ、”gong”に対して”工”が検索可能な場合で
も、変換辞書の”gongsi(公私)”の方が文字数
が長いことから、変換辞書8に登録された”gongs
i”の第一候補である”公私”が出力されるような事態
を防止することができる。
【0088】なお、上記処理においては、文節区切り位
置も記憶されているので、オペレータがもし、再変換を
行った場合には、”gong”もしくは”si”のどち
らか指定された方の同音漢字熟語が再変換されることに
なり、どちらか一方だけを変換したい場合や、変換辞書
8において”gongsi”対応する二字の漢字熟語の
中に、入力すべき漢字熟語が無い場合に、変換効率を向
上することができる。
【0089】次に、図7及び図8に示す別の発音記号列
の場合について説明する。まず、中国語用漢字変換装置
に、図7(A)に示すように、”不董事”に対応する発
音記号列”budongshi”が入力される。な
お、”不董事”の”董”は、実際には、図7(F)に示
すように「りっしんべん」を有するものであるが、明細
書上では日本語に該当する漢字がないので、”董”とし
た。
【0090】この際には、図8(A)に示すように、ワ
ークメモリ7の入力バッファ領域IBに”budong
shi”が登録される。そして、図(B)に示すよう
に、(変換)キーを入力した場合には、”budong
shi”を変換辞書及び学習辞書から検索する。この場
合には、発音記号列”budongshi”の先頭から
できるだけ長い漢字数の漢字熟語に対応する部分が優先
して検索されることになる。
【0091】ここでは、”budongshi”に対応
する漢字熟語が変換辞書8にも学習辞書9にも登録され
ていなかったものとする。そして、変換辞書8及び学習
辞書9に登録され、”budongshi”の先頭部分
を含む任意の文字数の漢字列の中で最も長いものとして
は、”budong”に対応する第一候補として”不
動”が登録されているものとする。この際には、ワーク
メモリ7の検索発音記号領域PYに”budong”が
格納され、”不動”が検出される。
【0092】また、残りの”shi”に対応する漢字熟
語の第一候補として、変換辞書8もしくは学習辞書9か
ら”是”が検出されるものとする。この場合には、候補
表示情報領域SCに”不動是”が格納され、表示部に図
7(B)に示すように”不動是”が表示される。
【0093】また、初期変換候補情報領域T1に、上
記”不動是”が格納されるとともに、初期変換文節情報
領域W1に、文節の区切り位置を示す”2,1”が格納
される。次に、オペレータは、初期変換時の文節の区切
り位置が異なるので、図7(C)に示すように(ES
C)キーを入力して、文節区切り位置変更モードとし
て、矢印キーにより、文節区切り位置を”不”(bu)
と”動是(dongshi)”との間とする。
【0094】そして、”不”の文節は、入力すべき漢字
列と一致するので、”不”を指定した状態で、図7
(D)のように(実行)キーを入力することにより、”
不”を確定する。次いで、”動是”の文節を指定した状
態で、図7(E)に示すように(変換)キーを入力する
ことにより、再変換を行う。
【0095】この際には、図8(B)に示すように、検
索発音記号領域PYに”dongshi”が格納さ
れ、”dongshi”が変換辞書8及び学習辞書9か
ら検索される。そして、ここでは、”dongshi”
に対する第一候補として”董事”が検出されたものとす
る。
【0096】この場合には、図8(B)に示すように上
記”不”と”董事”とを合わせた”不董事”が候補表示
情報領域SCに格納され、図7(E)に示すように”不
董事”が表示部4に表示される。そして、図7(F)に
示すように(実行)キーを入力することにより、”董
事”が確定され、先に確定された”不”と合わせて”不
董事”が確定入力される。この際には、図(C)に示す
ように確定入力時候補情報領域T2に”不董事”が格納
され、確定入力時文節情報W2に文節区切り位置を文字
数で示すものとして”1、2”が格納される。
【0097】ここで、初期変換時のデータと確定入力時
のデータを比較すると、以下のようになる。
【0098】:不 動:是: :不:董 事: この場合には、上記共通分割部分が、”budongs
hi”全体となるので、学習情報は、発音記号列とし
て”budongshi”、漢字列として”不董事”、
文節位置として”1,2”となり、これが学習辞書9に
図3に示すように登録される。
【0099】次に、図7(G)に示すように再び”bu
donghsi”を入力した場合には、学習辞書9に登
録された学習情報として、”budongshi”、”
不董事”、”1,2”が検出され、図7(H)に示すよ
うに初期変換により”不董事”が表示されることにな
る。また、この際の文節区切り位置は、”不”と”董
事”との間となる。
【0100】すなわち、上記”工死”の場合と同様に複
数の文節からなる”不董事”が同音語学習され、複数の
文節のまま”budonghsi”の第一候補となる。
【0101】この際には、通常の変換では、文字数の多
い候補が優先されるので、変換辞書8もしくは学習辞書
9に”不動(budong)”が登録されていれば、文
節区切り位置が二文字目と三文字目との間となるが、上
述のように学習辞書に”不董事(budonghs
i)”が登録されているので、文字数が多いとともに学
習辞書9に登録されているということで、”不董事”が
優先的に表示されととともに、文節位置が上述のように
なる。
【0102】以上のように、この実施例の中国語用漢字
変換装置及び中国語用漢字変換方法によれば、上述のよ
うに、初期変換時と確定入力時とで、文節区切り位置の
変更がない場合、もしくは文節区切り位置が一致する文
節部分においては、学習辞書9に登録された漢字列が優
先されるので、従来の同音語学習と同様の作用効果を奏
することができる。
【0103】また、初期変換時から文節区切り位置を変
更した場合には、上述のよう共通分割部分内の複数の文
節がグループ化された状態で学習辞書に登録されるの
で、複数の文節からなる漢字列を一つの漢字熟語として
検索することが可能となる。
【0104】従って、任意の発音記号列を変換した場合
に文字数の長い漢字熟語を優先するものとしても、初期
変換時に一つの文節からなる漢字列に変換されたものを
確定入力時に複数の文節からなる漢字列に変換して確定
した場合に、従来の同音語学習のように、文節の文字数
の多い漢字列が優先され、初期変換時の漢字列が第一候
補とされるようなことがなく、複数の文節からなる漢字
列が、一つの文節の漢字列と同様の同音語学習の対象と
なり、二度目以降に同様の発音記号列を入力した場合に
は、複数の文節からなる漢字列が優先される。
【0105】また、この処理は、一種の未知語(辞書に
登録されていない漢字)登録としても作用する。すなわ
ち、辞書に登録されていない漢字熟語を、一文字の単漢
字熟語等から再構成するように、入力すべき未知語の初
期変換される発音記号列を複数の文節に区切り、各文節
において再変換を行い、漢字を選択していくことによ
り、上記未知語と同様の漢字列を確定入力した場合に
は、最初に入力された発音記号列と、上記未知語の漢字
列とが学習辞書9に登録されることになる。従って、上
記発音記号列を再び入力した場合には、変換辞書8に登
録されていない未知語を学習辞書9に基づいて一回の変
換により入力することが可能となる。
【0106】また、上記”不動是”と”不董事”との場
合のように、新たに文節区切り位置を設定するのではな
く、文節区切り位置を変更した場合には、文節区切り位
置の変更が学習されることになり、上述の不定詞の不が
一文字目にくるような場合に、一度確定入力された漢字
列においては、不の部分で文節が区切られるようにな
り、より中国語の文法に即した変換が可能となる。
【0107】以上のように、この実施例の中国語用漢字
変換装置及び中国語用漢字変換方法においては、確定時
結果に文節区切りがある場合に、文節毎の同音語学習に
代えて、上述のような未知語学習や文節区切り位置学習
が可能な複数の文節を一つの文節と同様に同音語学習す
るとともに、文節区切り位置を学習する機能を備えてい
るので、変換効率を向上することができる。
【0108】特に、複数の文節を一括して同音語学習す
ることにより、漢字列を文節単位で解析するのではな
く、文節の前後関係に基づいて解析するのと同様の状態
となり、変換効率の飛躍的向上を図ることが可能とな
る。なお、上記実施例では、声調記号なしの発音記号を
用いるものとしたが、声調記号有りの発音記号を用いる
ものとしても良い。
【0109】
【発明の効果】上記請求項1記載の中国語用漢字変換装
置によれば、確定された複数の文節からなる漢字列にお
いて同音語学習を行う際に、文節毎に学習を行うのでは
なく、複数の文節からなる漢字列を一つの漢字列として
学習することが可能なので、上述のように辞書に登録さ
れた文字数の長い漢字列を優先して文節を区切るように
しても、従来のように、入力される発音記号列に対して
一つの漢字列が登録された状態で、上記発音記号列に対
して複数の文節からなる漢字列を繰り返し入力する際
に、文節の区切り位置を変更する必要がなく、中国語の
漢字変換における変換効率の向上とそれに伴う漢字入力
の迅速化を図ることができる。
【0110】また、上記請求項2記載の中国語用漢字変
換装置によれば、複数の文節からなる漢字列を一つの漢
字列として学習する際に、文節区切り位置も学習され、
学習された複数の文節からなる漢字列を出力する際に、
漢字列を文節毎に区切った状態で出力することができる
ので、出力された漢字列の一部の文節だけ再変換する必
要がある場合に、変換効率を向上することができる。
【0111】また、上記請求項3記載の中国語用漢字変
換装置によれば、確定された漢字列が初期変換時の文節
よりも短く分割されることがなく、適度な長さの漢字列
に分割されて辞書に登録されることになり、発音記号列
に対応する辞書に登録された最も長い漢字列に基づいて
文節を区切るようにしても、学習結果による変換率の向
上を図ることができる。
【0112】また、初期変換時の文節区切り位置と、確
定された漢字列の文節区切り位置とで位置が異なる文節
区切り位置がある場合に、確定入力時の文節区切り位置
で区切られた前後の文節は、一つの漢字列として辞書に
登録されることになり、文節区切り位置も辞書に登録す
る場合に、初期変換時に対して確定入力時に位置が変更
された文節区切り位置だけが辞書に登録されることにな
り、文節区切り位置の学習を効率化することができる。
【0113】上記請求項4記載の中国語用漢字変換方法
によれば、上記請求項2記載の中国語変換装置と同様
に、変換効率の向上を図ることができる。
【0114】上記請求項5記載の中国語用漢字変換方法
によれば、上記請求項3記載の中国語変換装置と同様
に、効率的に文節区切り位置の学習が行えるとともに、
変換効率の向上を図ることができる。
【図面の簡単な説明】
【図1】本発明の一実施例の中国語用漢字変換装置の基
本構成を示すブロック図である。
【図2】上記実施例の中国語用漢字変換装置のワークメ
モリを説明するための図面である。
【図3】上記実施例の中国語用漢字変換装置の学習辞書
を説明するための図面である。
【図4】上記中国語用漢字変換装置における中国語用漢
字変換方法を説明するためのフローチャートである。
【図5】上記中国語用漢字変換装置における漢字変換操
作を説明するための図面である。
【図6】上記中国語用漢字変換装置のワークメモリにお
けるデータの格納状態を説明するための図面である。
【図7】上記中国語用漢字変換装置における漢字変換操
作を説明するための図面である。
【図8】上記中国語用漢字変換装置のワークメモリにお
けるデータの格納状態を説明するための図面である。
【符号の説明】
1 キー入力部(入力手段、指示手段、確定手段) 2 CPU(変換手段、学習手段) 8 変換辞書(辞書) 9 学習辞書(辞書)

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 発音記号列に対応して漢字列が登録され
    た辞書と、 漢字列の発音を示す発音記号列を入力する入力手段と、 上記辞書に基づいて入力された発音記号列を文節毎に漢
    字列に変換して出力する変換手段と、 文節区切り位置の変更及び上記変換手段による再変換、
    一つの発音記号列に対応する同音の複数の漢字列からの
    選択等の操作を指示する指示手段と、 変換された漢字列を確定する確定手段と、 入力された発音記号列及び該発音記号列に対して確定さ
    れた漢字列を対応させて辞書に登録する学習手段とを具
    備してなり、 上記学習手段は、確定時に複数の文節からなる漢字列を
    一つの漢字列として上記辞書に登録可能とされ、 上記変換手段は、上記辞書に基づいて入力された発音記
    号列を漢字列に変換する際に、上記発音記号列に対応
    し、かつ、上記学習手段により登録された漢字列が上記
    辞書に登録されている場合に、上記学習手段により登録
    された漢字列を優先して出力させることを特徴とする中
    国語用漢字変換装置。
  2. 【請求項2】 上記学習手段は、複数の文節からなる漢
    字列を一つの漢字列として辞書に登録する際に、上記漢
    字列とともにその文節の区切り位置を上記辞書に登録
    し、 上記変換手段は、入力された発音記号列を複数の文節か
    らなる漢字列に変換する際に、上記漢字列に対応して上
    記辞書に登録された文節区切り位置で上記漢字列を区切
    った状態とすることを特徴とする請求項1記載の中国語
    用漢字変換装置。
  3. 【請求項3】 上記学習手段は、上記変換手段の最初の
    変換時の文節区切り位置と、上記確定手段に確定された
    漢字列の文節区切り位置とで位置が一致する文節区切り
    位置を共通区切り位置とするとともに、確定された漢字
    列を上記共通区切り位置で分割し、各分割部分をそれぞ
    れ一つの漢字列として辞書に登録することを特徴とする
    請求項1または2記載の中国語用漢字変換装置。
  4. 【請求項4】 入力される発音記号列を、発音記号列と
    漢字列とが対応させられて登録された辞書に基づいて漢
    字列に変換する中国語用漢字変換装置における中国語用
    漢字変換方法であって、 入力された発音記号列により上記辞書を検索して文節毎
    に漢字列に変換された候補漢字列を出力し、 上記候補漢字列と入力すべき漢字列とが異なる場合に、
    文節区切り位置の変更及び候補漢字列の再出力、一つの
    発音記号列に対応する同音の複数の漢字列からの選択等
    の操作により候補漢字列を確定し、 確定された漢字列を学習するために、入力された発音記
    号列と確定された漢字列とを対応させて上記辞書に登録
    するに際し、複数の文節からなる漢字列を一つの漢字列
    として登録するとともに、上記漢字列の文節区切り位置
    を登録し、 上記発音記号列が再び入力された際に、上記辞書に登録
    された複数の文節からなる漢字列を文節毎に区切った状
    態で候補漢字列として出力することを特徴とする中国語
    用漢字変換方法。
  5. 【請求項5】 入力された発音記号列と確定された漢字
    列とを対応させて辞書に登録するに際し、最初に出力さ
    れた候補漢字列の文節区切り位置と、確定された漢字列
    の文節区切り位置とで位置が一致する文節区切り位置を
    共通区切り位置とするとともに、入力された発音記号列
    及び確定された漢字列を上記共通区切り位置で分割し、
    各分割部分毎に発音記号列と漢字列とを対応させて辞書
    に登録することを特徴とする請求項4記載の中国語用漢
    字変換方法。
JP7181099A 1995-06-23 1995-06-23 中国語用漢字変換装置及び中国語用漢字変換方法 Pending JPH096761A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7181099A JPH096761A (ja) 1995-06-23 1995-06-23 中国語用漢字変換装置及び中国語用漢字変換方法
CN 96107169 CN1100301C (zh) 1995-06-23 1996-06-24 中文汉字字符转换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7181099A JPH096761A (ja) 1995-06-23 1995-06-23 中国語用漢字変換装置及び中国語用漢字変換方法

Publications (1)

Publication Number Publication Date
JPH096761A true JPH096761A (ja) 1997-01-10

Family

ID=16094826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7181099A Pending JPH096761A (ja) 1995-06-23 1995-06-23 中国語用漢字変換装置及び中国語用漢字変換方法

Country Status (1)

Country Link
JP (1) JPH096761A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7228267B2 (en) 2002-07-03 2007-06-05 2012244 Ontario Inc. Method and system of creating and using Chinese language data and user-corrected data
JP2012511759A (ja) * 2008-12-11 2012-05-24 マイクロソフト コーポレーション ユーザ指定された語句入力学習

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7228267B2 (en) 2002-07-03 2007-06-05 2012244 Ontario Inc. Method and system of creating and using Chinese language data and user-corrected data
US7512533B2 (en) 2002-07-03 2009-03-31 Research In Motion Limited Method and system of creating and using chinese language data and user-corrected data
JP2012511759A (ja) * 2008-12-11 2012-05-24 マイクロソフト コーポレーション ユーザ指定された語句入力学習
US9009591B2 (en) 2008-12-11 2015-04-14 Microsoft Corporation User-specified phrase input learning

Similar Documents

Publication Publication Date Title
US5835924A (en) Language processing apparatus and method
JPH096761A (ja) 中国語用漢字変換装置及び中国語用漢字変換方法
JP3904504B2 (ja) 文字列変換装置、履歴情報生成方法、および履歴情報生成処理プログラム。
JPS5818730A (ja) 文字処理装置
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JPS6068423A (ja) 日本語文章入力装置
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
JP2001014304A (ja) 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体
JPH0452500B2 (ja)
JPH08161320A (ja) 文書作成装置及びその表示処理方法
JPH0683807A (ja) 文書作成装置
JPH08329067A (ja) 文書作成装置および表示方法
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JPH0131229B2 (ja)
JPH096762A (ja) 中国語用漢字変換装置及び中国語用漢字変換方法
JPH07146857A (ja) 文書作成装置及び表示方法
JPS62117060A (ja) 文字・音声入力変換方式
JPH08335217A (ja) 読み変換方法及び文書作成装置
JPH1078955A (ja) かな漢字変換システム
JPH08171568A (ja) 複数言語入力方法
JPH0683805A (ja) 文書作成装置
JP2001175645A (ja) 中国語入力変換処理装置、中国語入力変換処理方法及び記録媒体
JPH10187700A (ja) 文書処理装置
JPH0991278A (ja) 文書作成装置
JPH06176011A (ja) 漢字変換方式