JP2000003355A - 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体 - Google Patents

中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体

Info

Publication number
JP2000003355A
JP2000003355A JP10168788A JP16878898A JP2000003355A JP 2000003355 A JP2000003355 A JP 2000003355A JP 10168788 A JP10168788 A JP 10168788A JP 16878898 A JP16878898 A JP 16878898A JP 2000003355 A JP2000003355 A JP 2000003355A
Authority
JP
Japan
Prior art keywords
tone
information
tone information
reading
new word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10168788A
Other languages
English (en)
Inventor
Yukihiro Karasaki
幸弘 唐崎
Tomoichi Takeuchi
朝一 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Software Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Software Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Software Engineering Corp filed Critical Toshiba Corp
Priority to JP10168788A priority Critical patent/JP2000003355A/ja
Publication of JP2000003355A publication Critical patent/JP2000003355A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】中国語の知識が乏しくとも、新語登録時に適切
な声調情報を付与して登録可能とする。 【解決手段】新語登録時に、声調情報が指定されていな
かった場合に、新語登録部26はユーザが指定した登録
語句の見出しと読みを声調情報付与部27に渡して声調
情報の付与を声調情報付与部27に指示する。声調情報
付与部27は声調に関する情報を記憶した声調情報付与
テーブル28を参照して当該登録語句に対応する声調情
報を判断する。新語登録部26は声調情報付与部27か
ら声調情報を取得すると、この声調情報と当該登録語句
の読みと見出しを新語情報としてユーザ辞書25に登録
する。これにより、新語登録時に声調情報を指定しなく
とも、登録語句に対応する適切な声調情報を付与して新
語登録することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、中国語文書の作成
に用いられる中国語ワードプロセッサ等の中国語入力変
換処理装置に係り、特に声調情報を含めて任意の語句を
新語登録する場合に用いて好適な中国語入力変換処理装
置と、同装置に用いられる新語登録方法及び記録媒体に
関する。
【0002】
【従来の技術】従来、中国語ワードプロセッサ等の中国
語入力変換処理装置では、中国語の漢字とその読みを表
す表音記号(以下、ピンインと称す)とを対応付けた辞
書を用い、中国語の読みをピンインで入力し、これを漢
字に変換して出力する機能を備えている。これをピンイ
ン漢字変換機能(日本語ワードプロセッサのかな漢字変
換機能に相当)と呼ぶ。
【0003】ここで、中国語では、1つの漢字の発音は
必ず1音節になっている。1つの音節はさらに「声母」
と呼ばれる先頭子音(音節の先頭にくる子音)と、「韻
母」と呼ばれる「声母」を除いた部分(母音、二重母
音、鼻音化母音などがある)とで構成されている。
【0004】ピンイン入力方式では、このような声母と
韻母をアルファベットで入力することになる。ところ
が、中国語では、同じピンインを持つ漢字が複数存在す
ることがあり、ピンインだけを入力して変換を行なって
も、ユーザが意図する漢字を第1の変換候補として必ず
しも得られないことがある。
【0005】そこで、このような問題を解決するため
に、ピンイン表記と合わせて、音節の抑揚を表わす「四
声」と呼ばれる声調記号を入力することにより、ユーザ
が意図する変換候補を提示する方法が一般的に採られて
いる。
【0006】声調には、基本的なものが4つあり、これ
を四声(しせい)と呼ぶ。そのうち、音を同じ高さで伸
ばすものを第1声、上げるものを第2声、曲げるものを
第3声、下げるものを第4声という。同じ音節でも声調
が異なれば、漢字も意味も異なってくる。なお、この他
に、短く軽く発音する「軽声」と呼ばれる声調もある。
【0007】例えば音節[qi]は、以下のようにな
る。 第1声…[期] 第2声…[奇] 第3声…[起] 第4声…[器] このように、発音表記(ピンイン)から中国語の漢字に
変換する際の変換率を高めるため、ピンインの他に四声
を示す声調情報を併せて入力することが一般的に行われ
ている。
【0008】ところで、ピンイン入力により所望の漢字
がすべて変換できるほど辞書の登録語数が多ければ、効
率良く、正確に変換することができる。しかし、メモリ
容量の制限などから、すべての語句を辞書に登録するこ
とは不可能である。また、必要とする語句はユーザによ
って、また、作成する文書の種類によって大きく異な
る。
【0009】そこで、このような欠点を補うため、いく
つかの中国語変換処理では新語登録という機能を用意し
ている。これは、辞書に載っていない語句を新語として
ユーザが任意に登録できる機能であり、登録された新語
は辞書登録語として以後同様に変換することができる。
【0010】
【発明が解決しようとする課題】上記したような新語登
録機能を用いれば、辞書に載っていない語句であって
も、一度新語として登録しておけば、次回から辞書登録
語と同様に変換できるので便利である。
【0011】しかしながら、新語登録を行う場合には、
登録対象となる語句の見出し、読み、品詞といった情報
の他に、変換をより正確に行うために声調情報を指定す
る必要がある。この場合、声調情報を指定するには、声
調に関する中国語の知識が必要であり、誰も簡単に指定
できるものではない。また、知識があったとしても、そ
の都度声調情報を指定する操作が必要であるため、ユー
ザに負担がかかる問題があった。
【0012】また、声調情報を誤って指定した場合、従
来の新語登録機能では、それを正す機能はないため、そ
のまま新語登録されてしまい、後の変換処理が正しく行
われなくなる問題があった。
【0013】本発明は上記の問題を解決するためになさ
れたものであり、中国語の知識が乏しくとも、新語登録
時に適切な声調情報を付与して登録することのできる中
国語入力変換処理装置、同装置に用いられる新語登録方
法及び記録媒体を提供することを目的とする。
【0014】
【課題を解決するための手段】本発明は、中国語入力変
換処理に用いられる変換辞書に任意の語句を新語登録す
る機能を備えたものであり、新語登録時に、その登録語
句の見出しと読みと共に声調情報が指定されたか否かを
判断し、声調情報が指定されていなかった場合に、声調
に関する情報を記憶した声調テーブルを参照して当該登
録語句に対応する声調情報を取得し、この声調情報と当
該登録語句の読みと見出しを新語情報として変換辞書に
登録することを特徴とする。
【0015】このような構成によれば、新語登録時に声
調情報を指定しなくとも、登録語句に対応する適切な声
調情報を付与して新語登録することができる。また、本
発明は、新語登録時に、その登録語句の見出しと読みと
共に声調情報が指定されたか否かを判断し、声調情報が
指定された場合に、声調に関する情報を記憶した声調テ
ーブルを参照して上記指定された声調情報が正しいか否
かを判断し、その判断結果に応じて上記指定された声調
情報を適切な声調情報に修正し、この修正された声調情
報と当該登録語句の読みと見出しを新語情報として変換
辞書に登録することを特徴とする。
【0016】このような構成によれば、新語登録時に声
調情報を指定した際に、その声調情報の妥当性がチェッ
クされる。その結果、指定された声調情報が誤っている
場合にはその声調情報を正しく修正して新語登録するこ
とができる。
【0017】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。 (第1の実施形態)図1は本発明の中国語入力変換処理
装置のシステム構成を示すブロック図である。本装置
は、アルファベットのピンインを入力して中国語変換を
行うものである。
【0018】なお、本実施形態における中国語入力変換
処理装置は、例えば磁気ディスク等の記録媒体に記録さ
れたプログラムを読み込み、このプログラムによって動
作が制御されるコンピュータによって実現される。
【0019】図1に示すように、本実施形態における中
国語入力変換処理装置は、CPU11、メモリ12、入
力装置13、表示装置14、外部記憶装置15、印刷装
置16、通信装置17、オーディオ装置18によって構
成される。
【0020】CPU11は、本装置の動作全体を制御す
るものであり、メモリ12に格納されたプログラムの起
動で動作する。なお、メモリ12に格納されたプログラ
ムに基づいて実現される機能としては、アプリケーショ
ンプログラムによるワードプロセッサ等がある。
【0021】メモリ12は、例えばROMやRAMから
なり、本装置で使用される各種プログラムやフォント
(中国語フォントを含む)等のデータを格納する。この
メモリ12には、ワードプロセッサを実現するアプリケ
ーションプログラムなどのプログラムデータを格納する
ためのプログラム領域12aの他、入力バッファ12
b、候補バッファ12c、文書バッファ12dなどが設
けられている。
【0022】入力バッファ12bは、文書作成のために
入力された中国語漢字の読みであるピンイン文字列を格
納する。候補バッファ12cは、ピンイン漢字変換によ
って得られた変換候補を格納する。文書バッファ12d
は、ピンイン漢字変換によって得られた中国語漢字から
なる文書データを格納する。
【0023】入力装置13は、キーボードからなり、本
装置に対する指示やデータの入力を行うものであり、中
国語の読み表記であるピンイン文字列の入力や、その入
力されたピンイン文字列に対するピンイン漢字変換指示
(「変換」キーの操作による指示)、新語登録指示
(「新語登録」キーの操作による指示)、音声読上げ指
示(「音声読上げ」キーの操作による指示)などを行う
ためのものである。
【0024】表示装置14は、例えばCRT (Cathode
Ray Tube) やLCD (Liquid Crystal Display) からな
り、入力装置13を通じて入力されたピンイン文字列や
ピンイン漢字変換結果、また、新語登録時には登録用の
インタフェース画面などの表示を行う。
【0025】外部記憶装置15は、例えばHDD (Hard
Disk Drive)やCD−ROM (Compact Disc Read Only
Memory)からなり、各種プログラムや文書などのデータ
を保存する。この外部記憶装置15には、ワードプロセ
ッサを実現するためのアプリケーションプログラムの
他、ピンイン漢字変換処理で使用する辞書などのデータ
も含まれる。
【0026】印刷装置16は、文書の印刷等を行うため
に用いられる。この印刷装置16としては、本装置に内
蔵されたものでも、外付けにて接続されるものでも良
い。また、通信装置17は、例えば構内LAN (Local
Area Network) や通信ネットワーク等を介して外部装置
とのデータの送受信制御を行う。
【0027】また、本装置では、オーディオ装置18が
設けられており、新語登録の際に音声読上げ指示があっ
たときに、登録対象となる語句を音声情報に変えて出力
する機能を備えている。
【0028】次に、図1に示すシステム構成によって実
現される中国語入力変換処理装置の機能構成について説
明する。図2は図1のシステム構成によって実現される
中国語入力変換処理装置の機能構成を示すブロック図で
ある。図2に示すように、本実施形態における中国語入
力変換処理装置は、入力部21、制御部22、変換部2
3、変換辞書24、ユーザ辞書25、新語登録部26、
声調情報付与部27、声調情報付与テーブル28、出力
部29を有する。
【0029】入力部21は、文字列の入力や変換指示、
新語登録指示等のファンクションの入力などを行う。制
御部22は、入力部21より入力されたデータに基づい
て各処理部の制御を行うものであり、変換指示により変
換部23を制御してピンイン漢字変換処理を実行し、新
語登録指示により新語登録部26を制御して新語登録処
理を実行する。
【0030】変換部23は、変換辞書24およびユーザ
辞書25を参照して、ピンイン入力された読み文字列を
中国語漢字に変換する処理を行う。変換辞書24および
ユーザ辞書25には、ピンイン表記で中国語漢字の読
み、声調とそれに対応する見出し、品詞など、ピンイン
漢字変換処理に必要な情報が登録されている(図3参
照)。
【0031】このうち、変換辞書24は標準的な語句が
登録された中国語辞書であって、予め標準装備されてい
る。これに対し、ユーザ辞書25は新語登録機能によっ
てユーザに任意に作成される中国語辞書であって、変換
辞書24とは別に用意されている。これらの変換辞書2
4およびユーザ辞書25は、外部記憶装置15に格納さ
れる。
【0032】新語登録部26は、新語登録対象として指
定された語句の読みと見出し、さらに声調情報をユーザ
辞書25に新語登録する処理を行う。声調情報付与部2
7は、声調情報付与テーブル28を参照し、新語登録対
象として指定された語句に適切な声調情報を付与するた
めの処理を行う。声調情報付与テーブル28には、中国
語漢字の声調に関する情報が格納されている(図4参
照)。
【0033】出力部29は、入力されたピンインの文字
列や、その入力ピンインに対応する変換候補、新語登録
用のインタフェース画面(図5参照)などを表示装置1
4に表示するための出力処理を行う。
【0034】図3は変換辞書24の構成を示す図であ
る。変換辞書24には、中国語のピンイン読み、声調、
見出し、品詞など、ピンイン漢字変換処理に必要な情報
が登録されている。図3の例では、声調付き(1〜4の
数字で表す)のピンイン読み「mai3dan1」に対
し、見出し「買單」、品詞「動詞」が登録されている
(和訳:勘定)。同様に、声調付きのピンイン読み「y
i1tian1」に対し、見出し「一天」、品詞「名
詞」が登録されている(和訳:一日)。
【0035】なお、ユーザ辞書25についても、同様の
構成であり、中国語のピンイン読み、声調、見出し、品
詞など、ピンイン漢字変換処理に必要な情報が登録され
ている。ただし、ユーザ辞書25には、新語登録時にユ
ーザによって指定された新語情報が登録される。
【0036】図4は声調情報付与テーブル28の構成を
示す図である。声調情報付与テーブル28は、中国語漢
字の声調情報を定義したテーブルであり、登録語句の見
出し、読み、声調といった情報、並びに、声調ルールか
らなる。図4の例では、「買」といった語句の読みが
「mai」であり、声調が「第3声」であることが定義
されている。同様に、語句「單」に対し、読み「da
n」、声調「第1声」、語句「一」に対し、読み「y
i」、声調「第1声」、語句「天」に対し、読み「ti
an」、声調「第1声」が定義されている。
【0037】また、声調ルールは、文章表記と日常の話
し言葉の相違などによる声調の変化(声調のゆれと呼ば
れる)を定義したものである。以下に、代表的な例を挙
げる。
【0038】・声調変化1 第3声の単語が2つの並ぶと、前の第3声は第2声に変
化する。すなわち、「**3**3」→「**2**
3」(**はピンイン) ・声調変化2 「一:yi」のケース (1)「一」が単独or末尾の時→「yi1」 (2)「一」+第1声→「yi4」 例1 「一天」:「yi4tian1」 例2 「一杯」:「yi4bei1」 (3)「一」+第2声→「yi4」 例1 「一年」:「yi4nian2」 例2 「一条」:「yi4tiao2」 (4)「一」+第3声→「yi4」 例1 「一本」:「yi4ben3」 例2 「一尺」:「yi4chi3」 (5)「一」+第4声→「yi2」 例1 「一定」:「yi2ding4」 例2 「一共」:「yi2gong4」 ・声調変化3 「不:bu」のケース (1)「不」が単独or末尾の時→「bu4」 (2)「不」+第1声→「bu4」 例1 「不多」:「bu4duo1」 例2 「不高」:「bu4gao1」 (3)「不」+第2声→「bu4」 例1 「不同」:「bu4tong2」 例2 「不行」:「bu4xing2」 (4)「不」+第3声→「bu4」 例1 「不好」:「bu4hao3」 例2 「不少」:「bu4shao3」 (5)「不」+第4声→「bu2」 例1 「不去」:「bu2qu4」 例2 「不対」:「bu2dui4」 図5は新語登録時に表示される登録用のインタフェース
画面を示す図である。
【0039】所定の操作により新語登録を指示すると、
図5に示すようなインタフェース画面が表示される。こ
のインタフェース画面には、新語登録の対象となる語句
の見出し、読み、品詞、声調といった新語情報を入力す
るための各入力項目31〜34が設けられている。
【0040】ユーザは、これらの入力項目31〜34に
必要な情報をキー入力して、新語登録を行う。この場
合、少なくとも、登録語句の見出しとその読みを語句入
力項目31と読み入力項目32にそれぞれ入力すれば、
新語登録を行うことができる。なお、声調入力項目34
に声調情報を入力する場合には、1音節毎に区切って声
調記号を示す数字を入力するものとする。例えば「買
單」:「mai3dan1」であれば、入力項目34に
「3,1」と入力する。
【0041】次に、第1の実施形態としての処理動作を
説明する。図6は第1の実施形態における新語登録時の
処理動作を示すフローチャートである。
【0042】例えば「新語登録」キーの押下などによ
り、新語登録を指示すると、その情報が入力部21から
制御部22に伝えられる。これにより、制御部22は新
語登録部26に登録開始を指示する。
【0043】新語登録部26は、まず、図5に示すよう
な登録語句の見出しとその読み、品詞、声調情報などの
入力を促すインタフェース画面の表示を出力部29に対
して指示する(ステップA11)。このインタフェース
画面に設けられた入力項目31〜34に、ユーザは登録
語句の見出し、読み、品詞、声調情報を適宜入力した
後、図示せぬ登録ボタン等の押下により登録実行を指示
する。
【0044】新語登録部26は、このインタフェース画
面上で入力された新語情報を受け取ると、その内容をチ
ェック(文字種類、文字数など)した後、その新語情報
の中に声調情報が指定されているか否かを判断する(ス
テップA12)。
【0045】声調情報が指定されていない場合(ステッ
プA12のNo)、声調情報付与部27に処理が渡され
る。声調情報付与部27は声調情報付与テーブル28を
参照して、当該登録語句に適切な声調情報を付与する
(ステップA13)。なお、声調情報を付与する方法に
ついては、後に具体例を挙げて説明する。
【0046】この場合、声調情報付与テーブル28を参
照した結果、当該登録語句に付与する声調情報が一意に
決まれば(ステップA14のNo)、新語登録部26は
その声調情報を声調情報付与部27から取得し、ユーザ
が指定した登録語句の見出し、読み、品詞と共に、これ
らを新語情報としてユーザ辞書25に登録する(ステッ
プA20)。
【0047】しかし、声調のゆれなどにより、当該登録
語句に付与する声調情報が複数考えられる場合には(ス
テップA14のYes)、新語登録部26はそれらの声
調情報を声調情報付与部27から取得した後、ユーザが
指定した読みに各声調情報を付与した形で候補選択画面
に表示するように出力部29に指示する(ステップA1
5)。この候補選択画面の表示により、ユーザは所望の
声調情報を選択することができる(ステップA16)。
【0048】ユーザにより所望の声調情報が選択される
と、新語登録部26はその声調情報を受けて、ユーザが
指定した登録語句の見出し、読み、品詞と共に、これら
を新語情報としてユーザ辞書25に登録する(ステップ
A20)。
【0049】一方、上記ステップA12において、ユー
ザによって声調情報が指定されている場合には、新語登
録部26はその指定された声調情報を登録語句の見出
し、読みと共に声調情報付与部27に渡して、声調チェ
ックを指示する。これにより、声調情報付与部27は、
声調情報付与テーブル28を参照して当該声調情報の妥
当性をチェックする(ステップA17)。
【0050】すなわち、声調情報付与テーブル28に定
義されている語句の見出しとその読み、声調情報との関
係から、ユーザが指定した声調情報が正しいか否かを判
断する。その結果、ユーザが指定した声調情報が正しけ
れば(ステップA18のNo)、新語登録部26はその
結果を受けて、ユーザが指定した登録語句の見出し、読
み、品詞そして声調情報を新語情報としてユーザ辞書2
5に登録する(ステップA20)。
【0051】また、ユーザが指定した声調情報が誤って
いる場合には(ステップA18のYes)、新語登録部
26は声調情報付与部27から正しい声調情報を取得し
(ステップA19)、ユーザが指定した登録語句の見出
し、読み、品詞と共に、これらを新語情報としてユーザ
辞書25に登録する(ステップA20)。
【0052】その際、ユーザが入力した声調情報が誤っ
ている旨をメッセージ表示した後、ユーザに確認の上、
正しい声調情報を登録するようにしても良い。また、正
しいと考えられる声調情報が複数存在した場合には、そ
れらをユーザに提示して選択させるようにしても良い。
【0053】次に、具体例を挙げて説明する。ここで
は、声調情報を以下のような数字で表す。また、読み、
語句以外の品詞などの指定方法は省略するものとする。
【0054】第1声:「1」、第2声:「2」、第3
声:「3」、第4声:「4」 ・動作例1「声調候補が限定できる場合」 (1)新語登録を指示。
【0055】(2)インタフェース画面の表示。 (3)ここで、ユーザが読み「maidan」、語句
「買單」を新語登録対象として指定したとする。なお、
図3に示す変換辞書24には同じ語句が既に登録されて
いる例が示されているが、ここでは変換辞書24にはな
く、ユーザ辞書25に新たに登録する語句として説明す
る。
【0056】(4)登録実行指示。 (5)声調情報が付与されていないので、声調情報付与
部27が声調情報付与テーブル28を参照して声調情報
を判断する。この場合、図4に示すように、声調情報付
与テーブル28には「買:mai」は第3声、「單:d
an」は第1声であることが定義されている。したがっ
て、声調情報は第4声と第1声であると判断できる。
【0057】(6)その結果、読み(声調付き)「ma
i3dan1」と語句「買單」(見出し)をユーザ辞書
25に登録する。 ・動作例2「声調候補が複数ある場合」 通常は、語句(見出し)から声調情報は1つに限定でき
るが、文章表現と話し言葉表現との相違などによる声調
のゆれによって、複数の候補が得られることがある。
【0058】(1)新語登録を指示。 (2)インタフェース画面の表示。 (3)ここで、ユーザが読み「yitian」、語句
「一天」を新語登録対象として指定したとする。なお、
図3に示す変換辞書24には同じ語句が既に登録されて
いる例が示されているが、ここでは変換辞書24にはな
く、ユーザ辞書25に新たに登録する語句として説明す
る。
【0059】(4)登録実行指示。 (5)声調情報が付与されていないので、声調情報付与
部27が声調情報付与テーブル28を参照して声調情報
を判断する。この場合、図4に示すように、声調情報付
与テーブル28には「一:yi」は第1声、「天:ti
an」は第1声であることが定義されているが、声調ル
ールにおいて、話し言葉として用いられる場合、「一:
yi」は第1声の漢字の前では、第4声として扱われる
ことが定義されている。
【0060】(6)その結果、「yi1tian1:一
天」、「yi4tian1:一天」といった2つの候補
が得られる。 (7)上記候補の選択画面を表示し、ユーザに選択させ
る。
【0061】(8)選択された読み(声調付き)として
「yi1tian1」または「yi4tian1」と、
語句(見出し)として「一天」をユーザ辞書25に登録
する。
【0062】このように、新語登録の際に、声調情報を
指定しなくとも、ユーザが指定した語句とその読みから
適切な声調情報が付与され、ユーザ辞書25に登録され
る。したがって、以後、文書作成時において、声調付き
で読みをピンイン入力することにより、ユーザ辞書25
を用いて正確なピンイン漢字変換処理を行うことができ
るようになる。
【0063】また、声調のゆれなどにより複数の声調情
報が考えられる場合に、それらの声調情報に基づいて声
調付きの読みを候補表示することで、ユーザはその中か
ら所望の声調情報を選択することができる。
【0064】また、ユーザが声調情報を指定した際、そ
れが間違っている場合には、自動的に修正して登録、ま
たは、ユーザに注意を促した後、登録することができ
る。例えば、ユーザが声調付きで読み「mai4dan
1」、語句「買單」を新語登録対象として指定したとす
る。この場合、声調情報付与テーブル28に「買:ma
i」は第3声、「單:dan」は第1声であることが定
義されているので、読み「mai」の声調情報は第3声
であると解析される。
【0065】したがって、ユーザが指定した「mai
4」は「mai3」に修正されてユーザ辞書25に登録
される。このように、声調情報を誤って指定した場合で
も、常に正しい声調情報を新語登録することができ、以
後、文書作成時にユーザ辞書25を参照して正しい変換
処理を行うことができる。
【0066】(第2の実施形態)次に、本発明の第2の
実施形態について説明する。図7は本発明の第2の実施
形態に係る中国語入力変換処理装置の機能構成を示すブ
ロック図である。基本的な構成は図2と同様であり、同
一部分には同一符号を付してその説明は省略するものと
する。
【0067】図7において、図2と異なる点は、音声読
上げ部30が設けられていることである。この音声読上
げ部30は、指定された文字列を音声によって読上げる
ためのものである。新語登録時に、ユーザからの指示が
あれば、新語登録部26は音声読み上げ部30に登録対
象として指定された読みを声調情報と共に渡して音声読
上げを指示する。音声読上げ部30は、声調情報が付与
された読みをその声調情報に応じたイントネーションで
読上げる。
【0068】なお、データを音声化して出力する方法
は、一般的な音声合成方式を用いるものとし、ここでは
具体的な説明は省略するものとする。次に、第2の実施
形態としての処理動作を説明する。
【0069】図8は第2の実施形態における新語登録時
の処理動作を示すフローチャートである。なお、基本的
な処理の流れは図6と同様であり、図中のステップB1
1〜B16、ステップB19〜B22までの処理は図6
のステップA11〜A16、ステップA17〜A20ま
での処理と同様である。
【0070】すなわち、例えば「新語登録」キーの押下
などにより、新語登録を指示すると、その情報が入力部
21から制御部22に伝えられる。これにより、制御部
22は新語登録部26に登録開始を指示する。
【0071】新語登録部26は、まず、図5に示すよう
な登録語句の見出しとその読み、品詞、声調情報などの
入力を促すインタフェース画面の表示を出力部29に対
して指示する(ステップB11)。このインタフェース
画面に設けられた入力項目31〜34に、ユーザは登録
語句の見出し、読み、品詞、声調情報を適宜入力した
後、図示せぬ登録ボタン等の押下により登録実行を指示
する。
【0072】新語登録部26は、このインタフェース画
面上で入力された新語情報を受け取ると、その内容をチ
ェック(文字種類、文字数など)した後、その新語情報
の中に声調情報が指定されているか否かを判断する(ス
テップB12)。
【0073】声調情報が指定されていない場合(ステッ
プB12のNo)、声調情報付与部27に処理が渡され
る。声調情報付与部27は声調情報付与テーブル28を
参照して、当該登録語句に適切な声調情報を付与する
(ステップB13)。なお、声調情報を付与する方法に
ついては、後に具体例を挙げて説明する。
【0074】この場合、声調情報付与テーブル28を参
照した結果、当該登録語句に付与する声調情報が一意に
決まれば(ステップB14のNo)、新語登録部26は
その声調情報を声調情報付与部27から取得し、ユーザ
が指定した登録語句の見出し、読み、品詞と共に、これ
らを新語情報としてユーザ辞書25に登録する(ステッ
プB22)。
【0075】しかし、声調のゆれなどにより、当該登録
語句に付与する声調情報が複数考えられる場合には(ス
テップB14のYes)、新語登録部26はそれらの声
調情報を声調情報付与部27から取得した後、ユーザが
指定した読みに各声調情報を付与した形で候補選択画面
に表示するように出力部29に指示する(ステップB1
5)。この候補選択画面の表示により、ユーザは所望の
声調情報を選択することができる(ステップB16)。
【0076】ユーザにより所望の声調情報が選択される
と、新語登録部26はその声調情報を受けて、ユーザが
指定した登録語句、読み、品詞と共に、これらを新語情
報としてユーザ辞書25に登録する(ステップB2
2)。
【0077】ここで、第2の実施形態では、ユーザが所
望の声調情報を選択した際に、例えば「読上げ」キーの
押下などにより音声読上げを指示すると(ステップB1
7のYes)、その指示情報が新語登録部26に送られ
る。この音声読上げの指示を受けた新語登録部26は、
ユーザが選択した声調情報と当該登録語句の読みの情報
を音声読上げ部30に送る。音声読上げ部30は、これ
らの情報に基づいて声調付きの読みを発生する(ステッ
プB18)。この場合、選択された声調情報に応じたイ
ントネーションで読みを音声出力することになる。
【0078】このように、候補表示された声調付きの読
みを音声にて確認することができる。その結果、所望の
声調情報を正しく選択することができる。一方、上記ス
テップB12において、ユーザによって声調情報が入力
されている場合には、新語登録部26はその指定された
声調情報を登録語句の見出し、読みと共に声調情報付与
部27に渡して、声調チェックを指示する。これによ
り、声調情報付与部27は、声調情報付与テーブル28
を参照して当該声調情報の妥当性をチェックする(ステ
ップB19)。
【0079】すなわち、声調情報付与テーブル28に定
義されている語句の見出しとその読み、声調情報との関
係から、ユーザが指定した声調情報が正しいか否かを判
断する。その結果、ユーザが指定した声調情報が正しけ
れば(ステップB20のNo)、新語登録部26はその
結果を受けて、ユーザが指定した登録語句の見出し、読
み、品詞そして声調情報を新語情報としてユーザ辞書2
5に登録する(ステップB22)。
【0080】また、ユーザが指定した声調情報が誤って
いる場合には(ステップB20のYes)、新語登録部
26は声調情報付与部27から正しい声調情報を取得し
(ステップB21)、ユーザが指定した登録語句の見出
し、読み、品詞と共に、これらを新語情報としてユーザ
辞書25に登録する(ステップB22)。
【0081】その際、ユーザが入力した声調情報が誤っ
ている旨をメッセージ表示あるいは音声出力した後、ユ
ーザに確認の上、正しい声調情報を登録するようにして
も良い。また、正しいと考えられる声調情報が複数存在
した場合には、それらをユーザに提示して選択させるよ
うにしても良い。
【0082】次に、具体例を挙げて説明する。ここで
は、声調情報を以下のような数字で表す。また、読み、
語句以外の品詞などの指定方法は省略するものとする。
【0083】第1声:「1」、第2声:「2」、第3
声:「3」、第4声:「4」 動作例1「声調候補が複数ある場合」 (1)新語登録を指示。
【0084】(2)インタフェース画面の表示。 (3)ここで、ユーザが読み「yitian」、語句
「一天」を新語登録対象として指定したとする。なお、
図3に示す変換辞書24には同じ語句が既に登録されて
いる例が示されているが、ここでは変換辞書24にはな
く、ユーザ辞書25に新たに登録する語句として説明す
る。
【0085】(4)登録実行指示。 (5)声調情報が付与されていないので、声調情報付与
部27が声調情報付与テーブル28を参照して声調情報
を判断する。この場合、図4に示すように、声調情報付
与テーブル28には「一:yi」は第1声、「天:ti
an」は第1声であることが定義されているが、声調ル
ールにおいて、話し言葉として用いられる場合、「一:
yi」は第1声の漢字の前では、第4声として扱われる
ことが定義されている。
【0086】(6)その結果、「yi1tian1:一
天」、「yi4tian1:一天」といった2つの候補
が得られる。 (7)そこで、上記候補の選択画面を表示し、ユーザに
選択を促す。
【0087】(8)しかし、ユーザが声調について十分
な知識がない場合、画面上の文字列からだけでは、どち
らが正しいのかを判別することは難しい。そこで、音声
読上げを指示することにより、指定された声調付きの読
みが発声され、確認することができる。
【0088】(9)選択された読み(声調付き)として
「yi1tian1」または「yi4tian1」と、
語句(見出し)として「一天」をユーザ辞書25に登録
する。
【0089】このように、新語登録の際に、声調情報を
指定しなくとも、ユーザが指定した語句とその読みから
適切な声調情報が付与され、ユーザ辞書25に登録され
る。したがって、以後、文書作成時において、声調付き
で読みをピンイン入力することにより、ユーザ辞書25
を用いて正確なピンイン漢字変換処理を行うことができ
るようになる。
【0090】また、声調のゆれなどにより複数の声調情
報が考えられる場合に、それらの声調情報に基づいて声
調付きの読みを候補表示し、さらに、それらの候補を音
声で読上げることで、ユーザは所望の声調情報を的確に
選択することができる。これにより、より正確な新語登
録を行うことができるようになる。
【0091】また、ユーザが声調情報を指定した際、そ
れが間違っている場合には、自動的に修正して登録、ま
たは、ユーザに注意を促した後、登録することができ
る。例えば、ユーザが声調付きで読み「yi2tian
1」、語句「一天」を新語登録対象として指定したとす
る。この場合、声調情報付与テーブル28には、「一:
yi」は第1声、「天:tian」は第1声であること
が定義されており、また、声調ルールでは、口語上、
「一:yi」は第1声の漢字の前では、第4声として扱
われることが定義されているので、読み「yi」の声調
情報は第1声または第4声であると解析される。
【0092】したがって、ユーザが指定した「yi2」
は「yi1」または「yi4」に修正されてユーザ辞書
25に登録することができる。なお、上記第2の実施形
態では、複数の声調情報が得られた場合に(ステップB
14のYes)、音声読み上げ指示により、音声にて声
調情報の確認を行うようにしたが、例えば声調情報が1
つしかない場合(ステップB14のNo)や、ユーザが
声調情報を指定した場合(ステップB12のYes)で
あっても、必要に応じて音声読み上げを指示すること
で、音声にてその声調情報の確認を行うことができる。
【0093】また、上記第1および第2の実施形態で
は、中国語変換を行う場合での新語登録ついて説明した
が、本発明は中国語に限らず、発音情報を用いて変換可
能な他の言語変換処理についても有効に活用することが
できる。
【0094】また、上述した各実施形態において記載し
た手法は、コンピュータに実行させることのできるプロ
グラムとして、例えば磁気ディスク(フロッピーディス
ク、ハードディスク等)、光ディスク(CD−ROM、
DVD等)、半導体メモリなどの記録媒体に書き込んで
各種装置に適用したり、通信媒体により伝送して各種装
置に適用することも可能である。本装置を実現するコン
ピュータは、記録媒体に記録されたプログラムを読み込
み、このプログラムによって動作が制御されることによ
り、上述した処理を実行する。
【0095】
【発明の効果】以上のように本発明によれば、新語登録
時に、声調情報が指定されていなかった場合に、声調に
関する情報を記憶した声調テーブルを参照して当該登録
語句に対応する声調情報を取得し、この声調情報と当該
登録語句の読みと見出しを新語情報として変換辞書に登
録するようにしたため、新語登録時に声調情報を指定し
なくとも、登録語句に対応する適切な声調情報を付与し
て新語登録することができる。
【0096】また、新語登録時に、声調情報が指定され
た場合に、声調に関する情報を記憶した声調テーブルを
参照して上記指定された声調情報が正しいか否かを判断
し、その判断結果に応じて上記指定された声調情報を適
切な声調情報に修正し、この修正された声調情報と当該
登録語句の読みと見出しを新語情報として変換辞書に登
録するようにしたため、新語登録時に声調情報を指定し
た際に、その声調情報が誤っている場合にはその声調情
報を正しく修正して新語登録することができる。
【図面の簡単な説明】
【図1】本発明の中国語入力変換処理装置のシステム構
成を示すブロック図。
【図2】本発明の第1の実施形態に係る中国語入力変換
処理装置の機能構成を示すブロック図。
【図3】上記図2の変換辞書の構成を示す図。
【図4】上記図2の声調情報付与テーブルの構成を示す
図。
【図5】新語登録時に表示される登録用のインタフェー
ス画面を示す図。
【図6】第1の実施形態における新語登録時の処理動作
を示すフローチャート。
【図7】本発明の第2の実施形態に係る中国語入力変換
処理装置の機能構成を示すブロック図。
【図8】第2の実施形態における新語登録時の処理動作
を示すフローチャート。
【符号の説明】
21…入力部 22…制御部 23…変換部 24…変換辞書 25…ユーザ辞書 26…新語登録部 27…声調情報付与部 28…声調情報付与テーブル 29…出力部 30…音声読上げ部 31…語句入力項目 32…読み入力項目 33…品詞入力項目 34…声調入力項目
フロントページの続き (72)発明者 竹内 朝一 東京都青梅市新町1385番地 東芝ソフトウ ェアエンジニアリング株式会社内 Fターム(参考) 5B009 ME21 MF04 RD02 TB01 VB13

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 中国語漢字の読みと見出し、声調情報が
    登録された変換辞書を参照して、入力された声調付きの
    読み文字列を中国語漢字に変換する中国語入力変換処理
    装置において、 新語登録時に、その登録語句の見出しと読み、声調情報
    を指定する登録指定手段と、 声調に関する情報を記憶した声調テーブルと、 上記登録指定手段によって声調情報が指定されなかった
    場合に、上記声調テーブルを参照して当該登録語句に対
    応する声調情報を判断する声調判断手段と、 この声調判断手段によって得られた声調情報と当該登録
    語句の読みと見出しを新語情報として上記変換辞書に登
    録する新語登録手段とを具備したことを特徴とする中国
    語入力変換処理装置。
  2. 【請求項2】 上記声調判断手段によって複数の声調情
    報が得られた場合に、当該登録語句の読みにこれらの声
    調情報を付与した形で声調情報の候補を表示する声調候
    補表示手段と、 この声調候補表示手段によって表示された声調情報を選
    択する声調選択手段とを有し、 上記新語登録手段は、この声調選択手段によって選択さ
    れた声調情報と当該登録語句の読みと見出しを新語情報
    として上記変換辞書に登録することを特徴とする請求項
    1記載の中国語入力変換処理装置。
  3. 【請求項3】 上記声調判断手段によって声調情報が得
    られた場合に、その声調情報を当該登録語句の読みに付
    与し、その声調付きの読みを音声によって発生する音声
    読上げ手段を具備したことを特徴とする請求項1記載の
    中国語入力変換処理装置。
  4. 【請求項4】 中国語漢字の読みと見出し、声調情報が
    登録された変換辞書を参照して、入力された声調付きの
    読み文字列を中国語漢字に変換する中国語入力変換処理
    装置において、 新語登録時に、その登録語句の見出しと読み、声調情報
    を指定する登録指定手段と、 声調に関する情報を記憶した声調テーブルと、 上記登録指定手段によって声調情報が指定された場合
    に、上記声調テーブルを参照して上記指定された声調情
    報が正しいか否かを判断し、その判断結果に応じて上記
    指定された声調情報を適切な声調情報に修正する声調修
    正手段と、 この声調修正手段によって修正された声調情報と当該登
    録語句の読みと見出しを新語情報として上記変換辞書に
    登録する新語登録手段とを具備したことを特徴とする中
    国語入力変換処理装置。
  5. 【請求項5】 上記登録指定手段によって指定された声
    調情報あるいは上記声調修正手段によって修正された声
    調情報を当該登録語句の読みに付与し、その声調付きの
    読みを音声によって発生する音声読上げ手段を具備した
    ことを特徴とする請求項4記載の中国語入力変換処理装
    置。
  6. 【請求項6】 中国語入力変換処理に用いられる変換辞
    書に任意の語句を新語登録するための新語登録方法であ
    って、 新語登録時に、その登録語句の見出しと読みと共に声調
    情報が指定されたか否かを判断し、 声調情報が指定されていなかった場合に、声調に関する
    情報を記憶した声調テーブルを参照して当該登録語句に
    対応する声調情報を取得し、 この声調情報と当該登録語句の読みと見出しを新語情報
    として上記変換辞書に登録することを特徴とする新語登
    録方法。
  7. 【請求項7】 中国語入力変換処理に用いられる変換辞
    書に任意の語句を新語登録するための新語登録方法であ
    って、 新語登録時に、その登録語句の見出しと読みと共に声調
    情報が指定されたか否かを判断し、 声調情報が指定された場合に、声調に関する情報を記憶
    した声調テーブルを参照して上記指定された声調情報が
    正しいか否かを判断し、その判断結果に応じて上記指定
    された声調情報を適切な声調情報に修正し、 この修正された声調情報と当該登録語句の読みと見出し
    を新語情報として上記変換辞書に登録することを特徴と
    する新語登録方法。
  8. 【請求項8】 中国語入力変換処理に用いられる変換辞
    書に任意の語句を新語登録するためのプログラムを記録
    した記録媒体であって、 新語登録時に、その登録語句の見出しと読みと共に声調
    情報が指定されたか否かを判断する手順と、 声調情報が指定されていなかった場合に、声調に関する
    情報を記憶した声調テーブルを参照して当該登録語句に
    対応する声調情報を取得する手順と、 この声調情報と当該登録語句の読みと見出しを新語情報
    として上記変換辞書に登録する手順とをコンピュータに
    実行させるプログラムを記録したコンピュータ読取り可
    能な記録媒体。
  9. 【請求項9】 中国語入力変換処理に用いられる変換辞
    書に任意の語句を新語登録するためのプログラムを記録
    した記録媒体であって、 新語登録時に、その登録語句の見出しと読みと共に声調
    情報が指定されたか否かを判断する手順と、 声調情報が指定された場合に、声調に関する情報を記憶
    した声調テーブルを参照して上記指定された声調情報が
    正しいか否かを判断し、その判断結果に応じて上記指定
    された声調情報を適切な声調情報に修正する手順と、 この修正された声調情報と当該登録語句の読みと見出し
    を新語情報として上記変換辞書に登録する手順とをコン
    ピュータに実行させるプログラムを記録したコンピュー
    タ読取り可能な記録媒体。
JP10168788A 1998-06-16 1998-06-16 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体 Pending JP2000003355A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10168788A JP2000003355A (ja) 1998-06-16 1998-06-16 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10168788A JP2000003355A (ja) 1998-06-16 1998-06-16 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体

Publications (1)

Publication Number Publication Date
JP2000003355A true JP2000003355A (ja) 2000-01-07

Family

ID=15874490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10168788A Pending JP2000003355A (ja) 1998-06-16 1998-06-16 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体

Country Status (1)

Country Link
JP (1) JP2000003355A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193595A (ja) * 2003-02-26 2009-08-27 Xerox Corp 中国語方言判断プログラム
JP2014059422A (ja) * 2012-09-18 2014-04-03 Casio Comput Co Ltd 中国語表示制御装置、中国語表示制御プログラム及び中国語表示制御方法
JP2016012319A (ja) * 2014-06-30 2016-01-21 カシオ計算機株式会社 組合せ単語登録装置およびプログラム
WO2021107445A1 (ko) * 2019-11-25 2021-06-03 주식회사 데이터마케팅코리아 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193595A (ja) * 2003-02-26 2009-08-27 Xerox Corp 中国語方言判断プログラム
JP2014059422A (ja) * 2012-09-18 2014-04-03 Casio Comput Co Ltd 中国語表示制御装置、中国語表示制御プログラム及び中国語表示制御方法
JP2016012319A (ja) * 2014-06-30 2016-01-21 カシオ計算機株式会社 組合せ単語登録装置およびプログラム
WO2021107445A1 (ko) * 2019-11-25 2021-06-03 주식회사 데이터마케팅코리아 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치

Similar Documents

Publication Publication Date Title
US6446041B1 (en) Method and system for providing audio playback of a multi-source document
US6853971B2 (en) Two-way speech recognition and dialect system
US7277851B1 (en) Automated creation of phonemic variations
US6490563B2 (en) Proofreading with text to speech feedback
JP4833313B2 (ja) 中国語方言判断プログラム
JP2001092484A (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
US20090281808A1 (en) Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device
JP2005241829A (ja) 音声情報処理システム、音声情報処理方法及びプログラム
JP5088109B2 (ja) 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置
JP2000003355A (ja) 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体
JP2008009507A (ja) 外国語の発音のカタカナ表記方法
Mossige et al. How do technologies meet the needs of the writer with dyslexia? An examination of functions scaffolding the transcription and proofreading in text production aimed towards researchers and practitioners in education
JP6411015B2 (ja) 音声合成装置、音声合成方法、およびプログラム
JP2580565B2 (ja) 音声情報辞書作成装置
JP2003202886A (ja) テキスト入力処理装置及び方法並びにプログラム
JPH11259094A (ja) 規則音声合成装置
JP2001014304A (ja) 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体
JP4208819B2 (ja) 音声合成辞書登録方法および装置
JPH05210482A (ja) 発音辞書管理方法
JP6340839B2 (ja) 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム
JPH1196141A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP2023144953A (ja) 発話評価装置及びプログラム
JP2023006055A (ja) プログラム、情報処理装置、方法
JP2006091105A (ja) 単語学習装置及びその音声出力方法並びにプログラム
JP2020181141A (ja) 歌詞入力方法およびプログラム