JPH08272780A - 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 - Google Patents

中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法

Info

Publication number
JPH08272780A
JPH08272780A JP8001662A JP166296A JPH08272780A JP H08272780 A JPH08272780 A JP H08272780A JP 8001662 A JP8001662 A JP 8001662A JP 166296 A JP166296 A JP 166296A JP H08272780 A JPH08272780 A JP H08272780A
Authority
JP
Japan
Prior art keywords
character string
character
chinese
pinyin
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8001662A
Other languages
English (en)
Inventor
Fuyuki Maruyama
冬樹 丸山
Akira Sai
陽 佐井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP8001662A priority Critical patent/JPH08272780A/ja
Publication of JPH08272780A publication Critical patent/JPH08272780A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 ピンインに関して完全な地時を持たない(例
えば、母音(韻母)部分に関する知識が不足し曖昧な場
合など)操作者でも容易に効率よく入力が可能な中国語
入力装置及び中国語入力処理方法を得る。 【解決手段】 中国語入力時、曖昧なピンイン文字列の
替わりに記号文字を用いる。入力手段1において入力さ
れた文字列を中国語音節分割手段5により中国語の音節
に分割する。ピンイン文字列生成手段9は、音節の中に
記号文字が含まれているか否か判定する。記号文字が含
まれている場合、記号文字を文法上可能なピンイン文字
列に置き換え、ピンイン文字列の候補リストを生成す
る。単語範囲設定手段6で一単語をいくつの音節にする
か設定し、中国語変換手段7により中国語に変換する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータやワ
ードプロセッサなどにおいて、中国語のピンインに関す
る知識が十分でない(例えばピンイン文字列が曖昧な)
操作者でも容易に効率よく入力が可能な中国語入力処理
装置及び中国語入力処理方式に関するものである。ま
た、中国語や日本語のような複数種類の文字種からなる
言語の言語処理装置及び言語処理方法に関するものであ
る。
【0002】
【従来の技術】
従来例1.中国語のワープロ等ではピンイン入力方式が
よく用いられており、補助入力として、GBコードや字
形コードを用いた入力が用いられている。ピンインとは
中国語文字の発音をアルファベットで表記したものであ
る。ピンイン入力方式は中国語文字の発音をピンインで
キーボードから入力し期待する中国語文字列に変換する
ものである。このとき、ピンイン文字列に対応する中国
語文字列は必ずしも1対1対応ではなく、同じピンイン
文字列に対応する中国語文字列が複数存在する場合があ
る。この場合は通常、中国語文字列候補を複数表示し、
その中から操作者が所望の中国語文字列を選択するよう
になっている。
【0003】従来の中国語入力処理装置のピンイン入力
方式として以下のようなものがある。図28に従来の入
力例15を示す。入力された同一のピンイン文字に対し
て異なる中国語文字があるので複数の候補の中から選択
するという操作が発生する。そこでピンイン文字列の後
にアクセントを示す声調情報を付与して入力すれば、複
数の候補を絞り込むことができ、操作をある程度容易に
することができる。声調情報は5種類あり、アクセント
の違いにより、たとえば0から4までの数字情報を付け
る。
【0004】また、図28に従来の入力例16を示す。
ピンイン文字列にアクセントを示す声調情報を付与する
入力方式は、中国語2文字以上からなる単語の場合に、
同音のものがあるときに効果がある。声調情報はすべて
のピンインに付ける必要はなく、部分的であってもよ
い。
【0005】また、図28に従来の入力例17を示す。
同じくピンイン入力を基本とするが、各中国語文字に対
応するピンインの先頭文字だけを使用するこの入力方式
は、入力操作数を減らすことができ、中国語文字が2以
上からなる単語の場合に特に有効である。入力例17の
場合、入力された頭文字2個をピンインの先頭文字とす
る単語を辞書から探して選択するものである。
【0006】また、入力されたピンイン文字列を中国語
文字列に変換する際の単語範囲の設定方式に関するもの
では、特願平4−167159があった。しかし、ピン
インに関して正確な知識を持たない操作者が入力した場
合、正しい中国語文字列に変換することができなかっ
た。
【0007】従来例2.また、単語の綴りが不明な英単
語の検索ツールとして、英語辞書検索ツール”The
American Heritage Diction
ary”がある。使用者は、”invent”で始まる
単語で所望の単語の綴りが曖昧な場合、”inven
t”と入力する。”The American Her
itageDictionary”は、図29に示すよ
うに”invent”で始まる単語をリストアップし、
表示装置に表示する。使用者は、必要があればリストア
ップされた単語の中からどれかを選択して選択した単語
の意味を辞書の内容を参照して調べる。図30は、mと
tの間に任意文字1個を含む単語を検索しリストアップ
する例である。使用者が”m?t”と入力すると、図3
0に示す単語候補が表示される。また、mとtの間に任
意の文字列を含む単語も得ることができる。この場合使
用者は、”m*t”と入力する。該当する単語が表示さ
れるが500以上表示される。このように、既存の英単
語の検索ツールは、単語候補を多数表示し、表示された
多くのアルファベットの文字列の中から使用者がアルフ
ァベットの文字列を確認し、本来望むものを選択するも
のであった。しかし、前述した検索方法は、英語やフラ
ンス語などの単一な文字種からなる言語では適用できる
が、中国語や日本語などの複数の文字種からなりひとつ
の文字種から他の文字種へ変換する必要がある言語では
適用できないという問題点があった。以下、漢字をひと
つの文字種とし、日本語のひらがな、又はカタカナのよ
うに漢字の発音を表す文字を他の文字種とする。また、
日本語のローマ字、中国語のピンインのように漢字およ
び中国語の発音を表す記号もまたひとつの文字種とみな
す。
【0008】
【発明が解決しようとする課題】従来の中国語入力処理
装置及び中国語入力処理方法では、基本的に操作者が正
しいピンイン綴りを知識としてもっていないと使えない
ものであり、存在しないピンイン文字列あるいは違った
ピンイン文字列を入力した場合は正しい中国語文字列に
変換することはできないという問題点があった。また、
従来の言語処理装置において、例えばアルファベットの
1種類の文字種からなる英語のような言語の処理装置に
おいては、文字綴りが不明な場合必要な単語を容易に検
索することができる。しかし、中国語や日本語のような
複数種類の文字種からなる言語に関しては、操作者が入
力に用いる文字種の文字綴りを正しく知らないと、出力
に用いられる文字種の文字綴りが正しく得られないとい
う問題点があった。
【0009】本発明は、このような課題を解消するため
になされたもので、ピンインに関して十分な知識を持た
ない、例えば、母音(韻母)部分に関する知識が不足し
曖昧な操作者でも、容易に効率よく入力が可能な中国語
入力処理装置及び中国語入力処理方法を得ることを目的
としている。また、本発明は、従来のピンイン入力方式
と適合性を持たせ、本発明に係わる入力方式と従来のピ
ンイン入力方式のいずれの入力に対しても容易に効率よ
く入力が可能な中国語入力処理装置及び中国語入力処理
方法を得ることを目的としている。また、本発明は、異
なる文字種間で交換を行いながら言語を入力する場合
に、容易に効率よく入力が可能な言語処理装置及び言語
処理方法を得ることを目的とする。
【0010】
【課題を解決するための手段】この発明に係る中国語入
力処理装置は、ピンイン文字列を入力し中国語文字列に
変換して表示する中国語入力処理装置であって、以下の
要素を有し、入力するピンイン文字列内でピンイン文字
列の替わりに任意文字列を表す記号文字を入力して所望
の中国語文字列に変換して表示することを特徴とする。 (a)中国語のピンイン文字列、及びピンイン文字列内
でピンイン文字列の替わりに任意文字列を表す記号文字
を入力する入力手段、(b)上記入力手段より入力され
た文字列を中国語の音節区分に分割する中国語音節分割
手段、(c)中国語の各音節区分毎に標準ピンイン文字
列か否かを解析し、標準ピンイン文字列の場合にはそれ
を出力し、ピンイン文字列内でピンイン文字列の替わり
に任意文字列を表す記号文字が使われている場合には理
論的に可能性のあるピンイン文字列候補を生成し出力す
る文字列生成手段、(d)中国語文字列とピンイン情報
とを共に格納している辞書手段、(e)上記の得られた
ピンイン文字列候補を上記辞書手段を参照して中国語文
字列候補に変換する中国語変換手段、(f)上記中国語
変換手段により変換された中国語文字列候補を表示する
表示手段。
【0011】この発明に係る中国語入力装置は、ピンイ
ン文字列を入力し中国語文字列に変換して表示する中国
語入力処理装置であって、以下の要素を有し、ピンイン
文字列内でピンイン文字の替わりに任意文字を表す記号
文字を入力して所望の中国語文字列に変換して表示する
ことを特徴とする。 (a)中国語入力にピンイン文字列と、ピンイン文字列
内でピンイン文字の替わりに任意文字を表す記号文字を
入力する入力手段、(b)上記入力手段より入力された
文字列を中国語の音節区分に分割する中国語音節分割手
段、(c)中国語の各音節区分毎に標準ピンイン文字列
か否かを解析し、標準ピンイン文字列の場合にはそれを
出力し、ピンイン文字列内でピンイン文字の替わりに任
意文字を表す記号文字が使われている場合には理論的に
可能性のあるピンイン文字列候補を生成し出力する文字
列生成手段、(d)中国語文字列とピンイン情報とを共
に格納している辞書手段、(e)上記の得られたピンイ
ン文字列候補を上記辞書手段を参照して中国語文字列候
補に変換する中国語変換手段、(f)上記中国語変換手
段により変換された中国語文字列候補を表示する表示手
段。
【0012】この発明に係る中国語入力装置は、ピンイ
ン文字列を入力し中国語文字列に変換して表示する中国
語入力処理装置であって、以下の要素を有し、ピンイン
の頭文字の直後に声調情報を表す記号文字を使用して所
望の中国語文字列に変換して表示することを特徴とす
る。 (a)中国語入力にピンイン文字列、ピンインの頭文字
の直後に声調情報を表す記号文字を入力する入力手段、
(b)上記入力手段より入力された文字列を中国語の音
節区分に分割する中国語音節分割手段、(c)中国語文
字列とピンイン情報とを共に格納している辞書手段、
(d)上記辞書手段を参照して、上記中国語の音節区分
に分割された文字列を中国語文字列候補に変換し、かつ
ピンインの頭文字の直後に声調情報を表す記号文字が使
われている場合にはその声調情報を単語絞り込みに使用
する中国語変換手段、(e)上記中国語変換手段により
変換された中国語文字列候補を表示する表示手段。
【0013】この発明に係る中国語入力処理方法は、ピ
ンイン文字列を入力し中国語文字列に変換して表示する
中国語入力処理方法であって、以下のステップを有し、
入力するピンイン文字列内でピンイン文字列の替わり
に、任意文字列を表す記号文字を入力して所望の中国語
文字列に変換処理することを特徴とする。 (a)中国語のピンイン文字列、及びピンイン文字列内
でピンイン文字列の替わりに任意文字列を表す記号文字
を入力するステップ、(b)上記文字列を中国語の音節
区分に分割するステップ、(c)中国語の各音節区分毎
に標準ピンイン文字列か否かを解析し、標準ピンイン文
字列の場合にはそれを出力し、ピンイン文字列内でピン
イン文字列の替わりに任意文字列を表す記号文字が使わ
れている場合には理論的に可能性のあるピンイン文字列
候補を生成し出力するステップ、(d)中国語文字列と
ピンイン情報とを共に格納している辞書手段を参照して
上記の出力されたピンイン文字列候補を中国語文字列候
補に変換するステップ、(e)上記変換された中国語文
字列候補を表示するステップ。
【0014】この発明に係る中国語入力処理方法は、ピ
ンイン文字列を入力し中国語文字列に変換して表示する
中国語入力処理方法であって、以下のステップを有し、
ピンイン文字列内でピンイン文字の替わりに任意文字を
表す記号文字を入力して所望の中国語文字列に変換して
表示することを特徴とする。 (a)中国語入力にピンイン文字列と、ピンイン文字列
内でピンイン文字の替わりに任意文字を表す記号文字を
入力するステップ、(b)入力された文字列を中国語の
音節区分に分割するステップ、(c)中国語の各音節区
分毎に標準ピンイン文字列か否かを解析し、標準ピンイ
ン文字列の場合にはそれを出力し、ピンイン文字列内で
ピンイン文字の替わりに任意文字を表す記号文字が使わ
れている場合には理論的に可能性のあるピンイン文字列
候補を生成し出力するステップ、(d)中国語文字列と
ピンイン情報とを共に格納している辞書手段を参照し
て、上記のピンイン文字列候補を中国語文字列候補に変
換するステップ、(e)変換された中国語文字列候補を
表示するステップ。
【0015】この発明に係る中国語入力処理方法は、ピ
ンイン文字列を入力し中国語文字列に変換して表示する
中国語入力処理方法であって、以下のステップを有し、
ピンインの頭文字の直後に声調情報を表す記号文字を使
用して所望の中国語文字列に変換して表示することを特
徴とする。 (a)中国語入力にピンイン文字列、ピンインの頭文字
の直後に声調情報を表す記号文字を入力するステップ、
(b)入力された文字列を中国語の音節区分に分割する
ステップ、(c)中国語文字列とピンイン情報とを共に
格納している辞書手段を参照して、上記中国語の音節区
分に分割された文字列を中国語文字列に変換し、かつピ
ンインの頭文字の直後に声調情報を表す記号文字が使わ
れている場合にはその声調情報を単語絞り込みに使用す
るステップ、(d)変換された中国語文字列候補を表示
するステップ。
【0016】この発明に係る言語処理装置は、少なくと
も第1と第2の文字種により構成される言語の言語処理
装置において、以下の要素を有することを特徴とする。 (a)記号文字を含む上記第1の文字種からなる文字列
を入力する入力手段、(b)上記入力手段より入力され
た文字列に記号文字が使われているか否かを解析し、記
号文字が使われている場合は、記号文字を上記言語の文
法上可能性のある文字列に置き換えて第1の文字種から
なる文字列候補を生成する文字列生成手段、(c)上記
第1の文字種の文字列と対応する第2の文字種の文字列
を格納している辞書手段、(d)上記文字列生成手段に
より得られた第1の文字種からなる文字列候補を上記辞
書手段を参照して、対応する第2の文字種の文字列候補
に変換する変換手段、(e)上記変換手段により変換さ
れた第2の文字種の文字列候補を出力する出力手段。
【0017】上記言語処理装置は、さらに、上記入力手
段より入力された文字列を第2の文字種に対応する音節
を表す第1の文字種からなる文字列に分割する音節分割
手段を有することを特徴とする。
【0018】上記入力手段から入力される記号文字を含
む第1の文字種から成る文字列は、既知の部分の文字列
を構成する第1の文字種から成る文字と不明な部分の文
字列の文字の代わりに任意文字列を表す記号文字とから
構成されることを特徴とする。
【0019】上記任意文字列を表す記号文字は、一文字
に対応することを特徴とする。
【0020】上記任意文字列を表す記号文字は、複数文
字に対応することを特徴とする。
【0021】上記言語は中国語であり、上記入力手段に
より入力される第1の文字種はピンイン文字であり、上
記辞書手段は、ピンイン文字とピンイン文字列に対応す
る中国語文字列を格納し、上記変換工程はピンイン文字
列候補を上記辞書手段を参照してピンイン文字列に対応
する中国語文字列候補に変換することを特徴とする。
【0022】上記文字列生成手段は、文法上可能性のあ
るピンイン文字列の組み合わせを記憶したテーブルを備
え、上記既知の部分の文字列を用いて上記テーブルを検
索することにより文法上可能性のあるピンイン文字列候
補を生成することを特徴とする。
【0023】上記言語は中国語であり、上記入力手段は
ピンイン文字列の頭文字とピンイン文字列の頭文字の直
後に声調情報を表す記号文字を入力し、上記辞書手段は
上記ピンイン文字列の頭文字と声調情報と対応する中国
語文字列を格納し、上記変換工程は、上記辞書手段を参
照して上記ピンイン文字列の頭文字と声調情報から対応
する中国語文字列候補に変換することを特徴とする。
【0024】上記言語は日本語であり、上記入力手段に
より入力される第1の文字種は仮名文字であることを特
徴とする。
【0025】この発明に係る言語処理方法は、少なくと
も第1と第2の文字種により構成される言語の言語処理
方法において、以下の工程を有することを特徴とする。 (a)上記第1の文字種からなる所定の文字列のうち、
既知の部分の文字列を構成する文字と、不明な部分の文
字列の文字の代わりに任意文字列を表す記号文字とを入
力する入力工程、(b)上記入力工程より入力された文
字列に任意文字列を表す記号文字が使われているか否か
を解析し、記号文字が使われている場合は、文法上可能
性のある第1の文字種からなる文字列候補を生成する文
字列生成工程、(c)上記文字列生成工程により得られ
た第1の文字種からなる文字列候補を、上記第1の文字
種の文字列と対応する第2の文字種の文字列を格納して
いる辞書を参照して、対応する第2の文字種の文字列に
変換する変換工程、(d)上記変換工程により変換され
た第2の文字種の文字列候補を出力する出力工程。
【0026】上記言語処理方法は、さらに、上記入力工
程より入力された文字列を第2の文字種に対応する音節
を表す第1の文字種からなる文字列に分割する音節分割
工程を有することを特徴とする。
【0027】上記入力工程は、上記任意文字列を表す記
号文字を、一文字に対応させて入力することを特徴とす
る。
【0028】上記入力工程は、上記任意文字列を表す記
号文字を、複数文字に対応させて入力することを特徴と
する。
【0029】上記入力工程は、第一の文字種としてピン
イン文字を入力し、上記変換工程はピンイン文字列をピ
ンイン文字列に対応する中国語文字列に変換することを
特徴とする。
【0030】
【発明の実施の形態】
実施の形態1.この実施の形態は、ピンイン綴りについ
て正しい知識のない操作者でも扱える中国語入力処理装
置及び中国語処理方法について述べる。図1は、この実
施の形態で用いるハードウェア構成を示す図である。図
1において、100は処理装置、101はキーボード、
102は表示装置、103はディスク装置、104はプ
リンタである。105はマウス、106はマウスパッド
である。図2は、この発明の中国語入力処理装置の構成
を示すブロック図である。図2において、1は入力手段
である。入力手段1は、少なくともアルファベットキ
ー、数字キー、変換キー、確定キーを備えたキーボード
101を備える。2は文字列変換部3と辞書4からなる
制御部であり、変換の対象となる文字列や制御指示が入
力手段1を介して入力されると、制御プログラムに従っ
て後述するデータ処理を行う。辞書4の一例を図3に示
す。図3の辞書4は、ピンイン文字列と中国語の対応を
示すピンイン・中国語辞書の一部である。文字列変換部
3は、以下に説明する中国語音節分割手段5、ピンイン
文字列生成手段9、単語範囲設定手段6、中国語変換手
段7からなる。
【0031】5は入力文字列を中国語の音節に基づいて
音節区分に分割する中国語音節分割手段であり、基本的
に入力文字列は声母、または韻母、または声母+韻母の
いずれかとなるように区切られる。9は入力文字列を解
析し、標準のピンイン文字列候補を生成するピンイン文
字列生成手段である。6は音節区分に分割されたピンイ
ン文字列から単語の範囲の設定を行う単語範囲設定手段
である。7はピンイン文字列候補に対応する中国語文字
列候補に変換する中国語変換手段である。8は変換され
た中国語文字列を表示する表示手段である。表示手段8
は表示装置102を備えている。また、図1で示したハ
ードウェアとの関係を次に示す。入力手段1としてキー
ボード101を用いる。制御部2の処理は、処理装置1
00で実行される。文字列変換部3、及びこれに含まれ
る中国語音節分割手段5、ピンイン文字列生成手段9、
単語範囲設定手段6、中国語変換手段7の各処理は、処
理装置100の中のCPUで実行される。辞書4は、処
理装置100の中の記憶部であるメインメモリまたはキ
ャッシュメモリに記憶される。あるいは辞書4の一部
は、ディスク装置103に記憶されていてもよい。表示
手段8は表示装置102に対応する。
【0032】図4は、中国語入力操作者が入力したいピ
ンイン文字列の中で連続するピンイン文字2文字以上の
綴りについて、曖昧な場合の入力例である。この実施の
形態では、曖昧な連続するピンイン文字2文字以上の文
字列を表す記号を”*”とする。しかし”*”以外の他
の記号で2文字以上の曖昧な文字列を表しても良い。図
4において、入力例1(1)は操作者が意図した中国
語”東京”である。これに対応する正しいピンイン文字
列は、(2)に示すように”dongjing”であ
る。しかし操作者が、ピンイン文字列を正確に思い出せ
ない場合、(3)に示すように曖昧な箇所を”*”を用
いて”do*ji*”と入力する。同様に図4、入力例
2は、操作者は(4)に示す中国語”北京”を入力した
いが、ピンイン文字列が曖昧な場合(6)に示すよう
に”b*j*”を入力する。後述するが、中国語の音節
は声母と韻母の組み合わせから構成されており、上記”
*”は、韻母の一部又は全部が不明な場合に用いられる
ものとする。
【0033】図5は、中国語入力操作者が、入力したい
ピンイン文字列の中で1文字の綴りについて曖昧な場合
の入力例である。この実施の形態では、曖昧な1文字を
表す記号を”?”とする。しかし”?”以外の他の記号
で曖昧な1文字を表しても良い。図5において、入力例
3(1)は操作者が意図した中国語が”長城”である。
(1)に対応する正しいピンイン文字列は、(2)にし
めす”changcheng”である。しかし操作者
が、ピンイン文字列を正確に思い出せない場合、(3)
に示すように曖昧な1文字を”?”を用いて”ch?n
gch?ng”と入力する。
【0034】図6は、中国語入力操作者が声調情報を伴
った頭文字を入力する例である。声調情報を伴った頭文
字とは、ピンインの頭文字(先頭文字)の直後に数字が
ついている場合を言う。数字は、例えば0から4まで、
(あるいは1から5まで)とする。しかし5種類の他の
記号で声調情報を表しても良い。これは、操作者がピン
インの頭文字と声調情報しか知らず、残りのピンイン文
字列が曖昧な場合、またはピンイン文字列の入力を省略
したい場合に有効である。図6において、入力例4
(1)は操作者が意図した中国語”日本”である。これ
に対応する正しいピンイン文字列は(2)に示すよう
に”riben”である。ここで”ri”と”ben”
がそれぞれ各漢字に対応するピンインである。しかしピ
ンインの頭文字と声調情報しか知らず、残りのピンイン
文字列が曖昧な場合、または入力を省略したい場合、操
作者は(3)に示すように、頭文字と声調情報を用い
て”r4b3”と入力する。図6入力例5は、操作者は
(4)に示す中国語”航空公司”(ピンイン文字列で”
hangkonggongsi”)を入力する代りに、
(6)に示すように”h2k1g1s1”と入力する。
【0035】図7、図8は、この実施の形態の動作を説
明するためのフローチャートである。初めに、ピンイン
文字列の中で2文字以上の文字列が曖昧な場合につい
て、図4、入力例1を例に取り説明する。ステップ21
において、入力手段1であるキーボード101から入力
されたピンイン文字列を処理装置100の制御部2に読
み込む。この時、入力されたピンイン文字列は、”do
*ji*”とする。ステップ22において、中国語音節
分割手段5が入力されたピンイン文字列を中国語の音節
区分に分割する。図9から図11は中国語の標準ピンイ
ン文字列一覧表である。図9から図11に示す各項は中
国語の音節を示している。図9から図11に示すよう
に、中国語の音節は先行する声母と後行する韻母の組み
合わせから成る。声母は21個、韻母は37個あるが、
図から分かるように声母と韻母の組み合わせがない場合
もある。曖昧な文字列として”*”を使うのは、後行す
る韻母の場合であるので先行する声母が必ず存在し文字
列の中の声母ごとに音節区分の分割を行えばよい。”d
o*ji*”を音節区分に分割すると図12のようにな
る。”do*ji*”は音節区分”do*”と”ji
*”に分割される。ここで”do*”を音節区分1、”
ji*”を音節区分2と呼ぶことにする。なお、中国語
のピンイン文字列を音節区分に分割することは、中国語
の特徴を利用して従来から行われている。ステップ23
において、ピンイン文字列生成手段9が、分割された音
節区分を先頭から取り出し、ピンイン文字列だけか否か
判定する。ピンイン文字列だけからなれば、YESとな
りステップ25に処理が進む。ピンイン文字列以外の記
号”*”又は”?”があれば、NOとなりステップ24
へ進む。音節区分1”do*”は、ピンイン文字列以外
の記号”*”を含むのでNOとなりステップ24へ処理
が移る。ステップ24のピンイン文字列生成手段9のさ
らに詳しい処理の流れを図8を用いて説明する。
【0036】図8のステップ51において、音節区分
に”*”が含まれているかどうか調べる。NOであれ
ば、ステップ53に分岐する。ステップ53以下の処理
は後に説明する。音節区分1の”do*”には、”*”
が含まれているので、YESとなり、ステップ52に処
理がわたる。ステップ52において、ピンイン文字列生
成手段9は、音節区分の中の”*”を文法上可能なピン
イン文字列に置き換え、ピンイン文字列の候補リストを
生成する。ピンイン文字列生成手段9は、図9から図1
1の標準ピンイン文字列一覧表に示されている声母に対
する韻母のテーブルを持つ。ピンイン文字列生成手段9
は入力された既知の部分の文字列から、すなわち声母
が”d”、韻母のはじめの1文字が”o”である組み合
わせからテーブルを検索し、文法上可能なピンイン文字
列候補を探す。声母と韻母の組み合わせは21×37で
あるが、図9から図11に示すように声母と韻母の組み
合わせがない場合もあるのでピンイン文字列候補の数は
多くはない。ピンイン文字列生成手段9が生成するピン
イン文字列候補リストを図13に示す。”do*”にた
いするピンイン文字列候補リストは、”dong”と”
dou”である。ステップ52が終了すると、図7のス
テップ25に進む。ステップ25において、この音節区
分が、最後の音節区分かどうか調べ、YESならば、ス
テップ26に進む。この場合、最後ではないのでNOと
なり、ステップ23に戻る。ステップ23において、ピ
ンイン文字列生成手段9が、次の音節区分を取り出し、
ピンイン文字列だけかどうか判定する。音節区分2の”
ji*”は、ピンイン文字列だけではないので、先の説
明と同様の処理を行い、図14に示すピンイン文字列候
補リストを得る。
【0037】入力されたピンイン文字列の音節区分全て
に対して、ステップ23からステップ25までの処理を
繰り返し、音節区分全てについてステップ23からステ
ップ25までの処理終了した場合ステップ26の処理に
移る。”do*ji*”は、音節区分1、音節区分2と
もに処理が終了したので、ステップ26に進む。ステッ
プ26以降に関しては、この発明の中の曖昧な文字を記
号で置き換える発明の要点ではないので概略の説明にと
どめる。ステップ26において、単語範囲設定手段6
は、単語範囲を設定する。ここで、図15を用いて単語
範囲について説明する。3つの音節区分がある場合を例
に取ると、次の3つの場合がある。 (1)3つの音節区分で1単語とする。 (2)3つの音節区分から隣り合う2つの音節区分を1
単語と設定する。 (3)1音節区分をそれぞれ1単語とする。 この実施の形態においてステップ26、27では、最長
一致法を採用する。すなわち始めに、一番長い音節区分
の組み合わせを1つの単語範囲とする。そしてステップ
26からステップ28の処理を行い、可能な中国語リス
トを作成し、ステップ29において、可能な中国語リス
トの中に最適中国語がないと判定された場合、再びステ
ップ26に戻る。ステップ26で、音節区分の数を1減
らしたものを1単語とし、再度可能性のある単語を探
す。例えば図15の様に3音節区分ある場合、初めに3
音節区分で1単語と設定する。これで最適中国語がない
場合、次に2音節区分で1単語と設定し再度可能性のあ
る単語を探す。この場合も、最適単語が見つからないと
1音節区分1単語と設定する。1単語1音節区分とし、
かつ入力ミスがなければ、必ず最適な中国語単語が見つ
かる。
【0038】”do*ji*”の場合、ステップ26に
おいて、初めに2音節区分で1単語と設定する。この場
合のピンイン文字列の組み合わせを図16に示す。音節
区分1と音節区分2の組み合わせは、2×7=14通り
ある。ステップ27において、中国語変換手段7は、可
能なピンイン文字列の組み合わせに対し、辞書4を参照
して可能な中国語リストを生成する。図16の14通り
のピンイン文字列について、それぞれ図3で示した辞書
4を参照し対応する中国語が存在するか否か調べる。中
国語が存在すれば、その中国語を可能な中国語リストに
加える。生成された中国語リストの例を図17に示す。
図17で()で示した、ピンイン文字列は、参考のため
であり、実際には付けない。ステップ28において、中
国語変換手段7は中国語リストの中から、最適な中国語
を選び表示装置102に表示する。最適語を探す方法
は、すぐ前に参照した語を優先するか、使用頻度の高い
ものにする。あるいは、中国語リストの全てあるいは一
部を表示装置102に表示して、ステップ29でユーザ
が選ぶようにしても良い。ステップ29において、ユー
ザは、表示装置102に表示された中国語候補が意図す
る語かどうか判定する。一候補ずつ表示装置102に表
示する場合は、最適中国語が表示されユーザが選択する
か、あるいは中国語リストの中国語候補がなくなるま
で、ユーザの判定を続ける。最適中国語がなければ、ス
テップ26に戻る。この例では、”東京”がユーザの意
図する中国語であるので、ユーザが”東京”が表示され
た時点でこれを選択し、ステップ30に進む。ステップ
30において、単語範囲設定手段6が処理中の単語範囲
の中に最後の音節区分が含まれているかどうか調べる。
NOであれば、ステップ26に戻り以降の処理を行い、
残りの音節区分について適する中国語があるか否かしら
べる。YESであれば、処理を終了する。この例では、
最後の音節区分であるので、処理を終了する。
【0039】次にピンイン文字列内で曖昧な1文字を文
字記号、例えば”?”を使って表す場合の処理について
述べる。図5の入力例3を用いて説明する。”*”の場
合と同様な処理に関しては、説明を省く。ステップ21
において、”ch?ngch?ng”が入力される。ス
テップ22において、音節区分”ch?ng”と”ch
?ng”に分割される。ステップ23において、ピンイ
ン文字列以外の記号”?”が含まれているので、ステッ
プ24の処理に進む。図8を用いてステップ24の詳細
な処理を説明する。ステップ51において、ピンイン文
字列生成手段9は、この音節区分に”*”が含まれてい
るか否か調べる。NOであるので、ステップ53に分岐
する。ステップ53において、ピンイン文字列生成手段
9は、”?”が含まれているか否か調べる。NOであれ
ば、ステップ55においてエラー処理を行う。”ch?
ng”には”?”が含まれているので、YESとなり、
ステップ54に処理が移る。
【0040】ステップ54において、ピンイン文字列生
成手段9は先に述べたテーブルを検索し、音節区分内
の”?”を1文字の文法上可能なピンイン文字に置き換
え、ピンイン文字列の候補リストを生成する。ピンイン
文字列生成手段9が生成するピンイン文字列候補リスト
を図18に示す。”ch?ng”に対するピンイン文字
列候補リストは、”chang”、”chong”、”
cheng”である。ステップ54が終了すると、図7
のステップ25に進む。2番目の音節区分も1番目の音
節区分と同じ”ch?ng”なので、ピンイン文字列の
候補リストは図18に示すとおりとなる。ステップ26
〜ステップ30の処理は前述した手順と同じである。図
19に、2音節区分を1単語とした場合の中国語リスト
を示す。
【0041】次に声調情報を伴った頭文字入力について
述べる。図6の入力例4を用いて説明する。声調情報を
伴った頭文字入力の特徴となる処理について述べ、他は
省略する。ステップ21において、入力手段1であるキ
ーボード101から入力されたピンイン文字列を制御部
2に読み込む。入力されたピンイン文字列は、”r4b
3”とする。ステップ22において、中国語音節分割手
段5が、入力されたピンイン文字列を中国語の音節区分
に分割する。音節区分の分割は、中国語音節分割手段5
が声調情報を伴った頭文字を認識し、頭文字+声調情報
を1音節区分とし”r4”と”b3”に分割する。ステ
ップ23において、ピンイン文字列生成手段9が、分割
された音節区分を先頭から取り出し、ピンイン文字列だ
けか否か判定する。頭文字+声調情報”r4”はピンイ
ン文字列と解し、YESとなりステップ25に処理が進
む。ステップ25において、この音節区分が、最後の音
節区分かどうか調べ、NOなのでステップ23に戻る。
ステップ23において、ピンイン文字列生成手段9が、
次の音節区分”b3”を取り出し、ピンイン文字列だけ
かどうか判定する。”b3”は、ピンイン文字列なの
で、ステップ25へ進む。
【0042】ステップ25で、音節区分全てについて終
了したと判定され、ステップ26の処理に移る。ステッ
プ26において、単語範囲設定手段6は、単語範囲を設
定する。”r4b3”の場合、初めに2音節区分で1単
語と設定する。ステップ27において、図20で示す辞
書4を参照し可能な中国語リストを生成する。辞書4
は、図21の形式のものを用いても良い。図20、21
のピンイン文字列は、参考のためであり、実際には付け
ない。図20の辞書の利点は、頭文字と声調情報を分け
て持つので、頭文字のみ入力された場合もこの辞書を使
用できる。しかし、文字列が頭文字+声調情報で入力さ
れる場合、入力された文字列を加工して頭文字からなる
文字列にする必要がある。図21に示す辞書は、頭文字
+声調情報を見出しとして持つので、入力された文字列
でそのまま検索できる。”r4b3”に対応する中国語
は、辞書4から”日本”となり、これを中国語リストと
する。ステップ28において、中国語変換手段7は中国
語リストの中から、中国語を選び表示装置102に表示
する。この場合”日本”を表示する。声調情報を伴った
頭文字入力であるときは、声調情報を用い、中国語の候
補を絞り込むことができ、”日本”という変換結果を得
ることができる。
【0043】以上のように、中国語のピンインに関する
知識が十分でなく、入力すべきピンイン文字列が曖昧な
場合でも、”*”、”?”で曖昧なピンイン文字列を代
替することができる。あるいは、頭文字+声調情報によ
り、ピンイン文字列の省略入力が可能である。そのた
め、ユーザにとって操作性のよい中国語入力処理装置を
提供することが出来る。
【0044】本方式では、入力されたピンイン文字列を
中国語1文字に対応する音節区分ごとに分け、上記のよ
うな処理を行う。そのため、2文字以上の単語について
それぞれ”*”、”?”、”頭文字+声調情報”という
3種類の入力方式が混在しても、中国語文字列に変換が
可能である。入力方式が混在している例を図22に示
す。
【0045】入力例6は、中国語2文字のうち1文字の
ピンイン文字列内でピンイン文字列の替わりに任意文字
列を表す記号文字”*”が使われた入力例である。
【0046】入力例7は、中国語2文字のうち1文字の
ピンイン文字列内でピンイン文字の替わりに1字の任意
文字を表す記号文字”?”が使われた入力例である。
【0047】入力例8は、中国語3文字のうち2文字に
それぞれ任意文字列を表す記号文字”*”と、任意文字
を表す記号文字”?”とが使われた入力例である。
【0048】入力例9は、中国語4文字のうち先頭文字
は声調情報を伴った頭文字入力、2文字目にピンインの
頭文字が使われた例である。
【0049】以上のように、ピンインに関して十分な知
識を持たない、例えば、母音(韻母)部分に関する知識
が不足して曖昧な操作者でも容易に効率よく入力が可能
な中国語入力処理装置及び中国語入力処理方法を得るこ
とができる。また、従来のピンイン入力方式と適合性を
持たせ、本実施の形態で述べた入力方式と従来のピンイ
ン入力方式のいずれの入力に対しても容易に効率よく入
力が可能な中国語入力処理装置及び中国語入力処理方法
を得ることができる。
【0050】実施の形態2.日本語の言語処理装置に関
しても中国語入力処理装置と同様に実施することができ
る。日本語の文章は、ひらがな、カタカナ、ローマ字、
漢字の4種類の文字種を組み合わせて表すことができ
る。中国語のピンイン文字列による入力は、日本語では
ひらがな文字列、カタカナ文字列あるいはローマ字文字
列の入力に相当する。なお、この実施の形態では、変換
対象を名詞に限るものとし、ひらがなから漢字、または
ローマ字から漢字に変換する例について述べる。図23
に日本語のひらがなから漢字に変換する場合の入力例を
示す。図23(1)は、日本語入力操作者が意図した漢
字”海外”である。(2)は(1)に対応するひらがな
文字列である。しかし操作者がひらがな文字列を正確に
思い出せない場合、(3)に示すように曖昧な1文字
を”?”を用いて”かいが?”と入力する。中国語入力
処理装置と同様の手法で、ひらがな文字列を漢字文字列
に変換する日本語の言語処理装置を得ることができ
る。”が?”の場合のひらがな文字列候補を図24に示
す。ひらがな文字列候補を生成する場合、日本語の文法
上”あ”から”ん”、濁音、半濁音、ゃ、ゅ、ょ、っの
74文字の可能性がある。また、辞書にはひらがなとひ
らがなに対応する漢字が記憶されている。図25に日本
語のひらがな・漢字辞書の例を示す。
【0051】また、ローマ字から漢字に変換する場合の
入力例を図26に示す。漢字”海外”に対応するローマ
字は図26(2)”kaigai”である。しかし操作
者がローマ字文字列を正確に思い出せない場合、(3)
に示すように曖昧な文字列を”*”とし”kaig*”
と入力する。ローマ字文字列候補を生成する場合、ロー
マ字は26文字の可能性があることを利用する。図27
にローマ字・漢字辞書の例を示す。以上のように、入力
すべきひらがな文字列、またはローマ字文字列が曖昧な
場合、記号文字”*”、”?”で曖昧なひらがな文字列
を代替することが出来る。そのため日本語の入力におい
て、ひらがなから漢字、あるいはローマ字から漢字に変
換する際に入力の効率を上げることが可能な日本語の言
語処理装置および日本語の言語処理方法を得ることがで
きる。また、日本語、中国語に限らず複数の文字種から
成る言語において、入力する第1の文字種の文字列が曖
昧な場合、曖昧な文字列に関し記号文字で代替入力し、
第2の文字種の文字列候補を得ることが出来る。そのた
めユーザが使いやすい言語処理装置および言語処理方法
を提供できる。なお、曖昧な文字列を代替する記号とし
て”*”、”?”を使用したが、他の記号を使ってもよ
い。
【図面の簡単な説明】
【図1】 この発明の一実施の形態におけるハードウェ
ア構成図である。
【図2】 この発明の一実施の形態における中国語入力
処理装置のブロック図である。
【図3】 中国語のピンイン・中国語辞書の例を示す図
である。
【図4】 中国語のピンイン文字列において”*”を使
った入力例を示す図である。
【図5】 中国語のピンイン文字列において”?”を使
った入力例を示す図である。
【図6】 中国語のピンイン文字列において声調情報を
伴った頭文字入力の例を示す図である。
【図7】 中国語入力処理装置の動作を説明するフロー
チャート図である。
【図8】 中国語入力処理装置の動作を説明する詳細な
フローチャート図である。
【図9】 中国語の標準ピンイン文字列一覧表を示す図
である。
【図10】 中国語の標準ピンイン文字列一覧表を示す
図である。
【図11】 中国語の標準ピンイン文字列一覧表を示す
図である。
【図12】 中国語の音節区分の分割例を示す図であ
る。
【図13】 ピンイン文字列生成手段が生成する”do
*”に対するピンイン文字列候補リストを示す図であ
る。
【図14】 ピンイン文字列生成手段が生成する”ji
*”に対するピンイン文字列候補リストを示す図であ
る。
【図15】 単語範囲設定手段が行う単語範囲の設定方
法を示す図である。
【図16】 ピンイン文字列の組み合わせ方を示す図で
ある。
【図17】 中国語変換手段が生成する”do*”に対
する可能な中国語リストの例を示す図である。
【図18】 ピンイン文字列生成手段が生成する”ch
?ng”に対する可能なピンイン文字列候補リストを示
す図である。
【図19】 中国語変換手段が生成する”ch?ng”
に対する可能な中国語リストの例を示す図である。
【図20】 頭文字、声調情報によりひく辞書の例を示
す図である。
【図21】 頭文字+声調情報によりひく辞書の例を示
す図である。
【図22】 中国語ピンイン文字列において”*”、”
?”、”頭文字+声調情報”を用いた入力例を示す図で
ある。
【図23】 日本語のひらがな文字列において”?”を
使った入力例を示す図である。
【図24】 ”が?”に対するひらがな文字列候補の例
を示す図である。
【図25】 日本語のひらがな・漢字辞書の例を示す図
である。
【図26】 日本語のローマ字文字列において”*”を
使った入力例を示す図である。
【図27】 日本語のローマ字・漢字辞書の例を示す図
である。
【図28】 従来例における中国語ピンイン文字列の入
力例を示す図である。
【図29】 従来例における”invent”で始まる
英単語をリストアップした図である。
【図30】 従来例における”m?t”に対する英単語
候補を示す図である。
【符号の説明】
1 入力手段、2 制御部、3 文字列変換部、4 辞
書、5 中国語音節分割手段、6 単語範囲設定手段、
7 中国語変換手段、8 表示手段、9 ピンイン文字
列生成手段、100 処理装置、101 キーボード、
102 表示装置、103 ディスク装置、104 プ
リンタ、105 マウス、106 マウスパッド。

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 ピンイン文字列を入力し中国語文字列に
    変換して表示する中国語入力処理装置であって、以下の
    要素を有し、入力するピンイン文字列内でピンイン文字
    列の替わりに任意文字列を表す記号文字を入力して所望
    の中国語文字列に変換して表示することを特徴とする中
    国語入力処理装置 (a)中国語のピンイン文字列、及びピンイン文字列内
    でピンイン文字列の替わりに任意文字列を表す記号文字
    を入力する入力手段、 (b)上記入力手段より入力された文字列を中国語の音
    節区分に分割する中国語音節分割手段、 (c)中国語の各音節区分毎に標準ピンイン文字列か否
    かを解析し、標準ピンイン文字列の場合にはそれを出力
    し、ピンイン文字列内でピンイン文字列の替わりに任意
    文字列を表す記号文字が使われている場合には理論的に
    可能性のあるピンイン文字列候補を生成し出力する文字
    列生成手段、 (d)中国語文字列とピンイン情報とを共に格納してい
    る辞書手段、 (e)上記の得られたピンイン文字列候補を上記辞書手
    段を参照して中国語文字列候補に変換する中国語変換手
    段、 (f)上記中国語変換手段により変換された中国語文字
    列候補を表示する表示手段。
  2. 【請求項2】 ピンイン文字列を入力し中国語文字列に
    変換して表示する中国語入力処理装置であって、以下の
    要素を有し、ピンイン文字列内でピンイン文字の替わり
    に任意文字を表す記号文字を入力して所望の中国語文字
    列に変換して表示することを特徴とする中国語入力処理
    装置 (a)中国語入力にピンイン文字列と、ピンイン文字列
    内でピンイン文字の替わりに任意文字を表す記号文字を
    入力する入力手段、 (b)上記入力手段より入力された文字列を中国語の音
    節区分に分割する中国語音節分割手段、 (c)中国語の各音節区分毎に標準ピンイン文字列か否
    かを解析し、標準ピンイン文字列の場合にはそれを出力
    し、ピンイン文字列内でピンイン文字の替わりに任意文
    字を表す記号文字が使われている場合には理論的に可能
    性のあるピンイン文字列候補を生成し出力する文字列生
    成手段、 (d)中国語文字列とピンイン情報とを共に格納してい
    る辞書手段、 (e)上記の得られたピンイン文字列候補を上記辞書手
    段を参照して中国語文字列候補に変換する中国語変換手
    段、 (f)上記中国語変換手段により変換された中国語文字
    列候補を表示する表示手段。
  3. 【請求項3】 ピンイン文字列を入力し中国語文字列に
    変換して表示する中国語入力処理装置であって、以下の
    要素を有し、ピンインの頭文字の直後に声調情報を表す
    記号文字を使用して所望の中国語文字列に変換して表示
    することを特徴とする中国語入力処理装置 (a)中国語入力にピンイン文字列、ピンインの頭文字
    の直後に声調情報を表す記号文字を入力する入力手段、 (b)上記入力手段より入力された文字列を中国語の音
    節区分に分割する中国語音節分割手段、 (c)中国語文字列とピンイン情報とを共に格納してい
    る辞書手段、 (d)上記辞書手段を参照して、上記中国語の音節区分
    に分割された文字列を中国語文字列候補に変換し、かつ
    ピンインの頭文字の直後に声調情報を表す記号文字が使
    われている場合にはその声調情報を単語絞り込みに使用
    する中国語変換手段、 (e)上記中国語変換手段により変換された中国語文字
    列候補を表示する表示手段。
  4. 【請求項4】 ピンイン文字列を入力し中国語文字列に
    変換して表示する中国語入力処理方法であって、以下の
    ステップを有し、入力するピンイン文字列内でピンイン
    文字列の替わりに、任意文字列を表す記号文字を入力し
    て所望の中国語文字列に変換処理することを特徴とする
    中国語入力処理方法 (a)中国語のピンイン文字列、及びピンイン文字列内
    でピンイン文字列の替わりに任意文字列を表す記号文字
    を入力するステップ、 (b)上記文字列を中国語の音節区分に分割するステッ
    プ、 (c)中国語の各音節区分毎に標準ピンイン文字列か否
    かを解析し、標準ピンイン文字列の場合にはそれを出力
    し、ピンイン文字列内でピンイン文字列の替わりに任意
    文字列を表す記号文字が使われている場合には理論的に
    可能性のあるピンイン文字列候補を生成し出力するステ
    ップ、 (d)中国語文字列とピンイン情報とを共に格納してい
    る辞書手段を参照して上記の出力されたピンイン文字列
    候補を中国語文字列候補に変換するステップ、 (e)上記変換された中国語文字列候補を表示するステ
    ップ。
  5. 【請求項5】 ピンイン文字列を入力し中国語文字列に
    変換して表示する中国語入力処理方法であって、以下の
    ステップを有し、ピンイン文字列内でピンイン文字の替
    わりに任意文字を表す記号文字を入力して所望の中国語
    文字列に変換して表示することを特徴とする中国語入力
    処理方法 (a)中国語入力にピンイン文字列と、ピンイン文字列
    内でピンイン文字の替わりに任意文字を表す記号文字を
    入力するステップ、 (b)入力された文字列を中国語の音節区分に分割する
    ステップ、 (c)中国語の各音節区分毎に標準ピンイン文字列か否
    かを解析し、標準ピンイン文字列の場合にはそれを出力
    し、ピンイン文字列内でピンイン文字の替わりに任意文
    字を表す記号文字が使われている場合には理論的に可能
    性のあるピンイン文字列候補を生成し出力するステッ
    プ、 (d)中国語文字列とピンイン情報とを共に格納してい
    る辞書手段を参照して、上記のピンイン文字列候補を中
    国語文字列候補に変換するステップ、 (e)変換された中国語文字列候補を表示するステッ
    プ。
  6. 【請求項6】 ピンイン文字列を入力し中国語文字列に
    変換して表示する中国語入力処理方法であって、以下の
    ステップを有し、ピンインの頭文字の直後に声調情報を
    表す記号文字を使用して所望の中国語文字列に変換して
    表示することを特徴とする中国語入力処理方法 (a)中国語入力にピンイン文字列、ピンインの頭文字
    の直後に声調情報を表す記号文字を入力するステップ、 (b)入力された文字列を中国語の音節区分に分割する
    ステップ、 (c)中国語文字列とピンイン情報とを共に格納してい
    る辞書手段を参照して、上記中国語の音節区分に分割さ
    れた文字列を中国語文字列に変換し、かつピンインの頭
    文字の直後に声調情報を表す記号文字が使われている場
    合にはその声調情報を単語絞り込みに使用するステッ
    プ、 (d)変換された中国語文字列候補を表示するステッ
    プ。
  7. 【請求項7】 少なくとも第1と第2の文字種により構
    成される言語の言語処理装置において、以下の要素を有
    する言語処理装置 (a)記号文字を含む上記第1の文字種からなる文字列
    を入力する入力手段、 (b)上記入力手段より入力された文字列に記号文字が
    使われているか否かを解析し、記号文字が使われている
    場合は、記号文字を上記言語の文法上可能性のある文字
    列に置き換えて第1の文字種からなる文字列候補を生成
    する文字列生成手段、 (c)上記第1の文字種の文字列と対応する第2の文字
    種の文字列を格納している辞書手段、 (d)上記文字列生成手段により得られた第1の文字種
    からなる文字列候補を上記辞書手段を参照して、対応す
    る第2の文字種の文字列候補に変換する変換手段、 (e)上記変換手段により変換された第2の文字種の文
    字列候補を出力する出力手段。
  8. 【請求項8】 上記言語処理装置は、さらに、上記入力
    手段より入力された文字列を第2の文字種に対応する音
    節を表す第1の文字種からなる文字列に分割する音節分
    割手段を有することを特徴とする請求項7記載の言語処
    理装置。
  9. 【請求項9】 上記入力手段から入力される記号文字を
    含む第1の文字種から成る文字列は、既知の部分の文字
    列を構成する第1の文字種から成る文字と不明な部分の
    文字列の文字の代わりに任意文字列を表す記号文字とか
    ら構成されることを特徴とする請求項7または8記載の
    言語処理装置。
  10. 【請求項10】 上記任意文字列を表す記号文字は、一
    文字に対応することを特徴とする請求項9記載の言語処
    理装置。
  11. 【請求項11】 上記任意文字列を表す記号文字は、複
    数文字に対応することを特徴とする請求項9記載の言語
    処理装置。
  12. 【請求項12】 上記言語は中国語であり、上記入力手
    段により入力される第1の文字種はピンイン文字であ
    り、上記辞書手段は、ピンイン文字とピンイン文字列に
    対応する中国語文字列を格納し、上記変換工程はピンイ
    ン文字列候補を上記辞書手段を参照してピンイン文字列
    に対応する中国語文字列候補に変換することを特徴とす
    る請求項10または11記載の言語処理装置。
  13. 【請求項13】 上記文字列生成手段は、文法上可能性
    のあるピンイン文字列の組み合わせを記憶したテーブル
    を備え、上記既知の部分の文字列を用いて上記テーブル
    を検索することにより文法上可能性のあるピンイン文字
    列候補を生成することを特徴とする請求項12記載の言
    語処理装置。
  14. 【請求項14】 上記言語は中国語であり、上記入力手
    段はピンイン文字列の頭文字とピンイン文字列の頭文字
    の直後に声調情報を表す記号文字を入力し、上記辞書手
    段は上記ピンイン文字列の頭文字と声調情報と対応する
    中国語文字列を格納し、上記変換工程は、上記辞書手段
    を参照して上記ピンイン文字列の頭文字と声調情報から
    対応する中国語文字列候補に変換することを特徴とする
    請求項8記載の言語処理装置。
  15. 【請求項15】 上記言語は日本語であり、上記入力手
    段により入力される第1の文字種は仮名文字であること
    を特徴とする請求項10または11記載の言語処理装
    置。
  16. 【請求項16】 少なくとも第1と第2の文字種により
    構成される言語の言語処理方法において、以下の工程を
    有する言語処理方法 (a)上記第1の文字種からなる所定の文字列のうち、
    既知の部分の文字列を構成する文字と、不明な部分の文
    字列の文字の代わりに任意文字列を表す記号文字とを入
    力する入力工程、 (b)上記入力工程より入力された文字列に任意文字列
    を表す記号文字が使われているか否かを解析し、記号文
    字が使われている場合は、文法上可能性のある第1の文
    字種からなる文字列候補を生成する文字列生成工程、 (c)上記文字列生成工程により得られた第1の文字種
    からなる文字列候補を、上記第1の文字種の文字列と対
    応する第2の文字種の文字列を格納している辞書を参照
    して、対応する第2の文字種の文字列に変換する変換工
    程、 (d)上記変換工程により変換された第2の文字種の文
    字列候補を出力する出力工程。
  17. 【請求項17】 上記言語処理方法は、さらに、上記入
    力工程より入力された文字列を第2の文字種に対応する
    音節を表す第1の文字種からなる文字列に分割する音節
    分割工程を有することを特徴とする請求項16記載の言
    語処理方法。
  18. 【請求項18】 上記入力工程は、上記任意文字列を表
    す記号文字を、一文字に対応させて入力することを特徴
    とする請求項16または17記載の言語処理方法。
  19. 【請求項19】 上記入力工程は、上記任意文字列を表
    す記号文字を、複数文字に対応させて入力することを特
    徴とする請求項16または17記載の言語処理方法。
  20. 【請求項20】 上記入力工程は、第一の文字種として
    ピンイン文字を入力し、上記変換工程はピンイン文字列
    をピンイン文字列に対応する中国語文字列に変換するこ
    とを特徴とする請求項16から19いずれかに記載の言
    語処理方法。
JP8001662A 1995-01-30 1996-01-09 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 Pending JPH08272780A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8001662A JPH08272780A (ja) 1995-01-30 1996-01-09 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP7-12742 1995-01-30
JP1274295 1995-01-30
JP8001662A JPH08272780A (ja) 1995-01-30 1996-01-09 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法

Publications (1)

Publication Number Publication Date
JPH08272780A true JPH08272780A (ja) 1996-10-18

Family

ID=26334936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8001662A Pending JPH08272780A (ja) 1995-01-30 1996-01-09 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法

Country Status (1)

Country Link
JP (1) JPH08272780A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100476100B1 (ko) * 2001-11-28 2005-03-10 인벤텍 코오포레이션 실용적인 중국어 입력 방법
US8199112B2 (en) 2006-12-27 2012-06-12 Casio Computer Co., Ltd. Character input device
CN112748811A (zh) * 2021-01-21 2021-05-04 李博林 一种英文单词输入方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100476100B1 (ko) * 2001-11-28 2005-03-10 인벤텍 코오포레이션 실용적인 중국어 입력 방법
US8199112B2 (en) 2006-12-27 2012-06-12 Casio Computer Co., Ltd. Character input device
CN112748811A (zh) * 2021-01-21 2021-05-04 李博林 一种英文单词输入方法及装置

Similar Documents

Publication Publication Date Title
US5835924A (en) Language processing apparatus and method
KR100259407B1 (ko) 중국어 텍스트 입력키보드, 중국어 텍스트 처리 컴퓨터 시스템, 중국어 텍스트 입력장치, 음성 중국어의 음절 및 단어 저장방법
US6490563B2 (en) Proofreading with text to speech feedback
JP2515726B2 (ja) 情報検索方法及び装置
US20070242071A1 (en) Character Display System
JPH07114558A (ja) 漢字変換訂正処理方式
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
Saharia et al. LuitPad: a fully unicode compatible Assamese writing software
JPH10232863A (ja) かな漢字変換装置および方法、並びに記録媒体
JP3952964B2 (ja) 読み情報決定方法及び装置及びプログラム
JPH10320399A (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
KR100268297B1 (ko) 중국어 텍스트 처리 컴퓨터 시스템, 형태 처리에 의한 단어 스트링 처리 방법, 중국어 어구 분석 방법
JPH0350668A (ja) 文字処理装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP2023169063A (ja) 日本語入力システムのkearm学習変換
JPS59121425A (ja) 「へい」音漢字変換装置
JP2802369B2 (ja) かな漢字変換装置
JPH08335217A (ja) 読み変換方法及び文書作成装置
JPH03160555A (ja) 日本語入力装置
JPH0991278A (ja) 文書作成装置
JPS5998236A (ja) 日本文入力装置
JPH0115105B2 (ja)
JPH0414168A (ja) 文書作成装置