JPH03119473A - 中国語から日本語への機械翻訳方式 - Google Patents

中国語から日本語への機械翻訳方式

Info

Publication number
JPH03119473A
JPH03119473A JP1258245A JP25824589A JPH03119473A JP H03119473 A JPH03119473 A JP H03119473A JP 1258245 A JP1258245 A JP 1258245A JP 25824589 A JP25824589 A JP 25824589A JP H03119473 A JPH03119473 A JP H03119473A
Authority
JP
Japan
Prior art keywords
chinese
japanese
sentence
speech
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1258245A
Other languages
English (en)
Other versions
JP3016797B2 (ja
Inventor
Tadao Takahashi
忠雄 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1258245A priority Critical patent/JP3016797B2/ja
Publication of JPH03119473A publication Critical patent/JPH03119473A/ja
Application granted granted Critical
Publication of JP3016797B2 publication Critical patent/JP3016797B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は機械翻訳方式に関し、特に中国語から日本語へ
の機械翻訳方式に関する。
〔従来の技術〕
従来の機械翻訳方式は、情報処理学会出版の[情報処理
J  (1985年 VOL、26  No。
10)等で紹介されているように、英語および日本語を
ベースとした方式であった(中国語から日本語への機械
翻訳方式は存在しなかった)。
なお、中国語をアルファベントおよび数字によりキーボ
ードより入力することができる中国語入力手段(中国語
ワードプロセッサ)は、存在していた(特願昭62−1
92・329)。
〔発明が解決しようとする課題〕
上述した従来の機械翻訳方式は英語および日本語をベー
スとした方式であるので、中国語から日本語への機械翻
訳を行うことができないという欠点がある(中国語文法
と英語文法との間には差異があるので従来の方式を中国
語から11本語への機に適合するように構文が変換され
た中国語文を構成する中国語単語を日本語単語に翻訳す
る単語翻訳手段と、日本語辞書ファイルを参照して前記
単語翻訳手段により生成された日本語単語に日本語の品
詞を付与する日本語品詞付与手段と、この日本語品詞付
与手段により付与された品詞に基づき品詞が付与された
日本語単語を日本語文法に適合するように並べ変える品
詞並べ変え手段と、ごの品詞並べ変え手段による並べ変
えにより日本語文法に適合するように並べられた日本語
文中の単語群の間に連結紐を挿入して日本語文字コード
からなる日本語文を生成する連結語挿入手段と、アルフ
ァベット/数字/記号文字パターンファイルおよび日本
語文字パターンファイルを参照して前記連結語挿入手段
により生成された日本語文字コードからなる日本語文を
日本語文字で出力するロ木語出力手段とを有する。
〔作用〕
本発明の中国語から日本語への機械翻訳方式では、中国
語入力手段が併音記号および四声記号が械翻訳方式に適
用することはできない)。
本発明の目的は、上述の点に鑑み、中国語から日本語へ
の機械翻訳を可能にする中国語から日本語への機械翻訳
方式を提供することにある。
〔課題を解決するための手段〕
本発明の中国語から日本語への機械翻訳方式は、併音記
号および四声記号がアルファベントおよび数字で表現さ
れた中国語文を入力し当該中国語文を中国語知識データ
ベースファイル、中国語用語ファイル、中国語文字パタ
ーンファイルおよびアルファヘット/数字/記号文字パ
ターンファイルの参照に基づき中国語文字コードに変換
する中国語入力手段と、この中国語入力手段により入力
された当該中国語文の構文解析を行う中国語構文解析手
段と、この中国語構文解析手段による構文解析に基づい
て当該中国語文に係る中国語と日本語との構文の差異部
分を日本語文法に適合するように変換する構文変換手段
と、中国語知識データベースファイルを参照して前記中
国語入力手段により入力されて前記構文変換手段により
日本語文法アルファヘットおよび数字で表現された中国
語文を入力し当該中国語文を中国語知識データベースフ
ァイル、中国語用語ファイル、中国語文字パターンファ
イルおよびアルファベット/数字/記号文字パターンフ
ァイルの参照に基づき中国語文字コードに変換し、中国
語構文解析手段が中国語入力手段により入力された当該
中国語文の構文解析を行い、構文変換手段が中国語構文
解析手段による構文解析に基づいて当該中国語文に係る
中国語と日本語との構文の差異部分を日本語文法に適合
するように変換し、単語翻訳手段が中国語知識データベ
ースファイルを参照して中国語入力手段により入力され
て構文変換手段により日本語文法に適合するように構文
が変換された中国語文を構成する中国語単語を日本語単
語に翻訳し、日本語品詞付与手段が日本語辞書ファイル
を参照して単語翻訳手段により生成された日本語単語に
日本語の品詞を付与し、品詞並べ変え手段が日本語品詞
付与手段により付与された品詞に基づき品詞が付与され
た日本語単語を日本語文法に適合するように並べ変え、
連結語挿入手段が品詞並べ変え手段による並べ変えによ
り日本語文法に適合するように並べられた日本語文中の
単語群の間に連結語を挿入して日本語文字コードからな
る日本語文をイ1−成し、日本語出力手段がアルソアベ
ソl−/数字/記号文字パターンファイルおよび日本語
文字パターンファイルを参照して連結語挿入手段により
/44成された日本語文字コードからなる日本語文を日
本語文字で出力する。
〔実施例〕
次に、本発明について図面を参照して説明する。
第1図は、本発明の中国語から日本語への機械翻訳方式
の一実施例の構成を示すプロ、り図である(図中に、後
述する翻訳処理の具体例における処理対象の文の変換の
態様を示している)。本実施例の中国語から日本語への
機械翻訳方式は、中国語入力手段1と、中国語構文解析
手段2と、構文変換手段3と、単語翻訳手段4と、日本
語品詞付与手段5と、品詞並べ変え手段6と、連結語挿
入手段7と、日本語出力手段8と、中国語知識デである
。CKDBF9は、中国語単語文字コード(中国語単語
を示す中国語文字コード)と、併音/声調(凹座)文字
コードと、日本語の意味文字コード(日本語の意味を示
す日本語文字コー1゛)とからなる。
第3図は、C11CFloの内容の−・部を示す図であ
る。CHCFIOは、漢字文字コードと、併音/声調文
字コードと、用語例文字コードとからなる。
第4図は、CCPFIIの内容の一部を示す図である。
CCI”Filは、文字コード(中国語文字コード)と
、併音/声調文字コードと、中国語文字パターンとから
なる。
第5図は、ANSCPF12の内容の一部を示す図であ
る。ANSCPF12は、文字コードと、アルファベッ
ト/数字/記号文字パターンとからなる。
第6図は1.JPF14の内容の一部を示す図である。
JPF14は、文字コード(日本語文字コート。
)と、日本語文字パターンまたは日本語漢字文字パター
ンとからなる。
−タベースファイル(CKDBF、Chinese  
 Knowledge   Data   Ba5eF
ile)9と、中国語用語ファイル(CHCF。
Chinese  Handler  Charact
er  File)10と、中国語文字パターンファイ
ル(CCPF、Chinese  Character
  Pattern  File)11と、アルファヘ
ット/数字/記号文字パターンファイル(ANSCPF
、Alphabet/Number/Symbolic
  Character  Pattern  Fil
e)12と、日本語辞書ファイル13と、日本語文字パ
ターンファイル(J P F。
Japanese  Pattern  File)1
4とを含んで構成されている。
中国語入力手段1は、上述した特願昭62−19232
9に係る中国語ワードプロセッサにより実現されている
日本語辞書ファイル13は、三省堂出版の国語辞典(第
3版)を参考にして生成されている。
第2図は、CKDBF9の内容の一部を示す同次に、こ
のように構成された本実施例の中国語から日本語への機
械翻訳方式の動作について説明する。なお、ここでは第
1図中に示す具体的な例文に関する本実施例の動作につ
いて説明する。
中国語入力手段1 (中国語ワードプロセッサ)のキー
ボード(−船釣なキーボード)から第1図に示すような
rWO3△C0NG2△5HANG4△HA13△DA
O4△BEI3△JINGI△ZUO4△LE△ΔFE
II△JII。」(「Δ」は空白を示す)という入力(
中国語の併音記号および凹座記号がアルファベットおよ
び数字で表現された中国語文の入力)が行われると、第
2図に示すようなCKDBF9.第3図に示すようなC
HCFIO,第4図に示すようなCCPFIIおよび第
5図に示すようなANSCPF12の参照に基づき、中
国語入力手段1はこの入力を以下に示すような中国語文
字コードに変換する(かっこ内は対応する中国語単語を
示す)。
rWo 3 J   =Ca3b C−36(我)。
rcONG2J→C1ISCII、(ハ)。
rSHANG4ΔHAI3J →C,l!。C112゜Cn++ C1,(上海)rD
AO4J  →CIl?C−7(到)。
rBEI3ΔJINGIJ −C,,□C−z C、、r s C□、(北東)。
rZUO4△LE△」 →Cnxa Cazs Cnrt Cart  (朱子
)。
rFE11△JIIJ −C,,?C,,C□2C□2 (1机)。
「。」     →Al13z  As1z  (。)
中国語構文解析手段2は、このような中国語文字コード
により表現されている中国語文(「我ハ上海到北東朱子
1机。」)の構文解析を行う。
この中国語構文解析手段2による構文解析で考慮される
中国語文法の構文(文法構造)の主な形態としては、第
7図+alに示すような基本構文等がある。
これらの基本構文等を有する中国語の構文は、大別して
3種類の構文(単純構文、埋め込み形複合構文および結
合形複合構文)がら成り立ってぃ1 中国語と日本語との間の構文に関する文法の差異部分は
主に述語と動詞との関係にあり、第1図中の例文に係る
構文においては第7図(C1に示すような関係にある。
構文変換手段3は、この関係(規則)に基づいて、中国
語文の「我ハ上海到北東朱子1机。」を「我駄上海到北
東1机坐了。」に変換する(中国語と日本語との構文の
差異部分を日本語文法に適合するように変換する)。
単語翻訳手段4は、このような変換後に、CKDBF9
を参照して、当該中国語文を構成する各中国語単語を以
下に示すように日本語単語に翻訳する(中国語文字コー
ドから日本語文字コードに変換する)。
CR36CMff6(我) =Knas K−ay  
(私)。
Cf1sC−s(ハ)→Jl16JII6J1121 
 Ja□、 (から)Cnzo Cnzo C01Ca
++  (上海)→K 、、z +  K m 31 
 K 、、ffZ  K @ 32   (−上海) 
C,、tC,、(到)  ・J、、、o 、1−211
 J、:ll  J−3(f、で)C7□C1□C,,
1,C1,I、(北東)ここで、上述の3種類の構文と
して構文解析できるものは全体の90%程度であり、慣
用構文等の構文解析はできない。
したがって、中国語構文解析手段2には、このような慣
用構文等の知識があらかしめ記憶されている。
なお、慣用構文の例としては、「下用。」、「下雪。J
、  rlJI4. J、  r打電。」、「起霧。」
右よび「下霧。」等のような自然現象を表す構文がある
第7図(blは、中国語構文解析手段2による「我ハ上
海到北東朱子1机。」という中国語文の構文解析を模式
的に示す図である。この構文解析により、当該中国語文
は主語、状況語、動詞および述語という文の要素からな
る構文として認識される。
次に、構文変換手段3は、このような構文解析に基づい
て、中国語の構文を日本語文法に適合するように変換す
る(文の要素の順序を適切に変換する)。
2 −に、、、に□に、、5K−5(北東)。
C−9C−9C−12G−+t  (”E机)−・j(
−+zK□t Keys Kall KII19 K1
119  (飛行機)。
c、1.、c、□、c、、、c、、、(朱子)→Kns
q K1139 JllI6 J□6 Jll14 J
s14  (乗った)。
Al13Z  A113□ (。)→A、、3□ Aa
3□ (。)次に、日本語品詞付与手段5は、日本語辞
書ファイル13を参照して、上述のようにして生成され
た各日本語単語に日本語の品詞を付与する(各日本語単
語の品詞を特定する)。
第1図に示す例文(日本語文)では、「私Jに「名詞」
が付与され、「から」に「格助詞」が付与され、「上海
」に「名詞」が付与され、「まで」に「副助詞」が付与
され、「北東」に「名詞」が付与され、「飛行機」に「
名詞」が付与され、「乗った」に「動詞」が付与される
品詞並べ変え手段6は、上述のようにして付与された品
詞に基づいて、各日本語単語を日本語文法に適合するよ
うに並べ変える。
中国語と日本語との間の品詞の並びに関する文法の差異
部分は、主に第7図Tdlに示すような助詞と名呵との
並びの規則にある。
この規則に基づいて、品詞並べ変え手段6は、以下に示
すように例文中の日本語単語を並べ変える。
「私(名詞)」+「上湯(名詞)」+「から(格助詞)
」+「北京(名詞)」+「まで(副助詞)」+「飛行機
(名詞)」+「乗った(動詞)」+「。」 連結語挿入手段7は、このようにして並べ変えられた日
本語文中の単語群(中国語構文解析手段2による構文解
析で認識された文の要素に相当する単語の集合。第1図
中の例文では、「私」、「上湯から北京まで」、「飛行
機」および「乗った」という各単語群)の間に、連結語
(連用修飾語)を挿入しく第7図te+参照。図中の「
φ」は連結語が不要であることを示している)、これに
よって以下に示すような日本語文字コードからなる日本
語文を生成する。
「Kイ4ff Ke43  (私) J−:+s Jf
fi311  (は)K11s+5 声記号をアルファヘットおよび数字で表現して中国語文
を入力すると、その入力に基づく中国語から日本語への
機械翻訳が可能になる。
〔発明の効果〕
以上説明したように本発明は、中国語入力手段中国語構
文解析手段、構文変換手段、単語翻訳手段2日本語品詞
(」与手段3品詞並べ変え1段、連結語挿入手段および
日本語出力手段を設けるごとにより、従来の機械翻訳方
式では実現できなかった中国語から日本語への機械翻訳
が可能になるという効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、 第2図は第1図中のCKDBFの内容の一部を示す図、 第3図は第1図中のCHCFの内容の一部を示す図、 第4図は第1図中のc c p Fの内容の−・部を示
す図、 K、、、に、3zK、□ (上湯) J n6 J +
++6 J nll  J 521(から) K −4
K −a K 、s K −s (北京)J、2゜Jm
2゜Ji31  J−3(まで) Kn+z K11+
2 K1118 KIllI6Kn+q KIII9 
 (飛行機) Jl、I9 J、9  (に)K、。 KIl+39 JTII6 Jm+b JllI4 J
ll114  (乗った)A73□Aい、2 (。)」 なお、連結語挿入手段7としては、日本語文の解析を繰
り返して学習を行うごとにより日本語文における語間の
連結関係に関する情報を収集・蓄積し、高品質な日本語
への翻訳を可能とする手段(例えば、訳語選択学習方式
(特願昭61−077639)により実現される手段)
を適用することが望ましい。 日本語出力手段8は、このようにして生成された日本語
文字コードからなる日本語文に基づき、ANSCPF1
2および第6図に示すようなJPF14を参照して、「
私は上湯から北京まで飛行機に乗った。」という日本語
文(日本語文字(日本語文字パターン)による日本語文
)を出力する。 以上のようにして、中国語の併音記号および四6 第5図は第1図中のANSCPFの内容の一部を示す図
、 第6図は第1図中のJPFの内容の一部を示す図、 第7図(al〜(elは第1図に示す中国語から日本語
への機械翻訳方式の具体的な動作を説明するための図で
ある。 図において、 1・・・中国語入力手段、 2・・・中国語構文解析手段、 3・・・構文変換手段、 4・・・用語翻訳手段、 5・・・日本語品詞付与手段、 6・・・品詞並べ変え手段、 7・・・連結語挿入手段、 8・・・日本語出力手段、 9・・・CKDBF (中国語知識データヘースファイ
ル)、 10・・・CIICF(中国語用語ファイル)、11・
・・CCPF (中国語文字パターンファイル)、 ・ANSCPIi’(アルファべ・ノド/数字/記号文
字パターンファイル)、 ・日本語辞書ファイル、 ・、IPFC日本語文字パターンファイル)である。

Claims (1)

  1. 【特許請求の範囲】 ■音記号および四声記号がアルファベットおよび数字で
    表現された中国語文を入力し当該中国語文を中国語知識
    データベースファイル、中国語用語ファイル、中国語文
    字パターンファイルおよびアルファベット/数字/記号
    文字パターンファイルの参照に基づき中国語文字コード
    に変換する中国語入力手段と、 この中国語入力手段により入力された当該中国語文の構
    文解析を行う中国語構文解析手段と、この中国語構文解
    析手段による構文解析に基づいて当該中国語文に係る中
    国語と日本語との構文の差異部分を日本語文法に適合す
    るように変換する構文変換手段と、 中国語知識データベースファイルを参照して前記中国語
    入力手段により入力されて前記構文変換手段により日本
    語文法に適合するように構文が変換された中国語文を構
    成する中国語単語を日本語単語に翻訳する単語翻訳手段
    と、 日本語辞書ファイルを参照して前記単語翻訳手段により
    生成された日本語単語に日本語の品詞を付与する日本語
    品詞付与手段と、 この日本語品詞付与手段により付与された品詞に基づき
    品詞が付与された日本語単語を日本語文法に適合するよ
    うに並べ変える品詞並べ変え手段と、 この品詞並べ変え手段による並べ変えにより日本語文法
    に適合するように並べられた日本語文中の単語群の間に
    連結語を挿入して日本語文字コードからなる日本語文を
    生成する連結語挿入手段と、アルファベット/数字/記
    号文字パターンファイルおよび日本語文字パターンファ
    イルを参照して前記連結語挿入手段により生成された日
    本語文字コードからなる日本語文を日本語文字で出力す
    る日本語出力手段と を有することを特徴とする中国語から日本語への機械翻
    訳方式。
JP1258245A 1989-10-03 1989-10-03 中国語から日本語への機械翻訳方式 Expired - Fee Related JP3016797B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1258245A JP3016797B2 (ja) 1989-10-03 1989-10-03 中国語から日本語への機械翻訳方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1258245A JP3016797B2 (ja) 1989-10-03 1989-10-03 中国語から日本語への機械翻訳方式

Publications (2)

Publication Number Publication Date
JPH03119473A true JPH03119473A (ja) 1991-05-21
JP3016797B2 JP3016797B2 (ja) 2000-03-06

Family

ID=17317545

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1258245A Expired - Fee Related JP3016797B2 (ja) 1989-10-03 1989-10-03 中国語から日本語への機械翻訳方式

Country Status (1)

Country Link
JP (1) JP3016797B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05266069A (ja) * 1992-03-23 1993-10-15 Nec Corp 中国語と日本語との間の双方向機械翻訳方式
JPH06314293A (ja) * 1993-04-30 1994-11-08 Nec Corp 電子中日辞典使用検索方式

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6310264A (ja) * 1986-07-01 1988-01-16 Nec Corp 中国語から日本語への翻訳方式
JPS63153669A (ja) * 1986-08-25 1988-06-27 Nec Corp 日本語文から中国語文への翻訳方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6310264A (ja) * 1986-07-01 1988-01-16 Nec Corp 中国語から日本語への翻訳方式
JPS63153669A (ja) * 1986-08-25 1988-06-27 Nec Corp 日本語文から中国語文への翻訳方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05266069A (ja) * 1992-03-23 1993-10-15 Nec Corp 中国語と日本語との間の双方向機械翻訳方式
JPH06314293A (ja) * 1993-04-30 1994-11-08 Nec Corp 電子中日辞典使用検索方式

Also Published As

Publication number Publication date
JP3016797B2 (ja) 2000-03-06

Similar Documents

Publication Publication Date Title
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
JPH05266069A (ja) 中国語と日本語との間の双方向機械翻訳方式
JPH0344764A (ja) 機械翻訳装置
JPH03119473A (ja) 中国語から日本語への機械翻訳方式
JPS6190269A (ja) 翻訳方式
JP2827321B2 (ja) 日本語から中国語への機械翻訳方式
JPS6170663A (ja) 住所翻訳装置
JPS6190268A (ja) 翻訳方式
JPH02133824A (ja) トランスレータ
JPH09281993A (ja) 発音記号生成装置
JPS6079400A (ja) 音声合成方法
JPH04195586A (ja) 中国語音声入力による機械翻訳装置
JPH04112366A (ja) 自然言語文解析装置
JPH10269221A (ja) 未登録語処理方式
JPS63255767A (ja) 日本語ワ−ドプロセツサ
JPH04306766A (ja) 機械翻訳装置
JPS6367677A (ja) 機械翻訳装置
JPH04263364A (ja) 自然言語自動翻訳方法
JPH0284698A (ja) 音声応答方式
JPH0259860A (ja) 機械翻訳装置
JPH07182342A (ja) 機械翻訳装置
JPH02281374A (ja) 機械翻訳装置におけるハイフン合成語処理方法
JPH0785051A (ja) 機械翻訳システム
JPH03179561A (ja) 機械翻訳装置
JPH06149870A (ja) 日本語文単語分割方法及びその装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees