JPH02165378A - 機械翻訳システム - Google Patents

機械翻訳システム

Info

Publication number
JPH02165378A
JPH02165378A JP63321602A JP32160288A JPH02165378A JP H02165378 A JPH02165378 A JP H02165378A JP 63321602 A JP63321602 A JP 63321602A JP 32160288 A JP32160288 A JP 32160288A JP H02165378 A JPH02165378 A JP H02165378A
Authority
JP
Japan
Prior art keywords
words
processing
speech
rules
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63321602A
Other languages
English (en)
Inventor
Akira Takagi
高木 朗
Jun Takada
潤 高田
Minoru Yugawa
実 湯川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CSK Corp
Original Assignee
CSK Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSK Corp filed Critical CSK Corp
Priority to JP63321602A priority Critical patent/JPH02165378A/ja
Priority to PCT/JP1989/001264 priority patent/WO1990007159A1/ja
Priority to EP19900900994 priority patent/EP0403660A4/en
Priority to CA002006039A priority patent/CA2006039A1/en
Priority to US07/452,807 priority patent/US5136503A/en
Publication of JPH02165378A publication Critical patent/JPH02165378A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、日本語を所定の翻訳言語に自動的に翻訳する
機械翻訳システムに関する。
[従来の技術] 近年、コンピュータや通信技術の発展に伴い、あらゆる
分野において国際間の情報交換が極めて活発になってき
ている。様々な経済活動が地球規模で行われるようにな
ってきた今日、国際コミニュケーションの重要性は益々
高まってきている。
このような状況の下、コンピュータを用いて日英間の翻
訳を自動的に行うシステムの開発が望まれ、これまで種
々の機械翻訳システムが開発されてきている。
従来の日本語を英語に翻訳する機械翻訳システムとして
は1文脈自由文法や依存文法等に基づいて原文の組立て
を解析する意味トランスファ方式が主流となっている。
[発明が解決しようとする課題] 従来の機械翻訳システムにおいては、上述の如く文脈自
由文法や格関係に基づく構文解析規則によって原文の組
立てを解析するが、この方式では文体毎に構文解析規則
を必要としかつ同じ意味の文でも語順が異なればそれぞ
れに異なる規則が必要であるため、構文解析規則の数が
無数となる。
しかし、現実にはあらゆる文体に応じて無数の構文解析
規則を用意するのは不可能であることから、実際に翻訳
処理を行うときは、前編集処理を行って原文を変形した
上で構文解析処理等を行っている。このように従来の方
式では、翻訳の際に前編集処理等の手間が必要となるた
め処理効率が悪いといった欠点があった。
[課題を解決するための手段] 上記従来の課題を解決する本発明は、入力された原文を
単語に分割し、該単語に単語の持つ文法情報及び意味情
報を付加する形態素解析処理と、上記形態素解析処理に
より分割された単語相互の係り受け構造を上記文法情報
と意味情報及び解析規則に従って解析し、上記原文の解
析木を生成する構文解析処理と、構文解析による解析木
を翻訳言語が生成可能な解析木に変換する構文変換処理
と、翻訳言語への生成規則に基づき翻訳文を生成する生
成処理と、生成された翻訳文の各単語を付加情報に基づ
き語形変化させる形態素合成処理とからなる機械翻訳シ
ステムにおいて、上記構文解析処理は、係られる語と係
る語の品詞の組み合わせに応じて解析規則を記述した品
詞マトリックステーブルから単語相互の組み合わせに対
応する規則を取り出し係り受け(修飾被修飾関係)の有
無を判別する処理と、係り受けが成立した単語を部分解
析木として順次スタックする処理と、スタックされた部
分解析木から上記原文に対応する解析木を出力する処理
からなることを特徴とする。
[実施例] 以下、本発明の実施例について図面を参照して詳細に説
明する。
第1図は本発明による機械翻訳システムの機能ブロック
図である。
本機械翻訳システムは、翻訳処理部lと、翻訳処理用の
内部データ部2と、翻訳処理用の外部データ部3とで構
成されている。また、内部データ部2は品詞マトリック
ステーブル21と品詞間連接テーブル22を有し、外部
データ部3は日本語辞占部31と交換辞書部32と生成
規則部33を有してなる。
上記翻訳処理部1は、形態素解析部11と、構文解析部
12と、構文変換部13と、文生成部14と、形態素合
成部15からなる。
上記形態素解析部11は、第2図のフローチャートに示
すように入力された日本文を単語に分、!スし、該単語
に単語の持つ文法情報及び意味情報を付加する形態素解
析処理Stを行なう、構文解析部12は、上記形態素解
析処理Stにより分。
割された単語相互の係り受け(修飾被修飾関係)構造を
上記文法情報と意味情報及び解析規則に従って解析し、
上記日本文の解析木を生成する構文解析処理S3を行な
う、構文変換部13は、構文解析結果から日本文を英文
の構造に変換する構文変換処理S5を行なう。文生成部
14は、英文への生成規則に基づき英文を生成する文生
成処理S7を行ない、形態素合成部15は、生成された
英文の各単語を付加情報に基づき語形変化させる形態素
合成処理部S9を行なう、これによって日本文から英文
への翻訳を行う。
次に具体的な翻訳処理例を挙げて各処理内容を詳しく解
説する。
“私は、新宿で本を買った。”という日本文を英文に翻
訳する場合、まず形態素解析部11の形態素解析処理S
1において上記原文を次にように単語に分割する。
私/は/新宿/で/木/を/買つ/た。/その際1例え
ば“私は”を1つの単語として区切った場合、′私は”
という語の活用の有無を内部データ部2の品詞間連接テ
ーブル22と外部データ部3の第3図に示す構成の日本
語辞書部31を参照することによって判別する。この場
合“私は”は無活用であるから、さらに形態素解析処理
が行われ“私”と“は”に分割される。
ここで、本システムの日本語辞書部31には、図示の如
く各単語の品詞、意味素性、格等の文法情報及び意味情
報が登録されている。分割された各単語には、上記日本
語辞書部31からその単語の文法情報及び意味情報が付
加され、次の構文解析部12の構文解析処理S3に移さ
れる。
構文解析部12の構文解析処理S3では、まず第1に上
記分割して得た単語を2語づつ取り出して係り受けの判
別を行う、この係り受けの判別は、係られる語と係る語
の品詞の組み合わせに応じて解析規則を記述した内部デ
ータ部2の品詞マトリックステーブル21に基づいて行
う。即ち、取り出した2つ単語相互の組み合わせに対応
する規則を品詞マトリックステーブル21から取り出し
係り受けが成立するかどうかを判別する。上記品詞マト
リックステーブル21には、最大品詞の数の2乗に相当
する数の規則が規定されている。
なお、2つの単語は、文頭から順に選択するものとする
。これは、日本語においては、原則として文の後方にあ
る語が前方にある語に係ることはないことによる。
上記具体例の場合、まず文頭から順に“私”(代名詞)
と“は” (格助詞)を取り出し、第4図に示すような
構成の品詞マトリックステーブル21を読む、ここでは
、代名詞の“私”が係る語で格助詞の“は”が係られる
語であるから、品詞マトリックステーブル21の対応す
る組み合わ仕位置から規則Aを読出す。ここで、規則A
には、例えば“代名詞が格助詞に係る”と規定されてお
り、これにより係り受けが成立することが判断される0
次に、“は”と“新宿” (名詞)を取り出し、品詞マ
トリックステーブル21を読むと規則Cを得る。ここで
、規則Cには、“係り受けが成立しない”と規定されて
おり、上記2語の取り出しは無視される。
構文解析処理S3では、第2に係り受けが成立した2つ
の単語を部分解析木として順次スタック5に格納してい
く。例えば、上記“私”と“は”では、係り受けが成立
したので、第5図(a)のように部分解析木を生成して
スタック5に入れる。
このスタック5には、後入れ先出し型のスタックが用い
られている。また、′新宿”と“で” (格助詞)の組
み合わせ及び“木″ (名詞)と“を”(格助詞)の組
み合わせで係り受けが成立するので、第5図(b)及び
第5図(C)に示すようにそれぞれの2語で部分解析木
を生成し順次スタック5に入れる。
“を” (格助詞)と“買う” (動詞)の2語を取り
出し品詞マトリックステーブル21を読むと、対応する
規則Bには、例えば“動詞の格スロットにある連結語及
び意味素と、係ろうとしている格助詞及びその下の名詞
の意味素が一致するなら係る”と規定されている。本例
では、日本語辞書部31の“買う”の格スロットにある
連結語が“を”で、意味素が“商品”であり、かつ係ろ
うとしている格助詞が“を”でかつその下の名詞“本”
の意味素が“商品”であるから、上記規則を満足する。
この結果、“を”と“買う”で係り受けが成立すること
が判別され、その部分解析木がスタック5に格納される
最後に、構文解析処理S3では、スタック5に格納され
た部分解析木から原文の日本文に対応する第6図(a)
に示すような解析木を生成して出力する。
構文変換部13の構文変換処理S5では、構文解析部1
2から出力された解析木を翻訳言語である英語の解析木
に変換する。その際、日本語に対応する英語への近き換
えを行う、英語への置き換えは、外部データ部3の変換
辞書部32を参照してなされる。構文変換処理S5によ
り変換された解析木を第6図(b)に示す。
文生成部14の文生成処理S7では、上記英語が生成可
能な解析木を1次元列に並べ換えて英文(I buy 
a book in 5injyuku )を生成する
。その際、外部データ部3の生成規則部33を参照する
また、形態素合成部15の形態素合成処理S9では、生
成された英文の各単語を活用情報(動詞の過去形1名詞
の複数形等)に基づき語形変化させて最終的な翻訳結果
(I bought a bookin 5injyu
ku )を出力する。
なお、上記実施例では日本文を英文に翻訳する場合を説
明したが、翻訳言語については英語に限らずフランス語
やロシア語などの言語への翻訳にも本発明を適用するこ
とができる。
[発明の効果1 以上説明したように本発明によれば、構文解析処理は、
係られる語と係る語の品詞の組み合わせに応じて解析規
則を記述した品詞マトリックステーブルから単語相互の
組み合わせに対応する規則を取り出し係り受けの有無を
判別する処理と、係り受けが成立した単語を部分解析木
として順次スタックする処理と、スタックされた部分解
析木から上記原文に対応する解析木を出力する処理から
なるため、構文解析を行うための規則が最大品詞の2乗
の数で済むため、これまでのように前編集処理を行う必
要がなくなり、あらゆる文体の日本文を効率よく翻訳処
理できるようになる。
【図面の簡単な説明】 第り図は本発明による機械翻訳システムのaf駈ブロッ
ク図、 第2図は本発明による機械翻訳システムの翻訳処理の流
れを示すフローチャート、 第3図は日本語辞書部の内容を示す図、第4図は品詞マ
トリックステーブルの内容を示す図、 第5図(a)〜(c)は部分解析木をスタックに格納し
た状態を示す図、 第6図(a)は構文解析処理によって出力される解析木
を示す図、 第6図(b)は構文変換処理により生成される解析木を
示す図である。 l:翻訳処理部      2:内部データ部3:外部
データ部 ll:形態素解析部    12:構文解析部13:構
文変換部     14:文生成部15:形態素合成部 2に品詞マトリックステーブル 31:日本語辞書部    32:変換辞書部33:生
成規則部 Sl:形態素解析処理   S2:構文解析処理S3:
構文変換処理    S4:英文生成処理S5:形態素
合成処理

Claims (1)

  1. 【特許請求の範囲】 入力された原文を単語に分割し、該単語に単語の持つ文
    法情報及び意味情報を付加する形態素解析処理と、 上記形態素解析処理により分割された単語相互の係り受
    け構造を上記文法情報と意味情報及び解析規則に従って
    解析し、上記原文の解析木を生成する構文解析処理と、 構文解析による解析木を翻訳言語が生成可能な解析木に
    変換する構文変換処理と、 翻訳言語への生成規則に基づき翻訳文を生成する生成処
    理と、 生成された翻訳文の各単語を付加情報に基づき語形変化
    させる形態素合成処理とからなる機械翻訳システムにお
    いて、 上記構文解析処理は、係られる語と係る語の品詞の組み
    合わせに応じて解析規則を記述した品詞マトリックステ
    ーブルから単語相互の組み合わせに対応する規則を取り
    出し係り受け(修飾被修飾関係)の有無を判別する処理
    と、係り受けが成立した単語を部分解析木として順次ス
    タックする処理と、スタックされた部分解析木から上記
    原文に対応する解析木を出力する処理からなることを特
    徴とする機械翻訳システム。
JP63321602A 1988-12-20 1988-12-20 機械翻訳システム Pending JPH02165378A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP63321602A JPH02165378A (ja) 1988-12-20 1988-12-20 機械翻訳システム
PCT/JP1989/001264 WO1990007159A1 (en) 1988-12-20 1989-12-15 Machine translation system
EP19900900994 EP0403660A4 (en) 1988-12-20 1989-12-15 Machine translation system
CA002006039A CA2006039A1 (en) 1988-12-20 1989-12-19 Machine translation system
US07/452,807 US5136503A (en) 1988-12-20 1989-12-19 Machine translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63321602A JPH02165378A (ja) 1988-12-20 1988-12-20 機械翻訳システム

Publications (1)

Publication Number Publication Date
JPH02165378A true JPH02165378A (ja) 1990-06-26

Family

ID=18134368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63321602A Pending JPH02165378A (ja) 1988-12-20 1988-12-20 機械翻訳システム

Country Status (5)

Country Link
US (1) US5136503A (ja)
EP (1) EP0403660A4 (ja)
JP (1) JPH02165378A (ja)
CA (1) CA2006039A1 (ja)
WO (1) WO1990007159A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992009041A1 (en) * 1990-11-20 1992-05-29 Kabushiki Kaisha Csk Japanese sentence structure analyzing system
WO1992011600A1 (en) * 1990-12-20 1992-07-09 Kabushiki Kaisha Csk Syntax analyzing system for japanese language
JP2009176062A (ja) * 2008-01-24 2009-08-06 Yahoo Japan Corp 自然言語解析装置、自然言語解析方法および自然言語解析プログラム
JP2018092619A (ja) * 2016-12-05 2018-06-14 雲拓科技有限公司 請求の範囲のパソコン自動翻訳装置

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03129469A (ja) * 1989-10-14 1991-06-03 Canon Inc 自然言語処理装置
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
JP3293619B2 (ja) * 1990-08-20 2002-06-17 株式会社シーエスケイ 日本語構文解析システム
US5416903A (en) * 1991-08-19 1995-05-16 International Business Machines Corporation System and method for supporting multilingual translations of a windowed user interface
US6760695B1 (en) 1992-08-31 2004-07-06 Logovista Corporation Automated natural language processing
US5528491A (en) * 1992-08-31 1996-06-18 Language Engineering Corporation Apparatus and method for automated natural language translation
US6278967B1 (en) 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
JPH06195373A (ja) * 1992-12-24 1994-07-15 Sharp Corp 機械翻訳装置
US6283952B1 (en) 1992-12-30 2001-09-04 Tambrands, Inc. Shaped tampon
JP2821840B2 (ja) * 1993-04-28 1998-11-05 日本アイ・ビー・エム株式会社 機械翻訳装置
JP2855409B2 (ja) * 1994-11-17 1999-02-10 日本アイ・ビー・エム株式会社 自然言語処理方法及びシステム
USD385276S (en) * 1996-01-26 1997-10-21 Griggs Robert L Portable language translating machine
US6470306B1 (en) 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
US6233544B1 (en) * 1996-06-14 2001-05-15 At&T Corp Method and apparatus for language translation
US6460015B1 (en) * 1998-12-15 2002-10-01 International Business Machines Corporation Method, system and computer program product for automatic character transliteration in a text string object
US6496844B1 (en) 1998-12-15 2002-12-17 International Business Machines Corporation Method, system and computer program product for providing a user interface with alternative display language choices
US6389386B1 (en) 1998-12-15 2002-05-14 International Business Machines Corporation Method, system and computer program product for sorting text strings
US7099876B1 (en) 1998-12-15 2006-08-29 International Business Machines Corporation Method, system and computer program product for storing transliteration and/or phonetic spelling information in a text string class
JP2001005675A (ja) * 1999-06-21 2001-01-12 Matsushita Electric Ind Co Ltd プログラム変換装置及びプロセッサ
JP3662519B2 (ja) * 2000-07-13 2005-06-22 シャープ株式会社 光ピックアップ
US7536293B2 (en) * 2003-02-24 2009-05-19 Microsoft Corporation Methods and systems for language translation
KR100911621B1 (ko) * 2007-12-18 2009-08-12 한국전자통신연구원 한영 자동번역 방법 및 장치
US20110320191A1 (en) * 2009-03-13 2011-12-29 Jean-Pierre Makeyev Text creation system and method
CN104298662B (zh) * 2014-04-29 2017-10-10 中国专利信息中心 一种基于有机物命名实体的机器翻译方法及翻译系统
CN107229616B (zh) 2016-03-25 2020-10-16 阿里巴巴集团控股有限公司 语言识别方法、装置及系统
US11907678B2 (en) 2020-11-10 2024-02-20 International Business Machines Corporation Context-aware machine language identification
CN114611524B (zh) * 2022-02-08 2023-11-17 马上消费金融股份有限公司 文本纠错方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61184685A (ja) * 1985-02-12 1986-08-18 Hitachi Ltd 翻訳情報追加方法
JPS62163173A (ja) * 1986-01-14 1987-07-18 Toshiba Corp 機械翻訳方法
JP2732563B2 (ja) * 1986-05-20 1998-03-30 株式会社東芝 機械翻訳方法及び装置
JPS638864A (ja) * 1986-06-27 1988-01-14 Sharp Corp 翻訳装置
JPS63175971A (ja) * 1987-01-16 1988-07-20 Nippon Telegr & Teleph Corp <Ntt> 自然言語処理方式

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992009041A1 (en) * 1990-11-20 1992-05-29 Kabushiki Kaisha Csk Japanese sentence structure analyzing system
WO1992011600A1 (en) * 1990-12-20 1992-07-09 Kabushiki Kaisha Csk Syntax analyzing system for japanese language
JP2009176062A (ja) * 2008-01-24 2009-08-06 Yahoo Japan Corp 自然言語解析装置、自然言語解析方法および自然言語解析プログラム
JP2018092619A (ja) * 2016-12-05 2018-06-14 雲拓科技有限公司 請求の範囲のパソコン自動翻訳装置

Also Published As

Publication number Publication date
EP0403660A1 (en) 1990-12-27
CA2006039A1 (en) 1990-06-20
WO1990007159A1 (en) 1990-06-28
EP0403660A4 (en) 1992-09-30
US5136503A (en) 1992-08-04

Similar Documents

Publication Publication Date Title
JPH02165378A (ja) 機械翻訳システム
EP1306775A1 (en) Machine translation
JPH02308370A (ja) 機械翻訳システム
JPH10312382A (ja) 類似用例翻訳システム
Wang et al. Evaluation of spoken language grammar learning in the ATIS domain
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005284723A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
KR102143158B1 (ko) 한국어 구문 분석을 활용한 정보 처리 시스템
JP2626722B2 (ja) 日本語生成装置
KR100194798B1 (ko) 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005092615A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3892227B2 (ja) 機械翻訳システム
JP4033012B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033088B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2715875B2 (ja) 多言語要約生成装置
Aref et al. English to Arabic machine translation: a critical review and suggestions for development
JP4036172B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPS63180172A (ja) 機械翻訳装置
JP3313810B2 (ja) アスペクト処理装置
JP2004199519A (ja) 機械翻訳方法、機械翻訳装置、および機械翻訳プログラム
JP2004086919A (ja) 機械翻訳システム
JP2001125898A (ja) 言語解析処理の方法、システム
EP1306773A1 (en) Machine translation
EP1306774A1 (en) Machine translation