JP2821840B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP2821840B2
JP2821840B2 JP5102973A JP10297393A JP2821840B2 JP 2821840 B2 JP2821840 B2 JP 2821840B2 JP 5102973 A JP5102973 A JP 5102973A JP 10297393 A JP10297393 A JP 10297393A JP 2821840 B2 JP2821840 B2 JP 2821840B2
Authority
JP
Japan
Prior art keywords
feature
meaning
information
sentence
polysemy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5102973A
Other languages
English (en)
Other versions
JPH06314294A (ja
Inventor
直彦 浦本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IBM Japan Ltd
Original Assignee
IBM Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IBM Japan Ltd filed Critical IBM Japan Ltd
Priority to JP5102973A priority Critical patent/JP2821840B2/ja
Priority to US08/203,084 priority patent/US5844798A/en
Priority to DE69429301T priority patent/DE69429301T2/de
Priority to EP94302567A priority patent/EP0622742B1/en
Publication of JPH06314294A publication Critical patent/JPH06314294A/ja
Application granted granted Critical
Publication of JP2821840B2 publication Critical patent/JP2821840B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳方法及び機械
翻訳装置に係り、より詳しくは、コンピュータ等の機械
により翻訳対象である第1言語による原文を第2言語に
よる訳文に変換する機械翻訳方法及び機械翻訳装置に関
する。
【0002】
【従来の技術及び発明が解決しようとする課題】従来、
異なる言語間において相互に意味が一致した文として各
々の文を適合させるために、コンピュータによって第1
言語で表された原文を形態素解析等の構文解析を行って
単語に分割し、目的とする第2言語で表された訳文に変
換する機械翻訳装置が知られている(特開平2−308
370号公報、特開平3−8082号公報等)。
【0003】この機械翻訳装置では、第1言語の翻訳を
対象としている原文について係り受け解析等の構文解析
を行い、語義等の曖昧な部分に仮の係り受けを付与し最
終的に原文の語順等を利用して翻訳したり、語義等の曖
昧な部分について原文の該部分以外の部分の情報を用い
て曖昧さを解消して翻訳したりしている。
【0004】しかしながら、複数の語義による曖昧さを
有する語句(以下、多義語という)は、原文と訳文との
語レベルの適合が難しく、構文解析等の解析を充分に行
った詳細な規則により各語句の使用について充分な場合
分けが行わなければならないため、多義語の原語に適合
する訳語が無数となり訳語を決定できないことを生じ
る。
【0005】そこで、多義語の語義を決定するために、
多義語である動詞に第2言語の訳語を付与するに際し
て、各訳語とその用法を動詞に限って記述した動詞変換
テーブルを形成しておき、翻訳するときには、この動詞
変換テーブルを参照して、適合する語義で翻訳する機械
翻訳方法が知られている(特開昭62−219165号
公報参照)。
【0006】しかしながら、上記のように動詞に限って
記述した動詞変換テーブルを用いた機械翻訳方法では、
動詞についてのみの情報が画一的に適用されるため、解
析された文が含む動詞以外の全ての多義語について最適
な語義を選択することができない。また、個々の語義を
決定するのに必要な様々な意味情報や文法情報を動的に
扱うことができない。
【0007】また、多義語を状況及び属性等を付与した
文の事例によるデータベース(以下、事例ベースとい
う)に整理して利用することにより、語句と語義との適
合関係を設定し、翻訳時には、この事例ベースを参照し
て最適な語義を選択する機械翻訳方法も知られている
(特開平3−282677号公報参照)。
【0008】しかしながら、複数事例を一般化した事例
ベースから語義を特定する方法では、語義決定に必要な
演算量が多くなる。
【0009】本発明は、上記事実を考慮して、第1言語
の原文と第2言語の訳文とが最適に適合するように、多
数の語義を有する第1言語の語句に対する語義の曖昧さ
を解消して高精度で原文を訳文に変換する機械翻訳方法
及び機械翻訳装置を得ることが目的である。
【0010】
【0011】第1の発明の機械翻訳方法は、1つの語句
に対して複数の語義を有する多義語を含む翻訳対象とな
る第1言語による文の構造を解析して意味情報及び文法
情報を求め、該意味情報及び文法情報に基づいて第2言
語による文に変換する機械翻訳方法であって、前記多義
語を含みかつ該多義語の語義に曖昧さがなく構成された
複数の文から、該多義語の1つの語義にのみ適合する意
味情報及び文法情報の少なくとも一方の情報を十分特徴
とすると共に、該多義語の1語義に関する全ての文に適
合する意味情報及び文法情報の少なくとも一方の情報を
必要特徴として、該十分特徴と該十分特徴に適合する語
義との関係及び該必要特徴と該必要特徴に適合する語義
との関係を予め求め、前記解析された文の意味情報及び
文法情報の少なくとも一方の情報が前記十分特徴及び必
要特徴に一致するか否かを判断し、一致した前記十分特
徴及び必要特徴に適合する前記多義語の語義を選択す
る。
【0012】第2の発明の機械翻訳方法は、1つの語句
に対して複数の語義を有する多義語を含む翻訳対象とな
る第1言語による文の構造を解析して意味情報及び文法
情報を求め、該意味情報及び文法情報に基づいて第2言
語による文に変換する機械翻訳方法であって、前記多義
語を含みかつ該多義語の語義に曖昧さがなく構成された
複数の文から、該多義語の1つの語義にのみ適合する意
味情報及び文法情報の少なくとも一方の情報を十分特徴
とすると共に、該多義語の1語義に関する全ての文に適
合する意味情報及び文法情報の少なくとも一方の情報を
必要特徴としかつ、該多義語の2以上の語義に適合する
意味情報及び文法情報の少なくとも一方の情報を依存特
徴として、該十分特徴と該十分特徴に適合する語義との
関係を求めると共に該必要特徴と該必要特徴に適合する
語義との関係を求めかつ該依存特徴と該依存特徴に適合
する語義との関係を予め求め、前記解析された文の意味
情報及び文法情報の少なくとも一方の情報が前記十分特
徴及び必要特徴に一致するか否かを判断し、前記十分特
徴及び必要特徴に少なくとも一方が一致しない場合に
は、前記依存特徴に適合する語義の範囲内に含まれる前
記文に基づいて類似度を演算し、演算結果に基づいて前
記多義語の語義を選択する。
【0013】
【0014】第3機械翻訳装置は、1つの語句に対して
複数の語義を有する多義語を含む翻訳対象となる第1言
語による文の構造を解析して意味情報及び文法情報を求
め、該意味情報及び文法情報に基づいて第2言語による
文に変換する機械翻訳装置において、前記多義語を含み
かつ該多義語の語義に曖昧さがなく構成された複数の文
から前記多義語の1つの語義にのみ適合する意味情報及
び文法情報の少なくとも一方の情報を十分特徴とすると
共に、該多義語の1語義に関する全ての文に適合する意
味情報及び文法情報の少なくとも一方の情報を必要特徴
として、該十分特徴と該十分特徴に適合する語義との関
係及び該必要特徴と該必要特徴に適合する語義との関係
を表す特徴テーブルと、前記特徴テーブルを参照し、前
記解析された文の意味情報及び文法情報の少なくとも一
方の情報が前記十分特徴及び必要特徴に一致するか否か
を判断する判断手段と、前記一致した前記十分特徴に適
合する前記多義語の語義を選択する選択手段と、を備え
ている。
【0015】第4の機械翻訳装置は、1つの語句に対し
て複数の語義を有する多義語を含む翻訳対象となる第1
言語による文の構造を解析して意味情報及び文法情報を
求め、該意味情報及び文法情報に基づいて第2言語によ
る文に変換する機械翻訳装置において、前記多義語を含
みかつ該多義語の語義に曖昧さがなく構成された複数の
文から、該多義語の1つの語義にのみ適合する意味情報
及び文法情報の少なくとも一方の情報を十分特徴とする
と共に、該多義語の1語義に関する全ての文に適合する
意味情報及び文法情報の少なくとも一方の情報を必要特
徴としかつ、該多義語の2以上の語義に適合する意味情
報及び文法情報の少なくとも一方の情報を依存特徴とし
て、該十分特徴と該十分特徴に適合する語義との関係を
求めると共に該必要特徴と該必要特徴に適合する語義と
の関係を求めかつ該依存特徴と該依存特徴に適合する語
義との関係を表す特徴テーブルと、前記特徴テーブルを
参照し、前記解析された文の意味情報及び文法情報の少
なくとも一方の情報が前記十分特徴及び必要特徴に一致
するか否かを判断する判断手段と、前記判断手段によっ
て前記十分特徴及び必要特徴に少なくとも一方が一致し
ないと判断された場合に、前記依存特徴に適合する語義
の範囲内に含まれる前記文に基づいて類似度を演算する
演算手段と、前記演算手段の演算結果に基づいて前記多
義語の語義を選択する選択手段と、を備えている。
【0016】
【作用】上記の機械翻訳方法では、1つの語句に対して
複数の語義を有する多義語を含む翻訳対象となる第1言
語による文の構造を解析して意味情報及び文法情報を求
め、該意味情報及び文法情報に基づいて第2言語による
文に変換する。多義語の場合、語義の曖昧さが生じるの
でそのままでは第2言語に翻訳することができない。多
義語は一般に語義毎に、その語義毎に他の語義と弁別可
能な特徴を有している。すなわち、目的語が物であった
り主語が敵対者であったりする意味概念の特徴を有する
意味情報や、他動詞で用いられることや目的語を2個有
することを特徴とする文法情報等がある。この特徴は、
ある語義では文法情報であったり意味情報であったりす
る。
【0017】この多義語を含みかつ該多義語の語義に曖
昧さがなく構成された複数の文から、該多義語の1つの
語義にのみ適合する意味情報及び文法情報の少なくとも
一方の情報を該多義語の十分特徴として、該十分特徴と
該十分特徴に適合する語義との関係を予め求める。この
求めた関係から、第1言語による文の構造が解析された
文の意味情報及び文法情報の少なくとも一方の情報が十
分特徴に一致するか否かを判断し、一致した十分特徴に
適合する多義語の語義を選択すれば、翻訳対象となる第
1言語による文の各語義の曖昧さは解消され、容易に第
2言語による文に変換することができる。
【0018】この機械翻訳方法は、後述の機械翻訳装置
のように、多義語を含みかつ該多義語の語義に曖昧さが
なく構成された複数の文から多義語の1つの語義にのみ
適合する意味情報及び文法情報の少なくとも一方の情報
を十分特徴として該十分特徴と該十分特徴に適合する語
義との関係を表す特徴テーブルと、特徴テーブルを参照
し、解析された文の意味情報及び文法情報の少なくとも
一方の情報が十分特徴に一致するか否かを判断する判断
手段と、一致した十分特徴に適合する多義語の語義を選
択する選択手段と、を備えることによって実現できる。
このように、その語義のを他の語義から弁別する十分特
徴を判断して語義を選択しているため、高負荷の類似度
演算を行う必要がない。
【0019】また、多義語が有する1つの語義におい
て、この語義に適合する全ての文に共通して有する特徴
があるときは、入力文はこの共通してこの情報を含んで
いなければならない。
【0020】第1の発明である機械翻訳方法では、多義
語を含みかつ該多義語の語義に曖昧さがなく構成された
複数の文から、該多義語の1つの語義にのみ適合する意
味情報及び文法情報の少なくとも一方の情報を十分特徴
とすると共に、該多義語の1語義に関する全ての文に適
合する意味情報及び文法情報の少なくとも一方の情報を
必要特徴として、該十分特徴と該十分特徴に適合する語
義との関係及び該必要特徴と該必要特徴に適合する語義
との関係を予め求めている。この求めた関係から、第1
言語による文の構造が解析された文の意味情報及び文法
情報の少なくとも一方の情報が十分特徴及び必要特徴に
一致するか否かを判断し、一致した十分特徴及び必要特
徴に適合する多義語の語義を選択する。このように、翻
訳対象となる文が有する十分特徴による語義について必
ず有する必要特徴を判断して語義を選択しているため、
高負荷の類似度演算することがなく、高精度で多義語の
語義を選択できる。
【0021】この第1の発明である機械翻訳方法は、第
3の発明である機械翻訳装置のように、多義語を含みか
つ該多義語の語義に曖昧さがなく構成された複数の文か
ら多義語の1つの語義にのみ適合する意味情報及び文法
情報の少なくとも一方の情報を十分特徴とすると共に、
該多義語の1語義に関する全ての文に適合する意味情報
及び文法情報の少なくとも一方の情報を必要特徴とし
て、該十分特徴と該十分特徴に適合する語義との関係及
び該必要特徴と該必要特徴に適合する語義との関係を表
す特徴テーブルと、特徴テーブルを参照し、解析された
文の意味情報及び文法情報の少なくとも一方の情報が十
分特徴及び必要特徴に一致するか否かを判断する判断手
段と、一致した十分特徴に適合する多義語の語義を選択
する選択手段と、を備えることによって実現できる。
【0022】また、第2の発明である機械翻訳方法で
は、多義語を含みかつ該多義語の語義に曖昧さがなく構
成された複数の文から、該多義語の1つの語義にのみ適
合する意味情報及び文法情報の少なくとも一方の情報を
十分特徴とすると共に、該多義語の1語義に関する全て
の文に適合する意味情報及び文法情報の少なくとも一方
の情報を必要特徴としかつ、該多義語の2以上の語義に
適合する意味情報及び文法情報の少なくとも一方の情報
を依存特徴として、該十分特徴と該十分特徴に適合する
語義との関係を求めると共に該必要特徴と該必要特徴に
適合する語義との関係を求めかつ該依存特徴と該依存特
徴に適合する語義との関係を予め求めている。この求め
た関係から、第1言語による文の構造が解析された文の
意味情報及び文法情報の少なくとも一方の情報が十分特
徴及び必要特徴に一致するか否かを判断する。次に、十
分特徴及び必要特徴に少なくとも一方が一致しない場合
に、依存特徴に適合する語義の範囲内に含まれる文に基
づいて類似度を演算し、演算結果に基づいて多義語の語
義を選択する。例えば、類似度が高い語義を選択する。
従って、十分特徴及び必要特徴という弁別的な特徴を翻
訳対象である第1言語による文が有しないときであって
も、多義語解消処理を行うことができる。
【0023】この第2の発明である機械翻訳方法は、第
4の発明である機械翻訳装置のように、多義語を含みか
つ該多義語の語義に曖昧さがなく構成された複数の文か
ら、該多義語の1つの語義にのみ適合する意味情報及び
文法情報の少なくとも一方の情報を十分特徴とすると共
に、該多義語の1語義に関する全ての文に適合する意味
情報及び文法情報の少なくとも一方の情報を必要特徴と
しかつ、該多義語の2以上の語義に適合する意味情報及
び文法情報の少なくとも一方の情報を依存特徴として、
該十分特徴と該十分特徴に適合する語義との関係を求め
ると共に該必要特徴と該必要特徴に適合する語義との関
係を求めかつ該依存特徴と該依存特徴に適合する語義と
の関係を表す特徴テーブルと、特徴テーブルを参照し、
解析された文の意味情報及び文法情報の少なくとも一方
の情報が十分特徴及び必要特徴に一致するか否かを判断
する判断手段と、判断手段によって十分特徴及び必要特
徴に少なくとも一方が一致しないと判断された場合に、
依存特徴に適合する語義の範囲内に含まれる文に基づい
て類似度を演算する演算手段と、演算手段の演算結果に
基づいて多義語の語義を選択する選択手段と、を備える
ことによって実現できる
【0024】
【実施例】以下、図面を参照して、本発明の第1実施例
を説明する。本実施例は翻訳対象となる第1言語に英語
を用い、翻訳されて訳文となる第2言語に日本語を設定
し、英語の原文を日本語の訳文に翻訳する機械翻訳装置
に本発明を適用したものである。
【0025】図1に示したように、本実施例の機械翻訳
装置10は、ユーザ端末装置(キーボード)等の入力装
置12、入力文解析装置14、多義語解消装置20、対
訳処理装置40及び出力装置46から構成されている。
入力装置12には入力文解析装置14が接続され、入力
文解析装置14にユーザ端末装置(キーボード)等の入
力装置12からの原文が入力される。入力文解析装置1
4には、原言語用辞書が記憶された原辞書メモリ16及
び解析用文法が記憶された文法メモリ18が接続されて
いる。
【0026】なお、上記入力文解析装置14に入力され
る原文は文章に限定されず、話言葉を認識する音声認識
装置等が出力する言葉を表す信号であってもよい。
【0027】入力文解析装置14は、多義語解消装置2
0に接続されている。この入力文解析装置14により構
文解析された第1言語の原文が多義語解消装置20に入
力される。
【0028】多義語解消装置20は、語義が曖昧な多義
語について語義を選択するための装置であり、特徴レコ
ード生成部22、特徴照合部24、語義判定部26、出
力部28、特徴テーブル生成部30及び事例ベース検索
照合部32から構成されている。また、多義語解消装置
20は事例ベース34を備えており、事例ベース34は
特徴テーブル生成部30及び事例ベース検索照合部32
に接続されている。詳細は後述するが、この多義語解消
装置20で語義の曖昧さが解消された各語句が対訳処理
装置40に出力される。
【0029】この事例ベース34には、以下の〔原文〕
に示した例のように、語義の曖昧さが解消されている複
数の事例50i(i=1、2、・・・、n,nは全事例
数)が、英語の原文のままの事例50iをレコードとし
たデータベースとして記憶されている。また、文型や品
詞も文型情報として記憶されている。
【0030】 〔原文〕 We took a cup of coffee. ・・・(501 ) The army took the fort. ・・・(502 ) Take her another cup of tea. ・・・(503 ) She took a gift from him. ・・・(504
【0031】この対訳処理装置40には、特定された語
義に適合する訳語を選択するための情報として慣用句等
の用例データや語義としての知識データ等が記憶された
対訳情報メモリ44が対訳辞書42を介して接続されて
いる。対訳辞書42には、第1言語の語句に対する第2
言語の訳語が記憶されている。なお、対訳情報メモリ4
4には、第2言語の生成用文法や生成規則を記憶しても
よい。
【0032】以下、本実施例の作用を説明する。図2に
示したように、オペレータが入力装置12(キーボー
ド)により翻訳対象の文を入力すると、入力装置12が
この文を入力文解析装置14に出力し、入力文解析装置
14において、入力された文の構文解析が成される(ス
テップ100)。構文解析が終了すると、入力文及び解
析結果を入力文解析装置14が多義語解消装置20へ出
力する。多義語解消装置20では、入力された文及び解
析結果に基づいて予め記憶された特徴テーブル(詳細後
述)を参照することにより多義語の語義が1つ選択され
(ステップ200)、語義が一義的に決定された入力文
を対訳処理装置40へ出力する。対訳処理装置40で
は、多義語の曖昧さが解消された入力文の各語句の対訳
を選択することにより訳文を生成する(ステップ30
0)。
【0033】次に、多義語の語義を選択するにあたって
利用する特徴テーブル56k(k=1,2,・・・n,
nは多義語の個数)の生成について説明する。多義語解
消装置20の特徴テーブル生成部30では、オペレータ
の指示により図3に示した特徴テーブル生成処理ルーチ
ンが実行される。なお、このルーチンの実行は、電源投
入時等に処理されるようにしてもよい。本実施例では、
後述する特徴テーブルが特徴テーブル生成部30の図示
しないメモリに、事例ベース34の内容が変更されるま
で記憶することとする。
【0034】図3に示した特徴テーブル生成処理ルーチ
ンの実行と共に、ステップ402へ進み、事例ベース3
4から記録されている事例50iを読み取る。なお、こ
の事例50iの読み取りは、生成される特徴テーブルの
確実性を高くするために、文の意味情報や文情報等の
情報(以下、特徴という)が2度以上重複して出現する
事例を抽出する。また、このステップ402では、読み
取った事例について、以下に示した〔変換A〕のように
上記〔原文〕中の代名詞(例えば、he,she等)を概念語
(例えば、person)に置換する処理も同時に行われる。
【0035】 〔変換A〕 person took a cup of coffee. ・・・(501 ’) The army took the fort. ・・・(502 ’) Take person another cup of tea. ・・・(503 ’) person took a gift from him. ・・・(504 ’)
【0036】次のステップ404では、読み取った事例
の特徴を特徴フィールド52j(j=1,2,・・m,
mは1事例中に含み得る特徴の個数)に対応させて、1
事例の特徴フィールドに格納される複数特徴からなる特
徴レコード54i(1≦i≦n)を生成して記憶する。
【0037】本実施例では、特徴レコードの各特徴フィ
ールドに格納される事例の特徴として、以下の5つを用
いた。
【0038】 1.主語の位置の語句 (subject ) 2.目的語の位置の語句(object) 3.前置詞(preposition ) 4.前置詞に伴う語句(noun with preposition ) 5.文型(pattern ) 従って、本実施例では、特徴レコード54iは、以下に
示した特徴レコード・フォーマットのように事例毎に特
徴フィールド521 、522 、523 、524、525
の順に記憶される。
【0039】
【0040】なお、上記特徴の個数は5つに限定され
ず、4つ以下または6つ以上でもよい。この6つ以上の
特徴の例として、主語の位置の語句(subject )の同義
語または上位概念及び下位概念に適合する語句の集合、
目的語の位置の語句(object)の同義語または上位概念
及び下位概念に適合する語句の集合、第2目的語の位置
の語句、第2目的語の位置の語句の同義語または上位概
念及び下位概念に適合する語句の集合、前置詞(prep)
の同義語または上位概念及び下位概念に適合する語句の
集合、共起語の集合の何れかを更に加えてもよい。
【0041】次のステップ406では、事例ベース34
に記録されている全ての事例501〜50n について特
徴レコード54i の生成が終了したか否かを判断し、全
ての事例501 〜50n について特徴レコード54i の
生成が終了したときに、ステップ408へ進む。ステッ
プ408では、特徴テーブル56k を生成する対象とな
る1つの語句を設定し、ステップ410へ進む。以下、
語句takeの設定から開始される例を説明する。
【0042】ステップ410では、設定された語句take
を含む1特徴レコード54iを読み取り、ステップ41
2へ進む。ステップ412では、読み取った特徴レコー
ド54iの特徴を登録することによって、語句takeに関
する特徴テーブル561 を生成しかつ記憶する。すなわ
ち、1事例中の語句takeの語義は一義的であるため、1
事例の語句takeの語義と上記5つの特徴とが適合する特
徴テーブル561 に各特徴を登録する。従って、特徴の
登録に際しては、同義的な特徴レコードは、同一の語義
の適合する部位に特徴が登録される。例えば、語句take
では、以下の10個の語義S(sense) が挙げられる。
【0043】〔語義S(sense) 〕 1.occupy 2.grasp 3.make picture 4.choose 5.carry 6.carry person 7.use 8.receive 9.pay 10.drink
【0044】ステップ414では、事例ベース34に記
録されている語句takeを含む全ての事例50iについて
の特徴を特徴テーブルに登録したか否かを判断し、全て
の事例501 〜50n の特徴登録が終了すると、ステッ
プ416へ進む。
【0045】語句takeについて、上記のようにして生成
した特徴テーブルの例を以下の表1に示した。
【0046】
【表1】
【0047】次のステップ416では、特徴テーブル5
1 に登録された各特徴を十分特徴62、必要特徴64
及び依存特徴66に分類する。
【0048】十分特徴62とは、特徴テーブル561
登録された各特徴に対して、その特徴が他の語義の全て
に表れることがない特徴をいう。例えば、語句person
は、上記表1に示したように他の語義に現れているため
に十分特徴62にはならないが、語句armyは、他の語義
に現れていないために十分特徴となる。
【0049】また、必要特徴64とは、特徴テーブル5
1 に登録された各特徴に対して、その特徴がその語義
に適合する事例の全てに共通な特徴をいう。例えば、語
句takeの全ての事例について(表1)、文型を参照する
と語句takeが他動詞で用いられているため、他動詞で用
いられる文型は必要特徴64となる。
【0050】また、依存特徴66とは、特徴テーブル5
1 に登録された各特徴に対して、その特徴が他の語義
に同時に現れる特徴をいう。例えば、語句takeの語句pe
rsonは他の語義に現れているので依存特徴66となる。
【0051】上記特徴の分類が終了すると、次のステッ
プ418において、各分類された特徴レコードについて
依存関係及び出現頻度を付与する。すなわち、十分特徴
62及び必要特徴64の何れでもない特徴には、他の事
例との依存関係が付与される。この依存関係は、上記特
徴テーブル561 から求めるものではなく、事例の特徴
レコードから求める。従って、事例として1度しか出現
しない特徴に対しても依存関係が考慮できる。
【0052】上記表1に示した特徴テーブル561
は、十分特徴62である語句に記号*を付し、必要特徴
64については下線を付して分類を示した。また、依存
特徴66については記号を付さないが、依存関係につい
て、上記表1に()付きの添字を付して示した。この表
1において()内の数字は、関係する語義に適合し、
(1−9)は語義の番号1から番号9の間で依存関係を
有することを示し、(all)は全ての語義間で依存関係
を有することを示している。
【0053】なお、記載は省略したが、特徴毎に出現頻
度を表す度数が対応されている。次のステップ420で
は、多義語の有無を判断することにより、特徴テーブル
を生成する対象となる語句の有無を判断する。未だ多義
語が存在するときには、ステップ408へ戻り上記処理
を繰り返すことにより、多義語毎の特徴テーブル56i
を生成する。
【0054】一方、全ての多義語について特徴テーブル
の生成が終了したときには、本ルーチンを終了する。
【0055】このように、原文が記憶された事例ベース
34から、1語句について事例毎の特徴を抽出し語義に
適合する特徴を表す特徴テーブルを生成するので、事例
中の特徴は、1つの語義を他の語義と判別するための特
徴として抽出できる。
【0056】なお、上記説明した特徴テーブルは、予め
作成した特徴テーブルを記憶するようにしてもよい。ま
た、上記特徴テーブルは、語句毎に生成することに限定
されずに、1つの特徴テーブルに複数の多義語に関する
対応が記憶されていればよく、特徴テーブルを分割して
異なる領域に多義語を対応させてもよい。
【0057】次に、ステップ200の詳細を説明する。
ステップ200は、図4に示したように、上記生成され
た特徴テーブルを用いて、多義語解消処理を行い、多義
語の語義を選択するサブルーチンである。すなわち、入
力文から特徴を抽出し、その特徴が1つの語義の十分特
徴62と全ての必要特徴64を満たせば、その語義を多
義語の語義とする。
【0058】なお、説明を簡単にするために、入力され
る文の例として以下に示した入力文1を用い、多義語は
上記特徴テーブル561 を生成した語句takeの多義語の
語義を選択する場合を説明する。
【0059】〔入力文1〕 He took the cab to the station.
【0060】本ルーチンが実行されると、ステップ20
2へ進み、解析終了後に入力された入力文の特徴レコー
ド55が、特徴レコード生成部22において上記特徴テ
ーブル生成時と同様に以下のように生成される。この場
合、特徴レコード生成部22には、入力文解析装置14
における構文解析時に、heが名詞でかつ主語であると
の情報も入力される。
【0061】55 = (person),(cab ),(t
o),(station ),(SVO )
【0062】次のステップ204では、特徴照合部24
において生成された特徴レコード55について、上記特
徴テーブル561 を比較参照することにより、特徴レコ
ード55の特徴と合致する特徴を求める。この生成され
た特徴レコード55の各特徴と上記特徴テーブル561
との関係を以下の表2に示した。
【0063】
【表2】
【0064】上記のようにして求めた特徴テーブル56
1 の特徴と特徴レコード55の特徴と合致する特徴に基
づいて、語義判定部26で多義語の語義を選択する。す
なわち、ステップ206では、生成された特徴レコード
55の特徴に特徴テーブル561 の十分特徴62が有る
か否かを判断する。この場合、上記表2に示したように
十分特徴62が有るため、肯定判断され、ステップ20
8へ進む。
【0065】次のステップ208では、特徴レコード5
5が十分特徴62で選択される語義の必要特徴64を充
足しているか否かを判断する。この場合、上記表2に示
したように必要特徴を充足しているので、ステップ21
0へ進み、残留語義の有無を判断し、残留語義が無のと
きは、十分特徴62を有しかつ必要特徴64が充足され
た語義を選択しステップ218において対訳処理装置4
0へ出力し、本ルーチンを終了する。
【0066】従って、語義判定部26では、語句takeの
語義は特徴テーブル561 の7番目の語義が選択され、
出力部28から対訳処理装置40へ出力する。このよう
に、入力文1は語義について曖昧さが解消されているの
で、対訳処理装置40では、以下の訳文1に示したよう
に、対応する訳文が生成されて出力される。
【0067】〔訳文1〕彼は駅までタクシーを使った。
【0068】ここで、入力文によっては、入力文の有す
る特徴が十分特徴62及び必要特徴64の一方と該当し
ないときがある。この場合の例として以下に示した入力
文2を用いて説明する。
【0069】〔入力文2〕 He took the building.
【0070】この入力文2に対して上記と同様にして、
生成された特徴レコード55の各特徴と上記特徴テーブ
ル561 との関係を以下の表3に示した。
【0071】
【表3】
【0072】上記表3に示したように、入力文2には、
十分特徴62が含まれていないので、他の語義を考慮す
ることなく語句takeの語義を選択することができない。
そこで、入力文の特徴に十分特徴62が含まれないとき
(ステップ206で否定判断)、及び入力文の特徴が十
分特徴62であるが必要特徴64を充足していないとき
(ステップ208で否定判断)の何れか一方のときは、
ステップ212へ進み、依存関係を有する事例間で類似
度を演算する。この入力文2の例では、類似度演算する
事例を特定するために、生成された特徴レコード55の
各特徴と上記特徴テーブル561 との関係が共通する特
徴の種類である、4番目の特徴(object)を選択し、特
徴テーブル561 の1番目の語義及び9番目の語義の各
々の事例の特徴レコードと入力文2の特徴レコード55
との間で類似度演算する。この類似度演算は、例えば、
特徴レコード間の一致度を演算することで求めることが
できる。
【0073】次のステップ214では、演算された類似
度に基づいて、例えば類似度が最も高い特徴を入力文の
多義語の特徴と選択し、ステップ218に進み、この特
徴に適合する語義を対訳処理装置40に出力し、本ルー
チンを終了する。
【0074】従って、例えば、語句takeの語義が特徴テ
ーブル561 の1番目の語義の類似度が高いときには、
1番目の語義(occupy)が選択され、対訳処理装置40
では、以下の訳文2に示したように、対応する訳文が生
成される。
【0075】〔訳文1〕彼は建物を占領した。
【0076】また、入力文によっては、入力文の有する
特徴が十分特徴62及び必要特徴64と該当する語義が
複数あるときがある。この場合にも、語句takeの語義を
選択することができない。そこで、入力文の特徴が十分
特徴でありかつ必要特徴を充足しているが、残留語義が
有るときは(ステップ210で否定判断)、ステップ2
16へ進む。ステップ216では、入力文の特徴とし
て、上記特徴テーブルの語義に対する特徴について最も
多くの特徴が一致する語義を選択する。また、更に、特
徴の頻度を合計し、最も多頻度の特徴を有する語義を選
択するようにしてもよい。次のステップ218では、選
択された語義を対訳処理装置40へ出力し、本ルーチン
を終了する。
【0077】このように、本実施例では、複数の事例か
ら多義語毎に各語義とこの語義に適合する特徴との関係
を示す特徴テーブルを生成している。この特徴テーブル
において、多義語が有する語義毎の特徴として、他の語
義に現れない十分特徴、入力文が充足しなければならな
い必要特徴及び複数の語義に関係する依存特徴とに分類
している。
【0078】従って、入力文中の多義語の語義を選択す
るに際して、特徴テーブルに含まれる十分特徴に適合す
る特徴が該当すれば、事例ベースから演算量が多い類似
度を演算することなく、迅速に多義語の語義を選択する
ことができる。この十分特徴に加え、入力文が充足しな
ければならない必要特徴の一致を演算することによっ
て、さらに確度が高く多義語の語義を選択することがで
きる。
【0079】また、十分特徴及び必要特徴が該当しない
場合であっても、事例ベースから依存関係に基づいて類
似度を演算しているため、特徴テーブルに反映されてい
ない事例をも考慮して多義語の語義を選択することがで
きる。この場合、依存特徴があればそれを参照すること
により関係する語義間における類似度を演算しているた
め、演算量は減少し、多義語の語義を選択するに際して
の処理の迅速化が図れる。
【0080】このように、本実施例では、入力された文
が有する意味情報及び文法情報等の情報を同等な特徴と
して捉えているため、多義語の各語義毎に異なる種類の
情報を用いて多義語の語義の曖昧さを解消することがで
きる。
【0081】上記実施例では、多義語を解消する第1言
語に英語を用いて説明したが、本発明は英語に限定され
ずに他の言語を用いてもよい。この場合、第1言語に他
の言語を用いた場合にも、上記実施例と同様にして特徴
テーブルを生成し得る。
【0082】次に、他の第1言語としてフランス語を用
いて、フランス語の語義の曖昧さを解消する第2実施例
を説明する。なお、本実施例の構成は、上記第1実施例
と同様のため、同一部分の詳細な説明は省略し、以下異
なる部分を説明する。
【0083】先ず、フランス語における多義語の語義を
解消するにあたって利用する特徴テーブル56FL (L
=1,2,・・・n,nは多義語の個数)は、上記と同
様に特徴テーブル生成部30で生成される。すなわち、
図3に示した特徴テーブル生成処理ルーチンが実行さ
れ、事例ベース34から事例50iを読み取り、読み取
った事例について上記と同様に5つの特徴を特徴フィー
ルド52j(1≦j≦5)に対応させて、1事例の特徴
フィールドに格納される複数特徴からなる特徴レコード
54i(1≦i≦n)を生成して記憶する(ステップ4
02、404)。この特徴レコード54i を、事例ベー
ス34に記録されている全ての事例501〜50n につ
いて生成した後に、特徴テーブル56FLを生成する対
象となる1つの語句を設定する(ステップ406、40
8)。以下、語句prendre の設定を例に説明する。
【0084】この設定された語句prendre を含む1特徴
レコード54iを読み取り、読み取った特徴レコード5
4iの特徴を登録することによって、語句prendreに関
する語義で分割された特徴テーブル56F1 を生成しか
つ記憶する(ステップ410、412)。この語句pren
dreでは、以下の10個の語義S(sens)が挙げられる。
【0085】〔語義S(sens)〕 1.occuper 2.saiser 3.photographie 4.chosir 5.emmener 6.monter 7.recevir 8.payer 9.manger 10.succes
【0086】次に、事例ベース34に記録されている語
句prendreを含む全ての事例50iについての特徴を特
徴テーブルに登録した後に、登録された各特徴を上記で
説明した十分特徴62、必要特徴64及び依存特徴66
に分類して、各分類された特徴レコードについて依存関
係及び出現頻度を付与する(ステップ414〜41
8)。なお、以下のステップは、上記実施例と同様にた
め、説明を省略する。
【0087】このように、フランス語の原文が記憶され
た事例ベース34から、1語句について事例毎の特徴を
抽出し語義に適合する特徴を表す特徴テーブルを生成す
るので、事例中の特徴は、1つの語義を他の語義と判別
するための特徴として抽出される。
【0088】語句prendreについて、上記のようにして
生成した特徴テーブルの例を以下の表4に示した。
【0089】
【表4】
【0090】以上のように生成された特徴テーブルを用
いて、上記実施例と同様にして図4に示したフローチャ
ートに従いフランス語の語句の多義語解消処理を行うこ
とができる。
【0091】次に、第1言語の上記の他例として日本語
を用いて、日本語の語義の曖昧さを解消する第3実施例
を説明する。本実施例の構成は、上記実施例と略同様の
ため、同一部分の詳細な説明は省略し、以下異なる部分
を説明する。
【0092】日本語における多義語の語義を解消するに
あたって利用する特徴テーブル56JM (M=1,2,
・・・n,nは多義語の個数)は、上記実施例と同様の
多義語解消装置20の特徴テーブル生成部30で生成さ
れる。この特徴テーブル56JM について、語句「と
る」の例では、以下の10個の〔語義/特徴〕が挙げら
れる。
【0093】〔語義/特徴〕 1.占領する 2.掴む 3.撮影する 4.選ぶ 5.採用する 6.乗る 7.受け取る 8.金を払う 9.飲食する 10.招く
【0094】この語句「とる」について、生成した特徴
テーブル56J1 の例を以下の表5に示した。
【0095】
【表5】
【0096】以上のように生成された特徴テーブルを用
いて、上記実施例と同様にして図4に示したフローチャ
ートに従い日本語の語句の多義語解消処理を行うことが
できる。
【0097】
【発明の効果】以上説明したように本発明の機械翻訳方
法によれば、第1言語の原文である複数の文が有する意
味情報や文型情報による情報を用いて、多義語の1語義
にのみある十分特徴と翻訳対象となる原文の情報とによ
り語義を選択できるため、迅速に多義語の語義の曖昧さ
を解消して語義を選択することができる、という効果が
ある。
【0098】また、解析された文が十分特徴に一致する
情報を有するときに、更に十分特徴に関する全ての文に
適合する情報の必要特徴を有する語義を選択するため、
より高精度で多義語の語義の曖昧さを解消して語義を選
択することができる、という効果がある。
【0099】また、十分特徴及び必要特徴が該当しない
場合であっても、例えば、事例である第1言語の文を用
いて、類似度を演算して多義語の語義を選択することが
できるため、多義語が有する語義に合致した語義の選択
処理を行うことができる、という効果がある。
【0100】本発明の機械翻訳装置では、第1言語の原
文である複数の文が有する意味情報や文型情報による情
報を用いて、情報と該情報に適合する語義との関係を表
す特徴テーブルを備えているため、全ての文、例えば事
例について類似度を演算することなく、非常に少ない規
則で多義語の語義の曖昧さを解消することができる、と
いう効果がある。
【図面の簡単な説明】
【図1】本実施例の機械翻訳装置の概略構成を示すブロ
ック図である。
【図2】本実施例の機械翻訳装置のメインルーチンを示
すフローチャートである。
【図3】特徴テーブル生成ルーチンの流れを示すフロー
チャートである。
【図4】多義語解消処理ルーチンの流れを示すフローチ
ャートである。
【符号の説明】
10 機械翻訳装置 20 多義語解消装置 30 特徴テーブル生成部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 17/27 - 17/28

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 1つの語句に対して複数の語義を有する
    多義語を含む翻訳対象となる第1言語による文の構造を
    解析して意味情報及び文法情報を求め、該意味情報及び
    文法情報に基づいて第2言語による文に変換する機械翻
    訳装置において、 前記多義語を含みかつ該多義語の語義に曖昧さがなく構
    成された複数の文から前記多義語の1つの語義にのみ適
    合する意味情報及び文法情報の少なくとも1つの情報を
    十分特徴とすると共に、該多義語の1語義に関する全て
    の文に適合する意味情報及び文法情報の少なくとも1つ
    の情報を必要特徴として、該十分特徴と該十分特徴に適
    合する語義との関係及び該必要特徴と該必要特徴に適合
    する語義との関係を表す特徴テーブルと、 前記特徴テーブルを参照し、前記解析された文の意味情
    報及び文法情報の少なくとも1つの情報が前記十分特徴
    及び必要特徴に一致するか否かを判断する判断手段と、 前記判断手段によって前記解析された文の意味情報及び
    文法情報の少なくとも1つの情報が前記十分特徴及び必
    要特徴に一致すると判断した場合、当該一致する十分特
    徴に適合する前記語義を、前記多義語の語義として選択
    する選択手段とを有し、前記選択された語義に基づいて
    前記第2言語による文を生成することを特徴とする機械
    翻訳装置。
  2. 【請求項2】 1つの語句に対して複数の語義を有する
    多義語を含む翻訳対象となる第1言語による文の構造を
    解析して意味情報及び文法情報を求め、該意味情報及び
    文法情報に基づいて第2言語による文に変換する機械翻
    訳装置において、 前記多義語を含みかつ該多義語の語義に曖昧さがなく構
    成された複数の文から、該多義語の1つの語義にのみ適
    合する意味情報及び文法情報の少なくとも1つの情報を
    十分特徴とすると共に、該多義語の1語義に関する全て
    の文に適合する意味情報及び文法情報の少なくとも1つ
    の情報を必要特徴としかつ、該多義語の2以上の語義に
    適合する意味情報及び文法情報の少なくとも1つの情報
    を依存特徴として、該十分特徴と該十分特徴に適合する
    語義との関係を求めると共に該必要特徴と該必要特徴に
    適合する語義との関係を求めかつ該依存特徴と該依存特
    徴に適合する語義との関係を表す特徴テーブルと、 前記特徴テーブルを参照し、前記解析された文の意味情
    報及び文法情報の少なくとも1つの情報が前記十分特徴
    及び必要特徴に一致するか否かを判断する判断手段と、 前記判断手段によって前記十分特徴及び必要特徴少な
    くとも1つが一致しないと判断された場合、前記特徴テ
    ーブルにおける複数の文から、前記解析された文の意味
    情報及び文法情報の少なくとも1つの情報と前記依存特
    徴が適合する前記語義を有する前記文を選択し、前記選
    択された文と前記解析された文との類似度を演算すると
    共に、当該演算結果に基づいてさらに選択されたいずれ
    かの前記文に関する語義を前記多義語の語義とする選択
    手段とを有し、前記選択された語義に基づいて前記第2
    言語による文を生成することを特徴とする機械翻訳装
    置。
JP5102973A 1993-04-28 1993-04-28 機械翻訳装置 Expired - Fee Related JP2821840B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP5102973A JP2821840B2 (ja) 1993-04-28 1993-04-28 機械翻訳装置
US08/203,084 US5844798A (en) 1993-04-28 1994-02-28 Method and apparatus for machine translation
DE69429301T DE69429301T2 (de) 1993-04-28 1994-04-12 Sprachverarbeitungssystem
EP94302567A EP0622742B1 (en) 1993-04-28 1994-04-12 Language processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5102973A JP2821840B2 (ja) 1993-04-28 1993-04-28 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH06314294A JPH06314294A (ja) 1994-11-08
JP2821840B2 true JP2821840B2 (ja) 1998-11-05

Family

ID=14341700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5102973A Expired - Fee Related JP2821840B2 (ja) 1993-04-28 1993-04-28 機械翻訳装置

Country Status (4)

Country Link
US (1) US5844798A (ja)
EP (1) EP0622742B1 (ja)
JP (1) JP2821840B2 (ja)
DE (1) DE69429301T2 (ja)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
US6233545B1 (en) * 1997-05-01 2001-05-15 William E. Datig Universal machine translator of arbitrary languages utilizing epistemic moments
US6233546B1 (en) * 1998-11-19 2001-05-15 William E. Datig Method and system for machine translation using epistemic moments and stored dictionary entries
JPH113338A (ja) * 1997-06-11 1999-01-06 Toshiba Corp 多言語入力システム、多言語入力方法及び多言語入力プログラムを記録した記録媒体
US6078878A (en) * 1997-07-31 2000-06-20 Microsoft Corporation Bootstrapping sense characterizations of occurrences of polysemous words
WO1999052041A1 (fr) * 1998-04-06 1999-10-14 Sha Liu Procede de traduction de langage a gabarit holographique et d'ouverture presentant une fonction d'interaction homme-machine et systeme de marquage holographique
US6167370A (en) * 1998-09-09 2000-12-26 Invention Machine Corporation Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
US6460015B1 (en) 1998-12-15 2002-10-01 International Business Machines Corporation Method, system and computer program product for automatic character transliteration in a text string object
US6496844B1 (en) 1998-12-15 2002-12-17 International Business Machines Corporation Method, system and computer program product for providing a user interface with alternative display language choices
US6389386B1 (en) 1998-12-15 2002-05-14 International Business Machines Corporation Method, system and computer program product for sorting text strings
US7099876B1 (en) * 1998-12-15 2006-08-29 International Business Machines Corporation Method, system and computer program product for storing transliteration and/or phonetic spelling information in a text string class
EP1266313A2 (en) 1999-03-19 2002-12-18 Trados GmbH Workflow management system
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7120574B2 (en) * 2000-04-03 2006-10-10 Invention Machine Corporation Synonym extension of search queries with validation
US7962326B2 (en) * 2000-04-20 2011-06-14 Invention Machine Corporation Semantic answering system and method
US6728707B1 (en) 2000-08-11 2004-04-27 Attensity Corporation Relational text index creation and searching
US6732097B1 (en) 2000-08-11 2004-05-04 Attensity Corporation Relational text index creation and searching
US6732098B1 (en) 2000-08-11 2004-05-04 Attensity Corporation Relational text index creation and searching
US7171349B1 (en) 2000-08-11 2007-01-30 Attensity Corporation Relational text index creation and searching
US6738765B1 (en) 2000-08-11 2004-05-18 Attensity Corporation Relational text index creation and searching
US6741988B1 (en) 2000-08-11 2004-05-25 Attensity Corporation Relational text index creation and searching
KR20020036059A (ko) * 2000-11-07 2002-05-16 옥철영 사전 뜻풀이말에서 추출된 의미정보를 기반으로하는 의미중의성 해결 방법
US9009590B2 (en) * 2001-07-31 2015-04-14 Invention Machines Corporation Semantic processor for recognition of cause-effect relations in natural language documents
US20030236658A1 (en) * 2002-06-24 2003-12-25 Lloyd Yam System, method and computer program product for translating information
JP4355138B2 (ja) * 2002-12-13 2009-10-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 翻訳サーバ、コラボレーションサーバ及びプログラム
US20040193557A1 (en) * 2003-03-25 2004-09-30 Olsen Jesse Dale Systems and methods for reducing ambiguity of communications
WO2004107203A1 (ja) * 2003-05-30 2004-12-09 Fujitsu Limited 対訳文対応付け装置
US7366666B2 (en) * 2003-10-01 2008-04-29 International Business Machines Corporation Relative delta computations for determining the meaning of language inputs
US7813916B2 (en) 2003-11-18 2010-10-12 University Of Utah Acquisition and application of contextual role knowledge for coreference resolution
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
WO2006076034A2 (en) * 2004-05-21 2006-07-20 Bhanu, Kalra Stabilized two component system for chemilumiescent assay in immunodiagnostics
GB2417103A (en) * 2004-08-11 2006-02-15 Sdl Plc Natural language translation system
US20070073678A1 (en) * 2005-09-23 2007-03-29 Applied Linguistics, Llc Semantic document profiling
US7765098B2 (en) * 2005-04-26 2010-07-27 Content Analyst Company, Llc Machine translation using vector space representations
US20070073745A1 (en) * 2005-09-23 2007-03-29 Applied Linguistics, Llc Similarity metric for semantic profiling
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8112402B2 (en) * 2007-02-26 2012-02-07 Microsoft Corporation Automatic disambiguation based on a reference resource
JPWO2008108061A1 (ja) * 2007-03-01 2010-06-10 日本電気株式会社 言語処理システム、言語処理方法、言語処理プログラムおよび記録媒体
US8738353B2 (en) * 2007-09-05 2014-05-27 Modibo Soumare Relational database method and systems for alphabet based language representation
US20090083026A1 (en) * 2007-09-24 2009-03-26 Microsoft Corporation Summarizing document with marked points
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
GB2468278A (en) 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
EP2406731A4 (en) * 2009-03-13 2012-08-22 Invention Machine Corp SYSTEM AND METHOD FOR THE AUTOMATIC SEMANTIC MARKING OF NATURAL LANGUAGE TEXTS
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
CN107273355B (zh) * 2017-06-12 2020-07-14 大连理工大学 一种基于字词联合训练的中文词向量生成方法
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
EP3825896A4 (en) * 2018-07-19 2021-08-04 Fujitsu Limited LEARNING PROCEDURES, TRANSLATION PROCEDURES, LEARNING PROGRAM, TRANSLATION PROGRAM AND INFORMATION PROCESSING DEVICE
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
CN110991196B (zh) * 2019-12-18 2021-10-26 北京百度网讯科技有限公司 多义词的翻译方法、装置、电子设备及介质

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6140672A (ja) * 1984-07-31 1986-02-26 Hitachi Ltd 多品詞解消処理方式
JPS61187077A (ja) * 1985-02-14 1986-08-20 Ricoh Co Ltd 日本語解析装置
JPH083815B2 (ja) * 1985-10-25 1996-01-17 株式会社日立製作所 自然言語の共起関係辞書保守方法
JPS62219165A (ja) * 1986-03-20 1987-09-26 Fujitsu Ltd 機械翻訳における訳語選択処理方式
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
US4916614A (en) * 1986-11-25 1990-04-10 Hitachi, Ltd. Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words
JPS63305463A (ja) * 1987-06-05 1988-12-13 Hitachi Ltd 自然言語処理方式
US4868750A (en) * 1987-10-07 1989-09-19 Houghton Mifflin Company Collocational grammar system
JPH01314373A (ja) * 1988-06-15 1989-12-19 Hitachi Ltd 機械翻訳システムにおける訳語選択方式
JPH0798416B2 (ja) * 1988-07-28 1995-10-25 株式会社東芝 プリンタ装置
JPH0242572A (ja) * 1988-08-03 1990-02-13 Hitachi Ltd 共起関係辞書生成保守方法
JPH02165378A (ja) * 1988-12-20 1990-06-26 Csk Corp 機械翻訳システム
JPH02254564A (ja) * 1989-03-29 1990-10-15 Ricoh Co Ltd 翻訳用辞書編集装置
JPH02308370A (ja) * 1989-05-24 1990-12-21 Toshiba Corp 機械翻訳システム
US5056021A (en) * 1989-06-08 1991-10-08 Carolyn Ausborn Method and apparatus for abstracting concepts from natural language
EP0409425A3 (en) * 1989-07-15 1993-04-28 Keechung Kim Method and apparatus for translating language
US5289375A (en) * 1990-01-22 1994-02-22 Sharp Kabushiki Kaisha Translation machine
JPH03282677A (ja) * 1990-03-29 1991-12-12 Nec Corp 記号と概念の対応関係の設定方法
JPH03296860A (ja) * 1990-04-16 1991-12-27 Ricoh Co Ltd 自然言語文解析装置
JP3266246B2 (ja) * 1990-06-15 2002-03-18 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
JP2815714B2 (ja) * 1991-01-11 1998-10-27 シャープ株式会社 翻訳装置
JPH05298355A (ja) * 1992-04-20 1993-11-12 Ricoh Co Ltd 自然言語文解析装置

Also Published As

Publication number Publication date
JPH06314294A (ja) 1994-11-08
EP0622742B1 (en) 2001-12-05
US5844798A (en) 1998-12-01
DE69429301D1 (de) 2002-01-17
EP0622742A1 (en) 1994-11-02
DE69429301T2 (de) 2002-08-22

Similar Documents

Publication Publication Date Title
JP2821840B2 (ja) 機械翻訳装置
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
Ge et al. A statistical semantic parser that integrates syntax and semantics
US6182027B1 (en) Translation method and system
US5895446A (en) Pattern-based translation method and system
US8185372B2 (en) Apparatus, method and computer program product for translating speech input using example
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
WO2003056450A1 (fr) Procede et appareil d'analyse syntaxique
WO2005059771A1 (ja) 対訳判断装置、方法及びプログラム
GB2234614A (en) Machine translation apparatus
EP0398513B1 (en) Method and apparatus for translating a sentence including a compound word formed by hyphenation
EP0357344B1 (en) Computer assisted language translating machine
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
KR100617319B1 (ko) 영한 자동번역을 위하여 동사구 패턴 및 의미 벡터를 사용하는 동사/명사 대역어 선택 장치 및 그 방법
JPH0855123A (ja) イディオム登録機能を有する機械翻訳装置
JP2005202924A (ja) 対訳判断装置、方法及びプログラム
JP3326646B2 (ja) 機械翻訳システム用辞書・ルール学習装置
Bourbakis et al. An SPN based methodology for document understanding
JP3682915B2 (ja) 自然文マッチング装置、自然文マッチング方法、及び自然文マッチングプログラム
JP3353647B2 (ja) 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体
JP3388393B2 (ja) データベースを利用したテンス、アスペクトあるいはモダリティに関する翻訳装置
JP3244286B2 (ja) 翻訳処理装置
JP2608384B2 (ja) 機械翻訳装置及びその方法
JP2749954B2 (ja) 自然言語解析装置
JP2752025B2 (ja) 機械翻訳装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees