JPH01314373A - 機械翻訳システムにおける訳語選択方式 - Google Patents

機械翻訳システムにおける訳語選択方式

Info

Publication number
JPH01314373A
JPH01314373A JP63145713A JP14571388A JPH01314373A JP H01314373 A JPH01314373 A JP H01314373A JP 63145713 A JP63145713 A JP 63145713A JP 14571388 A JP14571388 A JP 14571388A JP H01314373 A JPH01314373 A JP H01314373A
Authority
JP
Japan
Prior art keywords
word
translated word
words
occurrence
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63145713A
Other languages
English (en)
Inventor
Hiroyuki Nakajima
弘之 中島
Hiroyuki Kaji
梶 博行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63145713A priority Critical patent/JPH01314373A/ja
Priority to GB8913635A priority patent/GB2220285A/en
Priority to US07/366,668 priority patent/US5227971A/en
Publication of JPH01314373A publication Critical patent/JPH01314373A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野] 本発明は1機械翻訳システムにおいて、出力文生成にお
ける語の選択方式に関する。
〔従来の技術〕
機械翻訳システムにおける訳語の選択方式としては、語
と語の共起関係を利用する方法が有効である。しかし、
この方法には、膨大な量の共起関係知識をどのように表
現し、MMするがという問題がある。このため、たとえ
ば、特願昭61−280033では、語のもつ概念の上
位・下位関係を表わしたシソーラスを用いて、語と概念
の関係として共起関係を表現する方式をとり、上記の問
題の解決を図っている。
〔発明が解決しようとする課題〕
しかしながら、かかる従来の方法では、1つの語と共起
する複数の語を下位概念とする上位概念のJl(をうま
く選ぶ必要があるなど、シソーラスの構築自体が困難で
あるという問題がある。
本発明の目的は、複雑なシソーラスを構築することなく
、実データから得た共起関係知識を、少数の一般的な意
味素性のみで表現し、この共起関係知識を利用して、訳
語選択を行なう訳語選択方式を提供することにある6 〔課題を解決するための手段〕 上記目的を達成するために1本発明は、「6の持つ意味
素性を表わすベクトルと訳語と共起関係にある語の持つ
意味素性のベクトルとをMWするレコードを、翻訳用辞
書に設けることに特徴がある。
〔作用〕
本発明では1語のもつ意味素性を表わすベクトルと、訳
語と共起関係にある語の持つ意味素性を表わすベクトル
とを蓄積した翻訳用辞書のレコードから、入力語の訳語
候補と共起関係にある語の持つ意味素性を表わすベクト
ルと、入力文中で入力語と共起している語の持つ意味素
性を表わすベクトルとを読みだし、この2つのベクトル
の一致度を計算することにより、その−数取に基づいて
、入力語の訳語を選択できる。
〔実施例〕
以下1本発明の一実施例である日契機械翻訳システムに
ついて説明する。
第2図は、実施例のハードウェア構成図で、処理袋h’
!1、入力装置2、出方装置3、語い辞書記憶′JAI
R4,共起関係辞書記憶装置5がら成る。
Mい#得記憶装置4内の語い#書は、第3図に示すよう
なレコードで構成される。レコードは。
日本語見出し419品詞42.訳語43.意味素性ベク
トル44.格フレーム45がら成る。格フレームは、品
詞が動詞の場合に、その各訳語に対して定義され、動詞
の取る格(深層格)とそれに対応する日本語の助詞と英
語の構文的役割を表わしている。レコードは日本語見出
し41をキーとして検索できる。意味素性ベクトルは3
次元であり、第1.第2.第3次元は、それぞれ、意味
素性[制限]、[!志有]、[平面]を表わす。品詞が
名詞の場合、第1.第2.第3成分の値は。
それぞれ、第1.第2.第3次元の意味素性をその名詞
自体が持てば+1.持たなければ、−1である0品詞が
動詞の場合、意味素性ベクトルは。
動詞の持つ各訳語に対してg、#!Iされ、第1.第2
゜第3成分の値は、その訳語と共起する格要素が、それ
ぞれ、第1.第2.第3次元の意味素性を一般に持てば
、+1.持たなければ、−1であり、一般には持つとも
、持たないとも、i゛えない場合は、0である。すなわ
ち、!!lJ詞の意味素性ベクトルは、各訳語と共起す
る概要前の集合を表わしており、動詞に関する共起関係
を簡潔に表現している。
共起関係辞書記憶装置内の共起関係辞書は、第4図に示
すようなレコードで構成される。レコードは、日本語動
詞51、日本語名詞52、英語動詞53.英語名詞54
から成る。レコードは日本語動詞51と日本語名詞52
の連接をキーとして検索できる。
共起関係辞書は、動詞の意味素性ベクトルとしては表現
できない共起関係を、動詞と名詞の対として登録してい
る。
次に処理装置1で実行される翻訳処理について。
第5図によって説明する。まず、入力装置2から日本文
を読み込み(ステップ11)、語い辞書を参照して動詞
の格フレーム45とのパターンマツチングにより、語と
語の意味的関係の集合としての中間表現を得る(ステッ
プ12)。次に、語い辞書および共起関係辞書を参照し
、共起関係辞書のデータおよび動詞と格要素の意味素性
ベクトルの一致度に基づいて、訳語を選択する(ステッ
プ13)。訳語選択ステップの詳細は後述する。次に語
い辞書を参照し、動詞の訳語の格フレームに基づいて格
要素の構文的役割を決定して、英文を生成する(ステッ
プ14)、最後に、得られた英文を出力装置3に出力す
る(ステップ15)。
次に、第3図の語い辞書と第4図の共起関係辞書を用い
た場合の訳語選択処理のステップを第1図に従って説明
する。
入力文を「紙を破る」とする。まず、語い辞書を検索し
、動詞「破る」 (記号Pで表わす)および名調「紙」
 (記号Aで表すす)を見出しとするレコードの内容を
それぞれ読み出す(ステップ131)。
次に動詞Pと名詞Aの連接をキーとして、共起関係辞書
記憶装置内の共起関係辞書を検索する(ステップ132
)、動詞Pと名詞Aの連接をキーとするレコードがあれ
ば、該レコードの英語動詞部に登録された英語動詞pを
動詞Pの訳語として選択する(ステップ133)。
動詞Pと名詞Aの連接をキーとするレコードがなければ
、ステップ131で読み込んだ語覧1辞書内のデータに
基づき、動詞Pの訳語候補p1.・・・。
pnの意味素性ベクトルSL、・・・、Snと名詞Aの
意味素性ベクトルCの内積値N1=Si−C(i=1.
・・・+n)を計算する。この内容積Nl。
・・・、Nnはそれぞれ、意味素性ベクトルSL、・・
・。
SnとCとの一致度を表わしている。第4図の共起関係
辞書には、「破る」と「紙」の連接をキーとするレコー
ドがないので1語い辞書内のデータに基づき、「破る」
の訳語候補’tear’ (記号pi)、’dsfsa
t’ (記号p2)、’break’ (記号p3)の
意味素性ベクトルSL、S2,83と1紙」の意味素性
ベクトルCとの内積値、N1=S1・C1N2=S2・
C,N5=S3・Cを、それぞれ計算する(ステップ1
34)、最後に、内積値Nl。
・・・、Nnの最大値を与えるiを求め(ステップ13
5)、記号piを動詞Pの訳語として選択する(ステッ
プ136)、第3図の語い辞書では、SL= (0,−
1,1)、52=(1,1,−1)。
S3= (1,−1,−1)であり、C=(−1゜−4
,1)であるから、Nl、N2.N3の値は、それぞれ
、2.−3.−1となり、Pの訳語としてp 1 = 
’tear’が選択される。
また、入力文が「窓ガラスを破る」の場合は、「破る」
と「窓ガラス」の連接をキーとするレコードが共起関係
辞書に存在するので、このレコードに登録された英語動
詞’break’を「破る」の訳語として選択する。
以上、本発明の一実施例を示した。
上記実施例によれば、動詞に関する共起関係を意味素性
のベクトルの形で蓄積しておくことにより、単語と単語
の組をすべて共起関係辞書に登録する場合に比べて、辞
書に記述するデータ量を大幅に削減できる。また1つの
動詞の訳語と共起する語の集合を意味素性のベクトル、
すなわち意味素性の組み合わせで表現できるので、設定
すべき 4意味素性は少数の一般的なものだけでよいこ
とになる。
上記実施例では、簡単のため、動詞の意味素性ベクトル
を1つの格に関して定義している。しかし、動詞は一般
に複数の格を持つ、それぞれに共起制約がある。そこで
、動詞の意味素性ベクトルを格別に定義し、それぞれの
格について、ベクトルの一致度を計算し、その総和に基
づいて訳語を選択するという方法が考えられる。
〔発明の効果〕
本発明によれば、機械翻訳システムにおいて、語と語の
共起関係を意味素性のベクトルによって表現することが
できるので、少数の一般的な意味素性のみを用いて共起
関係を表現し、訳語選択を行なうことができる。また、
単語と意味素性の関係として表わした共起関係と、単語
と単語の共起関係とを併用して訳語選択を行なうことに
より。
蓄積すべき共起関係データを少なくすることができる。
【図面の簡単な説明】
第1図は、共起関係に基づく訳語選択ステップのフロー
チャート、第2図は日英機械翻訳システムのハードウェ
ア構成図、第3図は語い辞書のレコード内容の例を示す
図、第4図は共起関係辞書のレコード内容の例を示す図
、第5図は日英機械翻訳システムの処理の概略を示すフ
ローチャートである。

Claims (1)

  1. 【特許請求の範囲】 1、語の持つ意味素性を表わしたベクトルと、訳語と共
    起関係にある語の持つ意味素性を表わしたベクトルとを
    蓄積するレコードを、翻訳用辞書に設け、上記2つのベ
    クトルの一致度を計算するステップと、この一致度に基
    づいて訳語を選択するステップを設けたことを特徴とす
    る、機械翻訳システムにおける訳語選択方式。 2、請求項第1項の訳語選択方式において、動詞と格要
    素との共起関係に基づいて、動詞の訳語を選択すること
    を特徴とする、機械翻訳システムにおける訳語選択方式
    。 3、単語と単語の対として表現した共起関係を蓄積した
    第1の記憶装置と、単語と意味素性の共起関係を蓄積し
    た第2の記憶装置を有し、上記第1の記憶装置を参照し
    て訳語を選択するステップと、上記第2の記憶装置を参
    照して訳語を選択するステップを設けたことを特徴とす
    る、機械翻訳システムにおける訳語選択方式。
JP63145713A 1988-06-15 1988-06-15 機械翻訳システムにおける訳語選択方式 Pending JPH01314373A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP63145713A JPH01314373A (ja) 1988-06-15 1988-06-15 機械翻訳システムにおける訳語選択方式
GB8913635A GB2220285A (en) 1988-06-15 1989-06-14 Selecting a target language equivalent of a predicate word in a source language word string, in a machine translation system
US07/366,668 US5227971A (en) 1988-06-15 1989-06-14 Apparatus for and method of selecting a target language equivalent of a predicate word in a source language word string in a machine translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63145713A JPH01314373A (ja) 1988-06-15 1988-06-15 機械翻訳システムにおける訳語選択方式

Publications (1)

Publication Number Publication Date
JPH01314373A true JPH01314373A (ja) 1989-12-19

Family

ID=15391404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63145713A Pending JPH01314373A (ja) 1988-06-15 1988-06-15 機械翻訳システムにおける訳語選択方式

Country Status (3)

Country Link
US (1) US5227971A (ja)
JP (1) JPH01314373A (ja)
GB (1) GB2220285A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013046590A1 (ja) * 2011-09-26 2013-04-04 日本電気株式会社 情報処理装置、情報処理方法、及びプログラム

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05151260A (ja) * 1991-11-29 1993-06-18 Hitachi Ltd 翻訳テンプレート学習方法および翻訳テンプレート学習システム
JP2640793B2 (ja) * 1992-01-17 1997-08-13 松下電器産業株式会社 共起辞書構築装置及びこの共起辞書を用いた文解析装置
JPH0689302A (ja) * 1992-09-08 1994-03-29 Hitachi Ltd 辞書メモリ
US5515534A (en) * 1992-09-29 1996-05-07 At&T Corp. Method of translating free-format data records into a normalized format based on weighted attribute variants
JP2821840B2 (ja) * 1993-04-28 1998-11-05 日本アイ・ビー・エム株式会社 機械翻訳装置
US5724594A (en) * 1994-02-10 1998-03-03 Microsoft Corporation Method and system for automatically identifying morphological information from a machine-readable dictionary
JP3272288B2 (ja) * 1997-12-24 2002-04-08 日本アイ・ビー・エム株式会社 機械翻訳装置および機械翻訳方法
US7483828B2 (en) * 2001-03-16 2009-01-27 Meaningful Machines, L.L.C. Multilingual database creation system and method
JP2003288362A (ja) * 2002-03-27 2003-10-10 Seiko Epson Corp 特定要素ベクトル生成装置、文字列ベクトル生成装置、類似度算出装置、特定要素ベクトル生成プログラム、文字列ベクトル生成プログラム及び類似度算出プログラム、並びに特定要素ベクトル生成方法、文字列ベクトル生成方法及び類似度算出方法
US7587307B2 (en) * 2003-12-18 2009-09-08 Xerox Corporation Method and apparatus for evaluating machine translation quality
US9779079B2 (en) * 2007-06-01 2017-10-03 Xerox Corporation Authoring system
JP5319655B2 (ja) * 2008-02-29 2013-10-16 シャープ株式会社 情報処理装置、情報処理方法、プログラム、およびプログラムを記録したコンピュータ読取り可能な記録媒体
CN102012900B (zh) * 2009-09-04 2013-01-30 阿里巴巴集团控股有限公司 信息检索方法和系统
US9110883B2 (en) * 2011-04-01 2015-08-18 Rima Ghannam System for natural language understanding
US9824083B2 (en) * 2015-07-07 2017-11-21 Rima Ghannam System for natural language understanding
US9928236B2 (en) * 2015-09-18 2018-03-27 Mcafee, Llc Systems and methods for multi-path language translation
KR102565274B1 (ko) * 2016-07-07 2023-08-09 삼성전자주식회사 자동 통역 방법 및 장치, 및 기계 번역 방법 및 장치
US10083451B2 (en) 2016-07-08 2018-09-25 Asapp, Inc. Using semantic processing for customer support
US10453074B2 (en) 2016-07-08 2019-10-22 Asapp, Inc. Automatically suggesting resources for responding to a request
US10109275B2 (en) * 2016-12-19 2018-10-23 Asapp, Inc. Word hash language model
US10650311B2 (en) 2016-12-19 2020-05-12 Asaap, Inc. Suggesting resources using context hashing
US10497004B2 (en) 2017-12-08 2019-12-03 Asapp, Inc. Automating communications using an intent classifier
US10489792B2 (en) 2018-01-05 2019-11-26 Asapp, Inc. Maintaining quality of customer support messages
US10210244B1 (en) 2018-02-12 2019-02-19 Asapp, Inc. Updating natural language interfaces by processing usage data
US10169315B1 (en) 2018-04-27 2019-01-01 Asapp, Inc. Removing personal information from text using a neural network
AU2018433736B2 (en) * 2018-07-23 2022-05-12 Fujitsu Limited Generating method, generating program, and information processing apparatus
US11216510B2 (en) 2018-08-03 2022-01-04 Asapp, Inc. Processing an incomplete message with a neural network to generate suggested messages
US10747957B2 (en) 2018-11-13 2020-08-18 Asapp, Inc. Processing communications using a prototype classifier
US11551004B2 (en) 2018-11-13 2023-01-10 Asapp, Inc. Intent discovery with a prototype classifier
US11425064B2 (en) 2019-10-25 2022-08-23 Asapp, Inc. Customized message suggestion with user embedding vectors
CN111753553B (zh) * 2020-07-06 2022-07-05 北京世纪好未来教育科技有限公司 语句类型识别方法、装置、电子设备和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4635199A (en) * 1983-04-28 1987-01-06 Nec Corporation Pivot-type machine translating system comprising a pragmatic table for checking semantic structures, a pivot representation, and a result of translation
JPS61105671A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 自然言語処理装置
JPH0664585B2 (ja) * 1984-12-25 1994-08-22 株式会社東芝 翻訳編集装置
JPH0782498B2 (ja) * 1985-01-14 1995-09-06 株式会社日立製作所 機械翻訳システム
US4916614A (en) * 1986-11-25 1990-04-10 Hitachi, Ltd. Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words
JP2546245B2 (ja) * 1986-11-25 1996-10-23 株式会社日立製作所 自然言語文生成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013046590A1 (ja) * 2011-09-26 2013-04-04 日本電気株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
GB8913635D0 (en) 1989-08-02
US5227971A (en) 1993-07-13
GB2220285A (en) 1990-01-04

Similar Documents

Publication Publication Date Title
JPH01314373A (ja) 機械翻訳システムにおける訳語選択方式
US11397762B2 (en) Automatically generating natural language responses to users' questions
Al‐Sughaiyer et al. Arabic morphological analysis techniques: A comprehensive survey
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
US10296584B2 (en) Semantic textual analysis
KR101004515B1 (ko) 문장 데이터베이스로부터 문장들을 사용자에게 제공하는 컴퓨터 구현 방법 및 이 방법을 수행하기 위한 컴퓨터 실행가능 명령어가 저장되어 있는 유형의 컴퓨터 판독가능 기록 매체, 문장 데이터베이스로부터 확인 문장들을 검색하는 시스템이 저장되어 있는 컴퓨터 판독가능 기록 매체
US5136503A (en) Machine translation system
US20150012262A1 (en) Method and system for generating new entries in natural language dictionary
Jabbar et al. A survey on Urdu and Urdu like language stemmers and stemming techniques
US8489384B2 (en) Automatic translation method
Habert et al. Contextual acquisition of information categories
Aikawa et al. Generation for multilingual MT
JPS5892063A (ja) イデイオム処理方式
Bahadur et al. Machine translation—A journey
JPS59140582A (ja) 自然言語翻訳援助方式
JP3300142B2 (ja) 自然言語処理装置
Rodrigues et al. Bootstrapping a hybrid MT system to a new language pair
Dung et al. Ontology-based information extraction and information retrieval in health care domain
Alshargi et al. Xword: A Multi-lingual Framework for Expanding Words
Kadam Develop a Marathi Lemmatizer for Common Nouns and Simple Tenses of Verbs
Ahmed et al. Impact of Related Languages as Pivot Language on Machine Translation
Gezmu et al. Morpheme-Based Neural Machine Translation Models for Low-Resource Fusion Languages
Momtazi et al. History and Architecture
Jawaid Statistical Machine Translation between Languages with Significant Word Order Differences
Aikawa et al. Sentence generation for multilingual machine translation