JP2742059B2 - 翻訳用辞書編集装置 - Google Patents
翻訳用辞書編集装置Info
- Publication number
- JP2742059B2 JP2742059B2 JP63195819A JP19581988A JP2742059B2 JP 2742059 B2 JP2742059 B2 JP 2742059B2 JP 63195819 A JP63195819 A JP 63195819A JP 19581988 A JP19581988 A JP 19581988A JP 2742059 B2 JP2742059 B2 JP 2742059B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- translation
- word
- information
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
Description
【発明の詳細な説明】 技術分野 本発明は、翻訳用辞書編集装置,より詳細には、自然
言語の自動翻訳(機械翻訳)におけるユーザ支援装置に
関し、例えば、自然言語の応答装置等に応用可能なもの
である。
言語の自動翻訳(機械翻訳)におけるユーザ支援装置に
関し、例えば、自然言語の応答装置等に応用可能なもの
である。
従来技術 ある言語Aから、ある言語Bへ自動的な翻訳を行な
う、いわゆる、機械翻訳装置においては、辞書の構築が
問題となる。とくに、言語Aのある語に対応する言語B
の訳語とのあいだに、アスペクト等属性の違いがある場
合にその困難が著しくなる。従来は、アスペクト等の違
いは、辞書中の訳語以外のある種の情報として保持する
ことにより、その違いをアルゴリズムの中で解消しよう
としている。しかし、そのやり方では、アルゴリズムを
十分理解している人間が、その情報として保持する部分
を除いた訳語を与え、保持する情報も同時に辞書に与え
る必要があった。従って、一般には、辞書登録が非常に
困難である。より具体的に説明すると、機械翻訳用辞書
では、たとえば、アスペクトの異なる単語の場合のよう
に、実際の翻訳時にもっとも普通にでてくる訳語と、実
際に辞書中に含まれている訳語が異なる。例えば、know
の訳語としては、「知る」という訳語とアスペクト情報
がはいっており、翻訳結果としてでてくる訳語は、「知
っている」というふうになる。翻訳アルゴリズム上「知
っている」という訳語の語と考えると、「知っていてい
る」とか、「知っていられる」というような変な訳語を
生成してしまうことになる。しかし、使用者は翻訳アル
ゴリズムを知っているとは限らないので、「知ってい
る」のような訳語を付けがちである。
う、いわゆる、機械翻訳装置においては、辞書の構築が
問題となる。とくに、言語Aのある語に対応する言語B
の訳語とのあいだに、アスペクト等属性の違いがある場
合にその困難が著しくなる。従来は、アスペクト等の違
いは、辞書中の訳語以外のある種の情報として保持する
ことにより、その違いをアルゴリズムの中で解消しよう
としている。しかし、そのやり方では、アルゴリズムを
十分理解している人間が、その情報として保持する部分
を除いた訳語を与え、保持する情報も同時に辞書に与え
る必要があった。従って、一般には、辞書登録が非常に
困難である。より具体的に説明すると、機械翻訳用辞書
では、たとえば、アスペクトの異なる単語の場合のよう
に、実際の翻訳時にもっとも普通にでてくる訳語と、実
際に辞書中に含まれている訳語が異なる。例えば、know
の訳語としては、「知る」という訳語とアスペクト情報
がはいっており、翻訳結果としてでてくる訳語は、「知
っている」というふうになる。翻訳アルゴリズム上「知
っている」という訳語の語と考えると、「知っていてい
る」とか、「知っていられる」というような変な訳語を
生成してしまうことになる。しかし、使用者は翻訳アル
ゴリズムを知っているとは限らないので、「知ってい
る」のような訳語を付けがちである。
目的 本発明は、上述のごとき実情に鑑みてなされたもの
で、特に、ユーザは、辞書中の訳語として、アスペクト
等を合わせた形(活用させる等の操作を加えた後の形)
で登録し、その訳語を形態素解析・あるいは構文解析す
ることによって、アスペクト等の部分と、本来の訳語等
の部分とに分割し、それらの情報と本来の訳語部分を辞
書中の情報として登録するようにし、これにより、辞書
への訳語の登録が一般のユーザでも非常に容易となるよ
うにすることを目的としてなされたものである。
で、特に、ユーザは、辞書中の訳語として、アスペクト
等を合わせた形(活用させる等の操作を加えた後の形)
で登録し、その訳語を形態素解析・あるいは構文解析す
ることによって、アスペクト等の部分と、本来の訳語等
の部分とに分割し、それらの情報と本来の訳語部分を辞
書中の情報として登録するようにし、これにより、辞書
への訳語の登録が一般のユーザでも非常に容易となるよ
うにすることを目的としてなされたものである。
構成 本発明は、上記目的を構成するために、少なくとも原
言語の単語・品詞・属性情報と、目的言語における訳語
・訳語の品詞・活用情報・属性情報を持つ翻訳用辞書
と、原言語・目的言語の入出力手段と、新しい辞書情報
を上記翻訳用辞書へ登録する手段とを持つ翻訳用辞書編
集装置において、目的言語の単語・品詞・活用情報等を
持つ目的言語解析用辞書と、目的言語解析用辞書の検索
手段と、目的言語の解析手段を持ち、入力された原言語
の単語とその目的言語における訳語のうち、訳語を前記
解析手段及び目的言語解析用辞書を用いて解析し、訳語
の本来部分と、属性部分に訳語を分離し、訳語の本来部
分については訳語情報として、訳語の属性部分について
は該訳語に対応する原言語の単語の属性情報として翻訳
用辞書に登録することを特徴としたものである。以下、
本発明の実施例に基づいて説明する。
言語の単語・品詞・属性情報と、目的言語における訳語
・訳語の品詞・活用情報・属性情報を持つ翻訳用辞書
と、原言語・目的言語の入出力手段と、新しい辞書情報
を上記翻訳用辞書へ登録する手段とを持つ翻訳用辞書編
集装置において、目的言語の単語・品詞・活用情報等を
持つ目的言語解析用辞書と、目的言語解析用辞書の検索
手段と、目的言語の解析手段を持ち、入力された原言語
の単語とその目的言語における訳語のうち、訳語を前記
解析手段及び目的言語解析用辞書を用いて解析し、訳語
の本来部分と、属性部分に訳語を分離し、訳語の本来部
分については訳語情報として、訳語の属性部分について
は該訳語に対応する原言語の単語の属性情報として翻訳
用辞書に登録することを特徴としたものである。以下、
本発明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するための全体構
成図、第2図は辞書情報入力時の処理の概要を示す図、
第3図は、日本語解析用辞書の一例を示す図で、図中、
1は翻訳用辞書、2は辞書検索装置、3は登録装置、4
は訳語解析装置、5は表示装置、6は入力装置、7は訳
語解析用辞書で、本発明は、少なくとも、原言語の単語
・品詞・属性情報と、目的言語における訳語・訳語の品
詞・活用情報・属性情報を持つ翻訳用辞書1と、原言語
・目的言語の入出力手段6と、入力された内容を上記翻
訳用辞書1へ登録する登録手段3を持つ翻訳用辞書編集
装置において、目的言語の単語・品詞・活用情報等を持
つ目的言語解析用辞書7と、目的言語解析用辞書の辞書
検索装置2と、目的言語の解析装置4とを有し、入力さ
れた訳語部分を上記解手段及び辞書を用いて解析し、訳
語の本来部分と、属性部分に訳語を分離し、それらの情
報を辞書情報として登録するようにしたものである。
成図、第2図は辞書情報入力時の処理の概要を示す図、
第3図は、日本語解析用辞書の一例を示す図で、図中、
1は翻訳用辞書、2は辞書検索装置、3は登録装置、4
は訳語解析装置、5は表示装置、6は入力装置、7は訳
語解析用辞書で、本発明は、少なくとも、原言語の単語
・品詞・属性情報と、目的言語における訳語・訳語の品
詞・活用情報・属性情報を持つ翻訳用辞書1と、原言語
・目的言語の入出力手段6と、入力された内容を上記翻
訳用辞書1へ登録する登録手段3を持つ翻訳用辞書編集
装置において、目的言語の単語・品詞・活用情報等を持
つ目的言語解析用辞書7と、目的言語解析用辞書の辞書
検索装置2と、目的言語の解析装置4とを有し、入力さ
れた訳語部分を上記解手段及び辞書を用いて解析し、訳
語の本来部分と、属性部分に訳語を分離し、それらの情
報を辞書情報として登録するようにしたものである。
以下、本発明を英日機械翻訳装置に適用した実施例で
説明すると、本発明による処理は、英日機械翻訳装置の
ユーザ辞書エディタの一部として、実現されており、英
日機械翻訳システムにおいて、例えば、英日対訳画面か
らユーザ辞書呼び出しキーによって起動される。ユーザ
辞書エディタが起動されて、英語の単語の綴りが入力さ
れ、それに対応する品詞・訳語が入力される。入力され
た訳語を、日本後解析辞書7と日本語解析装置4を用い
て解析する。解析方法は、どんなものでもよいが、たか
だか1〜2文節程度の解析であるので、非常に容易に実
現できる。本発明では、最長一致法を用いる。(これら
は、従来技術により容易に実現可能である。)これによ
り、辞書1中の訳語が、{自立語部+付属語部の連続}
という形に分割される。この付属語部の連続は、例え
ば、「ている」は、継続部素性を示す。「ます」は、丁
寧の素性を示すというように素性の束に分解する。つま
り、辞書中の訳語は、{自立語部(訳語・訳語の品詞・
活用・訳語の素性)+付属語部の素性の束}という形に
分解される。
説明すると、本発明による処理は、英日機械翻訳装置の
ユーザ辞書エディタの一部として、実現されており、英
日機械翻訳システムにおいて、例えば、英日対訳画面か
らユーザ辞書呼び出しキーによって起動される。ユーザ
辞書エディタが起動されて、英語の単語の綴りが入力さ
れ、それに対応する品詞・訳語が入力される。入力され
た訳語を、日本後解析辞書7と日本語解析装置4を用い
て解析する。解析方法は、どんなものでもよいが、たか
だか1〜2文節程度の解析であるので、非常に容易に実
現できる。本発明では、最長一致法を用いる。(これら
は、従来技術により容易に実現可能である。)これによ
り、辞書1中の訳語が、{自立語部+付属語部の連続}
という形に分割される。この付属語部の連続は、例え
ば、「ている」は、継続部素性を示す。「ます」は、丁
寧の素性を示すというように素性の束に分解する。つま
り、辞書中の訳語は、{自立語部(訳語・訳語の品詞・
活用・訳語の素性)+付属語部の素性の束}という形に
分解される。
この後、辞書には、付属語部の素性の束を英語の素
性、自立語部の素性を訳語の素性とし、英語の単語・活
用・日本語の訳語・訳語の品詞・活用・訳語の素性を辞
書の情報として、翻訳用辞書1の中に登録する。
性、自立語部の素性を訳語の素性とし、英語の単語・活
用・日本語の訳語・訳語の品詞・活用・訳語の素性を辞
書の情報として、翻訳用辞書1の中に登録する。
本発明では、すべての訳語について、解析を行なうの
でなく、訳語の品詞が活用語であるものだけを解析する
ことにした。非活用語は、このような解析を行なう必要
が少ないからである。
でなく、訳語の品詞が活用語であるものだけを解析する
ことにした。非活用語は、このような解析を行なう必要
が少ないからである。
以下、実例で説明する。翻訳辞書エディタ中で、英語
の単語として、know、品詞として動詞・訳語として、
「知っている」が与えられたとする。品詞が動詞である
ので、日本語解析処理が起動される。日本語解析処理で
は、「知っている」を「知る(連用形)」+「ている」
と分析する。辞書中の素性から、第4図のように翻訳辞
書に登録される。
の単語として、know、品詞として動詞・訳語として、
「知っている」が与えられたとする。品詞が動詞である
ので、日本語解析処理が起動される。日本語解析処理で
は、「知っている」を「知る(連用形)」+「ている」
と分析する。辞書中の素性から、第4図のように翻訳辞
書に登録される。
もちろん、英語の活用情報等も同時に登録させるよう
に変更することは非常に容易である。
に変更することは非常に容易である。
翻訳処理中の訳語の生成処理では、まず各素性を組合
せから訳出の助動詞が決定される。助動詞が複数ある時
の順序等は、日本語として適当なように別途定めてあ
る。
せから訳出の助動詞が決定される。助動詞が複数ある時
の順序等は、日本語として適当なように別途定めてあ
る。
I am known.といった例の翻訳では、第5図のような
日本語構造が得られる。ここで、知っているのノードの
日本語の分析は、 「知る」+「受け身」+「ている」となり、 「知られている」という、正しい日本語が生成され
る。
日本語構造が得られる。ここで、知っているのノードの
日本語の分析は、 「知る」+「受け身」+「ている」となり、 「知られている」という、正しい日本語が生成され
る。
従来「知っている」という訳語を取る場合は、「知っ
ていられる」となるのが通例である。したがって、受け
身のための新たな訳語を必要とするか、あるいは、辞書
の構造とアルゴリズムをよく知った辞書管理者が辞書情
報を個別に与える必要があった。このように、例えば、
knowという語に対して、日本語として自然な(人間用の
辞書に載っている形の)「知っている」という訳語を与
えることにより、特殊なアスペクト情報等や受け身等の
考慮を必要とした情報を人間が意識する必要なく、正し
い日本語が生成できるような翻訳用辞書ができるのであ
る。
ていられる」となるのが通例である。したがって、受け
身のための新たな訳語を必要とするか、あるいは、辞書
の構造とアルゴリズムをよく知った辞書管理者が辞書情
報を個別に与える必要があった。このように、例えば、
knowという語に対して、日本語として自然な(人間用の
辞書に載っている形の)「知っている」という訳語を与
えることにより、特殊なアスペクト情報等や受け身等の
考慮を必要とした情報を人間が意識する必要なく、正し
い日本語が生成できるような翻訳用辞書ができるのであ
る。
本実施例では、アスペクトの違いを主に対象にしてい
るが、その他のものにも容易に応用が可能である。たと
えば、訳語として丁寧語を与えた場合でも、連体修飾で
名詞を修飾する場合は、丁寧語を省いて自然な日本語を
生成するということが容易に可能になるのである。
るが、その他のものにも容易に応用が可能である。たと
えば、訳語として丁寧語を与えた場合でも、連体修飾で
名詞を修飾する場合は、丁寧語を省いて自然な日本語を
生成するということが容易に可能になるのである。
また、日本語の解析部分を簡単にするために、例えば
アスペクト等を扱うこととし、簡単な助動詞のテーブル
と、辞書とのマッチング処理だけで上記の処理に交える
ことも可能である。
アスペクト等を扱うこととし、簡単な助動詞のテーブル
と、辞書とのマッチング処理だけで上記の処理に交える
ことも可能である。
英日機械翻訳システムだけでなく、ある言語から、別
の言語へ翻訳を行なう、いわゆる機械翻訳装置全般に簡
単に応用・実施できる。
の言語へ翻訳を行なう、いわゆる機械翻訳装置全般に簡
単に応用・実施できる。
効果 以上の説明から明らかなように、本発明によると、辞
書に載っているような自然な訳語を与えるだけで、各種
の条件に合った適当な訳語を生成できるような辞書情報
を付与できる。
書に載っているような自然な訳語を与えるだけで、各種
の条件に合った適当な訳語を生成できるような辞書情報
を付与できる。
特殊な情報も訳語中に内在させられるので、辞書の構
造等を知らなくても、容易に辞書構築が可能である。
造等を知らなくても、容易に辞書構築が可能である。
第1図は、本発明の一実施例を説明するための全体構成
図、第2図は、辞書情報入力時の処理の概要を説明する
ためのフロー図、第3図は、日本語解析用辞書の一例を
示す図、第4図は、翻訳用辞書の一例を示す図、第5図
は、I am knownの構造を示す図である。 1……翻訳用辞書,2……辞書検索装置,3……登録装置, 4……訳語解析装置,5……表示装置,6……入力装置, 7……訳語解析用辞書。
図、第2図は、辞書情報入力時の処理の概要を説明する
ためのフロー図、第3図は、日本語解析用辞書の一例を
示す図、第4図は、翻訳用辞書の一例を示す図、第5図
は、I am knownの構造を示す図である。 1……翻訳用辞書,2……辞書検索装置,3……登録装置, 4……訳語解析装置,5……表示装置,6……入力装置, 7……訳語解析用辞書。
Claims (1)
- 【請求項1】少なくとも原言語の単語・品詞・属性情報
と、目的言語における訳語・訳語の品詞・活用情報・属
性情報を持つ翻訳用辞書と、原言語・目的言語の入出力
手段と、新しい辞書情報を上記翻訳用辞書へ登録する手
段とを持つ翻訳用辞書編集装置において、目的言語の単
語・品詞・活用情報等を持つ目的言語解析用辞書と、目
的言語解析用辞書の検索手段と、目的言語の解析手段を
持ち、入力された原言語の単語とその目的言語における
訳語のうち、訳語を前記解析手段及び目的言語解析用辞
書を用いて解析し、訳語の本来部分と、属性部分に訳語
を分離し、訳語の本来部分については訳語情報として、
訳語の属性部分については該訳語に対応する原言語の単
語の属性情報として翻訳用辞書に登録することを特徴と
する翻訳用辞書編集装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63195819A JP2742059B2 (ja) | 1988-08-04 | 1988-08-04 | 翻訳用辞書編集装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63195819A JP2742059B2 (ja) | 1988-08-04 | 1988-08-04 | 翻訳用辞書編集装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0244461A JPH0244461A (ja) | 1990-02-14 |
| JP2742059B2 true JP2742059B2 (ja) | 1998-04-22 |
Family
ID=16347523
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63195819A Expired - Fee Related JP2742059B2 (ja) | 1988-08-04 | 1988-08-04 | 翻訳用辞書編集装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2742059B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04107675A (ja) * | 1990-08-28 | 1992-04-09 | Nec Corp | 英文ワードプロセッサー |
-
1988
- 1988-08-04 JP JP63195819A patent/JP2742059B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0244461A (ja) | 1990-02-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5132901A (en) | System and method for input of target language equivalents and determination of attribute data associated therewith | |
| JP2742059B2 (ja) | 翻訳用辞書編集装置 | |
| JP2807586B2 (ja) | 機械翻訳装置 | |
| JP2871300B2 (ja) | 機械翻訳装置 | |
| JP2807468B2 (ja) | 翻訳用辞書情報表示装置 | |
| JP3267168B2 (ja) | 自然言語変換システム | |
| JPS62272357A (ja) | 機械翻訳システムにおける入力文のエラ−表示方式 | |
| JPS6368972A (ja) | 未登録語処理方式 | |
| JP2935928B2 (ja) | 自然言語翻訳装置 | |
| JPH0850588A (ja) | 未知語登録装置 | |
| JPH07234872A (ja) | 言語データベースの形態素列変換装置 | |
| JPH02208775A (ja) | 機械翻訳方式 | |
| JP2003114890A (ja) | 翻訳装置、翻訳方法、翻訳サーバおよびプログラム | |
| JPH05324711A (ja) | 自然言語自動翻訳システム | |
| JPH04296969A (ja) | 機械翻訳装置 | |
| JPH03282965A (ja) | 機械翻訳システム | |
| JPH06236394A (ja) | 自然言語自動翻訳装置 | |
| JPH07182342A (ja) | 機械翻訳装置 | |
| JPH09330317A (ja) | 機械翻訳装置 | |
| JPH09146959A (ja) | 機械翻訳システム | |
| JPS63182775A (ja) | 機械翻訳装置 | |
| JPH0474268A (ja) | 機械翻訳装置 | |
| JPH06180713A (ja) | 機械翻訳装置 | |
| JPH0736892A (ja) | 機械翻訳装置 | |
| JPH04284569A (ja) | 機械翻訳装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |