JP3393494B2 - 利用者辞書作成支援装置 - Google Patents

利用者辞書作成支援装置

Info

Publication number
JP3393494B2
JP3393494B2 JP14040993A JP14040993A JP3393494B2 JP 3393494 B2 JP3393494 B2 JP 3393494B2 JP 14040993 A JP14040993 A JP 14040993A JP 14040993 A JP14040993 A JP 14040993A JP 3393494 B2 JP3393494 B2 JP 3393494B2
Authority
JP
Japan
Prior art keywords
user
natural language
word
dictionary
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14040993A
Other languages
English (en)
Other versions
JPH06348747A (ja
Inventor
諭 白井
昭男 横尾
ボンド フランシス
悟 池原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP14040993A priority Critical patent/JP3393494B2/ja
Publication of JPH06348747A publication Critical patent/JPH06348747A/ja
Application granted granted Critical
Publication of JP3393494B2 publication Critical patent/JP3393494B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、入力された第1自然言
語の文を第2自然言語に自動的に翻訳する自然言語翻訳
システムに関し、特に利用者が個別に使用する第1自然
言語の単語または表現に対して第2自然言語の訳語句を
与える利用者辞書の作成を支援する装置に関する。 【0002】 【従来の技術】自然言語翻訳システムに用いる利用者辞
書の作成は、一般に利用者の責任において行われること
になっており、何を登録するか(第1自然言語の語
句)、どう訳出するか(第2自然言語の訳語句)、その
表現はどんな性質か(単語属性)について基本的にシス
テムは関与しない。ただし、市販されている一部の自然
言語翻訳システムには、利用者辞書を作成するための参
考情報が得られるものがある。例えば、特定のモードで
自然言語翻訳システムを走行させると、システムが知ら
ない単語(未知語)の一覧を出力したり、訳出すべき表
現を決定するためにオンライン辞書検索を行ったりす
る。 【0003】 【発明が解決しようとする課題】上述した従来の技術で
は、第1自然言語の語句の選定と第2自然言語の訳語句
の決定に関する支援を行うことは可能である。しかしな
がら、単語属性については、自然言語翻訳システムの開
発者によってあらかじめ公開されている分類表に基づい
て、利用者が個別に決定する必要がある。 【0004】自然言語翻訳システムの精度の面からは、
分類表がある程度細かく分離されていると精密な解釈を
行えることが知られているが(「池原、宮崎、横尾;日
英機械翻訳のための意味解釈辞書、情処研報NL−84
−13,1991年7月」では3000程度の単語分類
の必要性を指摘している)、一般利用者がこのような細
かな分類に従って単語属性を決定するのは極めて負担に
なる。また、自然語システムの開発者にとっては、分類
のノウハウに関するセキュリティの観点などから、分類
表自体をあるレベルより粗い分類の段階までしか公開し
たくないことがあり、この場合には利用者は単語属性を
細かいレベルで設定できない。 【0005】このため、システム辞書に登録されている
情報に関して、第1自然言語の語句または第2自然言語
の訳語句のみを変更したい場合や、登録語句を部分表現
として含むような長い語句を登録したい場合などは、利
用者が単語属性を設定することになり、その設定のいか
んによっては、訳文の構造ががらりと変わるなど、自然
言語翻訳システムの訳文品質の低下の原因となってい
る。 【0006】本発明の目的は、自然言語翻訳システムに
利用する利用者辞書の作成に要する利用者の負担が低減
され、かつ利用者辞書の単語属性を設定する際に必要と
なる分類表の公開も粗いレベルでとどめておくことが可
能な利用者辞書作成支援装置を提供することにある。 【0007】 【課題を解決するための手段】本発明の利用者辞書作成
支援装置は、第1自然言語の語句、第2自然言語の訳語
句、単語属性を保持しているシステム辞書と、利用者が
入力した第1自然言語の語句と第2自然言語の訳語句の
ペアに対して、利用者が入力した第1自然言語の語句全
体と同じ表記の語句がシステム辞書に登録されている場
合は、その語句に対する単語属性をシステム辞書から抽
出し、利用者が入力した第2自然言語の訳語句全体と同
じ表記の訳語句がシステム辞書に登録されている場合
は、その訳語句を与える語句に対する単語属性をシステ
ム辞書から抽出し、利用者が入力した第1自然言語の語
句の中心単語を含む部分表現が、システム辞書の登録語
句の全体かまたは登録語句の中心単語を含む部分表現と
一致する場合は、その一致した語句に対する単語属性を
システム辞書から抽出し、利用者が入力した第2自然言
語の訳語句の中心単語を含む部分表現が、システム辞書
の登録訳語句の全体かまたは登録訳語句の中心単語を含
む部分表現と一致する場合は、その一致した訳語句を与
える表現に対する単語属性をシステム辞書から抽出する
ことにより、利用者が入力した第1自然言語の語句に対
する単語属性を推定し、推定により得た結果を、利用者
辞書に自動的に反映するか、利用者に提示した後、利用
者の選択結果に基づいて前記利用者辞書に反映する属性
推定部を有する。 【0008】 【作用】本発明によれば、利用者が入力した第1自然言
語の語句と第2自然言語の訳語句のペアに対して、シス
テム辞書が保持している第1自然言語の語句あるいは第
2自然言語の訳語句と全体としてあるいは部分的に一致
するものがある場合には、システム辞書から該当する単
語属性を抽出するので利用者の負担が軽減される。 【0009】また、このように自動的に抽出した単語属
性は、必ずしも細かなレベルまで利用者に提示する必要
はなく、分類が階層的に行われているならば、内部的に
は細かく設定されていても利用者には粗いレベルで提示
することも可能であり、セキュリティの観点からも有効
である。 【0010】 【実施例】次に、本発明の実施例を、第1自然言語が日
本語、第2自然言語が英語の場合について説明する。 【0011】図1は本発明の一実施例を示す利用者辞書
作成支援装置のブロック図である。端末1から入力され
た日本語の語句と英語の訳語句に対して、属性推定部2
は日英翻訳システムに用いるシステム辞書である日英対
訳辞書3を参照して単語属性を推定し、必要に応じて端
末1に表示して利用者の修正を求め、利用者の操作を受
けて入力された日英の対訳情報と単語属性を利用者辞書
4に登録する。属性推定部22、日本語部分マッチ属性
推定部23、英語部分マッチ属性推定部24から構成さ
れている。 【0012】図2は図1の利用者辞書作成支援装置の動
作を示すフローチャートである。表1に示すように、日
英対訳辞書3に日本語「治療」に対する英訳語treatmen
t」がその単語属性「《治療》」と共に登録されている
場合について、図1の利用者辞書作成支援装置の動作を
説明する。 【0013】 【表1】 利用者が「治療→cure」を入力した場合(ステップ3
1)、日英対訳辞書3には日本語部分が同じ語「治療」
があるので、その単語属性《治療》を取り出して(ステ
ップ32,36)、利用者に提示して指示を受けるなど
した後(ステップ37)、表2のように利用者辞書4に
登録する(ステップ38)。 【0014】 【表2】 次に、利用者が「手当て→ treatment」を入力した場合
(ステップ31)、日英対訳辞書3に日本語部分が同じ
語はないが、英語部分が同じ語があるので、その単語属
性を取り出し(ステップ32,33,36)、先程と同
様にして利用者辞書4に登録する(ステップ37,3
8)。 【0015】利用者が「放射線治療→radiotherapy」を
入力した場合(ステップ31)、日英対訳辞書3には日
本語部分、英語部分とも一致する語がないが、日本語の
中心単語「治療」に一致する語があるので、その単語属
性を取り出し(ステップ32,33,34,36)、同
様にして利用者辞書4に登録する(ステップ37,3
8)。 【0016】利用者が「医療→ medical treatment」を
入力した場合(ステップ31)、日英対訳辞書3には日
本語部分、英語部分とも一致する語がないが、英語の中
心単語「treatment 」が一致する語があるので、その単
語属性を取り出し(ステップ32〜36)、同様にして
利用者辞書4に登録する(ステップ37,38)。 【0017】なお、システム辞書3に「数値制御ロボッ
ト→numerical controlled robot,《産業機械》」が登
録されているとき、利用者が「コンピュータ制御ロボッ
ト→computer controlled robot 」を入力すると、日本
語の部分表現「制御ロボット」か、または、英語の部分
表現「controlled robot」が一致するので、この場合も
単語属性が抽出できる。 【0018】特に、該当する語が複数個抽出される場
合、その結果を利用者に提示し、利用者に選択させるこ
とにより、利用者の負担を少なく保ちながら精度の高い
単語情報を付与することができる。日英対訳辞書3から
取り出された単語属性は利用者に提示することなく、利
用者辞書4に登録してもよい。 【0019】ここでは触れなかったが、中心単語を取り
出す方法としては、日本語の複合語では「数値制御ロボ
ット」のように中心単語「ロボット」に対して前方から
のみ修飾され、英語の複合語では「numerical controll
ed robot」のように中心単語「robot 」に対して前方か
ら修飾される場合と「desk with lighting unit (照明
付机)」のように中心単語「desk」に対して後方から句
や節により修飾される場合があるが、いずれも比較的容
易に中心単語を推定することができる。 【0020】 【発明の効果】以上説明したように、本発明は、利用者
が入力した第1自然言語の語句と第2自然言語の訳語句
のペアに対してシステムが保持している第1自然言語の
語句あるいは第2自然言語の訳語句と全体としてあるい
は部分的に一致するものがある場合には、システム辞書
から該当する単語属性を抽出することにより、自然言語
翻訳システムに使用する利用者辞書の作成に要する利用
者の負担を軽減できるほか、利用者辞書の単語属性を設
定する際に必要となる分類表の公開も粗いレベルにとど
めておくことが可能となる効果がある。
【図面の簡単な説明】 【図1】本発明の一実施例を示す利用者辞書作成支援
のブロック図である。 【図2】図1の利用者辞書作成支援装置の動作を示すフ
ローチャートである。 【符号の説明】 1 端末 2 属性推定部 3 日英対訳辞書 4 利用者辞書 21 日本語全体マッチ属性推定部 22 英語全体マッチ属性推定部 23 日本語部分マッチ属性推定部 24 英語部分マッチ属性推定部 31〜38 ステップ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 池原 悟 東京都千代田区内幸町一丁目1番6号 日本電信電話株式会社内 (56)参考文献 特開 平4−177463(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28 JICSTファイル(JOIS)

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 入力された第1自然言語の文を第2自然
    言語の文に自動的に翻訳する自然言語翻訳システムにお
    いて、利用者が個別に使用する第1自然言語の単語また
    は表現に対して第2自然言語の訳語を与える、第1自然
    言語の語句、第2自然言語の訳語句、単語属性を保持す
    る利用者辞書の作成を支援する利用者辞書作成支援装置
    であって、 第1自然言語の語句、第2自然言語の訳語句、単語属性
    を保持しているシステム辞書と、 利用者が入力した第1自然言語の語句と第2自然言語の
    訳語句のペアに対して、利用者が入力した第1自然言語
    の語句全体と同じ表記の語句が前記システム辞書に登録
    されている場合は、その語句に対する単語属性を前記シ
    ステム辞書から抽出し、利用者が入力した第2自然言語
    の訳語句全体と同じ表記の訳語句が前記システム辞書に
    登録されている場合は、その訳語句を与える語句に対す
    る単語属性を前記システム辞書から抽出し、利用者が入
    力した第1自然言語の語句の中心単語を含む部分表現
    が、前記システム辞書の登録語句の全体かまたは登録語
    句の中心単語を含む部分表現と一致する場合は、その一
    致した語句に対する単語属性を前記システム辞書から抽
    出し、利用者が入力した第2自然言語の訳語句の中心単
    語を含む部分表現が、前記システム辞書の登録訳語句の
    全体かまたは登録訳語句の中心単語を含む部分表現と一
    致する場合は、その一致した訳語句を与える表現に対す
    る単語属性を前記システム辞書から抽出することによ
    り、利用者が入力した第1自然言語の語句に対する単語
    属性を推定し、推定により得た結果を、利用者辞書に自
    動的に反映するか、利用者に提示した後、利用者の選択
    結果に基づいて前記利用者辞書に反映する属性推定部を
    有する利用者辞書作成支援装置
JP14040993A 1993-06-11 1993-06-11 利用者辞書作成支援装置 Expired - Fee Related JP3393494B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14040993A JP3393494B2 (ja) 1993-06-11 1993-06-11 利用者辞書作成支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14040993A JP3393494B2 (ja) 1993-06-11 1993-06-11 利用者辞書作成支援装置

Publications (2)

Publication Number Publication Date
JPH06348747A JPH06348747A (ja) 1994-12-22
JP3393494B2 true JP3393494B2 (ja) 2003-04-07

Family

ID=15268082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14040993A Expired - Fee Related JP3393494B2 (ja) 1993-06-11 1993-06-11 利用者辞書作成支援装置

Country Status (1)

Country Link
JP (1) JP3393494B2 (ja)

Also Published As

Publication number Publication date
JPH06348747A (ja) 1994-12-22

Similar Documents

Publication Publication Date Title
EP0953192B1 (en) Natural language parser with dictionary-based part-of-speech probabilities
JP3695191B2 (ja) 翻訳支援装置及びその方法並びにコンピュータ可読記録媒体
US5132901A (en) System and method for input of target language equivalents and determination of attribute data associated therewith
GB2194084A (en) Translation system
JP3393494B2 (ja) 利用者辞書作成支援装置
Borisov et al. Yandex school of data analysis russian-english machine translation system for wmt14
US7440890B2 (en) Systems and methods for normalization of linguisitic structures
JP2778025B2 (ja) 共起関係辞書の学習方法
JP3085394B2 (ja) 複数文翻訳における訳語選択方法およびこれを用いた機械翻訳システム
JP3136973B2 (ja) 言語解析システムおよび方法
JP2928246B2 (ja) 翻訳支援装置
JP2790886B2 (ja) 日本語文推敲装置
JP2000250913A (ja) 実例型自然言語翻訳方法、対訳用例集作成方法および装置とそのプログラムを記録した記録媒体
JP2840258B2 (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JP3236027B2 (ja) 機械翻訳装置
JP2742059B2 (ja) 翻訳用辞書編集装置
Li et al. Using Grammatical and Semantic Correction Model to Improve Chinese-to-Taiwanese Machine Translation Fluency
JP2830097B2 (ja) 文章検索方式
JP2871300B2 (ja) 機械翻訳装置
JPH10134055A (ja) 文作成支援装置及び文作成支援プログラムを記憶した媒体
JP3132563B2 (ja) 文書作成支援装置
JP3014746B2 (ja) 機械翻訳装置
JPH0421167A (ja) 機械翻訳装置
JP3267168B2 (ja) 自然言語変換システム
JP3884001B2 (ja) 言語解析システムおよび方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090131

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090131

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100131

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110131

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110131

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120131

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130131

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees