JPH06119378A - 機械翻訳システムにおけるユーザ・チューニング機構 - Google Patents

機械翻訳システムにおけるユーザ・チューニング機構

Info

Publication number
JPH06119378A
JPH06119378A JP4269945A JP26994592A JPH06119378A JP H06119378 A JPH06119378 A JP H06119378A JP 4269945 A JP4269945 A JP 4269945A JP 26994592 A JP26994592 A JP 26994592A JP H06119378 A JPH06119378 A JP H06119378A
Authority
JP
Japan
Prior art keywords
translation
machine translation
translation system
processing
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4269945A
Other languages
English (en)
Inventor
Jun Ibuki
潤 伊吹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4269945A priority Critical patent/JPH06119378A/ja
Publication of JPH06119378A publication Critical patent/JPH06119378A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】機械翻訳システムに関し、機械翻訳システムの
内部構造を知らないユーザが、容易に機械翻訳システム
をチューニングするための機構を提供することを目的と
する。 【構成】翻訳すべき原文と、この原文に対する翻訳結果
とを入力する手段と、前記原文とその翻訳結果とに基づ
いて、単語辞書登録、あるいは新たな文法規則の追加を
行なう手段とを具備することにより構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳システムの出
力を制御する簡便なインタフェースを、機械翻訳システ
ムの内部構造を知らないユーザに対して提供するための
ユーザ・チューニング機構に関する。
【0002】最近の機械翻訳システムの低価格化、ネッ
トワークを用いた機械翻訳サービスの提供などによっ
て、機械翻訳の利用が次第に個人レベルにまで広がって
行こうとしている。
【0003】しかしながら、機械翻訳システムは、限ら
れた種類の文のみを入力として受け付けるようになって
おり、機械翻訳システムが持つ文法や辞書を、ユーザの
個々の要求に応じて修正(以下、「チューニング」とい
う。)することが必要となってくる。
【0004】しかし、チューニングの作業は、機械翻訳
システムの内部に精通した専門家が、個々のユーザの要
求を解釈して行なう必要があるので、この作業は、機械
翻訳システムを個人レベルへまで普及させるのに、大き
な障害となっている。
【0005】チューニングの作業は、機械翻訳システム
の内部の解析・生成文法、辞書構成の改変等によって行
なわれるが、そのためには、機械翻訳システムの内部に
精通した専門家が必要であり、これはチューニング作業
のコストを引き上げる原因の一つとなっている。
【0006】
【従来の技術】機械翻訳システムでは、一般に文法規則
をユーザに公開し、その文法規則の自由な改変は許して
いない。その一つの理由として、文法規則の改変が非常
に難しいということがあげられる。機械翻訳システムの
文法は、一般に数千を越える規則から構成され、相互に
関連し合っているのである。
【0007】このため、従来、機械翻訳システムの文法
等をチューニングするには、単純に文法規則の記述形式
を覚えるだけでなく、機能語の辞書登録の形式、他の文
法規則への影響等を考慮に入れる必要があった。
【0008】
【発明が解決しようとする課題】現在の機械翻訳システ
ムでは、予め辞書中に登録された語彙を使い、制限され
た構文パターンで記述されたテキストしか翻訳を正しく
行なうことができない。基本的に、ユーザが機械翻訳シ
ステムをチューニングできるところは、新しい単語の辞
書登録のみである。
【0009】高品質の翻訳結果を得るためには、多くの
場合、ユーザは予めテキストを受け入れ可能な形に書き
直してから入力する必要があった。このことは、機械翻
訳の前処理の負荷を増大させると同時に、大量の文書の
翻訳には費用対効果の点で、機械翻訳システムの使用を
不適なものとしており、問題であった。
【0010】本発明は、このような従来の問題点に鑑み
て為されたものであり、機械翻訳システムの内部構造を
知らないユーザが、容易に機械翻訳システムをチューニ
ングすることができるインタフェースを具備する機械翻
訳システムを提供することを目的とする。
【0011】
【課題を解決するための手段】本発明によれば、上述の
目的は、前記特許請求の範囲に記載した手段にて達成さ
れる。
【0012】すなわち、請求項1の発明は、機械翻訳シ
ステムが有する翻訳アルゴリズムを変更するための手段
であって、翻訳すべき原文と、この原文に対する翻訳結
果とを入力する手段と、前記原文とその翻訳結果とに基
づいて、単語辞書登録あるいは、新たな文法規則の追加
を行なう手段とを具備する機械翻訳システムにおけるユ
ーザ・チューニング機構である。
【0013】また、請求項2の発明は、機械翻訳システ
ムの利用に際し、入力文に対して行なわれた前編集及び
後編集作業の内容を記録する手段と、この記録より、機
械翻訳処理の前後におけるそれぞれのテキストを調べ、
機械翻訳システムの翻訳アルゴリズムを調整する手段と
を設ける機械翻訳システムにおけるユーザ・チューニン
グ機構である。
【0014】また、請求項3の発明は、前記原文とその
翻訳結果とで構成する一の組み合わせと、他の組み合わ
せとの間で、類似した部分を検出する手段と、この類似
した部分を元に、ある原文とその翻訳結果との組み合わ
せの中に存在する、抽象化されたパターンを生成する手
段と、与えられた原文が、生成したパターンに当てはま
る場合、そのパターンに従って翻訳処理を実行する手段
とを設ける機械翻訳システムにおけるユーザ・チューニ
ング機構である。
【0015】
【作用】本発明によれば、機械翻訳システムの内部に精
通していないユーザでも、翻訳例を機械翻訳システムに
示すことによって、翻訳結果を望む形式に変更させるこ
とが可能である。また、そうした翻訳例をシステムが翻
訳時の前編集作業、後編集作業から自動的に学習するこ
とも可能である。また代表例を複数入力することによっ
て、直接に示されない類似例の翻訳の指定をすることも
できる。
【0016】図1は、本発明の原理説明図である。図
中、入力パタン解析部1は、入力パターンを解析するも
のであり、入力された翻訳例を原言語パタン、目的言語
パタンに分ける。各々のパタンは原言語解析部2、及び
目的言語解析部3において形態素解析、構文解析などを
受ける。
【0017】処理判定部4は、これらの出力を受けて、
所望の翻訳結果を得るために、どのような処理が必要か
を判断する。これらの判断は、登録処理決定規則9中の
ヒューリスティックルールを参照して行なわれる。
【0018】処理オプションは、基本的には、新単語を
単語辞書7へ登録する処理を行なう単語登録5、あるい
は新たな書き換え規則を文法規則ベース8へ登録する処
理を行なう文法規則の追加6の二つである。
【0019】図5は、辞書登録について説明する図であ
る。図中、原言語である「Neural Networ
k」は、「Neural」という形容詞と、「Netw
ork」という名詞との二語で構成されていると見なす
ことができるので、機械翻訳システムは、その文法規則
にしたがって、例えば、「神経の網」といった訳語を出
力する。
【0020】しかし、「Neural Networ
k」を、工学分野で使用する一つの名詞として、正しく
「ニューラルネットワーク」と翻訳させたい場合、図示
するように、「Neural Network」という
原言語パタンと、「ニューラルネットワーク」という目
的言語パタンとの組み合わせを機械翻訳システムに与え
る。
【0021】すると、本発明によるチューニング機構に
より、単語辞書に対する単語登録が行なわれるので、以
後、機械翻訳システムに対して「Neural Net
work」と入力すると、「ニューラルネットワーク」
という訳語が出力されるようになる。
【0022】図6は、文法規則の登録について説明する
図である。図6では、「Thanks in adva
nce.」という原言語を、「どうぞよろしく御願いし
ます。」という訳文に翻訳させるために行なう文法規則
の登録について説明している。図6の場合、トップカテ
ゴリーは‘文’となるので、単語辞書への単語登録では
なく、文法規則ベースへの文法規則登録が行なわれてい
る。
【0023】図4は、トップカテゴリーに基づく処理の
分類方法を説明する流れ図である。図4の場合、トップ
カテゴリーが一つにまとまらない場合、及び、トップカ
テゴリーが‘動詞句’,‘節’,‘文’の場合には、文
法規則の追加を行なうこととしている。一方、トップカ
テゴリーが、‘名詞’,‘形容詞’,‘副詞’の場合に
は、単語登録を行なうこととしている。
【0024】
【実施例】図2は、本発明の一実施例を示す図である。
ここでは、テキストが人間と機械翻訳システムによって
処理される間、モニターを行なっている。このとき、
a.入力文、b.前編集用エディタ11の出力の二つ
を、原言語解析部14に送出しており、c.機械翻訳シ
ステム12の出力、d.後編集用エディタ13の出力の
二つを目的言語解析部15に送出している。
【0025】原言語解析部14及び目的言語解析部15
は、これらのデータを解析し、処理判定部16は、その
解析結果をチェックする。ここで、登録処理決定規則2
3が参照され、人間による修正が行なわれた文のみが記
録される。
【0026】ここでの処理オプションは、単語辞書22
を管理する単語登録19、文法規則ベース21を管理す
る文法規則の追加18、前編集規則ベース20を管理す
る前編集用規則の追加17の三つであり、この中からの
選択が行なわれる。
【0027】図3は、本発明の他の実施例を示す図であ
る。ここでは、複数の類似する翻訳例を入力する場合に
ついて説明する。図中、入力パタン解析部31は、入力
されてくるパタンが、原言語パタンであるか、目的言語
パタンであるかを検出し、その構文解析を行なう。
【0028】各々の種類の入力パタンはカテゴライザー
32によって、一致する部分、相違する部分へカテゴラ
イズされる。相違部分は、マッチャー33に送られる。
ここでは、階層化シソーラス37を参照しながらミニマ
ム・カバレッジ(すべての入力パタンに一致する最も特
殊なカテゴリ)の特定を行なう。
【0029】対応関係認定部34は、一般化されたパタ
ンが目的言語パタンのどこに対応するか、マッピング関
数は何かの認定を行なう。これによって登録のための変
換ルールを得ることができる。書換規則生成部35は、
文法規則ベース36へ、新しい文法規則を登録する。
【0030】図7は、図3に示す実施例による新しい文
法規則の生成例を示している。図7では、二つの翻訳
例、 Conference on AI => 人工知能に関する会議 Conference on cold fusion => 低温核融合に関する会議 から、より一般的な事例に適用可能な一般化パタンを生
成している。
【0031】
【発明の効果】以上説明したように、本発明によれば、
ユーザは機械翻訳システムの文法規則の登録を簡単に行
なうことができる。これにより、例えば、表記の変化、
単語の活用に対処できるし、より一般的な翻訳アルゴリ
ズムの調整も可能となる。さらに、ユーザは、翻訳例の
入力の手間を省くことができる。
【0032】また、本発明によれば、複数の翻訳例を入
力することによって、今までに入力されていない更に一
般的な事例に対して適用可能な新しい文法規則を生成す
ることもでき、また、特定の文種に対応した翻訳アルゴ
リズムの変更を容易に行なうこともできる。
【0033】このように、本発明では、今まで専門家に
任せていた機械翻訳システムの内部の文法の調整を、一
般のユーザでもある程度行なえるので、小量の文書の翻
訳にも機械翻訳システムを十分に活用することができ、
機械翻訳システムの普及に寄与するところが大きい。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の一実施例を示す図である。
【図3】本発明の他の実施例を示す図である。
【図4】トップカテゴリーに基づく処理の分類方法を説
明する流れ図である。
【図5】辞書登録について説明する図である。
【図6】文法規則の登録について説明する図である。
【図7】文法規則の生成例を示す図である。
【符号の説明】
1,31 入力パタン解析部 2,14 原言語解析部 3,15 目的言語解析部 4,16 処理判定部 5,19 単語登録 6,18 文法規則の追加 7,22 単語辞書 8,21,36 文法規則ベース 9,23 登録処理決定規則 11 前編集用エディタ 12 機械翻訳システム 13 後編集用エディタ 17 前編集用規則の追加 20 前編集規則ベース 32 カテゴライザー 33 マッチャー 34 対応関係認定部 35 書換規則生成部 37 階層化シソーラス

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】機械翻訳システムが有する翻訳アルゴリズ
    ムを変更するための手段であって、 翻訳すべき原文と、この原文に対する翻訳結果とを入力
    する手段と、 前記原文とその翻訳結果とに基づいて、単語辞書登録あ
    るいは、新たな文法規則の追加を行なう手段とを具備す
    ることを特徴とする機械翻訳システムにおけるユーザ・
    チューニング機構。
  2. 【請求項2】機械翻訳システムの利用に際し、入力文に
    対して行なわれた前編集及び後編集作業の内容を記録す
    る手段と、 この記録より、機械翻訳処理の前後におけるそれぞれの
    テキストを調べ、機械翻訳システムの翻訳アルゴリズム
    を調整する手段とを設ける請求項1記載の機械翻訳シス
    テムにおけるユーザ・チューニング機構。
  3. 【請求項3】前記原文とその翻訳結果とで構成する一の
    組み合わせと、他の組み合わせとの間で、類似した部分
    を検出する手段と、 この類似した部分を元に、ある原文とその翻訳結果との
    組み合わせの中に存在する、抽象化されたパターンを生
    成する手段と、 与えられた原文が、生成したパターンに当てはまる場
    合、そのパターンに従って翻訳処理を実行する手段とを
    設ける請求項1記載の機械翻訳システムにおけるユーザ
    ・チューニング機構。
JP4269945A 1992-10-08 1992-10-08 機械翻訳システムにおけるユーザ・チューニング機構 Withdrawn JPH06119378A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4269945A JPH06119378A (ja) 1992-10-08 1992-10-08 機械翻訳システムにおけるユーザ・チューニング機構

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4269945A JPH06119378A (ja) 1992-10-08 1992-10-08 機械翻訳システムにおけるユーザ・チューニング機構

Publications (1)

Publication Number Publication Date
JPH06119378A true JPH06119378A (ja) 1994-04-28

Family

ID=17479399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4269945A Withdrawn JPH06119378A (ja) 1992-10-08 1992-10-08 機械翻訳システムにおけるユーザ・チューニング機構

Country Status (1)

Country Link
JP (1) JPH06119378A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6920419B2 (en) 2001-04-16 2005-07-19 Oki Electric Industry Co., Ltd. Apparatus and method for adding information to a machine translation dictionary

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6920419B2 (en) 2001-04-16 2005-07-19 Oki Electric Industry Co., Ltd. Apparatus and method for adding information to a machine translation dictionary

Similar Documents

Publication Publication Date Title
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
JP2005165958A (ja) 情報検索システム、情報検索支援システム及びその方法並びにプログラム
JPH03202954A (ja) 機械翻訳装置
JPH11272672A (ja) 機械翻訳装置及び記録媒体
Vogel et al. Robust chart parsing with mildly inconsistent feature structures
US5132901A (en) System and method for input of target language equivalents and determination of attribute data associated therewith
JPH0261763A (ja) 機械翻訳装置
JPH06119378A (ja) 機械翻訳システムにおけるユーザ・チューニング機構
JPH03260766A (ja) 括弧生成判定機能付翻訳装置
Elleuch et al. Lexical data mining‐based approach for the self‐enrichment of LMF standardized dictionaries: Case of the syntactico‐semantic knowledge
JP2742059B2 (ja) 翻訳用辞書編集装置
JPH06295311A (ja) 機械翻訳装置
JPH09212507A (ja) 文字処理装置と文字列の解析方法
Vu et al. CISQA: Corporate Smart Insights Question Answering System
JP4110460B2 (ja) 表現抽出装置および方法
JP3358100B2 (ja) 日本語質問メッセージ解析方法及び装置
JP2504449B2 (ja) 日本語文節間係り受け解析装置
JPS63136265A (ja) 機械翻訳装置
JP2901977B2 (ja) 翻訳装置
Ocelikova et al. Processing of Anaphoric and Elliptic Sentences in a Spoken Dialog System
JPH07244664A (ja) 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置
JP2001125898A (ja) 言語解析処理の方法、システム
Liu et al. LANGUAGE UNDERSTANDING AND GENERATION IN CHINESE SPOKEN DIALOGUE SYSTEMS
JPH05290085A (ja) 機械翻訳装置
JPH07200602A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000104