JPH03160564A - 機械翻訳装置における前処理装置 - Google Patents

機械翻訳装置における前処理装置

Info

Publication number
JPH03160564A
JPH03160564A JP1301175A JP30117589A JPH03160564A JP H03160564 A JPH03160564 A JP H03160564A JP 1301175 A JP1301175 A JP 1301175A JP 30117589 A JP30117589 A JP 30117589A JP H03160564 A JPH03160564 A JP H03160564A
Authority
JP
Japan
Prior art keywords
translation
dictionary
words
document
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1301175A
Other languages
English (en)
Inventor
Toshihiko Yokogawa
横川 壽彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1301175A priority Critical patent/JPH03160564A/ja
Publication of JPH03160564A publication Critical patent/JPH03160564A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 挟檄允互 本発明は、機械翻訳装置における前処理装置に関する. 丈来技先 従来の機械翻訳装置においては、翻訳結果を見るまでは
、妥当な訳語が入っているがどうが不明である. また、妥当な訳語が辞書に登録されている場合でも,文
中の用法として認定されるとは限らない.つまり、多義
、多品詞、多訳語の場合には別の用法、訳語が優先され
てしまう場合がある.上記欠点を解消するために、特開
昭63−228374号公報においては,翻訳対象文書
の単語の頻度とその単語の辞書情報から,ある一定の頻
度以上で、多品詞あるいは多義の単語について、辞書の
情報を表示し、必要な情報を選択翻訳するようにしてい
るが、多品詞・多義性のある語は、特に構文上の位置に
よって多品詞・多義となっており,情報を限定すること
が困難な場合が多い。
また、文書中の単語の重要度と、多義性は必ずしも一致
せず、翻訳用の辞書では、単一の語義(訳語)しかない
ような語が、分野によってまったく違う訳語(専門用語
等)を必要とする場合,必要とする訳語が現われないた
めに、誤解を生じるといった辞書中の語義の不足に対応
できない等の欠点があった。
特に、上記特開昭63−228374号公報においては
、多義の語でその文書で頻度が高い語について、あらか
じめ抽出し、その結果をユーザに提示、修正することに
よって翻訳精度を語めるようにしているが, ■ 抽出する語が多義・多品詞を元としているので、文
書中で誤解されてはいけない重要語であるとは限らない
。例えば、訳語は数少ないが、間違えるとまったくの誤
解を呼ぶような語には対応できない.また,翻訳しよう
とする分野に特有の語紮で、一般の場合とはまったく異
なる用法がある場合(でかつ一般の語としての用法が少
ない場合)は対応できない(言換えれば、システムが多
義と認識していない語でも、システムの辞書の訳語では
非常にまずい場合が存在し得ると言うことである). ■ 抽出する語を頻度のみに頼っている。頻度は、非常
に重要な尺度であるが、頻度ばかりではなく.文書中の
位置等、文書中の語禦の重要度を計る基準は他にも存在
する等の欠点があった。
且一一豊 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、キーワード抽出の技術を応用し、文書中の重要語
を抽出し、抽出した文書中の重要語(言換えればキーワ
ード)について、翻訳用辞書の内容をユーザに提示し、
ユーザの確認,修正を求めるようにし、これによって、
上記■、■の欠点を解消するようにしたものである。
豊−一皮 本発明は、上記目的を達成するために、ある言語Aから
他の言語Bへの翻訳用の辞書と,入力された言語Aの文
書から,文書のキーワードとなる1個以上の語を選択す
る選択手段と、選択されたキーワードの各語について、
翻訳用辞書を検索しその結果を表示する表示手段と,表
示された検索結果を修正する修正手段とを有し、修正さ
れた結果を翻訳用辞書に登録することを特徴としたもの
であり、更には,修正された結果を入力された言語Aの
文書に特有の辞書として登録すること,或いは、登録対
象辞書を選択し、修正された結果を選択された登録対象
辞書に登録すること,或いは、登録対象となった.入力
された言語Aの文書に特有の辞書をもっとも優先順位の
高い辞書であると選択させること、或いは、登録対象と
なった辞書をもっとも優先順位の高い辞書であると選択
させることを特徴とするものである.以下、本発明の実
施例に基づいて説明する。
第1図は、本発明による翻訳前処理装置の一例を説明す
るための全体構或図、第2図は、本発明の動作説明をす
るためのフローチャートで、図中、1は対象文書.10
は翻訳前処理装置で、該翻訳前処理装置10は、翻訳用
辞書(複数)手段11,翻訳用辞書検索手段12,翻訳
用辞書表示・編集手段l3、及び、キーワード抽出手段
14等から成っている。
本発明による前処理装置は、日英機械翻訳システムの翻
訳エディタの一部として実現されており、日本語の文書
が入力され,キーワード抽出編集の機能が指定されたと
きに,本前処理が実行される.まず、キーワード抽出手
段14により、翻訳対象文書1からキーワードが抽出さ
れる.キーワード抽出手段14は、どんなものでもよく
、既存の技術で実現可能である。たとえば、情報処理学
会自然言語処理研究会資料64−1 rキーワードの自
動抽出と重要度評価」 (木本春夫 NTT情報通信処
理研究所 1987.11)等に詳細に説明されている
ようなキーワード抽出方法を取ることができる(第2図
のStapl)。
このキーワード抽出手段l4によって抽出された複数の
キーワードは、翻訳エディタ中の内部バッファに蓄えら
れる. 次に,内部バッファに蓄えられたキーワードの一語一語
について以下の処理を行なう(第2図のStep2  
Step6)。
なお、キーワードは翻訳エディタの内部バッファに蓄え
るのではなく、外部記憶装置等に蓄えて同等の処理を行
うことも可能であり,また、キーワード抽出手段とシー
クエンシャルに結合し、一つのキーワードを抽出するご
とに以下の処理を行なうことも可能である. また,以下の処理は,いわゆる翻訳システムにおける辞
書エディタの機能をそのまま用いるが、通常は、ユーザ
が編集したいエントリを入力して辞書エディタで辞書を
編集する.これに対して、本前処理では、ユーザ入力の
単語(エントリ)のかわりに,キーワード抽出手段で抽
出したキーワードを用いる(各キーワードに対して、辞
書エディタを用いて,辞書を編集する処理を行なうよう
にしたものであると考えてよい〉. キーワードを検索キーとして、翻訳用辞書11を検索し
(第2図のStep2)、検索結果を例えば、第3図の
ように画面上に表示する(第2図のStop3)。
ユーザは、画面上に表示されたキーワードの翻訳用辞書
情報を確認し、修正すべき情報があれば修正する(第2
図のStep4)。例えば、訳語を変更,あるいは追加
する. その後,修正・追加内容を翻訳用辞書に登録することが
できるように構成してある(第2図のStep5)● これは,修正した場合は、元の翻訳用辞書とは別に対象
文書専用辞書を形或し、そこに登録するように構成する
ことも容易に可能である。
また,元の辞書に登録するか,対象文書専用辞書に登録
するかを選択することができるように構威することも容
易であり,あるいは、登録したい辞書名を指定できるよ
うにすることもまた可能である. これらの場合、新たに指定した辞書あるいは文書専用辞
書が、元のシステムの辞書に優先して用いられるべきで
あるといったフラグ等を立てるようにすることも可能で
ある。
キーワードに該当する翻訳用辞書エントリが存在しない
場合は、翻訳用辞書エントリが存在しないこととともに
、翻訳用辞書編集画面を表示する。
ここで、ユーザが品詞や訳語の情報を入れた後、翻訳用
辞書エントリがあった場合と同様の処理を行なうように
している. 豊−一来 以上の説明から明らかなように、本発明によると、(1
)ある言語Aから他の言語Bへの翻訳用の辞書と、入力
された言語Aの文書から,文書のキーワードとなる1個
以上の語を選択する選択手段と、選択されたキーワード
の各語について、翻訳用辞書を検索しその結果を表示す
る表示手段と,表示された検索結果を修正する修正手段
とを有し、修正された結果を翻訳用辞書に登録するよう
にしたことにより、文書中の重要語であるキーワードを
自動的に抽出し、これらの重要語の訳語や文法情報等を
容易に変更できるので、後に行なう機械翻訳の結果得ら
れる訳文が文書の内容に適合したものとなる。また、(
2)修正された結果を入力された言語Aの文書に特有の
辞書として登録するようにすることにより、対象文書に
専用の辞書を自動的に形成するので、システム共用の辞
書内容を書き換えずに,上記の効果を得られる(したが
って、他の文書を同時に翻訳しようとしたりした場合に
より有効である).また、分野別辞書等と文書専用辞書
をまとめる形で容易に構築可能である. また、(3)登録対象辞書選択し,修正された結果を選
択された登録対象辞書に登録するようにすることにより
、修正内容を書き込む辞書を自由に選択できるので、既
存の分野別辞書等やユーザ固有の辞書に直接書き込むこ
とで,ある分野やユーザ固有の辞書を容易に拡張できる
.また、共通な情報として必要な場合は、システムの共
用辞書を書き換えることも同様に可能であり、非常に柔
軟な辞書内容の修正が可能となる. また、(4)登録対象となった,入力された言語Aの文
書に特有の辞書をもっとも優先順位の高い辞書であると
選択させるようにすることにより、対象文書専用辞書を
優先度の高い辞書に自動的に設定するので、前記の効果
を得られると共に、翻訳時にユーザが辞書の優先度等を
なんら意識せずに、適合する訳語を得ることができる.
更には、(5)登録対象となった辞書をもっとも優先順
位の高い辞書であると選択させるようにすることにより
、対象文書に適合した訳語に修正した内容を含んだ辞書
を優先度の高い辞書として自動的に設定するので,前記
の効果が得られると共に,翻訳時にユーザが辞書の優先
度をなんら意識せずに,適合する訳語を得られる等の利
点がある。
【図面の簡単な説明】
第1図は,本発明による翻訳前処理装置の一実施例を説
明するための全体構戊図,第2図は,本発明の動作説明
をするためのフローチャート,第3図は、翻訳用辞書表
示(編集)画面の一例を示す図である。 1・・・対象文書、10・・・翻訳前処理装置、11・
・・翻訳用辞書(複数)手段,12・・・翻訳用辞書検
索手段、13・・・翻訳用辞書表示・編集手段,14・
・・キーワード抽出手段. 第 1 図 第 ろ 図

Claims (1)

    【特許請求の範囲】
  1. 1、ある言語Aから他の言語Bへの翻訳用の辞書と、入
    力された言語Aの文書から、文書のキーワードとなる1
    個以上の語を選択する選択手段と、選択されたキーワー
    ドの各語について、翻訳用辞書を検索しその結果を表示
    する表示手段と、表示された検索結果を修正する修正手
    段とを有し、修正された結果を翻訳用辞書に登録するこ
    とを特徴とする機械翻訳装置における前処理装置。
JP1301175A 1989-11-20 1989-11-20 機械翻訳装置における前処理装置 Pending JPH03160564A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1301175A JPH03160564A (ja) 1989-11-20 1989-11-20 機械翻訳装置における前処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1301175A JPH03160564A (ja) 1989-11-20 1989-11-20 機械翻訳装置における前処理装置

Publications (1)

Publication Number Publication Date
JPH03160564A true JPH03160564A (ja) 1991-07-10

Family

ID=17893693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1301175A Pending JPH03160564A (ja) 1989-11-20 1989-11-20 機械翻訳装置における前処理装置

Country Status (1)

Country Link
JP (1) JPH03160564A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09231226A (ja) * 1996-02-26 1997-09-05 Nec Corp 機械翻訳用辞書メンテナンス装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09231226A (ja) * 1996-02-26 1997-09-05 Nec Corp 機械翻訳用辞書メンテナンス装置

Similar Documents

Publication Publication Date Title
US20170357642A1 (en) Cross Lingual Search using Multi-Language Ontology for Text Based Communication
JPH05324719A (ja) 文書検索システム
JP2960936B2 (ja) 係り受け解析装置
JPH03160564A (ja) 機械翻訳装置における前処理装置
JPH0343662B2 (ja)
JPS6118074A (ja) プレ・エデイツト方式
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JP4007630B2 (ja) 対訳例文登録装置
JPH03260764A (ja) 翻訳用辞書登録方式
JP2737662B2 (ja) 外国語キーワード文献検索処理装置
JP2715875B2 (ja) 多言語要約生成装置
JPH0561902A (ja) 機械翻訳システム
JP4361143B2 (ja) テキスト翻訳方法と装置
JP4361146B2 (ja) テキスト翻訳装置と記録媒体
JPH0635954A (ja) 機械翻訳機
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JP2786211B2 (ja) 機械翻訳装置における後編集装置
JPH05242141A (ja) 機械翻訳装置
JPH03225468A (ja) 機械翻訳装置
JPS62282364A (ja) 文字列検索方式
JPS6336478A (ja) 訳語のソ−ス辞書表示装置
JPH06266759A (ja) 単語連語翻訳装置
JPS62206669A (ja) 翻訳支援装置
JPH0855121A (ja) 文対応装置及び原文と訳文の対応付け方法
JPH05225232A (ja) テキスト自動前編集装置