JPH0561902A - 機械翻訳システム - Google Patents

機械翻訳システム

Info

Publication number
JPH0561902A
JPH0561902A JP3221467A JP22146791A JPH0561902A JP H0561902 A JPH0561902 A JP H0561902A JP 3221467 A JP3221467 A JP 3221467A JP 22146791 A JP22146791 A JP 22146791A JP H0561902 A JPH0561902 A JP H0561902A
Authority
JP
Japan
Prior art keywords
translation
field
translated
original sentence
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3221467A
Other languages
English (en)
Inventor
Takeshi Mogi
健 茂木
Kenji Hatama
健司 泰間
Kozo Oi
耕三 大井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP3221467A priority Critical patent/JPH0561902A/ja
Publication of JPH0561902A publication Critical patent/JPH0561902A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【構成】 原文入力装置12からの原文が翻訳装置本体
14に送られ、原文のタイプが判断され、原文のタイプ
に応じた解析規則によって、構文・意味解析が行われ
る。また、翻訳処理前に、翻訳装置本体14が辞書22
に含まれるキーワード辞書を用いて、入力された原文の
分野を決定し、システム辞書の訳語の優先順位を決定・
変更し、最優先の訳語を選択する。さらに、翻訳装置本
体14の翻訳不要句抽出部で原文の文頭の文字列と翻訳
不要句パターンテーブルのパターンとを比較して、その
文字列が翻訳不要句か否かを判断し、翻訳不要句なら翻
訳不要句バッファに格納し、残りの原文を翻訳する。そ
の後、訳文出力装置24でその文字列を訳文に付加し
て、同時に出力する。 【効果】 原文のタイプに応じた解析結果が得られ、ま
た、最適な訳語を自動的に選択でき、さらに、簡単に翻
訳作業を行える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は機械翻訳システムに関
し、特にコンピュータを用いて異なる言語間で翻訳する
機械翻訳システムに関する。
【0002】
【従来の技術】機械翻訳の対象となる自然言語文書に
は、一般的な定型文,表題および数式を含む文など様々
なタイプの原文が含まれるが、第1の従来の機械翻訳シ
ステムでは、原文のタイプを考慮せずに、どのタイプの
原文であっても、一律に一般的な文法規則によって構文
・意味解析を行っていた。
【0003】また、第2の従来の機械翻訳システムにお
いては、基本的には原文入力装置により入力された原文
について翻訳装置本体の中で翻訳辞書の訳語や文法など
の情報に従って翻訳処理が施され、訳文出力装置を介し
て出力される。このとき、従来では、翻訳装置本体の中
で、図15に示すように、まずステップS1において入
力処理された原文を、ステップS2の形態素解析処理に
よって単語単位に区切ってそれぞれの品詞を判別し、ス
テップS3の構文・意味解析処理によって、文の構成や
意味の解析を行う。そして、ステップS4の変換処理に
よってその解析結果に沿って文の構造変換や訳語の決定
を行い、最後にステップS5の生成処理によって訳語を
並べて正しい訳文を生成するという流れで翻訳が行われ
る。ここで、翻訳辞書には一般基本語について優先順位
と訳語とが登録されているシステム辞書が含まれるが、
システム辞書の中では、訳語が複数個登録されているも
のについては最も優先順位が高い訳語が一義的に選択さ
れる。したがって、従来の機械翻訳システムによって、
たとえば英語の“address ”という単語から日本語の
「住所」ではなく、専門用語として「番地」という訳語
を得るためには、システム辞書のほかに、科学技術用ま
たはコンピュータ用の専門用語の訳文が登録された分野
別辞書を用意するか、または正しい訳語を引き出すため
予め自分で訳語の優先順位を登録しさらに個人名や会社
名などの固有名詞を登録したユーザ辞書を準備する必要
があった。
【0004】さらに、第3の従来の機械翻訳システムに
よって、たとえば原文「(2) これは本です。」を英文に
翻訳する場合、まず、原文の文頭の「(2) 」という本来
の翻訳処理と無関係な文字列を前編集によって削除し、
「これは本です。」という原文だけを翻訳処理する。そ
して、出力された訳文「This is a book. 」に対して、
後編集によって文頭に「(2) 」を付加し、「(2) This i
s a book. 」とする必要があった。
【0005】
【発明が解決しようとする課題】第1の従来の機械翻訳
システムでは、どのタイプの原文であっても、一律に一
般的な文法規則によって構文・意味解析を行っていたの
で、特定のタイプの原文特に表題やタイトルなどについ
ては、その解析結果がふさわしくないものとなってい
た。
【0006】また、第2の従来の機械翻訳システムによ
って、前述のような専門用語を含んだ文章を翻訳するに
は、分野別辞書やユーザ辞書が必要であった。この改善
策として、原文入力時にオペレータが原文の内容の分野
を指示することで、機械翻訳時に分野による優先情報を
持つ翻訳辞書を用いて翻訳を行う方法も提案されている
(特願昭61−299146号)。しかし、この方法で
は、オペレータに原文の内容の分野が分からない場合や
オペレータにより分野の判断が行えない場合には、分野
による優先情報をまったく利用できないという問題点が
ある。さらに、文の途中からその分野が、オペレータが
最初に指示した分野と異なってくる場合には、訳語の優
先順位が所望のものと全く異なる可能性があるという問
題点があった。
【0007】さらに、第3の従来の機械翻訳システムで
は、原文に翻訳が不要な文字列が含まれている場合に
は、前編集および後編集が必要となり、翻訳作業にかな
りの手間がかかるという問題点があった。それゆえに、
この発明の主たる目的は、原文のタイプに応じて適切な
構文・意味解析を行える、機械翻訳システムを提供する
ことである。
【0008】この発明の他の目的は、少ない辞書によっ
て、機械翻訳処理時に最適な訳語を選択することができ
る、機械翻訳システムを提供することである。さらに、
この発明のその他の目的は、翻訳が不要な文字列を含む
原文であっても、簡単に所望の訳文を得ることができ
る、機械翻訳システムを提供することである。
【0009】
【課題を解決するための手段】第1の発明は、原文を入
力する原文入力手段、原文入力手段によって入力された
原文のタイプを識別するタイプ識別手段、およびタイプ
識別手段によって識別されたタイプに応じて入力された
原文を翻訳する翻訳手段を備える、機械翻訳システムで
ある。
【0010】第2の発明は、翻訳すべき原文を入力した
後に一括して翻訳処理を施す機械翻訳システムであっ
て、原文を入力する原文入力手段、各単語の複数の訳語
に優先順位を付して各単語に対応付けて記憶しているシ
ステム辞書、キーワードの訳語を分野別に分類して記憶
しているキーワード辞書、翻訳に先立ってキーワード辞
書を用いて原文全体に亘ってすべてのキーワードについ
てその訳語の分野を調べる分野検索手段、分野検索手段
によって検索した結果に基づいて訳語の分野のうち最も
多い分野を原文全体の分野と決定する分野決定手段、分
野決定手段によって決定された分野に基づいてシステム
辞書の複数の訳語の優先順位を決定する優先順位決定手
段、および各単語について優先順位決定手段によって決
定された最も優先順位の高い訳語を選択する訳語選択手
段を備える、機械翻訳システムである。
【0011】第3の発明は、翻訳すべき原文の入力に応
じて所定単位毎に逐次翻訳処理を施す機械翻訳システム
であって、原文を入力する原文入力手段、各単語の複数
の訳語に優先順位を付して各単語に対応付けて記憶して
いるシステム辞書、キーワードの訳語を分野別に分類し
て記憶しているキーワード辞書、キーワード辞書を用い
て原文のうち現在翻訳処理を行っている個所までに現れ
たキーワードについてその訳語の分野を調べる分野検索
手段、分野検索手段によって検索した結果に基づいて訳
語の分野のうち最も多い分野を現在翻訳処理を行ってい
る原文の分野と決定する分野決定手段、分野決定手段に
よって決定された分野に基づいて所定単位毎にシステム
辞書の複数の訳語の優先順位を適宜変更する変更手段、
および翻訳処理時に各単語について最も優先順位の高い
訳語を選択する訳語選択手段を備える、機械翻訳システ
ムである。
【0012】第4の発明は、原文の各単語に対応する訳
語や原文を構文・意味解析して訳文を生成するために必
要な情報を記憶した辞書、原文に含まれる翻訳が不要な
文字列のパターンを記憶した翻訳不要句パターンテーブ
ル、文字列を格納する翻訳不要句バッファ、翻訳不要句
パターンテーブル内のパターンと比較することによって
原文から翻訳が不要な文字列を抽出し、抽出した文字列
を翻訳不要句バッファに格納するとともに、原文から文
字列を削除する翻訳不要句抽出手段、文字列を削除した
原文について翻訳辞書を参照して訳文を生成する翻訳処
理手段、および翻訳不要句バッファに格納された文字列
を訳文に付加して出力する訳文出力手段を備える、機械
翻訳システムである。
【0013】
【作用】第1の発明では、タイプ識別手段によって、入
力された原文のタイプが、たとえば普通の文であるか表
題であるかを識別する。原文のタイプが表題であれば、
たとえばメモリに、「表題である」という属性が付さ
れ、原文が格納される。一方、原文のタイプが普通の文
であれば、メモリに「普通の文である」という属性が付
され、原文が格納される。そして、表題および普通の文
に対して、それぞれタイプに応じた適切な解析規則によ
って、構文・意味解析が行われる。
【0014】第2の発明では、原文全体の分野が明らか
な場合には原文を入力する前に、オペレータが予め原文
全体の分野を指定する。ただし、原文全体の分野が明ら
かでない場合やその他の場合にはオペレータは何も分野
を指定しなくてもよい。原文入力手段によって翻訳すべ
き原文を入力すると、分野検索手段がキーワード辞書を
用いて原文全体の分野を調べることによって、もし前も
って分野が指定されていればその分野よりさらに細かい
レベルの分野を特定でき、また、オペレータが予め何も
指定しないときでも分野を特定する。その結果に応じて
分野決定手段が分野を決定すると、優先順位決定手段に
よって、翻訳処理前に、システム辞書の複数の訳語の優
先順位が決定される。したがって、選択手段は、翻訳処
理時にシステム辞書から各単語について最も優先順位の
高いすなわち原文全体の分野に適した訳語を選択する。
【0015】第2の発明は原文をすべて入力した後一括
処理するものであるが、第3の発明では、原文入力に応
じて逐次処理を行う。そこで、分野検索手段は、キーワ
ード辞書を用いて現在翻訳処理を行っている個所までの
原文の分野を調べ、決定する。この分野に基づいて、変
更手段が、オペレータの指定の有無にかかわらず、所定
単位毎にシステム辞書の複数の訳語の優先順位が変更さ
れていく。
【0016】第4の発明では、翻訳不要句抽出手段にお
いて、翻訳不要句パターンテーブル中のパターンと原文
のたとえば文頭の文字列とが一致するか否かを判断す
る。両者が一致すれば、一致した原文の文頭の文字列を
翻訳不要句バッファに格納し、一致した文字列を原文か
ら削除する。一方、両者が一致しなければ、翻訳不要句
バッファには何も格納されず空の状態となる。次いで、
翻訳不要句バッファが空であるか否かを判断し、翻訳不
要句バッファが空であれば、訳文出力手段によって翻訳
処理手段で生成された訳文をそのまま出力する。一方、
翻訳不要句バッファが空でなく文字列が格納されていれ
ば、訳文出力手段によってその文字列を翻訳処理手段で
生成された訳文の文頭に付加して出力する。
【0017】
【発明の効果】第1の発明によれば、原文のタイプに応
じて適切な解析結果を得ることができる。第2および第
3の発明によれば、分野別辞書を用いることなく総じて
少ない辞書で、機械翻訳処理時に最適な訳語を自動的に
選択でき、機械翻訳処理後に訳語の誤りに伴うオペレー
タの修正処理を著しく軽減できる。
【0018】第4の発明によれば、翻訳が不要な文字列
が存在する原文を翻訳する場合でも、翻訳作業における
前編集および後編集をすることなく、簡単に正しい訳文
を作成することができる。この発明の上述の目的,その
他の目的,特徴および利点は、図面を参照して行う以下
の実施例の詳細な説明から一層明らかとなろう。
【0019】
【実施例】図1を参照して、この実施例の機械翻訳シス
テム10は、原文入力装置12を含む。原文入力装置1
2からの原文は翻訳装置本体14に送られる。翻訳装置
本体14には、たとえば図2に示すような構成のメモリ
16が内蔵される。メモリ16は、表題であることを表
す属性を格納するための領域18および入力文を格納す
るための領域20を含む。そして、領域20に格納され
た原文は、翻訳辞書22を用いて翻訳され、その訳文は
訳文出力装置24から出力される。
【0020】動作において、原文入力装置12から原文
を入力すると、図3に示すように、ステップS11にお
いて原文のタイプが識別される。そして、原文のタイプ
が表題の場合には、図4(a)に示すように、領域18
に表題であることを示す属性「1」が格納され、領域2
0に原文が格納される。一方、入力文のタイプが普通の
文の場合には、図4(b)に示すように、領域18に表
題でないことを示す属性「0」が格納され、領域20に
原文が格納される。
【0021】そして、解析規則はif−then形式で
記述されており、図5(a)に示すように、表題のため
の解析規則においては、if部で表題を示す属性値がチ
ェックされる。このように表題を示す属性値をチェック
することによって、原文のタイプが表題の場合には、図
3に示すステップS13において表題のための解析規則
による解析が適用され、さらにステップS15において
一般的な解析規則による解析が適用される。一方、表題
でない普通の文の場合には、ステップS15において一
般的な解析規則による解析だけが適用される。このよう
にして、原文のタイプに適応した解析を行う。
【0022】以下一例として、英語文書に含まれる表題
の解析処理例を示す。英語には、複数の品詞の用法を持
つ多品詞語が多数存在するが、これらの品詞を決定する
ことが、英語解析における重要な課題の1つとなってい
る。次に示すのは、多品詞語を含む表題の例である。 1.Exexcution of Rewite Commands. 2.Various Access Conflicts in Multiport Memorie
s. 注)下線部が動詞/名詞の多品詞語 一般的な解析規則では、文としての解釈を優先するた
め、下線部を動詞と判断する。すなわち、主語+動詞の
並びであると判断する。その結果、以下の日本語表現で
表すような解析結果となる。
【0023】1.Exexcution of Rewite Commands. → 書き換えの実行は命令する。 2.Various Access Conflicts in Multiport Memorie
s. → 各種のアクセスはマルチポートのメモリにおいて
突する。 これが通常の文中に現れたのであれば、この解釈で正し
いかもしれない。しかし、表題であることを考慮する
と、CommandsやConflictsは名詞として用いられている
と判断した方が適切である。
【0024】そこで、表題には名詞が多いということを
考慮して、図5(b)に示すような表題であることを考
慮した多品詞語の解消規則を作成する。この規則は、i
f部で、表題を示す属性値をチェックするようにしてい
るので、表題と判断された原文に対してのみ適用され
る。したがって、上記の表題の例にこの規則を適用する
ことによって、CommandsやConflicts は名詞と判断さ
れ、以下に示すような適切な解析結果を得ることができ
る。
【0025】1.Exexcution of Rewite Commands. → 書き換え命令の実行 2.Various Access Conflicts in Multiport Memorie
s. → マルチポートのメモリにおける各種のアクセス衝突 このように、英語表題中の多品詞語を解消する場合、表
題であるという特徴を考慮した解析が有効であることが
分かる。
【0026】なお、実施例においては、辞書22は、一
般基本語が登録されたシステム辞書,カテゴリ別に分類
されたキーワード辞書および固有名詞等予めオペレータ
が訳語を登録したユーザ辞書を含む。そして、たとえば
英語から日本語へ翻訳する場合には、辞書22に含まれ
るシステム辞書には、表1および表2に示す内容が登録
される。すなわち、訳語情報のほかに、分野に関する情
報と優先順位に関する情報が登録される。なお、分野に
関する情報はさらに細かく分類して登録することもでき
る。
【0027】
【表1】
【0028】
【表2】 たとえば、“performance ”という英語は一般的には
「実行」という訳文が対応するが、科学技術分野では、
「性能」という訳語が、そして芸術の分野では「公演」
という訳語が対応する。動作において注目すべきは、入
力処理前に訳語優先順位指定処理を施し、さらに、入力
処理と形態素解析処理との間に訳語優先順位変更処理を
施す点である。
【0029】動作を図6を参照して説明すると、まずス
テップS17において訳語優先順位指定処理が施され
る。訳語優先順位指定処理は、システム辞書において入
力された原文に含まれる各単語に対応する複数訳語の優
先順位を翻訳処理前に設定するものであり、たとえば図
7に示すように、原文入力前の初期画面で、オペレータ
が翻訳する文書ファイル名とともに分野名の指定を行う
ことによって対応する訳語の優先順位が決定される。た
だし、文書ファイル名および分野名が不明なときは、オ
ペレータは何も指定しない。すなわち、翻語優先順位指
定処理は施されない。次いで、ステップS19において
原文を入力する入力処理が施され、入力処理が完了すれ
ば、ステップS21において訳語優先順位変更処理が施
される。訳語優先順位変更処理によって、翻訳装置本体
14が辞書22を用いて入力された原文全体に亘ってす
べてのキーワード(前置詞,接続詞,冠詞など文の分野
を特定しない単語はキーワードとして除く)についてそ
れらの訳語の分野を調べ、最も多い分野を入力された原
文全体の分野と決定する。これにより、予め指定した分
野よりさらに細かい分類の分野を特定でき、また、オペ
レータが予め何も指定しないときでも分野を特定でき
る。たとえば、訳語優先順位指定処理によってオペレー
タが予め、科学,経済および芸術等のうち「経済」を指
定したとすれば、訳語優先順位変更処理によって翻訳装
置本体14が「経済」のうちさらに「為替」や「金融」
等まで設定し得る。そして、決定された原文全体の分野
に基づいて、システム辞書の各単語の訳語の優先順位が
変更される。そして、ステップS23において原文を単
語単位で区切りそれぞれの品詞を判別する形態素解析処
理が施され、次にステップS25において文の構成や意
味の解析を行う構文・意味解析処理が施され、ステップ
S27においてその解析結果に沿って文の構造変換や訳
語の決定を行う変換処理が施される。このとき、優先順
位の最も高い訳語が選択される。最後にステップS29
において訳語を並べて正しい訳文を生成する生成処理が
施される。そしてステップS17に戻り、上述の動作が
繰り返される。
【0030】ただし、訳語優先順位変更処理は、必ずし
も入力された原文全体に亘って行う必要はない。すなわ
ち、たとえば入力された原文が全体で4段落で構成され
ているとすれば、そのうちの最初の3段落と最後の1段
落とについて別々に訳語優先順位変更処理を施してもよ
い。これにより、より正確に原文の分野を決定でき、訳
語の優先順位が分野によって自動的に変更されるので、
原文の分野が、文の途中で最初に指定した分類と異なる
分野に変化しても柔軟に対応できる。なお、該当する分
野の訳文が存在しなければ、変更されない状態の優先順
位で訳語が選択される。
【0031】また、表2に示すように、“life”という
単語は、「生命」「人生」「暮らし」という訳語が文脈
によって考えられるが、システム辞書の中で「生命」と
いう訳語の優先順位が一番高ければ結果として、「生
命」という訳語が最優先で出力される。そこで、図8に
示すように、原文Pを入力中にカーソルCで単語を指定
し、原文入力装置12の訳語キー(図示せず)を押す
と、画面下に左より優先順位の高い順に訳語が表示され
るので、所望の訳語を選択する。そして、原文入力装置
12の登録キー(図示せず)を押すと、その訳語の優先
順位が最も高くなり、その他の訳語の優先順位も同時に
変更される。たとえば、「暮らし」という訳語を選択し
て登録キーを押すと、「暮らし」の優先度が“1”に、
「生命」の優先度が“2”に、「人生」の優先度が
“3”になり、以降この優先順位で翻訳処理が行われ
る。したがって、その後では、“life”という単語に対
しては、「暮らし」という訳語が最優先で出力される。
【0032】また、翻訳すべき原文の入力に応じて、オ
ペレータの指定によってたとえば一文毎,一文節毎また
は一文書毎といった所定単位毎に逐次翻訳処理を施す場
合、その動作は以下のようになる。まず、訳語優先順位
指定処理が施される。たとえば図9に示すように、原文
入力前の初期画面で、オペレータが翻訳する文書ファイ
ル名とともに分野名の指定を行う。ただし、文書ファイ
ル名および分野名が不明なときは、オペレータは何も指
定しない。次いで、原文を入力する入力処理を施す。す
ると、訳語優先順位変更処理によって翻訳装置本体14
がキーワード辞書を用いて入力された原文のうち現在翻
訳処理を行っている個所までに現れたキーワードについ
て、その訳語の分野を調べ、最も多い分野を現在翻訳処
理を行っている原文の分野と決定する。そして、その分
野に基づいて、オペレータの指定の有無にかかわらず、
所定単位毎にシステム辞書の複数の訳語の優先順位が適
宜変更される。その後、形態素解析処理,構文・意味解
析処理が施され、変換処理によって優先順位の最も高い
訳語が選択され、最後に生成処理が施される。このよう
な処理が原文の入力に従って繰り返され、自動的に分野
を逐次変更する。この実施例では、原文を入力中に即座
に翻訳可能と機械翻訳システム10が判断すれば、ほぼ
リアルタイムで訳文を出力することもできる。
【0033】なお、図9に示す“分野学習”について
「NO」を選択すれば、上述の訳語優先順位変更処理は
行われず、翻訳装置本体14がどのように判断しよう
が、当初オペレータが訳語優先順位指定処理で指定した
分野のみで訳語の優先順位が決意され、翻訳処理され
る。一方、“分野学習”について「YES」を選択すれ
ば、上述のように訳語優先順位変更処理が行われる。
【0034】このように、この実施例では、訳語の優先
順位がその時点で最適と思われる分野に自動的に変更さ
れるので、原文中の分野の変更等に対してより柔軟に対
応することができる。また、上述の実施例において、原
文の分野が変化したことをオペレータがわかる場合に
は、適宜、オペレータが翻語優先順位指定処理を行うこ
とによって迅速に対応できる。さらに、従来のように分
野別辞書を用いず、またユーザ辞書にしても優先順位を
特定した訳語を登録する必要はないので、総じて少ない
辞書で翻訳処理ができる。
【0035】さらに、図10に示す実施例の機械翻訳シ
ステム10では、翻訳装置本体14は翻訳不要句パター
ンテーブル42を含む。翻訳不要句パターンテーブル4
2は原文の文頭において翻訳が不要な文字列のパターン
を有し、その内容は図11に示すような文字列のパター
ンが複数記述されている。たとえば、エリア44のパタ
ーンは、先頭が“(”であり、2文字目が数字であり、
次の文字列が0個以上の連続した数字であり、その次の
文字が“)”であるパターンを示す。エリア46のパタ
ーンは、先頭が“(”であり、2文字目が英字1文字で
あり、その次の文字が“)”であるパターンを示す。さ
らに、エリア48のパターンは、先頭が“〔”であり、
2文字目が数字であり、次の文字列が0個以上の連続し
た数字であり、その次の文字が“〕”であるパターンを
示す。エリア50のパターンは、見出しに付されるたと
えば“1.1”や“1.2”などの番号を示す。さらに
“num ”,“alph”,“*”以外の“(”“)”
や“〔”“〕”なども、翻訳不要句パターンテーブル4
2に記述されている。また、翻訳装置本体14は、原文
の文頭の翻訳が不要な文字列を格納する翻訳不要句バッ
ファ52を含む。そして、翻訳不要句抽出部54によっ
て、翻訳不要句パターンテーブル42を参照して原文の
文頭から翻訳が不要な文字列を抽出し、抽出した文字列
を翻訳不要句バッファ52に格納するとともに、抽出し
た文字列を原文から削除する。次いで、翻訳処理部56
によって辞書22を参照しながら、目標言語の訳文を生
成する。そして、翻訳不要句バッファ52に格納されて
いる文字列を、翻訳処理部56により生成された訳文の
文頭に付加して、翻訳出力装置24から所望の訳文が出
力される。
【0036】動作において、図12に示すように、まず
ステップS31において翻訳不要句パターンテーブル4
2中の翻訳不要句パターンと原文の文頭の文字列とが一
致するか否かを判断する。両者が一致する場合には、ス
テップS33において一致した文字列を抽出して翻訳不
要句バッファ52に格納し、原文から一致した文字列を
削除して終了する。一方、両者が一致しない場合には、
ステップS35において翻訳不要句バッファ52を空に
して終了する。
【0037】次に、図13に示すように、ステップS3
7において翻訳不要句バッファ52が空であるかどうか
を判断する。翻訳不要句バッファ52が空であれば、ス
テップS39において翻訳処理部56で生成された訳文
をそのまま出力し、終了する。一方、翻訳不要句バッフ
ァ52が空でなければ、ステップS41において翻訳不
要句バッファ52に格納されている文字列を、翻訳処理
部56で生成された訳文の文頭に付加して、翻訳出力装
置24から出力し、終了する。
【0038】次に、具体例として、原文「(2) これは本
です。」を英文に翻訳する場合の翻訳不要句抽出部5
4,翻訳処理部56および翻訳出力装置24の動作を説
明する。まず、翻訳不要句抽出部54では、原文中の文
頭の文字列が翻訳不要句パターンテーブル42中のパタ
ーンと一致するか否かを調べる。この具体例では、
「(2) 」の文字列が、図11に示す翻訳不要句パターン
中のエリア44のパターンと一致するので、文字列
「(2) 」を翻訳不要句バッファ52に格納し、原文から
一致した文字列「(2) 」を削除する。
【0039】そして、翻訳処理部56では、文字列が削
除された原文について、辞書22を参照しながら、訳文
「This is a book. 」を生成する。そして、翻訳出力装
置24では、翻訳不要句バッファ52が空であるか否か
を調べる。この具体例では、翻訳不要句バッファ52は
空ではなく文字列「(2) 」が格納されているので、文字
列「(2) 」を翻訳処理部56で生成された訳文「This i
s a book. 」の文頭に付加し、たとえば図14に示すよ
うに、画面に「(2)This is abook. 」と表示して終了す
る。
【0040】なお、この実施例は、原文の文頭の文字列
が翻訳不要句であるか否かを判断し、処理するものであ
ったが、この発明は原文の文頭以外の文字列にも適用し
得る。
【図面の簡単な説明】
【図1】この発明の一実施例を示すブロック図である。
【図2】原文を格納するメモリを示す図解図である。
【図3】原文のタイプに応じた解析処理を示すフロー図
である。
【図4】メモリに表題の属性が示されている状態を示す
図解図である。
【図5】表題の解析規則を示す図解図である。
【図6】機械翻訳処理方法を示すフロー図である。
【図7】訳語優先順位指定処理時の画面表示の一態様を
模式的に示す図解図である。
【図8】原文入力時の画面表示を模式的に示す図解図で
ある。
【図9】訳語優先順位指定処理時の画面表示の一態様を
模式的に示す図解図である。
【図10】この発明の他の実施例を示すブロック図であ
る。
【図11】翻訳不要句パターンテーブルの内容を示す図
解図である。
【図12】翻訳不要句抽出部の動作を示すフロー図であ
る。
【図13】訳文出力装置の動作を示すフロー図である。
【図14】訳文出力装置における出力結果の一例を示す
図解図である。
【図15】従来技術の機械翻訳処理方法を示すフロー図
である。
【符号の説明】
10 …機械翻訳システム 12 …原文入力装置 14 …翻訳装置本体 16 …メモリ 22 …辞書 24 …訳文出力装置 42 …翻訳不要句パターンテーブル 52 …翻訳不要句バッファ 54 …翻訳不要句抽出部 56 …翻訳処理部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】原文を入力する原文入力手段、 前記原文入力手段によって入力された原文のタイプを識
    別するタイプ識別手段、および前記タイプ識別手段によ
    って識別されたタイプに応じて前記入力された原文を翻
    訳する翻訳手段を備える、機械翻訳システム。
  2. 【請求項2】翻訳すべき原文を入力した後に一括して翻
    訳処理を施す機械翻訳システムであって、 原文を入力する原文入力手段、 各単語の複数の訳語に優先順位を付して前記各単語に対
    応付けて記憶しているシステム辞書、 キーワードの訳語を分野別に分類して記憶しているキー
    ワード辞書、 翻訳に先立って前記キーワード辞書を用いて前記原文全
    体に亘ってすべてのキーワードについてその訳語の分野
    を調べる分野検索手段、 前記分野検索手段によって検索した結果に基づいて前記
    訳語の分野のうち最も多い分野を前記原文全体の分野と
    決定する分野決定手段、 前記分野決定手段によって決定された前記分野に基づい
    て前記システム辞書の複数の訳語の優先順位を決定する
    優先順位決定手段、および前記各単語について前記優先
    順位決定手段によって決定された最も優先順位の高い訳
    語を選択する訳語選択手段を備える、機械翻訳システ
    ム。
  3. 【請求項3】翻訳すべき原文の入力に応じて所定単位毎
    に逐次翻訳処理を施す機械翻訳システムであって、 原文を入力する原文入力手段、 各単語の複数の訳語に優先順位を付して前記各単語に対
    応付けて記憶しているシステム辞書、 キーワードの訳語を分野別に分類して記憶しているキー
    ワード辞書、 前記キーワード辞書を用いて前記原文のうち現在翻訳処
    理を行っている個所までに現れたキーワードについてそ
    の訳語の分野を調べる分野検索手段、 前記分野検索手段によって検索した結果に基づいて前記
    訳語の分野のうち最も多い分野を現在翻訳処理を行って
    いる原文の分野と決定する分野決定手段、 前記分野決定手段によって決定された前記分野に基づい
    て前記所定単位毎に前記システム辞書の複数の訳語の優
    先順位を適宜変更する変更手段、および翻訳処理時に前
    記各単語について最も優先順位の高い訳語を選択する訳
    語選択手段を備える、機械翻訳システム。
  4. 【請求項4】予め前記原文全体の分野を指定する分野指
    定手段を備え、前記分野指定手段によって比較的大きい
    分野を指定し、前記分野決定手段によって比較的細かい
    分野を決定するようにした、請求項2または3記載の機
    械翻訳システム。
  5. 【請求項5】原文の各単語に対応する訳語や前記原文を
    構文・意味解析して訳文を生成するために必要な情報を
    記憶した辞書、 前記原文に含まれる翻訳が不要な文字列のパターンを記
    憶した翻訳不要句パターンテーブル、 前記文字列を格納する翻訳不要句バッファ、 前記翻訳不要句パターンテーブル内の前記パターンと比
    較することによって前記原文から翻訳が不要な前記文字
    列を抽出し、抽出した前記文字列を前記翻訳不要句バッ
    ファに格納するとともに、前記原文から前記文字列を削
    除する翻訳不要句抽出手段、 前記文字列を削除した前記原文について前記翻訳辞書を
    参照して訳文を生成する翻訳処理手段、および前記翻訳
    不要句バッファに格納された前記文字列を前記訳文に付
    加して出力する訳文出力手段を備える、機械翻訳システ
    ム。
JP3221467A 1991-09-02 1991-09-02 機械翻訳システム Pending JPH0561902A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3221467A JPH0561902A (ja) 1991-09-02 1991-09-02 機械翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3221467A JPH0561902A (ja) 1991-09-02 1991-09-02 機械翻訳システム

Publications (1)

Publication Number Publication Date
JPH0561902A true JPH0561902A (ja) 1993-03-12

Family

ID=16767176

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3221467A Pending JPH0561902A (ja) 1991-09-02 1991-09-02 機械翻訳システム

Country Status (1)

Country Link
JP (1) JPH0561902A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6892190B2 (en) 2000-09-20 2005-05-10 International Business Machines Corporation Method and apparatus for machine translation and recording medium
JP2011221992A (ja) * 2004-09-15 2011-11-04 Apple Inc リアルタイムデータローカライズ
JP2013540304A (ja) * 2010-08-26 2013-10-31 グーグル・インコーポレーテッド 入力テキスト文字列の変換
JP2016139337A (ja) * 2015-01-28 2016-08-04 日本電信電話株式会社 テキスト変換装置、方法、及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6892190B2 (en) 2000-09-20 2005-05-10 International Business Machines Corporation Method and apparatus for machine translation and recording medium
JP2011221992A (ja) * 2004-09-15 2011-11-04 Apple Inc リアルタイムデータローカライズ
JP2013540304A (ja) * 2010-08-26 2013-10-31 グーグル・インコーポレーテッド 入力テキスト文字列の変換
US10133737B2 (en) 2010-08-26 2018-11-20 Google Llc Conversion of input text strings
JP2016139337A (ja) * 2015-01-28 2016-08-04 日本電信電話株式会社 テキスト変換装置、方法、及びプログラム

Similar Documents

Publication Publication Date Title
US5109509A (en) System for processing natural language including identifying grammatical rule and semantic concept of an undefined word
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JP2002215617A (ja) 品詞タグ付けをする方法
JPH05314166A (ja) 電子化辞書および辞書検索装置
JPH0561902A (ja) 機械翻訳システム
JP2838984B2 (ja) 汎用参照装置
JP3085394B2 (ja) 複数文翻訳における訳語選択方法およびこれを用いた機械翻訳システム
JPS61248160A (ja) 文書情報登録方式
JPH06348751A (ja) 言語変換装置
JP4007630B2 (ja) 対訳例文登録装置
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2020079749A1 (ja) 事例検索方法
JPH0320866A (ja) テキストベース検索方式
JPH0827803B2 (ja) テキストベース検索方法
JP2839419B2 (ja) イディオム登録機能を持つ機械翻訳装置
JP4023384B2 (ja) 自然言語翻訳方法及び装置及び自然言語翻訳プログラム
JPH03229367A (ja) テキストベース検索方式
JP2752025B2 (ja) 機械翻訳装置
JP3884001B2 (ja) 言語解析システムおよび方法
JP3313810B2 (ja) アスペクト処理装置
JP2819766B2 (ja) 外国語電子辞書検索方式
JP5032453B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP3281361B2 (ja) 文書検索装置及び文書検索方法
JPH05225232A (ja) テキスト自動前編集装置
JPH02208775A (ja) 機械翻訳方式

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000321