JPH0944504A - 翻訳方法及び機械翻訳装置 - Google Patents
翻訳方法及び機械翻訳装置Info
- Publication number
- JPH0944504A JPH0944504A JP7192018A JP19201895A JPH0944504A JP H0944504 A JPH0944504 A JP H0944504A JP 7192018 A JP7192018 A JP 7192018A JP 19201895 A JP19201895 A JP 19201895A JP H0944504 A JPH0944504 A JP H0944504A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- word
- field
- language
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】 未翻訳の文書の大意を文書全部を翻訳するこ
となく簡単に把握する。 【構成】 第1の言語で用いられる各単語が予め定めら
れた複数の分野のうちのどの分野に所属するかを記憶す
る分野別単語データベース21と、第1の言語で記述さ
れた文書に含まれる各単語の所属分野を分野別単語デー
タベースを用いて分類する単語分類手段9と、複数の分
野のうち多くの単語が分類された分野を指定する分野指
定手段10と、単語分類手段にて各分野に分類され単語
のうち分野指定手段で指定された分野に所属する単語を
含む文を前記入力された文書から抽出する文抽出手段1
2と、文抽出手段にて抽出された文を第2の言語に翻訳
する部分翻訳手段13とを備えている。
となく簡単に把握する。 【構成】 第1の言語で用いられる各単語が予め定めら
れた複数の分野のうちのどの分野に所属するかを記憶す
る分野別単語データベース21と、第1の言語で記述さ
れた文書に含まれる各単語の所属分野を分野別単語デー
タベースを用いて分類する単語分類手段9と、複数の分
野のうち多くの単語が分類された分野を指定する分野指
定手段10と、単語分類手段にて各分野に分類され単語
のうち分野指定手段で指定された分野に所属する単語を
含む文を前記入力された文書から抽出する文抽出手段1
2と、文抽出手段にて抽出された文を第2の言語に翻訳
する部分翻訳手段13とを備えている。
Description
【0001】
【産業上の利用分野】本発明は、入力された文書を翻訳
する翻訳方法とこの翻訳方法を採用した機械翻訳装置に
係わり、特に、翻訳対象文書の大意を文書全部を翻訳す
ることなく簡単に把握できる翻訳方法及び機械翻訳装置
に関する。
する翻訳方法とこの翻訳方法を採用した機械翻訳装置に
係わり、特に、翻訳対象文書の大意を文書全部を翻訳す
ることなく簡単に把握できる翻訳方法及び機械翻訳装置
に関する。
【0002】
【従来の技術】一つの言語で記述された文書を他の言語
の文書に自動的に翻訳する機械翻訳装置においては、翻
訳対象文書を構成する各文を先頭から順番に取り込んで
いって、各文を同一意味を有する他の言語の文に翻訳す
る。このように、文書全体を1文単位に分割して、各文
毎にそれぞれ個別に翻訳する。
の文書に自動的に翻訳する機械翻訳装置においては、翻
訳対象文書を構成する各文を先頭から順番に取り込んで
いって、各文を同一意味を有する他の言語の文に翻訳す
る。このように、文書全体を1文単位に分割して、各文
毎にそれぞれ個別に翻訳する。
【0003】したがって、例えば母国語以外の国の言葉
で記載された文書の意味を母国語で理解しようとする
と、この文書全部を機械翻訳装置で母国語に翻訳して、
この翻訳文を読む。
で記載された文書の意味を母国語で理解しようとする
と、この文書全部を機械翻訳装置で母国語に翻訳して、
この翻訳文を読む。
【0004】
【発明が解決しようとする課題】しかしながら、膨大な
数の母国語以外の言語で記述された文書があり、この膨
大な数の文書から、自己の必要な情報が記載された文書
を選択する場合においては、この膨大な数の文書を全て
母国語に翻訳して読む必要がある。
数の母国語以外の言語で記述された文書があり、この膨
大な数の文書から、自己の必要な情報が記載された文書
を選択する場合においては、この膨大な数の文書を全て
母国語に翻訳して読む必要がある。
【0005】上述したように、全ての文書が自己に必要
な情報が記載された文書ではないので、全ての文書を機
械翻訳装置で翻訳すると、結果的に多大の無駄な翻訳を
実行することになり、多大の翻訳処理時間が必要であっ
た。
な情報が記載された文書ではないので、全ての文書を機
械翻訳装置で翻訳すると、結果的に多大の無駄な翻訳を
実行することになり、多大の翻訳処理時間が必要であっ
た。
【0006】さらに、たとえ自己に必要な情報が記載さ
れた文書であったとしても、文書の詳細情報が必要でな
く、文書の大意が理解できれば十分である場合もある。
しかし、このような場合においても、文書の大意を把握
するに必要でない例えば実験結果や謝辞や参考文献等も
翻訳してしまう。よって、この翻訳文書から大意を読取
るためにはやはり多大の時間と労力が必要であった。
れた文書であったとしても、文書の詳細情報が必要でな
く、文書の大意が理解できれば十分である場合もある。
しかし、このような場合においても、文書の大意を把握
するに必要でない例えば実験結果や謝辞や参考文献等も
翻訳してしまう。よって、この翻訳文書から大意を読取
るためにはやはり多大の時間と労力が必要であった。
【0007】なお、このような不都合を解消するため
に、文書要約システムと機械翻訳装置とを組合わせて、
文書要約システムで要約された未翻訳の文書を機関翻訳
装置で翻訳することが考えらる。しかし、この文書を自
動的に要約する処理は多大の時間が必要である。したが
って、早急に大意のみを必要とする要望には対応できな
い。
に、文書要約システムと機械翻訳装置とを組合わせて、
文書要約システムで要約された未翻訳の文書を機関翻訳
装置で翻訳することが考えらる。しかし、この文書を自
動的に要約する処理は多大の時間が必要である。したが
って、早急に大意のみを必要とする要望には対応できな
い。
【0008】本発明はこのような事情に鑑みてなされた
ものであり、重要な特定の文又は文章のみを自動的に抽
出して部分翻訳することによって、未翻訳文書の記載内
容の大意を短時間でかつ簡単に把握できる翻訳方法及び
機械翻訳装置を提供することを目的とする。
ものであり、重要な特定の文又は文章のみを自動的に抽
出して部分翻訳することによって、未翻訳文書の記載内
容の大意を短時間でかつ簡単に把握できる翻訳方法及び
機械翻訳装置を提供することを目的とする。
【0009】
【課題を解決するための手段】上記課題を解消するため
に本発明の請求項1の翻訳方法においては、入力された
第1の言語で記述された文書に含まれる各単語を予め定
められた複数の分野のうちの該当単語が所属する分野に
分類し、多くの単語が分類された分野を指定し、各分野
に分類された単語のうち指定した分野に所属する単語を
含む文を入力された文書から抽出し、この抽出された文
を第2の言語に翻訳する。
に本発明の請求項1の翻訳方法においては、入力された
第1の言語で記述された文書に含まれる各単語を予め定
められた複数の分野のうちの該当単語が所属する分野に
分類し、多くの単語が分類された分野を指定し、各分野
に分類された単語のうち指定した分野に所属する単語を
含む文を入力された文書から抽出し、この抽出された文
を第2の言語に翻訳する。
【0010】また、請求項2の発明は、入力された第1
の言語で記述された文書の各文を第2の言語に翻訳する
機械翻訳装置において、第1の言語で用いられる各単語
が予め定められた複数の分野のうちのどの分野に所属す
るかを記憶する分野別単語データベースと、第1の言語
で記述された文書に含まれる各単語の所属分野を分野別
単語データベースを用いて分類する単語分類手段と、複
数の分野のうち多くの単語が分類された分野を指定する
分野指定手段と、単語分類手段にて各分野に分類され単
語のうち分野指定手段で指定された分野に所属する単語
を含む文を入力された文書から抽出する文抽出手段と、
文抽出手段にて抽出された文を第2の言語に翻訳する部
分翻訳手段とを備えている。
の言語で記述された文書の各文を第2の言語に翻訳する
機械翻訳装置において、第1の言語で用いられる各単語
が予め定められた複数の分野のうちのどの分野に所属す
るかを記憶する分野別単語データベースと、第1の言語
で記述された文書に含まれる各単語の所属分野を分野別
単語データベースを用いて分類する単語分類手段と、複
数の分野のうち多くの単語が分類された分野を指定する
分野指定手段と、単語分類手段にて各分野に分類され単
語のうち分野指定手段で指定された分野に所属する単語
を含む文を入力された文書から抽出する文抽出手段と、
文抽出手段にて抽出された文を第2の言語に翻訳する部
分翻訳手段とを備えている。
【0011】また、請求項3の発明は、上述した請求項
2の機械翻訳装置に対して、単語分類手段にて各分野毎
に該当分野に分類された単語の数を計数する単語数計数
手段を備え、かつ分野指定手段は、単語数計数手段にて
計数された単語の数に基づいて分野を指定するようにし
ている。
2の機械翻訳装置に対して、単語分類手段にて各分野毎
に該当分野に分類された単語の数を計数する単語数計数
手段を備え、かつ分野指定手段は、単語数計数手段にて
計数された単語の数に基づいて分野を指定するようにし
ている。
【0012】請求項4の発明は、入力された第1の言語
で記述された文書の各文を第2の言語に翻訳する機械翻
訳装置において、第1の言語で用いられる各単語が予め
定められた複数の分野のうちのどの分野に所属するかを
記憶する分野別単語データベースと、第1の言語で記述
された文書に含まれる各単語の所属分野を分野別単語デ
ータベースを用いて分類する単語分類手段と、複数の分
野のうち多くの単語が分類された分野を指定する分野指
定手段と、単語分類手段にて各分野に分類された単語の
うち分野指定手段で指定された分野に所属する単語を抽
出する単語抽出手段と、この単語抽出手段で抽出された
単語のうち特定の単語を指定する単語指定手段と、この
単語指定手段にて指定された単語を含む文を入力された
文書から抽出する文抽出手段と、この文抽出手段にて抽
出された文を前記第2の言語に翻訳する部分翻訳手段と
を備えている。
で記述された文書の各文を第2の言語に翻訳する機械翻
訳装置において、第1の言語で用いられる各単語が予め
定められた複数の分野のうちのどの分野に所属するかを
記憶する分野別単語データベースと、第1の言語で記述
された文書に含まれる各単語の所属分野を分野別単語デ
ータベースを用いて分類する単語分類手段と、複数の分
野のうち多くの単語が分類された分野を指定する分野指
定手段と、単語分類手段にて各分野に分類された単語の
うち分野指定手段で指定された分野に所属する単語を抽
出する単語抽出手段と、この単語抽出手段で抽出された
単語のうち特定の単語を指定する単語指定手段と、この
単語指定手段にて指定された単語を含む文を入力された
文書から抽出する文抽出手段と、この文抽出手段にて抽
出された文を前記第2の言語に翻訳する部分翻訳手段と
を備えている。
【0013】さらに、請求項5の発明は、入力された第
1の言語で記述された文書の各文を第2の言語に翻訳す
る機械翻訳装置において、入力された第1の言語の文書
に含まれる図表の説明を意味する特定語句を検出する特
定語句検出手段と、特定語句検出手段にて検出された特
定語句を含む文を入力された文書から抽出する文抽出手
段と、文抽出手段にて抽出された文を前記第2の言語に
翻訳する部分翻訳手段とを備えている。
1の言語で記述された文書の各文を第2の言語に翻訳す
る機械翻訳装置において、入力された第1の言語の文書
に含まれる図表の説明を意味する特定語句を検出する特
定語句検出手段と、特定語句検出手段にて検出された特
定語句を含む文を入力された文書から抽出する文抽出手
段と、文抽出手段にて抽出された文を前記第2の言語に
翻訳する部分翻訳手段とを備えている。
【0014】請求項6の発明は、入力された第1の言語
で記述された文書の各文を第2の言語に翻訳する機械翻
訳装置において、入力された第1の言語の文書に含まれ
る見出し部分を検出する見出し部分検出手段と、この見
出し部分検出手段にて検出された見出し部分に含まれる
文を入力された文書から抽出する文抽出手段と、文抽出
手段にて抽出された文を第2の言語に翻訳する部分翻訳
手段とを備えている。
で記述された文書の各文を第2の言語に翻訳する機械翻
訳装置において、入力された第1の言語の文書に含まれ
る見出し部分を検出する見出し部分検出手段と、この見
出し部分検出手段にて検出された見出し部分に含まれる
文を入力された文書から抽出する文抽出手段と、文抽出
手段にて抽出された文を第2の言語に翻訳する部分翻訳
手段とを備えている。
【0015】さらに、請求項7の発明は、入力された第
1の言語で記述された文書の各文を第2の言語に翻訳す
る機械翻訳装置において、入力された第1の言語の文書
における各文章相互間の区切りを検出する文章区切り検
出手段と、第1の言語の文書に含まれる文章の役割を意
味する特定語句を検出する特定語句検出手段と、入力さ
れた文書から、前記特定語句検出手段にて検出された特
定語句を含む文章の各文を抽出する文抽出手段と、文抽
出手段にて抽出された各文を第2の言語に翻訳する部分
翻訳手段とを備えている。
1の言語で記述された文書の各文を第2の言語に翻訳す
る機械翻訳装置において、入力された第1の言語の文書
における各文章相互間の区切りを検出する文章区切り検
出手段と、第1の言語の文書に含まれる文章の役割を意
味する特定語句を検出する特定語句検出手段と、入力さ
れた文書から、前記特定語句検出手段にて検出された特
定語句を含む文章の各文を抽出する文抽出手段と、文抽
出手段にて抽出された各文を第2の言語に翻訳する部分
翻訳手段とを備えている。
【0016】
【作用】このように構成された請求項1の翻訳方法及び
請求項2の機械翻訳装置においては、入力された文書に
含まれる各単語は予め定められた複数の分野のうちの該
当単語が所属する分野に分類される。
請求項2の機械翻訳装置においては、入力された文書に
含まれる各単語は予め定められた複数の分野のうちの該
当単語が所属する分野に分類される。
【0017】この分野とは例えば情報処理分野,医学分
野,化学分野,経済分野等の翻訳しようとする文書が大
まかにどの分野に所属する文書であるかを判断するため
の分野である。
野,化学分野,経済分野等の翻訳しようとする文書が大
まかにどの分野に所属する文書であるかを判断するため
の分野である。
【0018】そして、多くの単語が分類された分野が指
定されると、この分野に分類された単語を含む文が文書
から抽出される。そして、この抽出された文に対しのみ
翻訳が実施される。
定されると、この分野に分類された単語を含む文が文書
から抽出される。そして、この抽出された文に対しのみ
翻訳が実施される。
【0019】すなわち、この文書には、多くの単語が分
類された分野に関する情報が主に記載されていると見な
すことができるので、この分野に分類された単語が所属
する文のみを翻訳すれば、文書の全ての文を翻訳する事
なく、この文書の大意を把握することができる。
類された分野に関する情報が主に記載されていると見な
すことができるので、この分野に分類された単語が所属
する文のみを翻訳すれば、文書の全ての文を翻訳する事
なく、この文書の大意を把握することができる。
【0020】請求項3の発明の機械翻訳装置において
は、各分野毎に該当分野に分類された単語の数が自動的
に計数される。そして、計数値に基づいてが分野が指定
される。したがって、この場合、読者は分野を指定する
必要がないので、より翻訳操作が簡素化される。
は、各分野毎に該当分野に分類された単語の数が自動的
に計数される。そして、計数値に基づいてが分野が指定
される。したがって、この場合、読者は分野を指定する
必要がないので、より翻訳操作が簡素化される。
【0021】請求項4の発明の機械翻訳装置において
は、指定された分野に分類された全ての単語を含む文が
翻訳されるのではなくて、該当分野に分類された各単語
のうち例えば読者が必要とする単語を指定することによ
って、翻訳される文の数が絞り込まれ、読者が必要とす
る情報のみがさらに迅速に提供され、より簡単に文書の
大意を把握できる。
は、指定された分野に分類された全ての単語を含む文が
翻訳されるのではなくて、該当分野に分類された各単語
のうち例えば読者が必要とする単語を指定することによ
って、翻訳される文の数が絞り込まれ、読者が必要とす
る情報のみがさらに迅速に提供され、より簡単に文書の
大意を把握できる。
【0022】請求項5の発明の機械翻訳装置において
は、翻訳対象の文書に含まれる図表の説明を意味する特
定語句が検出される。そして、この特定語句を含む文の
みが翻訳される。
は、翻訳対象の文書に含まれる図表の説明を意味する特
定語句が検出される。そして、この特定語句を含む文の
みが翻訳される。
【0023】文書中に含まれる図や表はこの文書に記載
した情報を説明するために設けられている場合が多い。
したがって、この図表を説明する文を翻訳することによ
って、この文書が主張する情報の大意を把握できる。
した情報を説明するために設けられている場合が多い。
したがって、この図表を説明する文を翻訳することによ
って、この文書が主張する情報の大意を把握できる。
【0024】また、請求項6の発明の機械翻訳装置にお
いては、翻訳対象の文書に含まれる見出し部分が検出さ
れる。そして、この見出し部分を含む文のみが翻訳され
る。すなわち、文書中に含まれる見出し部分は、例えば
英文の場合、独立した行に記載され、全て大文字であっ
たり、下線が施してあったり、文の終りにピリオドや句
読点がない等の特徴部分を有する場合が多いので、この
特徴部分から見出し部分を特定して検出することが可能
である。
いては、翻訳対象の文書に含まれる見出し部分が検出さ
れる。そして、この見出し部分を含む文のみが翻訳され
る。すなわち、文書中に含まれる見出し部分は、例えば
英文の場合、独立した行に記載され、全て大文字であっ
たり、下線が施してあったり、文の終りにピリオドや句
読点がない等の特徴部分を有する場合が多いので、この
特徴部分から見出し部分を特定して検出することが可能
である。
【0025】文書は、この文書を読者に対して読み易く
するために、複数に分割して、それぞれ見出しを付す場
合が多い。したがって、この見出し部分みを翻訳して
も、この文書がどの分野に所属する情報が記載されてい
るかが理解でき、さらに大意を把握する手助けとなる。
するために、複数に分割して、それぞれ見出しを付す場
合が多い。したがって、この見出し部分みを翻訳して
も、この文書がどの分野に所属する情報が記載されてい
るかが理解でき、さらに大意を把握する手助けとなる。
【0026】請求項7の発明の機械翻訳装置において
は、翻訳対象の文書ににおける各文章相互間の区切りが
検出される。そして、文章の役割を意味する特定語句が
検出され、特定語句を含む文章の各文が翻訳される。
は、翻訳対象の文書ににおける各文章相互間の区切りが
検出される。そして、文章の役割を意味する特定語句が
検出され、特定語句を含む文章の各文が翻訳される。
【0027】すなわち、文書は、それぞれ複数の文から
なるそれぞれ意味を有する複数の文章からなる。そし
て、一般に、各文章の区切り位置は改行記号等で簡単に
検出できる。
なるそれぞれ意味を有する複数の文章からなる。そし
て、一般に、各文章の区切り位置は改行記号等で簡単に
検出できる。
【0028】また、文章の役割を意味する特定語句と
は、例えば、[要約すれば、」「目的とするところ
は、」等の文章中の語句や、前述した特定の意味を示す
見出し等が含まれる。このように、特定語句を含む一連
の文章が翻訳されるので、文書の大意を把握することが
できる。
は、例えば、[要約すれば、」「目的とするところ
は、」等の文章中の語句や、前述した特定の意味を示す
見出し等が含まれる。このように、特定語句を含む一連
の文章が翻訳されるので、文書の大意を把握することが
できる。
【0029】
【実施例】以下本発明の一実施例を図面を用いて説明す
る。図1は実施例の翻訳方法が採用された機械翻訳装置
の概略構成を示すブロック図である。
る。図1は実施例の翻訳方法が採用された機械翻訳装置
の概略構成を示すブロック図である。
【0030】この機械翻訳装置は例えばコンピュータ等
の情報処理装置で構成されている。そして、アプリケー
ションプログラム上にソフト的に構成された複数の処理
部からなる制御部1に対して、外部から書込まれた翻訳
対象の文書を記憶する例えばHDD内に形成された文書
ファイル2、HDD内に形成された分野別単語データベ
ース3、分野別ファイル4等の可変データを記憶する記
憶部5、操作者が各種操作指令を入力するためのキーボ
ードやマウス等で構成された入力装置6、CRT表示装
置等の翻訳文等を表示するための表示装置7、翻訳文等
を印字出力するプリンタ8が接続されている。
の情報処理装置で構成されている。そして、アプリケー
ションプログラム上にソフト的に構成された複数の処理
部からなる制御部1に対して、外部から書込まれた翻訳
対象の文書を記憶する例えばHDD内に形成された文書
ファイル2、HDD内に形成された分野別単語データベ
ース3、分野別ファイル4等の可変データを記憶する記
憶部5、操作者が各種操作指令を入力するためのキーボ
ードやマウス等で構成された入力装置6、CRT表示装
置等の翻訳文等を表示するための表示装置7、翻訳文等
を印字出力するプリンタ8が接続されている。
【0031】前記制御部1は、単語分類部9、分野指定
部10、単語指定部11,文抽出部12、部分翻訳部1
3等で構成されている。分野別単語データベース3は、
例えばこの機械翻訳装置で翻訳を行うための辞書データ
ベース内に組込まれており、この分野別単語データベー
ス3内には、文章ファイル2に書込まれている翻訳対象
の文書である第1の言語における各単語毎に、該当単語
が、例えば情報処理分野,医学分野,化学分野,経済分
野等の予め定められた複数の分野のうちどの分野に所属
するかが、該当単語が翻訳先の第2の言語における同一
意味を有する単語(翻訳単語)と共に記憶されている。
部10、単語指定部11,文抽出部12、部分翻訳部1
3等で構成されている。分野別単語データベース3は、
例えばこの機械翻訳装置で翻訳を行うための辞書データ
ベース内に組込まれており、この分野別単語データベー
ス3内には、文章ファイル2に書込まれている翻訳対象
の文書である第1の言語における各単語毎に、該当単語
が、例えば情報処理分野,医学分野,化学分野,経済分
野等の予め定められた複数の分野のうちどの分野に所属
するかが、該当単語が翻訳先の第2の言語における同一
意味を有する単語(翻訳単語)と共に記憶されている。
【0032】記憶部5には前記分野毎にそれぞれ専用の
分野別ファイル4が制御部1の単語分類部9によって形
成される。各分野別ファイル4内には、図2に示すよう
に、[情報分野]等の分野名称14と、単語分類部9に
て検出された該当分野に所属する単語の単語名称15,
現在時点までの該当単語の出現頻度(出現回数)16、
および該当単語が含まれる文を特定する文番号17が登
録される。この文番号17は、翻訳しようとする一つの
文書を構成する各文の先頭からの出現番号である。
分野別ファイル4が制御部1の単語分類部9によって形
成される。各分野別ファイル4内には、図2に示すよう
に、[情報分野]等の分野名称14と、単語分類部9に
て検出された該当分野に所属する単語の単語名称15,
現在時点までの該当単語の出現頻度(出現回数)16、
および該当単語が含まれる文を特定する文番号17が登
録される。この文番号17は、翻訳しようとする一つの
文書を構成する各文の先頭からの出現番号である。
【0033】表示装置7には、必要に応じて、文書ファ
イル2に記憶されている未翻訳の文書が表示出力された
り、全文翻訳モードが指定された場合における全文翻訳
が表示されると共に、部分翻訳モードが指定された場合
における図3に示す分野別ファイル一覧表18、一つの
分野における出現回数の多い分野別単語一覧表19、お
よび図4に示す部分翻訳文20a,20bが表示され
る。
イル2に記憶されている未翻訳の文書が表示出力された
り、全文翻訳モードが指定された場合における全文翻訳
が表示されると共に、部分翻訳モードが指定された場合
における図3に示す分野別ファイル一覧表18、一つの
分野における出現回数の多い分野別単語一覧表19、お
よび図4に示す部分翻訳文20a,20bが表示され
る。
【0034】次に、この機械翻訳装置が、操作者によっ
て部分翻訳モードに指定された場合における前記制御部
1を構成する各処理部9〜13の動作を図5,図6の流
れ図に従って説明する。
て部分翻訳モードに指定された場合における前記制御部
1を構成する各処理部9〜13の動作を図5,図6の流
れ図に従って説明する。
【0035】流れ図が開始さると、単語分類部9が起動
され、P(プログラム・ステップ)1において、文書フ
ァイル2に記憶されている未翻訳の文書の一つの文を読
出す。P2にて、この読出した文にまだ未検索の単語が
存在すれば、P3へ進み、該当単語で分野別単語データ
ベース3を検索して該当単語の所属分野を検出する。該
当単語の所属分野が検索されると、記憶部5に図2に示
す該当分野の分野別ファイル4が既に形成されているか
否か調べる(P4)。
され、P(プログラム・ステップ)1において、文書フ
ァイル2に記憶されている未翻訳の文書の一つの文を読
出す。P2にて、この読出した文にまだ未検索の単語が
存在すれば、P3へ進み、該当単語で分野別単語データ
ベース3を検索して該当単語の所属分野を検出する。該
当単語の所属分野が検索されると、記憶部5に図2に示
す該当分野の分野別ファイル4が既に形成されているか
否か調べる(P4)。
【0036】記憶部5に該当分野別ファイル4がまだ形
成されていない場合は、図2に示す該当分野の分野別フ
ァイル4を新規に作成する(P5)。そして、P6へ進
み、作成した新規の分野別ファイル4に分野名称14,
単語名称15,出現頻度(出現回数)16,及び該当単
語が所属する文の文番号17を新規登録する。
成されていない場合は、図2に示す該当分野の分野別フ
ァイル4を新規に作成する(P5)。そして、P6へ進
み、作成した新規の分野別ファイル4に分野名称14,
単語名称15,出現頻度(出現回数)16,及び該当単
語が所属する文の文番号17を新規登録する。
【0037】なお、P4にて既に該当単語の分野別ファ
イル4が形成されていた場合は、この分野別ファイル4
に今回の単語が既に登録されているか否かを調べて、ま
だ未登録の場合は、上述と同様な手法にて単語名称1
5,出現頻度(出現回数)16,及び該当単語が所属す
る文の文番号17を新規登録する。
イル4が形成されていた場合は、この分野別ファイル4
に今回の単語が既に登録されているか否かを調べて、ま
だ未登録の場合は、上述と同様な手法にて単語名称1
5,出現頻度(出現回数)16,及び該当単語が所属す
る文の文番号17を新規登録する。
【0038】また、既に同一単語が登録されていた場合
は、出現頻度(出現回数)16に1を加算し、今回の所
属文の文番号17を追加登録する。一つの単語に対する
分野別ファイル4に対する登録処理が終了すると、P2
へ戻り、今回読出した文に未検索の単語が存在するか否
かを調べて、存在すればP3にて該当単語の所属分野を
調べる。
は、出現頻度(出現回数)16に1を加算し、今回の所
属文の文番号17を追加登録する。一つの単語に対する
分野別ファイル4に対する登録処理が終了すると、P2
へ戻り、今回読出した文に未検索の単語が存在するか否
かを調べて、存在すればP3にて該当単語の所属分野を
調べる。
【0039】P2にて、読出した文に所属するすべての
単語の分野別ファイル4に対する登録処理が終了する
と、P1へ戻り、文書ファイル2から次の文を読出す。
そして、この文に所属する単語に対する分野別ファイル
4に対する登録処理を開始する。
単語の分野別ファイル4に対する登録処理が終了する
と、P1へ戻り、文書ファイル2から次の文を読出す。
そして、この文に所属する単語に対する分野別ファイル
4に対する登録処理を開始する。
【0040】P1にて、文書ファイル2に記憶されてい
る1文書の全ての文に対する読出処理が終了すると、分
野指定部10が起動する。そして、P7にて、操作者が
入力装置6を介して、表示ファイル数Nを入力すると、
P8にて、記憶部5の各分野別ファイル4毎の各単語の
出現頻度16を合計した単語総登録数SMを算出する。
そして、この単語総登録数SMの多い順からN番目まで
の分野別ファイル4を特定する。この特定されたN個の
分野別ファイル4の各分野名称14を、図3(a)に示
すように、表示装置7に分野別ファイル一覧表18とし
て表示する。
る1文書の全ての文に対する読出処理が終了すると、分
野指定部10が起動する。そして、P7にて、操作者が
入力装置6を介して、表示ファイル数Nを入力すると、
P8にて、記憶部5の各分野別ファイル4毎の各単語の
出現頻度16を合計した単語総登録数SMを算出する。
そして、この単語総登録数SMの多い順からN番目まで
の分野別ファイル4を特定する。この特定されたN個の
分野別ファイル4の各分野名称14を、図3(a)に示
すように、表示装置7に分野別ファイル一覧表18とし
て表示する。
【0041】そして、P9にて、操作者が表示された分
野別ファイル一覧表18に基づいて、1個又は複数の分
野別ファイル4を入力装置6を介して指定する。複数の
分野別ファイル4を指定した場合は、P10にて、指定
された各分野別ファイル4に登録されている各単語の単
語名称15を出現頻度(出現回数)16が多い順に番号
を付して、図3(b)に示すように、分野別単語一覧表
19として表示装置7に表示出力する。
野別ファイル一覧表18に基づいて、1個又は複数の分
野別ファイル4を入力装置6を介して指定する。複数の
分野別ファイル4を指定した場合は、P10にて、指定
された各分野別ファイル4に登録されている各単語の単
語名称15を出現頻度(出現回数)16が多い順に番号
を付して、図3(b)に示すように、分野別単語一覧表
19として表示装置7に表示出力する。
【0042】次に、単語指定部11が起動される。P1
1にて、操作者が表示された分野別単語一覧表19に基
づいて単語数Mが入力されると、この各分野別単語一覧
表19における各上位M個の単語が指定される。また、
P12にて、特定の単語が入力装置6を介して入力され
ると、この入力された単語も指定単語に加える。
1にて、操作者が表示された分野別単語一覧表19に基
づいて単語数Mが入力されると、この各分野別単語一覧
表19における各上位M個の単語が指定される。また、
P12にて、特定の単語が入力装置6を介して入力され
ると、この入力された単語も指定単語に加える。
【0043】次に、文抽出部12が起動される。P13
にて、先に指定された複数の分野別ファイル4をそれぞ
れ個別に翻訳する指定がある場合は、P15にて、文書
ファイル2から指定単語を含む文を、分野別ファイル4
に記憶されている該当単語の文番号17を用いて抽出し
て、部分翻訳部13を起動する。
にて、先に指定された複数の分野別ファイル4をそれぞ
れ個別に翻訳する指定がある場合は、P15にて、文書
ファイル2から指定単語を含む文を、分野別ファイル4
に記憶されている該当単語の文番号17を用いて抽出し
て、部分翻訳部13を起動する。
【0044】部分翻訳部13は抽出された各文を順番に
翻訳して、図4(a)に示すように、表示装置7に各分
野別に翻訳文を部分翻訳文20aとして表示出力する。
なお、必要に応じて、部分翻訳文20aをプリンタ8で
印字出力することも可能である。
翻訳して、図4(a)に示すように、表示装置7に各分
野別に翻訳文を部分翻訳文20aとして表示出力する。
なお、必要に応じて、部分翻訳文20aをプリンタ8で
印字出力することも可能である。
【0045】また、P13で先に指定された複数の分野
別ファイル4を区別せずに翻訳する指定がある場合は、
P14にて、全ての分野別ファイル4に亘って各文番号
17順に各文を文書ファイル2から読出して翻訳して、
図4(b)に示すフォーマットの部分翻訳文20bとし
て表示出力する。
別ファイル4を区別せずに翻訳する指定がある場合は、
P14にて、全ての分野別ファイル4に亘って各文番号
17順に各文を文書ファイル2から読出して翻訳して、
図4(b)に示すフォーマットの部分翻訳文20bとし
て表示出力する。
【0046】また、P9にて、一つの分野別ファイル4
のみが選択された場合は、図6のP16へ進み、該当分
野ファイル4の図3(b)に示す分野別単語一覧表19
を表示出力する。そして、P17で単語が指定され、P
18でさらに特性の単語が指定されると、P19にて指
定された各単語が所属する文を文番号17を用いて文書
ファイ2から抽出する。この抽出された各文に対して翻
訳を行って、表示装置7に図4(b)に示すフォーマッ
トの部分翻訳文20bとして表示出力する。
のみが選択された場合は、図6のP16へ進み、該当分
野ファイル4の図3(b)に示す分野別単語一覧表19
を表示出力する。そして、P17で単語が指定され、P
18でさらに特性の単語が指定されると、P19にて指
定された各単語が所属する文を文番号17を用いて文書
ファイ2から抽出する。この抽出された各文に対して翻
訳を行って、表示装置7に図4(b)に示すフォーマッ
トの部分翻訳文20bとして表示出力する。
【0047】このように構成された機械翻訳装置におい
ては、入力されて一旦文書ファイル2に記憶された文書
に含まれる各単語は、分野別単語データデータベース3
に登録されている複数の分野のうちの該当単語が所属す
る一つ又は複数の分野の分野別ファイル4に登録され
る。
ては、入力されて一旦文書ファイル2に記憶された文書
に含まれる各単語は、分野別単語データデータベース3
に登録されている複数の分野のうちの該当単語が所属す
る一つ又は複数の分野の分野別ファイル4に登録され
る。
【0048】そして、1文書文の全ての単語の分類が終
了すると、多くの単語が分類された分野別ファイル4が
例えば操作者によって指定される。そして、この指定さ
れた分野に分類された単語を含む文が文書から抽出され
て翻訳が実施される。
了すると、多くの単語が分類された分野別ファイル4が
例えば操作者によって指定される。そして、この指定さ
れた分野に分類された単語を含む文が文書から抽出され
て翻訳が実施される。
【0049】前述したように、文書には多くの単語が分
類された分野に関する情報が主に記載されていると見な
すことができるので、この分野に分類された単語が所属
する文を翻訳すれば、文書の全ての文を翻訳する事な
く、この文書の大意を把握することができる。
類された分野に関する情報が主に記載されていると見な
すことができるので、この分野に分類された単語が所属
する文を翻訳すれば、文書の全ての文を翻訳する事な
く、この文書の大意を把握することができる。
【0050】さらに、指定分野に所属する各単語のう
ち、出現頻度(出現回数)16に大きい順に指定個数M
の単語の文を部分翻訳するのみならず、操作者が重要で
あると指定した特定の単語に対しては、たとえ出現頻度
(出現回数)16が少なくとも、無条件に翻訳してい
る。
ち、出現頻度(出現回数)16に大きい順に指定個数M
の単語の文を部分翻訳するのみならず、操作者が重要で
あると指定した特定の単語に対しては、たとえ出現頻度
(出現回数)16が少なくとも、無条件に翻訳してい
る。
【0051】したがって、操作者にとって翻訳する文の
裁量範囲が広くなり、より使用勝手のよい機械翻訳装置
をとすることができる。また、この機械翻訳装置におい
て、操作者が入力装置6にて[全文翻訳モード]を指定
すると、文書ファイル2に記憶されている文書における
全部の文が順番に読出されて翻訳される。そして、全文
書の翻訳文が表示装置7に表示されるとともにプリンタ
8にて印字出力される。
裁量範囲が広くなり、より使用勝手のよい機械翻訳装置
をとすることができる。また、この機械翻訳装置におい
て、操作者が入力装置6にて[全文翻訳モード]を指定
すると、文書ファイル2に記憶されている文書における
全部の文が順番に読出されて翻訳される。そして、全文
書の翻訳文が表示装置7に表示されるとともにプリンタ
8にて印字出力される。
【0052】なお、本発明は上述した図1に示す機械翻
訳装置に限定されるものではない。実施例装置において
は、分野別ファイル4の指定は操作者が行っていたが、
この指定処理を自動的に実施することができる。その選
択基準として、例えば以下に示す4つの基準がある。さ
らに、指定分野別ファイル4の数も1つのみではなく
て、複数個指定することも可能である。
訳装置に限定されるものではない。実施例装置において
は、分野別ファイル4の指定は操作者が行っていたが、
この指定処理を自動的に実施することができる。その選
択基準として、例えば以下に示す4つの基準がある。さ
らに、指定分野別ファイル4の数も1つのみではなく
て、複数個指定することも可能である。
【0053】(1) 各単語の出現頻度(出現回数)16を
合計した単語総出現回数の最も多い分野別フアイル4を
指定する。 (2) 文書における見出し部分の単語が含まれる分野別フ
アイル4を指定する。
合計した単語総出現回数の最も多い分野別フアイル4を
指定する。 (2) 文書における見出し部分の単語が含まれる分野別フ
アイル4を指定する。
【0054】(3) 全部の分野別ファイル4に亘って最も
出現頻度(出現回数)16が多い単語が含まれる分野別
フアイル4を指定する。 (4) 別途定義された、重要語句を最も多く含む分野別フ
アイル4を指定する。
出現頻度(出現回数)16が多い単語が含まれる分野別
フアイル4を指定する。 (4) 別途定義された、重要語句を最も多く含む分野別フ
アイル4を指定する。
【0055】図7は本発明の他の実施例の機械翻訳装置
の概略構成を示すブロック図である。図1に示す実施例
装置と同一部分には同一符号が付してある。したがっ
て、重複する部分の詳細説明は省略されている。
の概略構成を示すブロック図である。図1に示す実施例
装置と同一部分には同一符号が付してある。したがっ
て、重複する部分の詳細説明は省略されている。
【0056】この実施例装置においては、分野別単語デ
ータベース3の代りに、特定語句データベース21が設
けられている。この特定語句データベース21内には、 (1) [図X],[fig.X],[上図],[下図],
[表X],[上表],[下表]等の図表を説明する場合
に用いられる特定の図表特定語句 (2) 文書を構成する各文章の役割を示す例えば[要約す
れば、」「目的とするところは、」等の役割特定語句 (3) 文書中に含まれる見出し部分を特定するための文書
中に含まれる下記に示す各見出し部分情報(例えば英語
の場合) (a) 全部大文字又は基幹語の先頭が全て大文字 (b) 章番号,節番号等が先頭につく (C) ピリオド等が行末になく、改行されており、次の行
と接続なし また、制御部1内には、単語分類部9,分野指定部10
及び単語指定部11のの代りに、図7に示すように、特
定語句検出部22及び特定語句指定部24が設けられて
いる。
ータベース3の代りに、特定語句データベース21が設
けられている。この特定語句データベース21内には、 (1) [図X],[fig.X],[上図],[下図],
[表X],[上表],[下表]等の図表を説明する場合
に用いられる特定の図表特定語句 (2) 文書を構成する各文章の役割を示す例えば[要約す
れば、」「目的とするところは、」等の役割特定語句 (3) 文書中に含まれる見出し部分を特定するための文書
中に含まれる下記に示す各見出し部分情報(例えば英語
の場合) (a) 全部大文字又は基幹語の先頭が全て大文字 (b) 章番号,節番号等が先頭につく (C) ピリオド等が行末になく、改行されており、次の行
と接続なし また、制御部1内には、単語分類部9,分野指定部10
及び単語指定部11のの代りに、図7に示すように、特
定語句検出部22及び特定語句指定部24が設けられて
いる。
【0057】さらに、記憶部5内には、複数の分野別フ
ァイル4の代りに、3個の特定語句ファイル23a,2
3b,23cが形成されている。3個の各特定語句ファ
イル23a,23b,23cは、それぞれ上述した(1)
図表特定語句、(2) 役割特定語句、(3) 見出し部分情報
に対応している。最初の特定語句ファイル23aは文書
中で検出された各図表特定語句と該当図表特定語句が所
属する文の文番号17が登録される。また、2番目の特
定語句ファイル23bは文書中で検出された各役割特定
語句と該当役割特定語句が所属する文の文番号17が登
録される。さらに、3番目の特定語句ファイル23cは
文書中で検出された各見出し部分情報と該当見出し部分
情報が所属する文の文番号17が登録される。
ァイル4の代りに、3個の特定語句ファイル23a,2
3b,23cが形成されている。3個の各特定語句ファ
イル23a,23b,23cは、それぞれ上述した(1)
図表特定語句、(2) 役割特定語句、(3) 見出し部分情報
に対応している。最初の特定語句ファイル23aは文書
中で検出された各図表特定語句と該当図表特定語句が所
属する文の文番号17が登録される。また、2番目の特
定語句ファイル23bは文書中で検出された各役割特定
語句と該当役割特定語句が所属する文の文番号17が登
録される。さらに、3番目の特定語句ファイル23cは
文書中で検出された各見出し部分情報と該当見出し部分
情報が所属する文の文番号17が登録される。
【0058】次に、このような構成の機械翻訳装置の動
作を説明する。先ず、制御部1の特定語句検出部22が
起動され、文書ファイル2に記憶されている未翻訳の文
書を構成する各文を順番に取込んでいって、各文に特定
語句データベース21に登録されている前述した(1) 図
表特定語句、(2) 役割特定語句、(3) 見出し部分情報が
含まれているか否かを調べる。含まれていた場合は、所
属する文の文番号17と共に記憶部5の該当する特定語
句ファイル23a〜23cへ登録する。
作を説明する。先ず、制御部1の特定語句検出部22が
起動され、文書ファイル2に記憶されている未翻訳の文
書を構成する各文を順番に取込んでいって、各文に特定
語句データベース21に登録されている前述した(1) 図
表特定語句、(2) 役割特定語句、(3) 見出し部分情報が
含まれているか否かを調べる。含まれていた場合は、所
属する文の文番号17と共に記憶部5の該当する特定語
句ファイル23a〜23cへ登録する。
【0059】文書ファイル2に記憶されている文書の全
ての文に対する特定語句の記憶部5の特定語句ファイル
23a〜23cへの登録処理が終了すると、特定語句指
定部24が起動される。
ての文に対する特定語句の記憶部5の特定語句ファイル
23a〜23cへの登録処理が終了すると、特定語句指
定部24が起動される。
【0060】この特定語句指定部24は、入力装置6か
ら操作者が上述した(1) 図表特定語句、(2) 役割特定語
句、(3) 見出し部分情報のうちのいずれかを選択する
と、選択された特定語句の特定語句ファイル23a〜2
3cの記憶内容を表示装置に表示すると共に、文抽出部
12を起動する。
ら操作者が上述した(1) 図表特定語句、(2) 役割特定語
句、(3) 見出し部分情報のうちのいずれかを選択する
と、選択された特定語句の特定語句ファイル23a〜2
3cの記憶内容を表示装置に表示すると共に、文抽出部
12を起動する。
【0061】文抽出部12は、指定された特定語句ファ
イル23a〜23cに登録された特定語句が所属する文
の文番号17に基づいて、文書ファイル2から該当文を
抽出して、部分翻訳部13へ送出する。部分翻訳部13
は文抽出部12から入力された各文を翻訳して、表示装
置7に表示出力すると共に、プリンタ8へ印字出力す
る。
イル23a〜23cに登録された特定語句が所属する文
の文番号17に基づいて、文書ファイル2から該当文を
抽出して、部分翻訳部13へ送出する。部分翻訳部13
は文抽出部12から入力された各文を翻訳して、表示装
置7に表示出力すると共に、プリンタ8へ印字出力す
る。
【0062】上記動作をさらに具体的に説明すると、特
定語句指定部24にて(1) 図表特定語句が指定された場
合は、[図X],[fig.X],[上図],[下
図],[表X],[上表],[下表]等の図表を説明す
る語句を含む文のみが翻訳されて表示される。
定語句指定部24にて(1) 図表特定語句が指定された場
合は、[図X],[fig.X],[上図],[下
図],[表X],[上表],[下表]等の図表を説明す
る語句を含む文のみが翻訳されて表示される。
【0063】また、特定語句指定部24にて(3) 見出し
部分情報が指定された場合は、前述した見出し部分と見
なすことができる(a) 〜(c) の条件を満足する文が抽出
されて翻訳されて表示される。すなわち、文書中に含ま
れる見出し部分のみが翻訳される。
部分情報が指定された場合は、前述した見出し部分と見
なすことができる(a) 〜(c) の条件を満足する文が抽出
されて翻訳されて表示される。すなわち、文書中に含ま
れる見出し部分のみが翻訳される。
【0064】さらに、特定語句指定部24にて(2) 役割
特定語句が指定された場合は、この役割特定語句が含ま
れる文は勿論のこと、この文が含まれる文章全体が翻訳
される。この場合、文書における各文章の区切りが検出
される。この文章の区切りは例えば文書に含まれる改行
等で判断される。
特定語句が指定された場合は、この役割特定語句が含ま
れる文は勿論のこと、この文が含まれる文章全体が翻訳
される。この場合、文書における各文章の区切りが検出
される。この文章の区切りは例えば文書に含まれる改行
等で判断される。
【0065】このように構成された翻訳機械装置におい
ては、[図X],[fig.X],[上図],[下
図],[表X],[上表],[下表]等の図表を説明す
る文のみが翻訳されて表示されるので、この文書が主張
する情報の大意を図表の説明文で容易に把握できる。
ては、[図X],[fig.X],[上図],[下
図],[表X],[上表],[下表]等の図表を説明す
る文のみが翻訳されて表示されるので、この文書が主張
する情報の大意を図表の説明文で容易に把握できる。
【0066】また、文書に含まれる見出し部分のみを翻
訳している。よって、この文書がどの分野に所属するの
かを簡単に把握できる。また、この見出し部分を操作者
が文書の大意を把握するための判断材料として用いるこ
とができる。
訳している。よって、この文書がどの分野に所属するの
かを簡単に把握できる。また、この見出し部分を操作者
が文書の大意を把握するための判断材料として用いるこ
とができる。
【0067】さらに、この文書における結論や要約等が
記載された文章のみが自動的に翻訳される。その結果、
より適確にこの文書の大意を把握できる。このように、
操作者は、上述した文書の大意を得るために種々の特定
語句を指定して、文書中のこの特定語句に関する部分の
みを翻訳することによって、短時間で文書全体の大意を
把握することができる。
記載された文章のみが自動的に翻訳される。その結果、
より適確にこの文書の大意を把握できる。このように、
操作者は、上述した文書の大意を得るために種々の特定
語句を指定して、文書中のこの特定語句に関する部分の
みを翻訳することによって、短時間で文書全体の大意を
把握することができる。
【0068】
【発明の効果】以上説明したように、本発明の翻訳方法
及び機械翻訳装置においては、翻訳対象の文書に含まれ
る各単語を所属する分野に分類して、多くの単語が分類
された分野に所属する単語が含まれる文を抽出して翻訳
している。したがって、文書全部を翻訳することなく、
未翻訳文書の記載内容の大意を短時間でかつ簡単に把握
できる。
及び機械翻訳装置においては、翻訳対象の文書に含まれ
る各単語を所属する分野に分類して、多くの単語が分類
された分野に所属する単語が含まれる文を抽出して翻訳
している。したがって、文書全部を翻訳することなく、
未翻訳文書の記載内容の大意を短時間でかつ簡単に把握
できる。
【0069】さらに、文書の大意を把握する上で指標と
なる図表の説明部分,見出し部分,役割を意味する部分
を自動的に抽出して翻訳している。したがって、上述し
た発明と同様に、文書全部を翻訳することなく、未翻訳
文書の記載内容の大意を短時間でかつ簡単に把握でき
る。
なる図表の説明部分,見出し部分,役割を意味する部分
を自動的に抽出して翻訳している。したがって、上述し
た発明と同様に、文書全部を翻訳することなく、未翻訳
文書の記載内容の大意を短時間でかつ簡単に把握でき
る。
【図1】 本発明の一実施例に係わる翻訳方法を採用し
た機械翻訳装置の概略構成を示すブロック図
た機械翻訳装置の概略構成を示すブロック図
【図2】 同実施例機械翻訳装置に組込まれた分野別フ
ァイルの記憶内容を示す図
ァイルの記憶内容を示す図
【図3】 同実施例機械翻訳装置の表示装置に表示され
る分野別ファイル一覧表及び分野別単語一覧表を示す図
る分野別ファイル一覧表及び分野別単語一覧表を示す図
【図4】 同実施例機械翻訳装置の表示装置に表示され
る各部分翻訳文を示す図
る各部分翻訳文を示す図
【図5】 同実施例機械翻訳装置の動作を示す流れ図
【図6】 同じく同実施例機械翻訳装置の動作を示す流
れ図
れ図
【図7】 本発明の他の実施例に係わる機械翻訳装置の
概略構成を示すブロック図
概略構成を示すブロック図
1…制御部、2…文書ファイル、3…分野別単語データ
ベース、4…分野別ファイル、5…記憶部、6…入力装
置、7…表示装置、8…プリンタ、9…単語分類部、1
0…分野指定部、11…単語指定部、12…文抽出部、
13…部分翻訳部、14…分野名称、15…単語名称、
16…出現頻度(出現回数)、17…文番号、18…分
野別ファイル一覧表、19…分野別単語一覧表、20
a,20b…部分翻訳文、21…特定語句データベー
ス、22…特定語句検出部、23a,23b,23c…
特定語句ファイル、24…特定語句指定部
ベース、4…分野別ファイル、5…記憶部、6…入力装
置、7…表示装置、8…プリンタ、9…単語分類部、1
0…分野指定部、11…単語指定部、12…文抽出部、
13…部分翻訳部、14…分野名称、15…単語名称、
16…出現頻度(出現回数)、17…文番号、18…分
野別ファイル一覧表、19…分野別単語一覧表、20
a,20b…部分翻訳文、21…特定語句データベー
ス、22…特定語句検出部、23a,23b,23c…
特定語句ファイル、24…特定語句指定部
Claims (7)
- 【請求項1】 入力された第1の言語で記述された文書
に含まれる各単語を予め定められた複数の分野のうちの
該当単語が所属する分野に分類し、 前記複数の分野のうちの多くの単語が分類された分野を
指定し、 前記各分野に分類された単語のうち前記指定した分野に
所属する単語を含む文を前記入力された文書から抽出
し、 この抽出された文を第2の言語に翻訳することを特徴と
する翻訳方法。 - 【請求項2】 入力された第1の言語で記述された文書
の各文を第2の言語に翻訳する機械翻訳装置において、 前記第1の言語で用いられる各単語が予め定められた複
数の分野のうちのどの分野に所属するかを記憶する分野
別単語データベースと、 前記第1の言語で記述された文書に含まれる各単語の所
属分野を前記分野別単語データベースを用いて分類する
単語分類手段と、 前記複数の分野のうち多くの単語が分類された分野を指
定する分野指定手段と、 前記単語分類手段にて各分野に分類され単語のうち前記
分野指定手段で指定された分野に所属する単語を含む文
を前記入力された文書から抽出する文抽出手段と、 この文抽出手段にて抽出された文を前記第2の言語に翻
訳する部分翻訳手段とを備えた機械翻訳装置。 - 【請求項3】 前記単語分類手段にて各分野毎に該当分
野に分類された単語の数を計数する単語数計数手段を備
え、かつ前記分野指定手段は、前記単語数計数手段にて
計数された単語の数に基づいて前記分野を指定すること
を特徴とする請求項2記載の機械翻訳装置。 - 【請求項4】 入力された第1の言語で記述された文書
の各文を第2の言語に翻訳する機械翻訳装置において、 前記第1の言語で用いられる各単語が予め定められた複
数の分野のうちのどの分野に所属するかを記憶する分野
別単語データベースと、 前記第1の言語で記述された文書に含まれる各単語の所
属分野を前記分野別単語データベースを用いて分類する
単語分類手段と、 前記複数の分野のうち多くの単語が分類された分野を指
定する分野指定手段と、 前記単語分類手段にて各分野に分類された単語のうち前
記分野指定手段で指定された分野に所属する単語を抽出
する単語抽出手段と、 この単語抽出手段で抽出された単語のうち特定の単語を
指定する単語指定手段と、 この単語指定手段にて指定された単語を含む文を前記入
力された文書から抽出する文抽出手段と、 この文抽出手段にて抽出された文を前記第2の言語に翻
訳する部分翻訳手段とを備えた機械翻訳装置。 - 【請求項5】 入力された第1の言語で記述された文書
の各文を第2の言語に翻訳する機械翻訳装置において、 前記入力された第1の言語の文書に含まれる図表の説明
を意味する特定語句を検出する特定語句検出手段と、 この特定語句検出手段にて検出された特定語句を含む文
を前記入力された文書から抽出する文抽出手段と、 この文抽出手段にて抽出された文を前記第2の言語に翻
訳する部分翻訳手段とを備えた機械翻訳装置。 - 【請求項6】 入力された第1の言語で記述された文書
の各文を第2の言語に翻訳する機械翻訳装置において、 前記入力された第1の言語の文書に含まれる見出し部分
を検出する見出し部分検出手段と、 この見出し部分検出手段にて検出された見出し部分に含
まれる文を前記入力された文書から抽出する文抽出手段
と、 この文抽出手段にて抽出された文を前記第2の言語に翻
訳する部分翻訳手段とを備えた機械翻訳装置。 - 【請求項7】 入力された第1の言語で記述された文書
の各文を第2の言語に翻訳する機械翻訳装置において、 前記入力された第1の言語の文書における各文章相互間
の区切りを検出する文章区切り検出手段と、 前記第1の言語の文書に含まれる文章の役割を意味する
特定語句を検出する特定語句検出手段と、 前記入力された文書から、前記特定語句検出手段にて検
出された特定語句を含む文章の各文を抽出する文抽出手
段と、 この文抽出手段にて抽出された各文を前記第2の言語に
翻訳する部分翻訳手段とを備えた機械翻訳装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7192018A JPH0944504A (ja) | 1995-07-27 | 1995-07-27 | 翻訳方法及び機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7192018A JPH0944504A (ja) | 1995-07-27 | 1995-07-27 | 翻訳方法及び機械翻訳装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0944504A true JPH0944504A (ja) | 1997-02-14 |
Family
ID=16284234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7192018A Pending JPH0944504A (ja) | 1995-07-27 | 1995-07-27 | 翻訳方法及び機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0944504A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1139306A (ja) * | 1997-07-16 | 1999-02-12 | Sony Corp | 多言語情報の処理システムおよび処理方法 |
JP2007052597A (ja) * | 2005-08-17 | 2007-03-01 | Fuji Xerox Co Ltd | 翻訳装置 |
-
1995
- 1995-07-27 JP JP7192018A patent/JPH0944504A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1139306A (ja) * | 1997-07-16 | 1999-02-12 | Sony Corp | 多言語情報の処理システムおよび処理方法 |
JP2007052597A (ja) * | 2005-08-17 | 2007-03-01 | Fuji Xerox Co Ltd | 翻訳装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6533822B2 (en) | Creating summaries along with indicators, and automatically positioned tabs | |
US9177013B2 (en) | System and method for citation processing, presentation and transport and for validating references | |
US8060511B2 (en) | Method for extracting referential keys from a document | |
US8270721B2 (en) | Method and system for acquiring data from machine-readable documents | |
EP0525427A2 (en) | Non-text object storage and retrieval | |
JPH07325827A (ja) | ハイパーテキスト自動生成装置 | |
JPS62245367A (ja) | 文書処理装置 | |
JP3360617B2 (ja) | 数値情報抽出装置および数値情報検索装置並びに数値情報抽出プログラムを記憶した記憶媒体、数値情報検索プログラムを記憶した記憶媒体 | |
JPH0944504A (ja) | 翻訳方法及び機械翻訳装置 | |
JP3515586B2 (ja) | 文書処理方法及び装置 | |
JP3711636B2 (ja) | 情報検索装置および方法 | |
EP4080444A1 (en) | Information processing device, reading comprehension support method, and program | |
JPH1011443A (ja) | 文書符号検査システム | |
KR20220058257A (ko) | 논문 메타데이터 영역 분류 모델을 학습하기 위한 데이터셋의 검수 방법 및 장치 | |
JPS61248160A (ja) | 文書情報登録方式 | |
JP2762934B2 (ja) | テスト項目設計支援システム | |
Chen et al. | Automating index preparation | |
JPH08115330A (ja) | 類似文書検索方法および装置 | |
JP4382343B2 (ja) | 電子辞書及び電子辞書として機能させるためのプログラムを記録したコンピュータ読み取り可能な記憶媒体 | |
Mukhammadsolikh | SOFTWARE OF THE NATIONAL CORPUS OF THE UZBEK LANGUAGE | |
JPH044467A (ja) | 文書構造解析装置 | |
JPH0251766A (ja) | 索引項目自動抽出方式 | |
JPH03252759A (ja) | 文章の論理構造抽出方法及びその装置並びに文書処理装置 | |
JPH10320409A (ja) | 文書情報抽出方法及び装置並びに文書抽出処理プログラムを記憶した記憶媒体 | |
JPH03233669A (ja) | 文書作成装置 |