JP2994539B2

JP2994539B2 - 機械翻訳装置

Info

Publication number: JP2994539B2
Application number: JP5290491A
Authority: JP
Inventors: 貴司神子
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1993-11-19
Filing date: 1993-11-19
Publication date: 1999-12-27
Anticipated expiration: 2014-12-27
Also published as: JPH07141372A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、機械翻訳装置に関し、
より詳細には、原文の表題情報を原文の解析処理に利用
することができる機械翻訳装置に関する。

【０００２】

【従来の技術】従来の機械翻訳装置について記載した公
知文献としては、例えば、特開平５−１５１２５７号公
報がある。この公報のものは、原文中の箇条書部分等の
レイアウト情報を自動的に認定し、そのレイアウト情報
を利用して箇条書部分に関しては、利用者の修正なしに
箇条書にふさわしい翻訳を行うことができるものであ
る。また、特公平５−２８８７１号公報には、日本語文
書中から固有名詞や新語やその文書においてのみ使用さ
れていると考えられる語を抽出することができる日本語
対象文固有用語抽出装置が開示されている。

【０００３】

【発明が解決しようとする課題】しかしながら、従来の
機械翻訳装置は、１文ごとを処理の対象にしていたの
で、レイアウト情報を利用して表題等を認定し、その表
題からその文書の話題となっている固有名詞や新語やそ
の文書においてのみ使用されていると考えられる語、す
なわち表題情報を抽出することができたとしても、その
表題情報をその文書の他の文の解析には利用できないと
いう問題点があった。

【０００４】本発明は、このような実情に鑑みてなされ
たもので、表題情報を利用して、原文を正確に形態素解
析できる機械翻訳装置を提供することを目的としてい
る。

【０００５】

【課題を解決するための手段】本発明は、上記目的を達
成するために、（１）入力された言語の文章を辞書およ
び文法ルールに基づいてターゲット言語の文章に変換す
る機械翻訳装置において、入力された言語の文章を言語
解析する言語解析手段と、該言語解析手段に含まれ、前
記入力された文章の中に表題部分が存在することを検知
する検知手段と、該検知手段が表題部分を検知したとき
は、前記検知された表題部分から表題情報を抽出する抽
出手段とから成り、該抽出手段が抽出した表題情報を入
力された言語の文章が日本語のように単語にわかち書き
されていない場合、単語にわかち書きするのに利用する
こと、更には、（２）前記抽出手段が、抽出した表題情
報を入力された言語の文章が英語のように多品詞の単語
を含む場合、品詞の決定に利用することを特徴としたも
のである。

【０００６】

【作用】入力された言語の文章の中に表題部分があり、
その表題部分から固有名詞等の表題情報が抽出できる場
合、その表題情報が他の文の形態素解析に利用される。
表題情報を利用せずに形態素解析を行った場合には、避
けられない誤りを避けることができるので、正確な形態
素解析を行える。

【０００７】

【実施例】以下、本発明の実施例を図面を参照して説明
する。図１は、本発明による機械翻訳装置の要部を示す
構成図で、図中、１は入力部、２は表題検知部、３は表
題情報抽出部、４は形態素解析処理部、５は構文解析生
成処理部、６は出力部、７は表題情報保持部、８は辞書
・文法ルールである。

【０００８】機械翻訳装置は、機械翻訳を行いたい入力
された言語の文章を読み込む入力部１と、表題部分を検
知する表題検知部２と、表題部分から表題情報等を抽出
する表題情報抽出部３と、表題情報を保持する表題情報
保持部７と、表題情報および辞書，文法ルール８に基づ
いて、入力された文章を形態素単位に分割し、品詞やそ
の他の情報を獲得する形態素解析処理部４とを有する。
入力部１では、ファイル情報による入力だけでなく、キ
ーボードから直接文章を入力してもよい。また、辞書，
文法ルール８を用いて入力された文章の解析とターゲッ
ト言語の文章の生成を行う構文解析生成処理部５と、翻
訳結果であるターゲット言語を出力する出力部６とを有
する。

【０００９】図２は、本発明による機械翻訳装置の処理
の流れを示すフローチャートである。以下、各ステップ
に従って順に説明する。まず、文章を入力し（S11）、
入力された言語の文章に表題部分があれば（S12）、表
題情報抽出部３において、表題情報抽出処理が行われる
（S13）。次いで、形態素解析処理が行われ（S14）、次
いで、構文解析生成処理が行われる（S15）。その結果
が出力部６に出力される（S16）。

【００１０】次に、本発明による機械翻訳装置の動作の
具体的内容について説明する。例えば、日本語を他の言
語に翻訳する機械翻訳装置が、図３に示した文書テキス
トＡを形態素解析する場合を考えると、文２を翻訳する
際、この文はそのレイアウト情報から表題部分であると
判断される（S12）。次いで、文２から「とそ」という
表題情報が抽出される（S13）。この表題情報は、表題
情報保持部７に保持される。次いで、文３を翻訳する
際、表題情報保持部７に保持されている表題情報が参照
され、文３の内「とその」の部分を形態素解析して単語
に分割した結果として「とそ」（表題）／「の」（助
詞）を得ることができる。この発明によらないと、辞書
に「とそ」という語彙がない場合には、文３の「とそ
の」の部分は「と」（助詞）／「その」（連体詞）とい
う誤った分割の形態素結果になる。

【００１１】また、英語を他の言語に翻訳する機械翻訳
装置が、図４に示した文書テキストＢを形態素解析する
場合を考えると、文８を翻訳する際、この文はそのレイ
アウト情報から表題部分であると判断される（S12）。
次いで、文８から「fruit fly」が名詞であるという表
題情報が抽出される（S13）。この表題情報は、表題情
報保持部７に保持される。次いで、文９を翻訳する際、
表題情報保持部７に保持されている表題情報が参照さ
れ、文９の「fly」が持つ名詞または動詞という品詞の
曖昧性を解消でき、「fly」を名詞として解析して「シ
ョウジョウバエはバナナを好む」という解釈が得られ
る。この発明によらないと、文９の「fly」を「飛ぶ」
という意味の動詞と解析し、「果物はバナナのように飛
ぶ」という誤った解釈になる可能性がある。

【００１２】

【発明の効果】以上の説明から明らかなように、本発明
によれば、表題情報が他の文の形態素解析に利用される
ので、表題情報を利用せずに形態素解析を行った場合に
は、避けられない誤りを減らすことができ、正確な形態
素解析を行える。

【図面の簡単な説明】

【図１】本発明による機械翻訳装置の要部を示す構成図
である。

【図２】本発明による機械翻訳装置処理の動作を説明す
るためのフローチャートである。

【図３】本発明におけるテキストＡの例文を示す図であ
る。

【図４】本発明におけるテキストＢの例文を示す図であ
る。

【符号の説明】

１…入力部、２…表題検知部、３…表題情報抽出部、４
…形態素解析処理部、５…構文解析生成処理部、６…出
力部、７…表題情報保持部、８…辞書，文法ルール。

Claims

(57)【特許請求の範囲】

【請求項１】入力された言語の文章を辞書および文法
ルールに基づいてターゲット言語の文章に変換する機械
翻訳装置において、入力された言語の文章を言語解析す
る言語解析手段と、該言語解析手段に含まれ、前記入力
された文章の中に表題部分が存在することを検知する検
知手段と、該検知手段が表題部分を検知したときは、前
記検知された表題部分から表題情報を抽出する抽出手段
とから成り、該抽出手段が抽出した表題情報を入力され
た言語の文章が日本語のように単語にわかち書きされて
いない場合、単語にわかち書きするのに利用することを
特徴とする機械翻訳装置。
【請求項２】前記抽出手段が、抽出した表題情報を入
力された言語の文章が英語のように多品詞の単語を含む
場合、品詞の決定に利用することを特徴とする請求項１
記載の機械翻訳装置。