JP2001202365A - 機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体 - Google Patents

機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体

Info

Publication number
JP2001202365A
JP2001202365A JP2000009310A JP2000009310A JP2001202365A JP 2001202365 A JP2001202365 A JP 2001202365A JP 2000009310 A JP2000009310 A JP 2000009310A JP 2000009310 A JP2000009310 A JP 2000009310A JP 2001202365 A JP2001202365 A JP 2001202365A
Authority
JP
Japan
Prior art keywords
sentence
data
phrase
word
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000009310A
Other languages
English (en)
Other versions
JP3947859B2 (ja
Inventor
Shinichi Ando
真一 安藤
Kiyoshi Yamahata
潔 山端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2000009310A priority Critical patent/JP3947859B2/ja
Publication of JP2001202365A publication Critical patent/JP2001202365A/ja
Application granted granted Critical
Publication of JP3947859B2 publication Critical patent/JP3947859B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 (修正有) 【課題】 用例データを参照することで連接機能語を適
切に出力し文章中の各句を適切に翻訳し、一方使用する
用例データを容易に編集し生成する。 【解決手段】 翻訳対象の文章である原言語文を解析す
る原言語解析手段20と、原言語文の各単語と文章構造
を、目的言語の単語と文章構造に変換したデータである
変換データを生成する言語変換手段30と、目的言語の
指定された種類の文章句の単語データと各文章句内にお
ける指定された連結機能語の適否に関する情報とを示す
用例データベース41と、変換データ中における連結機
能語の使用の適否を用例データベースを参照して判断
し、変換データ中の適切な位置に連結機能語を設定し、
翻訳結果の文章である目的言語文を生成する目的言語生
成手段40、目的言語の文章データを基に、用例データ
ベース41に記録する用例データを自動的に編集し登録
する用例データベース作成手段60aを備える。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、文章を自動的に翻
訳する機械翻訳に関し、特に用例を用いて翻訳する機械
翻訳装置とその翻訳方法、及びその機械翻訳プログラム
を記録した記憶媒体に関する。
【0002】
【従来の技術】一般に機械翻訳装置による自然言語の翻
訳処理は、まず入力された原言語の文章の解析処理を行
い、次にこの解析結果を翻訳先の言語である目的言語へ
の変換処理を行い、最後に目的言語の文章を正しく生成
する生成処理を行うことで翻訳実行している。
【0003】また、機械翻訳装置による翻訳処理は、単
語情報や文法規則、言語変換規則等の様々な複雑で大規
模な言語知識や翻訳知識を利用することが必要であるた
め、翻訳システムの構築作業には多大なコストが必要で
ある。
【0004】特に、慣用的な要因が強い言語現象は、一
般化が困難であり、翻訳システムの構築のコストのより
多くの部分を占めていた。
【0005】こうした慣用的な要因が強い言語現象の一
例として、名詞句の翻訳がある。これを英日翻訳を例に
説明する。
【0006】英語の名詞連続部分の日本語訳は、同様に
名詞の連続として訳した方がよい場合と、名詞間を連結
する機能語を挿入して訳した方がよい場合とがある。
【0007】例えば英文“a baseball ga
me”の日本語訳は、各単語“baseball”と
“game”を日本語に訳した名詞を英文と同様に連続
して並べて「野球試合」としては不適切である。「野
球」と「試合」の両名詞の間に、連結機能語として格助
詞「の」を名詞間に挿入して「野球の試合」と翻訳され
ることが求められる。
【0008】逆に英文“a baseball pla
yer”の日本語訳は、「野球の選手」とも言えなくは
ないが「野球選手」と訳す方が自然である。
【0009】また、英文“Tokyo Statio
n”の日本語訳は、「東京の駅」としては不適切であ
り、格助詞「の」を名詞間に挿入することなく「東京
駅」と翻訳されることが求められる。
【0010】これらをいずれの形で訳せば良いかは、各
単語の組み合わせに対する慣用的な要因が大きく、自動
的に十分に訳し分けができるだけの翻訳知識を構築する
ことはコスト的に非常に困難であった。
【0011】このような翻訳知識の構築コストを低減す
ることを目的として、従来から大量に集めた用例を翻訳
知識として利用する手法が提案されている。
【0012】例えば特開平03−276367号公報に
開示された機械翻訳方法では、対訳用例を用いて原言語
の解析結果を目的言語の構造に変換する手法が提案され
ている(以下、第1の従来例という)。
【0013】この手法では通常の翻訳処理と同様に、ま
ず入力文を解析して依存構造を導出する。そして得られ
た依存構造と用例とを比較し、原言語の構造が似ている
用例を抽出する。さらにここで得られた用例の対訳関係
に従って入力文の依存構造を目的言語の依存構造に変換
し翻訳処理を進める。
【0014】このように構築がより容易な用例を変換知
識の代わりに利用することで、低コストで高品質な翻訳
装置を実現することを目指している。
【0015】また特開平11−259482号公報に開
示された機械翻訳方式では、対訳用例を用いて原言語の
形態素列を直接、目的言語の形態素列に変換する手法を
提案している(以下、第2の従来例という)。
【0016】ここでは翻訳対象を複合名詞に限り、形態
素列の対応関係を保持した用例を用いる。第1の従来例
では用例を適用するために入力文の依存構造解析が必要
であるのに対して、この手法では依存構造解析を行わな
くても用例が適用でき、翻訳処理が行えることを特徴と
している。
【0017】これにより、より低コストで高品質な翻訳
装置を実現することを目指している。
【0018】しかし、第1の従来例においても第2の従
来例においても、知識として利用する用例には、その内
部構造として要素間の対訳関係が与えられている必要が
ある。
【0019】すなわち、第1の従来例で用いる用例に
は、対訳関係にある2つの言語の依存関係に対してノー
ド毎の対応関係を付与する必要があり、また第2の従来
例で用いる用例には、対訳関係にある2つの言語の形態
素列に対して形態素毎の対応関係を付与する必要があ
る。
【0020】このように用例の作成にはこれら要素の間
の対応付け作業を伴うため、用例の作成には依然として
高いコストが必要であった。
【0021】このため、高品質な翻訳結果を出力するた
めに非常に大きなコストが必要となり、現実には高品質
な翻訳結果を得ることは難しかった。
【0022】
【発明が解決しようとする課題】第1の従来例や第2の
従来例では翻訳処理に利用する用例は対訳用例であり、
その内部の要素間の対応付けを行わなければならないた
め、高品質な翻訳処理が行えるだけの大量の対訳の用例
を集めるには依然として多くのコストが必要で、現実に
十分な用例を収集することは困難であった。
【0023】この問題は、名詞句等の句の部分におい
て、特定の連結機能語を挿入すべきか否かの判定を伴う
翻訳処理等においても同様であり、適切な判定のために
必要とする用例データを蓄積するには、手作業による膨
大なコストを必要とした。
【0024】このため、対訳関係の設定処理を必要とし
ない翻訳先の言語のみの用例データを参照して適切な翻
訳を実行する翻訳装置、またこの用例データを翻訳先の
言語の文章データを基に自動的に編集し生成する翻訳装
置が求められていた。
【0025】本発明の第1の目的は、連結機能語の用例
データを参照し文章中の各句を適切に翻訳することで、
自然な翻訳結果を出力する機械翻訳装置を提供すること
である。
【0026】本発明の第2の目的は、原言語から目的言
語への対訳用例を用いるのではなく、目的言語のみの用
例データを参照する方式の械翻訳装置を提供することで
ある。
【0027】本発明の第3の目的は、単に目的言語の文
章データを入力するのみで、こうした用例データを自動
的に編集生成する機械翻訳装置を提供することである。
【0028】本発明の第4の目的は、入力された目的言
語の文章データから、文章句に連接機能語を含む用例と
含まない用例の双方の情報を検出し、連接機能語の使用
の適否を適切に判定した用例データを自動的に編集生成
し、かつこの適切な判定による用例データに基づく翻訳
を実行する機械翻訳装置を提供することである。
【0029】
【課題を解決するための手段】上記目的を達成するため
本発明の機械翻訳装置は、翻訳元の言語である原言語の
文章を、翻訳先の言語である目的言語に翻訳する機械翻
訳装置において、目的言語の指定された種類の文章句の
単語データと、各前記文章句内における指定された連結
機能語の適否に関する情報とを示す用例データを記録し
た用例データベースと、目的言語の文章中における連結
機能語の使用の適否を、前記用例データベースを参照し
て判断し、前記文章中の適切な位置に連結機能語を設定
し、連結機能語の使用を適切に修正した文章を生成する
目的言語生成手段を備えることを特徴とする。
【0030】請求項2の本発明の機械翻訳装置は、翻訳
元の言語である原言語の文章を、翻訳先の言語である目
的言語に翻訳する機械翻訳装置において、入力された翻
訳対象の文章である原言語文を解析する原言語解析手段
と、前記原言語解析手段の解析に基づき、前記原言語文
の各単語と文章構造を、翻訳先の言語である目的言語の
単語と文章構造に変換したデータである変換データを生
成する言語変換手段と、目的言語の指定された種類の文
章句の単語データと、各前記文章句内における指定され
た連結機能語の適否に関する情報とを示す用例データを
記録し参照する用例データベースと、前記変換データ中
における連結機能語の使用の適否を、前記用例データベ
ースを参照して判断し、前記変換データ中の適切な位置
に連結機能語を設定し、翻訳結果の文章である目的言語
文を生成する目的言語生成手段を備えることを特徴とす
る。
【0031】請求項3の本発明の機械翻訳装置は、前記
目的言語生成手段は、目的言語の文章の構造を解析し
て、文章中の前記指定された種類の文章句の部分を処理
対象の句として検出する対象句同定手段と、前記用例デ
ータベースに記録された前記用例データを参照し、前記
処理対象の句に対し、適切な場合に適切な個所に適切な
連結機能語を挿入する連結機能語挿入手段と、前記連結
機能語挿入手段の挿入処理と、前記対象句同定手段の解
析結果に従い、目的言語の文章を生成する目的言語文生
成手段を備えることを特徴とする。
【0032】請求項4の本発明の機械翻訳装置は、入力
された目的言語の文章データを基に、前記用例データベ
ースに記録する用例データを自動的に編集し登録する用
例データベース作成手段を備えることを特徴とする。
【0033】請求項5の本発明の機械翻訳装置は、前記
用例データベース作成手段は、前記入力された目的言語
の文章データを解析し、解析データを形態素列として出
力する形態素解析手段と、前記形態素列から、前記指定
された種類の文章句のデータを構成要素列として抽出す
る対象句構成要素抽出手段と、前記構成要素列から、前
記指定された連結機能語を含む用例である正用例を検出
する正用例抽出手段と、前記正用例抽出手段が検出する
前記正用例に係る前記用例データを生成し前記用例デー
タベースに登録する用例登録手段を備えることを特徴と
する。
【0034】請求項6の本発明の機械翻訳装置は、前記
用例データベース作成手段は、前記構成要素列から、前
記指定された連結機能語を含まない用例である負用例を
検出する負用例抽出手段を備え、前記用例登録手段は、
前記負用例抽出手段が検出する前記負用例に係る前記用
例データを生成し前記用例データベースに登録を行い、
前記用例データベース作成手段は、登録された前記用例
データにおける前記正用例と前記負用例の情報を基に、
当該文章句内における前記指定された連結機能語の使用
の適否を判定し、この適否の判定結果を前記用例データ
ベースに登録する用例調整手段を備えることを特徴とす
る。
【0035】請求項7の本発明の機械翻訳装置は、前記
用例データベースにおける各前記用例データは、前記文
章句の前方の語句のデータと、後方の語句のデータと、
前記前方の語句と前記後方の語句の間に前記指定された
連結機能語を挿入することの適否を示すデータから成る
ことを特徴とする。
【0036】請求項8の本発明の機械翻訳装置は、前記
用例データベースにおける各前記用例データは、前記文
章句の前方の語句のデータと、後方の語句のデータと、
前記前方の語句と前記後方の語句の間に前記指定された
連結機能語を備える正用例を前記正用例抽出手段が検出
した回数を示すデータと、前記指定された連結機能語を
備えない負用例を前記負用例抽出手段が検出した回数を
示すデータと、前記前方の語句と前記後方の語句の間に
前記指定された連結機能語を挿入することの適否を示す
データから成ることを特徴とする。
【0037】請求項9の本発明の機械翻訳装置は、前記
用例調整手段は、正用例を前記正用例抽出手段が検出し
た回数が、負用例を前記負用例抽出手段が検出した回数
よりも多い場合には、当該用例データの前記前方の語句
と前記後方の語句の間に前記指定された連結機能語を挿
入するものと判定し、そうでない場合には、当該用例デ
ータの前記前方の語句と前記後方の語句の間に前記指定
された連結機能語を挿入しないものと判定することを特
徴とする。
【0038】請求項10の本発明の機械翻訳装置は、前
記形態素解析手段は、前記入力された目的言語の文章デ
ータから、前記文章データを構成する単語を識別し、各
前記単語の品詞を判定し、この単語とその品詞の情報を
形態素列として出力する手段を備えることを特徴とす
る。
【0039】請求項11の本発明の機械翻訳装置は、前
記指定された種類の文章句の一つを名詞句とし、前記対
象句構成要素抽出手段は、前記形態素列中の名詞である
単語の連続する個所を名詞句と認識し、これを構成要素
列として抽出する手段を備えることを特徴とする。
【0040】請求項12の本発明の機械翻訳装置は、前
記目的言語を日本語とし、前記指定された連結機能語の
一つを、格助詞の「の」とすることを特徴とする。
【0041】請求項13の本発明の機械翻訳方法は、翻
訳元の言語である原言語の文章を、翻訳先の言語である
目的言語に翻訳する機械翻訳方法において、目的言語の
指定された種類の文章句の単語データと、各前記文章句
内における指定された連結機能語の適否に関する情報と
を示す用例データをデータベースに記録し参照する用例
参照ステップと、目的言語の文章中における連結機能語
の使用の適否を、前記用例参照ステップが参照する前記
用例データを基に判断し、前記文章中の適切な位置に連
結機能語を設定し、連結機能語の使用を適切に修正した
文章を生成する目的言語生成ステップを備えることを特
徴とする。
【0042】請求項14の本発明の機械翻訳方法は、翻
訳元の言語である原言語の文章を、翻訳先の言語である
目的言語に翻訳する機械翻訳方法において、入力された
翻訳対象の文章である原言語文を解析する原言語解析ス
テップと、前記原言語解析ステップによる解析に基づ
き、前記原言語文の各単語と文章構造を、翻訳先の言語
である目的言語の単語と文章構造に変換したデータであ
る変換データを生成する言語変換ステップと、目的言語
の指定された種類の文章句の単語データと、各前記文章
句内における指定された連結機能語の適否に関する情報
とを示す用例データをデータベースに記録し参照する用
例参照ステップと、前記変換データ中における連結機能
語の使用の適否を、前記用例参照ステップが参照する前
記用例データを基に判断し、前記変換データ中の適切な
位置に連結機能語を設定し、翻訳結果の文章である目的
言語文を生成する目的言語生成ステップを備えることを
特徴とする。
【0043】請求項15の本発明の機械翻訳方法は、前
記目的言語生成ステップは、目的言語の文章の構造を解
析して、文章中の前記指定された種類の文章句の部分を
処理対象の句として検出する対象句同定ステップと、前
記用例参照ステップが参照する前記用例データを基に、
前記処理対象の句に対し、適切な場合に適切な個所に適
切な連結機能語を挿入する連結機能語挿入ステップと、
前記連結機能語挿入ステップによる挿入処理と、前記対
象句同定ステップによる解析結果に従い、目的言語の文
章を生成する目的言語文生成ステップを備えることを特
徴とする。
【0044】請求項16の本発明の機械翻訳方法は、入
力された目的言語の文章データを基に、前記用例参照ス
テップが参照する前記データベースに対し、自動的に新
たな用例データを編集し登録し更新する用例データベー
ス作成ステップを備えることを特徴とする。
【0045】請求項17の本発明の機械翻訳方法は、前
記用例データベース作成ステップは、前記入力された目
的言語の文章データを解析し、解析データを形態素列と
して出力する形態素解析ステップと、前記形態素列か
ら、前記指定された種類の文章句のデータを構成要素列
として抽出する対象句構成要素抽出ステップと、前記構
成要素列から、前記指定された連結機能語を含む用例で
ある正用例を検出する正用例抽出ステップと、前記正用
例抽出ステップが検出する前記正用例に係る前記用例デ
ータを生成し、前記用例参照ステップが参照する前記デ
ータベースに登録する用例登録ステップを備えることを
特徴とする。
【0046】請求項18の本発明の機械翻訳方法は、前
記用例データベース作成ステップは、前記構成要素列か
ら、前記指定された連結機能語を含まない用例である負
用例を検出する負用例抽出ステップを備え、前記用例登
録ステップは、前記負用例抽出ステップが検出する前記
負用例に係る前記用例データを生成し、前記用例参照ス
テップが参照する前記データベースに登録を行い、前記
用例データベース作成ステップは、登録された前記用例
データにおける前記正用例と前記負用例の情報を基に、
当該文章句内における前記指定された連結機能語の使用
の適否を判定し、この適否の判定結果を前記用例参照ス
テップが参照する前記データベースに登録する用例調整
ステップを備えることを特徴とする。
【0047】請求項19の本発明の機械翻訳プログラム
を記録した記憶媒体は、翻訳元の言語である原言語の文
章を、翻訳先の言語である目的言語に翻訳する機械翻訳
プログラムを記録した記憶媒体において、目的言語の指
定された種類の文章句の単語データと、各前記文章句内
における指定された連結機能語の適否に関する情報とを
示す用例データをデータベースに記録し参照する用例参
照ステップと、目的言語の文章中における連結機能語の
使用の適否を、前記用例参照ステップが参照する前記用
例データを基に判断し、前記文章中の適切な位置に連結
機能語を設定し、連結機能語の使用を適切に修正した文
章を生成する目的言語生成ステップを備えることを特徴
とする。
【0048】請求項20の本発明の機械翻訳プログラム
を記録した記憶媒体は、翻訳元の言語である原言語の文
章を、翻訳先の言語である目的言語に翻訳する機械翻訳
プログラムを記録した記憶媒体において、入力された翻
訳対象の文章である原言語文を解析する原言語解析ステ
ップと、前記原言語解析ステップによる解析に基づき、
前記原言語文の各単語と文章構造を、翻訳先の言語であ
る目的言語の単語と文章構造に変換したデータである変
換データを生成する言語変換ステップと、目的言語の指
定された種類の文章句の単語データと、各前記文章句内
における指定された連結機能語の適否に関する情報とを
示す用例データをデータベースに記録し参照する用例参
照ステップと、前記変換データ中における連結機能語の
使用の適否を、前記用例参照ステップが参照する前記用
例データを基に判断し、前記変換データ中の適切な位置
に連結機能語を設定し、翻訳結果の文章である目的言語
文を生成する目的言語生成ステップを備えることを特徴
とする。
【0049】請求項21の本発明の機械翻訳プログラム
を記録した記憶媒体は、前記目的言語生成ステップは、
目的言語の文章の構造を解析して、文章中の前記指定さ
れた種類の文章句の部分を処理対象の句として検出する
対象句同定ステップと、前記用例参照ステップが参照す
る前記用例データを基に、前記処理対象の句に対し、適
切な場合に適切な個所に適切な連結機能語を挿入する連
結機能語挿入ステップと、前記連結機能語挿入ステップ
による挿入処理と、前記対象句同定ステップによる解析
結果に従い、目的言語の文章を生成する目的言語文生成
ステップを備えることを特徴とする。
【0050】請求項22の本発明の機械翻訳プログラム
を記録した記憶媒体は、入力された目的言語の文章デー
タを基に、前記用例参照ステップが参照する前記データ
ベースに対し、自動的に新たな用例データを編集し登録
し更新する用例データベース作成ステップを備えること
を特徴とする。
【0051】請求項23の本発明の機械翻訳プログラム
を記録した記憶媒体は、前記用例データベース作成ステ
ップは、前記入力された目的言語の文章データを解析
し、解析データを形態素列として出力する形態素解析ス
テップと、前記形態素列から、前記指定された種類の文
章句のデータを構成要素列として抽出する対象句構成要
素抽出ステップと、前記構成要素列から、前記指定され
た連結機能語を含む用例である正用例を検出する正用例
抽出ステップと、前記正用例抽出ステップが検出する前
記正用例に係る前記用例データを生成し、前記用例参照
ステップが参照する前記データベースに登録する用例登
録ステップを備えることを特徴とする。
【0052】請求項24の本発明の機械翻訳プログラム
を記録した記憶媒体は、前記用例データベース作成ステ
ップは、前記構成要素列から、前記指定された連結機能
語を含まない用例である負用例を検出する負用例抽出ス
テップを備え、前記用例登録ステップは、前記負用例抽
出ステップが検出する前記負用例に係る前記用例データ
を生成し、前記用例参照ステップが参照する前記データ
ベースに登録を行い、前記用例データベース作成ステッ
プは、登録された前記用例データにおける前記正用例と
前記負用例の情報を基に、当該文章句内における前記指
定された連結機能語の使用の適否を判定し、この適否の
判定結果を前記用例参照ステップが参照する前記データ
ベースに登録する用例調整ステップを備えることを特徴
とする。
【0053】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0054】本発明の機械翻訳装置は、自然言語の翻訳
処理等において、連結機能語の用例のデータを参照する
ことで、文章中の各種の句の翻訳において自然な翻訳結
果を出力することを特徴とする。
【0055】なお、以下翻訳元の言語を原言語と言い、
翻訳先の言語を目的言語と言う。例えば英日翻訳におい
ては英語が原言語であり日本語が目的言語である。
【0056】また翻訳する翻訳元の文章データ(文章又
は文字列、単語等)を原言語文字列と言い、翻訳結果と
して生成する文章データを目的言語文と言う。
【0057】図1は、本発明の第1の実施の形態の機械
翻訳装置の構成を示すブロック図である。
【0058】図1を参照すると、本実施例の機械翻訳装
置は、翻訳元の文章データである原言語文字列の入力を
受け付ける入力手段10と、入力手段10に入力された
原言語文字列を解析する原言語解析手段20と、原言語
解析手段20が出力する解析結果を目的言語の構造に変
換する言語変換手段30と、言語変換手段30が変換し
た目的言語の構造から目的言語文を生成する目的言語生
成手段40と、目的言語生成手段40が生成した目的言
語文を出力する出力手段50を備える。
【0059】特に目的言語生成手段40は、目的言語に
おける所定の連結機能語に関する句の用例を格納する連
結機能語用例データベース41と、言語変換手段30が
変換した目的言語の構造を解析して処理対象とすべき句
に相当する部分構造を同定する対象句同定手段42と、
連結機能語用例データベース41に格納された用例に従
って対象句同定手段42で同定された句の適切な個所に
連結機能語を挿入する連結機能語挿入手段43と、連結
機能語挿入手段43の連結機能語の挿入処理等に従い目
的言語の構造から目的言語文を生成する目的言語文生成
手段44を備える。
【0060】次に、本実施の形態の機械翻訳装置の動作
を説明する。
【0061】図2は、本実施の形態の機械翻訳装置の翻
訳処理を説明するためのフローチャートである。
【0062】ここでは、本実施の形態の機械翻訳装置の
用例を用いる翻訳処理を、特に2つの単語の間に所定の
連結機能語を挿入するかどうかの判断処理を行う一具体
例を用いて説明する。
【0063】図2を参照すると、まず入力手段10は、
翻訳対象となる原言語文字列の入力を受け付ける(ステ
ップ201)。
【0064】この翻訳する文章データの入力処理は、例
えばキーボードやOCR、音声認識による入力方法によ
るものや、また外部記憶装置等の記憶媒体に電子データ
として記録された文章データを直接読み込むこと等によ
り実現できる。
【0065】次に、原言語解析手段20は、入力手段1
0から読み込んだ原言語文字列を解析して文章の構造を
計算する(ステップ202)。
【0066】言語変換手段30は、翻訳知識のデータを
参照して、原言語解析手段20が出力した翻訳対象の文
章構造を、目的言語の文章構造に変換する(ステップ2
03)。
【0067】次に、目的言語生成手段40は、言語変換
手段30が出力した目的言語の構造から目的言語文を生
成する。
【0068】これは、まず対象句同定手段42は、ステ
ップ203で言語変換手段30が目的言語の文章構造に
変換したデータの中から、連結機能語挿入処理の対象と
なる句の部分を同定する(ステップ204)。
【0069】具体的には、入力された文章データの句構
造を構成する各単語を検査し、検査対象の句の構成要素
である2単語が互いに直接係る場合に、この部分を連結
機能語挿入処理の対象の句として抽出する。
【0070】連結機能語挿入手段43は、連結機能語用
例データベース41に格納された用例を参照し、適切な
場合においては所定の格助詞を、対象句同定手段42が
処理対象として同定した句に挿入する。
【0071】連結機能語用例データベース41は、所定
の連結機能語に関する句の用例を格納している。
【0072】ここで、連結機能語用例データベース41
に用例を格納する方式の一具体例としては、句を構成す
る2つの単語の組と、その2つの単語の間に所定の連結
機能語を挿入(表出)すべきかどうかを示す連結機能語
表出フラグとの対応を記録するテーブルを用いて構成す
ることができる。
【0073】具体的には、まず対象句同定手段42が同
定した処理対象の句構造を一つ取り出す(ステップ20
5)。これは、挿入処理を行うかどうかの判定がまだ未
処理の句が残っているかどうかをチェックし(ステップ
206)、未処理の句が残っていたらこれを取り出すの
である。そして、取り出した処理対象の句を構成する2
つの単語を連結機能語用例データベース41で検索する
(ステップ207)。
【0074】次に、得られた検索結果をチェックし(ス
テップ208)、もし検索結果として用例が得られ、か
つその用例の連結機能語表出フラグが連結機能語を挿入
すべきである旨を示していれば、処理対象の句に所定の
連結機能語を挿入する(ステップ209)。
【0075】以上の挿入処理を行うかどうかの判定処理
を、対象句同定手段42が同定した処理対象の句構造に
対し実行し、挿入処理を実行する(ステップ206)。
【0076】全ての処理対象の句構造に対する処理の終
了後、目的言語文生成手段44は、連結機能語挿入手段
43が連結機能語処理を施した目的言語の構造に含まれ
る単語を並べて活用変形等の処理を行い、目的言語の文
を生成する(ステップ210)。
【0077】そして出力手段50は、目的言語生成手段
40が生成した目的言語文を出力する(ステップ21
1)。
【0078】この翻訳結果の出力方式としては、例えば
ディスプレイ等の表示装置や、音声合成装置によるスピ
ーカからの出力や、また外部記憶装置等の記憶媒体に電
子データとして直接出力する等の方式により実現でき
る。
【0079】次に、本実施の形態の機械翻訳装置の具体
的な翻訳動作の一例を、図3から図6を用いて具体的に
説明する。
【0080】以下の具体例では、翻訳元の言語である原
言語を英語とし、翻訳先の言語である目的言語を日本語
とする英日翻訳の例により説明するが、本実施の形態の
機械翻訳装置の翻訳処理はこれに限られるものではな
く、仏日翻訳、独日翻訳、露日翻訳や日英翻訳等任意の
言語間の翻訳に適用可能である。
【0081】また以下では処理対象の句として名詞句を
考え、また所定の連結機能語として格助詞の「の」を考
えるが、本発明の範囲はこれに限られるものではなく、
形容詞句や動詞句等の任意の句構造、及び「な」「か
ら」「より」「に」「へ」「は」「が」等の任意の連結
機能語に対して適用可能である。
【0082】ここで翻訳対象の英文として“I wen
t to the baseball game.”が
入力手段10に入力された場合を考える。
【0083】ここで入力された英文は、原言語解析手段
20により構文構造に解析され、さらに言語変換手段3
0により目的言語の構文構造に変換される。
【0084】図3は、本実施の形態の原言語解析手段に
よる翻訳対象の英文の構文構造の解析一例を示す図であ
る。図3では、各リーフノードに入力文中の各単語が割
り当て、その単語間の依存関係をツリー構造で示してい
る。
【0085】例えば、図3に見られる「basebal
l game」に対する構造を参照すると、この2単語
の間には直接の依存関係があり、2つがまとまって名詞
句(NP)を作っていることが分かる。
【0086】さらに、この図では各ノードに対して、そ
の下位の構造の代表語となるヘッドワードを付与してお
り、またその関係を太線で表わしている。
【0087】つまり「baseball game」と
いう名詞句の構造では「game」がヘッドワードであ
り、その一つ上の構造は「the」と「game」の間
の関係として捉えることができる。
【0088】図4は、本発明の第1の実施の形態の言語
変換手段による変換結果の日本文の構文構造の一例を示
す図である。図4では、入力英文中の各単語に対する日
本語訳を、日本語の語順で各リーフノードに割り当てて
いる。
【0089】また、図3と同様に、その単語間の依存関
係をツリー構造で示しているが、図4ではさらに各々の
単語の依存関係を示す連結語も付与されている。
【0090】例えば「私」と「行く」の間には、「が」
で結ばれる主語−述語の関係があることが示されてい
る。
【0091】図5は、本発明の第1の実施の形態の連結
機能語用例データベース41に格納された用例データの
一例を示す図である。
【0092】図5では、格助詞の「の」の係り元と係り
先に出現しうる名詞の組が単語1と単語2のカラムに格
納されている。
【0093】さらに、それぞれの単語の組にはその間に
格助詞の「の」を表出すべきかどうかを表わす連結機能
語表出フラグが格納されている。ここで、連結機能語表
出フラグは“1”で表出すべき、“0”で表出すべきで
ないということを示すものとする。
【0094】言語変換手段30で変換された目的言語の
構文構造は、対象句同定手段42に送られる。
【0095】対象句同定手段42は、受け取った構文構
造中の各単語を検査して名詞やそれに類する単語を探
し、その係り先が名詞かそれに類する単語であった場
合、これを処理対象の名詞句として抽出する。
【0096】図4を参照すると、ここではまず「私」と
いう単語を検査する。
【0097】「私」は代名詞であり名詞に類する単語と
して認定できるが、その係り先が「行く」という動詞で
あるため、これは処理対象外であると認定する。
【0098】次に「野球」という単語を検査し、これが
名詞であり、かつ「試合」という名詞に係るため、「野
球/試合」に対する構文構造を処理対象の名詞句として
同定する。
【0099】同様に全ての単語をチェックして全ての処
理対象を同定する。
【0100】ここで同定された処理対象の名詞句は一つ
ずつ連結機能語挿入手段43に送られる。
【0101】連結機能語挿入手段43は、対象句同定手
段42で同定された処理対象の名詞句に含まれる2つの
名詞、あるいはそれに類する単語を用いて連結機能語用
例データベース41を検索する。
【0102】ここでは係り元となる単語1が「野球」で
あり、係り先となる単語2が「試合」であるような用例
を検索する。
【0103】ここで得られた検索結果の連結機能語表出
フラグをチェックするとこれが“1”であり、この間に
は格助詞「の」を挿入すべきである旨が分かる。
【0104】連結機能語挿入手段43は、ここで得られ
た結果に従って「野球」が「試合」にかかる部分の関係
として「の」を挿入する。
【0105】図6は、本実施の形態の連結機能語挿入処
理の処理結果の一例を示す図である。
【0106】ここで得られた構文構造は目的言語文生成
手段44に送られ、日本語文として生成される。
【0107】ここでは単語間の関係を表わす「が」
「の」「に」や過去の「た」などが助詞として表出する
と共に活用変形などを行うことで、「私は野球の試合に
行った」という日本語文が生成される。
【0108】ここで生成された日本語文は、出力手段5
0に送られ、出力される。
【0109】図7は、本発明の第1の実施の形態の機械
翻訳装置の一実施例の構成を示すブロック図である。
【0110】図7を参照すると、本実施例は入出力機能
及び情報処理機能等を備えるコンピュータ処理装置90
において、本実施の形態の目的言語生成手段40等の各
機能を備える機械翻訳プログラムをメモリにロードする
ことで実現することができる。この機械翻訳プログラム
は、磁気ディスク、磁気テープ、光ディスク、半導体メ
モリ又はその他のコンピュータ等によって読み取りが可
能な記憶媒体100に格納される。そして、その記憶媒
体100からコンピュータ処理装置90にロードされ、
コンピュータ処理装置90の動作を制御することによ
り、上述した各機能を実現する。
【0111】つまり、この記憶媒体100に格納された
機械翻訳プログラムは、記憶媒体100からコンピュー
タ処理装置90のメモリに読み込まれ、コンピュータ処
理装置90の動作を制御することにより、コンピュータ
処理装置90上に連結機能語用例記憶部941といった
記憶部を実現すると共に、入力部91、原言語解析部9
2、言語変換部93、対象句同定部942、連結機能語
挿入部943、目的言語文生成部944、出力部95と
いった各機能を実現するのである。
【0112】ここで、図1の第1の実施の形態との関係
では、入力部91が入力手段10に、原言語解析部92
が原言語解析手段20に、言語変換部93が言語変換手
段30に、目的言語生成部94内の各部が目的言語生成
手段40内の各手段に、出力部95が出力手段50に、
それぞれ対応する。
【0113】本実施例は、コンピュータ処理装置90が
機械翻訳プログラムの制御により動作する点に特徴があ
り、基本的な機能は図1や図2と同じである。
【0114】つまり、コンピュータ処理装置90は、機
械翻訳プログラムの制御により以下の処理を実行する。
【0115】入力部91への翻訳対象のデータの入力に
よって、入力部91は翻訳対象となる原言語文字列の入
力を受け取り、原言語解析部92を起動する。
【0116】原言語解析部92は、入力部91から入力
された原言語文字列を解析し、言語変換部93を起動す
る。
【0117】言語変換部93は、言語解析部92が出力
した翻訳対象に対する解析結果の構造を目的言語の構造
に変換した後、対象句同定部942を起動する。
【0118】対象句同定部942は、言語変換部93が
出力した目的言語の構造の中から連結機能語挿入処理の
対象となる句の部分構造を同定し、各々に対して連結機
能語挿入部943を起動する。
【0119】連結機能語挿入部943は、連結機能語用
例記憶部941に格納された用例を参照して適切な場合
には、対象句同定部942で同定された句の部分構造に
所定の格助詞を挿入する。
【0120】ここでは、対象句同定部942が同定した
部分構造の全てに対して連結機能語挿入処理を行った
後、目的言語文生成部944を起動する。
【0121】目的言語文生成部944は、連結機能語挿
入部943が連結機能語処理を施した目的言語の構造に
含まれる単語を並べて活用変形等の処理を行い、目的言
語の文を生成する。
【0122】出力部95は、目的言語生成部94で生成
された目的言語文を出力する。
【0123】以上説明した本実施の形態の機械翻訳装置
により、連結機能語の使用の適否を示す用例データを用
いるため、連接機能語を適切に出力して文章中の各句を
適切に翻訳し、自然な翻訳結果を出力することができ
る。
【0124】また、原言語から目的言語への対訳用例を
用いるのではなく、目的言語のみの用例データを参照す
るため、翻訳処理中に目的言語に変換した文章に対し、
適切な文章への修正処理を実行することができる。
【0125】図8は、本発明の第2の実施の形態の機械
翻訳装置の構造を示すブロック図である。
【0126】本実施の形態の機械翻訳装置は、自動的に
収集した連結機能語用例を用いることで、低コストで自
然な翻訳結果を出力するものである。
【0127】本実施の形態の機械翻訳装置が、図1の第
1の実施の形態の機械翻訳装置と相違する点は、連結機
能語用例データベース41を自動的に作成する用例デー
タベース作成手段60を備える点にある。
【0128】本実施例における用例データベース作成手
段60は、目的言語文字列の入力を受け付ける用例入力
手段61と、用例入力手段61から入力された文字列を
解析して形態素列を出力する形態素解析手段62と、目
的言語の形態素列から対象となる句の構成要素列を抽出
する対象句構成要素抽出手段63と、形態素解析手段6
2で解析された形態素列から対象句構成要素抽出手段6
3で抽出された構成要素列を参照して所定の連結機能語
を含む連結機能語正用例を抽出する正用例抽出手段64
と、正用例抽出手段64で抽出された正用例を連結機能
語用例データベース41に登録する用例登録手段65と
から構成される。
【0129】ここで、正用例とは、用例データベース4
1に登録される用例において単語間に連結機能語を含む
用例のことである。
【0130】次に、本実施の形態の機械翻訳装置の動作
を説明する。
【0131】本実施の形態の機械翻訳装置の動作の、第
1の実施の形態の機械翻訳装置の動作と相違する点は、
用例データベース作成手段60による連結機能語用例デ
ータベース41を自動的に作成するステップを備えるこ
とであり、他の入力手段10、原言語解析手段20、言
語変換手段30、目的言語生成手段40、出力手段50
の動作は、第1の発明の実施例の動作で説明したものと
同じである。以下、本実施の形態の特徴である用例デー
タベース作成手段60の動作について説明する。
【0132】図9は、本実施の形態の用例データベース
作成手段60の動作を説明するためのフローチャートで
ある。図2のフローチャートにおいては翻訳の実行のた
めの翻訳元の言語の原言語文字列の入力・解析を行った
のに対し、ここでは用例データの登録のための翻訳先の
言語の目的言語文字列の入力・解析を実行する。
【0133】用例入力手段61は、用例抽出の対象とな
る目的言語文字列の入力を受け付ける(ステップ90
1)。
【0134】これは例えばキーボードやOCR、音声認
識装置等を用いる入力方式や、また外部記憶装置等に記
憶された原言語文字列の電子データを直接読み込む方式
等により実現できる。
【0135】形態素解析手段62は、用例入力手段61
から入力された目的言語文字列を形態素解析し、形態素
列に分解する(ステップ902)。ここで形態素列は、
図10の例に示されるように目的言語文字列の各単語
と、その各単語が成す品詞等を示す情報である。
【0136】正用例抽出手段64は、形態素解析手段6
2が解析結果として出力した形態素列の中から連結機能
語用例データベース41に登録すべき用例を抽出する。
【0137】具体的には、まず形態素解析手段62が解
析結果として出力した形態素列の中から所定の連結機能
語(「の」等)を検索する(ステップ903)。
【0138】ここで得られた検索結果をチェックし(ス
テップ904)、形態素列中に所定の連結機能語がある
場合には、その全てに対して次の処理を実行する。
【0139】まず処理対象となる連結機能語の直前の形
態素aが登録の対象となる句の構成要素であるかどうか
をチェックする(ステップ905)。これは、形態素a
の品詞が名詞や形容詞等であるか、また当該連結機能語
を挟む句を構成するか等をチェックする。
【0140】この形態素aが、対象となる句の構成要素
である場合、その連結機能語の後ろにある形態素列(又
は形態素)を対象句構成要素抽出手段63に渡し、その
連結機能語の直後の構成要素列を抽出する(ステップ9
06)。
【0141】対象句構成要素抽出手段63が構成要素列
が抽出できたかどうかをチェックし(ステップ90
7)、正常に抽出でき場合には、例えば図5の例等に示
される記録形態に合わせて記録するため、形態素aとそ
の構成要素列の最後の形態素bの組を用例として抽出
し、用例登録手段65に渡す(ステップ908)。
【0142】用例登録手段65は、正用例抽出手段64
が用例として抽出した形態素aと形態素bの組を連結機
能語用例データベース41に登録する(ステップ90
9)。
【0143】ここで、連結機能語用例データベース41
に格納する用例としては、図5の例に示されるように2
つの単語の組と、その2つの単語の間に所定の連結機能
語を表出すべきかどうかを表わす連結機能語表出フラグ
とで構成することができる。
【0144】用例登録手段65による連結機能語用例デ
ータベース41への登録方式として、既に登録済みの用
例に対しては、連結機能語表出フラグと共に、あるいは
その代わりとして、ステップ909において連結機能語
用例データベース41に登録が指示された回数の情報を
図11に示すように格納する形態も可能である。
【0145】さらにまた、各々の単語の組に対して、連
結機能語表出フラグにより連結機能語を用いるか用いな
いかの二者択一の形式で登録するのではなく、単語間に
所定の連結機能語が出現する確率の情報により(又、出
現回数と出現しない回数の情報により)登録する形態も
可能である。
【0146】本実施の形態の翻訳処理においては、用例
データベース作成手段60で作成された連結機能語用例
データベース41を用いて、第1の実施の形態の動作で
説明した処理を実行する。
【0147】次に、第2の実施の形態の機械翻訳装置の
具体的な動作について、図面を参照して詳細に説明す
る。
【0148】以下では、翻訳元の言語である原言語を英
語とし、翻訳先の言語である目的言語を日本語とする例
により説明するが、本実施の形態の機械翻訳装置が翻訳
を行う言語はこれに限られるものではなく、任意の言語
間の翻訳に対しても同様に適用可能である。
【0149】また、以下では名詞句を処理対象の句と
し、格助詞の「の」を所定の連結機能語とする例により
説明するが、本実施の形態の機械翻訳装置が処理する処
理対象の句及び連結機能語はこれに限られるものではな
く、任意の句構造、連結機能語に対しても同様に適用可
能である。
【0150】本実施の形態の機械翻訳装置が、第1の実
施の形態と相違する点は、用例データベース作成手段6
0により連結機能語用例データベース41を自動的に作
成する処理であり、他の入力手段10、原言語解析手段
20、言語変換手段30、目的言語生成手段40、出力
手段50の各部の動作は第1の実施の形態の動作で説明
したものと同じである。このため、以下では本実施の形
態の特徴である用例データベース作成手段60の動作に
ついて具体的に説明する。
【0151】「私は野球の試合に行くのが好きだ」とい
う日本語文を、用例抽出の処理対象として説明する。
【0152】まず、この処理対象の日本語文を、用例入
力手段61に入力する。すると、形態素解析手段62
は、入力された日本語文を形態素解析し形態素列に変換
する。
【0153】図10は、本実施の形態の形態素解析手段
による形態素解析の結果として得られた形態素列の一例
を示す図である。
【0154】図10の例では、各行に一つの形態素が示
されており、各々には形態素の文字列(単語)とその品
詞が示されている。
【0155】形態素解析手段62で得られたこの形態素
解析結果は、正用例抽出手段64に送られ、そこに含ま
れる用例を抽出する。
【0156】まず正用例抽出手段64は、得られた形態
素解析結果から所定の連結機能語を検索する。
【0157】ここでは格助詞の「の」を検索すると、4
番目の形態素が格助詞の「の」であり、この位置が検索
結果として得られる。
【0158】次に正用例抽出手段64は、得られた検索
結果の直前の形態素(単語)である「野球」の品詞を調
べる。品詞が名詞等の場合には用例の抽出すべき候補で
あり、助詞等の場合には用例の抽出すべき候補ではない
ものと判断する。
【0159】ここで「野球」の品詞は名詞であり、用例
の抽出すべき候補である。このため、正用例抽出手段6
4は、4番目の形態素である処理対象の格助詞「の」
の、次から始まる形態素列を対象句構成要素抽出手段6
3に送る。そして、対象句構成要素抽出手段63は、正
用例抽出手段64から送られた形態素列から、処理対象
とする名詞句の構成要素列として名詞連続部分を抽出す
る。
【0160】正用例抽出手段64が抽出する名詞句の長
さは、予め定めた所定の単語数を抽出する方式や、格助
詞「の」以後の各単語の品詞を順次チェックし名詞等の
名詞句を構成する品詞が続く範囲の単語を抽出する方式
や、格助詞「の」以後に最初に句読点が表れるまでの単
語を抽出する方式等が可能である。
【0161】ここでは、正用例抽出手段64から、例え
ば「試合/に/行く/の/が/好き/だ」という形態素
列が対象句構成要素抽出手段63に送られたものとして
説明する。
【0162】まず、対象句構成要素抽出手段63は、格
助詞「の」以後の1番目の形態素「試合」の品詞を調べ
ると名詞であるため、この形態素は名詞連続の一部(名
詞句の一部)であると判断する。
【0163】次に2番目の形態素「に」の品詞を調べる
とその品詞は格助詞であるため、この形態素は名詞連続
に属さないと判断し、直前の形態素「試合」までの形態
素列を名詞連続部分として抽出する。
【0164】以上の処理により「試合」が名詞連続部分
として抽出され、正用例抽出手段64に送られる。
【0165】正用例抽出手段64は、対象句構成要素抽
出手段63で抽出された名詞連続部分の最後の形態素
を、現在処理対象としている連結機能語の係り先の形態
素として抽出する。
【0166】ここでは「試合」が抽出され、用例として
は「野球」「試合」の形態素の組が得られるため、これ
を用例登録手段65に送る。
【0167】用例登録手段65は、正用例抽出手段64
が用例として抽出した形態素の組を連結機能語データベ
ース41に登録する。
【0168】ここでは「野球」「試合」の形態素の組を
登録するが、対象となる連結機能語データベース41と
して図11に示したものを考える。図11は、本発明の
第2の実施の形態の連結機能語用例データベースに格納
された用例データの一例を示す図である。
【0169】図11を参照すると、ここには格助詞の
「の」の係り元と係り先に出現しうる名詞の組が単語1
と単語2のカラムに格納されている。
【0170】さらにそれぞれの単語の組にはその間に格
助詞の「の」を表出すべきかどうかを表わす連結機能語
表出フラグが格納されている。
【0171】ここで連結機能語表出フラグは“1”で表
出すべき、“0”で表出すべきでないということを表わ
しているものとする。
【0172】さらに各々の単語の組には、それらの単語
の間に所定の連結機能語が出現した用例に関して、連結
機能語用例データベース41に登録された用例の数が格
納されている。
【0173】例えば「野球」「試合」の組み合わせを参
照すると、「野球の試合」と格助詞「の」を伴って出現
した用例が54回登録されていることが分かる。
【0174】この連結機能語データベース41に対する
「野球」「試合」の形態素の組の登録では、まず単語1
が「野球」で単語2が「試合」である用例の正用例数を
1つ増やして55にする。
【0175】さらに、正用例数の増加に従って連結機能
語表出フラグも更新する。例えば、この用例の登録処理
によって正用例数が所定の閾値を超えた場合に連結機能
語表出フラグを1にするのである。
【0176】また第2の実施の形態における翻訳処理
は、ここで作成した連結機能語用例データベース41を
用いて、第1の発明の実施例の動作で説明した処理を実
行するものである。
【0177】図12は、本発明の第2の実施の形態の機
械翻訳装置の一実施例の構成を示すブロック図である。
【0178】図12を参照すると、本実施例は入出力機
能及び情報処理機能等を備えるコンピュータ処理装置9
0において、本実施の形態の目的言語生成手段40、用
例データベース作成手段60等の各機能を備える機械翻
訳プログラムをメモリにロードすることで実現すること
ができる。この機械翻訳プログラムは、磁気ディスク、
磁気テープ、光ディスク、半導体メモリ又はその他のコ
ンピュータ等によって読み取りが可能な記憶媒体100
に格納される。そして、その記憶媒体100からコンピ
ュータ処理装置90にロードされ、コンピュータ処理装
置90の動作を制御することにより、上述した各機能を
実現する。
【0179】つまり、この記憶媒体100に格納された
機械翻訳プログラムは、記憶媒体100からコンピュー
タ処理装置90のメモリに読み込まれ、コンピュータ処
理装置90の動作を制御することにより、コンピュータ
処理装置90上に連結機能語用例記憶部941といった
記憶部を実現すると共に、入力部91、原言語解析部9
2、言語変換部93、対象句同定部942、連結機能語
挿入部943、目的言語文生成部944、用例入力部9
61、形態素解析部962、対象句構成要素抽出部96
3、正用例抽出部964、用例登録部965、出力部9
5といった各機能を実現するのである。
【0180】ここで、図8の実施例との関係では、入力
部91が入力手段10に、原言語解析部92が原言語解
析手段20に、言語変換部93が言語変換手段30に、
目的言語生成部94内の各部が目的言語生成手段40内
の各手段に、出力部95が出力手段50に、用例生成部
96内の各部が用例データベース作成手段60内の各種
段に、それぞれ対応する。
【0181】本実施例は、コンピュータ処理装置90が
機械翻訳プログラムの制御により動作する点に特徴があ
り、基本的な機能は図8や図9と同じである。
【0182】つまり、コンピュータ処理装置90は、機
械翻訳プログラムの制御により以下の処理を実行する。
【0183】用例登録処理においては、まず入力部91
への用例の入力によって、用例入力部961は、用例抽
出の対象となる目的言語文字列の入力を受け付け、形態
素解析部962を起動する。
【0184】形態素解析部962は、用例入力部961
から入力された目的言語文字列を形態素解析し、形態素
列に分解した後、正用例抽出部964を起動する。
【0185】正用例抽出部964は、形態素解析部96
2が解析結果として出力した形態素列の中から連結機能
語用例記憶部941に登録すべき用例を抽出し、用例登
録部965を起動する。
【0186】用例を抽出する際には、形態素解析部96
2が解析結果として出力した形態素列の中から所定の連
結機能語を検索し、得られた連結機能語の直前の形態素
と、直後の形態素列から対象句構成要素抽出部963に
よって抽出された対象となる句の構成要素列とを用い
る。
【0187】用例登録部965は、正用例抽出部964
が用例として抽出した2つの形態素の組を、連結機能語
用例記憶部941に登録する。
【0188】さらに翻訳処理においては、用例作成部9
6で作成された連結機能語用例記憶部941を用いて、
第1実施の形態の動作で説明した処理を行う。
【0189】以上説明した本実施の形態の機械翻訳装置
により、単に目的言語の文章データを入力するのみで、
翻訳に使用する用例データを自動的に編集し生成でき
る。
【0190】図13は、本発明の第3の実施の形態の機
械翻訳装置の構成を示すブロック図である。
【0191】本実施の形態の機械翻訳装置は、自動的に
収集した連結機能語用例を用いることで、低コストで自
然な翻訳結果を出力することを特徴とする。
【0192】本実施の形態の機械翻訳装置の、図8の第
2の実施の形態の機械翻訳装置と相違する点は、用例デ
ータベース作成手段60aの内部構成にあり、負用例抽
出手段66と、用例調整手段67を新たに備えた点であ
る。
【0193】ここで、負用例とは、正用例と逆に用例デ
ータベース41に登録される用例において単語間に連結
機能語を含まない用例のことである。
【0194】つまり、本実施の形態の用例データベース
作成手段60aは、目的言語文字列の入力を受け付ける
用例入力手段61と、用例入力手段61から入力された
文字列を解析して形態素列を出力する形態素解析手段6
2と、目的言語の形態素列から対象となる句の構成要素
列を抽出する対象句構成要素抽出手段63と、形態素解
析手段62で解析された形態素列から対象句構成要素抽
出手段63で抽出された構成要素列を参照して所定の連
結機能語を含む連結機能語正用例を抽出する正用例抽出
手段64と、正用例抽出手段64で抽出された正用例を
連結機能語用例データベース41に登録する用例登録手
段65と、形態素解析手段62で解析された形態素列か
ら対象句構成要素抽出手段63で抽出された構成要素列
を参照して所定の連結機能語を含まない連結機能語負用
例を抽出する負用例抽出手段66と、負用例抽出手段6
6で抽出された負用例を用いて連結機能語用例データベ
ース41の内容を調整する用例調整手段67を備える。
【0195】次に、本実施の形態の機械翻訳装置の動作
を説明する。
【0196】図14は、本発明の第3の実施の形態の機
械翻訳装置の翻訳処理を説明するためのフローチャート
である。
【0197】本実施の形態の機械翻訳装置の動作の、第
2の実施の形態の機械翻訳装置と相違する点は、用例デ
ータベース作成手段60aによる連結機能語用例データ
ベース41を自動的に作成する処理であり、他の入力手
段10、原言語解析手段20、言語変換手段30、目的
言語生成手段40、出力手段50の動作は、第2の実施
の形態の及び第1の実施の形態の動作で説明したものと
同じである。このため、以下では本実施の形態の特徴で
ある用例データベース作成手段60の動作について説明
する。
【0198】まず、用例入力手段61は、用例抽出の対
象となる目的言語文字列の入力を受け付ける(ステップ
1401)。
【0199】この翻訳する文章データの入力処理は、例
えばキーボードやOCR、音声認識による入力方法によ
るものや、また外部記憶装置等の記憶媒体に電子データ
として記録された文章データを直接読み込むこと等によ
り実現できる。
【0200】形態素解析手段62は、用例入力手段61
から入力された目的言語文字列を形態素解析し、形態素
列に分解する(ステップ1402)。ここで解析結果の
各形態素には、各単語の品詞の情報も付与する。
【0201】正用例抽出手段64は、形態素解析手段6
2が解析結果として出力した形態素列の中から連結機能
語用例データベース41に登録すべき正用例を抽出す
る。
【0202】具体的には、まず形態素解析手段62が解
析結果として出力した形態素列の中から所定の連結機能
語を検索する(ステップ1403)。
【0203】そして、得られた検索結果をチェックし
(ステップ1404)、形態素列中に所定の連結機能語
があれば、その全てに対して次の処理を実行する。
【0204】まず処理対象となる連結機能語の直前の形
態素aが対象となる句の構成要素であるかどうかをチェ
ックする(ステップ1405)。
【0205】形態素aが対象となる句の構成要素である
場合、その連結機能語の後ろにある形態素列を対象句構
成要素抽出手段63に渡し、その連結機能語の直後の構
成要素列を抽出する(ステップ1406)。
【0206】対象句構成要素抽出手段63で構成要素列
が抽出できたかどうかをチェックし(ステップ140
7)、抽出できたら、例えば形態素aとその構成要素列
の最後の形態素bの組を用例として抽出し、用例登録手
段65に渡す(ステップ1408)。
【0207】用例登録手段65は、正用例抽出手段64
が正用例として抽出した形態素aと形態素bの組を連結
機能語用例データベース41に登録する(ステップ14
09)。
【0208】ここで連結機能語用例データベース41に
格納する用例としては、例えば2つの単語の組と、その
2つの単語の間に所定の連結機能語を表出すべきかどう
かを表わす連結機能語表出フラグとで構成することがで
きる。
【0209】また連結機能語表出フラグと共に、あるい
はその代わりとして、それらの単語の間に所定の連結機
能語が出現した正用例や、それらの単語が所定の連結機
能語を介さずに連続して出現した負用例について、連結
機能語用例データベース41に登録された用例の数を格
納してもよい。
【0210】さらに各々の単語の組に対して、その間に
所定の連結機能語が出現する確率を格納してもよい。
【0211】負用例抽出手段66は、形態素解析手段6
2が解析結果として出力した形態素列の中から連結機能
語用例データベース41に登録すべき負用例を抽出す
る。
【0212】具体的には、まず形態素解析手段62が解
析結果として出力した形態素列の中から、対象句構成要
素抽出手段63を用いて対象となる句の構成要素を抽出
する(ステップ1410)。
【0213】ここで2形態素以上の構成要素列が得られ
れば、その全てに対し次の処理を実行する。
【0214】まず、構成要素列の形態素の組み合わせを
一つ取り出す(ステップ1411)。
【0215】2形態素の組み合わせが取り出せたら(ス
テップ1412)、その構成要素列の中で前方に出現し
た形態素cと後方に出現した形態素dを負用例として抽
出し(ステップ1413)、用例調整手段67に渡す。
【0216】用例調整手段67は、負用例抽出手段66
が負用例として抽出した形態素cと形態素dの組を連結
機能語用例データベース41に登録し、既に登録済みで
ある場合にはその用例の連結機能語表出フラグなどを調
整する(ステップ1414)。
【0217】次に、本実施の形態の動作について、図面
を参照して具体的に説明する。
【0218】以下では、翻訳元の言語である原言語を英
語とし、翻訳先の言語である目的言語を日本語とする例
により説明するが、本実施の形態の機械翻訳装置が翻訳
を行う言語はこれに限られるものではなく、任意の言語
間の翻訳に対しても同様に適用可能である。
【0219】また、以下では名詞句を処理対象の句と
し、格助詞の「の」を所定の連結機能語とする例により
説明するが、本実施の形態の機械翻訳装置が処理する処
理対象の句及び連結機能語はこれに限られるものではな
く、任意の句構造、連結機能語に対しても同様に適用可
能である。
【0220】本実施の形態の機械翻訳装置の、第2の実
施の形態の機械翻訳装置と相違する点は、例データベー
ス作成手段60aによる連結機能語用例データベース4
1を自動的に作成する処理であり、他の入力手段10、
原言語解析手段20、言語変換手段30、目的言語生成
手段40、出力手段50の動作は第2の実施の形態及び
第1の実施の形態の動作で説明したものと同じである。
このため、以下では用例データベース作成手段60aの
動作について具体的に説明する。
【0221】「野球選手を見た」という日本語文を、用
例抽出の処理対象として説明する。
【0222】まず、この処理対象の日本語文を、用例入
力手段61に入力する。すると、形態素解析手段62
は、入力された日本語文を形態素解析し形態素列に変換
する。
【0223】図15は、本実施の形態の形態素解析手段
による形態素解析の結果として得られた形態素列の一例
を示す図である。
【0224】図15の例では、各行に一つの形態素が示
されており、各々には形態素の文字列(単語)とその品
詞が示されている。
【0225】形態素解析手段62で得られた形態素解析
結果は、正用例抽出手段64に送られ、そこに含まれる
正用例が抽出される。
【0226】まず、第2の実施の形態と同様に、得られ
た形態素解析結果から所定の連結機能語を検索する。
【0227】しかし、ここでの「野球選手を見た」とい
う日本文においては、格助詞の「の」を検索しても得ら
れないため正用例は抽出されないが、検索結果が存在す
る場合においては第2の実施の形態の動作で説明したも
のと同様に正用例の抽出、登録の処理を行う。
【0228】次に、形態素解析手段62で得られた形態
素解析結果は、負用例抽出手段66に送られ、そこに含
まれる負用例を抽出する。
【0229】これはまず、対象句構成要素抽出手段63
を起動して対象となる句の構成要素列を抽出する。対象
句構成要素抽出手段63は、入力された形態素列から対
象となる句の構成要素列を抽出するが、ここでは「野球
/選手/を/見/た」という形態素列が入力されたと考
える。
【0230】まず1番目の形態素「野球」の品詞を調べ
ると、名詞であるため、この形態素は名詞句の構成要素
であると判断する。
【0231】次に2番目の形態素「選手」の品詞を調べ
ると、その品詞もやはり名詞であるため、この形態素も
名詞句の構成要素であると判断する。
【0232】さらに3番目の形態素「を」の品詞を調べ
ると、格助詞であるため、この形態素は名詞句の構成要
素に属さないと判断し直前の形態素までの形態素列を名
詞句の構成要素列として抽出する。
【0233】以上により「野球/選手」が構成要素列と
して抽出され、負用例抽出手段66に送られる。
【0234】負用例抽出手段66は、対象句構成要素抽
出手段63で抽出された構成要素列に2つ以上の形態素
が含まれているかどうかをチェックし、その内部の形態
素の組み合わせを負用例として抽出する。
【0235】ここでは「野球」「選手」という2つの形
態素の組み合わせが負用例として抽出でき、これらを用
例調整手段67に送る。
【0236】用例調整手段67は、負用例抽出手段66
が負用例として抽出した形態素の組を用いて、連結機能
語データベース41内のデータを調整する。
【0237】これはまず「野球」「選手」の形態素の組
を登録するが、対象となる連結機能語データベース41
として図16の例に示したものを考える。
【0238】図16は、本実施の形態の連結機能語用例
データベースに格納された用例データの一例を示す図で
ある。
【0239】図16を参照すると、ここには格助詞の
「の」の係り元と係り先に出現しうる名詞の組が単語1
と単語2のカラムに格納されている。
【0240】さらに、各単語の組には、その間に格助詞
の「の」を表出すべきかどうかを示す連結機能語表出フ
ラグを格納している。
【0241】連結機能語表出フラグは、“1”で表出す
べき、“0”で表出すべきでないということを表わして
いるものとする。
【0242】各々の単語の組には、それらの単語の間に
所定の連結機能語を含む正用例の出現回数に関して、連
結機能語用例データベース41に登録された正用例の出
現回数を格納している。
【0243】例えば「野球」「選手」の組み合わせを参
照すると、正用例である「野球の選手」として格助詞
「の」を伴って出現した用例が8回登録されていること
が分かる。
【0244】またさらに各々の単語の組には、それらの
単語の間が所定の連結機能語を介さずに名詞連続内に出
現した負用例の出現回数に関しても同様に、連結機能語
用例データベース41に登録された負用例の出現回数を
格納している。
【0245】例えば「野球」「選手」の組み合わせを参
照すると、負用例である「野球選手」として格助詞
「の」を伴わずに名詞連続内に出現した用例が40回登
録されていることが分かる。
【0246】また、ここで説明中の連結機能語データベ
ース41に対する「野球」「選手」の形態素の組の登録
処理においては、まず単語1が「野球」で単語2が「選
手」である用例の負用例数を1つ増やして41にする処
理を実行する。
【0247】さらに負用例数の増加に従って連結機能語
表出フラグを更新する。この連結機能語表出フラグの更
新処理は、例えばこの用例の登録処理によって“正用例
数−負用例数”の値が所定の閾値(例えば“0回”)を
下回った場合に連結機能語表出フラグを0にする等の処
理を行う。
【0248】また、本実施の形態の翻訳処理に関して
は、ここで作成した連結機能語用例データベース41を
用いて、第2の実施の形態及び第1の実施の形態の動作
で説明したものと同じように行う。
【0249】図17は、本発明の第3の実施の形態の機
械翻訳装置の一実施例の構成を示すブロック図である。
【0250】図17を参照すると、本実施例は入出力機
能及び情報処理機能等を備えるコンピュータ処理装置9
0において、本実施の形態の目的言語生成手段40や用
例データベース作成手段60a等の各機能を備える機械
翻訳プログラムを、メモリにロードすることで実現する
ことができる。この機械翻訳プログラムは、磁気ディス
ク、磁気テープ、光ディスク、半導体メモリ又はその他
のコンピュータ等によって読み取りが可能な記憶媒体1
00に格納される。そして、その記憶媒体100からコ
ンピュータ処理装置90にロードされ、コンピュータ処
理装置90の動作を制御することにより、上述した各機
能を実現する。
【0251】つまり、この記憶媒体100に格納された
機械翻訳プログラムは、記憶媒体100からコンピュー
タ処理装置90のメモリに読み込まれ、コンピュータ処
理装置90の動作を制御することにより、コンピュータ
処理装置90上に連結機能語用例記憶部941といった
記憶部を実現すると共に、入力部91、原言語解析部9
2、言語変換部93、対象句同定部942、連結機能語
挿入部943、目的言語文生成部944、用例入力部9
61、形態素解析部962、対象句構成要素抽出部96
3、正用例抽出部964、用例登録部965、負用例抽
出部966、用例調整部967、出力部95といった各
機能を実現するのである。
【0252】ここで、図13の実施例との関係では、入
力部91が入力手段10に、原言語解析部92が原言語
解析手段20に、言語変換部93が言語変換手段30
に、目的言語生成部94内の各部が目的言語生成手段4
0内の各手段に、出力部95が出力手段50に、用例生
成部96a内の各部が用例データベース作成手段60a
内の各種段にそれぞれ対応する。
【0253】本実施例は、コンピュータ処理装置90が
機械翻訳プログラムの制御により動作する点に特徴があ
り、基本的な機能は図13や図14と同じである。
【0254】つまり、コンピュータ処理装置90は、機
械翻訳プログラムの制御により以下の処理を実行する。
【0255】用例登録処理においては、まず入力部91
への用例の入力によって、用例入力部961は、用例抽
出の対象となる目的言語文字列の入力を受け付け、形態
素解析部962を起動する。
【0256】形態素解析部962は、用例入力部961
から入力された目的言語文字列を形態素解析し、形態素
列に分解した後、正用例抽出部964を起動する。
【0257】正用例抽出部964は、形態素解析部96
2が解析結果として出力した形態素列の中から連結機能
語用例記憶部941に登録すべき正用例を抽出し、用例
登録部965を起動する。
【0258】正用例を抽出する際には、形態素解析部9
62が解析結果として出力した形態素列の中から所定の
連結機能語を検索し、得られた連結機能語の直前の形態
素と、直後の形態素列から対象句構成要素抽出部963
によって抽出された対象となる句の構成要素列とを用い
る。
【0259】用例登録部965は、正用例抽出部964
が用例として抽出した2つの形態素の組を連結機能語用
例記憶部941に登録する。
【0260】負用例抽出部966は、形態素解析部96
2が解析結果として出力した形態素列の中から連結機能
語用例記憶部941に登録すべき負用例を抽出し、用例
調整部967を起動する。
【0261】負用例の抽出は、まず形態素解析部962
が解析結果として出力した形態素列の中から対象句構成
要素抽出部963によって構成要素列を抽出し、得られ
た構成要素列の中で形態素の組み合わせを取ることで行
う。
【0262】用例調整部967は、負用例抽出部966
が用例として抽出した2つの形態素の組を連結機能語用
例記憶部941に登録し、その用例の連結機能語フラグ
を調整する。
【0263】さらに翻訳処理においては、用例作成部9
6で作成された連結機能語用例記憶部941を用いて、
第1第2の実施の形態の実施例の動作で説明した処理を
実行する。
【0264】以上説明した本実施の形態の機械翻訳装置
により、入力された目的言語の文章データから、文章句
に連接機能語を含む正用例と含まない負用例の双方の検
出回数等の情報を検出することにより、連接機能語の使
用の適否の適切な判定ができ、またこの適切な判定によ
る用例データ自動的に編集生成し、かつこの適切な判定
に基づく翻訳を実行することができる。
【0265】以上説明した各実施の形態においては、処
理対象の句を名詞句とし、処理対象の連結機能語を格助
詞「の」とした例により説明したが、これに限定される
ものではなく、また処理対象の句の種類や処理対象の連
結機能語の個数も一つに限定されるものではない。処理
対象の句の種類や処理対象の連結機能語の個数を複数と
する場合には、連結機能語用例データベース41に用例
データを記録するテーブルを複数備え、それぞれに各種
の句や連結機能語による用例データを記録する方式や、
又連結機能語用例データベース41において用例データ
にこの句や連結機能語の種別の情報を合わせて記録する
方式を用いることで、上述の各実施の形態において説明
された1種類での場合と同様にして実施が可能である。
【0266】以上説明した各実施の形態においては、用
例データベースにおける用例データの記録方式として、
文章句を連結機能語を挿入する位置から前部と後部に分
けて記録する方式により説明しているがこれに限定され
るものではない。他に、文章句全体のデータと連結機能
語を挿入する位置のデータ(文章句の先頭から何文字目
であるか等)により記録する方式も上記の各実施の形態
と同様に実施できる。また、特に連結機能語の前方と後
方の単語数を“1つ”とする例により説明しているが、
前方と後方のいずれの単語数も“1つ”に限定されるも
のではなく、上記の各実施の形態において説明された方
法により、任意の複数個の単語による文章句の用例デー
タを用いる翻訳や用例データの自動登録を扱うことがで
きる。
【0267】さらに、本発明の他の実施の形態として、
以上説明してきた連結機能語を、翻訳元の文章中におい
て直接該当する単語がない又は記載されない場合のあ
る、補助的な意味や役割を示す単語の全般に適応し、前
後の語句の間に挿入する単語に限定せず、英語の冠詞等
の様に文章句の先頭に使用する単語や、また末尾に使用
する単語をも対象とする形態が考えられる。つまり、用
例データ中の連結機能語の前方の文又は後方の文のいず
れか一方に単語を記録しない(単語数を“0個”とす
る)場合の用例データをも対象とする形態である。
【0268】第2、第3の実施の形態の用例データの自
動登録処理においては、連結機能語の前後双方の(連結
機能語の直前と直後の)単語をチェックしているが、こ
れは例えば連結機能語の品詞が冠詞等の文章句の先頭に
使用する単語である場合には、前方の単語をチェックす
る処理を省略する(ステップ905やステップ1405
等を省略する)ことにより、第2、第3の実施の形態に
おいて説明された方法と同様にして用例データの自動登
録処理が可能である。また、こうした連結機能語の前方
又は後方の単語のない用例データによる翻訳処理につい
ても、第1の実施の形態において説明された方法により
翻訳できる。これにより名詞句の日英翻訳における冠詞
の使用・不使用や“the”と“a”の選択等の処理を
用例データを参照して実行することができる。
【0269】以上好ましい実施の形態及び実施例をあげ
て本発明を説明したが、本発明は必ずしも上記実施の形
態及び実施例に限定されるものではなく、その技術的思
想の範囲内において様々に変形して実施することができ
る。
【0270】
【発明の効果】以上説明したように本発明によれば、以
下のような効果が得られる。
【0271】第1に、連結機能語の使用の適否を示す用
例データを用いるため、連接機能語を適切に出力して文
章中の各句を適切に翻訳し、自然な翻訳結果を出力する
ことができる。
【0272】第2に、原言語から目的言語への対訳用例
を用いるのではなく、目的言語のみの用例データを参照
するため、翻訳処理中に目的言語に変換した文章に対
し、適切な文章への修正処理を実行することができる。
【0273】更に、このため従来では人手による膨大な
コストを必要とした用例の対訳関係の設定処理を必要と
せずに、単に目的言語の文章データを入力するのみで、
こうした用例データを自動的に編集生成することが実現
できる。
【0274】第4に、入力された目的言語の文章データ
から、文章句に連接機能語を含む用例と含まない用例の
双方の情報を検出することにより、連接機能語の使用の
適否の適切な判定ができ、またこの適切な判定による用
例データ自動的に編集生成し、かつこの適切な判定に基
づく翻訳を実行することができる。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態の機械翻訳装置の
構成を示すブロック図である。
【図2】 本発明の第1の実施の形態の機械翻訳装置の
翻訳処理を説明するためのフローチャートである。
【図3】 本発明の第1の実施の形態の原言語解析手段
による翻訳対象の英文の構文構造の解析結果の一例を示
す図である。
【図4】 本発明の第1の実施の形態の言語変換手段に
よる変換結果の日本文の構文構造の一例を示す図であ
る。
【図5】 本発明の第1の実施の形態の連結機能語用例
データベースに格納された用例データの一例を示す図で
ある。
【図6】 本発明の第1の実施の形態の連結機能語挿入
処理の処理結果の一例を示す図である。
【図7】 本発明の第1の実施の形態の機械翻訳装置の
一実施例の構成を示すブロック図である。
【図8】 本発明の第2の実施の形態の機械翻訳装置の
構造を示すブロック図である。
【図9】 本発明の第2の実施の形態の用例データベー
ス作成手段の動作を説明するためのフローチャートであ
る。
【図10】 本発明の第2の実施の形態の形態素解析手
段による形態素解析の結果として得られた形態素列の一
例を示す図である。
【図11】 本発明の第2の実施の形態の連結機能語用
例データベースに格納された用例データの一例を示す図
である。
【図12】 本発明の第2の実施の形態の機械翻訳装置
の一実施例の構成を示すブロック図である。
【図13】 本発明の第3の実施の形態の機械翻訳装置
の構成を示すブロック図である。
【図14】 本発明の第3の実施の形態の機械翻訳装置
の翻訳処理を説明するためのフローチャートである。
【図15】 本発明の第3の実施の形態の形態素解析手
段による形態素解析の結果として得られた形態素列の一
例を示す図である。
【図16】 本発明の第3の実施の形態の連結機能語用
例データベースに格納された用例データの一例を示す図
である。
【図17】 本発明の第3の実施の形態の機械翻訳装置
の一実施例の構成を示すブロック図である。
【符号の説明】
10 入力手段 20 原言語解析手段 30 言語変換手段 40 目的言語生成手段 41 連結機能語用例データベース 42 対象句同定手段 43 連結機能語挿入手段 44 目的言語文生成手段 50 出力手段 60、60a 用例データベース作成手段 61 用例入力手段 62 形態素解析手段 63 対象句構成要素抽出手段 64 正用例抽出手段 65 用例登録手段 66 負用例抽出手段 67 用例調整手段 90 コンピュータ処理装置 91 入力部 92 原言語解析部 93 言語変換部 94 目的言語生成部 941 連結機能語用例記憶部 942 対象句同定部 943 連結機能語挿入部 944 目的言語文生成 95 出力部 96、96a 用例作成部 961 用例入力部 962 形態素解析部 963 対象句構成要素抽出部 964 正用例抽出部 965 用例登録部 966 負用例抽出部 967 用例調整部 100 記憶媒体

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 翻訳元の言語である原言語の文章を、翻
    訳先の言語である目的言語に翻訳する機械翻訳装置にお
    いて、 目的言語の指定された種類の文章句の単語データと、各
    前記文章句内における指定された連結機能語の適否に関
    する情報とを示す用例データを記録した用例データベー
    スと、 目的言語の文章中における連結機能語の使用の適否を、
    前記用例データベースを参照して判断し、前記文章中の
    適切な位置に連結機能語を設定し、連結機能語の使用を
    適切に修正した文章を生成する目的言語生成手段を備え
    ることを特徴とする機械翻訳装置。
  2. 【請求項2】 翻訳元の言語である原言語の文章を、翻
    訳先の言語である目的言語に翻訳する機械翻訳装置にお
    いて、 入力された翻訳対象の文章である原言語文を解析する原
    言語解析手段と、 前記原言語解析手段の解析に基づき、前記原言語文の各
    単語と文章構造を、翻訳先の言語である目的言語の単語
    と文章構造に変換したデータである変換データを生成す
    る言語変換手段と、 目的言語の指定された種類の文章句の単語データと、各
    前記文章句内における指定された連結機能語の適否に関
    する情報とを示す用例データを記録し参照する用例デー
    タベースと、 前記変換データ中における連結機能語の使用の適否を、
    前記用例データベースを参照して判断し、前記変換デー
    タ中の適切な位置に連結機能語を設定し、翻訳結果の文
    章である目的言語文を生成する目的言語生成手段を備え
    ることを特徴とする機械翻訳装置。
  3. 【請求項3】 前記目的言語生成手段は、 目的言語の文章の構造を解析して、文章中の前記指定さ
    れた種類の文章句の部分を処理対象の句として検出する
    対象句同定手段と、 前記用例データベースに記録された前記用例データを参
    照し、前記処理対象の句に対し、適切な場合に適切な個
    所に適切な連結機能語を挿入する連結機能語挿入手段
    と、 前記連結機能語挿入手段の挿入処理と、前記対象句同定
    手段の解析結果に従い、目的言語の文章を生成する目的
    言語文生成手段を備えることを特徴とする請求項1又は
    請求項2に記載の機械翻訳装置。
  4. 【請求項4】 入力された目的言語の文章データを基
    に、前記用例データベースに記録する用例データを自動
    的に編集し登録する用例データベース作成手段を備える
    ことを特徴とする請求項1から請求項3のいずれか一つ
    に記載の機械翻訳装置。
  5. 【請求項5】 前記用例データベース作成手段は、 前記入力された目的言語の文章データを解析し、解析デ
    ータを形態素列として出力する形態素解析手段と、 前記形態素列から、前記指定された種類の文章句のデー
    タを構成要素列として抽出する対象句構成要素抽出手段
    と、 前記構成要素列から、前記指定された連結機能語を含む
    用例である正用例を検出する正用例抽出手段と、 前記正用例抽出手段が検出する前記正用例に係る前記用
    例データを生成し前記用例データベースに登録する用例
    登録手段を備えることを特徴とする請求項4記載の機械
    翻訳装置。
  6. 【請求項6】 前記用例データベース作成手段は、 前記構成要素列から、前記指定された連結機能語を含ま
    ない用例である負用例を検出する負用例抽出手段を備
    え、 前記用例登録手段は、 前記負用例抽出手段が検出する前記負用例に係る前記用
    例データを生成し前記用例データベースに登録を行い、 前記用例データベース作成手段は、 登録された前記用例データにおける前記正用例と前記負
    用例の情報を基に、当該文章句内における前記指定され
    た連結機能語の使用の適否を判定し、この適否の判定結
    果を前記用例データベースに登録する用例調整手段を備
    えることを特徴とする請求項5記載の機械翻訳装置。
  7. 【請求項7】 前記用例データベースにおける各前記用
    例データは、 前記文章句の前方の語句のデータと、後方の語句のデー
    タと、 前記前方の語句と前記後方の語句の間に前記指定された
    連結機能語を挿入することの適否を示すデータから成る
    ことを特徴とする請求項1から請求項6のいずれか一つ
    に記載の機械翻訳装置。
  8. 【請求項8】 前記用例データベースにおける各前記用
    例データは、 前記文章句の前方の語句のデータと、後方の語句のデー
    タと、 前記前方の語句と前記後方の語句の間に前記指定された
    連結機能語を備える正用例を前記正用例抽出手段が検出
    した回数を示すデータと、前記指定された連結機能語を
    備えない負用例を前記負用例抽出手段が検出した回数を
    示すデータと、 前記前方の語句と前記後方の語句の間に前記指定された
    連結機能語を挿入することの適否を示すデータから成る
    ことを特徴とする請求項6に記載の機械翻訳装置。
  9. 【請求項9】 前記用例調整手段は、 正用例を前記正用例抽出手段が検出した回数が、負用例
    を前記負用例抽出手段が検出した回数よりも多い場合に
    は、当該用例データの前記前方の語句と前記後方の語句
    の間に前記指定された連結機能語を挿入するものと判定
    し、 そうでない場合には、当該用例データの前記前方の語句
    と前記後方の語句の間に前記指定された連結機能語を挿
    入しないものと判定することを特徴とする請求項8に記
    載の機械翻訳装置。
  10. 【請求項10】 前記形態素解析手段は、 前記入力された目的言語の文章データから、前記文章デ
    ータを構成する単語を識別し、各前記単語の品詞を判定
    し、この単語とその品詞の情報を形態素列として出力す
    る手段を備えることを特徴とする請求項5から請求項9
    のいずれか一つに記載の機械翻訳装置。
  11. 【請求項11】 前記指定された種類の文章句の一つを
    名詞句とし、 前記対象句構成要素抽出手段は、 前記形態素列中の名詞である単語の連続する個所を名詞
    句と認識し、これを構成要素列として抽出する手段を備
    えることを特徴とする請求項10に記載の機械翻訳装
    置。
  12. 【請求項12】 前記目的言語を日本語とし、 前記指定された連結機能語の一つを、格助詞の「の」と
    することを特徴とする請求項1から請求項11のいずれ
    か一つに記載の機械翻訳装置。
  13. 【請求項13】 翻訳元の言語である原言語の文章を、
    翻訳先の言語である目的言語に翻訳する機械翻訳方法に
    おいて、 目的言語の指定された種類の文章句の単語データと、各
    前記文章句内における指定された連結機能語の適否に関
    する情報とを示す用例データをデータベースに記録し参
    照する用例参照ステップと、 目的言語の文章中における連結機能語の使用の適否を、
    前記用例参照ステップが参照する前記用例データを基に
    判断し、前記文章中の適切な位置に連結機能語を設定
    し、連結機能語の使用を適切に修正した文章を生成する
    目的言語生成ステップを備えることを特徴とする機械翻
    訳方法。
  14. 【請求項14】 翻訳元の言語である原言語の文章を、
    翻訳先の言語である目的言語に翻訳する機械翻訳方法に
    おいて、 入力された翻訳対象の文章である原言語文を解析する原
    言語解析ステップと、 前記原言語解析ステップによる解析に基づき、前記原言
    語文の各単語と文章構造を、翻訳先の言語である目的言
    語の単語と文章構造に変換したデータである変換データ
    を生成する言語変換ステップと、 目的言語の指定された種類の文章句の単語データと、各
    前記文章句内における指定された連結機能語の適否に関
    する情報とを示す用例データをデータベースに記録し参
    照する用例参照ステップと、 前記変換データ中における連結機能語の使用の適否を、
    前記用例参照ステップが参照する前記用例データを基に
    判断し、前記変換データ中の適切な位置に連結機能語を
    設定し、翻訳結果の文章である目的言語文を生成する目
    的言語生成ステップを備えることを特徴とする機械翻訳
    方法。
  15. 【請求項15】 前記目的言語生成ステップは、 目的言語の文章の構造を解析して、文章中の前記指定さ
    れた種類の文章句の部分を処理対象の句として検出する
    対象句同定ステップと、 前記用例参照ステップが参照する前記用例データを基
    に、前記処理対象の句に対し、適切な場合に適切な個所
    に適切な連結機能語を挿入する連結機能語挿入ステップ
    と、 前記連結機能語挿入ステップによる挿入処理と、前記対
    象句同定ステップによる解析結果に従い、目的言語の文
    章を生成する目的言語文生成ステップを備えることを特
    徴とする請求項13又は請求項14に記載の機械翻訳方
    法。
  16. 【請求項16】 入力された目的言語の文章データを基
    に、 前記用例参照ステップが参照する前記データベースに対
    し、自動的に新たな用例データを編集し登録し更新する
    用例データベース作成ステップを備えることを特徴とす
    る請求項13から請求項15のいずれか一つに記載の機
    械翻訳方法。
  17. 【請求項17】 前記用例データベース作成ステップ
    は、 前記入力された目的言語の文章データを解析し、解析デ
    ータを形態素列として出力する形態素解析ステップと、 前記形態素列から、前記指定された種類の文章句のデー
    タを構成要素列として抽出する対象句構成要素抽出ステ
    ップと、 前記構成要素列から、前記指定された連結機能語を含む
    用例である正用例を検出する正用例抽出ステップと、 前記正用例抽出ステップが検出する前記正用例に係る前
    記用例データを生成し、前記用例参照ステップが参照す
    る前記データベースに登録する用例登録ステップを備え
    ることを特徴とする請求項16記載の機械翻訳方法。
  18. 【請求項18】 前記用例データベース作成ステップ
    は、 前記構成要素列から、前記指定された連結機能語を含ま
    ない用例である負用例を検出する負用例抽出ステップを
    備え、 前記用例登録ステップは、 前記負用例抽出ステップが検出する前記負用例に係る前
    記用例データを生成し、前記用例参照ステップが参照す
    る前記データベースに登録を行い、 前記用例データベース作成ステップは、 登録された前記用例データにおける前記正用例と前記負
    用例の情報を基に、当該文章句内における前記指定され
    た連結機能語の使用の適否を判定し、この適否の判定結
    果を前記用例参照ステップが参照する前記データベース
    に登録する用例調整ステップを備えることを特徴とする
    請求項17記載の機械翻訳方法。
  19. 【請求項19】 翻訳元の言語である原言語の文章を、
    翻訳先の言語である目的言語に翻訳する機械翻訳プログ
    ラムを記録した記憶媒体において、 目的言語の指定された種類の文章句の単語データと、各
    前記文章句内における指定された連結機能語の適否に関
    する情報とを示す用例データをデータベースに記録し参
    照する用例参照ステップと、 目的言語の文章中における連結機能語の使用の適否を、
    前記用例参照ステップが参照する前記用例データを基に
    判断し、前記文章中の適切な位置に連結機能語を設定
    し、連結機能語の使用を適切に修正した文章を生成する
    目的言語生成ステップを備えることを特徴とする機械翻
    訳プログラムを記録した記憶媒体。
  20. 【請求項20】 翻訳元の言語である原言語の文章を、
    翻訳先の言語である目的言語に翻訳する機械翻訳プログ
    ラムを記録した記憶媒体において、 入力された翻訳対象の文章である原言語文を解析する原
    言語解析ステップと、前記原言語解析ステップによる解
    析に基づき、前記原言語文の各単語と文章構造を、翻訳
    先の言語である目的言語の単語と文章構造に変換したデ
    ータである変換データを生成する言語変換ステップと、 目的言語の指定された種類の文章句の単語データと、各
    前記文章句内における指定された連結機能語の適否に関
    する情報とを示す用例データをデータベースに記録し参
    照する用例参照ステップと、 前記変換データ中における連結機能語の使用の適否を、
    前記用例参照ステップが参照する前記用例データを基に
    判断し、前記変換データ中の適切な位置に連結機能語を
    設定し、翻訳結果の文章である目的言語文を生成する目
    的言語生成ステップを備えることを特徴とする機械翻訳
    プログラムを記録した記憶媒体。
  21. 【請求項21】 前記目的言語生成ステップは、 目的言語の文章の構造を解析して、文章中の前記指定さ
    れた種類の文章句の部分を処理対象の句として検出する
    対象句同定ステップと、 前記用例参照ステップが参照する前記用例データを基
    に、前記処理対象の句に対し、適切な場合に適切な個所
    に適切な連結機能語を挿入する連結機能語挿入ステップ
    と、 前記連結機能語挿入ステップによる挿入処理と、前記対
    象句同定ステップによる解析結果に従い、目的言語の文
    章を生成する目的言語文生成ステップを備えることを特
    徴とする請求項19又は請求項20に記載の機械翻訳プ
    ログラムを記録した記憶媒体。
  22. 【請求項22】 入力された目的言語の文章データを基
    に、 前記用例参照ステップが参照する前記データベースに対
    し、自動的に新たな用例データを編集し登録し更新する
    用例データベース作成ステップを備えることを特徴とす
    る請求項19から請求項21のいずれか一つに記載の機
    械翻訳プログラムを記録した記憶媒体。
  23. 【請求項23】 前記用例データベース作成ステップ
    は、 前記入力された目的言語の文章データを解析し、解析デ
    ータを形態素列として出力する形態素解析ステップと、 前記形態素列から、前記指定された種類の文章句のデー
    タを構成要素列として抽出する対象句構成要素抽出ステ
    ップと、 前記構成要素列から、前記指定された連結機能語を含む
    用例である正用例を検出する正用例抽出ステップと、 前記正用例抽出ステップが検出する前記正用例に係る前
    記用例データを生成し、前記用例参照ステップが参照す
    る前記データベースに登録する用例登録ステップを備え
    ることを特徴とする請求項22記載の機械翻訳プログラ
    ムを記録した記憶媒体。
  24. 【請求項24】 前記用例データベース作成ステップ
    は、 前記構成要素列から、前記指定された連結機能語を含ま
    ない用例である負用例を検出する負用例抽出ステップを
    備え、 前記用例登録ステップは、 前記負用例抽出ステップが検出する前記負用例に係る前
    記用例データを生成し、前記用例参照ステップが参照す
    る前記データベースに登録を行い、 前記用例データベース作成ステップは、 登録された前記用例データにおける前記正用例と前記負
    用例の情報を基に、当該文章句内における前記指定され
    た連結機能語の使用の適否を判定し、この適否の判定結
    果を前記用例参照ステップが参照する前記データベース
    に登録する用例調整ステップを備えることを特徴とする
    請求項23記載の機械翻訳プログラムを記録した記憶媒
    体。
JP2000009310A 2000-01-18 2000-01-18 機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体 Expired - Fee Related JP3947859B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000009310A JP3947859B2 (ja) 2000-01-18 2000-01-18 機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000009310A JP3947859B2 (ja) 2000-01-18 2000-01-18 機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007035937A Division JP4488010B2 (ja) 2007-02-16 2007-02-16 機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体

Publications (2)

Publication Number Publication Date
JP2001202365A true JP2001202365A (ja) 2001-07-27
JP3947859B2 JP3947859B2 (ja) 2007-07-25

Family

ID=18537479

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000009310A Expired - Fee Related JP3947859B2 (ja) 2000-01-18 2000-01-18 機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体

Country Status (1)

Country Link
JP (1) JP3947859B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932233A (zh) * 2017-05-23 2018-12-04 松下知识产权经营株式会社 翻译文生成方法、翻译文生成装置以及翻译文生成程序

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932233A (zh) * 2017-05-23 2018-12-04 松下知识产权经营株式会社 翻译文生成方法、翻译文生成装置以及翻译文生成程序
CN108932233B (zh) * 2017-05-23 2024-01-09 松下知识产权经营株式会社 翻译文生成方法、翻译文生成装置以及翻译文生成程序

Also Published As

Publication number Publication date
JP3947859B2 (ja) 2007-07-25

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
US20050137853A1 (en) Machine translation
WO1997004405A1 (en) Method and apparatus for automated search and retrieval processing
JP2002215617A (ja) 品詞タグ付けをする方法
JPH02308370A (ja) 機械翻訳システム
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPH0293866A (ja) 要約生成方法および要約生成装置
US6385569B1 (en) Translator, translating method and recording medium having translating program recorded thereon
JP4488010B2 (ja) 機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体
JP3947859B2 (ja) 機械翻訳装置とその翻訳方法、及びその機械翻訳プログラムを記録した記憶媒体
JP3876014B2 (ja) 機械翻訳装置
US5640581A (en) CD-ROM information editing apparatus
JP4313967B2 (ja) 自然言語変換システム
JP3236027B2 (ja) 機械翻訳装置
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH0561902A (ja) 機械翻訳システム
JP2719453B2 (ja) 機械翻訳装置
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05225232A (ja) テキスト自動前編集装置
JP2972212B2 (ja) 機械翻訳方法及びシステム
JPS63109572A (ja) 派生語処理方式
JP2003271590A (ja) 翻訳方法、翻訳装置および翻訳プログラム
JP3233800B2 (ja) 機械翻訳装置
JP4361146B2 (ja) テキスト翻訳装置と記録媒体
JP3313810B2 (ja) アスペクト処理装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050311

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070117

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070403

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110427

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120427

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120427

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140427

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees