JPH1063669A - 対訳データベース作成装置及び対訳例文検索装置 - Google Patents

対訳データベース作成装置及び対訳例文検索装置

Info

Publication number
JPH1063669A
JPH1063669A JP8238350A JP23835096A JPH1063669A JP H1063669 A JPH1063669 A JP H1063669A JP 8238350 A JP8238350 A JP 8238350A JP 23835096 A JP23835096 A JP 23835096A JP H1063669 A JPH1063669 A JP H1063669A
Authority
JP
Japan
Prior art keywords
bilingual
sentence
document
search
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8238350A
Other languages
English (en)
Inventor
Mihoko Kitamura
美穂子 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8238350A priority Critical patent/JPH1063669A/ja
Publication of JPH1063669A publication Critical patent/JPH1063669A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 文だけでなく、単語やイディオムの対応情報
を持つ対訳データベースを作成し、かつ、この対訳デー
タベースを用いて、原言語の任意の文字列に対する目的
言語の最適な訳語を取り出す。 【解決手段】 使用者は、用例としたい対訳文書を入力
する。対訳データベース作成手段12は、対訳文書から
文の対応付けを行うと共に、単語やイディオムの対応付
けを行い、かつ予め決められた定義で対訳データベース
14を作成する。使用者が、特定の訳語を欲する場合
は、その原言語の文字列を検索キーとして与える。対訳
データベース検索手段13は、この検索キーで対訳デー
タベース14を検索し、対応する訳語を全て抽出する。
検索結果表示手段113は、訳語と、この訳語を含む文
とを表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、対訳文書の文と単
語やイディオムの対応付けを行った対訳データベースを
作成する対訳データベース作成装置、および、作成され
た対訳データベースを用いて、母国語のある単語や言い
回しが目的言語でどのように表現されるかを知るため
に、母国語を用いて、対訳文書中の目的言語の翻訳例を
検索したり、それを基に目的言語の文書の作成を支援す
る対訳例文検索装置に関する。
【0002】
【従来の技術】日本人が英語のビジネス文書や論文を作
成する機会が増えている。しかし、英語力に乏しい人間
がいざ英語文書を作成するとなると稚拙な英文になりが
ちである。そのため、日本語表現と英語表現の対訳例文
集や定型文例集等の出版物、用例文検索付きの電子辞
書、定型文書スクリプト集付属のワープロ等が広まって
いる。
【0003】しかし、一般に、英語文書作成者が望む適
切な表現は既存の例文集ではなかなか見つからず、期待
する英訳語ではない場合も多い。そのため、結局、おし
きせのフォーマットや表現に甘んじたり、稚拙な英語表
現になるのが現状である。
【0004】このような問題に対処するため、例えば、
“辞書と統計を用いた対訳アライメント,春野 雅彦,
山崎 毅文(NTT),言語処理学会 第2回年次大会
発表論文集 p193−196”に示される方法があ
った。この方法は、対訳辞書の知識と文書から得られる
統計情報を用いて既存の対訳文書の文単位の対応付けを
半自動的に行う方法であり、また、その対応付けの結果
をユーザに提示するシステムを開示している。
【0005】このシステムに、使用者が対訳例文として
利用したい大量の既存の対訳文書を与えると、文対応済
みの対訳データベースを半自動的に作成することができ
る。この方法で、使用者が英文作成の手本としたい対訳
文書を対訳データベース化しておけば、ある日本語表現
の英訳語を知りたい場合、対訳データベースをその日本
語表現で検索すれば、その日本語表現を含む対訳文を取
り出すことができ、それを基にして英文を作成すること
ができる。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の方法では、文のレベルの対応付けに留まっているた
め、単語やイディオム等の英訳語まで知ることはできな
い。即ち、対訳文書データベースの英文と日本語文とが
1文単位で対応がついていて、使用者が欲する特定の表
現を含む対訳文を検索できるようになったとしても、特
定の表現が対応する対訳文中のどこに対応するかを見つ
けるのは使用者にとって容易ではない。
【0007】また、対訳文書は原文の状態のまま格納さ
れているため、例えば「入力する」という検索キーで
は、「〜を入力して、〜」という用例は抽出できない。
即ち、動詞等の語形変化する単語に関して、標準形での
検索はできない。一方、既にCD−ROM等の媒体で市
販されている用例検索機能付きの翻訳辞書は、標準形で
の検索機能は備わっているものの、そこでの対訳例文や
検索キーは特定の分野の特別な表現に限られている。
【0008】このような点から、文だけでなく、単語や
イディオムの対応付けに関する情報を持つ対訳データベ
ースを作成することのできる対訳データベース作成装置
や、この対訳データベースを用いて原言語の任意の文字
列に対する目的言語の訳語を取り出すことのできる対訳
例文検索装置の実現が望まれていた。更に、目的言語の
文書作成を支援するための対訳例文検索装置の実現が望
まれていた。
【0009】
【課題を解決するための手段】本発明は、前述の課題を
解決するため次の構成を採用する。 〈請求項1の構成〉原言語の文書と目的言語の文書から
なる対訳文書を入力する対訳文書入力手段と、原言語の
文書を構成する文と、目的言語の訳文との対応付けを行
う文対応付け手段と、文対応付け手段の結果に基づき、
各文中の、原言語の特定の表現の文字列と、目的言語の
訳語との対応付けを行う単語・イディオム対応付け手段
と、単語・イディオム対応付け手段の結果に基づき、対
訳文書を、文の対応情報と、各文中の文字列の対応情報
とを有する対訳データベースの形式に整形する対訳デー
タベース加工手段とを備えたことを特徴とする対訳デー
タベース作成装置である。
【0010】〈請求項1の説明〉原言語と目的言語と
は、例えば日本語と英語であるが、これ以外の言語であ
っても同様に適用可能である。単語・イディオム対応付
け手段が対応付けを行う原言語の特定の表現の文字列と
は、例えば単語やイディオムであるが、1文中で原言語
と目的言語とが対応付けられる文字列であれば、単語や
イディオムに限らない。
【0011】使用者は、用例としたい目的言語の文書を
原言語の文書と共に対訳文書入力手段で入力する。これ
により、文対応付け手段は、各文書を1文毎に分割し
て、形態素解析を行い、単語辞書を用いてそれぞれの言
語の文同士の類似度を計算し、この類似度の和が文書全
体で最大になるような組み合わせを選択することによ
り、文の対応付け処理を行う。尚、この処理はこれ以外
の方法で行ってもよい。
【0012】そして、単語・イディオム対応付け手段
は、この文対応付け手段によって対応付けられた文に基
づき、文単位で対応付けられた原言語と目的言語の文に
同時に高頻度で出現する原言語の単語と目的言語の単語
のペアを求めることによって、単語やイディオムの対応
付けを行う。また、この処理も、他の方法を用いてもよ
い。対訳データベース加工手段は、予め決められた定義
に従って、対訳文書を、それぞれが、文と、各文中の文
字列とが対応付けられるよう整形する。ここで、予め決
められた定義とは、例えば図8で記した定義であるが、
これ以外の定義であってもよい。
【0013】請求項1の発明は、このような構成である
ことにより、例えば、専門分野の対訳文書等、所望する
対訳文書を入力するだけで、その分野では原言語の表現
がどのような訳語に対応し、かつ、その場合の文はどの
ようなものであるかといった、文と単語やイディオムの
対応付けされたデータベースを作成することができる。
【0014】〈請求項2の構成〉原言語の文書と目的言
語の文書からなる対訳文書を入力する対訳文書入力手段
と、原言語の文書を構成する文と、目的言語の訳文との
対応付けを行う文対応付け手段と、文対応付け手段の結
果に基づき、各文中の、原言語の特定の表現の文字列
と、目的言語の訳語との対応付けを行う単語・イディオ
ム対応付け手段と、単語・イディオム対応付け手段の結
果に基づき、対訳文書を、文の対応情報と、各文中の文
字列の対応情報とを有する対訳データベースの形式に整
形する対訳データベース加工手段と、原言語の任意の文
字列を検索キーとして入力する検索キー入力手段と、検
索キー入力手段で入力された検索キーに基づき、対訳デ
ータベースを検索する対訳データベース検索手段と、対
訳データベース検索手段で検索された目的言語の訳語
を、その訳語を含む文と共に表示する検索結果表示手段
とを備えたことを特徴とする対訳例文検索装置である。
【0015】〈請求項2の説明〉請求項2の発明は、請
求項1の発明によって作成された対訳データベースを用
い、原言語の任意の表現に対応する訳を抽出するように
したものである。使用者は、任意の表現に対する訳語を
得る場合、この表現を検索キー入力手段で入力する。こ
こで、任意の表現とは、例えば単語やイディオムである
が、これ以外にも「事実上、困難になる」といった句や
節レベルの検索キーを含むものとする。
【0016】検索キー入力手段で特定の検索キーが入力
されると、対訳データベース検索手段は、対訳データベ
ースを検索し、対応する訳語があった場合は、全ての訳
語を、その訳語を含む文と共に取り出す。そして、検索
結果表示手段は、対訳データベース検索手段で抽出した
訳語と、これを含む文とを表示する。
【0017】これによって、原言語の表現に対する目的
言語の表現を容易かつ正確に取り出すことができ、ま
た、文脈によって訳語がどう異なるかといった点も把握
することができる。
【0018】〈請求項3の構成〉請求項2記載の対訳例
文検索装置において、単語の見出しを、その単語の語形
変化する場合の基本形である標準形で表した対訳データ
ベースと、検索キー入力手段で入力された検索キーが出
現形であった場合、この検索キーの標準形で対訳データ
ベースを検索する対訳データベース検索手段とを備えた
ことを特徴とする対訳例文検索装置である。
【0019】〈請求項3の説明〉請求項3の発明は、対
訳データベースの定義として、各単語の見出しが標準形
でも表され、この標準形での検索を行うようにした点を
特徴としている。尚、ここで、標準形とは、例えば「入
力して」に対する「入力する」といったように、任意の
単語を形態素解析した結果であり、語形変化する単語の
見出しとなる語である。このような構成であることによ
り、検索を漏れなく正確に行うことができる。
【0020】〈請求項4の構成〉原言語の表現を当ては
めるための型となるテンプレートに用いる目的言語の文
書を入力する対訳文書入力手段と、対訳文書入力手段で
入力された原言語と目的言語との対訳文書に基づき、原
言語と目的言語に対する文の対応情報と、各文中の文字
列の対応情報とを有する対訳データベースを作成する対
訳データベース作成手段と、原言語の任意の文字列の検
索要求を受けて、対訳データベースから、対応する目的
言語の訳語候補を抽出する対訳データベース検索手段
と、対訳データベース検索手段の抽出結果に基づき、原
言語の変更要求された表現を、目的言語の訳語に変更し
てテンプレートに当てはめるテンプレート変更手段と、
テンプレート変更手段で変更された目的言語の文を表示
する表示手段とを備えた対訳例文検索装置である。
【0021】〈請求項4の説明〉請求項4の発明は、請
求項1の発明によって作成された対訳データベースをテ
ンプレートとして、原言語の文中の任意の表現を指定す
ることにより、その指定に対応した目的言語の文を作成
するようにしたものである。
【0022】対訳データベースは、使用者がテンプレー
トとして使用したい対訳文書を登録するものであるが、
この場合は、できるだけ多くの種類の対訳文書が登録さ
れることが望ましい。使用者がテンプレートとして使用
したい対訳文書を選択し、任意の部分の表現の変更を指
示すると、テンプレート変更手段は、指定された表現の
検索要求を対訳データベース検索手段に送出する。対訳
データベース検索手段は、対訳データベースより、指定
された表現に対応した目的言語の訳語を取り出し、テン
プレート変更手段に渡す。テンプレート変更手段は、受
け取った目的言語の訳語をテンプレートに当てはめた文
を作成し、テンプレート表示手段は、これを表示する。
【0023】これにより、使用者の好みに応じてどんな
種類のテンプレートでも準備することができる。また、
表現の変更は、原言語での指定であるため、目的言語の
知識は特に必要なく、容易に正確な目的言語の変更文を
得ることができる。
【0024】〈請求項5の構成〉請求項4記載の対訳例
文検索装置において、対訳データベース検索手段で検索
した結果、訳語候補が複数ある場合は、訳語候補を含む
それぞれの訳文の自立語と、検索キーを含む元の文の自
立語が重複する語数の最も多い訳文を優先して目的言語
の訳語に変更するテンプレート変更手段とを備えたこと
を特徴とする対訳例文検索装置である。
【0025】〈請求項5の説明〉請求項5の発明は、請
求項4の発明において、訳語候補が複数あった場合は、
訳語候補を含む訳文の自立語と、元の文の自立語とで同
じ語が多い訳文の訳語候補を優先して選択するようにし
たものである。即ち、これは、重複する自立語が多い方
が元の文への近似度が高く、精度の高い訳語であると考
えられるからである。これにより、最適な目的言語の訳
語が選択され、統一のとれた目的言語の表現を持つ文書
を得ることができる。
【0026】
【発明の実施の形態】以下、本発明の実施の形態を図面
を用いて詳細に説明する。 《具体例1》 〈構成〉図1は本発明の対訳例文検索装置の具体例1を
示す構成図である。本装置は、使用者が対訳文書を入力
する等、データの入出力を司る入出力手段11と、文、
句、単語単位の対応付けを行う対訳データベース作成手
段12と、その対訳データベースが格納されている対訳
データベース14と、使用者が入力した検索キーに従っ
て対訳データベース14の検索を行う対訳データベース
検索手段13とから構成される。尚、本具体例では原言
語を日本語、目的言語を英語として説明する。
【0027】入出力手段11は、使用者が対訳データベ
ースの作成源となる対訳文書を入力するための対訳文書
入力手段111と、日本語検索キーを入力するための検
索キー入力手段112と、検索結果を出力する検索結果
表示手段113とから構成される。
【0028】対訳データベース作成手段12は、後述す
る方法により、文単位の対応付けを行う文対応付け手段
121と、単語やイディオムの対応付けを後述する方法
によって行う単語・イディオム対応付け手段122と、
これらの対応付けの結果を元にして対訳データベースを
予め決められた定義で整形する対訳データベース加工手
段123とから構成される。尚、本具体例では、対訳文
書入力手段111、文対応付け手段121、単語・イデ
ィオム対応付け手段122、対訳データベース加工手段
123および対訳データベース14によって対訳データ
ベース作成装置が構成されている。
【0029】〈動作〉本装置は、 (1)使用者が用例として使用したい対訳文書を対訳デ
ータベースとして登録する。 (2)登録した対訳データベースを検索する、の二種類
の動作がある。それぞれについて以下説明する。
【0030】図2は、本装置が、使用者が与えた対訳文
書から対訳データベースを作成するまでの流れを示すフ
ローチャートである。図6は、本装置の対訳データベー
スの作成対象となる対訳文書の例である。使用者が図6
の対訳文書を入力した場合を例に挙げ、ここでの動作に
ついて説明する。
【0031】使用者は自分が英文作成の見本として使用
したい対訳文書を対訳文書入力手段111によって入力
する(ステップS201)。これにより、入力された対
訳文書の日本語文書と英語文書は、文対応付け手段12
1に渡される。文対応付け手段121は、日本語文書中
の各文が英語文書中のどの文に対応しているかを自動的
に判別する(ステップS202)。ここで、文対応付け
手段121は、例えば、先に出願した特願平7−194
134号に示すように、各文書を一文毎に分割し、形態
素解析を行い、単語辞書を用いて日本語文と英語文の類
似度を計算し、この類似度の和が文書全体で最大になる
ような組合せを選択することにより対応付けを行う。
【0032】次に、文対応が付けられた日本語文書と英
語文書は、単語・イディオム対応付け手段122に渡さ
れる。単語・イディオム対応付け手段122は、日本語
文書中に出現する単語、イディオムが、英語文書中のど
の表現に対応しているかを自動的に判別する(ステップ
S203)。ここで、単語・イディオム対応付け手段1
22は、例えば、先に出願した特願平8−178595
号に示すように、文単位で対応付けられた日英対訳文に
同時に高頻度で出現する日本語単語と英語単語のペアを
求めることによって単語・イディオム単位での対応付け
を行う。
【0033】図7に、図6の対訳文書における単語・イ
ディオム対応付け手段122の結果の例を示す。文対応
付け手段の結果と単語・イディオム対応付け手段の結果
は、対訳データベース加工手段123に渡され、対訳デ
ータベース加工手段123は、これらの結果を対訳デー
タベースの形式に整形する(ステップS204)。本定
義に従って整形された対訳データベースは、対訳データ
ベース14に格納され(ステップS205)、対訳デー
タベース作成処理を終了する。
【0034】図8に、対訳データベースの定義の例をB
NF(バッカスナウーア記法)で記したものを示す。ま
た、図9、図10は、その定義に基づいて整形された図
6の対訳文書の対訳データベースを示す。
【0035】対訳データベース14は、入力された対訳
文書の原文を保持する出現形と、標準形の2種類の形式
で格納される(図8の61参照)。また、文書の対応付
けの情報は{英語文書タグ}および{日本語文書タグ}
内の文書識別番号に(62a、62b参照)、文の対応
付けの情報は{文タグ}内の文識別番号に(63参
照)、単語・イディオムの対応付けの情報は{単語タ
グ}中の単語識別番号に(64参照)それぞれ保持され
る。
【0036】具体例を図9および図10の対訳データベ
ースを用いて説明する。この対訳文書の文書識別番号は
{英語文書タグ}、{日本語文書タグ}によりID=1
(71a、71b)である。また、この対訳文書中の英
文“typing n or RETURN skips them.”と日本語文「n
またはRETURNを入力すれば、それらの指示を飛ば
します。」は、SENT ID=1(72a、72b)
で対応付けられている。更に、ID=1の英文中の“an
swering ”と、日本語文中の「入力する」は、R ID
=3(73a、73b)で対応付けられている。尚、イ
ディオムの場合は、“start ”と“up”の両単語に、R
ID=2(74a、74b)が重複して付与されてい
るように、複数の単語に一つの単語識別番号を付与す
る。
【0037】このように、本具体例では、文単位だけで
はなく、単語・イディオム単位で対応付けられた対訳デ
ータベース14を作成することができるため、使用者は
所望する分野の対訳文書を入力するだけで、その分野で
は日本語の表現が英語のどのような訳語に対応し、か
つ、その場合の文はどのようなものであるかといった対
応情報を持ったデータベースを得ることができる。
【0038】次に、(2)の動作である、作成した対訳
データベース14から対訳例文を検索する方法について
説明する。図3に、本処理の流れを示す。ここでは、使
用者が上記で登録した対訳データベースから、「入力す
る」に関する対訳例文を検索する場合について説明す
る。
【0039】使用者は、検索キー入力手段112によ
り、「入力する」を入力する(ステップS301)。こ
れにより、対訳データベース検索手段13は、検索キー
である「入力する」を受け取り、対訳データベース14
の{日本語文書}の範囲(図9の77参照)を検索する
(ステップS302)。最初は出現形で検索する。
【0040】出現形での検索方法は次のとおりである。
図9の<SENT ID=1>の日本語文の出現形を取
り出し、それらをつなげると「addbibを始めるとき、最
初のInstructions? プロンプトにyと入力することで指
示が与えられます。」のように原文を復元することがで
きる。その復元した文において、「入力する」を検索
し、もし検索キーが存在すれば、その単語を含む{日本
語文書タグ}、{文タグ}、並びに、その単語に付与さ
れている{単語タグ}を抽出する。ここでは、<TEX
T LANG=JAP ID=1>(71a)、<SE
NT ID=1>(72a)、<R ID=3>(73
a)が抽出される。全ての対訳データベースの文に対し
て上記の検索を繰り返し、検索対象となる文がなくなれ
ば、出現形における処理を終了する(ステップS30
3)。
【0041】次に、標準形においても、出現形の場合と
同様に検索処理を行う(ステップS304)。日本語検
索キー「入力する」の例では、<TEXT LANG=
JAP ID=1>(71a)、<SENT ID=2
>(75a)、<R ID=1>(76a)が抽出され
る。検索対象となる文がなくなれば(ステップS30
5)、検索結果が存在するかどうかを判断する(ステッ
プS306)。ステップS306において、検索結果が
存在すれば、対訳データベース14の{英語文書}の範
囲78から、抽出した日本語文書タグ、文タグ、単語タ
グの各識別番号と同じ識別番号の英語文書タグ、文タグ
を持つ英文72b、75b、並びに、同じ単語タグの識
別番号を持つ英単語73b、76bを取り出し(ステッ
プS307)、その英文並びに英単語を、日本語文と共
に検索結果表示手段113を用いて表示する(ステップ
S308)。一方、日本語検索キーが標準形、出現形の
両方において存在しない場合は、存在しないことを検索
結果表示手段113を用いて表示する(ステップS30
9)。
【0042】図11は、出力結果の例である。図示のよ
うに、使用者が与えた日本語検索キー「入力する」を含
む対訳例文が表示されており、「入力する」に対応する
英単語(“answer”と“type”)は対訳例文中で強調表
示されている。
【0043】〈効果〉日本語単語の英語訳は大抵一意に
決まらず、複数の候補が考えられる。そのため、作成し
ようとする英語文書において、どのような英単語を使用
するのが適切かの判断が難しい。そのような場合、もし
英文作成の見本としたい英語文書とその日本語訳を持っ
ているならば、本装置にその対訳文書を対訳データベー
スとして登録し、そのデータベースを日本語で検索する
ことにより、その日本語表現に対する英語表現を容易に
取り出すことができ、その結果に基づいて英文を作成す
ることができる。
【0044】例えば、本装置に登録済みの対訳文書と同
じ内容で、「〜を入力する」の意の英文を作成したいと
する。本装置で検索することにより、「入力する」の英
訳語が“answer”と“type”のいずれかであることがわ
かる。同時に出力された対訳例文も参考にして、“answ
er”と“type”のどちらが適切であるかを判断し、英文
を作成することができる。
【0045】例えば、「入力する」を一般的な対訳辞書
で検索すると、“input ”の英訳語しか得られない。し
かし、実際の文書では、上記の“answer”、“type”の
ように、その文書の文脈に応じてさまざまな英語が使用
される。種々の対訳文書を登録しておけば、本装置は、
実際の文書に則った対訳例文付きの翻訳辞書としても使
用できる。
【0046】また、検索するための日本語キーは、対訳
文書に出現している形だけでなく、標準形による検索も
可能であるため、より正確な訳語を抽出することができ
る。
【0047】《具体例2》 〈構成〉図4は、具体例2の対訳例文検索装置の構成図
である。本具体例では、使用者が対訳データベースをテ
ンプレートとして英語文書を作成する場合(対訳データ
ベースに登録されている文書を少しだけ変更して文書を
作成する場合)の構成に関するものである。
【0048】本装置は、使用者が対訳文書を入力する
等、データの入出力を司る入出力手段41と、文、句、
単語単位の対応付けを行う対訳データベース作成手段4
2と、その対訳データベースが格納されている対訳デー
タベース44と、一般的な単語の対訳が格納されている
対訳辞書45と、使用者が指定する対訳文書や単語・イ
ディオムの訳語を対訳データベースから抽出する対訳デ
ータベース検索手段43とから構成される。
【0049】入出力手段41は、使用者が対訳データベ
ースの作成源となる対訳文書を入力するための対訳文書
入力手段411と、使用者が対訳文書を選択するための
テンプレート選択手段412と、使用者が指定した対訳
文書をテンプレートとして表示するためのテンプレート
表示手段413と、表示されたテンプレートに対して使
用者や対訳データベース検索手段が変更を行うためのテ
ンプレート変更手段414とから構成される。
【0050】対訳データベース作成手段42は、文単位
の対応付けを行う文対応付け手段421と、単語やイデ
ィオム単位の対応付けを行う単語・イディオム対応付け
手段422と、対応付けの結果を元にして対訳データベ
ースを加工する対訳データベース加工手段423とから
構成される。
【0051】〈動作〉本装置は、 (1)使用者がテンプレートとして使用したい対訳文書
を対訳データベースに登録する。 (2)使用者が対訳データベースから対訳文書(テンプ
レート)を選択し、その対訳文書の日本語文書を変更す
ることにより英語文書を作成する、の二種類の動作があ
る。
【0052】(1)の動作は、具体例1に準ずる。使用
者によって登録された対訳文書は、具体例1と同様に、
対訳データベース44に格納される。尚、ここでは、で
きるだけ多くの種類の対訳文書が登録されることが望ま
しい。
【0053】次に、(2)の動作について説明する。図
5は、使用者が装置内の対訳データベース44の対訳文
書をテンプレートとして用い、英語文書を作成するまで
の処理の流れである。使用者は対訳データベース44か
らテンプレートとして使用したい対訳文書をテンプレー
ト選択手段412により選択する(ステップS50
1)。これにより、対訳データベース検索手段43は、
対訳データベース44からその対訳文書を取り出し、テ
ンプレート表示手段413はこれを表示する(ステップ
S502)。図12および図13はこの表示例を示す説
明図である。
【0054】使用者は、そのテンプレートの日本語文書
を変更する(ステップS503)。例えば、日本語文書
の点線部分「日本茶」を「スカーフ」に、「樹木と花」
を「風景」に変更する場合について説明する。テンプレ
ート変更手段414は対訳データベース検索手段43を
介して、対訳データベース44から変更部分に付与され
ている単語タグを取り出す。
【0055】図14に、図12および図13のテンプレ
ートにおける対訳データベースの一部を示す。「日本
茶」の例では、<TEXT LANG=JAP ID=
20>(1201a)、<SENT ID=5>(12
02a)、<R ID=4>(1203a)が取り出さ
れる。
【0056】次に、対訳データベース検索手段43は、
変更語の日本語を検索キーとして、対訳データベース4
4を検索し、それに対応する英訳語を抽出する(ステッ
プS504)。抽出方法は具体例1に準ずる。上記の例
では、「スカーフ」、「風景」が検索キーとなる。
【0057】ステップS504の検索の結果、検索が成
功し(ステップS505)、かつ、検索キーに対応する
英語表現が一意に決まるならば、その英訳語を、元の日
本語表現の文タグ、単語タグと同じ識別番号を持つ英語
文書の位置の英語と入れ換える(ステップS508)。
例えば、「スカーフ」の英訳語が検索の結果、“silky
scarf ”と一意に決定されたならば、<TEXT LA
NG=ENG ID=20>(1201b)、<SEN
T ID=5>(1202b)、<R ID=4>(1
203b)の“Japanese\\Japanese tea\\ tea”が
“silky \\silky scarf \\scarf ”に変更される。
【0058】一方、検索した結果、複数の英訳語候補が
存在するならば、その中で最適な英訳語を一つ選択し、
変更する。選択方法の例を「風景」を例にして説明す
る。「風景」をもつ例文として、 a.汽車の窓から見る風景 A scene from the train window. b.“The Valley”は美しい風景画の本としてお勧めし
ます I can recommend “The Valley”as a book with fine
landscape paintings . の二つが検索されたならば、「風景」は、“scene ”と
“landscape ”の二つの英訳語が候補となる。
【0059】このように訳語候補が複数ある場合は、そ
の文を構成する自立語と、元の文の自立語が重複する語
数が多い方の文の英訳語を優先する。例えば、a.は、
{汽車 窓 見る}、b.は{“The Valley”美しい風
景 画 本 勧める}の自立語から構成されている。一
方、原文は、{次回 写真 いっぱい 入る 本 送る
つもりだ}の自立語から構成されている。この場合、
a.では重複語は存在しないが、b.では「本」が重複
する。従って、b.の英訳語“landscape ”を採用す
る。尚、優先度が付けられない場合は、両方の英訳語を
テンプレート表示手段413において表示し、使用者が
いずれか一つを選択する。
【0060】検索の結果、候補が一つも存在しない場合
は、対訳辞書45を引き(ステップS506)、その英
訳語を元の日本語表現の文タグ、単語タグと同じ識別番
号を持つ英語文書の位置に格納する(ステップS50
8)。変更された英語文書はテンプレート表示手段によ
って表示される(ステップS509)。そして、使用者
が変更を加えた全ての部分に対して、上記の処理を繰り
返した後(ステップS510)、処理を終了する。
【0061】図15および図16は、出力結果の例を示
す説明図である。使用者が変更した日本語文書の部分は
□で囲まれて表示されており、その変更は英語文書にも
反映されている。
【0062】〈効果〉本具体例では、使用者自ら、見本
とするテンプレートを作成することができるため、使用
者の好みに応じて、どんな種類のテンプレートでも準備
することができる。
【0063】また、テンプレートを利用して英語文書を
作成する場合、従来では英語文書テンプレート上で、変
更が必要な部分を修正する方法をとっていた。従って、
使用者はテンプレートとする英語文書を理解する能力が
必要であった。しかし、本装置を使用すれば、その英語
文書と同等の内容を持つ日本語文書を修正する作業だけ
で、英語文書を作成することができるため、英語の知識
は不要となる。
【0064】更に、本具体例では、テンプレート変更時
に使用する日本語の英訳語は、対訳データベース44を
検索することにより決定し、しかも、複数の訳語候補が
ある場合は、文の構成単語等を検査することによって、
自動的に最適な英訳語を選択するよう構成されているた
め、本装置で作成される英語文書は、統一のとれた英語
表現をもつ文書となる。
【図面の簡単な説明】
【図1】本発明の対訳例文検索装置の具体例1を示す構
成図である。
【図2】本発明の対訳例文検索装置の具体例1における
対訳データベース作成のフローチャートである。
【図3】本発明の対訳例文検索装置の具体例1における
対訳例文検索の流れを示すフローチャートである。
【図4】本発明の対訳例文検索装置の具体例2の対訳例
文検索装置の構成図である。
【図5】本発明の対訳例文検索装置の具体例2における
動作を示すフローチャートである。
【図6】本発明の対訳例文検索装置の対訳データベース
の作成対象となる対訳文書の例を示す説明図である。
【図7】図6の文書における単語・イディオム対応付け
手段の結果を示す説明図である。
【図8】対訳データベースの定義の例を示す説明図であ
る。
【図9】対訳データベースの例を示す説明図(その1)
である。
【図10】対訳データベースの例を示す説明図(その
2)である。
【図11】本発明の対訳例文検索装置の具体例1におけ
る対訳例文検索の出力結果の例を示す説明図である。
【図12】本発明の対訳例文検索装置の具体例2におけ
るテンプレートの例を示す説明図(その1)である。
【図13】本発明の対訳例文検索装置の具体例2におけ
るテンプレートの例を示す説明図(その2)である。
【図14】本発明の対訳例文検索装置の具体例2の対訳
データベースの例を示す説明図である。
【図15】本発明の対訳例文検索装置の具体例2におけ
る出力結果の例を示す説明図(その1)である。
【図16】本発明の対訳例文検索装置の具体例2におけ
る出力結果の例を示す説明図(その2)である。
【符号の説明】
13、43 対訳データベース検索手段 14、44 対訳データベース 111、411 対訳文書入力手段 112 検索キー入力手段 113 検索結果表示手段 121、421 文対応付け手段 122、422 単語・イディオム対応付け手段 123、423 対訳データベース加工手段 413 テンプレート表示手段 414 テンプレート変更手段

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 原言語の文書と目的言語の文書からなる
    対訳文書を入力する対訳文書入力手段と、 前記原言語の文書を構成する文と、前記目的言語の訳文
    との対応付けを行う文対応付け手段と、 前記文対応付け手段の結果に基づき、各文中の、原言語
    の特定の表現の文字列と、目的言語の訳語との対応付け
    を行う単語・イディオム対応付け手段と、 前記単語・イディオム対応付け手段の結果に基づき、前
    記対訳文書を、文の対応情報と、各文中の文字列の対応
    情報とを有する対訳データベースの形式に整形する対訳
    データベース加工手段とを備えたことを特徴とする対訳
    データベース作成装置。
  2. 【請求項2】 原言語の文書と目的言語の文書からなる
    対訳文書を入力する対訳文書入力手段と、 前記原言語の文書を構成する文と、前記目的言語の訳文
    との対応付けを行う文対応付け手段と、 前記文対応付け手段の結果に基づき、各文中の、原言語
    の特定の表現の文字列と、目的言語の訳語との対応付け
    を行う単語・イディオム対応付け手段と、 前記単語・イディオム対応付け手段の結果に基づき、前
    記対訳文書を、文の対応情報と、各文中の文字列の対応
    情報とを有する対訳データベースの形式に整形する対訳
    データベース加工手段と、 原言語の任意の文字列を検索キーとして入力する検索キ
    ー入力手段と、 前記検索キー入力手段で入力された検索キーに基づき、
    前記対訳データベースを検索する対訳データベース検索
    手段と、 前記対訳データベース検索手段で検索された目的言語の
    訳語を、当該訳語を含む文と共に表示する検索結果表示
    手段とを備えたことを特徴とする対訳例文検索装置。
  3. 【請求項3】 請求項2記載の対訳例文検索装置におい
    て、 単語の見出しを、当該単語の語形変化する場合の基本形
    である標準形で表した対訳データベースと、 検索キー入力手段で入力された検索キーが出現形であっ
    た場合、当該検索キーの標準形で対訳データベースを検
    索する対訳データベース検索手段とを備えたことを特徴
    とする対訳例文検索装置。
  4. 【請求項4】 原言語の表現を当てはめるための型とな
    るテンプレートに用いる目的言語の文書を入力する対訳
    文書入力手段と、 前記対訳文書入力手段で入力された原言語と目的言語と
    の対訳文書に基づき、原言語と目的言語に対する文の対
    応情報と、各文中の文字列の対応情報とを有する対訳デ
    ータベースを作成する対訳データベース作成手段と、 原言語の任意の文字列の検索要求を受けて、前記対訳デ
    ータベースから、対応する目的言語の訳語候補を抽出す
    る対訳データベース検索手段と、 前記対訳データベース検索手段の抽出結果に基づき、原
    言語の変更要求された表現を、目的言語の訳語に変更し
    てテンプレートに当てはめるテンプレート変更手段と、 前記テンプレート変更手段で変更された目的言語の文を
    表示する表示手段とを備えた対訳例文検索装置。
  5. 【請求項5】 請求項4記載の対訳例文検索装置におい
    て、 対訳データベース検索手段で検索した結果、訳語候補が
    複数ある場合は、訳語候補を含むそれぞれの訳文の自立
    語と、検索キーを含む元の文の自立語が重複する語数の
    最も多い訳文を優先して目的言語の訳語に変更するテン
    プレート変更手段とを備えたことを特徴とする対訳例文
    検索装置。
JP8238350A 1996-08-21 1996-08-21 対訳データベース作成装置及び対訳例文検索装置 Pending JPH1063669A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8238350A JPH1063669A (ja) 1996-08-21 1996-08-21 対訳データベース作成装置及び対訳例文検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8238350A JPH1063669A (ja) 1996-08-21 1996-08-21 対訳データベース作成装置及び対訳例文検索装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004031995A Division JP2004185641A (ja) 2004-02-09 2004-02-09 対訳例文検索装置

Publications (1)

Publication Number Publication Date
JPH1063669A true JPH1063669A (ja) 1998-03-06

Family

ID=17028899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8238350A Pending JPH1063669A (ja) 1996-08-21 1996-08-21 対訳データベース作成装置及び対訳例文検索装置

Country Status (1)

Country Link
JP (1) JPH1063669A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005141630A (ja) * 2003-11-10 2005-06-02 Masanori Fukushima 翻訳支援辞書装置
JP2008262587A (ja) * 2002-06-28 2008-10-30 Microsoft Corp 用例ベースの機械翻訳システム
JP2010009399A (ja) * 2008-06-27 2010-01-14 Yahoo Japan Corp 辞書情報表示装置、辞書情報表示システム、検索装置、辞書情報表示方法、および、そのプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008262587A (ja) * 2002-06-28 2008-10-30 Microsoft Corp 用例ベースの機械翻訳システム
JP2005141630A (ja) * 2003-11-10 2005-06-02 Masanori Fukushima 翻訳支援辞書装置
JP2010009399A (ja) * 2008-06-27 2010-01-14 Yahoo Japan Corp 辞書情報表示装置、辞書情報表示システム、検索装置、辞書情報表示方法、および、そのプログラム

Similar Documents

Publication Publication Date Title
US6286014B1 (en) Method and apparatus for acquiring a file to be linked
JPH11250105A (ja) 多言語情報検索方法およびシステム
JP2001195404A (ja) 句翻訳方法およびシステム
US6985147B2 (en) Information access method, system and storage medium
JPH10124293A (ja) 音声指令可能なコンピュータとそれ用の媒体
JPH09198395A (ja) 文書検索装置
JPH1145261A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1063669A (ja) 対訳データベース作成装置及び対訳例文検索装置
JP4057962B2 (ja) 質問応答装置、質問応答方法及びプログラム
JP2002091963A (ja) 機械翻訳システム
JP2002258738A (ja) 語学学習支援システム
JP2004240859A (ja) 言い換えシステム
JP2004185641A (ja) 対訳例文検索装置
JP2004206654A (ja) 情報検索方法、情報検索処理システム、プログラム
JPH11272671A (ja) 機械翻訳装置及び機械翻訳方法
JP2005250525A (ja) 漢文解析支援装置及び異言語文処理装置及び翻訳プログラム
CN110874527A (zh) 一种基于云端的智能释义注音系统
JPH1145266A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145249A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008171243A (ja) コンテンツ検索装置および方法並びにプログラム
JPH1166084A (ja) 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
JPH0944521A (ja) インデックス作成装置および文書検索装置
JP2001331519A (ja) ローマ字表記による書誌情報検索装置及び方法並びに書誌情報検索プログラムを記録した記録媒体
CN115757727A (zh) 一种基于语法点进行检索的方法、装置及文心检索平台

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040302