JP2004318510A - 対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法 - Google Patents

対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法 Download PDF

Info

Publication number
JP2004318510A
JP2004318510A JP2003111807A JP2003111807A JP2004318510A JP 2004318510 A JP2004318510 A JP 2004318510A JP 2003111807 A JP2003111807 A JP 2003111807A JP 2003111807 A JP2003111807 A JP 2003111807A JP 2004318510 A JP2004318510 A JP 2004318510A
Authority
JP
Japan
Prior art keywords
document
bilingual
sentence
information
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003111807A
Other languages
English (en)
Other versions
JP3831357B2 (ja
Inventor
Akira Sasaki
晶 佐々木
Yumiko Yoshimura
裕美子 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003111807A priority Critical patent/JP3831357B2/ja
Publication of JP2004318510A publication Critical patent/JP2004318510A/ja
Application granted granted Critical
Publication of JP3831357B2 publication Critical patent/JP3831357B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Abstract

【課題】検索対象原文に対し、文脈や意図を考慮した訳文を容易に検索する。
【解決手段】対訳情報作成処理は、入力される第一言語の原文文書と第二言語の訳文文書を文単位に対応付けする一方(文対応付け部13)、原文文書から文書の特徴を表す文書識別情報を抽出する(文書識別情報抽出部14)。その後、文単位に対応付けられた原文と訳文との対訳ペアに抽出された文書識別情報を付加した対訳情報を作成し対訳メモリに記憶する(対訳情報作成部16)。このように作成された対訳情報を用いて、検索対象原文に基づき対訳情報の中から訳文を検索する。この対訳情報検索処理は、検索対象原文文書を文単位に分割し(文書分割部21)、また検索対象原文文書から文書の特徴を表す文書識別情報を抽出する。さらに、抽出した文書識別情報及び検索対象原文文書の各文を構成する構成文字列に基づき、対訳メモリの対訳情報の中から訳文を検索する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、翻訳支援ツール等に利用される対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法に関する。
【0002】
【従来の技術】
国際化の進行に伴い、外国語を用いた情報交換へのニーズが高まっており、機械翻訳は、かかる情報交換のツールとして大いに期待されている。しかし、現在の機械翻訳技術による翻訳結果は、人手による手直しが全く不要なレベルにあるとはいえず、翻訳精度の更なる向上が求められている。従って、現状の機械翻訳システムを用いて、人手による手直しのない状態まで翻訳精度を上げるためには、多大の労力と時間を必要とする。
【0003】
そこで、従来、新たに翻訳を行う場合、過去に翻訳済みとされた文書を有効に活用するために、次のような幾つかの技術が提案されている。
【0004】
その1つは、対訳データベース作成装置であって、ユーザが原文と当該原文の訳文とを文単位で対応付けし(以下、対訳ペアと呼ぶ)、データベース(以下、対訳メモリと呼ぶ)に保存する。原文の翻訳に関し、以後、原文と訳文との対訳ペアを作成し、順次、対訳メモリに保存し、対訳情報を作成する。
【0005】
従って、以上のような状態において、新たに入力される翻訳対象文の翻訳を行う場合、過去に翻訳済みとされた対訳メモリを検索し、翻訳対象文と類似した文が存在すれば、機械翻訳により訳文を生成する代わりに当該対訳メモリ中の訳文を翻訳文に採用する(特開平10−63669号公報参照)。
【0006】
他の1つは、過去の翻訳済みの文書を有効に活用する技術として、会話文翻訳装置がある(特開平5−324702号公報、特開平9−62681号公報)。これらの会話文翻訳装置は、予め用意された会話用例文の文類情報を対訳ペアに付与し、対訳メモリ検索者の意図する方向により近い対訳ぺアを検索可能にした構成である。なお、前記会話文の分類情報とは、例えば「部屋の交渉」、「支払う、デポジット」など、会話の目的を表すフレーズ及び想定されたシーンがキーワードとなる。
【0007】
さらに、前記特開平9−62681号公報の会話文翻訳装置は、対訳メモリに格納される対訳ペアに対し、対訳ペアの原文文字列の中から「意味情報」を抽出して付与し、対訳ペアの文意をより忠実に検索に反映させる方法も提案されている。この「意味情報」は主に自立語の基本形が用いられ、予め事前に「意味素性」毎にその同義語、活用変化形、表現のバリエーション等を対応付けした「意味素性辞書」を作成し、当該「意味素性辞書」を参照し、当該意味情報を抽出するものである。例えば意味素性「お願い」には、「依頼、お願いした、お願いしたいのです」などが対応付けられている。
【0008】
【特許文献1】
特開平10−63669号公報(4頁右欄30行〜5頁左欄38行、図1参照)
【0009】
【特許文献2】
特開平5−324702号公報(8頁左欄34行〜同頁右欄12行参照)
【0010】
【特許文献3】
特開平9−62681号公報(図9,17頁右欄17行〜19頁左欄17行)
【0011】
【発明が解決しようとする課題】
ところで、以上のような装置においては、次のような種々の問題が指摘されている。
【0012】
先ず、前者の対訳データベース作成装置では、対訳メモリに格納されている対訳ペアは、翻訳対象文書の一文だけが考慮されているので、検索時の検索対象文の文脈や意図が何ら考慮されていない。その結果、対訳メモリの検索に際し、原文文字列は類似しているが、対訳文の意味やニューアンスを異にする複数の対訳ペアが対訳メモリ中に存在する場合、検索対象文の文脈の合致度に拘らず、単に原文文字列の最も高い一致度の対訳ペアが優先的に検索されるといった問題がでてくる。
【0013】
一方、後者の会話文翻訳装置では、過去の翻訳済みの文書を有効に活用する点で意義を有するが、会話翻訳という観点から新たな問題が生じ、また十分な問題解決に至っていない。その理由について説明する。
【0014】
その1つとしては、会話文翻訳装置は旅行会話文を対象としており、例えば税関手続、ホテルの出入り等に使われる語や挨拶等のシーン等にある程度のパターンがあるので、分類情報の網羅はある程度可能な状況にある。しかし、翻訳対象文書は、多種多様な一般的な文書であることから、あらゆる分類項目を網羅して対訳ペアを作成することは到底不可能なことであり、さらに分類の追加・変更などの更新も大変な労力と手間がかかる問題がある。
【0015】
また、他の1つは、特開平9−62681号公報に記載される「意味情報」は各対訳ペア自体から抽出したものであり、対訳ペア自体の意図が検索結果に反映できても、対訳ペアが作成された出典文書全体の文脈は反映することができない。このことは、未だ十分な問題解決に至っていないことを意味する。通常、会話文は、文単位で文意が明確となる場合がほとんどであり、前後の文脈を考慮する必要性はそれほどない。これに対し、一般的な文書は、一文単位だけでは意図が不明瞭であり、文意を汲み取るためには少なくとも前後の文脈を考慮する必要が多々ある。例えば「よくそのようなことがおできになりましたね。」という文は、肯定的な文脈から「賞賛」、否定的な文脈から「皮肉」の意味をもつため、前後の文脈に応じて訳文が大きく異なり、全く意味をもたない翻訳結果ないし検索結果となる問題がある。
【0016】
本発明は上記事情にかんがみてなされたもので、対訳ペアに対訳対象文書の全体の特徴を考慮した情報を付加し、文脈や意図を反映した対訳情報を作成する対訳情報作成装置、対訳情報作成方法及びプログラムを提供することを目的とする。
【0017】
また、本発明の他の目的は、検索対象原文に対し、文脈や意図を反映した対訳情報を利用し、文脈や意図を汲み取った検索結果(翻訳結果)を容易に検索可能とし、また検索結果の前後の文も出力し、検索結果の文がどのような文脈であるかを容易に把握可能とする対訳情報検索装置、対訳情報検索方法及びプログラムを提供することにある。
【0018】
【課題を解決するための手段】
(1) 上記課題を解決するために、本発明に係る対訳情報作成装置は、原文文書と訳文文書よりなる対訳文書を入力する文書データ入力手段と、この文書データ入力手段から入力される原文文書と訳文文書を文単位に対応付けする文対応付け手段と、原文文書から文書の特徴を表す文書識別情報を抽出する文書識別情報抽出手段と、前記文対応付け手段で文単位に対応付けられた原文と訳文との対訳ペアに前記抽出された文書識別情報を付加した対訳情報を作成し対訳メモリに記憶する対訳情報作成手段とを設けた構成である。
【0019】
この発明は、以上のような構成とすることにより、対訳文書が入力されると、文対応付け手段は、対訳文書を構成する原文文書と訳文文書を文単位に対応付けし、一方、文書識別情報抽出手段は、原文文書全体から文書の特徴を表す文書識別情報を抽出する。しかる後、対訳情報作成手段は、文対応付けされた原文と訳文との対訳ペアに文書識別情報を付加した対訳情報(文書識別情報付き対訳ペア)を作成し対訳メモリに記憶する。従って、後に検索対象原文文書をもとに対訳ペアの訳文を検索する際、原文文書の文脈や意図を含んだ文書識別情報から適切な訳文を検索可能となる。
【0020】
なお、前記(1)では、対訳情報作成装置について述べたが、当該装置に適用する対訳情報作成方法も容易に実現でき、また対訳情報作成の一連の処理機能をプログラムにより実現することが可能である。
【0021】
(2) 本発明に係る対訳情報検索装置は、以上のような対訳情報作成装置により作成された対訳情報を用いて、検索対象原文から所要とする訳文を検索する場合、検索対象原文文書を文単位に分割する文書分割手段と、この検索対象原文文書から文書の特徴を表す文書識別情報を抽出する文書識別情報抽出手段と、この文書識別情報抽出手段で抽出される文書識別情報及び検索対象原文文書の各文とから、対訳メモリの対訳情報の中から訳文を検索する対訳情報検索処理手段とを設けた構成である。
【0022】
この発明は、以上のような構成とすることにより、検索対象原文文書から抽出される文書識別情報と既に対訳メモリに記憶される対訳情報の文書識別情報とに基づいて、検索対象原文文書の各文に対する対訳ペアの適切な訳文を検索することが可能である。
【0023】
なお、前記(2)では、対訳情報検索装置について述べたが、当該装置に適用する対訳情報検索方法も容易に実現でき、また対訳情報検索の一連の処理機能をプログラムにより実現することが可能である。
【0024】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。
【0025】
図1は対訳情報の作成及び対訳情報の検索を含んだシステムの一実施の形態を示す全体構成図である。
【0026】
このシステムは、翻訳処理された翻訳結果に基づいて対訳情報を作成する対訳情報作成装置10と検索対象文に対して当該対訳情報作成装置10により作成された対訳情報から最適な検索結果(翻訳結果)を検索する対訳情報検索装置20とによって構成されている。
【0027】
この対訳情報作成装置10は、CPUで構成され、対訳情報作成対象となる第一言語による原文文書と第二言語による訳文文書よりなる対訳文書を入力する文書データ入力部11と、この文書データ入力部11からバッフアメモリ12に格納される対訳文書を文単位で対応付ける文対応付け部13と、原文文書全体からから文書の特徴を表す文書識別情報を抽出する文書識別情報抽出部14と、文対応付け部13により文単位に対応付けられた原文及び訳文よりなる対訳ペア(対訳文)に文書識別情報抽出部14で抽出された文書識別情報を付け加えた対訳情報を作成し、対訳メモリ15に記憶する対訳情報作成部16とが設けられている。
【0028】
なお、対訳情報作成装置10には、対訳情報作成用プログラムを記録するプログラム記録媒体17が設けられている。
【0029】
前記文書データ入力部11としては、翻訳処理後の原文及び訳文よりなる対訳文書を入力するもので、例えば入力機器であるマウス等を含むキーボード111、予め翻訳処理後の原文及び訳文よりなる対訳文書を記憶するファイル112、当該対訳文書が伝送されてくるインターネット、専用線、LAN等のネットワーク113などが挙げられる。その他、トラックボール、タブレットなどのポインティングデバイス、光学式文字読取装置などがある。
【0030】
一方、対訳情報検索装置20は、検索対象文書である原文文書を入力する文書データ入力部11と、この文書データ入力部11から入力される原文文書を文単位に分割しバッフアメモリ12に格納する文書分割部21と、この文書分割部21で分割された原文文書から文書の特徴を表す文書識別情報を抽出する文書識別情報抽出部14と、この文書識別情報抽出部14で抽出された文書識別情報及び前記検索対象文書である原文文書の各文の構成文字列をキーとして前記対訳メモリ15の対訳情報の中から検索結果(翻訳結果)となる訳文を検索する対訳情報検索処理部22と、この検索結果を検索対象原文文書とともに、或いは検索結果だけを出力する検索結果出力制御部23とによって構成されている。
【0031】
24は検索結果出力部であって、原文文書を含み、或いは含まない検索結果を格納するファイル241、原文文書を含み、或いは含まない検索結果を表示する表示部242、原文文書を含み、或いは含まない検索結果を所要とする端末などに伝送するインターネット、専用線、LAN等を含むネットワーク243などの何れか1つ以上が用いられている。
【0032】
また、対訳情報検索装置20には、対訳情報を検索処理する対訳情報検索用プログラムを記録するプログラム記録媒体25が設けられている。
【0033】
なお、対訳情報作成装置10と対訳情報検索装置20は個別にプログラム記録媒体17,25を設けたが、対訳情報作成か対訳情報検索かを判断させる機能を設ければ、対訳情報作成処理と対訳情報検索処理とを1つのプログラム記録媒体を用いて実現できることは言うまでもない。
【0034】
次に、対訳情報作成装置10と対訳情報検索装置20とに分けて、それぞれの動作ないし本発明に係る対訳情報作成方法と対訳情報検索方法について順次説明する。なお、これら装置の一連の動作に関し、プログラム記録媒体17に記録されるプログラムを用いて対訳情報の作成処理を実現する場合には、本発明に係る対訳情報作成用プログラムに関する発明を構成し、またプログラム記録媒体25に記録されるプログラムを用いて対訳情報の検索処理を実現する場合には、本発明に係る対訳情報検索用プログラムに関する発明を構成する。
【0035】
(1) 対訳情報作成装置10の動作ないし本発明に係る対訳情報作成方法の一実施の形態例について(図2及び図3参照)。
【0036】
なお、図2は対訳情報作成装置10の全体動作及び対訳情報作成方法を説明する図、図3は図1に示す文書識別情報抽出部14の詳細動作を説明する図である。
【0037】
先ず、ユーザは、文書データ入力部11から図4に示す対訳文書(例文1)を入力しバッフアメモリ12に格納する(ST11)。この対訳文書の上段は日本語文書である原文文書、下段は英語文書である訳文文書である。
【0038】
ここで、以上のような対訳文書が入力されると、文対応付け部13は、自動的に日本語文書の各文が英語文書のどの文に対応しているかを判断し対応付けを行う(ST12:文対応付けステップ)。
【0039】
この文対応付け部13による文対応付け方法は、例えば対訳文書を構成する各文書を一文単位に分割し、日本語原文文書を英語に翻訳する翻訳辞書(図示せず)を用いて翻訳処理を行い、日本語原文文書の文単位の原文から生成される訳文と対訳文書の訳文との類似度を計算し、文書全体の中で最も類似度の高い訳文文書を選択し、日本語原文と訳文文書との文対応付けを行い、バッフアメモリ12に格納する。
【0040】
引き続き、文書識別情報抽出部14は、文対応付けされた日本語文書と英語文書(訳文文書)に関し、後記するように文書全体の特徴を表す文書識別情報を抽出する(S13:文書識別情報抽出ステップ)。この文書識別情報の詳細な抽出処理は、後記する(図3参照)。
【0041】
ここで、文書識別情報抽出部14が文書識別情報を抽出すると、文対応付けされた日本語文書の各文及び英語文書の各文と、文書識別情報とを対訳情報作成部16に送出する。この対訳情報作成部16では、日本語文書の各文及び英語文書の各文と文書識別情報とを受け取ると、文対応付けされた日本語文と英語訳文とを対(対訳ペア)とし、各対訳ペアに文書識別情報を付加した情報付き対訳ペア(対訳情報)を所要とする形式に従って対訳メモリ15に記憶する(S14)。
【0042】
図5は対訳メモリ15を示す図であって、文書識別情報付き対訳メモリ15aと文書識別情報定義テーブル15bとからなり、文書識別情報付き対訳メモリ15aには文対応付けされた日本語文(J:)と英語文(E:)との対訳ペアとし、この各対訳ペアに文書識別情報(PROP:)を付け加えたものを一つの単位とする情報付き対訳ペアの形式で記憶されている。この文書識別情報(PROP:)には文書構成文字列見出し(JWD=JWD1)と日本語文書及び英語文書に対する各文の構成情報SN、PNが格納される。また、文書識別情報定義テーブル15bには文書構成文字列見出し(JWD1)に対応する文書構成文字列データが格納される。
【0043】
(2) 図2に示す文書識別情報抽出部14の詳細動作について(図3参照)。
【0044】
文対応付け部13により文対応付けられた日本語文書と英語文書が入力されると、文書識別情報抽出部14は、日本語文書全体にわたって文書構成文字列(JWD)を抽出する(S131)。この文書構成文字列(JWD)は、文書全体から意味のある語をほぼ全て抽出しているので、文書の文脈や意図を反映したものものと言うことができる。JWDは各情報付き対訳ペアに共通の文書識別情報であるので、その抽出結果であるJWD1(文書構成文字列見出し)は、文書識別情報定義テーブル15bに別途抽出頻度とともに定義付けしておく。
【0045】
この文書構成文字列(JWD)の切り出し法は、例えば日本語文書中の文字列に対して形態素解析を行い、自立語を中心とし、名詞、動詞、形容詞、副詞などを切り出し、例えば「美しければ」とある場合には「美しい」という活用形に変換する。この実施の形態においては、図4の日本文全体から切り出された構成文字列JWD1には、「1万、台、売上、達成、心より、お祝い、申し上げる」などの語に加え、「成果、評判、高い」など、原文の肯定的な文脈もよく反映されていると言える。なお、各語に付記されるカッコ内の数字は文書内の出現頻度を表す。
【0046】
次に、日本語文書及び英語文書に対する各文の構成情報を抽出する。
【0047】
この構成情報の1つとしては、文書中の文番号(SN)を抽出する(S132)。この文番号SNは、日本語文書及び英語文書に関し、総文数を分母とし、文番号を分子とする分数で表される。例えば図5の1番目の情報付き対訳ペアは、日本語文書の6文中の第1文なのでSN=J1/6、英語文書でも同様に6文中の第1文なのでSN=E1/6となる。日本語文書及び英語文書の第2文以降について同様に文番号(SN)を抽出する。
【0048】
構成情報の他の1つとしては、文番号と同様な要領で文書中の段落番号(PN)を抽出する。この文書中の段落番号PNは、日本語文書及び英語文書とも文書全体の総段落数を分母、該当文の段落数を分子とする分数で表される。例えば図5の1番目の情報付き対訳ペアは、日本語文書及び英語文書とも4段落で構成されており、かつ、1番最初の段落の文であるので、日本語文はPN=J1/4、英語文も同じくPN=E1/4となる。日本語文書及び英語文書の第2段落以降の文について同様に段落番号(PN)を抽出する。
【0049】
なお、抽出する文書識別情報は、以上のような情報に限らず、例えば英語文書を構成する文字列、ファイル名、ファイル作成日時、作成者名、関連する顧客情報など、本装置のユーザが必要に応じて種々の情報を付与することが可能である。図6は文書データ入力部11から入力される例文2を示す図であり、上段の日本語文書である原文文書、下段の英語文書である訳文よりなる対訳文書が示されている。
【0050】
図7は、文書データ入力部11から入力された例文2の対訳文書に関する情報付き対訳ペアを図5の対訳メモリ15上に更に加えた例である。この例に示すように、対訳メモリ15上には第4番目以降の情報付き対訳ペアが付加されている。この例の4番目の対訳ペアに見られるように、片方の言語の一文に対し、もう片方の言語の複数の文が対応する場合、分子の文書番号がSN=J4+5/10のごとく、プラス記号(+)で結ばれて列挙される。また、図6の日本語文書から切り出される文書構成文字列見出しJWD2に対応する文書構成文字列は、「先ごろ、貴殿、届く、同封」等のほかに、「抗議」という否定的な文脈の語が含まれており、これらの語から原文は否定的な文脈であることが把握できる。
【0051】
図7に示す情報付き対訳メモリ15aの中には、「よくこのようなことがおできに……」という、日本語ではほぼ等しいが、英語ではかなり異なる2つの対訳ペアが格納されている(図7網掛け部分参照)。この2つの対訳ペアにはそれぞれ異なる文書構成文字列見出し(JWD1及びJWD2)が付いており、それぞれ肯定的な文脈及び否定的な文脈の原文から抽出された文であることが理解できる。
【0052】
(3) 対訳情報検索装置20の動作ないし本発明に係る対訳情報検索方法の一実施の形態例について(図8及び図9参照)。なお、図8は対訳情報検索装置20の全体動作及び方法を説明する図、図9は図1に示す対訳情報検索処理部22の詳細動作を説明する図である。
【0053】
この対訳情報検索方法は、ユーザが文書データ入力部11から図10を示す例文3の日本語文書(翻訳対象文書ないし検索対象文書)を入力し(ST21)、文書分割部21に送出する。この文書分割部21では、文書データ入力部11から入力される日本語文書を文単位に分割処理し、これら分割された日本語の各文は順次バッフアメモリ12に格納する(S22)。
【0054】
しかる後、文書識別情報抽出部14は、前記対訳情報作成装置10で説明したとほぼ同様な手段によって文書識別情報を抽出する(S23)。ここでは、文書識別情報抽出部14の詳しい処理動作は図3の説明に譲る。
【0055】
この文書識別情報抽出部14は、文書識別情報を抽出した後、分割された日本語文書と文書識別情報を対訳情報検索処理部22に渡す。この対訳情報検索処理部22は、分割された日本語文書と文書識別情報とに基づいて検索処理を実行する(S24)。この対訳情報検索処理部22による検索処理の詳細は後記する(図9参照)。
【0056】
この対訳情報検索処理部22は、検索処理を終了すると、検索結果が成功したか否かを判断する(S25)。検索結果が失敗の場合、検索結果出力制御部23は表示部242に検索結果無しの状態を表示する(S26)。検索結果が成功した場合、検索対象日本語文に基づいて対訳ペアとなっている英語文を抽出し、検索結果出力制御部23に渡す(S27)。この検索結果出力制御部23は、受け取った検索結果を表示部242又はプリンタ(図示せず)に出力する(S28)次に、対訳情報検索処理部22の検索処理の詳細について図9を参照して説明する。
【0057】
この対訳情報検索処理部22の検索処理は、文書分割部21により一文単位に分割された日本語文書及び文書識別情報抽出部14で抽出された文書識別情報から、識別情報付き日本語文書を作成し、対訳メモリ15に格納する(S241)。図11は対訳メモリ15のデータ配列構成を示す図であって、文書識別情報付き対訳メモリ15aには図10に示す日本語文書の例文3から作成された文書識別情報付き日本語文書が格納され、文書識別情報定義テーブル15bには日本語文書の文書構成文字列データが格納されている。
【0058】
この文書識別情報付き日本語文書は、一文単位に分割された日本語文(J:)に文書識別情報(PROP)を付与した一つの単位(以下、情報付き日本語文と呼ぶ)として構成されている。この文書識別情報は、前述する対訳情報作成装置10とほぼ同様のデータ配列構成を有しており、例えば文書構成文字列見出し(JWD=JWDP)、文番号(SN)、段落番号(PN)などからなっている。
同様に、文書識別情報定義テーブル15bには文書構成文字列見出しに対応する文書構成文字列データが定義されている。しかし、その定義内容は、前述する対訳情報作成装置10と多少異なり、日本語の文書構成文字列が段落別に抽出され、抽出結果としてJWDP1〜JWDP5別に分けられている。これは、検索対象文書が長く、多数の段落から構成されている場合、文書全体をひとまとめにした処理だけでなく、後記する文書識別情報に関する処理を段落単位で行えるようにするためである。
【0059】
引き続き、検索対象となる情報付き日本語文と文書構成情報付き対訳メモリ15a中の情報付き対訳ペアの一方である原文との一致度を計算する(S242〜S245)。この検索装置20における一致度計算のポイントは、日本語文字列の一致度に加え、さらに文書識別情報の一致度も考慮する点にある。この文書識別情報は、検索対象の日本語文書全体の文脈や文意を反映しているので、これにより検索対象の日本語文書の文脈を考慮した検索が可能となる。特に、日本語文をもつ同様な複数の対訳ペアが対訳メモリ15aに存在しても、文書識別情報の文書構成文字列の一致度を考慮することにより、検索対象の日本語文と文脈的に一致度の高い対訳ペアを検索することが可能となる。
【0060】
なお、文書識別情報の一致度の計算は、最も単純な一計算法を説明すれば、例えば文書識別情報中の文書構成文字列(JWD)を直交ベクトル成分とする文書全体を代表する文書ベクトルを作成し、ベクトルの内積を一致度とするベクトル空間法が用いられる。
【0061】
ここで、検索対象である図11の文書識別情報付き日本語文に対して、図7の対訳メモリ15aを検索した場合を例とし、一致度の計算処理(S242〜S245)を具体的に説明する。
【0062】
今、図11に示す文書識別情報定義テーブル15bにあるすべての文書構成文字列(JWDP1〜JWDP5)に基づき、各文書構成文字列をベクトル成分とし、その文書識別情報の頻度を重みとした検索対象文書ベクトル(Dtr)を作成する(S242)。ここで、段落別の文書構成文字列JWDP1、JWDP2などから、それぞれ個別に検索対象ベクトルを作成し、これら複数のベクトルを同時に考慮すれば、段落ごとの文脈をきめ細かく反映した検索が可能となる。
【0063】
次に、図7に示す文書識別情報付き対訳ペアに付与された各文書構成文字列(JWD1、JWD2)に基づき、各文字列をベクトル成分とし、頻度を重みとした対訳メモリ15の文書ベクトル(DTM1、DTM2)を作成する(S243)。さらに、検索対象文の文書ベクトルと対訳メモリ15の文書ベクトルとの一致度を求めるために、DtrとDTM1、DtrとDTM2の内積をそれぞれ計算する(S244)。DTM1では、「お祝い、健闘」が一致することから内積値はゼロより大きい正の整数となるが、DTM2では、一致項目が無いので、内積値はゼロとなる。その結果、DtrとDTM1の内積値はDtrとDTM2の正積値よりも大きく、DTM1の方の一致度が高いことが分かる。
【0064】
次に、検索対象文書から一文を取り上げ、文字列の一致度について計算する(S245)。一例として、図11の一文である「よくこのようなことがおできになりましたね」(図11の網掛け部分参照)を文字列検索した場合を考えてみる。図7の情報付き対訳メモリ15aの中には、日本語文が「よくこのようなことがおできになりますね。」と「よくこのようなことがおできになりましたね。」である二つの対訳ペアが存在し(図7の網掛け部分参照)、それぞれに文書識別情報JWD1、JWD2が付与されている。
【0065】
そこで、検索対象文を意味のある4つの語「よく・このような・こと・おできになりましたね」に分解したとする。このような文において、活用が異なるだけで基本形が一致している場合には0.5の重みで一致と考える。このような条件のもとに一致度を計算すると、JWD1が付与されている日本語文は、4語中の3語が完全に一致し、1語は活用の違いだけであって基本形は一致するので、一致度は、(3/4)+{0.5(1/4)}=0.88となる。一方、JWD2が付与されている日本語文は、4語中4語が一致するので、一致度は4/4=1となる。従って、文字列の一致度だけを考慮すると、JWD2が付与されている対訳ペアの方が一致度が高い。しかし、最終的な一致度は、文書構成文字列の一致度と文書識別情報の一致度との両方を考慮し、、例えば2つの一致度を掛けた値とすれば、JWD2が付与された対訳ペアの文書識別情報の一致度がゼロになり、結局、JWD1が付与された対訳ペアの一致度の方が高くなる。このことは、文字列の一致度が低くても、文脈の一致度が高い対訳ペアが選択されることになる。
【0066】
従って、以上のような対訳情報作成装置10は、対訳対象の一文だけでなく、対訳対象文書全体の特徴を反映するように対訳情報を作成するので、対訳情報検索装置20では、図10に示す検索対象文書に関し、文脈や意図を考慮した訳文を検索することができる。なお、前述の説明は、ごく単純な例を挙げて説明をしたが、文書ベクトルを構成するベクトル成分を作成する際、以下のようなステップ数を導入することにより、一致度計算の精度を上げることができる。すなわち、各日本語構成文字列そのものをベクトル成分とせずに同意語、関連語などの相関が大きな語を分類(クラスタリング)し、同一分類に入る語をサブ成分としてベクトル成分を再構築する。同じベクトル成分に分類された同義語及び関連語は一致する語と見なすことにより、一致度はより文の主旨を反映したものとなる。例えば前記例において、DTM1では、「お祝い、健闘」の二語だけが一致していたが、対訳メモリ15(図7参照)中の「達成、成果」等の語と、「検索対象文(図10参照)中の「栄誉、獲得、勝利」などの関連語も「一致する」と期待することができる。
【0067】
また、図10に示す検索対象文中にJWD2の文字列(図6の日本語文書=例文2)と一致する文のスタイルに関わる「貴殿、届く」などの語が含まれていたとしても、以上のような処理を実行することにより、文意を反映した一致度を十分高くできれば、文意に即した検索を行うことができる。
【0068】
さらに、本発明方法においては、自動生成された分類に対する重みを、ユーザの判断に応じて調整すれば、ユーザの意図を考慮した検索が可能となる。つまり、前述する例において、文意を重視したければ、「お祝い」などの含まれる分類の重みを大きくするとか、手紙文というスタイルの文の一致度を重視したければ、文のスタイルに関わる語の重みを大きくすることも可能である。
【0069】
なお、クラスタリングを行うには、相関強度の定義が必要になるが、例えばニューラルネットワークを利用した自動学習、EDR(Electlonic Dictionary Research)編集の電子化辞書又はWord Net等の同意語、関連語、概念等の既存の分類体系を利用することができる。このような辞書、分類体系を利用することにより、文書の構成文字列から必要に応じて分類を作成することができ、特に分類を用意する必要がなく、分類の追加、変更も柔軟に行うことができる。
【0070】
次に、図1に示す検索結果出力制御部23、図8のステップS25ないしS28の詳細について説明する。
【0071】
ステップS25において、検索が成功した場合、検索結果を表示部242に表示するが、本発明の対訳情報検索装置20の検索結果出力制御部23では、検索結果だけでなく、その前後の文も同時に表示する方法を採用する。つまり、対訳メモリ15に格納される文書識別情報の中に、対訳ペアの出典文書全体の通し番号(文番号)が記述されている。そこで、この文番号を利用し、検索結果の英語文及び日本語文の前後の文を表示することができる。
【0072】
図12は翻訳結果の表示部242への表示例を示す図である。この検索結果出力制御部23は、左上側に検索対象原文表示ウインドウ242a、右上側に訳文表示ウインドウ242bが配置されている。この検索対象原文表示ウインドウ242aには検索対象原文である日本語文が表示され、一方、訳文表示ウインドウ242bには対訳メモリ15を参照し検索結果である翻訳結果英語文が表示される。
【0073】
このような状態において、検索対象原文である日本語文書の一文をマウスで選択すると、表示部下側に対訳メモリ検索結果表示ウインドウ242cが表れ、ここに検索対象原文のみの検索結果が表示される。さらに、検索結果表示ウインドウ242cに表示された検索結果をマウスで選択し、右クリックすると、ウインドウ242dが表れ、このウインドウ242dには検索結果文の出典文書における前後に位置する文もポップアップ表示される。これにより、検索結果の一文がどのような文脈で用いられているかを容易に把握することができる。
【0074】
なお、本願発明は、上記実施の形態に限定されるものでなく、その要旨を逸脱しない範囲で種々変形して実施できる。
【0075】
また、各実施の形態は可能な限り組み合わせて実施することが可能であり、その場合には組み合わせによる効果が得られる。さらに、上記各実施の形態には種々の上位,下位段階の発明が含まれており、開示された複数の構成要素の適宜な組み合わせにより種々の発明が抽出され得るものである。例えば問題点を解決するための手段に記載される全構成要件から幾つかの構成要件が省略されうることで発明が抽出された場合には、その抽出された発明を実施する場合には省略部分が周知慣用技術で適宜補われるものである。
【0076】
【発明の効果】
以上説明したように本発明によれば、対訳ペアに原文文書の全体の特徴を考慮した文書識別情報を付加することにより、原文文書の文脈や意図を反映した対訳情報を作成することができ、また原文文書の構成文字列から容易に分類分けされた文書識別情報付き対訳情報を作成できる対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法を提供できる。
【0077】
また、本発明は、検索対象原文に対し、文脈や意図を汲み取った第二言語の検索結果(翻訳結果)を容易に検索でき、また検索結果の前後の文も同時に出力すれば、検索結果の文がどのような文脈となっているか容易に把握できる対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法を提供できる。
【図面の簡単な説明】
【図1】本発明に係る対訳情報作成装置及び対訳情報検索装置の一実施の形態を含んだシステムの構成図。
【図2】対訳情報作成装置の動作及び本発明に係る対訳情報作成方法の一実施の形態を説明するフローチャート。
【図3】図1に示す対訳情報作成装置の文書識別情報抽出部の動作例を説明するフローチャート。
【図4】例文1としての入力原文とこの入力原文の対訳文書(訳文)との関係を示す図。
【図5】例文1に関する文書の文ごとの対訳ペアに文書識別情報を付加した対訳情報が格納された対訳メモリのデータ配列構成を示す図。
【図6】例文2としての入力原文とこの入力原文の対訳文書(訳文)との関係を示す図。
【図7】例文1に関する対訳情報に例文2に関する対訳情報を付け加えた対訳メモリのデータ配列構成を示す図。
【図8】対訳情報検索装置の動作及び本発明に係る対訳情報検索方法の一実施の形態を説明するフローチャート。
【図9】図1に示す対訳情報検索装置の対訳情報検索部の動作例を説明するフローチャート。
【図10】例文3としての検索対象文書を説明する図。
【図11】例文3に関する文書の文ごとの対訳ペアに文書識別情報を付加した対訳情報が格納された対訳メモリのデータ配列構成を示す図。
【図12】図1に示す対訳情報検索装置の検索結果出力制御部における表示部への表示状態を示す図。
【符号の説明】
10…対訳情報作成装置、11…文書データ入力部、13…文対応付け部、14…文書識別情報抽出部、15…対訳メモリ、15a…文書識別情報付き対訳メモリ、15b…文書識別情報定義テーブル、16…対訳情報作成部、17…プログラム記録媒体、20…対訳情報検索装置、21…文書分割部、22…対訳情報検索処理部、23…検索結果出力制御部、25…プログラム記録媒体。

Claims (13)

  1. 原文文書と当該原文文書の訳文文書よりなる対訳文書を入力する文書データ入力手段と、
    この文書データ入力手段から入力される原文文書と訳文文書を文単位に対応付けする文対応付け手段と、
    前記原文文書から文書の特徴を表す文書識別情報を抽出する文書識別情報抽出手段と、
    前記文対応付け手段で文単位に対応付けられた原文と訳文との対訳ペアに前記抽出された文書識別情報を付加した対訳情報を作成し対訳メモリに記憶する対訳情報作成手段とを備えたことを特徴とする対訳情報作成装置。
  2. 前記文対応付け手段は、原文文書の文から生成される訳文と前記対訳文書の訳文との類似度から文対応付けを判断することを特徴とする請求項1に記載の対訳情報作成装置。
  3. 前記文書識別情報は、原文文書から抽出する構成文字列の他、当該原文文書及び前記訳文文書の各文に基づいて抽出する構成情報を含んだものであることを特徴とする請求項1又は請求項2に記載の対訳情報作成装置。
  4. 原文文書と当該原文文書の訳文文書よりなる対訳文書から対訳情報を作成するコンピュータに、
    前記原文文書と前記訳文文書とを文単位に対応付けする文対応付け機能と、
    この原文文書から文書の特徴を表す文書識別情報を抽出する文書識別情報抽出機能と、
    前記文対応付け機能により文単位に対応付けられた原文と訳文との対訳ペアに前記抽出された文書識別情報を付加した対訳情報を作成し記憶手段に記憶する対訳情報作成機能とを実現させることを特徴とする対訳情報作成用プログラム。
  5. 対訳文書を構成する原文文書と訳文文書とを文単位に文対応付けを行うステップと、
    前記原文文書から文書の特徴を表す文書識別情報を抽出する情報抽出ステップと、
    前記文単位に対応付けられた原文と訳文との対訳ペアに前記ステップで抽出された文書識別情報を付加した対訳情報を作成し記憶手段に記憶するステップとを有することを特徴とする対訳情報作成方法。
  6. 前記文書識別情報抽出ステップは、原文文書から文書の特徴を表す文書構成文字列を抽出するステップと、前記文対応付けされた原文文書の各文と前記訳文文書の各文の文書中の文構成情報を抽出するステップとを有することを特徴とする請求項5に記載する対訳情報作成方法。
  7. 予め対訳ペアに文書識別情報を付加した対訳情報(既文書識別情報付き対訳ペア)が対訳メモリに記憶され、検索対象原文から所要とする訳文を検索する対訳情報検索装置において、
    前記検索対象原文文書を文単位に分割する文書分割手段と、
    この検索対象原文文書から文書の特徴を表す文書識別情報を抽出する文書識別情報抽出手段と、
    前記文単位に分割された前記検索対象原文に前記書識別情報を付加した情報と前記対訳メモリ中の既文書識別情報付き対訳ペアの原文とから当該対訳ペアの訳文を検索する対訳情報検索処理手段とを備えたことを特徴とする対訳情報検索装置。
  8. 請求項7に記載の対訳情報検索装置において、
    少なくとも前記検索対象原文文書と検索結果である訳文とを表示する検索結果出力制御手段を設けたことを特徴とする対訳情報検索装置。
  9. 前記検索結果出力制御手段は、前記検索対象原文文書と検索結果との他、前記文書識別情報抽出手段で抽出される文書識別情報から前記検索結果の前後の訳文を同時に表示することを特徴とする請求項8に記載の対訳情報検索装置。
  10. 予め対訳ペアに文書構成文字列データを含む文書識別情報を付加した対訳情報が対訳メモリに記憶され、検索対象原文から所要とする訳文を検索するコンピュータに、
    前記検索対象原文文書を文単位に分割する文書分割機能と、
    この検索対象原文文書から文書の特徴を表す文書識別情報を抽出する文書識別情報抽出機能と、
    前記文単位に分割された前記検索対象原文に前記書識別情報を付加した情報と前記対訳メモリ中の既文書識別情報付き対訳ペアの原文とから当該対訳ペアの訳文を検索する対訳情報検索処理機能とを実現させることを特徴とする対訳情報検索用プログラム。
  11. 予め対訳ペアに文書構成文字列データを含む文書識別情報を付加した対訳情報が対訳メモリに記憶され、検索対象原文から所要とする訳文を検索する対訳情報検索方法において、
    前記検索対象原文文書を文単位に分割処理するステップと、
    前記検索対象原文文書から文書の特徴を表す文書識別情報を抽出するステップと、
    前記文単位に分割された前記検索対象原文に前記書識別情報を付加した情報に基づいて前記対訳ペアの訳文を検索する検索処理ステップと、
    このステップによる検索結果の成功有無を判断し、検索成功と判断した場合、前記文書識別情報に基づいて対訳ペアとなっている訳文を抽出し、検索対象原文文書の文と訳文とを表示するステップとを有することを特徴とする対訳情報検索方法。
  12. 前記検索処理ステップは、文単位に分割された前記検索対象原文文書及び前記抽出された文書識別情報とから文書識別情報付き検索対象文を作成するステップと、この文書識別情報付き検索対象文と前記対訳メモリ中の文書識別情報付き対訳ペアの原文との一致度を計算し、検索結果を出力するステップとを有することを特徴とする請求項11に記載の対訳情報検索方法。
  13. 一致度の計算処理は、前記文書識別情報付き検索対象文及び原文の構成文字列と前記文書識別情報との一致度をそれぞれ計算することを特徴とする請求項12に記載の対訳情報検索方法。
JP2003111807A 2003-04-16 2003-04-16 対訳情報作成装置及び対訳情報検索装置 Expired - Lifetime JP3831357B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003111807A JP3831357B2 (ja) 2003-04-16 2003-04-16 対訳情報作成装置及び対訳情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003111807A JP3831357B2 (ja) 2003-04-16 2003-04-16 対訳情報作成装置及び対訳情報検索装置

Publications (2)

Publication Number Publication Date
JP2004318510A true JP2004318510A (ja) 2004-11-11
JP3831357B2 JP3831357B2 (ja) 2006-10-11

Family

ID=33472257

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003111807A Expired - Lifetime JP3831357B2 (ja) 2003-04-16 2003-04-16 対訳情報作成装置及び対訳情報検索装置

Country Status (1)

Country Link
JP (1) JP3831357B2 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009217689A (ja) * 2008-03-12 2009-09-24 National Institute Of Information & Communication Technology 情報処理装置、情報処理方法、及びプログラム
JP2010170303A (ja) * 2009-01-22 2010-08-05 Toshiba Corp 機械翻訳装置及びプログラム
JP2011095841A (ja) * 2009-10-27 2011-05-12 Sdl Plc 文脈内正確(ice)一致
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8620793B2 (en) 1999-03-19 2013-12-31 Sdl International America Incorporated Workflow management system
US8874427B2 (en) 2004-03-05 2014-10-28 Sdl Enterprise Technologies, Inc. In-context exact (ICE) matching
US8935150B2 (en) 2009-03-02 2015-01-13 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US8935148B2 (en) 2009-03-02 2015-01-13 Sdl Plc Computer-assisted natural language translation
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US9600472B2 (en) 1999-09-17 2017-03-21 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
WO2021009972A1 (ja) * 2019-07-18 2021-01-21 株式会社モールサービス 自然言語処理方法、自然言語処理システム、及び、自然言語処理プログラム
CN112307189A (zh) * 2020-10-29 2021-02-02 浙江科技学院 双语自动识别图书检索系统
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8620793B2 (en) 1999-03-19 2013-12-31 Sdl International America Incorporated Workflow management system
US10216731B2 (en) 1999-09-17 2019-02-26 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10198438B2 (en) 1999-09-17 2019-02-05 Sdl Inc. E-services translation utilizing machine translation and translation memory
US9600472B2 (en) 1999-09-17 2017-03-21 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10248650B2 (en) 2004-03-05 2019-04-02 Sdl Inc. In-context exact (ICE) matching
US8874427B2 (en) 2004-03-05 2014-10-28 Sdl Enterprise Technologies, Inc. In-context exact (ICE) matching
US9342506B2 (en) 2004-03-05 2016-05-17 Sdl Inc. In-context exact (ICE) matching
US9400786B2 (en) 2006-09-21 2016-07-26 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
JP2009217689A (ja) * 2008-03-12 2009-09-24 National Institute Of Information & Communication Technology 情報処理装置、情報処理方法、及びプログラム
JP2010170303A (ja) * 2009-01-22 2010-08-05 Toshiba Corp 機械翻訳装置及びプログラム
US8935150B2 (en) 2009-03-02 2015-01-13 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US8935148B2 (en) 2009-03-02 2015-01-13 Sdl Plc Computer-assisted natural language translation
JP2011095841A (ja) * 2009-10-27 2011-05-12 Sdl Plc 文脈内正確(ice)一致
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US11321540B2 (en) 2017-10-30 2022-05-03 Sdl Inc. Systems and methods of adaptive automated translation utilizing fine-grained alignment
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11475227B2 (en) 2017-12-27 2022-10-18 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
WO2021009972A1 (ja) * 2019-07-18 2021-01-21 株式会社モールサービス 自然言語処理方法、自然言語処理システム、及び、自然言語処理プログラム
JPWO2021009972A1 (ja) * 2019-07-18 2021-09-13 株式会社モールサービス 自然言語処理方法、自然言語処理システム、及び、自然言語処理プログラム
CN112307189A (zh) * 2020-10-29 2021-02-02 浙江科技学院 双语自动识别图书检索系统

Also Published As

Publication number Publication date
JP3831357B2 (ja) 2006-10-11

Similar Documents

Publication Publication Date Title
Al-Saleh et al. Automatic Arabic text summarization: a survey
US6662152B2 (en) Information retrieval apparatus and information retrieval method
KR101136007B1 (ko) 문서 감성 분석 시스템 및 그 방법
EP1927927A2 (en) Speech recognition training method for audio and video file indexing on a search engine
US20070055493A1 (en) String matching method and system and computer-readable recording medium storing the string matching method
WO2005059771A1 (ja) 対訳判断装置、方法及びプログラム
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
JP5403696B2 (ja) 言語モデル生成装置、その方法及びそのプログラム
WO2008107305A2 (en) Search-based word segmentation method and device for language without word boundary tag
JPH11219368A (ja) 情報検索装置及び情報検索方法
JP3831357B2 (ja) 対訳情報作成装置及び対訳情報検索装置
JP2004062893A (ja) 重み付き編集距離に基づく例文の自動検索用システムおよび方法
JPH1145274A (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
Koka et al. Automatic identification of keywords in lecture video segments
JPH08129554A (ja) 関係表現抽出装置および関係表現検索装置
JP2002251412A (ja) 文書検索装置および方法ならびに記憶媒体
JP3937741B2 (ja) 文書の標準化
JP4401269B2 (ja) 対訳判断装置及びプログラム
JP5298834B2 (ja) 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
JP3471253B2 (ja) 文書分類方法、文書分類装置、および文書分類プログラムを記録した記録媒体
CN113240485A (zh) 文本生成模型的训练方法、文本生成方法和装置
JPH10307837A (ja) 検索装置並びに検索プログラムを記録した記録媒体
JP2004220226A (ja) 検索文書のための文書分類方法及び装置
JP2020071668A (ja) 要約生成方法及び要約生成プログラム
JP2002251401A (ja) 文書検索装置および方法ならびに記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060713

R151 Written notification of patent or utility model registration

Ref document number: 3831357

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090721

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110721

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120721

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120721

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313114

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120721

Year of fee payment: 6

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130721

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term