JP2000020524A - 対訳文検索装置 - Google Patents

対訳文検索装置

Info

Publication number
JP2000020524A
JP2000020524A JP10202788A JP20278898A JP2000020524A JP 2000020524 A JP2000020524 A JP 2000020524A JP 10202788 A JP10202788 A JP 10202788A JP 20278898 A JP20278898 A JP 20278898A JP 2000020524 A JP2000020524 A JP 2000020524A
Authority
JP
Japan
Prior art keywords
sentence
language
search
written
bilingual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10202788A
Other languages
English (en)
Other versions
JP3114703B2 (ja
Inventor
Hiroshi Masuichi
博 増市
Hiroshi Umeki
宏 梅基
Shoichi Tateno
昌一 舘野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP10202788A priority Critical patent/JP3114703B2/ja
Priority to US09/343,543 priority patent/US6321189B1/en
Publication of JP2000020524A publication Critical patent/JP2000020524A/ja
Application granted granted Critical
Publication of JP3114703B2 publication Critical patent/JP3114703B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3335Syntactic pre-processing, e.g. stopword elimination, stemming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Abstract

(57)【要約】 【課題】 表現の相違、文の長さ等に大きく影響される
ことなく、対訳文ペアを用いて第1言語の検索質問文か
らより適切な訳文たる第2言語文を検索する。 【解決手段】 対訳文ペア格納手段1に第1言語で書か
れた文とそれに対応する第2言語で書かれた訳文とのペ
アを複数格納しておき、検索文入力手段2から第1言語
で書かれた検索質問文を受け付けると、第1の検索手段
3が検索質問文に基づいて対訳文ペア格納手段1に格納
されている第1言語で書かれた文の集合を対象として検
索処理する。第1の検索手段3により検索された第1言
語で書かれた文に対応して対訳文ペア格納手段1に格納
されている第2言語で書かれた訳文に類似する文を、第
2の検索手段4が対訳文ペア格納手段1に格納されてい
る第2言語で書かれた訳文の集合を対象として検索す
る。訳文ペアに対する第1言語入力文による検索を行
い、この検索結果に対応する第2言語文を用いて、訳文
ペアから第2言語文の類似検索を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、第1言語と第2言
語との2種の言語間の対訳文を検索する装置に関し、特
に、第1言語と第2言語との対訳文を用いて、第1言語
で書かれた検索質問文により第1言語についての検索を
行い、更に、当該検索結果に基づいて第2言語について
の類似文検索を行う対訳文検索装置に関する。
【0002】
【従来の技術】コンピュータ性能の向上、電子辞書の整
備、自然言語処理技術の進歩等に伴い、これまで多くの
機械翻訳技術の提案がなされてきた。しかしながら、未
だ十分な翻訳精度を持つ機械翻訳システムが実現されて
いるとは言い難い状況にある。
【0003】(従来技術1)そこで、翻訳元の言語(第
1言語)と翻訳先の言語(第2言語)の対訳文のペアを
多数用意しておき、対訳文ペアの第1言語文から第1言
語入力文に類似する文を検索し、この検索結果としての
第1言語文に対応する第2言語文を対訳文ペアから出力
し、この出力された第2言語文をユーザに参照させるこ
とによって、第1言語入力文の翻訳の質を高めようとす
る手法が提案されている。第1言語入力文と類似する文
を対訳文ペアの第1言語文の集合中から得る方法とし
て、共通に用いられている語の多いものを類似度の高い
文とする方法や、例えば特開平9−50435号公報に
記載されるように、類似文書検索手法の一つであるベク
トル空間モデルに基づいた検索手法を用いて、第1言語
入力文に対応するベクトルと距離の近いベクトルを持つ
第1言語文を類似度の高い文とする方法が提案されてい
る。
【0004】以下、文献「David Ellis,”
情報検索論”,丸善株式会社,pp.53−57(19
94)」に記載されるベクトル空間モデルにより入力文
と類似度の高い文を得る手法について説明する。ベクト
ル空間モデルにおいては、検索対象となる各文と検索式
として与えられる入力文の両者をベクトルとして表現す
る。検索対象の文がN文存在し、N文中に含まれる全単
語がM種類(W1,W2,・・・,WM)あるとして、各
文(S1,S2,・・・,SN)に対応するベクトルは、
それぞれ式1の通りにM次元のベクトルとして定義でき
る。ただし、Tijは文Si中に単語Wjが存在していれば
1、存在していなければ0である。
【0005】
【数1】 S1=(T11,T12,・・・,T1M)、 S2=(T21,T22,・・・,T2M)、 ・・・ SN=(TN1,TN2,・・・,TNM)、 ・・・(式1)
【0006】同様に検索入力文Qに対応するベクトルは
式2の通りに定義できる。ただし、Tiは入力文Q中に
単語Wiが存在していれば1、存在していなければ0で
ある。なお、ここではベクトルの各要素を1,0の2値
としているが、単語の各文中での重要度に応じて実数値
を割り当てる場合もある。
【0007】
【数2】 Q=(T1,T2,・・・,TM) ・・・(式2)
【0008】ベクトル空間モデルでは、ベクトルQと距
離の近い(距離の値が大きい)ベクトルSiに対応する
文Siを入力文Qと類似度の高い文とし、検索結果とし
て類似度の高い文から順に出力する。ベクトルQとベク
トルSiの距離D(Q,Si)は、式3の計算式に従って
行う。ただし、(V,U)はベクトルVとベクトルUの
内積である。なお、通常、ベクトル空間モデルでは、計
算に用いる単語W1,W2,・・・,WMを自立語のみと
し、助詞や助動詞等の付属語を考慮しないことが多い。
また、自立語であっても、英語のbe動詞のようなあり
ふれた語(ストップワード)は考慮しないことが多い。
【0009】
【数3】 D(Q,Si)=(Q,Si)/((Q,Q)(Si,Si))1/2 ・・・(式3 )
【0010】(従来技術2)上記の(従来技術1)と同
様の効果を得るために、第1言語の入力文中の各単語
を、辞書を用いて第2言語の単語や熟語に機械的に置き
換え、この第2言語による単語や熟語の集合を用いて第
2言語の文集合中から該当する文を検索し、得られた第
2言語文をユーザに参照させることによって翻訳の質を
高める手法が研究されている。
【0011】
【発明が解決しようとする課題】しかしながら、上記し
た(従来技術1)や(従来技術2)にあっては、次のよ
うな課題があった。
【0012】まず、(従来技術1)は、第1言語の入力
文中に存在する単語だけを基に類似する第1言語文を得
るものである。このため、第1言語入力文の翻訳文とし
て適切な第2言語文が対訳文ペア集合中に存在している
場合であっても、第1言語文の表現が第1言語入力文と
異なる場合には、検索結果として適切な第2言語文を得
ることができない。この(従来技術1)が効果的である
のは、第1言語入力文中に存在する単語集合とほぼ同一
の単語集合を構成要素とする文が対訳文ペア集合中に存
在している場合に限られてしまう。このような欠点は、
入力文中に含まれる単語の数が少ない程顕著になる。こ
のことからすれば、入力が多くの文から構成される文書
のような場合には、対応する文書ベクトルの非零の要素
が多くなり(実質的なベクトルの次元が高くなり)、検
索結果の信頼性は高くなるといえるが、実際に存在する
対訳文データは短い文であることがほとんどであるた
め、(従来技術1)により適切な対訳文(第2言語文)
を得ることは事実上困難である。
【0013】1つの例として、第1言語を日本語、第2
言語を英語とし、「次第に細くなる。」という日本語文
を入力文とする場合を考える。この文から自立語を抽出
すると、「次第」及び「細い」が得られる。なお、動詞
「なる」はストップワードであり、説明から省くことに
する。(従来技術1)によれば、上記入力文に類似する
日本語文として、「次第」と「細い」の両単語を含む文
が得られることになる。しかしながら、入力文に意味的
には等しいが、表現の異なる(使用されている単語の異
なる)次のような適切な対訳文を得ることはできない。 「先細になる。 It tapers down to a point.」 ・・・(a)、 「先へ行って尖る。 It tapers into a sharp point.」 ・・・(b)、
【0014】また、(従来技術2)は、第1言語の入力
文中の個々の単語を、辞書を用いて第2言語の単語や熟
語に置き換えることにより、参照すべき第2言語文を得
るものである。しかしながら、或る第1言語単語を表現
することが可能な第2言語の単語や熟語は極めて多様で
あり、さらに、その中からどの第2言語単語で置き換え
るのが適切であるかは第1言語入力文の文意に依存する
ため、それらを予め決定しておくことは事実上不可能で
ある。したがって、第1言語単語と第2言語単語の対応
関係を予め網羅的に辞書の形式で表現することは困難で
あり、(従来技術2)で適切な対訳文を得ることも困難
である。
【0015】1つの例として、上記の(従来技術1)に
ついての例と同じ条件において、「次第」および「細
い」を英語単語あるいは英熟語に置き換えると例えば次
のようになる。 「次第」→「gradually, by degrees, little by little, as soon as, order, the state of things, depend on」 ・・・(c)、 「細い」→「thin, narrow, fine, slim, slender」 ・・・(d)、 この(c)および(d)中の英単語を含む文を検索した
としても、上記した(a)や(b)に示した適切な英語
文を得ることはできない。実際、(c)および(d)中
の英単語を中心にして「次第に細くなる。」に対応する
英語文を作成すると不自然な文となってしまう。(a)
や(b)中の英語文に含まれる「taper」は単独で「次
第に細くなる。次第に少なくなる。」という意味を持つ
単語であるが、(従来技術2)においては、「次第」
(あるいは「細い」)の翻訳単語として「taper」が記
述されていなければ(a)や(b)を得ることはできな
いことになる。
【0016】しかしながら、「taper」は、「次第に」
と「細くなる」という両者の意味内容が同時に含まれて
いる場合にのみ対応する単語であって、「次第」(ある
いは「細い」)単独の翻訳単語としては不適切である。
「taper」と同様に単一の語で「次第に」という意味を
含む英単語として、「peter(次第に消える)」「wane
(次第に弱くなる)」「fade(次第に薄れる)」等様々
な単語を挙げることができるが、いずれも同様の理由で
「次第」という1単語の翻訳単語としては不適切であ
る。すなわち、ある日本語単語に適切に対応する英単語
は入力文の文意に依存し、予め辞書を作成しておくこと
は不可能であるといえる。
【0017】なお、前述の特開平9−50435号公報
に記載された方法では、ベクトル空間モデルにおいて、
各文ではなく、単語ごとに予めベクトルを設定し、文に
含まれる各単語に対応するベクトルの総和として文ベク
トルを表現している。この場合においても、同一単語が
存在しない場合は類似度の値が低くなり、上記した(従
来技術1)についての課題は解決されるものではない。
さらに、既に述べたように各単語の意味は文意に依存す
るものであるため、各単語について予め固定的なベクト
ルを決定しておくことは不可能であり、上記した(従来
技術2)と同種の課題を持つことになってしまう。
【0018】本発明は、上記従来の事情に鑑みなされた
ものであり、その表現の相違や単語や熟語の数に大きく
影響されることなく、対訳文ペアを用いて第1言語の検
索質問文からより適切な訳文たる第2言語文を検索する
ことを目的とする。特に、本発明は、第1言語入力文が
比較的短い場合であっても、適切な第2言語文を対訳文
ペア中から検索することを目的とする。
【0019】
【課題を解決するための手段】本発明に係る対訳文検索
装置では、対訳文ペア格納手段に第1言語で書かれた文
とそれに対応する第2言語で書かれた訳文とのペアを複
数格納しておき、検索文入力手段から第1言語で書かれ
た検索質問文を受け付けると、第1の検索手段が当該検
索質問文に基づいて対訳文ペア格納手段に格納されてい
る第1言語で書かれた文の集合を対象として検索処理す
る。そして、第1の検索手段により検索された第1言語
で書かれた文に対応して対訳文ペア格納手段に格納され
ている第2言語で書かれた訳文に類似する文を、第2の
検索手段が対訳文ペア格納手段に格納されている第2言
語で書かれた訳文の集合を対象として検索する。
【0020】すなわち、訳文ペアに対する第1言語入力
文による検索を行い、この検索結果に対応する第2言語
文を用いて、訳文ペアから第2言語文の類似検索を行っ
ている。このように訳文ペアを橋渡しとした第1言語と
第2言語との検索を二重に連続して行うことにより、表
現の相違や単語や熟語の数に大きく影響されることな
く、第1言語の検索質問文からより適切な訳文たる第2
言語文を検索することができる。なお、本明細書におい
て、第1の検索処理の対象とする第1言語で書かれた文
の集合や、第2の検索処理の対象とする第2言語で書か
れた文の集合には、対訳文ペア格納手段(文格納手段)
に格納された状態の文データである場合に限らず、これ
ら文データから抽出された節や単語或いは文集合であっ
て元の文データに対応付けられていることにより、検索
処理上、対訳文ペア格納手段(文格納手段)に格納され
た文集合と実質的に同一に扱うことができるデータ集合
をも包含している。
【0021】また、本発明に係る対訳文検索装置では、
対訳文ペア格納手段に第1言語で書かれた文とそれに対
応する第2言語で書かれた訳文とのペアを複数格納し、
また、文格納手段に第2言語で書かれた文を複数格納し
ておき、検索文入力手段から第1言語で書かれた検索質
問文を受け付けると、第1の検索手段が当該検索質問文
に基づいて対訳文ペア格納手段に格納されている第1言
語で書かれた文の集合を対象として検索処理する。そし
て、第1の検索手段により検索された第1言語で書かれ
た文に対応して対訳文ペア格納手段に格納されている第
2言語で書かれた訳文に類似する文を、第2の検索手段
が対訳文ペア格納手段及び文格納手段に格納されている
第2言語で書かれた文の集合を対象として検索する。
【0022】すなわち、訳文ペアに対する第1言語入力
文による検索を行い、この検索結果に対応する第2言語
文を用いて、訳文ペア及び別個な第2言語文の集合から
第2言語文の類似検索を行っている。この態様において
も訳文ペアを橋渡しとした第1言語と第2言語との検索
を二重に連続して行っており、これにより、表現の相違
や単語や熟語の数に大きく影響されることなく、第1言
語の検索質問文からより適切な訳文たる第2言語文を検
索することができる。なお、この態様によれば、第2の
検索手段による類似文検索に、訳文ペアの他に、例えば
外部の文書集合データベースをもネットワーク等を通し
て利用し、より多くのデータを用いてより適切なる第2
言語の訳文を得ることができる。
【0023】また、本発明に係る対訳文検索装置では、
対訳文ペア格納手段に第1言語で書かれた文とそれに対
応する第2言語で書かれた訳文とのペアを複数格納し、
また、文格納手段に第2言語で書かれた文を複数格納し
ておき、検索文入力手段から第1言語で書かれた検索質
問文を受け付けると、第1の検索手段が当該検索質問文
に基づいて対訳文ペア格納手段に格納されている第1言
語で書かれた文の集合を対象として検索処理する。そし
て、第1の検索手段により検索された第1言語で書かれ
た文に対応して対訳文ペア格納手段に格納されている第
2言語で書かれた訳文に類似する文を、第2の検索手段
が文格納手段に格納されている第2言語で書かれた文の
集合を対象として検索する。
【0024】すなわち、訳文ペアに対する第1言語入力
文による検索を行い、この検索結果に対応する第2言語
文を用いて、訳文ペアとは別個な第2言語文の集合から
第2言語文の類似検索を行っている。この態様において
も訳文ペアを橋渡しとした第1言語と第2言語との検索
を二重に連続して行っており、これにより、表現の相違
や単語や熟語の数に大きく影響されることなく、第1言
語の検索質問文からより適切な訳文たる第2言語文を検
索することができる。なお、この態様によれば、第2の
検索手段による類似文検索に、例えば外部の文書集合デ
ータベースをネットワーク等を通して利用し、種々なデ
ータを用いてより適切なる第2言語の訳文を得ることが
できる。
【0025】なお、本発明に係る対訳文検索装置は、後
述するように、第2の検索手段による検索において重要
語やその重要度を用いる、第2の検索手段による検索に
おいてベクトル空間モデルを用いる、第2の検索手段に
より第1言語で書かれた文と第2言語で書かれた訳文と
からなる対訳文ペアに類似する対訳文ペアを検索する、
第1言語で書かれた検索質問文を複数の単語或いは節に
分割して、これら各単語或いは各節ごとに類似文検索を
行う、等と言った種々な態様で実現することができる。
また、本発明に係る対訳文検索方法は、上記のような訳
文ペアを用いた第1言語による第1の検索と、この検索
結果に基づいて、訳文ペア及び/又は別個な第2言語文
集合を用いた第2言語による第2の検索とを行うことに
よって、第1言語の検索質問文からより適切な訳文たる
第2言語文を検索することができる。
【0026】また、本発明は、上記した対訳文検索をコ
ンピュータに実行させるためのプログラムを記憶した記
憶媒体としても実施でき、第1言語で書かれた検索質問
文を受け付ける検索文入力機能と、メモリに記憶されて
いる第1言語で書かれた文とそれに対応する第2言語で
書かれた訳文とのペアデータを用いて、受け付けた検索
質問文に基づいて第1言語で書かれた文の集合を対象と
して検索処理する第1の検索機能と、第1の検索機能に
より検索された第1言語で書かれた文に対応するペアデ
ータ中の第2言語で書かれた訳文に類似する文を、当該
ペアデータ中の第2言語で書かれた訳文集合(及び/又
は、当該ペアデータとは別個にメモリに格納されている
第2言語で書かれた文の集合)を対象として検索する第
2の検索機能と、をコンピュータに実現させるための対
訳文検索プログラムをコンピュータにより読み出し可能
にCDROM等の記憶媒体に記憶した。
【0027】ここで、本発明の記憶媒体において、コン
ピュータに設けられているメモリや外部のデータベース
に予め用意したペアデータを用いるようにしてもよい
が、ペアデータを上記の対訳文検索機能プログラムと共
に記憶媒体に記憶したパッケージとしてもよい。なお、
この場合には、記憶媒体に記憶されたペアデータをコン
ピュータに利用させるために、当該記憶媒体に記憶され
る対訳文検索機能プログラムには、ペアデータを記憶媒
体から読み出してコンピュータに備えられているメモリ
に格納する機能が含まれている。
【0028】より具体的に説明すると、本発明を実施し
た場合の対訳文検索装置の典型的な態様は図1に示すよ
うなものとなる。すなわち、第1言語で書かれた文とそ
れに対応する第2言語で書かれた訳文とのペアを複数格
納する対訳文ペア格納手段1と、第1言語で書かれた検
索質問文を受け付ける検索文入力手段2と、検索質問文
に類似する文を対訳文ペア格納手段1に格納されている
第1言語で書かれた文の集合から検索する第1の検索手
段3と、第1の検索手段により検索された第1言語で書
かれた文に対応して対訳文ペア格納手段1に格納されて
いる第2言語で書かれた文を入力として、当該文に類似
する文を対訳文ペア格納手段1に格納されている第2言
語で書かれた文の集合から検索する第2の検索手段4
と、を備えて構成される。
【0029】第1の検索手段3による類似文検索は、例
えば、第1言語の検索質問文から自立語を抽出した後、
(1)得られた自立語集合を基にベクトル空間モデルに
従って得られる類似文(第1言語文)の内から距離の値
が所定の閾値よりも大きい文を検索結果とする、又は、
(2)後述する拡張相互情報量に基づいた計算によって
得られる類似文(第1言語文)の内から拡張相互情報量
の合計値が所定の閾値よりも大きい文を検索結果とす
る、のいずれかの方法で行う。そして、第1の検索手段
3から得られた第1言語文の集合中の各第1言語文は、
対訳文ペア格納手段1に格納されている対応する第2言
語文に置き換えられて、第2の検索手段4に入力され
る。
【0030】第2の検索手段4による類似文検索は、例
えば、このようにして得られた第2言語文集合から自立
語を抽出し、(1)得られた自立語集合を基にベクトル
空間モデルに従って得られる類似文(第2言語文)の内
から距離の値が所定の閾値よりも大きい文を検索結果と
する、又は、(2)後述する拡張相互情報量に基づいた
計算によって得られる類似文(第2言語文)の内から拡
張相互情報量の合計値が所定の閾値よりも大きい文を検
索結果とする、のいずれかの方法で行う。なお、複数の
文を入力として、ベクトル空間モデルを利用する場合に
は、入力された各文に対応する文ベクトルの総和ベクト
ルを入力文ベクトルとみなして、単一文入力の場合と同
様の計算を行えばよい。
【0031】第1の検索手段3で行う検索は、入力され
た検索質問文と類似性のある第1言語文を広範に得るこ
とを目的としている。ベクトル空間モデルによる類似文
検索も、後述する拡張相互情報量に基づいた計算による
類似文検索も、統計的な手法に基づくものであり、検索
質問文中の異なり語数が多いほど結果の信頼性は高くな
る。したがって、第1の検索手段3で行う類似文検索
は、第2の検索手段4で行う類似文検索に対する入力文
の量を増加させ、より漏れの少ない検索とすることを狙
いとしている。また、第2の検索手段4で行う検索は、
第2言語で類似検索を行うものであり、これにより、第
1言語の表現の違いに依存しない第2言語の類似文を得
ることが可能となる。
【0032】このような第1の検索手段3と第2の検索
手段4の組み合わせにより、前記した(従来技術1)お
よび(従来技術2)における課題を解決することができ
る。(従来技術1)における課題は、第1言語入力文と
意味的には等しいが表現の異なる第1言語文が対訳文ペ
ア集合中に存在する場合でも、その文を検索できないと
いうものであった。本発明によると、第2言語文集合に
対する第2の検索手段4による類似文検索の結果が最終
結果となるため、第1言語入力文に含まれる単語を全く
含まないものであっても、第1言語入力文と類似性の高
い対訳文ペアが存在すれば、それを検索結果として得る
ことができる。また、(従来技術2)における課題は、
或る第1言語単語に対応する第2言語単語を網羅的に記
述する辞書を予め作成しておくことが不可能であるとい
うものであった。本発明によると、第1の検索手段3に
よって第1言語入力文と類似度の高い第1言語文集合を
取得し、それらに対応する第2言語文集合を基に第2の
検索手段4で類似文検索を行っており、第1言語単語と
第2言語単語の対応関係は、第1言語入力文に応じて類
似文検索された広範な対訳文ペアから得られる単語情報
によって動的に決定される。すなわち、第1言語単語に
対応する第2言語単語を辞書として作成しておくことな
しに、網羅的な第1言語単語と第2言語単語の対応関係
を得ることが可能となる。
【0033】1つの例として、上記した(従来技術1)
についての例と同じ条件で、本発明の第1の検索手段3
から、「イギリスの援助が次第に減じた。(British ai
d tapered off.)」、「フランスワインの購買が次第に
先細りになった。(The purchase of French wine tape
red off.)」、「彼の筋肉たくましい脚は下に向かって
だんだん細くなり、足首はほっそりとしていた。(His
muscular legs tapered to slender ankles.)」、「彼
の言っていることがはっきりわかってくると拍手かっさ
いが心もとなげに次第に小さくなった。(When they re
alized what hewas saying, the applause tapered off
uncertainly.)」、と言った日本文が得られる。これ
らのいずれの文も「次第」あるいは「細い」のいずれか
が含まれているため、入力日本語文「次第に細くなる」
の類似文として得られるものである。第2の検索手段4
は、第1の検索手段3から得られた日本語文集合の各々
に対応する英語文の集合を入力として類似文検索を行う
が、上記の例文中の英語訳には全て「taper」が含まれ
ているため、第2の検索手段4の検索結果では「tape
r」を含む文の類似度が高くなり、上記した(a)
(b)が検索結果として得られることになる。
【0034】
【発明の実施の形態】本発明をその一実施形態に基づい
て具体的に説明する。本実施形態では、本来単語間の類
似度として用いる統計量である相互情報量、Dice−
coefficentおよびt−scoreを拡張する
ことによって、検索式と単語の間の類似度計算を実現し
ている。なお、相互情報量、Dice−coeffic
entおよびt−scoreを単語間の類似度計算に用
いた例として、「春野,山崎:辞書と統計を用いた対訳
アライメント,情報処理学会自然言語処理研究会研究報
告,96−NL−112,pp.23−30(199
6)」、「大森,堤,中西:統計情報を用いた対訳単語
辞書の作成,言語処理学会第2回年次大会発表論文集,
pp.49−52(1996)」等を挙げることができ
る。
【0035】単語word1と単語word2の間の相
互情報量(MI)は、式4によって定義される。ただ
し、全検索対象文書数をM、word1とword2を
共に含む文書数をa、word1のみを含む文書数を
b、word2のみを含む文書数をcとした場合、それ
ぞれ出現確率は式5である。
【0036】
【数4】 MI(word1,word2)=log2{prob(word1,word 2)/(prob(word1)prob(word2))} ・・・(式4)
【0037】
【数5】 prob(word1,word2)=a/M prob(word1)=(a+b)/M prob(word2)=(a+c)/M ・・・(式5)
【0038】これに対して本実施形態では、検索式Sと
単語wordの間の相互情報量(MI’)を、式6によ
って定義している。ただし、全検索対象文書数をM、w
ordを含み且つ検索式Sから得られる文書の数を
a’、検索式Sから得られる文書の内のwordを含ま
ない文書の数をb’、wordを含む文書のうち検索式
Sから得られる文書を除いた文書の数をc’とした場
合、それぞれ出現確率は式7である。
【0039】
【数6】 MI’(S,word)=log2{prob(S,word)/(prob( S)prob(word))} ・・・(式6)
【0040】
【数7】 prob(S,word)=a’/M prob(S)=(a’+b’)/M prob(word)=(a’+c’)/M ・・・(式7)
【0041】また、相互情報量と同様に単語間の類似度
を求める統計量として、Dice−coefficen
tおよびt−scoreを挙げることができる。Dic
e−coefficent(DC)は式8、t−sco
re(TS)は式9で定義される。
【0042】
【数8】 DC(word1,word2)=2prob(word1,word2)/( prob(word1)+prob(word2)) ・・・(式8)
【0043】
【数9】 TS(word1,word2)= M(prob(word1,word2) −prob(word1)prob(word2))/(prob(word1 )prob(word2)) ・・・(式9)
【0044】これらについても、相互情報量と同様に、
検索式と単語の間の類似度計算するために式10および
式11に示す拡張を施している。なお、MI’(S,w
ord)、DC’(S,word)、TS’(S,wo
rd)のいずれも、その値が大きいほど検索式Sと単語
wordの間に高い類似性があることを意味する。
【0045】
【数10】 DC’(S,word)=2prob(S,word)/(prob(S)+p rob(word)) ・・・(式10)
【0046】
【数11】 TS’(S,word)=M(prob(S,word)−prob(S)pr ob(word))/(prob(S)prob(word))・・・(式11 )
【0047】本実施形態では、上記の検索式と単語の間
の拡張相互情報量(MI’)、又は、拡張Dice−c
oefficent(DC’)、又は、拡張t−sco
re(TS’)のいずれかによって、検索式Sと単語w
ord(すなわち、これら値の重要度を持った重要語候
補)の間の類似度を求めている。具体的には、本実施例
では、拡張相互情報量(MI’)を用いた以下のアルゴ
リズム[S01]〜[S04]を本実施形態の対訳文検
索装置で実行することによって、文集合Dを検索対象と
して、検索式Sの類似文検索を行っている。
【0048】[S01]:検索式Sで文書集合Dを検索
し、得られた文集合中に存在する全ての自立語を形態素
解析処理(文を単語に分割する処理)を施すことにより
抽出する。なお、得られた自立語集合をW=(w1,w
2,・・・,wn)とする。 [S02]:(式6)により、検索式Sと自立語集合W
中の各自立語との間の拡張相互情報量(MI’(S,w
1),MI’(S,w2),・・・,MI’(S,Wn))を
求める。 [S03]:文集合D中の全ての文を対象として、自立
語集合Wの要素wiを含む文に対してMI’(S,wi)
の値を加える計算を、1≦i≦nを満たすiについて繰
り返す。 [S04]:MI’(S,wi)の合計値の高い文から
順に出力し、検索式Sの類似度文検索の結果とする。
【0049】それでは、図2を参照して本実施形態に係
る対訳文検索装置の構成を説明する。なお、本実施形態
では、CDROM等の携帯可能な記憶媒体に格納された
対訳文検索プログラムをコンピュータの読み取り装置で
読み取らせ、当該プログラムをコンピュータに実行させ
ることにより対訳文検索装置を実現しているが、本発明
に係る対訳文検索装置は以下に説明する各機能を実現す
る専用の装置として実施してもよい。また、本実施形態
では、第1言語を日本語、第2言語を英語として説明し
ているが、形態素解析処理が適用可能な言語であればど
うような言語であっても同様の効果を得ることができ
る。
【0050】日本語文入力手段11は、類似する英語文
を得るためにユーザが入力する日本語で書かれた検索質
問文を受け付けるユーザインターフェースを有したプロ
グラムモジュールである。なお、日本語文入力手段11
の他の態様としては、通信回線を介して遠隔地のユーザ
から検索質問文を受け付ける通信インタフェースを備え
てもよい。対訳文ペア格納手段12は、日本語文と英語
文の対訳文のペアを複数格納するメモリを有したプログ
ラムモジュールであり、本例では、これらペアデータは
予めコンピュータのメモリに用意しておくが、対訳検索
プログラムと共にペアデータを記憶媒体に格納してお
き、当該ペアデータをコンピュータのメモリに書き込む
或いはコンピュータが当該記憶媒体にアクセスして必要
なペアデータを用いるようにしてもよい。なお、本例で
は、日本語文とそれに対応する英語文とからなる各ペア
データには、それらを一意に特定できる識別子(対訳文
ペア識別子)が割り振られている。
【0051】形態素解析手段13は、対訳文ペア格納手
段12に格納されている全ての文と、日本語文入力手段
11から受け付けた日本語検索質問文に対して形態素解
析処理を行うプログラムモジュールである。形態素解析
手段13は、対訳文ペア格納手段12に格納されている
文の解析結果は対訳文ペア自立語格納手段15に格納
し、日本語文入力手段11から受け付けた日本語検索質
問文の解析結果は検索式作成手段14に引き渡す。検索
式作成手段14は、日本語検索質問文の形態素解析結果
を形態素解析手段13から受け取って該解析結果から自
立語(ただしストップワードは除く)を抽出し、得られ
た自立語を論理和演算子ORで結合して検索式とするプ
ログラムモジュールである。
【0052】対訳文ペア自立語格納手段15は、対訳文
ペア格納手段12に格納されている全ての文の形態素解
析結果を形態素解析手段13から受け取って、該解析結
果から自立語(ただしストップワードは除く)を抽出し
た上で、各対訳文ペア識別子ごとに格納するメモリを有
したプログラムモジュールである。日本語類似文検索手
段16は、検索式作成手段14によって作成された検索
式を入力として、対訳文ペア自立語格納手段15に格納
されている日本語単語情報に基づいて、該検索式に類似
する複数の日本語文(対訳文ペア識別子)を得るプログ
ラムモジュールである。なお、この類似文を得るための
検索に拡張相互情報量が用いられる。
【0053】言語変換手段17は、日本語類似文検索手
段6によって得られた対訳文ペア識別子に対応する英単
語の全てを対訳文ペア自立語格納手段15から取得し
て、それらを論理和演算子ORで結合して英単語による
検索式を作成するプログラムモジュールである。英語類
似文検索手段18は、言語変換手段17によって作成さ
れた検索式を入力として、対訳文ペア自立語格納手段1
5に格納されている英語単語情報に基づいて、該検索式
に類似する複数の英語文(対訳文ペア識別子)を得るプ
ログラムモジュールである。なお、この類似文を得るた
めの検索に拡張相互情報量が用いられる。検索結果出力
手段19は、英語類似文検索手段18の検索結果を受け
取って、それらをユーザに対して表示するユーザインタ
ーフェースを有したプログラムモジュールである。
【0054】図3には、対訳文ペア格納手段12に複数
格納されている対訳文ペア(ペアデータ)の一例を示し
てあり、各対訳文ペアは対訳文ペア識別子で一意に特定
される日本語文とそれに対応する英語文とから成ってい
る。図4には、対訳文ペア自立語格納手段15に格納さ
れる対訳文ペアの形態素解析結果の一例を示してあり、
対訳文ペアの日本語文から抽出された日本語自立語とそ
れに対応する英語文から抽出された英語自立語とが、元
の対訳文ペアと同一の対訳文ペア識別子で特定されてい
る。すなわち、対訳文ペア自立語格納手段15に格納さ
れる対訳文ペアと対訳文ペア格納手段12に格納されて
いる対訳文ペアとは、対訳文ペア識別子によって一意に
対応付けられている。なお、本実施形態では、類似文検
索を行う前に、対訳文ペア自立語格納手段15の格納内
容を得るために、対訳文ペア格納手段12に格納されて
いる全ての対訳文ペアに対して形態素解析処理を施して
おく。
【0055】図5には、上記構成の対訳文検索装置によ
って実行されるアルゴリズムをフローチャートで示して
あり、当該アルゴリズムを実行することによって、日本
語文入力手段11に入力された日本語検索質問文に類似
する対訳英語文が得られる。まず、日本語文入力手段1
1が入力された日本語入力文(検索質問文)Qを受け付
けると(ステップS1)、形態素解析手段13が日本語
検索質問文Qに形態素解析処理を施して、単語に分割す
る(ステップS2)。そして、検索式作成手段14が、
日本語検索質問文Qから得られた単語の内からストップ
ワード以外の自立語を抽出し、各自立語を論理和演算子
ORで結合して検索式Sとする(ステップS3)。
【0056】次いで、日本語類似文検索手段16が、検
索式Sを入力として、対訳文ペア格納手段12に格納さ
れている対訳文ペアの日本語文を対象に通常の検索(例
えば、キーワードマッチング)を行い、検索式S中のい
ずれかの単語を含む日本語文を検索して得られた検索結
果数をMとする(ステップS4)。そして、日本語類似
文検索手段16が当該Mが0であるか否かを判断し(ス
テップS5)、Mが0である場合には、入力された日本
語検索質問文Qに類似する英語文は検索対象のデータ中
に存在しない旨を検索結果出力手段19から表示出力し
て処理を終了する(ステップS14)。なお、検索対象
の対訳文ペア中に入力日本語文Q中の単語すら含んでい
ない場合には、当該対訳文ペア中に類似文が存在する可
能性はほとんど無いと言えるので、本実施形態では、こ
のような通常の検索(ステップS4)を前処理的に行う
ことによって以後の類似文検索を無駄に行わないように
している。
【0057】一方、Mが0でない場合には、日本語類似
文検索手段16が、検索式Sを入力として、対訳文ペア
の日本語文を対象に類似文検索を行う(ステップS
6)。すなわち、上記したアルゴリズム[S01]〜
[S04]を実行し、対訳文ペアの日本語文の集合を文
書集合Dとし、対訳文ペア自立語格納手段15に格納さ
れている日本語の自立語集合を自立語集合Wとして、類
似文検索を行う。そして、日本語類似文検索手段16
が、この検索結果の内で閾値T(予め設定した非負の定
数)を越える拡張相互情報量の合計値を持つ対訳文ペア
識別子の集合をEとし(ステップS7)、この識別子集
合Eの要素数が0であるか否かを判断する(ステップS
8)。
【0058】この結果、識別子集合Eの要素数が0であ
る場合には、適切な類似文が得られないのでステップS
14へ進んで処理を終了する一方、識別子集合Eの要素
数が0でない場合には、言語変換手段17が、識別子集
合E中の各識別子に対応する全ての英単語を対訳ペア自
立語格納手段15から抽出し、論理和演算子ORで結合
して検索式S’とする(ステップS9)。そして、英語
類似文検索手段18が、検索式S’を入力として、対訳
文ペアの英語文を対象として類似文検索を行う(ステッ
プS10)。すなわち、上記したアルゴリズム[S0
1]〜[S04]を実行し、対訳文ペアの英語文の集合
を文書集合Dとし、対訳文ペア自立語格納手段15に格
納されている英語の自立語集合を自立語集合Wとして、
類似文検索を行う。
【0059】そして、英語類似文検索手段18が、この
検索結果の内で閾値T’(予め設定した非負の定数)を
越える拡張相互情報量の合計値を持つ対訳文ペア識別子
の集合をE’とし(ステップS11)、この識別子集合
E’の要素数が0であるか否かを判断する(ステップS
12)。この結果、識別子集合E’の要素数が0である
場合には、適切な類似文が得られないのでステップS1
4へ進んで処理を終了する一方、識別子集合E’の要素
数が0でない場合には、結果出力手段19が、識別子集
合E’に対応する英語文(あるいは対訳文ペア)を、拡
張相互情報量の合計値の大きいものから順に日本語入力
文Qの類似文として表示出力して、処理を終了する(ス
テップS13)。
【0060】なお、上記した実施形態では、英語類似文
検索手段16(第2の検索手段)の検索対象を対訳文ペ
ア中の英語文としているが、第2の検索手段の検索対象
は対訳文ペアである必要はなく、対応する日本語文を持
たない英語文の集合、或いは、対訳文ペア中の英語文集
合と対応する日本語文を持たない英語文の集合との両方
としてもよい。この場合には、対訳文ペア格納手段12
とは別に、英語文のみを複数格納する英語文格納手段を
設け、第2の検索手段の検索対象を、英語文格納手段中
の英語文のみ、或いは対訳文ペア格納手段12中の英語
文および英語文格納手段中の英語文とすればよい。な
お、このようにした場合には、上記したステップS10
で行う類似文検索アルゴリズム[S01]〜[S04]
の処理において、文書集合Dを「英語文格納手段中の英
語文」或いは「対訳文ペア格納手段12中の英語文およ
び英語文格納手段中の英語文」とし、自立語集合Wを
「英語文格納手段中の英語文から抽出した全ての自立
語」或いは「対訳文ペア格納手段12中の英語文および
英語文格納手段中の英語文から抽出した全ての自立語」
とすればよい。
【0061】また、英語類似文検索手段18が、第2の
検索手段として、英語文のみならず英語文と日本語文の
両者を対象として類似文検索を行うようにしてもよい。
この場合には、上記のステップS9の処理において、言
語変換手段17が各識別子に対応する英単語および日本
語単語の両者を抽出して検索式S’を作成し、ステップ
S10の処理において、英語文とそれに対応する(同一
の識別子を持つ)日本語文の両者をまとめて単一の文と
みなし、それら対訳文ペアの集合をアルゴリズム[S0
1]〜[S04]中の文書集合Dとし、検索対象の英語
文および日本語文から抽出した全ての自立語を自立語集
合Wとして処理を行えばよい。
【0062】また、上記の実施形態では、拡張相互情報
量に基づいた類似文検索を行ったが、拡張T−scor
e、拡張Dice−coefficient、更には、
ベクトル空間モデルによる類似文検索を行う場合でも同
様の効果が得られる。また、上記の実施形態では、日本
語類似文検索手段16(第1の検索手段)と英語類似文
検索手段18(第2の検索手段)とが等しいアルゴリズ
ムで類似文検索を行ったが、第1の検索手段は、第1言
語の検索質問文と関連する文を広範に得ることが目的で
あるので、本発明では、例えば、上記のステップS4に
おける検索結果を直接日本語類似文検索手段16の検索
結果として、英語類似文検索手段18が用いるようにし
てもよく、同様の効果が得られる。すなわち、本発明で
は、第1の検索手段による検索処理には、類似文検索と
通常の検索とのいずれを採用してもよい。
【0063】また、上記の実施形態では、日本語類似文
検索手段16の検索結果として得られる対訳文ペア識別
子に与えられる拡張相互情報量(重要度)の合計値(識
別子の拡張相互情報量値)を英語類似文検索手段18で
の類似文検索処理に利用していないが、日本語類似文検
索手段16で得られる拡張相互情報量を英語類似文検索
手段18での類似文検索処理に利用して、日本語入力文
との類似度をより正確に反映した英語対訳文を得ること
もできる。具体的には、この重要度を利用するために
は、上記のステップS10の処理におけるアルゴリズム
[S01]〜[S04]で式(6)の計算を行う際に、
式(7)中のa’、b’、c’を文書数とする代わり
に、日本語類似文検索手段16で得られた各文識別子の
拡張相互情報量値の合計値とすればよい。
【0064】また、上記の実施形態では、日本語の入力
文から英語類似対訳文を得るものであるが、本発明で
は、構文解析処理により、日本語入力文を意味的に独立
な複数の節や単語に分割し、それぞれの節や単語から英
語類似対訳文を求めて、日本語入力文の意味内容をより
正確に反映した検索を行うこともできる。この場合に
は、各節や各単語に対して上記のステップS1〜S14
の処理を行い、それぞれの処理において英語類似文検索
手段18から得られる各識別子の拡張相互情報量値の合
計を最終的値として、その値の大きいものから順に検索
結果として出力するようにすればよい。
【0065】図6には、日英の対訳文36万ペアを用い
て、上記した実施形態の対訳文検索装置により「雲が立
ち込めてきた。」という日本語入力文の英語対訳文を検
索した結果を示してある。なお、同図には、得られた検
索結果の上位20文から「雲が立ち込めてきた。」の英
訳を行う際の参照英語文として適切であると判断できた
ものを抜き出して示してある。この例に示すように、対
訳として適切な英語文を7文得ることができた。なお、
各文に付加した数字は、それぞれの文が検索結果の上位
何番目に位置していたかを示すものである。例えば、
「Clouds blanketed the sky.」という文は、36万文
の検索対象の中から9番目に類似度の高い文であるとし
て検索されたことを示している。
【0066】「雲が立ち込めてきた。」を形態素解析す
ることにより、自立語「雲」と「立ち込める」を得るこ
とができるが、本例のように「雲」と「立ち込める」を
同時に含む日本語文が36万文の中に存在しない場合に
は、(従来技術1)によっては適切な検索結果を得るこ
とはできない。実際、図6に示す日本語文には「立ち込
める」という表現は存在しておらず、これらの適切な対
訳文を(従来技術1)によって得ることはできない。ま
た、「雲」に対応する英単語は「cloud」であり、「立
ち込める」に対応する英単語/英熟語は「hang over, e
nvelop, shroud, screen」であるが、本例のように「cl
oud」と「hang over, envelop, shroud, screen」のい
ずれかを同時に含む英語文が36万文の中に存在しない
場合には、(従来技術2)によっては適切な検索結果を
得ることはできない。実際、図6に示す英語文には「ha
ng over, envelop, shroud, screen」のいずれの表現も
存在しておらず、これらの適切な対訳文を(従来技術
2)によって得ることはできない。
【0067】図7には、同様に、「本名を伏せておくこ
とにした。」という日本語入力文の英語対訳文検索を行
った結果を示してある。この例に示すように、対訳とし
て適切な英語文を5文得ることができた。本例のように
「本名を伏せておくことにした。」から得られる自立語
「本名」および「伏せる」を共通に含む日本語文が検索
対象の文集合中に存在しない場合には、「本名」および
「伏せる」に対応する英単語/英熟語である「real nam
e,autony」のいずれかと「hide, conceal, keep secre
t」のいずれかを共通に含む英語文も存在しない。した
がって、(従来技術1)および(従来技術2)によって
適切な英語文を検索することはできない。
【0068】図8には、上記と同様の条件で、本発明に
よる対訳文検索と(従来技術1)による対訳文検索を実
行した結果を示してある。同図の左欄に示す20文の日
本語入力文でそれぞれ検索を行い、それぞれ上位20位
中に適切な検索結果が何文含まれているかを示してあ
り、本発明の対訳文検索によれば、(従来技術1)の対
訳文検索と比較して、適切な対訳文を3倍以上多く検索
できた。以上の実験結果からも明らかなように、本発明
によれば、従来の技術では検索結果として得ることがで
きなかった適切な類似対訳文をユーザに提示することが
できる。
【0069】
【発明の効果】以上説明したように、本発明によると、
第1言語文とそれに対応する第2言語文との対訳ペアを
用いて、第1言語文に対する第1の検索と第2言語文に
対する第2の検索とを組み合わせて実行するようにした
ため、(1)比較的短い第1言語の検索質問文からで
も、広範な対訳文ペア情報から検索漏れの少ない対訳文
検索を行うことができ、(2)第1言語の検索質問文の
表現の差異に依存することなしに、適切な対訳文検索を
行うことができ、(3)予め作成された辞書を必要とせ
ず、広範な対訳文ペア情報から第1言語単語と第2言語
単語の対応関係を動的に取得することができるため、第
1言語の検索質問文の文意に応じた対訳文検索を行うこ
とができるといった効果を得ることができる。
【図面の簡単な説明】
【図1】 本発明に係る典型的な対訳文検索装置の構成
を示す図である。
【図2】 本発明の一実施形態に係る対訳文検索装置の
構成を示す図である。
【図3】 対訳文ペアの一例を示す図である。
【図4】 対訳文ペアを形態素解析した結果の一例を示
す図である。
【図5】 本発明の一実施形態に係る検索処理手順を示
すフォローチャートである。
【図6】 本発明の実施例に係る対訳文検索の結果を示
す図である。
【図7】 本発明の実施例に係る対訳文検索の結果を示
す図である。
【図8】 本発明の実施例と従来技術とによる対訳文検
索の結果を示す図である。
【符号の説明】 11・・・日本語文入力手段、 12・・・対訳文ペア
格納手段、13・・・形態素解析手段、 14・・・検
索式作成手段、15・・・対訳文ペア自立語格納手段、
16・・・日本語類似文検索手段、17・・・言語変
換手段、 18・・・英語類似文検索手段、19・・・
検索結果出力手段、
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成11年9月22日(1999.9.2
2)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
───────────────────────────────────────────────────── フロントページの続き (72)発明者 舘野 昌一 神奈川県足柄上郡中井町境430 グリーン テクなかい 富士ゼロックス株式会社内 Fターム(参考) 5B075 ND03 NK02 NK32 PP25 PR08 QM08 5B091 AA03 CA02 DA04

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 第1言語で書かれた検索質問文に基づい
    て第2言語で書かれた訳文を検索する対訳文検索装置に
    おいて、 第1言語で書かれた文とそれに対応する第2言語で書か
    れた訳文とのペアを複数格納する対訳文ペア格納手段
    と、 第1言語で書かれた検索質問文を受け付ける検索文入力
    手段と、 受け付けた検索質問文に基づいて対訳文ペア格納手段に
    格納されている第1言語で書かれた文の集合を対象とし
    て検索処理する第1の検索手段と、 第1の検索手段により検索された第1言語で書かれた文
    に対応して対訳文ペア格納手段に格納されている第2言
    語で書かれた訳文に類似する文を、当該対訳文ペア格納
    手段に格納されている第2言語で書かれた訳文の集合を
    対象として検索する第2の検索手段と、 を有することを特徴とする対訳文検索装置。
  2. 【請求項2】 第1言語で書かれた検索質問文に基づい
    て第2言語で書かれた文を検索する対訳文検索装置にお
    いて、 第1言語で書かれた文とそれに対応する第2言語で書か
    れた訳文とのペアを複数格納する対訳文ペア格納手段
    と、 第2言語で書かれた文を複数格納する文格納手段と、 第1言語で書かれた検索質問文を受け付ける検索文入力
    手段と、 受け付けた検索質問文に基づいて対訳文ペア格納手段に
    格納されている第1言語で書かれた文の集合を対象とし
    て検索処理する第1の検索手段と、 第1の検索手段により検索された第1言語で書かれた文
    に対応して対訳文ペア格納手段に格納されている第2言
    語で書かれた訳文に類似する文を、当該対訳文ペア格納
    手段に格納されている第2言語で書かれた訳文集合及び
    文格納手段に格納されている第2言語で書かれた文集合
    を対象として検索する第2の検索手段と、 を有することを特徴とする対訳文検索装置。
  3. 【請求項3】 第1言語で書かれた検索質問文に基づい
    て第2言語で書かれた文を検索する対訳文検索装置にお
    いて、 第1言語で書かれた文とそれに対応する第2言語で書か
    れた訳文とのペアを複数格納する対訳文ペア格納手段
    と、 第2言語で書かれた文を複数格納する文格納手段と、 第1言語で書かれた検索質問文を受け付ける検索文入力
    手段と、 受け付けた検索質問文に基づいて対訳文ペア格納手段に
    格納されている第1言語で書かれた文の集合を対象とし
    て検索処理する第1の検索手段と、 第1の検索手段により検索された第1言語で書かれた文
    に対応して対訳文ペア格納手段に格納されている第2言
    語で書かれた訳文に類似する文を、文格納手段に格納さ
    れている第2言語で書かれた文集合を対象として検索す
    る第2の検索手段と、 を有することを特徴とする対訳文検索装置。
  4. 【請求項4】 請求項1乃至請求項3のいずれか1項に
    記載の対訳文検索装置において、 第2の検索手段は、第1の検索手段により検索された第
    1言語で書かれた文に対応する第2言語で書かれた訳文
    から所定の基準に基づいた重要語を抽出し、当該重要語
    を用いて第2言語で書かれた類似文を検索することを特
    徴とする対訳文検索装置。
  5. 【請求項5】 請求項1乃至請求項3のいずれか1項に
    記載の対訳文検索装置において、 第2の検索手段は、第1の検索手段により検索された第
    1言語で書かれた文に対応する第2言語で書かれた訳文
    から重要語を抽出するとともに重要語に重要度を付与
    し、当該重要語及び重要度を用いて第2言語で書かれた
    類似文を検索し、 更に、対訳文ペア格納手段に格納されている第2言語で
    書かれた文の集合Aと、第1の検索手段で検索された第
    1言語で書かれた文に対応する第2言語で書かれた文の
    集合Bと、集合B中に出現する全単語の集合Cに関し
    て、 集合Bに含まれる文の数である第1の値と、集合B中に
    出現する単語を重要語候補として各重要語候補を含む集
    合B中の文の数である第2の値と、各重要語候補を含む
    集合A中の文の数である第3の値を求め、これら3種の
    値を変数として各重要語候補の重要度を算出し、これら
    重要度に基づいて重要語候補中から重要語が決定される
    ことを特徴とする対訳文検索装置。
  6. 【請求項6】 請求項2又は請求項3に記載の対訳文検
    索装置において、 第2の検索手段は、第1の検索手段により検索された第
    1言語で書かれた文に対応する第2言語で書かれた訳文
    から重要語を抽出するとともに重要語に重要度を付与
    し、当該重要語及び重要度を用いて第2言語で書かれた
    類似文を検索し、 更に、対訳文ペア格納手段に格納されている第2言語で
    書かれた文の集合と文格納手段に格納されている第2言
    語で書かれた文の集合の和である集合Aと、第1の検索
    手段で検索された第1言語で書かれた文に対応する第2
    言語で書かれた文の集合Bと、集合B中に出現する全単
    語の集合Cに関して、 集合Bに含まれる文の数である第1の値と、集合B中に
    出現する単語を重要語候補として各重要語候補を含む集
    合B中の文の数である第2の値と、各重要語候補を含む
    集合A中の文の数である第3の値を求め、これら3種の
    値を変数として各重要語候補の重要度を算出し、これら
    重要度に基づいて重要語候補中から重要語が決定される
    ことを特徴とする対訳文検索装置。
  7. 【請求項7】 請求項5又は請求項6に記載の対訳文検
    索装置において、 第2の検索手段は、集合A中に含まれる文書の数をMと
    し、第1の値をα、重要語候補ごとの第2の値をβ、重
    要語候補ごとの第3の値をγとした場合に、 拡張相互情報量=log{(Mβ)/(αγ)} 拡張T−score=M{(Mβ−αγ)/(αγ)} 拡張Dice−coefficient=2β/(α+
    γ) のいずれかの値を各重要語候補の重要度とすることを特
    徴とする対訳文検索装置。
  8. 【請求項8】 請求項1乃至請求項4のいずれか1項に
    記載の対訳文検索装置において、 第2の検索手段は、第1の検索手段により検索された第
    1言語で書かれた文に対応する第2言語で書かれた文に
    基づいて、第2言語で書かれた訳文に類似する文を検索
    する際に、ベクトル空間モデルを用いることを特徴とす
    る対訳文検索装置。
  9. 【請求項9】 請求項1乃至請求項8のいずれか1項に
    記載の対訳文検索装置において、 第1の検索手段は、受け付けた検索質問文に類似する文
    を検索するとともに当該類似する文に重要度を付与し、 第2の検索手段は、第1の検索手段により検索された第
    1言語で書かれた文に対応する第2言語で書かれた文及
    び第1の検索手段によって付与された重要度に基づい
    て、第2言語で書かれた訳文に類似する文を検索するこ
    とを特徴とする対訳文検索装置。
  10. 【請求項10】 請求項1乃至請求項9のいずれか1項
    に記載の対訳文検索装置において、 検索文入力手段は、第1言語で書かれた検索質問文を受
    け付けるとともに、当該検索質問文を複数の単語或いは
    節に分割し、 第1の検索手段は、分割された各単語或いは各節を用い
    て、受け付けた検索質問文に類似する第1言語で書かれ
    た文を検索し、 第2の検索手段は、第1の検索手段により検索された第
    1言語で書かれた文に対応して対訳文ペア格納手段に格
    納されている第2言語で書かれた訳文に類似する文を検
    索し、 更に、各単語或いは各節ごとに第2の検索手段により検
    索された第2言語で書かれた複数の文の中から、検索結
    果を所定の重要度を基準として選択する検索結果統合手
    段を有することを特徴とする対訳文検索装置。
  11. 【請求項11】 請求項1、請求項2、請求項4、請求
    項5、請求項8、請求項9、請求項10のいずれか1項
    に記載の対訳文検索装置において、 第2の検索手段は、第1の検索手段により検索された第
    1言語で書かれた文に対応する第2言語で書かれた訳文
    と共に、当該第1言語で書かれた文も対訳文ペア格納手
    段から取得し、当該第1言語で書かれた文と第2言語で
    書かれた訳文とからなる対訳文ペアに類似する対訳文ペ
    アを対訳文ペア格納手段に格納されている対訳文ペアの
    集合から検索することを特徴とする対訳文検索装置。
  12. 【請求項12】 第1言語で書かれた検索質問文に基づ
    いて第2言語で書かれた訳文をコンピュータに検索させ
    るための対訳文検索プログラムを記憶した記憶媒体にお
    いて、 第1言語で書かれた検索質問文を受け付ける検索文入力
    機能と、 メモリに記憶されている第1言語で書かれた文とそれに
    対応する第2言語で書かれた訳文とのペアデータを用い
    て、受け付けた検索質問文に基づいて第1言語で書かれ
    た文の集合を対象として検索処理する第1の検索機能
    と、 第1の検索機能により検索された第1言語で書かれた文
    に対応するペアデータ中の第2言語で書かれた訳文に類
    似する文を、当該ペアデータ中の第2言語で書かれた訳
    文集合を対象として検索する第2の検索機能と、 をコンピュータに実現させるための対訳文検索プログラ
    ムをコンピュータにより読み出し可能に記憶したことを
    特徴とする記憶媒体。
  13. 【請求項13】 第1言語で書かれた検索質問文に基づ
    いて第2言語で書かれた訳文をコンピュータに検索させ
    るための対訳文検索プログラムを記憶した記憶媒体にお
    いて、 第1言語で書かれた検索質問文を受け付ける検索文入力
    機能と、 メモリに記憶されている第1言語で書かれた文とそれに
    対応する第2言語で書かれた訳文とのペアデータを用い
    て、受け付けた検索質問文に基づいて第1言語で書かれ
    た文の集合を対象として検索処理する第1の検索機能
    と、 第1の検索機能により検索された第1言語で書かれた文
    に対応するペアデータ中の第2言語で書かれた訳文に類
    似する文を、当該ペアデータ中の第2言語で書かれた訳
    文集合及び当該ペアデータとは別個にメモリに格納され
    ている第2言語で書かれた文の集合を対象として検索す
    る第2の検索機能と、 をコンピュータに実現させるための対訳文検索プログラ
    ムをコンピュータにより読み出し可能に記憶したことを
    特徴とする記憶媒体。
  14. 【請求項14】 第1言語で書かれた検索質問文に基づ
    いて第2言語で書かれた訳文をコンピュータに検索させ
    るための対訳文検索プログラムを記憶した記憶媒体にお
    いて、 第1言語で書かれた検索質問文を受け付ける検索文入力
    機能と、 メモリに記憶されている第1言語で書かれた文とそれに
    対応する第2言語で書かれた訳文とのペアデータを用い
    て、受け付けた検索質問文に基づいて第1言語で書かれ
    た文の集合を対象として検索処理する第1の検索機能
    と、 第1の検索機能により検索された第1言語で書かれた文
    に対応するペアデータ中の第2言語で書かれた訳文に類
    似する文を、当該ペアデータとは別個にメモリに格納さ
    れている第2言語で書かれた文の集合を対象として検索
    する第2の検索機能と、 をコンピュータに実現させるための対訳文検索プログラ
    ムをコンピュータにより読み出し可能に記憶したことを
    特徴とする記憶媒体。
  15. 【請求項15】 請求項12乃至請求項14のいずれか
    1項に記載の対訳文検索プログラムを記憶した記憶媒体
    において、 記憶媒体にはペアデータが読み出し自在に記憶されてお
    り、 対訳文検索プログラムは、当該ペアデータを記憶媒体か
    ら読み出してコンピュータに備えられているメモリに格
    納する機能を含んでいることを特徴とする対訳文検索プ
    ログラムを記憶した記憶媒体。
  16. 【請求項16】 第1言語で書かれた検索質問文に基づ
    いて第2言語で書かれた訳文を検索する対訳文検索方法
    において、 第1言語で書かれた検索質問文を受け付け、 第1言語で書かれた文とそれに対応する第2言語で書か
    れた訳文とのペアデータを用いて、受け付けた検索質問
    文に基づいて第1言語で書かれた文の集合を対象として
    第1の検索し、 第1の検索により検索された第1言語で書かれた文に対
    応するペアデータ中の第2言語で書かれた訳文に類似す
    る文を、当該ペアデータ中の第2言語で書かれた訳文集
    合を対象として第2の検索することを特徴とする対訳文
    検索方法。
  17. 【請求項17】 第1言語で書かれた検索質問文に基づ
    いて第2言語で書かれた訳文を検索する対訳文検索方法
    において、 第1言語で書かれた検索質問文を受け付け、 第1言語で書かれた文とそれに対応する第2言語で書か
    れた訳文とのペアデータを用いて、受け付けた検索質問
    文に基づいて第1言語で書かれた文の集合を対象として
    第1の検索し、 第1の検索により検索された第1言語で書かれた文に対
    応するペアデータ中の第2言語で書かれた訳文に類似す
    る文を、当該ペアデータ中の第2言語で書かれた訳文集
    合及び当該ペアデータとは別個に用意されている第2言
    語で書かれた文の集合を対象として第2の検索すること
    を特徴とする対訳文検索方法。
  18. 【請求項18】 第1言語で書かれた検索質問文に基づ
    いて第2言語で書かれた訳文を検索する対訳文検索方法
    において、 第1言語で書かれた検索質問文を受け付け、 第1言語で書かれた文とそれに対応する第2言語で書か
    れた訳文とのペアデータを用いて、受け付けた検索質問
    文に基づいて第1言語で書かれた文の集合を対象として
    第1の検索し、 第1の検索により検索された第1言語で書かれた文に対
    応するペアデータ中の第2言語で書かれた訳文に類似す
    る文を、当該ペアデータとは別個に用意されている第2
    言語で書かれた文の集合を対象として第2の検索するこ
    とを特徴とする対訳文検索方法。
JP10202788A 1998-07-02 1998-07-02 対訳文検索装置 Expired - Fee Related JP3114703B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP10202788A JP3114703B2 (ja) 1998-07-02 1998-07-02 対訳文検索装置
US09/343,543 US6321189B1 (en) 1998-07-02 1999-06-30 Cross-lingual retrieval system and method that utilizes stored pair data in a vector space model to process queries

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10202788A JP3114703B2 (ja) 1998-07-02 1998-07-02 対訳文検索装置

Publications (2)

Publication Number Publication Date
JP2000020524A true JP2000020524A (ja) 2000-01-21
JP3114703B2 JP3114703B2 (ja) 2000-12-04

Family

ID=16463212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10202788A Expired - Fee Related JP3114703B2 (ja) 1998-07-02 1998-07-02 対訳文検索装置

Country Status (2)

Country Link
US (1) US6321189B1 (ja)
JP (1) JP3114703B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005059771A1 (ja) * 2003-12-15 2005-06-30 Laboratory For Language Technology Incorporated 対訳判断装置、方法及びプログラム
US11055496B2 (en) 2018-08-31 2021-07-06 Samsung Electronics Co., Ltd. Method and apparatus with sentence mapping

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6498921B1 (en) * 1999-09-01 2002-12-24 Chi Fai Ho Method and system to answer a natural-language question
US5836771A (en) * 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
CN1174332C (zh) * 2000-03-10 2004-11-03 松下电器产业株式会社 转换表达方式的方法和装置
JP4066600B2 (ja) * 2000-12-20 2008-03-26 富士ゼロックス株式会社 多言語文書検索システム
US20030083860A1 (en) * 2001-03-16 2003-05-01 Eli Abir Content conversion method and apparatus
US7483828B2 (en) 2001-03-16 2009-01-27 Meaningful Machines, L.L.C. Multilingual database creation system and method
US8874431B2 (en) * 2001-03-16 2014-10-28 Meaningful Machines Llc Knowledge system method and apparatus
US7711547B2 (en) * 2001-03-16 2010-05-04 Meaningful Machines, L.L.C. Word association method and apparatus
US20030093261A1 (en) * 2001-03-16 2003-05-15 Eli Abir Multilingual database creation system and method
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
US7146358B1 (en) * 2001-08-28 2006-12-05 Google Inc. Systems and methods for using anchor text as parallel corpora for cross-language information retrieval
US20030154069A1 (en) * 2002-02-14 2003-08-14 International Business Machines Corporation Computerized system and method for converting selected text between languages
US7361881B2 (en) * 2002-03-13 2008-04-22 Oy Ajat Ltd Ganged detector pixel, photon/pulse counting radiation imaging device
US7293015B2 (en) * 2002-09-19 2007-11-06 Microsoft Corporation Method and system for detecting user intentions in retrieval of hint sentences
US7171351B2 (en) * 2002-09-19 2007-01-30 Microsoft Corporation Method and system for retrieving hint sentences using expanded queries
US7194455B2 (en) * 2002-09-19 2007-03-20 Microsoft Corporation Method and system for retrieving confirming sentences
WO2004059461A2 (en) * 2002-12-26 2004-07-15 Casio Computer Co., Ltd. Electronic dictionary with example sentences
US8135575B1 (en) 2003-08-21 2012-03-13 Google Inc. Cross-lingual indexing and information retrieval
US20050091039A1 (en) * 2003-10-25 2005-04-28 Simab Bilal S. Enhanced foreign language dictionaries
US8024337B1 (en) * 2004-09-29 2011-09-20 Google Inc. Systems and methods for determining query similarity by query distribution comparison
WO2007133625A2 (en) * 2006-05-12 2007-11-22 Eij Group Llc Multi-lingual information retrieval
US8185375B1 (en) * 2007-03-26 2012-05-22 Google Inc. Word alignment with bridge languages
US8799307B2 (en) 2007-05-16 2014-08-05 Google Inc. Cross-language information retrieval
US8051061B2 (en) * 2007-07-20 2011-11-01 Microsoft Corporation Cross-lingual query suggestion
US7890493B2 (en) * 2007-07-20 2011-02-15 Google Inc. Translating a search query into multiple languages
EP2201484A4 (en) * 2007-09-21 2010-09-22 Google Inc INTERLANGUE RESEARCH
US20090083026A1 (en) * 2007-09-24 2009-03-26 Microsoft Corporation Summarizing document with marked points
US7917488B2 (en) * 2008-03-03 2011-03-29 Microsoft Corporation Cross-lingual search re-ranking
US8457441B2 (en) * 2008-06-25 2013-06-04 Microsoft Corporation Fast approximate spatial representations for informal retrieval
US8364462B2 (en) * 2008-06-25 2013-01-29 Microsoft Corporation Cross lingual location search
US8352244B2 (en) 2009-07-21 2013-01-08 International Business Machines Corporation Active learning systems and methods for rapid porting of machine translation systems to new language pairs or new domains
US8639701B1 (en) 2010-11-23 2014-01-28 Google Inc. Language selection for information retrieval
US9465797B2 (en) 2012-02-23 2016-10-11 Google Inc. Translating text using a bridge language
JP2015060458A (ja) * 2013-09-19 2015-03-30 株式会社東芝 機械翻訳装置、方法、及びプログラム
JP6466138B2 (ja) * 2014-11-04 2019-02-06 株式会社東芝 外国語文作成支援装置、方法及びプログラム
US20170177712A1 (en) * 2015-12-21 2017-06-22 Ebay Inc. Single step cross-linguistic search using semantic meaning vectors
WO2017139575A1 (en) 2016-02-11 2017-08-17 Ebay Inc. Semantic category classification
JP6631930B2 (ja) * 2017-02-07 2020-01-15 パナソニックIpマネジメント株式会社 翻訳装置および翻訳方法
US10672392B2 (en) 2018-07-23 2020-06-02 Motorola Solutions, Inc. Device, system and method for causing an output device to provide information for voice command functionality
US11070435B2 (en) 2019-01-16 2021-07-20 Servicenow, Inc. Service model re-computation based on configuration item change type
CN112085090A (zh) * 2020-09-07 2020-12-15 百度在线网络技术(北京)有限公司 翻译方法、装置以及电子设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5278980A (en) * 1991-08-16 1994-01-11 Xerox Corporation Iterative technique for phrase query formation and an information retrieval system employing same
WO1994006086A1 (en) * 1992-09-04 1994-03-17 Caterpillar Inc. Integrated authoring and translation system
JPH0950435A (ja) 1995-08-04 1997-02-18 Sharp Corp 翻訳装置
US5963940A (en) * 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
US6006221A (en) * 1995-08-16 1999-12-21 Syracuse University Multilingual document retrieval system and method using semantic vector matching
JP3099756B2 (ja) * 1996-10-31 2000-10-16 富士ゼロックス株式会社 文書処理装置、単語抽出装置及び単語抽出方法
US5835912A (en) * 1997-03-13 1998-11-10 The United States Of America As Represented By The National Security Agency Method of efficiency and flexibility storing, retrieving, and modifying data in any language representation
JP3173411B2 (ja) * 1997-03-17 2001-06-04 富士ゼロックス株式会社 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体
KR980004126A (ko) * 1997-12-16 1998-03-30 양승택 다국어 웹 문서 검색을 위한 질의어 변환 장치 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005059771A1 (ja) * 2003-12-15 2005-06-30 Laboratory For Language Technology Incorporated 対訳判断装置、方法及びプログラム
US11055496B2 (en) 2018-08-31 2021-07-06 Samsung Electronics Co., Ltd. Method and apparatus with sentence mapping

Also Published As

Publication number Publication date
JP3114703B2 (ja) 2000-12-04
US6321189B1 (en) 2001-11-20

Similar Documents

Publication Publication Date Title
JP3114703B2 (ja) 対訳文検索装置
US6442540B2 (en) Information retrieval apparatus and information retrieval method
US6167370A (en) Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
JP3173411B2 (ja) 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体
JP2011118689A (ja) 検索方法及びシステム
JP3427674B2 (ja) 関連語提示装置及び関連語提示用プログラムを記録した媒体
EP2450805A1 (en) Information search device, information search method, information search program, and storage medium on which information search program has been stored
JP2004318510A (ja) 対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法
JP3594701B2 (ja) キーセンテンス抽出装置
JPH09282331A (ja) 文書類似判定装置および文書類似判定方法
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
JP2000040085A (ja) 日本語形態素解析処理の後処理方法および装置
JPH11328316A (ja) 文字認識装置、方法及び記憶媒体
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
JP2004280316A (ja) 分野判定装置及び言語処理装置
JP3436109B2 (ja) 関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2715875B2 (ja) 多言語要約生成装置
JP3447955B2 (ja) 機械翻訳システム及び機械翻訳方法
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4114580B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3884001B2 (ja) 言語解析システムおよび方法
JPS6389976A (ja) 言語解析装置
JPS6395570A (ja) 言語解析方式
JPH03161865A (ja) 文章の検索方法
JPH08180057A (ja) 文書検索方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070929

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080929

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090929

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100929

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110929

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees