JP2002117028A - Device and method for dictionary generation and recording medium with recorded dictionary generating program - Google Patents

Device and method for dictionary generation and recording medium with recorded dictionary generating program

Info

Publication number
JP2002117028A
JP2002117028A JP2000306865A JP2000306865A JP2002117028A JP 2002117028 A JP2002117028 A JP 2002117028A JP 2000306865 A JP2000306865 A JP 2000306865A JP 2000306865 A JP2000306865 A JP 2000306865A JP 2002117028 A JP2002117028 A JP 2002117028A
Authority
JP
Japan
Prior art keywords
natural language
entry
dictionary
storage unit
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000306865A
Other languages
Japanese (ja)
Other versions
JP3419748B2 (en
Inventor
Sanae Fujita
早苗 藤田
Yasuhiro Akiba
泰弘 秋葉
Hiromi Nakaiwa
浩巳 中岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000306865A priority Critical patent/JP3419748B2/en
Publication of JP2002117028A publication Critical patent/JP2002117028A/en
Application granted granted Critical
Publication of JP3419748B2 publication Critical patent/JP3419748B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a device and a method for dictionary generation which can accurately generate a dictionary of good quality between natural languages even without a translation corpus with sufficient capacity. SOLUTION: A 1st natural language-to-2nd natural language dictionary entry is taken out of a 1st natural language-to-2nd natural language dictionary storage part. A 3rd natural language dictionary entry corresponding to the 2nd natural language entry of the 1st natural language-to-2nd natural language dictionary entry is obtained from a 2nd natural language-to-3rd natural language dictionary storage part. The 2nd natural language entry of the 1st natural language-to-2nd natural language dictionary entry is replaced with this 3rd natural language entry in order to generate and store a translation dictionary of the 1st natural language to the 3rd natural language which has indexes and parts of speech of the 1st natural language and also indexes and parts of speech of the 3rd natural language as translations of 1st natural language entries in a 1st natural language-to-3rd natural language dictionary storage part.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、例えば自然言語処
理システム、情報検索システム、機械翻訳システムなど
で利用され、異なる自然言語対の対訳辞書を作成する辞
書作成装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a dictionary creation device used in, for example, a natural language processing system, an information retrieval system, a machine translation system, etc., for creating a bilingual dictionary of different natural language pairs.

【0002】[0002]

【従来の技術】近年、インターネットの発達などで、様
々な自然言語で書かれた文書に接する機会が増加してお
り、利用者が必ずしも堪能でない自然言語に触れる機会
も増加している。これに伴い、利用者が必ずしも堪能で
ない自然言語で書かれた文書や情報を利用するため、特
に電子化データに対する多言語検索や多言語情報処理、
多言語翻訳などの需要が増加し、それらに用いるための
様々な言語対の辞書が必要とされるようになってきた。
そこで、品質のよい様々な言語対の対訳辞書の作成が求
められている。
2. Description of the Related Art In recent years, with the development of the Internet and the like, opportunities to come in contact with documents written in various natural languages have been increasing, and opportunities for users to come into contact with natural languages which are not always fluent have also increased. Along with this, in order to use documents and information written in natural languages that users are not necessarily proficient in, multilingual search and multilingual information processing, especially for digitized data,
The demand for multilingual translations and the like has increased, and dictionaries of various language pairs have been required to be used for them.
Therefore, it is required to create bilingual dictionaries of various language pairs with good quality.

【0003】品質のよい辞書を得るには人手での作成が
一般的だが(白井ら、「日英機械翻訳に必要な結合化パ
ターン対の数とその収集方法」、情報処理学会研究報
告、自然言語処理研究会、95-NL-110-7,pp.43-50)、作
業量が膨大となるため、辞書を人手で作成するにはコス
トと人手と時間が非常にかかる。特に近年、様々な言語
対への拡張が必要とされてきているため、なるべく人手
を介さず自動的あるいは半自動的に品質のよい辞書を作
成することが望まれる。
In order to obtain a high-quality dictionary, it is common to create it manually (Shirai et al., "The number of combined pattern pairs necessary for Japanese-to-English machine translation and its collection method", Information Processing Society of Japan research report, Nature Language Processing Research Group, 95-NL-110-7, pp.43-50) Due to the enormous amount of work, creating a dictionary manually requires a great deal of cost, manpower, and time. In particular, in recent years, expansion to various language pairs has been required, and it is desired to create a high-quality dictionary automatically or semi-automatically without using any manual operation.

【0004】自然言語対の辞書の自動的な作成方法とし
ては、作成する自然言語対の対訳コーパスを利用する方
法がある。対訳コーパスとは、異なる言語で書かれた同
一文書を電子化したものである。対訳コーパスを利用す
る方法には、文対応をつけた自然言語対の対訳コーパス
を形態素解析して、対訳文中に出現する言語対の全単語
ペアに対して全対訳コーパス中での出現頻度を求め、出
現頻度の高い単語ペアは類似度が高いとして単語類似度
を計算し、更に対訳コーパスを構文解析して構文構造の
比較を行い、単語類似度と構文構造の比較から翻訳パタ
ーンを抽出する等の研究がある(北村ら、「二言語対訳
コーパスからの翻訳知識の自動獲得」、人工知能学会第
8回全国大会論文集、pp.645-648,1994)。
As a method for automatically creating a dictionary of natural language pairs, there is a method of using a bilingual corpus of natural language pairs to be created. A bilingual corpus is an electronic version of the same document written in different languages. To use the bilingual corpus, morphological analysis is performed on the bilingual corpus of the natural language pair with sentence correspondence, and the frequency of occurrence in the bilingual corpus for all word pairs of the language pair appearing in the bilingual sentence is calculated. , Word pairs with high frequency of appearance have high similarity, calculate word similarity, then parse the bilingual corpus to compare syntactic structures, and extract translation patterns from word similarity and syntactic structure comparisons, etc. (Kitamura et al., "Automatic acquisition of translation knowledge from bilingual bilingual corpora", Proc. Of the 8th Annual Conference of the Japanese Society for Artificial Intelligence, pp.645-648, 1994).

【0005】しかし、近年大量のコーパスが計算機上で
利用可能になってきているとはいえ、対訳コーパスは種
類や量が少なく、様々な言語対の対訳コーパスを実用に
耐え得る大規模な辞書の作成に十分なだけ獲得するのは
困難である(K.W.Church andR.L.Mercer,"Introduction
to the special issue on computational linguistics
using large corpora",Computational Linguistics Vo
l.19,PP1-24,1993)。特に文対応をつけられた対訳コー
パスはさらに少なく、文対応をつけられていない対訳コ
ーパスは、必ずしも文レベルで一対一対応でなかった
り、意訳してあるなど、的確な訳語が出現しないことも
多い。
[0005] However, although a large number of corpora have recently become available on computers, the type and amount of the bilingual corpus are small, and a large-scale dictionary capable of practically using a bilingual corpus of various language pairs can be used. It is difficult to get enough to make (KWChurch and R.L.Mercer, "Introduction
to the special issue on computational linguistics
using large corpora ", Computational Linguistics Vo
l.19, PP1-24, 1993). In particular, the number of bilingual corpora with sentence correspondence is even smaller, and bilingual corpuses without sentence correspondence often do not always have accurate translations, such as not being one-to-one correspondence at the sentence level or being translated. .

【0006】[0006]

【発明が解決しようとする課題】上述した従来技術のう
ち、人手作業による方法では、必要とされる辞書の言語
対の多様化とニーズの増大に比して、コストと人手と時
間がかかりすぎるという問題がある。
Of the above-mentioned prior arts, the manual method requires too much cost, manpower and time compared to the diversification of the required language pairs of the dictionary and the increase in the needs. There is a problem.

【0007】また、対訳コーパスを利用した方法では、
対訳コーパスは種類や量が少なく、多様な言語対に対し
て、実用に耐え得る大規模な辞書を作成するのに十分な
量の対訳コーパスを得ることが困難であるという問題が
ある。
In the method using a bilingual corpus,
The bilingual corpus is small in type and quantity, and it has a problem that it is difficult to obtain a bilingual corpus sufficient for creating a large-scale dictionary that can withstand practical use for various language pairs.

【0008】本発明は、上記に鑑みてなされたもので、
その目的とするところは、十分な量の対訳コーパスがな
くても、品質のよい自然言語間の辞書を的確に作成し得
る辞書作成装置および方法と辞書作成プログラムを記録
した記録媒体を提供することにある。
[0008] The present invention has been made in view of the above,
It is an object of the present invention to provide a dictionary creating apparatus and method capable of accurately creating a dictionary between high-quality natural languages without a sufficient amount of a bilingual corpus, and a recording medium recording a dictionary creating program. It is in.

【0009】[0009]

【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の本発明は、自然言語対の対訳辞書を
作成する辞書作成装置であって、第1自然言語の見出し
およびその品詞と、該第1自然言語エントリの対訳であ
る第2自然言語の対訳表現およびその品詞とを有する第
1自然言語対第2自然言語の辞書を格納する第1自然言
語対第2自然言語辞書格納部と、第2自然言語の見出し
およびその品詞と、該第2自然言語エントリの対訳であ
る第3自然言語の対訳表現およびその品詞とを有する第
2自然言語対第3自然言語辞書を格納する第2自然言語
対第3自然言語辞書格納部と、前記第1自然言語対第2
自然言語辞書格納部から第1自然言語対第2自然言語辞
書エントリを取り出す辞書エントリ読み込み部と、この
取り出した第1自然言語対第2自然言語辞書エントリの
第2自然言語エントリに対応する第3自然言語エントリ
を前記第2自然言語対第3自然言語辞書格納部から獲得
し、前記第1自然言語対第2自然言語辞書エントリの第
2自然言語エントリを前記第3自然言語エントリで置き
換える辞書作成管理部と、この第1自然言語エントリ対
第2自然言語辞書エントリの第2自然言語エントリを第
3自然言語エントリで置き換えることにより生成される
第1自然言語対第3自然言語辞書エントリに基づき第1
自然言語の見出しおよびその品詞と、該第1自然言語エ
ントリの対訳である第3自然言語の対訳およびその品詞
とを有する第1自然言語対第3自然言語の対訳辞書を作
成して格納する第1自然言語対第3自然言語辞書格納部
とを有することを要旨とする。
According to one aspect of the present invention, there is provided a dictionary creating apparatus for creating a bilingual dictionary of a natural language pair, comprising: a first natural language heading and its part of speech. And a first natural language versus a second natural language dictionary storing a first natural language versus a second natural language dictionary having a bilingual expression of a second natural language and a part of speech of the first natural language entry. A second natural language-third natural language dictionary having a part, a heading of the second natural language and its part of speech, a bilingual expression of the third natural language which is a bilingual translation of the second natural language entry, and its part of speech. A second natural language-third natural language dictionary storage unit, and the first natural language-second
A dictionary entry reading unit for retrieving the first natural language pair to the second natural language dictionary entry from the natural language dictionary storage unit; and a third corresponding to the second natural language entry of the retrieved first natural language to second natural language dictionary entry. A dictionary creation that acquires a natural language entry from the second natural language to third natural language dictionary storage unit and replaces the second natural language entry of the first natural language to second natural language dictionary entry with the third natural language entry A management unit configured to replace the first natural language entry with the third natural language dictionary entry generated by replacing the second natural language entry of the first natural language entry with the second natural language dictionary entry with the third natural language entry; 1
A first natural language-third natural language bilingual dictionary having a natural language heading and its part of speech, a third natural language bilingual translation of the first natural language entry, and its part of speech, is created and stored. The gist of the present invention is to have one natural language-third natural language dictionary storage unit.

【0010】請求項1記載の本発明にあっては、第1自
然言語対第2自然言語辞書格納部から第1自然言語対第
2自然言語辞書エントリを取り出し、この取り出した第
1自然言語対第2自然言語辞書エントリの第2自然言語
エントリに対応する第3自然言語エントリを第2自然言
語対第3自然言語辞書格納部から獲得し、この第3自然
言語エントリで第1自然言語対第2自然言語辞書エント
リの第2自然言語エントリを置き換えて第1自然言語の
見出しおよびその品詞と、該第1自然言語エントリの対
訳である第3自然言語の対訳およびその品詞とを有する
第1自然言語対第3自然言語の対訳辞書を作成して第1
自然言語対第3自然言語辞書格納部に格納するため、第
1自然言語対第2自然言語辞書および第2自然言語対第
3自然言語辞書を利用して、第1自然言語対第3自然言
語の組み合わせの辞書や対訳コーパスが無くても、第1
自然言語対第3自然言語辞書を作成することができる。
According to the first aspect of the present invention, the first natural language pair and the second natural language dictionary entry are fetched from the first natural language pair and the second natural language dictionary storage, and the fetched first natural language pair is extracted. A third natural language entry corresponding to the second natural language entry of the second natural language dictionary entry is obtained from the second natural language-to-third natural language dictionary storage unit, and the first natural language-to-second natural language entry is obtained by the third natural language entry. A first natural language having a heading of the first natural language and its part of speech by replacing the second natural language entry of the second natural language dictionary entry, and a third natural language bilingual translation and its part of speech of the first natural language entry; Create a bilingual dictionary of language versus third natural language
The first natural language versus the third natural language is stored in the natural language versus third natural language dictionary storage unit using the first natural language versus the second natural language dictionary and the second natural language versus the third natural language dictionary. Even if there is no dictionary or bilingual corpus of
A natural language versus third natural language dictionary can be created.

【0011】また、請求項2記載の本発明は、請求項1
記載の発明において、第1自然言語コーパスの統計情報
を格納している第1自然言語コーパス情報格納部を更に
有し、前記辞書作成管理部は、前記辞書エントリ読み込
み部から供給された第1自然言語対第2自然言語辞書エ
ントリの第1自然言語エントリをキーとして前記第1自
然言語コーパス情報格納部を参照し、不必要な第1自然
言語対第2自然言語エントリを取り除くエントリ選択情
報付与部を有することを要旨とする。
The present invention described in claim 2 is the same as the claim 1.
In the invention described in the above, further comprising a first natural language corpus information storage unit that stores statistical information of the first natural language corpus, wherein the dictionary creation management unit is configured to supply the first natural language corpus information supplied from the dictionary entry reading unit. An entry selection information providing unit that refers to the first natural language corpus information storage unit and uses the first natural language entry of the language-to-second natural language dictionary entry as a key to remove unnecessary first natural language-to-second natural language entries The gist is to have.

【0012】請求項2記載の本発明にあっては、辞書エ
ントリ読み込み部から供給された第1自然言語対第2自
然言語辞書エントリの第1自然言語エントリをキーとし
て第1自然言語コーパス情報格納部を参照し、不必要な
第1自然言語対第2自然言語エントリを取り除くため、
例えば分野限定の辞書を作成する場合などには、不必要
な辞書エントリを作成しないことになり、結果的に第1
自然言語対第3自然言語辞書の作成と利用において高速
化および効率化を図ることができる。また、分野限定の
辞書を作成する場合、利用する第1自然言語対第2自然
言語辞書や第2自然言語対第3自然言語辞書もその分野
の辞書を用いることができれば、更に信頼性の高い分野
限定の第1自然言語対第3自然言語辞書を作成すること
ができる。
According to the present invention, the first natural language corpus information is stored using the first natural language entry of the first natural language versus second natural language dictionary entry supplied from the dictionary entry reading unit as a key. Section to remove unnecessary first natural language versus second natural language entries,
For example, when a dictionary limited to a field is created, unnecessary dictionary entries are not created.
The speed and efficiency of the creation and use of the natural language versus third natural language dictionary can be improved. In the case of creating a dictionary limited to a field, if the first natural language-to-second natural language dictionary and the second natural language-to-third natural language dictionary to be used can use the dictionary of the field, the reliability is higher. A field-specific first natural language versus third natural language dictionary can be created.

【0013】更に、請求項3記載の本発明は、請求項2
記載の発明において、第2自然言語コーパスの統計情報
を格納している第2自然言語コーパス情報格納部を更に
有し、前記エントリ選択情報付与部は、前記辞書エント
リ読み込み部から供給された第1自然言語対第2自然言
語辞書エントリの第2自然言語エントリをキーとして前
記第2自然言語コーパス情報格納部を参照し、重みづけ
情報である訳語選択情報を付与する訳語選択情報/重み
づけ情報付与手段を有することを要旨とする。
Further, the present invention according to claim 3 provides the invention according to claim 2.
The invention described in the above, further comprising a second natural language corpus information storage unit that stores statistical information of a second natural language corpus, wherein the entry selection information providing unit is configured to receive the first natural language corpus information from the dictionary entry reading unit. Using the second natural language entry of the natural language versus the second natural language dictionary entry as a key, referring to the second natural language corpus information storage unit and assigning translation word selection information / weighting information addition to assign the translation word selection information as weighting information The point is to have means.

【0014】請求項3記載の本発明にあっては、辞書エ
ントリ読み込み部から供給された第1自然言語対第2自
然言語辞書エントリの第2自然言語エントリをキーとし
て第2自然言語コーパス情報格納部を参照し、重みづけ
情報である訳語選択情報を付与するため、第1自然言語
から第2自然言語への訳語候補が複数ある場合でも、例
えば専門用語や分野特有の語としては、どの訳語がより
適切であるかがわかり、また複数の訳語候補の中でも、
よりよく出現する訳語候補はどれであるかの優先順位を
つけることができる。更に、訳語候補が1つである場合
でも、該訳語候補の尤もらしさを判断でき、結果的に、
より信頼性の高い第1自然言語対第3自然言語辞書を作
成できる。また、第2自然言語の段階で訳語選択のため
の情報を付与するため、第1自然言語および第2自然言
語を変えずに第3自然言語のみを変えるときにも同じ情
報を利用することができ、結果として第3自然言語を様
々な言語へと拡張するとき、第1自然言語対第3自然言
語辞書を効率的に作成することができる。
According to the third aspect of the present invention, the second natural language corpus information is stored using the second natural language entry of the first natural language versus second natural language dictionary entry supplied from the dictionary entry reading unit as a key. For example, when there are a plurality of candidate translations from the first natural language to the second natural language in order to add translation word selection information as weighting information by referring to Is more appropriate, and among several possible translations,
It is possible to prioritize which translation candidates appear better. Further, even when there is one translation word candidate, the likelihood of the translation word candidate can be determined, and as a result,
A more reliable first natural language to third natural language dictionary can be created. In addition, since information for selecting a translated word is added at the stage of the second natural language, the same information can be used when only the third natural language is changed without changing the first natural language and the second natural language. When the third natural language is extended to various languages as a result, the first natural language-third natural language dictionary can be efficiently created.

【0015】請求項4記載の本発明は、請求項1,2ま
たは3記載の発明において、前記辞書作成管理部が、第
1自然言語対第2自然言語辞書エントリの第2自然言語
エントリを第3自然言語エントリで置き換えることがで
きなかった場合、該第2自然言語エントリを解析する第
2自然言語解析部と、該第2自然言語解析部の解析結果
に基づき第3自然言語エントリを獲得し、この獲得した
第3自然言語エントリで前記第2自然言語エントリを置
き換える置換実行部とを有することを要旨とする。
According to a fourth aspect of the present invention, in the first, second or third aspect of the invention, the dictionary creation management unit stores the second natural language entry of the first natural language versus second natural language dictionary entry in the second natural language entry. When the third natural language entry cannot be replaced with the third natural language entry, the second natural language analysis unit analyzes the second natural language entry, and acquires the third natural language entry based on the analysis result of the second natural language analysis unit. And a replacement execution unit that replaces the second natural language entry with the obtained third natural language entry.

【0016】請求項4記載の本発明にあっては、第1自
然言語対第2自然言語辞書エントリの第2自然言語エン
トリを第3自然言語エントリで置き換えることができな
かった場合、該第2自然言語エントリを解析し、この解
析結果に基づき第3自然言語エントリを獲得し、この獲
得した第3自然言語エントリで第2自然言語エントリを
置き換えるため、例えば第2自然言語エントリが複合語
で、そのままの表記では第2自然言語対第3自然言語辞
書に登録されていない場合でも、第2自然言語エントリ
に対して複合語を構成する部分表現単位に分割するなど
の解析を行い、各部分表現が第2自然言語対第3自然言
語辞書に登録されていれば、第1自然言語対第2自然言
語辞書エントリの第2自然言語エントリを第3自然言語
エントリで置き換えることができ、結果的にそのままの
表記では置き換えの困難な複合語などに対する第3自然
言語エントリも獲得して第1自然言語対第3自然言語辞
書を作成できる。
According to the present invention, when the second natural language entry of the first natural language-to-second natural language dictionary entry cannot be replaced with the third natural language entry, the second natural language entry cannot be replaced. In order to analyze the natural language entry and obtain a third natural language entry based on the analysis result and replace the second natural language entry with the obtained third natural language entry, for example, the second natural language entry is a compound word, Even if the notation is not registered in the second natural language-third natural language dictionary as it is, analysis is performed on the second natural language entry, such as division into sub-expression units constituting a compound word, and each sub-expression is analyzed. Is registered in the second natural language-third natural language dictionary, the second natural language entry of the first natural language-second natural language dictionary entry is replaced with the third natural language entry. Rukoto can, can be created as a result, as it is the third natural language entry also won the first natural language versus the third natural language dictionary for such difficult compound word of the replacement notation.

【0017】また、請求項5記載の本発明は、請求項4
記載の発明において、第2自然言語を第3自然言語に置
き換える置換ルールを格納している置換ルール格納部を
更に有し、前記辞書作成管理部は、前記第2自然言語解
析部の解析結果に基づき前記置換ルール格納部を検索し
て、置換ルールを取り出す置換ルール検索部を有し、前
記置換実行部は、前記置換ルール検索部で取り出した置
換ルールを利用し、該置換ルールが複数の場合は該複数
の置換ルールを組み合わせて利用して、前記第2自然言
語対第3自然言語辞書格納部から第3自然言語エントリ
を獲得する手段を有することを要旨とする。
The present invention according to claim 5 provides the present invention according to claim 4.
The invention described in the above, further comprising a replacement rule storage unit storing a replacement rule for replacing the second natural language with the third natural language, wherein the dictionary creation management unit stores the analysis result of the second natural language analysis unit. A replacement rule search unit that searches the replacement rule storage unit based on the replacement rule, and obtains a replacement rule. The replacement execution unit uses the replacement rule extracted by the replacement rule search unit. Has a means for acquiring a third natural language entry from the second natural language / third natural language dictionary storage unit by using the plurality of replacement rules in combination.

【0018】請求項5記載の本発明にあっては、第2自
然言語解析部の解析結果に基づき置換ルール格納部を検
索して、置換ルールを取り出し、この取り出した置換ル
ールを利用し、該置換ルールが複数の場合は該複数の置
換ルールを組み合わせて利用して、第2自然言語対第3
自然言語辞書格納部から第3自然言語エントリを獲得す
るため、例えば第2自然言語エントリが複合語や変化形
またはそれらの組み合わせ等でそのままの表記では第2
自然言語対第3自然言語辞書に登録されていない場合で
も、第2自然言語エントリの解析結果と該解析結果に適
した置換ルールと第2自然言語対第3自然言語辞書を用
いて、より複雑な第2自然言語エントリに対してもより
確実に第1自然言語対第2自然言語辞書エントリの第2
自然言語エントリを第3自然言語エントリで置き換える
ことができる。また、置換ルールを複数組み合わせて用
いることにより、第2自然言語エントリの解析結果を一
括して置き換えることができる置換ルールが置換ルール
格納部に格納されていない場合でも、第1自然言語対第
2自然言語辞書エントリの第2自然言語エントリを第3
自然言語エントリで置き換えることができ、結果的にそ
のままの表記では置き換えの難しい複合語など、より複
雑な第2自然言語エントリに対する第3自然言語エント
リも的確に獲得して、第1自然言語対第3自然言語辞書
を作成できる。更に、置換ルールを組み合わせて利用で
きるため、置換ルール格納部に可能性のある全置換ルー
ルを保有している必要がなく、第1自然言語対第3自然
言語辞書を効率的に作成することができる。
According to the fifth aspect of the present invention, the replacement rule storage section is searched based on the analysis result of the second natural language analysis section, the replacement rule is extracted, and the extracted replacement rule is used. When there are a plurality of replacement rules, the plurality of replacement rules are used in combination to obtain a second natural language versus a third natural language.
In order to obtain the third natural language entry from the natural language dictionary storage unit, for example, if the second natural language entry is a compound word, a modified form, a combination thereof, or the like, the second natural language entry is the second
Even when not registered in the natural language-to-third natural language dictionary, a more complex result is obtained by using the analysis result of the second natural language entry, a replacement rule suitable for the analysis result, and the second natural language-to-third natural language dictionary. Of the first natural language to the second natural language dictionary entry more reliably for the second natural language entry.
The natural language entry can be replaced by a third natural language entry. Further, by using a plurality of replacement rules in combination, even if a replacement rule that can replace the analysis result of the second natural language entry in a lump is not stored in the replacement rule storage unit, the first natural language versus the second natural language entry can be used. The second natural language entry of the natural language dictionary entry is the third
The third natural language entry corresponding to the more complex second natural language entry, such as a compound word that can be replaced with a natural language entry, and as a result, is difficult to replace with the notation as it is, is obtained accurately, and the first natural language entry is replaced with the first natural language entry. 3. Create a natural language dictionary. Further, since the replacement rules can be used in combination, there is no need to hold all possible replacement rules in the replacement rule storage unit, and the first natural language-third natural language dictionary can be efficiently created. it can.

【0019】更に、請求項6記載の本発明は、請求項5
記載の発明において、前記辞書作成管理部が、前記置換
実行部において前記置換ルール検索部で取り出した複数
の置換ルールを組み合わせて利用した場合、この組み合
わせた置換ルールの利用回数を計数する利用回数計数手
段と、この計数した置換ルールの利用回数が所定の回数
以上になった場合、この組み合わせた置換ルールを前記
置換ルール格納部に格納する置換ルール作成部とを有す
ることを要旨とする。
Further, the present invention described in claim 6 provides the present invention in claim 5.
In the invention described in the above, when the dictionary creation management unit uses a plurality of replacement rules extracted by the replacement rule search unit in the replacement execution unit in combination, the dictionary creation management unit counts the number of uses of the combined replacement rule. The gist of the present invention is to have a means and a replacement rule creating unit for storing the combined replacement rule in the replacement rule storage unit when the counted number of times of use of the replacement rule is equal to or more than a predetermined number.

【0020】請求項6記載の本発明にあっては、複数の
置換ルールを組み合わせて利用した場合、この組み合わ
せた置換ルールの利用回数を計数、この利用回数が所定
の回数以上になった場合、この組み合わせた置換ルール
を置換ルール格納部に格納するため、利用頻度が高い組
み合わせ置換ルールを獲得して置換ルール格納部に格納
しておくことにより、第1自然言語対第2自然言語辞書
エントリの第2自然言語エントリを第3自然言語エント
リで置き換える時の高速化を図ることができ、第1自然
言語対第3自然言語辞書を効率的に作成することができ
る。
According to the present invention, when a plurality of replacement rules are used in combination, the number of times of use of the combined replacement rule is counted, and when the number of uses becomes a predetermined number or more, In order to store the combined replacement rule in the replacement rule storage unit, a combination replacement rule having a high use frequency is acquired and stored in the replacement rule storage unit, so that the first natural language versus the second natural language dictionary entry is obtained. The speed of replacing the second natural language entry with the third natural language entry can be increased, and the first natural language-third natural language dictionary can be efficiently created.

【0021】請求項7記載の本発明は、請求項4乃至6
のいずれかに記載の発明において、第2自然言語の原
形、品詞および活用情報を格納している第2自然言語辞
書を格納する第2自然言語辞書格納部を更に有し、前記
第2自然言語解析部は、第2自然言語辞書格納部を検索
して、第2自然言語エントリを解析する手段を有するこ
とを要旨とする。
The present invention according to claim 7 provides the invention according to claims 4 to 6
In the invention according to any one of the above, further comprising a second natural language dictionary storage unit for storing a second natural language dictionary storing the original form, part of speech, and utilization information of the second natural language, The gist is that the analysis unit has means for searching the second natural language dictionary storage unit and analyzing the second natural language entry.

【0022】請求項7記載の本発明にあっては、第2自
然言語の原形、品詞および活用情報を格納している第2
自然言語辞書を有し、第2自然言語解析部は第2自然言
語辞書格納部を検索して、第2自然言語エントリを解析
するため、例えば第2自然言語エントリに変化形が含ま
れ、そのままの表記では第2自然言語対第3自然言語辞
書に登録されていない場合でも、第2自然言語辞書から
該第2自然言語エントリに含まれる変化形の原形を獲得
でき、この原形が第2自然言語対第3自然言語辞書に登
録されている場合、第1自然言語対第2自然言語辞書エ
ントリの第2自然言語エントリを第3自然言語エントリ
に置き換えることができ、結果としてそのままの表記で
は置き換えが難しい変化形などの第2自然言語エントリ
に対する第3自然言語エントリも獲得でき、第1自然言
語対第3自然言語辞書を的確に作成することができる。
According to the seventh aspect of the present invention, the second natural language stores the original form, part of speech, and utilization information.
Since the second natural language analysis unit has a natural language dictionary and searches the second natural language dictionary storage unit and analyzes the second natural language entry, for example, the second natural language entry includes a variant, In the notation of, even if it is not registered in the second natural language-third natural language dictionary, it is possible to acquire the original form of the variant included in the second natural language entry from the second natural language dictionary, and this original form is the second natural language entry. When registered in the language-to-third natural language dictionary, the second natural-language entry of the first natural language-to-second natural language dictionary entry can be replaced with the third natural language entry, and as a result, can be replaced with the literal notation It is also possible to acquire a third natural language entry for a second natural language entry such as a variant that is difficult to perform, and to create a first natural language-third natural language dictionary accurately.

【0023】また、請求項8記載の本発明は、請求項4
乃至7のいずれかに記載の発明において、第3自然言語
の原形、品詞および活用情報を格納している第3自然言
語辞書を格納する第3自然言語辞書格納部を更に有し、
前記置換実行部は、前記第2自然言語解析部の解析結果
または前記置換ルール検索部で取り出した置換ルールに
基づき前記第3自然言語辞書格納部を検索して、第1自
然言語対第2自然言語辞書エントリの第2自然言語エン
トリを第3自然言語エントリで置き換える手段を有する
ことを要旨とする。
The present invention described in claim 8 provides the present invention according to claim 4.
The invention according to any one of the first to seventh aspects, further comprising a third natural language dictionary storage unit that stores a third natural language dictionary that stores the original form, part of speech, and utilization information of the third natural language,
The replacement execution unit searches the third natural language dictionary storage unit based on the analysis result of the second natural language analysis unit or the replacement rule retrieved by the replacement rule search unit, and searches for the first natural language versus the second natural language. The gist of the present invention is to have means for replacing the second natural language entry of the language dictionary entry with the third natural language entry.

【0024】請求項8記載の本発明にあっては、第3自
然言語の原形、品詞および活用情報を格納している第3
自然言語辞書を有し、第2自然言語解析部の解析結果ま
たは前記置換ルール検索部で取り出した置換ルールに基
づき第3自然言語辞書格納部を検索して、第1自然言語
対第2自然言語辞書エントリの第2自然言語エントリを
第3自然言語エントリで置き換えるため、例えば第2自
然言語エントリに変化形が含まれ、そのままの表記では
第2自然言語対第3自然言語辞書に登録されていない場
合に、該第2自然言語エントリに含まれる変化形を原形
に直して、対応する第3自然言語エントリを第2自然言
語対第3自然言語辞書から原形で獲得した場合、第3自
然言語辞書を検索して第3自然言語エントリの原形を適
切な変化形の表記へと変換でき、結果としてそのままの
表記では置き換えが難しい変化形などの第2自然言語エ
ントリに対応する第3自然言語エントリも適確な表現へ
と変換して、第1自然言語対第3自然言語辞書を的確に
作成することができる。
According to the eighth aspect of the present invention, the third natural language stores the original form, part of speech, and utilization information.
A third natural language dictionary storage unit that has a natural language dictionary and searches the third natural language dictionary storage unit based on the analysis result of the second natural language analysis unit or the replacement rule retrieved by the replacement rule search unit; In order to replace the second natural language entry of the dictionary entry with the third natural language entry, for example, the second natural language entry contains a variant, and is not registered in the second natural language-third natural language dictionary as it is. In this case, if the variant included in the second natural language entry is converted to the original form and the corresponding third natural language entry is obtained in the original form from the second natural language to third natural language dictionary, the third natural language dictionary To convert the original form of the third natural language entry into a notation of an appropriate variant, and as a result, corresponds to the second natural language entry such as a variant that is difficult to replace with the notation as it is 3 is converted into a natural language entry is also applicable exact representation can be created accurately first natural-language third natural language dictionary.

【0025】更に、請求項9記載の本発明は、請求項1
乃至8のいずれかに記載の発明において、前記辞書作成
管理部が、第1自然言語対第2自然言語辞書エントリの
第2自然言語エントリが複数獲得され、かつ該第2自然
言語エントリに対する第3自然言語エントリが重複して
獲得された場合、この重複して獲得された第3自然言語
エントリの方がより適切であると判断する訳語選択情報
付与部を有することを要旨とする。
Further, the present invention described in claim 9 is based on claim 1.
In the invention according to any one of the first to eighth aspects, the dictionary creation management unit acquires a plurality of second natural language entries of the first natural language dictionary entry and the second natural language dictionary entry, and stores a third natural language entry for the second natural language entry. In a case where the natural language entries are acquired in duplicate, the gist of the present invention is to have a translation word selection information providing unit that determines that the third acquired natural language entry is more appropriate.

【0026】請求項9記載の本発明にあっては、第1自
然言語対第2自然言語辞書エントリの第2自然言語エン
トリが複数獲得され、かつ該第2自然言語エントリに対
する第3自然言語エントリが重複して獲得された場合、
この重複して獲得された第3自然言語エントリの方がよ
り適切であると判断するため、第2自然言語エントリの
段階で訳語候補が複数になった場合、複数の第2自然言
語エントリから獲得された第3自然言語エントリが重複
すれば、この重複した第3自然言語エントリの方が単独
で出現した第3自然言語エントリよりも適切であるとい
う訳語選択情報を付与でき、結果として信頼性の高い第
1自然言語対第3自然言語辞書を作成することができ
る。
According to the ninth aspect of the present invention, a plurality of second natural language entries of the first natural language versus second natural language dictionary entry are obtained, and a third natural language entry corresponding to the second natural language entry is obtained. Is acquired twice,
In order to judge that the third acquired natural language entry is more appropriate, if there are a plurality of candidate translations at the stage of the second natural language entry, the third natural language entry is acquired from the plurality of second natural language entries. If the duplicated third natural language entries overlap, translation word selection information indicating that the duplicated third natural language entry is more appropriate than the third natural language entry that appeared alone can be added, and as a result, reliability A high first natural language to third natural language dictionary can be created.

【0027】請求項10記載の本発明は、請求項1乃至
9のいずれかに記載の発明において、第3自然言語コー
パスの統計情報を格納している第3自然言語コーパス情
報格納部を更に有し、前記辞書作成管理部は、前記第3
自然言語コーパス情報格納部の情報を利用して、前記辞
書作成管理部で獲得した第3自然言語エントリが適切か
どうかを示す訳語選択情報を付与する手段を有すること
を要旨とする。
[0027] According to a tenth aspect of the present invention, in the invention of any one of the first to ninth aspects, there is further provided a third natural language corpus information storage unit for storing statistical information of the third natural language corpus. And the dictionary creation management unit performs the third
The gist of the present invention is to include means for adding translation word selection information indicating whether the third natural language entry acquired by the dictionary creation management unit is appropriate, using information in the natural language corpus information storage unit.

【0028】請求項10記載の本発明にあっては、第3
自然言語コーパスの統計情報を格納している第3自然言
語コーパス情報格納部を有し、この第3自然言語コーパ
ス情報格納部の情報を利用して、辞書作成管理部で獲得
した第3自然言語エントリが適切かどうかを示す訳語選
択情報を付与するため、第1自然言語エントリから第2
自然言語エントリを介して第3自然言語エントリへと辿
る間に訳語候補が増加しても、例えば専門用語や分野特
有の語など、どの訳語がより適切であるかわかる。ま
た、複数の訳語候補の中で、よりよく用いられる語の優
先順位を付与できるし、更に第3自然言語の訳語候補が
1つである場合でも該訳語候補の尤もらしさを判断でき
る。更に、第2自然言語エントリが複合語で、そのまま
の表記では第3自然言語エントリを獲得できず、解析を
行って第3自然言語エントリを獲得する場合、該第3自
然言語エントリ中の単語候補が複数あっても、獲得した
第3自然言語エントリの中に含まれる単語間の共起情報
などから、より適切な語の組み合わせを選択でき、結果
的に信頼性の高い第1自然言語対第3自然言語辞書を作
成することができる。
In the present invention according to claim 10, the third aspect
A third natural language corpus information storage unit that stores the statistical information of the natural language corpus, and uses the information of the third natural language corpus information storage unit to acquire the third natural language acquired by the dictionary creation management unit From the first natural language entry, the second
Even if the number of translation candidates increases while tracing to the third natural language entry via the natural language entry, it is possible to know which translation is more appropriate, for example, a technical term or a field-specific word. In addition, a priority order of a word that is more frequently used among a plurality of translation word candidates can be given, and even when there is only one translation word candidate of the third natural language, the likelihood of the translation word candidate can be determined. Further, when the second natural language entry is a compound word and the third natural language entry cannot be obtained by the notation as it is, and the analysis is performed to obtain the third natural language entry, a word candidate in the third natural language entry is obtained. Even if there are a plurality of words, it is possible to select a more appropriate word combination from the co-occurrence information between words included in the acquired third natural language entry, and as a result, the first natural language versus the first 3. A natural language dictionary can be created.

【0029】請求項11記載の本発明は、自然言語対の
対訳辞書を作成する辞書作成方法であって、第1自然言
語の見出しおよびその品詞と、該第1自然言語エントリ
の対訳である第2自然言語の対訳表現およびその品詞と
を有する第1自然言語対第2自然言語の辞書を第1自然
言語対第2自然言語辞書格納部に格納する第1自然言語
対第2自然言語辞書格納部格納ステップと、第2自然言
語の見出しおよびその品詞と、該第2自然言語エントリ
の対訳である第3自然言語の対訳表現およびその品詞と
を有する第2自然言語対第3自然言語辞書を第2自然言
語対第3自然言語辞書格納部に格納する第2自然言語対
第3自然言語辞書格納部格納ステップと、前記第1自然
言語対第2自然言語辞書格納部から第1自然言語対第2
自然言語辞書エントリを取り出す辞書エントリ読み込み
ステップと、この取り出した第1自然言語対第2自然言
語辞書エントリの第2自然言語エントリに対応する第3
自然言語エントリを前記第2自然言語対第3自然言語辞
書格納部から獲得し、前記第1自然言語対第2自然言語
辞書エントリの第2自然言語エントリを前記第3自然言
語エントリで置き換える辞書作成管理ステップと、この
第1自然言語エントリ対第2自然言語辞書エントリの第
2自然言語エントリを第3自然言語エントリで置き換え
ることにより生成される第1自然言語対第3自然言語辞
書エントリに基づき第1自然言語の見出しおよびその品
詞と、該第1自然言語エントリの対訳である第3自然言
語の対訳およびその品詞とを有する第1自然言語対第3
自然言語の対訳辞書を作成して格納する第1自然言語対
第3自然言語辞書格納ステップとを有することを要旨と
する。
According to an eleventh aspect of the present invention, there is provided a dictionary creation method for creating a bilingual dictionary of a natural language pair, comprising: a first natural language heading and its part of speech; and a bilingual translation of the first natural language entry. A first natural language versus a second natural language dictionary storing a first natural language versus a second natural language dictionary having a bilingual expression and a part of speech of the second natural language in a first natural language versus a second natural language dictionary storage unit A second natural language-third natural language dictionary having a part storing step, a heading of the second natural language and its part of speech, a bilingual expression of the third natural language which is a bilingual translation of the second natural language entry, and its part of speech. A second natural language pair to a third natural language dictionary storage unit stored in the second natural language pair to the third natural language dictionary storage unit; and a first natural language pair from the first natural language pair to the second natural language dictionary storage unit. Second
A dictionary entry reading step of extracting a natural language dictionary entry, and a third natural language entry corresponding to the second natural language entry of the extracted first natural language to second natural language dictionary entry.
A dictionary creation that acquires a natural language entry from the second natural language to third natural language dictionary storage unit and replaces the second natural language entry of the first natural language to second natural language dictionary entry with the third natural language entry A management step, based on the first natural language-third natural language dictionary entry generated by replacing the second natural language entry of the first natural language entry-second natural language dictionary entry with the third natural language entry; A first natural language pair having a first natural language headline and its part of speech, and a third natural language parallel translation and its part of speech that is a parallel translation of the first natural language entry;
A first natural language-third natural language dictionary storing step of creating and storing a natural language bilingual dictionary is essential.

【0030】請求項11記載の本発明にあっては、第1
自然言語対第2自然言語辞書格納部から第1自然言語対
第2自然言語辞書エントリを取り出し、この取り出した
第1自然言語対第2自然言語辞書エントリの第2自然言
語エントリに対応する第3自然言語エントリを第2自然
言語対第3自然言語辞書格納部から獲得し、この第3自
然言語エントリで第1自然言語対第2自然言語辞書エン
トリの第2自然言語エントリを置き換えて第1自然言語
の見出しおよびその品詞と、該第1自然言語エントリの
対訳である第3自然言語の対訳およびその品詞とを有す
る第1自然言語対第3自然言語の対訳辞書を作成して第
1自然言語対第3自然言語辞書格納部に格納するため、
第1自然言語対第2自然言語辞書および第2自然言語対
第3自然言語辞書を利用して、第1自然言語対第3自然
言語の組み合わせの辞書や対訳コーパスが無くても、第
1自然言語対第3自然言語辞書を作成することができ
る。
In the present invention according to claim 11, the first
The first natural language / second natural language dictionary entry is retrieved from the natural language / second natural language dictionary storage unit, and the third natural language entry corresponding to the retrieved first natural language / second natural language dictionary entry is retrieved. A natural language entry is obtained from the second natural language to third natural language dictionary storage unit, and the third natural language entry replaces the second natural language entry of the first natural language to second natural language dictionary entry to obtain the first natural language entry. A first natural language-third natural language bilingual dictionary having a headline of a language and its part of speech, a third natural language bilingual translation of the first natural language entry and its part of speech, and creates a first natural language bilingual dictionary To store in the third natural language dictionary storage unit,
By using the first natural language-second natural language dictionary and the second natural language-third natural language dictionary, the first natural language-third natural language combination dictionary and the bilingual corpus are not required. A language-to-third natural language dictionary can be created.

【0031】また、請求項12記載の本発明は、請求項
11記載の発明において、第1自然言語コーパスの統計
情報を第1自然言語コーパス情報格納部に格納するステ
ップを更に有し、前記辞書作成管理ステップは、前記辞
書エントリ読み込みステップから供給された第1自然言
語対第2自然言語辞書エントリの第1自然言語エントリ
をキーとして前記第1自然言語コーパス情報格納部を参
照し、不必要な第1自然言語対第2自然言語エントリを
取り除くエントリ選択情報付与ステップを有することを
要旨とする。
According to a twelfth aspect of the present invention, in accordance with the eleventh aspect, the method further comprises the step of storing statistical information of the first natural language corpus in the first natural language corpus information storage unit, The creation management step refers to the first natural language corpus information storage unit by using the first natural language entry of the first natural language versus second natural language dictionary entry supplied from the dictionary entry reading step as a key, and The gist of the present invention is to include an entry selection information adding step of removing the first natural language pair and the second natural language entry.

【0032】請求項12記載の本発明にあっては、辞書
エントリ読み込みステップから供給された第1自然言語
対第2自然言語辞書エントリの第1自然言語エントリを
キーとして第1自然言語コーパス情報格納部を参照し
て、不必要な第1自然言語対第2自然言語エントリを取
り除くため、例えば分野限定の辞書を作成する場合など
には、不必要な辞書エントリを作成しないことになり、
結果的に第1自然言語対第3自然言語辞書の作成と利用
において高速化および効率化を図ることができる。ま
た、分野限定の辞書を作成する場合、利用する第1自然
言語対第2自然言語辞書や第2自然言語対第3自然言語
辞書もその分野の辞書を用いることができれば、更に信
頼性の高い分野限定の第1自然言語対第3自然言語辞書
を作成することができる。
According to the present invention, the first natural language corpus information is stored by using the first natural language entry of the first natural language versus second natural language dictionary entry supplied from the dictionary entry reading step as a key. To remove unnecessary first natural language vs. second natural language entries with reference to the section, unnecessary dictionary entries are not created when, for example, a dictionary limited to a field is created,
As a result, the speed and efficiency of creation and use of the first natural language versus third natural language dictionary can be improved. In the case of creating a dictionary limited to a field, if the first natural language-to-second natural language dictionary and the second natural language-to-third natural language dictionary to be used can use the dictionary of the field, the reliability is higher. A field-specific first natural language versus third natural language dictionary can be created.

【0033】更に、請求項13記載の本発明は、請求項
12記載の発明において、第2自然言語コーパスの統計
情報を第2自然言語コーパス情報格納部に格納するステ
ップを更に有し、前記エントリ選択情報付与ステップ
は、前記辞書エントリ読み込みステップから供給された
第1自然言語対第2自然言語辞書エントリの第2自然言
語エントリをキーとして前記第2自然言語コーパス情報
格納部を参照し、重みづけ情報である訳語選択情報を付
与する訳語選択情報/重みづけ情報付与ステップを有す
ることを要旨とする。
Further, the present invention according to claim 13 is the invention according to claim 12, further comprising the step of storing statistical information of the second natural language corpus in a second natural language corpus information storage unit, The selecting information adding step refers to the second natural language corpus information storage unit using the second natural language entry of the first natural language versus second natural language dictionary entry supplied from the dictionary entry reading step as a key, and assigns a weight. The gist of the present invention is to provide a translation word selection information / weighting information provision step for providing translation word selection information as information.

【0034】請求項13記載の本発明にあっては、辞書
エントリ読み込みステップから供給された第1自然言語
対第2自然言語辞書エントリの第2自然言語エントリを
キーとして第2自然言語コーパス情報格納部を参照し、
重みづけ情報である訳語選択情報を付与するため、第1
自然言語から第2自然言語への訳語候補が複数ある場合
でも、例えば専門用語や分野特有の語としては、どの訳
語がより適切であるかがわかり、また複数の訳語候補の
中でも、よりよく出現する訳語候補はどれであるかの優
先順位をつけることができる。更に、訳語候補が1つで
ある場合でも、該訳語候補の尤もらしさを判断でき、結
果的に、より信頼性の高い第1自然言語対第3自然言語
辞書を作成できる。また、第2自然言語の段階で訳語選
択のための情報を付与するため、第1自然言語および第
2自然言語を変えずに第3自然言語のみを変えるときに
も同じ情報を利用することができ、結果として第3自然
言語を様々な言語へと拡張するとき、第1自然言語対第
3自然言語辞書を効率的に作成することができる。
According to the present invention, the second natural language corpus information is stored by using the second natural language entry of the first natural language versus the second natural language dictionary entry supplied from the dictionary entry reading step as a key. See section
To assign translation selection information, which is weighting information,
Even when there are multiple candidate translations from natural language to the second natural language, it is possible to find out which translation is more appropriate, for example, as a technical term or a field-specific word, and to appear more frequently among multiple translation candidates It is possible to prioritize which translation word candidates to perform. Furthermore, even when there is one translation word candidate, the likelihood of the translation word candidate can be determined, and as a result, a more reliable first natural language versus third natural language dictionary can be created. In addition, since information for selecting a translated word is added at the stage of the second natural language, the same information can be used when only the third natural language is changed without changing the first natural language and the second natural language. When the third natural language is extended to various languages as a result, the first natural language-third natural language dictionary can be efficiently created.

【0035】請求項14記載の本発明は、請求項11記
載の発明において、前記辞書作成管理ステップが、第1
自然言語対第2自然言語辞書エントリの第2自然言語エ
ントリを第3自然言語エントリで置き換えることができ
なかった場合、該第2自然言語エントリを解析する第2
自然言語解析ステップと、該第2自然言語解析ステップ
の解析結果に基づき第3自然言語エントリを獲得し、こ
の獲得した第3自然言語エントリで前記第2自然言語エ
ントリを置き換える置換実行ステップを有することを要
旨とする。
According to a fourteenth aspect of the present invention, in the invention of the eleventh aspect, the dictionary creation management step includes the first step.
If the second natural language entry of the natural language versus second natural language dictionary entry could not be replaced with the third natural language entry, a second analysis of the second natural language entry is performed.
A natural language analysis step; and a replacement execution step of acquiring a third natural language entry based on an analysis result of the second natural language analysis step and replacing the second natural language entry with the acquired third natural language entry. Is the gist.

【0036】請求項14記載の本発明にあっては、第1
自然言語対第2自然言語辞書エントリの第2自然言語エ
ントリを第3自然言語エントリで置き換えることができ
なかった場合、該第2自然言語エントリを解析し、この
解析結果に基づき第3自然言語エントリを獲得し、この
獲得した第3自然言語エントリで第2自然言語エントリ
を置き換えるため、例えば第2自然言語エントリが複合
語で、そのままの表記では第2自然言語対第3自然言語
辞書に登録されていない場合でも、第2自然言語エント
リに対して複合語を構成する部分表現単位に分割するな
どの解析を行い、各部分表現が第2自然言語対第3自然
言語辞書に登録されていれば、第1自然言語対第2自然
言語辞書エントリの第2自然言語エントリを第3自然言
語エントリで置き換えることができ、結果的にそのまま
の表記では置き換えの困難な複合語などに対する第3自
然言語エントリも獲得して第1自然言語対第3自然言語
辞書を作成できる。
In the present invention according to claim 14, the first aspect
If the second natural language entry of the natural language to second natural language dictionary entry cannot be replaced with the third natural language entry, the second natural language entry is analyzed, and the third natural language entry is analyzed based on the analysis result. In order to replace the second natural language entry with the obtained third natural language entry, for example, the second natural language entry is a compound word, and is registered in the second natural language-third natural language dictionary as it is. Even if it is not, if the second natural language entry is analyzed such as dividing it into sub-expression units constituting a compound word, and if each sub-expression is registered in the second natural language-third natural language dictionary, , The second natural language entry of the first natural language versus the second natural language dictionary entry can be replaced by the third natural language entry, and as a result, the notation can be replaced as it is. The third natural language entry for such difficult compound words can create the first natural language versus the third natural language dictionary won.

【0037】請求項15記載の本発明は、自然言語対の
対訳辞書を作成する辞書作成プログラムを記録した記録
媒体であって、第1自然言語の見出しおよびその品詞
と、該第1自然言語エントリの対訳である第2自然言語
の対訳表現およびその品詞とを有する第1自然言語対第
2自然言語の辞書を第1自然言語対第2自然言語辞書格
納部に格納する第1自然言語対第2自然言語辞書格納部
格納ステップと、第2自然言語の見出しおよびその品詞
と、該第2自然言語エントリの対訳である第3自然言語
の対訳表現およびその品詞とを有する第2自然言語対第
3自然言語辞書を第2自然言語対第3自然言語辞書格納
部に格納する第2自然言語対第3自然言語辞書格納部格
納ステップと、前記第1自然言語対第2自然言語辞書格
納部から第1自然言語対第2自然言語辞書エントリを取
り出す辞書エントリ読み込みステップと、この取り出し
た第1自然言語対第2自然言語辞書エントリの第2自然
言語エントリに対応する第3自然言語エントリを前記第
2自然言語対第3自然言語辞書格納部から獲得し、前記
第1自然言語対第2自然言語辞書エントリの第2自然言
語エントリを前記第3自然言語エントリで置き換える辞
書作成管理ステップと、この第1自然言語対第2自然言
語辞書エントリの第2自然言語エントリを第3自然言語
エントリで置き換えることにより生成される第1自然言
語対第3自然言語辞書エントリに基づき第1自然言語の
見出しおよびその品詞と、該第1自然言語エントリの対
訳である第3自然言語の対訳およびその品詞とを有する
第1自然言語対第3自然言語の対訳辞書を作成して格納
する第1自然言語対第3自然言語辞書格納ステップとを
有する辞書作成プログラムを記録媒体に記録することを
要旨とする。
According to a fifteenth aspect of the present invention, there is provided a recording medium storing a dictionary creation program for creating a bilingual dictionary of a natural language pair, comprising: a first natural language heading and its part of speech; A first natural language versus a second natural language dictionary storing a first natural language versus a second natural language dictionary having a bilingual expression of the second natural language and its part of speech, A second natural language dictionary having a second natural language dictionary storage step, a heading of the second natural language and its part of speech, and a bilingual expression of the third natural language which is a bilingual translation of the second natural language entry and its part of speech. Storing the third natural language dictionary in the second natural language-third natural language dictionary storage unit; and storing the third natural language dictionary in the second natural language dictionary storage unit. 1st natural language A dictionary entry reading step of extracting a second natural language dictionary entry; and a third natural language entry corresponding to the second natural language entry of the first natural language pair and the second natural language dictionary entry thus extracted is stored in the second natural language pair. A dictionary creation management step of obtaining from the third natural language dictionary storage unit and replacing a second natural language entry of the first natural language pair second natural language dictionary entry with the third natural language entry; A first natural language heading and its part of speech based on the first natural language versus third natural language dictionary entry generated by replacing the second natural language entry of the second natural language dictionary entry with the third natural language entry; First natural language versus third natural language bilingual translation with third natural language bilingual translation of first natural language entry and its part of speech And gist dictionary creating program having a first natural-language third natural language dictionary storage step of storing create be recorded on the recording medium.

【0038】請求項15記載の本発明にあっては、第1
自然言語対第2自然言語辞書格納部から第1自然言語対
第2自然言語辞書エントリを取り出し、この取り出した
第1自然言語対第2自然言語辞書エントリの第2自然言
語エントリに対応する第3自然言語エントリを第2自然
言語対第3自然言語辞書格納部から獲得し、この第3自
然言語エントリで第1自然言語対第2自然言語辞書エン
トリの第2自然言語エントリを置き換えて第1自然言語
の見出しおよびその品詞と、該第1自然言語エントリの
対訳である第3自然言語の対訳およびその品詞とを有す
る第1自然言語対第3自然言語の対訳辞書を作成して第
1自然言語対第3自然言語辞書格納部に格納する辞書作
成プログラムを記録媒体に記録しているため、該記録媒
体を用いて、その流通性を高めることができる。
In the present invention according to claim 15, the first aspect
The first natural language / second natural language dictionary entry is retrieved from the natural language / second natural language dictionary storage unit, and the third natural language entry corresponding to the retrieved first natural language / second natural language dictionary entry is retrieved. A natural language entry is obtained from the second natural language to third natural language dictionary storage unit, and the third natural language entry replaces the second natural language entry of the first natural language to second natural language dictionary entry to obtain the first natural language entry. A first natural language-third natural language bilingual dictionary having a headline of a language and its part of speech, a third natural language bilingual translation of the first natural language entry and its part of speech, and creates a first natural language bilingual dictionary Since the dictionary creation program stored in the third natural language dictionary storage unit is recorded on the recording medium, the distribution can be improved by using the recording medium.

【0039】[0039]

【発明の実施の形態】以下、図面を用いて本発明の実施
の形態を説明する。図1は、本発明の一実施形態に係る
辞書作成装置の構成を示すブロック図である。同図に示
す辞書作成装置は、第1自然言語対第2自然言語辞書格
納部10、辞書エントリ読み込み部11、辞書作成管理
部12、第1自然言語対第3自然言語辞書格納部13、
第1自然言語コーパス情報格納部14、第2自然言語コ
ーパス情報格納部15、置換ルール格納部16、第2自
然言語辞書格納部17、第3自然言語辞書格納部18、
第2自然言語対第3自然言語辞書格納部19、第3自然
言語コーパス情報格納部20より構成される。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram illustrating a configuration of a dictionary creation device according to an embodiment of the present invention. The dictionary creation device shown in FIG. 1 includes a first natural language-second natural language dictionary storage unit 10, a dictionary entry reading unit 11, a dictionary creation management unit 12, a first natural language-third natural language dictionary storage unit 13,
A first natural language corpus information storage unit 14, a second natural language corpus information storage unit 15, a replacement rule storage unit 16, a second natural language dictionary storage unit 17, a third natural language dictionary storage unit 18,
It comprises a second natural language-third natural language dictionary storage unit 19 and a third natural language corpus information storage unit 20.

【0040】第1自然言語対第2自然言語辞書格納部1
0には、1つ以上の第1自然言語対第2自然言語辞書が
格納されており、格納されている辞書レコードには、少
なくとも第1自然言語の見出しおよびその品詞と、該第
1自然言語の見出しおよびその品詞のペアである第1自
然言語エントリに対する第2自然言語の対訳表現とその
品詞が含まれている。
First natural language to second natural language dictionary storage 1
0, one or more first natural language to second natural language dictionaries are stored. The stored dictionary records include at least a heading of the first natural language and its part of speech, and the first natural language. And a part-of-speech expression in the second natural language for the first natural language entry, which is a pair of the headline and the part of speech.

【0041】辞書エントリ読み込み部11は、第1自然
言語対第2自然言語辞書格納部10に格納されている辞
書から第1自然言語エントリとその対訳表現を含む第2
自然言語エントリを取り出して辞書作成管理部12へ供
給する。
The dictionary entry reading unit 11 reads a first natural language entry from a dictionary stored in the first natural language-to-second natural language dictionary storage unit 10 and stores a second natural language entry including the bilingual expression thereof.
The natural language entry is taken out and supplied to the dictionary creation management unit 12.

【0042】辞書作成管理部12は、第1自然言語コー
パス情報格納部14、第2自然言語コーパス情報格納部
15、置換ルール格納部16、第2自然言語辞書格納部
17、第3自然言語辞書格納部18、第2自然言語対第
3自然言語辞書格納部19、第3自然言語コーパス情報
格納部20を参照し、辞書エントリ読み込み部11から
供給された第1自然言語対第2自然言語辞書エントリの
第2自然言語エントリを第3自然言語エントリへと置き
換え、第1自然言語対第3自然言語辞書格納部13へ格
納する。
The dictionary creation management unit 12 includes a first natural language corpus information storage unit 14, a second natural language corpus information storage unit 15, a replacement rule storage unit 16, a second natural language dictionary storage unit 17, and a third natural language dictionary. The first natural language versus the second natural language dictionary supplied from the dictionary entry reading unit 11 with reference to the storage unit 18, the second natural language to third natural language dictionary storage unit 19, and the third natural language corpus information storage unit 20 The second natural language entry of the entry is replaced with the third natural language entry, and stored in the first natural language-third natural language dictionary storage unit 13.

【0043】辞書作成管理部12は、エントリ選択情報
付与部121、第2自然言語解析部122、置換管理部
123、訳語選択情報付与部124から構成される。ま
た、置換管理部123は、置換ルール検索部1231、
置換ルール作成部1232、置換実行部1233によっ
て構成される。
The dictionary creation management section 12 includes an entry selection information provision section 121, a second natural language analysis section 122, a substitution management section 123, and a translated word selection information provision section 124. Further, the replacement management unit 123 includes a replacement rule search unit 1231,
The replacement rule creation unit 1232 and the replacement execution unit 1233 are configured.

【0044】辞書作成管理部12のエントリ選択情報付
与部121は、辞書エントリ読み込み部11から供給さ
れた第1自然言語対第2自然言語辞書エントリの第1自
然言語エントリをキーとして、第1自然言語コーパス情
報格納部14を参照し、該第1自然言語対第2自然言語
辞書エントリが必要かどうかを判断し、不必要であれば
以降の操作を行わずに、次に辞書エントリ読み込み部1
1から供給された第1自然言語対第2自然言語辞書エン
トリへと操作を移す。
The entry selection information providing unit 121 of the dictionary creation management unit 12 uses the first natural language entry of the first natural language vs. second natural language dictionary entry supplied from the dictionary entry reading unit 11 as a key to generate a first natural language entry. Referring to the language corpus information storage unit 14, it is determined whether or not the first natural language-to-second natural language dictionary entry is necessary. If it is not necessary, the subsequent operation is not performed and the dictionary entry reading unit 1
The operation is shifted to the first natural language to second natural language dictionary entry supplied from 1.

【0045】また、エントリ選択情報付与部121は、
辞書エントリ読み込み部11から供給された第1自然言
語対第2自然言語辞書エントリの第2自然言語エントリ
をキーとして、第2自然言語コーパス情報格納部15を
参照し、該第2自然言語エントリに関するコーパス中の
統計情報を取り出して該第2自然言語エントリに付与
し、辞書作成管理部12の置換管理部123における置
換実行部1233へと統計情報を付与した該第2自然言
語エントリを供給する。
The entry selection information providing section 121
With reference to the second natural language corpus information storage unit 15 using the second natural language entry of the first natural language versus second natural language dictionary entry supplied from the dictionary entry reading unit 11 as a key, the second natural language entry is The statistical information in the corpus is taken out and added to the second natural language entry, and the second natural language entry with the statistical information added is supplied to the replacement execution unit 1233 in the replacement management unit 123 of the dictionary creation management unit 12.

【0046】置換実行部1233は第2自然言語対第3
自然言語辞書格納部19を参照し、辞書エントリ読み込
み部11から供給された第1自然言語対第2自然言語辞
書エントリの第2自然言語エントリを第3自然言語エン
トリに置き換え、第1自然言語エントリと第3自然言語
エントリの組を訳語選択情報付与部124へと供給す
る。
The replacement execution unit 1233 determines whether the second natural language
With reference to the natural language dictionary storage unit 19, the second natural language entry of the first natural language versus second natural language dictionary entry supplied from the dictionary entry reading unit 11 is replaced with a third natural language entry, and the first natural language entry And the third natural language entry pair to the translation word selection information providing unit 124.

【0047】ただし、置換実行部1233で第1自然言
語対第2自然言語辞書エントリの第2自然言語エントリ
に対する第3自然言語エントリが獲得できなかった場
合、該第2自然言語エントリは辞書作成管理部12の第
2自然言語解析部122へと供給される。
However, if the third natural language entry for the second natural language entry of the first natural language versus second natural language dictionary entry cannot be obtained by the replacement execution unit 1233, the second natural language entry is managed by dictionary creation management. It is supplied to the second natural language analysis unit 122 of the unit 12.

【0048】辞書作成管理部12の第2自然言語解析部
122は、第2自然言語エントリに対する解析手段を1
つ以上有し、置換管理部123の置換実行部1233に
おいて第1自然言語対第2自然言語辞書エントリの第2
自然言語エントリを第3自然言語エントリへ置き換える
ことができなかった場合に、必要に応じて第2自然言語
辞書格納部17を参照して該第2自然言語エントリを解
析し、解析結果を置換管理部123の置換ルール検索部
1231へと供給する。
The second natural language analysis unit 122 of the dictionary creation management unit 12 provides one analysis means for the second natural language entry.
The first natural language to second natural language dictionary entry in the replacement execution unit 1233 of the replacement management unit 123.
When the natural language entry cannot be replaced with the third natural language entry, the second natural language entry is analyzed with reference to the second natural language dictionary storage unit 17 as necessary, and the analysis result is replaced and managed. This is supplied to the replacement rule search unit 1231 of the unit 123.

【0049】辞書作成管理部12の置換管理部123
は、第1自然言語対第2自然言語辞書エントリの第2自
然言語の辞書エントリに対する第3自然言語エントリを
獲得する。
Replacement management unit 123 of dictionary creation management unit 12
Obtains a third natural language entry for the second natural language dictionary entry of the first natural language to second natural language dictionary entry.

【0050】置換管理部123の置換ルール検索部12
31は、第2自然言語解析部122から供給された第1
自然言語対第2自然言語辞書エントリの第2自然言語エ
ントリの解析結果をキーとして置換ルール格納部16の
置換ルールを検索し、第1自然言語対第2自然言語辞書
エントリの第2自然言語エントリの解析結果を用いて第
2自然言語エントリを第3自然言語エントリへ置き換え
る置換ルールを1つ以上取り出す。
The replacement rule search unit 12 of the replacement management unit 123
31 is the first natural language analysis unit 122 supplied from the first
Using the analysis result of the second natural language entry of the natural language versus the second natural language dictionary entry as a key, a replacement rule in the replacement rule storage unit 16 is searched, and the second natural language entry of the first natural language versus the second natural language dictionary entry is searched. One or more replacement rules for replacing the second natural language entry with the third natural language entry are extracted using the analysis result of.

【0051】置換管理部123の置換ルール作成部12
32は、置換ルール検索部1231で置換ルール格納部
16に格納されている既存の置換ルールを複数組み合わ
せて、第1自然言語対第2自然言語辞書エントリの第2
自然言語エントリに対する解析結果に対する置き換えを
行った場合に、該置換ルールの組み合わせ(組み合わせ
置換ルール)の出現回数が一定数以上になれば、該組み
合わせ置換ルールを置換ルール格納部16へと格納す
る。
The replacement rule creation unit 12 of the replacement management unit 123
Reference numeral 32 denotes a combination of a plurality of existing replacement rules stored in the replacement rule storage unit 16 by the replacement rule search unit 1231, and a second natural language dictionary entry of the second natural language dictionary entry.
When the analysis result of the natural language entry is replaced and the number of appearances of the combination of the replacement rules (combination replacement rule) becomes a certain number or more, the combination replacement rule is stored in the replacement rule storage unit 16.

【0052】置換管理部123の置換実行部1233
は、第1自然言語対第2自然言語辞書エントリの第2自
然言語エントリをキーとして、第2自然言語対第3自然
言語辞書格納部19を検索し、第1自然言語対第2自然
言語辞書エントリの第2自然言語エントリを第3自然言
語エントリへ置き換える。
The replacement execution unit 1233 of the replacement management unit 123
Searches the second natural language-third natural language dictionary storage unit 19 using the second natural language entry of the first natural language-second natural language dictionary entry as a key, and searches the first natural language-second natural language dictionary. Replace the second natural language entry of the entry with a third natural language entry.

【0053】また、置換実行部1233は、第1自然言
語対第2自然言語辞書エントリの第2自然言語エントリ
に対する第2自然言語解析部122による解析結果、あ
るいは、該第2自然言語エントリの解析結果と置換ルー
ル検索部1231で取り出した1つ以上の置換ルールに
応じて、第2自然言語対第3自然言語辞書格納部19
と、必要に応じて第3自然言語辞書格納部18を参照し
て、第1自然言語対第2自然言語辞書エントリの第2自
然言語エントリを第3自然言語エントリへと置き換え
る。
The replacement execution unit 1233 analyzes the second natural language entry of the first natural language dictionary entry against the second natural language dictionary by the second natural language analysis unit 122, or analyzes the second natural language entry. According to the result and one or more replacement rules retrieved by the replacement rule search unit 1231, the second natural language versus third natural language dictionary storage unit 19
Then, referring to the third natural language dictionary storage unit 18 as necessary, the second natural language entry of the first natural language versus second natural language dictionary entry is replaced with the third natural language entry.

【0054】また、置換実行部1233は、第1自然言
語対第2自然言語辞書エントリの第2自然言語エントリ
に対応する第3自然言語エントリを獲得できなかった場
合に、該第2自然言語エントリを第2自然言語解析部1
22に戻し、上記と同様に第1自然言語対第2自然言語
辞書エントリの第2自然言語エントリを第3自然言語エ
ントリへと置き換える処理を繰り返す。
If the third natural language entry corresponding to the second natural language entry of the first natural language dictionary entry to the second natural language dictionary entry cannot be obtained, the replacement execution unit 1233 To the second natural language analysis unit 1
22 and the process of replacing the second natural language entry of the first natural language versus second natural language dictionary entry with the third natural language entry is repeated in the same manner as described above.

【0055】ただし、第1自然言語対第2自然言語辞書
エントリの第2自然言語エントリを第2自然言語解析部
122に戻すのは、まだ第2自然言語解析部122での
解析を一度も行っていない場合か、第2自然言語解析部
122に複数の解析方法が格納されており、該第2自然
言語エントリに対してまだ行ってない解析方法が残って
いる場合のみであり、解析方法が残っていない場合に
は、置換できなかったというフラグを付与し、第1自然
言語対第2自然言語辞書エントリの第2自然言語エント
リを第3自然言語エントリで置き換えないまま、あるい
は、該第2自然言語エントリから第3自然言語エントリ
への置換の途中結果を第1自然言語対第3自然言語辞書
格納部13へと格納する。
However, the reason why the second natural language entry of the first natural language to second natural language dictionary entry is returned to the second natural language analysis unit 122 is that the analysis by the second natural language analysis unit 122 has not yet been performed. This is only when the analysis method has not been performed or when a plurality of analysis methods are stored in the second natural language analysis unit 122 and an analysis method that has not yet been performed on the second natural language entry remains. If not, a flag indicating that replacement has not been performed is given, and the second natural language entry of the first natural language versus second natural language dictionary entry is not replaced with the third natural language entry, or the second natural language entry is not replaced. The intermediate result of the replacement of the natural language entry with the third natural language entry is stored in the first natural language-third natural language dictionary storage unit 13.

【0056】訳語選択情報付与部124は、置換管理部
123から供給された第3自然言語エントリをキーとし
て、第3自然言語コーパス情報格納部20を参照し、各
該第3自然言語エントリに対してどの訳語を優先、ある
いは選択するか等の訳語選択情報を付与する。
The translation word selection information providing unit 124 refers to the third natural language corpus information storage unit 20 using the third natural language entry supplied from the replacement management unit 123 as a key, and Translation word selection information such as which translation word is given priority or selection is given.

【0057】第1自然言語対第3自然言語辞書格納部1
3には、辞書作成管理部12から供給された、少なくと
も第1自然言語の見出しとその品詞と、該第1自然言語
の見出しとその品詞のぺアである第1自然言語エントリ
に対応する第3自然言語の対訳表現とその品詞と、必要
であれば第3自然言語の訳語選択情報をも格納すること
ができる。
First natural language to third natural language dictionary storage 1
3 includes at least the first natural language heading and its part of speech supplied from the dictionary creation management unit 12 and the first natural language entry corresponding to the first natural language heading and its part of speech, which is the first natural language entry. The bilingual expression of the third natural language and its part of speech and, if necessary, the translation word selection information of the third natural language can also be stored.

【0058】第1自然言語コーパス情報格納部14は、
電子化文書である第1自然言語コーパスを用いて抽出さ
れた統計情報を格納している。
The first natural language corpus information storage unit 14
The statistical information extracted using the first natural language corpus, which is an electronic document, is stored.

【0059】第2自然言語コーパス情報格納部15は、
電子化文書である第2自然言語コーパスを用いて抽出さ
れた統計情報を格納している。
The second natural language corpus information storage unit 15
Statistical information extracted using the second natural language corpus, which is an electronic document, is stored.

【0060】置換ルール格納部16は、置換管理部12
3において第1自然言語対第2自然言語辞書エントリの
第2自然言語エントリを第3自然言語エントリへ置き換
える際に、利用される置換ルールが格納されている。
The replacement rule storage unit 16 stores the replacement management unit 12
3, a replacement rule used when the second natural language entry of the first natural language versus second natural language dictionary entry is replaced with the third natural language entry is stored.

【0061】また、置換ルール格納部16には、置換ル
ール検索部1231において既存の置換ルールを組み合
わせて用いられた組み合わせ置換ルールのうち、一定回
数以上出現した該組み合わせ置換ルールも格納される。
The replacement rule storage unit 16 also stores the combination replacement rules that have appeared a fixed number of times or more among the combination replacement rules used by combining the existing replacement rules in the replacement rule search unit 1231.

【0062】第2自然言語辞書格納部17は、第2自然
言語の単言語辞書を格納してあり、辞書エントリとして
少なくとも原形と品詞と活用情報が格納されている。
The second natural language dictionary storage section 17 stores a monolingual dictionary of the second natural language, and stores at least the original form, the part of speech, and the utilization information as dictionary entries.

【0063】第3自然言語辞書格納部18は、第3自然
言語の単言語辞書を格納してあり、辞書エントリとして
少なくとも原形と品詞と活用情報が格納されている。
The third natural language dictionary storage section 18 stores a monolingual dictionary of the third natural language, and stores at least the original form, the part of speech, and the utilization information as dictionary entries.

【0064】第2自然言語対第3自然言語辞書格納部1
9は、第2自然言語対第3自然言語辞書が1つ以上格納
されており、格納されている第2自然言語対第3自然言
語辞書エントリには、少なくとも第2自然言語の見出し
とその品詞と、該第2自然言語エントリに対応する第3
自然言語の対訳表現とその品詞が含まれている。
Second natural language-third natural language dictionary storage unit 1
Reference numeral 9 denotes at least one second natural language-third natural language dictionary stored therein, and the stored second natural language-third natural language dictionary entry includes at least a heading of the second natural language and its part of speech. And a third corresponding to the second natural language entry
Contains natural language bilingual expressions and their parts of speech.

【0065】第3自然言語コーパス情報格納部20は、
電子化文書である第3自然言語コーパスを用いて抽出さ
れた統計情報を格納している。
The third natural language corpus information storage unit 20
It stores statistical information extracted using a third natural language corpus, which is an electronic document.

【0066】次に、以上のように構成される辞書作成装
置の具体的例および作用について図2以降の図面を用い
るとともに、図14に示すフローチャートを適宜参照し
て説明する。なお、この説明では、第1自然言語を日本
語、第2自然言語を英語、第3自然言語を仏語とする
が、第1自然言語、第2自然言語、第3自然言語の組み
合わせは、第1、第2、第3自然言語がそれぞれ異なる
言語であれば、タイ語と中国語とスペイン語や、ドイツ
語とフランス語とロシア語などなんでもよい。
Next, a specific example and operation of the dictionary creating apparatus configured as described above will be described with reference to the flowcharts shown in FIGS. In this description, the first natural language is Japanese, the second natural language is English, and the third natural language is French, but the combination of the first natural language, the second natural language, and the third natural language is the first natural language. As long as the first, second, and third natural languages are different languages, any language such as Thai, Chinese, and Spanish, or German, French, and Russian may be used.

【0067】図2は、図1に示した第1自然言語対第2
自然言語辞書格納部10に格納された第1自然言語対第
2自然言語辞書エントリの例を示している。第1自然言
語対第2自然言語辞書は、第1自然言語を日本語、第2
自然言語を英語とすると、例えばALT−J/Eの日英
対照辞書(NTT、「日英機械翻訳技術」、NTTR&
Dvol.46,pp107-141,1997)やEDR電子化辞書(日本
電子化辞書研究所、http://www.iijnet.or.jp/edr/J-in
dex.html)などが存在する。
FIG. 2 is a diagram showing the relationship between the first natural language and the second natural language shown in FIG.
3 shows an example of a first natural language versus second natural language dictionary entry stored in a natural language dictionary storage unit 10. The first natural language vs. second natural language dictionary is such that the first natural language is Japanese and the second is natural.
If the natural language is English, for example, the ALT-J / E Japanese-English Contrast Dictionary (NTT, “Japanese-English Machine Translation Technology”, NTTR &
Dvol.46, pp107-141,1997) and EDR Electronic Dictionary (Nihondenshikajishokenkyusho, http: //www.iijnet.or.jp/edr/J - in
dex.html).

【0068】図2にあるように、第1自然言語対第2自
然言語辞書エントリとして、少なくとも日本語見出しと
その品詞、および該日本語エントリに対する英語の対訳
表現とその品詞が登録されている。例えば、日本語見出
しが「銀行」である第1自然言語対第2自然言語辞書エ
ントリには、その品詞「名詞」と対訳表現”bank”およ
びその品詞「名詞」が登録されており、また日本語見出
しが「銀行員」である第1自然言語対第2自然言語辞書
エントリには、その品詞「名詞」と対訳表現”bank cle
rk”およびその品詞「名詞」が登録されており、更に日
本語見出しが「やけど」である第1自然言語対第2自然
言語辞書エントリには、その品詞「名詞」と対訳表現”
burn”およびその品詞「名詞」と、更に他の対訳表現で
ある”scald"およびその品詞「名詞」が登録されてお
り、更に、日本語見出しが「四季」である第1自然言語
対第2自然言語辞書エントリには、その品詞「名詞」と
対訳表現”four seasons”およびその品詞「名詞」が登
録されており、更に、日本語見出しが「千秋楽」である
第1自然言語対第2自然言語辞書エントリには、その品
詞「名詞」と対訳表現”last performance of the seas
on”およびその品詞「名詞」が登録されている。
As shown in FIG. 2, at least a Japanese headline and its part of speech, and an English bilingual expression corresponding to the Japanese entry and its part of speech are registered as a first natural language versus second natural language dictionary entry. For example, in the first natural language versus second natural language dictionary entry whose Japanese heading is "bank", its part of speech "noun", its bilingual expression "bank", and its part of speech "noun" are registered. The first natural language versus second natural language dictionary entry whose word heading is "banker" has its part of speech "noun" and its bilingual expression "bank cle
rk "and its part of speech" noun "are registered, and the first natural language versus second natural language dictionary entry whose Japanese heading is" yagade "has its part of speech" noun "and bilingual expression"
burn "and its part-of-speech" noun ", and another bilingual expression" scald "and its part-of-speech" noun "are registered, and further, the first natural language vs. the second natural language whose Japanese heading is" four seasons " The part-of-speech “noun”, the bilingual expression “four seasons” and the part-of-speech “noun” are registered in the natural language dictionary entry, and the first natural language versus the second natural language whose Japanese heading is “Chiaki”. In the language dictionary entry, the part of speech “noun” and the translation “last performance of the seas”
on ”and its part of speech“ noun ”are registered.

【0069】これらの例では日本語見出しは名詞であっ
たが、必ずしも名詞である必要はなく、動詞や形容詞な
どなんでもよい。また、これらの例では英語の品詞も名
詞であったが、この品詞も名詞である必要はなく動詞や
形容詞などなんでもよく、更に、見出しの品詞と一致す
る必要もない。
In these examples, the Japanese heading is a noun, but the Japanese heading is not necessarily a noun, but may be a verb or an adjective. In these examples, the part of speech in English is also a noun, but this part of speech need not be a noun, but may be a verb or an adjective, and need not match the part of speech of the heading.

【0070】また、第1自然言語対第2自然言語辞書格
納部10に格納される第1自然言語対第2自然言語辞書
は1つである必要はなく、複数の辞書を格納してもよ
く、例えば前記ALT−J/Eの日英対照辞書やEDR
電子化辞書を両方格納することや、分野限定の辞書を作
成することが目的の場合には、例えばコンピュータ関連
の辞書を作成したい時には、コンピュータ用語の辞書を
用いることなどが考えられる。
The first natural language / second natural language dictionary stored in the first natural language / second natural language dictionary storage unit 10 does not need to be one, and a plurality of dictionaries may be stored. For example, the ALT-J / E Japanese-English contrast dictionary or EDR
If the purpose is to store both computerized dictionaries and to create a dictionary limited to a field, for example, when it is desired to create a computer-related dictionary, it is possible to use a computer term dictionary.

【0071】次に、辞書エントリ読み込み部11の機能
を説明する。辞書エントリ読み込み部11は、第1自然
言語対第2自然言語辞書格納部10に格納された1つま
たは複数の辞書から辞書エントリを取り出してくる機能
を持つ(図14のステップS2)。辞書エントリ読み込
み部11で読み込まれた第1自然言語対第2自然言語辞
書エントリは、辞書作成管理部12へと供給される。
Next, the function of the dictionary entry reading section 11 will be described. The dictionary entry reading unit 11 has a function of extracting a dictionary entry from one or a plurality of dictionaries stored in the first natural language versus second natural language dictionary storage unit 10 (Step S2 in FIG. 14). The first natural language versus second natural language dictionary entry read by the dictionary entry reading unit 11 is supplied to the dictionary creation management unit 12.

【0072】第1自然言語対第2自然言語辞書格納部1
0に格納された辞書が1つの場合には、例えば日本語で
あれば50音順など、第1自然言語の辞書で一般的な語
順で見出しをソートして取り出したり、第1自然言語対
第2自然言語辞書エントリを第1自然言語の品詞ごとに
分けて同一品詞の中で見出しをソートして取り出せばよ
い。
First natural language to second natural language dictionary storage unit 1
In the case where there is one dictionary stored in 0, for example, in the case of Japanese, the headings are sorted and taken out in a general word order in the dictionary of the first natural language, such as the order of the Japanese syllabary. The two natural language dictionary entries may be separated for each part of speech of the first natural language, and the headings may be sorted and extracted in the same part of speech.

【0073】第1自然言語対第2自然言語辞書格納部1
0に辞書が複数格納されている場合には、例えば50音
順など一定の検索順を決定し、各辞書からその検索順に
沿って辞書エントリを取り出し、複数の辞書で第1自然
言語エントリが同じである第1自然言語対第2自然言語
辞書エントリがあれば、全ての辞書から該第1自然言語
対第2自然言語辞書エントリを取り出す方法が考えられ
る。
First natural language to second natural language dictionary storage unit 1
When a plurality of dictionaries are stored in 0, for example, a fixed search order such as the order of the Japanese syllabary is determined, dictionary entries are extracted from each dictionary along the search order, and the first natural language entry is the same in a plurality of dictionaries. If there is a first natural language to second natural language dictionary entry, a method of extracting the first natural language to second natural language dictionary entry from all dictionaries can be considered.

【0074】その他にも、予め第1自然言語エントリを
キーとして複数の辞書を1つの辞書にまとめ直してお
き、辞書が1つの場合と同様に順に取り出す方法も考え
られる。
In addition, a method is also conceivable in which a plurality of dictionaries are re-combined into one dictionary in advance using the first natural language entry as a key, and the dictionaries are taken out sequentially in the same manner as in the case of one dictionary.

【0075】またその他にも、格納されている辞書を1
つずつ引く方法がある。その場合、まず1つめの辞書を
第1自然言語の見出しでソートして順に引いていき、出
てきた第1自然言語エントリが他の辞書にもあるかを調
べ、あれば該第1自然言語エントリを持つ第1自然言語
対第2自然言語辞書エントリを全て取り出し、取り出し
た第1自然言語対第2自然言語辞書エントリには取り出
し済みのフラグを付与しておく。次に1つめの辞書を最
後まで検索した後、次の辞書に移り、取り出し済みのフ
ラグが付与されていない第1自然言語対第2自然言語辞
書エントリだけ同様に取り出し、1つめの辞書を除く他
の辞書にもその第1自然言語エントリを持つ第1自然言
語対第2自然言語辞書エントリが登録されていればそれ
も取り出し、取り出し後は取り出し済みのフラグを付与
しながら、各辞書で取り出していない第1自然言語対第
2自然言語辞書エントリがなくなるまで繰り返すという
方法も考えられる。
In addition, the stored dictionary is 1
There is a way to pull one by one. In that case, the first dictionary is first sorted by the heading of the first natural language, and is searched in order, and it is checked whether the first natural language entry that has appeared is in another dictionary. All the first natural language-to-second natural language dictionary entries having entries are taken out, and the taken-out first natural language-to-second natural language dictionary entry is provided with a taken-out flag. Next, after searching the first dictionary to the end, the process proceeds to the next dictionary, and similarly extracts only the first natural language-second natural language dictionary entry to which the extracted flag is not added, and removes the first dictionary. If the first natural language entry and the second natural language dictionary entry having the first natural language entry are registered in other dictionaries, they are also taken out, and after being taken out, each dictionary is taken out while giving the taken-out flag. It is also conceivable to repeat until there is no remaining first natural language / second natural language dictionary entry.

【0076】また特に、作成する第1自然言語対第3自
然言語の辞書が分野限定の辞書の場合や、辞書ごとに信
頼性に差がある場合などには、取り出した第1自然言語
対第2自然言語辞書エントリに、どの辞書に載っていた
第1自然言語対第2自然言語辞書エントリかのフラグを
つけ、該第1自然言語対第2自然言語辞書の分野や信頼
性によって第1自然言語対第2自然言語辞書エントリに
重みづけをすることも考えられる。
In particular, when the dictionary of the first natural language to the third natural language to be created is a dictionary limited to the field, or when there is a difference in reliability between the dictionaries, the extracted first natural language to the third natural language is used. The two natural language dictionary entries are flagged as the first natural language versus the second natural language dictionary entry, and the first natural language versus the second natural language dictionary is determined based on the field and reliability of the first natural language versus the second natural language dictionary. It is also conceivable to weight the language versus second natural language dictionary entry.

【0077】次に、辞書作成管理部12について説明す
る。辞書エントリ読み込み部11から供給された第1自
然言語対第2自然言語辞書エントリは、辞書作成管理部
12によって第1自然言語対第2自然言語辞書エントリ
の第2自然言語エントリが第3自然言語エントリによっ
て置き換えられ、第1自然言語エントリと第3自然言語
エントリの組として第1自然言語対第3自然言語辞書格
納部13に格納される。
Next, the dictionary creation management unit 12 will be described. The first natural language to second natural language dictionary entry supplied from the dictionary entry reading unit 11 is used by the dictionary creation management unit 12 to change the second natural language entry of the first natural language to second natural language dictionary entry to the third natural language. The first natural language entry and the third natural language dictionary are stored as a set of the first natural language entry and the third natural language entry.

【0078】辞書作成管理部12では、まず、エントリ
選択情報付与部121において第1自然言語コーパス情
報格納部14を参照し、辞書エントリ読み込み部11か
ら供給された第1自然言語対第2自然言語辞書エントリ
が、作成する第1自然言語対第3自然言語辞書の分野で
頻出する語であるかなど、第1自然言語対第3自然言語
辞書エントリとして獲得するのに有益かどうかの判断を
行い、有益と判断すると置換実行部1233に供給す
る。
In the dictionary creation management section 12, first, the entry selection information providing section 121 refers to the first natural language corpus information storage section 14 and reads the first natural language versus the second natural language supplied from the dictionary entry reading section 11. A determination is made as to whether the dictionary entry is useful for acquiring as the first natural language-third natural language dictionary entry, such as whether the dictionary entry is a word that frequently appears in the field of the first natural language-third natural language dictionary to be created. , And supplies it to the replacement execution unit 1233 if it is determined to be useful.

【0079】ここで参照される第1自然言語コーパス情
報格納部14に格納されている第1自然言語コーパスの
統計情報は、例えば図3のような形式をしており、少な
くとも第1自然言語である日本語のコーパス中に出現す
る語およびその品詞の組と、その組のコーパスでの出現
頻度などの統計情報が示されている。
The statistical information of the first natural language corpus stored in the first natural language corpus information storage unit 14 referred to here has, for example, a format as shown in FIG. A set of words and parts of speech that appear in a certain Japanese corpus and statistical information such as the frequency of occurrence of the set in the corpus are shown.

【0080】第1自然言語コーパス情報格納部14に格
納されている第1自然言語コーパスの統計情報の元とな
るコーパスとしては、日本語であれば例えば電子化され
た日本経済新聞や毎日新聞などがあげられる。
The corpus which is the basis of the statistical information of the first natural language corpus stored in the first natural language corpus information storage unit 14 is, for example, a computerized Nihon Keizai Shimbun or Mainichi Shimbun in Japanese. Is raised.

【0081】図2と図3を用いて、エントリ選択情報付
与部121の機能を具体的に説明する。例えば経済関係
の辞書を作成したい場合を想定すると、第1自然言語コ
ーパス情報格納部14には経済関係の第1自然言語コー
パスから獲得した統計情報を格納しておく。図3は経済
関係の日本語コーパスから獲得された統計情報の例であ
る。エントリ選択情報付与部121に図2に示す日本語
エントリの「銀行(名詞)」や「銀行員(名詞」)の第
1自然言語対第2自然言語辞書エントリが供給されたと
すると、図3のように経済関係の日本語コーパス中に
「銀行(名詞)」および「銀行員(名詞)」は出現して
いるので、獲得すれば有益なエントリだと判断され、置
換実行部1233へと供給される(図14のステップS
3(Yes))。
The function of the entry selection information providing unit 121 will be specifically described with reference to FIGS. For example, assuming that it is desired to create an economic-related dictionary, the first natural language corpus information storage unit 14 stores statistical information obtained from the first economic-related natural language corpus. FIG. 3 is an example of statistical information obtained from a Japanese corpus of economic relations. Assuming that the first natural language vs. second natural language dictionary entry of “bank (noun)” or “bank employee (noun)” of the Japanese entry shown in FIG. As described above, since "bank (noun)" and "bank employee (noun)" appear in the Japanese corpus of economic relations, it is determined that the entry is useful if acquired, and is supplied to the replacement execution unit 1233. (Step S in FIG. 14)
3 (Yes)).

【0082】しかし、供給された第1自然言語対第2自
然言語辞書エントリの日本語エントリが「やけど(名
詞)」や「四季(名詞)」や「千秋楽(名詞)」であれ
ば、図3のように経済関係の日本語コーパス中にはいず
れの日本語エントリも出現しないため、経済関係の辞書
を作成する時には、これらの日本語エントリに対応する
辞書エントリの作成は有益とは判断されず、次の辞書エ
ントリへと操作が移される(図14のステップS3(N
o))。ただし、作成する辞書が経済関係の辞書だと限
定しない場合には、「やけど(名詞)」も「四季(名
詞)」も「千秋楽(名詞)」も置換実行部へと供給され
る。
However, if the supplied Japanese entry of the first natural language vs. second natural language dictionary entry is “yaku (noun)”, “four seasons (noun)”, or “senshugaku (noun)”, FIG. No Japanese entry appears in the Japanese-language corpus of economic relations, so when creating a dictionary of economic relations, it is not considered useful to create dictionary entries corresponding to these Japanese entries. Then, the operation is moved to the next dictionary entry (step S3 (N
o)). However, if the dictionary to be created is not limited to an economic dictionary, "burns (noun)", "four seasons (noun)", and "Chiakiraku (noun)" are also supplied to the replacement execution unit.

【0083】また、エントリ選択情報付与部121は、
第2自然言語コーパス情報格納部15を参照し、辞書エ
ントリ読み込み部11から供給された第2自然言語エン
トリに訳語選択のための重みづけを行い、すなわち訳語
選択情報を付与し、重みづけをした該第2自然言語エン
トリを置換実行部1233に供給する機能も有する。
The entry selection information providing section 121
With reference to the second natural language corpus information storage unit 15, the second natural language entry supplied from the dictionary entry reading unit 11 is weighted for selecting a translated word, that is, the translated word selection information is added and weighted. It also has a function of supplying the second natural language entry to the replacement execution unit 1233.

【0084】ここで参照される第2自然言語コーパス情
報格納部15に格納されている第2自然言語コーパスの
統計情報は、例えば図4のような形式をしており、少な
くとも第2自然言語である英語のコーパス中に出現する
語および品詞の組と、その組のコーパスでの出現頻度な
どの統計情報が示されている。
The statistical information of the second natural language corpus stored in the second natural language corpus information storage unit 15 referred to here has, for example, a format as shown in FIG. A set of words and parts of speech appearing in a certain English corpus and statistical information such as the frequency of occurrence of the set in the corpus are shown.

【0085】第2自然言語コーパス情報格納部15に格
納されている第2自然言語コーパスの統計情報の元とな
るコーパスとしては、英語であれば例えばFinantial Ti
mes(http://www.jcp.grenet.fr/ELRA/cata/text-det.ht
ml#mlcc)やWall Street Journal(http://morph.ldc.up
enn.edu/Catalog/LDC2000T43.html)などがあげられ
る。
If the corpus serving as the source of the statistical information of the second natural language corpus stored in the second natural language corpus information storage unit 15 is English, for example, Financial Corpus
mes (http://www.jcp.grenet.fr/ELRA/cata/text - det.ht
ml # mlcc) and Wall Street Journal (http: //morph.ldc.up
enn.edu/Catalog/LDC2000T43.html).

【0086】図2と図4を用いて、エントリ選択情報付
与部121の上記重みづけ機能を具体的に説明する。例
えば、図2に示す日本語エントリが「やけど(名詞)」
である第1自然言語対第2自然言語辞書エントリの英語
エントリは、”burn(名詞)”と”scale(名詞)”が
登録されている。しかし、図4から第2自然言語コーパ
ス中の出現頻度は”burn(名詞)”の方が高いことがわ
かる。そこで、「やけど(名詞)」の英訳語としては”
scale(名詞)”よりも”burn(名詞)”の方を重視、
ひいては”scale(名詞)”を用いて得られた仏語よ
り、”burn(名詞)”を用いて得られた仏語を重視する
ため、例えば図5のように訳語選択のための重みづけを
行う(図14のステップS4)。
With reference to FIGS. 2 and 4, the weighting function of the entry selection information giving unit 121 will be specifically described. For example, the Japanese entry shown in FIG.
In the English entry of the first natural language versus second natural language dictionary entry, "burn (noun)" and "scale (noun)" are registered. However, it can be seen from FIG. 4 that the appearance frequency in the second natural language corpus is higher for “burn (noun)”. So, as an English translation of "yaga (noun)"
"burn (noun)" is more important than "scale (noun)"
Consequently, in order to emphasize the French words obtained using "burn (noun)" over the French words obtained using "scale (noun)", weighting for selecting a translation word is performed as shown in FIG. 5, for example ( Step S4 in FIG. 14).

【0087】十分に大規模な第2自然言語コーパスか
ら、あるいは、信頼性のおける第2自然言語コーパスか
ら獲得された第2自然言語コーパスの統計情報を利用で
きれば、この例のように第1自然言語対第2自然言語辞
書エントリの第2自然言語エントリに重みづけして置換
実行部1233に供給することや、第2自然言語エント
リの重みの重いものだけ置換実行部1233に供給する
ことも考えられる。
If statistical information of the second natural language corpus obtained from a sufficiently large second natural language corpus or a reliable second natural language corpus can be used, the first natural language corpus can be used as in this example. It is also conceivable to weight the second natural language entry of the language-to-second natural language dictionary entry and supply the weighted second natural language entry to the replacement execution unit 1233, or to supply only the heavy weight of the second natural language entry to the replacement execution unit 1233. Can be

【0088】図2に示す他の第1自然言語対第2自然言
語辞書エントリが上記重みづけ機能を有するエントリ選
択情報付与部121に供給された場合には、それぞれの
日本語エントリに対応する英語エントリは1つずつなの
で、エントリ選択情報付与部121の重みづけ機能は働
かないか、あるいは分野限定の辞書を作成する場合など
には、第2自然言語エントリの該分野における尤もらし
さの情報を付与することも考えられる。
When another first natural language-to-second natural language dictionary entry shown in FIG. 2 is supplied to the entry selection information providing unit 121 having the above-mentioned weighting function, the English language corresponding to each Japanese entry is Since the entries are one by one, the weighting function of the entry selection information assigning unit 121 does not work, or information on the likelihood of the second natural language entry in the field is added when a dictionary limited to the field is created. It is also possible to do.

【0089】次に、置換管理部123の置換実行部12
33について説明する。置換実行部1233では、供給
された第1自然言語対第2自然言語辞書エントリの第2
自然言語エントリをキーとして第2自然言語対第3自然
言語辞書格納部19を参照し、該第2自然言語エントリ
の対訳である第3自然言語エントリを獲得し、第1自然
言語対第2自然言語辞書エントリの第2自然言語エント
リを該第3自然言語エントリへと置き換え、訳語選択情
報付与部124へと供給する。
Next, the replacement execution unit 12 of the replacement management unit 123
33 will be described. In the replacement execution unit 1233, the second natural language dictionary entry of the supplied first natural language
With reference to the second natural language-third natural language dictionary storage unit 19 using the natural language entry as a key, a third natural language entry which is a translation of the second natural language entry is acquired, and the first natural language-second natural language entry is obtained. The second natural language entry of the language dictionary entry is replaced with the third natural language entry and supplied to the translated word selection information providing unit 124.

【0090】ただし、置換実行部1233では供給され
た第1自然言語対第2自然言語辞書エントリの第2自然
言語エントリの対訳である第3自然言語エントリを獲得
できなかった場合は、該第2自然言語エントリを第2自
然言語解析部122に供給する。
However, if the replacement execution unit 1233 cannot acquire the third natural language entry which is a translation of the second natural language entry of the supplied first natural language / second natural language dictionary entry, the second natural language entry is not obtained. The natural language entry is supplied to the second natural language analysis unit 122.

【0091】ここでまず、図6(a)を用いて第2自然
言語対第3自然言語辞書格納部19について具体的に説
明する。図6(a)および(b)は第2自然言語対第3
自然言語辞書格納部19に格納された第2自然言語対第
3自然言語辞書エントリの例である。
First, the second natural language-third natural language dictionary storage unit 19 will be specifically described with reference to FIG. FIGS. 6A and 6B show the second natural language versus the third natural language.
5 is an example of a second natural language to third natural language dictionary entry stored in the natural language dictionary storage unit 19;

【0092】第2自然言語を英語、第3自然言語を仏語
とすると、第2自然言語対第3自然言語辞書は、例えば
Lantmark Lexicon(LanTmark,http://www.icp.grenet.fr
/ELRA/cata/text-det.html#multilex)やBasic Multili
ngual Dictionary(http://www.icp.grenet.fr/ELRA/cat
a/text-det.html#multilex)などが存在する。
Assuming that the second natural language is English and the third natural language is French, the second natural language to third natural language dictionary is, for example,
Lantmark Lexicon (LanTmark, http://www.icp.grenet.fr
/ ELRA / cata / text - det.html # multilex) and Basic Multili
ngual Dictionary (http://www.icp.grenet.fr/ELRA/cat
a / text - det.html # multilex).

【0093】図6(a)および(b)にあるように、第
2自然言語対第3自然言語辞書エントリとしては、少な
くとも英語見出しとその品詞、および該英語エントリに
対する仏語の対訳表現とその品詞が登録されている。
As shown in FIGS. 6A and 6B, the second natural language-third natural language dictionary entry includes at least an English headline and its part of speech, and a bilingual expression of French and its part of speech corresponding to the English entry. Is registered.

【0094】例えば、図6(a)では、英語見出しが"b
ank"である第2自然言語対第3自然言語辞書エントリに
は、その品詞「名詞」と対訳表現”banque”およびその
品詞「女性名詞」と、更に、他の対訳表現である”riv
e”およびその品詞「女性名詞」が登録されている。ま
た、英語見出しが"burn"である第2自然言語対第3自然
言語辞書エントリには、その品詞「名詞」と対訳表現”
ruisseau”およびその品詞「男性名詞」と、更に他の対
訳表現である”bru^lure”およびその品詞「女性名
詞」が登録されており、英語見出しが”scald”である
第2自然言語対第3自然言語辞書エントリには、その品
詞「名詞」と対訳表現”bru^lure”およびその品詞
「女性名詞」が登録されている。
For example, in FIG. 6A, the English heading is "b".
The second natural language versus third natural language dictionary entry "ank" has its part of speech "noun", its bilingual expression "banque" and its part of speech "female noun", and another bilingual expression "riv
e ”and its part of speech“ female noun ”are registered. Also, the second natural language-third natural language dictionary entry whose English heading is "burn" has its part of speech "noun" and its bilingual expression "
ruisseau ”and its part-of-speech“ masculine noun ”and another translation“ bru 対 lure ”and its part-of-speech“ feminine noun ”are registered, and the second natural language pair whose English heading is“ scald ” In the three natural language dictionary entries, the part of speech “noun”, the bilingual expression “bru お よ び lure”, and the part of speech “female noun” are registered.

【0095】これらの例では英語見出しは名詞であった
が、必ずしも名詞である必要はなく、動詞や形容詞など
なんでもよい。また、これらの例では仏語の品詞も男性
名詞あるいは女性名詞であったが、この品詞も男性名詞
あるいは女性名詞である必要はなく動詞や形容詞などな
んでもよく、更に、見出しの品詞と一致する必要もな
い。
In these examples, the English heading is a noun, but it is not necessarily a noun, but may be a verb or an adjective. Also, in these examples, the parts of speech in French were also masculine or feminine nouns, but these parts of speech need not be masculine or feminine nouns, but may be verbs or adjectives, and need to match the part of speech in the heading. Absent.

【0096】また、第2自然言語対第3自然言語辞書格
納部19に格納される第2自然言語対第3自然言語辞書
は1つである必要はなく、複数の辞書を格納してもよ
く、例えば前記Lantmark LexiconやBasic Multilingual
Dictionaryを両方格納することや、分野限定の辞書を
作成することが目的の場合であって、例えばコンピュー
タ関連の辞書を作成したい時には、コンピュータ用語の
辞書を用いることなどが考えられる。
Further, the second natural language-third natural language dictionary stored in the second natural language-third natural language dictionary storage unit 19 need not be one, and a plurality of dictionaries may be stored. For example, the Lantmark Lexicon or Basic Multilingual
If the purpose is to store both dictionaries or to create a dictionary limited to a specific field, for example, when a computer-related dictionary is to be created, a dictionary of computer terms may be used.

【0097】図6(a)を用いて、置換実行部1233
の機能について具体的に説明する。ここで、図2に示す
日本語エントリ「銀行(名詞)」に対する英語エントリ
である"bank(名詞)”が置換実行部1233に供給さ
れた場合には、図6(a)に示す第2自然言語対第3自
然言語辞書格納部19を検索し、"bank(名詞)”の対
訳である仏語エントリ”banque(女性名詞)”と”rive
(女性名詞)”を獲得して(図14のステップS5(Y
es))、日本語エントリ「銀行(名詞)」と仏語エン
トリ”banque(女性名詞)”および”rive(女性名
詞)”の組を訳語選択情報付与部124へと供給する
(図14のステップS6)。
Referring to FIG. 6A, replacement execution unit 1233
The function will be described specifically. Here, when "bank (noun)" which is an English entry for the Japanese entry "bank (noun)" shown in FIG. 2 is supplied to the replacement execution unit 1233, the second natural language shown in FIG. The language-to-third natural language dictionary storage unit 19 is searched, and the French entries “banque (female noun)” and “rive” which are translations of “bank (noun)”
(Female noun) "(step S5 (Y in FIG. 14)
es)), a pair of the Japanese entry “bank (noun)” and the French entries “banque (female noun)” and “rive (female noun)” is supplied to the translation word selection information provision unit 124 (step S6 in FIG. 14). ).

【0098】また、図2に示す日本語エントリ「やけど
(名詞)」に対する英語エントリである”burn(名
詞)”と”scald(名詞)”が置換実行部1233に供
給された場合は、第2自然言語対第3自然言語辞書格納
部19を検索し、図6(a)から、”burn(名詞)”に
対する仏語エントリ”ruisseau(男性名詞)”と
When the English entries “burn (noun)” and “scald (noun)” for the Japanese entry “yake (noun)” shown in FIG. The natural language-versus-third natural language dictionary storage unit 19 is searched, and from FIG. 6A, the French entry “ruisseau (male noun)” for “burn (noun)” is entered.

【外1】 と”scald(名詞)”に対する仏語エントリ”bru^lure
(女性名詞)”を獲得して(図14のステップS5(Y
es))、日本語エントリ「やけど(名詞)」と仏語エ
ントリ”ruisseau(男性名詞)”および”bru^lure
(女性名詞)”の組と、該組に”bru^lure(女性名
詞)”は重複して出現しているという情報をつけて、訳
語選択情報付与部124へと供給する(図14のステッ
プS6)。
[Outside 1] And the French entry “bru ^ lure” for “scald (noun)”
(Female noun) "(step S5 (Y in FIG. 14)
es)), Japanese entries "yaga (noun)" and French entries "ruisseau (male noun)" and "bru ^ lure
(Female noun) ”and the information indicating that“ bru ^ lure (female noun) ”appears redundantly in the set and supply them to the translation word selection information providing unit 124 (step in FIG. 14). S6).

【0099】また、図2に示す日本語エントリ「千秋楽
(名詞)」に対する英語エントリである”last perform
ance of the season(名詞)”が置換実行部1233に
供給された場合、第2自然言語対第3自然言語辞書格納
部19を検索しても、図6(a)に示すように該英語エ
ントリに対する第2自然言語対第3自然言語辞書エント
リはなく、対応する仏語エントリを獲得できない。その
ため、この英語エントリ”last performance of the se
ason(名詞)”は第2自然言語解析部122に供給され
る(図14のステップS5(No))。
Also, "last perform" which is an English entry for the Japanese entry "Chiakiraku (noun)" shown in FIG.
ance of the season (noun) ”is supplied to the replacement execution unit 1233, and even if the second natural language-third natural language dictionary storage unit 19 is searched, as shown in FIG. There is no second natural language-third natural language dictionary entry for, and no corresponding French entry can be obtained, so this English entry "last performance of the se
ason (noun) "is supplied to the second natural language analysis unit 122 (step S5 (No) in FIG. 14).

【0100】同様に、「銀行員(名詞)」に対する英語
エントリ”bank clerk(名詞)”および「四季(名
詞)」に対する英語エントリ”four seasons(名詞)”
に対しても、対訳である仏語エントリを獲得できないた
め、該英語エントリは第2自然言語解析部122に供給
される(図14のステップS5(No))。
Similarly, the English entry “bank clerk (noun)” for “bank employee (noun)” and the English entry “four seasons (noun)” for “four seasons (noun)”
, The English entry is supplied to the second natural language analysis unit 122 (step S5 (No) in FIG. 14).

【0101】次に、訳語選択情報付与部124について
説明する。訳語選択情報付与部124では、供給された
第3自然言語エントリをキーとして、第3自然言語コー
パス情報格納部20を検証し、供給された第3自然言語
エントリが正しいかどうか、あるいは、複数供給された
場合、どの第3自然言語エントリが優先されるか等の訳
語選択のための重みづけを行い、第1自然言語対第3自
然言語辞書格納部13に格納する。
Next, the translated word selection information providing unit 124 will be described. The translated word selection information providing unit 124 verifies the third natural language corpus information storage unit 20 by using the supplied third natural language entry as a key, and determines whether the supplied third natural language entry is correct, or If so, weighting is performed for selecting a translated word such as which third natural language entry has priority, and stored in the first natural language versus third natural language dictionary storage unit 13.

【0102】ここで参照される第3自然言語コーパス情
報格納部20に格納されている第3自然言語コーパスの
統計情報は、例えば図7(a)のような形式をしてお
り、少なくとも第3自然言語である仏語のコーパス中に
出現する語および品詞の組と、その組のコーパスでの出
現頻度や共起頻度などの統計情報が示されている。
The statistical information of the third natural language corpus stored in the third natural language corpus information storage unit 20 referred to here has, for example, a format as shown in FIG. A set of words and parts of speech appearing in a corpus of a natural language, French, and statistical information such as an appearance frequency and a co-occurrence frequency in the corpus of the set are shown.

【0103】第3自然言語コーパス情報格納部20に格
納されている第3自然言語コーパスの統計情報の元とな
るコーパスとしては、仏語であれば例えばLe Monde new
spaper(http://morph.ldc.upenn.edu/Catalog/LDC95T1
1.html)や、Canadian Hansard(http://www.ldc.upenn.
edu/ldc/news/release/hansard.html)などがあげられ
る。
If the corpus serving as the source of the statistical information of the third natural language corpus stored in the third natural language corpus information storage unit 20 is French, for example, Le Monde new
spaper (http://morph.ldc.upenn.edu/Catalog/LDC95T1
1.html) and Canadian Hansard (http: //www.ldc.upenn.
edu / ldc / news / release / hansard.html).

【0104】図3と図7(a)を用いて訳語選択情報付
与部124の機能を具体的に説明する。例えば、経済関
係の辞書を作成したい場合を想定すると、第3自然言語
コーパス情報格納部20には経済関係のコーパスから獲
得した統計情報を格納しておく。図7(a)は経済関係
の仏語コーパスから獲得された出現頻度の例である。エ
ントリ選択情報付与部121の説明で述べたように、経
済関係の辞書を作成している場合で、第1自然言語コー
パス情報格納部14に経済関係の第1自然言語コーパス
の統計情報が格納されており、該統計情報を利用して、
第1自然言語対第2自然言語辞書エントリを取捨選択し
た場合、図2に示す日本語エントリ「銀行(名詞)」と
「銀行員(名詞)」の第1自然言語対第2自然言語辞書
エントリのみ残されているが、日本語エントリ「銀行員
(名詞)」に対する英語エントリは第2自然言語解析部
122へと供給されているので、この段階で訳語選択情
報付与部124へと供給されているのは、日本語エント
リ「銀行(名詞)」と、該日本語エントリに対するただ
1つの英語エントリである"bank(名詞)"から獲得され
た仏語エントリのみである。
The function of the translation word selection information providing unit 124 will be specifically described with reference to FIGS. 3 and 7A. For example, assuming that it is desired to create an economic dictionary, the third natural language corpus information storage unit 20 stores statistical information obtained from the economic corpus. FIG. 7A shows an example of the appearance frequency acquired from a French corpus related to economics. As described in the description of the entry selection information providing unit 121, in the case where an economic dictionary is created, the statistical information of the first natural language corpus of economic relation is stored in the first natural language corpus information storage unit 14. And using the statistical information,
When the first natural language-to-second natural language dictionary entry is selected, the first natural language-to-second natural language dictionary entries of the Japanese entries "bank (noun)" and "bank employee (noun)" shown in FIG. Although only the English entry for the Japanese entry "bank employee (noun)" is supplied to the second natural language analysis unit 122, it is supplied to the translation word selection information adding unit 124 at this stage. There is only a Japanese entry "bank (noun)" and a French entry obtained from "bank (noun)" which is the only English entry for the Japanese entry.

【0105】従って、日本語エントリ「銀行(名詞)」
と仏語エントリ”banque(女性名詞)”および”rive
(女性名詞)”の組が、訳語選択情報付与部124に供
給されたとすると、図7(a)から経済関連の仏語コー
パスにおいては”banque(女性名詞)”は頻出するが”
rive(女性名詞)”は出現しないことがわかり、「銀行
(名詞)」に対する仏語エントリとしては、”banque
(女性名詞)”の方が有望であることがわかる。実際、
英語”bank(名詞)”には「銀行」という意味以外に
「岸」などの意味があり、”rive(女性名詞)”は後者
の意味で出現した仏語エントリである。このように、仏
語エントリ”banque(女性名詞)”および”rive(女性
名詞)”に対して訳語選択のための重みづけを行い、日
本語エントリ「銀行(名詞)」とともに第1自然言語対
第3自然言語辞書格納部13へ格納する(図14のステ
ップS7)。
Therefore, the Japanese entry "bank (noun)"
And French entries "banque (female noun)" and "rive"
Assuming that the set of “(female noun)” is supplied to the translation word selection information providing unit 124, “banque (female noun)” frequently appears in the economy-related French corpus from FIG.
rive (female noun) ”does not appear, and the French entry for“ bank (noun) ”is“ banque
(Female noun) "is more promising.
The English word “bank (noun)” has a meaning such as “shore” in addition to the meaning of “bank”, and “rive (female noun)” is a French entry that appeared in the latter meaning. In this way, the French entries “banque (female noun)” and “rive (female noun)” are weighted for selecting a translation, and the first natural language paired with the Japanese entry “bank (noun)” are selected. 3 is stored in the natural language dictionary storage unit 13 (step S7 in FIG. 14).

【0106】十分に大規模な第3自然言語コーパスか
ら、あるいは信頼性のおける第3自然言語コーパスから
獲得された第3自然言語コーパスの統計情報を利用でき
れば、第3自然言語エントリとして重みの重いものだけ
残して第1自然言語対第3自然言語辞書格納部13へ格
納することも考えられる。
If statistical information of the third natural language corpus obtained from a sufficiently large third natural language corpus or a reliable third natural language corpus can be used, the weight of the third natural language entry is heavy. It is also conceivable to store only those in the first natural language versus third natural language dictionary storage unit 13.

【0107】ただし、上記の例では、第1自然言語コー
パス情報格納部14に第1自然言語コーパスの統計情報
が格納されており、該統計情報を利用して第1自然言語
対第2自然言語辞書エントリが既に取捨選択されている
場合を想定したが、第1自然言語コーパス情報格納部1
4がない場合、あるいは第1自然言語コーパス情報格納
部14があっても第1自然言語対第2自然言語辞書エン
トリの取捨選択がされていない場合でも同様に、第3自
然言語コーパス情報格納部20に格納された第3自然言
語コーパスの出現頻度などの統計情報を利用して仏語エ
ントリの取捨選択、あるいは重みづけを行うことができ
る。
However, in the above example, the first natural language corpus information storage unit 14 stores the statistical information of the first natural language corpus, and the first natural language versus the second natural language is used by using the statistical information. Although it is assumed that dictionary entries have already been selected, the first natural language corpus information storage unit 1
Similarly, if there is no first natural language corpus information storage unit 14 or if there is no selection of the first natural language versus second natural language dictionary entry, the third natural language corpus information storage unit The French entries can be selected or weighted using statistical information such as the frequency of appearance of the third natural language corpus stored in 20.

【0108】また、訳語選択情報付与部124は、第1
自然言語対第2自然言語辞書エントリの第2自然言語エ
ントリが複数あった場合でも、供給された第3自然言語
エントリが重複して出現すれば、重複して出現した第3
自然言語の方がより適切だと判断する重複判断機能を有
する。
[0108] The translated word selection information providing section 124 is provided with the first
Even when there are a plurality of second natural language entries in the natural language versus second natural language dictionary entry, if the supplied third natural language entry appears repeatedly, the third occurrence of the third natural language entry appears.
It has a duplicate judgment function that judges that natural language is more appropriate.

【0109】訳語選択情報付与部124の前記重複判断
機能を具体的に説明する。前記のように図2に示す日本
語エントリ「やけど(名詞)」に対する英語エントリ”
scald(名詞)”からは、図6(a)に示す仏語エント
リ”bru^lure(女性名詞)”が、英語エントリ”burn
(名詞)”からは図6(a)に示す仏語エントリ”ruis
seau(男性名詞)”および”bru^lure(女性名詞)”
が獲得されて訳語選択情報付与部124へ供給されてい
る。供給された仏語エントリは、”bru^lure(女性名
詞)”のみ重複して出現している。そこで、「やけど
(名詞)」に対する仏語エントリとしては、”ruisseau
(男性名詞)”より”bru^lure(女性名詞)”の方が
有望であると重みづけを行う。実際、英語の”burn(名
詞)”には、「やけど」以外に「小川」という意味があ
り、”ruisseau(男性名詞)”は、小川の方の意味の仏
語である。このように、仏語エントリ”bru^lure(女
性名詞)”および”ruisseau(男性名詞)”に対して訳
語選択のための重みづけを行い、日本語エントリ「やけ
ど(名詞)」とともに第1自然言語対第3自然言語辞書
格納部13へ格納する(図14のステップS7)。ただ
し、第3自然言語エントリとして重みの重いものだけ残
して第1自然言語対第3自然言語辞書格納部13へ格納
することも考えられる。
The duplication determination function of the translation word selection information providing section 124 will be specifically described. As described above, the English entry for the Japanese entry "Yagade (noun)" shown in FIG.
From the scald (noun), the French entry “bru ^ lure (female noun)” shown in FIG.
(Noun) ”from the French entry“ ruis shown in FIG.
seau (masculine noun) ”and“ bru 女性 lure (feminine noun) ”
Is obtained and supplied to the translated word selection information providing unit 124. In the supplied French entry, only "bru ^ lure (female noun)" appears repeatedly. So, as a French entry for "burns (nouns)", "ruisseau
We weight that “bru ^ lure (female noun)” is more promising than “masculine noun”. Actually, “burn (noun)” in English means “brook” in addition to “burn”. "Ruisseau (masculine noun)" is French for Ogawa. In this way, the French entries “bruurelure (female noun)” and “ruisseau (male noun)” are weighted for selecting the translation, and the first natural language is added together with the Japanese entry “yagage (noun)”. It is stored in the third natural language dictionary storage unit 13 (step S7 in FIG. 14). However, it is also conceivable that the third natural language entry is stored in the first natural language-third natural language dictionary storage unit 13 while leaving only those having a heavy weight.

【0110】次に、第2自然言語解析部122について
説明をする。第2自然言語解析部122では、置換管理
部123において第1自然言語対第2自然言語辞書エン
トリの第2自然言語エントリを第3自然言語エントリへ
置き換えることができなかった場合に、供給された第2
自然言語エントリを解析し、該第2自然言語エントリの
解析結果を再び置換管理部123へ供給する。
Next, the second natural language analyzing unit 122 will be described. The second natural language analysis unit 122 is supplied when the replacement management unit 123 cannot replace the second natural language entry of the first natural language versus second natural language dictionary entry with the third natural language entry. Second
The natural language entry is analyzed, and the analysis result of the second natural language entry is supplied to the replacement management unit 123 again.

【0111】第2自然言語解析部122が有する解析方
法としては、例えば形態素解析や構文解析などがあげら
れる。英語に対する形態素解析器としては、Brill Tagg
er(Eric Brill,ftp:blaze.cs.jhu.edu:/pub/brill/)
や、Xelda(Xerox,ftp://ftp.parc.xerox.com/pub/tagge
r)などがあり、英語に対する構文解析としてはApplePi
e Parser(New York University,http://cs.nyu.edu/cs/
projects/proteus/app/)や、Link Grammar(Carnegie M
ellon University,http://www.link.cs.cmu.edu/link
/)などがあげられる。
Examples of the analysis method of the second natural language analysis unit 122 include morphological analysis and syntax analysis. Brill Tagg is a morphological analyzer for English
er (Eric Brill, ftp: blaze.cs.jhu.edu: / pub / brill /)
Or Xelda (Xerox, ftp: //ftp.parc.xerox.com/pub/tagge
r), etc., and parsing for English is ApplePi
e Parser (New York University, http://cs.nyu.edu/cs/
projects / proteus / app /), Link Grammar (Carnegie M
ellon University, http://www.link.cs.cmu.edu/link
/).

【0112】まず第2自然言語解析部122が形態素解
析と構文解析を行う場合について、図8(a)〜(c)
を用いて第2自然言語解析部122の機能を具体的に説
明する。図8(a)〜(c)は第2自然言語解析部12
2による第2自然言語エントリの解析結果の例である。
First, the case where the second natural language analysis unit 122 performs morphological analysis and syntax analysis will be described with reference to FIGS.
The function of the second natural language analysis unit 122 will be specifically described with reference to FIG. FIGS. 8A to 8C show the second natural language analysis unit 12.
2 is an example of a result of analysis of a second natural language entry by No. 2.

【0113】図2に示す日本語エントリ「千秋楽(名
詞)」に対する英語エントリ”last performance of th
e season(名詞)”が、第2自然言語解析部122に供
給されたとする。図8(a)は”last performance of
the season”の第2自然言語解析部122による形態素
解析結果を示している。また、図8(b)は該英語エン
トリの第2自然言語解析部122による構文解析結果を
示している。図8(a)に示す形態素解析結果による
と、”last performance of the season”は、”last
(形容詞)”,”performance(名詞)”,”of(前置
詞)”,”the(定冠詞)”,”season(名詞)”へと
形態素解析され、更に図8(b)から、”the(定冠
詞)”+”season(名詞)”で名詞句になり、更に”of
(前置詞)”が加わり前置詞句になり、また、”last
(形容詞)”+”performance(名詞)”で名詞句にな
り、”last(形容詞)performance(名詞)of(前置
詞)the(定冠詞)season(名詞)”で名詞句になるこ
とがわかる。この解析結果は置換管理部123へ供給さ
れる(図14のステップS10)。
The English entry “last performance of th” for the Japanese entry “Chiakiraku (noun)” shown in FIG.
e season (noun) ”is supplied to the second natural language analysis unit 122. FIG. 8A shows“ last performance of
8B shows the result of the morphological analysis by the second natural language analyzing unit 122 of the season ". FIG. 8B shows the result of the syntax analysis of the English entry by the second natural language analyzing unit 122. According to the morphological analysis results shown in (a), “last performance of the season”
(Adjective), "performance (noun)", "of (preposition)", "the (definite article)", "season (noun)", and from FIG. 8 (b), furthermore, "the (definite article)" ) "+" Season (noun) "becomes a noun phrase and" of
(Preposition) ”is added to form a prepositional phrase, and“ last
(Adjective) “+” performance (noun) ”is a noun phrase, and“ last (adjective) performance (noun) of (preposition) the (definite article) season (noun) ”is a noun phrase. The result is supplied to the replacement management unit 123 (Step S10 in FIG. 14).

【0114】また、第2自然言語解析部122の解析方
法としては、他に例えば、形態素解析のみ行い、形態素
ごとに置換管理部123へ渡すことが考えられる。この
場合例えば、図2に示す日本語エントリ「銀行員(名
詞)」に対する英語エントリ”bank clerk(名詞)”
は、図8(c)に示すように”bank(名詞)”,”cler
k(名詞)”に形態素解析され、置換管理部123へ供
給される(図14のステップS10)。
As another analysis method of the second natural language analysis unit 122, for example, it is conceivable that only the morphological analysis is performed and the morphological analysis is passed to the replacement management unit 123. In this case, for example, the English entry “bank clerk (noun)” for the Japanese entry “bank clerk (noun)” shown in FIG.
Are “bank (noun)” and “cler” as shown in FIG.
The morphological analysis is performed on “k (noun)”, and the result is supplied to the replacement management unit 123 (step S10 in FIG. 14).

【0115】また、第2自然言語解析部122の解析方
法としては、他に例えば、複合語の場合、複合語を構成
する一単語ずつに分けて、置換管理部123へ渡すこと
が考えられる。その場合、図2に示す日本語エントリ
「銀行員(名詞)」に対する英語エントリ”bank clerk
(名詞)”では”bank”,”clerk”と分割され、置換
管理部123へ供給される(図14のステップS1
0)。
As another analysis method of the second natural language analysis unit 122, for example, in the case of a compound word, it is conceivable that the compound word is divided into words constituting the compound word and transferred to the replacement management unit 123. In that case, the English entry "bank clerk" for the Japanese entry "bank employee (noun)" shown in FIG.
(Noun) is divided into “bank” and “clerk” and replaced
It is supplied to the management unit 123 (step S1 in FIG. 14).
0).

【0116】また、第2自然言語解析部122の解析方
法としては、他に例えば、複合語の場合、部分集合へと
分割して置換管理部123へ渡すことが考えられる。そ
の場合、図2に示す日本語エントリ「千秋楽(名詞)」
に対する英語エントリ”lastperformance of the seaso
n(名詞)”では、”last performance of the”,”la
st performance of”,”last performance”,”las
t”,”performance of the season”,”parformance
of the”,”performance of”,”performance”,”o
f the season”,”of the”,”of”,”the seaso
n”,”the”,”season”へと分割され、置換管理部1
23へ供給される(図14のステップS10)。
As another analysis method of the second natural language analysis unit 122, for example, in the case of a compound word, it is considered that the compound word is divided into subsets and passed to the replacement management unit 123. In that case, the Japanese entry "Chiakiraku (noun)" shown in Fig. 2
English entry for “lastperformance of the seaso
n (noun) ”means“ last performance of the ”,“ la
st performance of ”,” last performance ”,” las
t ”,” performance of the season ”,” parformance
of the "," performance of "," performance "," o
f the season "," of the "," of "," the seaso
n "," the "," season "
23 (step S10 in FIG. 14).

【0117】また、第2自然言語解析部122は、本発
明の一実施形態である図1においては、第2自然言語の
辞書を格納する第2自然言語辞書格納部17を参照して
第2自然言語エントリを解析することができる第2自然
言語辞書利用解析機能を有する。
Further, in FIG. 1 which is an embodiment of the present invention, the second natural language analyzing section 122 refers to the second natural language dictionary storing section 17 for storing the dictionary of the second natural language. It has a second natural language dictionary utilization analysis function that can analyze natural language entries.

【0118】第2自然言語辞書格納部17に格納されて
いる第2自然言語辞書には、少なくとも第2自然言語エ
ントリの原形と品詞と活用情報が格納されている。図9
は第2自然言語辞書格納部17に格納されている英語辞
書エントリの例であり、英語の原形と品詞とその変化形
の情報が示されている。
The second natural language dictionary stored in the second natural language dictionary storage unit 17 stores at least the original form, part of speech, and utilization information of the second natural language entry. FIG.
Is an example of an English dictionary entry stored in the second natural language dictionary storage unit 17, which shows information on the English original form, the part of speech, and its variations.

【0119】図9を用いて、第2自然言語解析部122
の上述した第2自然言語辞書利用解析機能を具体的に説
明する。図2に示す日本語エントリ「四季(名詞)」に
対する英語エントリ”four seasons(名詞)”が供給さ
れた場合、第2自然言語解析部122は、供給された英
語エントリを単語単位に分割し、図9に示した第2自然
言語辞書格納部17から”four”は形容詞で不変化であ
り、”seasons”は”season(名詞)”の複数形である
という情報を得て、置換管理部123へ供給する(図1
4のステップS10)。
Referring to FIG. 9, second natural language analyzing unit 122
The above-described second natural language dictionary use analysis function will be specifically described. When the English entry “four seasons (noun)” for the Japanese entry “four seasons (noun)” shown in FIG. 2 is supplied, the second natural language analysis unit 122 divides the supplied English entry into word units, From the second natural language dictionary storage unit 17 shown in FIG. 9, information that “four” is an adjective and is invariable, and “seasons” is a plural form of “season (noun)” is obtained. (Figure 1
4 Step S10).

【0120】次に、置換管理部123の説明を行う。図
1では置換実行部1233の説明で既に述べたように、
第2自然言語エントリの第2自然言語エントリが第2自
然言語解析部122を通らずに置換管理部123にその
まま供給された場合、該第2自然言語エントリは置換実
行部1233に供給され、置換実行部1233は第2自
然言語対第3自然言語辞書格納部19に格納された第2
自然言語対第3自然言語辞書を検索し、前記第2自然言
語エントリに対応する第3自然言語エントリを獲得し、
第1自然言語対第2自然言語辞書エントリの第2自然言
語エントリを第3自然言語エントリへと置き換え、その
第1自然言語エントリと第3自然言語エントリの組を訳
語選択情報付与部124に供給する。
Next, the replacement management unit 123 will be described. In FIG. 1, as already described in the description of the replacement execution unit 1233,
When the second natural language entry of the second natural language entry is supplied to the replacement management unit 123 without passing through the second natural language analysis unit 122, the second natural language entry is supplied to the replacement execution unit 1233 and replaced. The execution unit 1233 stores the second natural language versus the third natural language dictionary stored in the third natural language dictionary storage unit 19.
Searching a natural language to third natural language dictionary to obtain a third natural language entry corresponding to said second natural language entry;
The second natural language entry of the first natural language pair to the second natural language dictionary entry is replaced with a third natural language entry, and the set of the first natural language entry and the third natural language entry is supplied to the translation word selection information providing unit 124 I do.

【0121】また、置換管理部123に第2自然言語エ
ントリの解析結果が供給された場合には、その解析結果
は置換ルール検索部1231に供給される。置換ルール
検索部1231は供給された第2自然言語エントリの解
析結果をキーとして置換ルール格納部16を検索し、該
第2自然言語エントリの解析結果から第3自然言語エン
トリを得るための置換ルールを1つ以上獲得しようとす
る。置換ルールが獲得できた場合、第2自然言語エント
リの解析結果と置換ルールは置換実行部1233へと供
給され、置換実行部1233において第1自然言語対第
2自然言語辞書エントリの第2自然言語エントリは第3
自然言語エントリへと置き換え、該第1自然言語エント
リと第3自然言語エントリの組を訳語選択情報付与部1
24に供給する。
When the analysis result of the second natural language entry is supplied to the replacement management unit 123, the analysis result is supplied to the replacement rule search unit 1231. The replacement rule search unit 1231 searches the replacement rule storage unit 16 using the supplied analysis result of the second natural language entry as a key, and obtains a replacement rule for obtaining a third natural language entry from the analysis result of the second natural language entry. Try to get one or more. When the replacement rule is obtained, the analysis result of the second natural language entry and the replacement rule are supplied to the replacement execution unit 1233, and the replacement execution unit 1233 checks the second natural language of the first natural language versus the second natural language dictionary entry. The entry is third
The first natural language entry and the third natural language entry are replaced with a natural language entry, and the translation word selection information providing unit 1
24.

【0122】また、置換ルール作成部1232では、置
換ルール検索部1231で複数の置換ルールを獲得し、
それらの置換ルールを組み合わせて利用した場合、該置
換ルールの組み合わせの出現回数を数えておき、該置換
ルールの組み合わせ(組み合わせ置換ルール)が一定回
数以上出現した場合、置換ルール格納部16に格納す
る。
Further, in the replacement rule creating section 1232, a plurality of replacement rules are obtained by the replacement rule searching section 1231,
When these replacement rules are used in combination, the number of appearances of the combination of the replacement rules is counted, and when the combination of the replacement rules (combination replacement rule) appears more than a certain number of times, it is stored in the replacement rule storage unit 16. .

【0123】置換ルール格納部16に格納されている置
換ルールは、予め人手で作成するか、あるいは決定木な
どを用いた機械学習(例えば、”Programs for Machine
Learning”,Morgan Kaufman,1992)によって作成する
か、あるいは機械学習によって作成したものを人手で修
正して格納しておく。また、前述のように、置換ルール
検索部1231で同一の組み合わせ置換ルールが一定回
数以上出現した場合は、該組み合わせ置換ルールも置換
ルール格納部16に格納する。該組み合わせ置換ルール
に対しては、人手でチェックを入れることも考えられ
る。
The replacement rules stored in the replacement rule storage section 16 are manually created in advance, or machine learning using a decision tree or the like (for example, “Programs for Machine”).
Learning ”, Morgan Kaufman, 1992), or manually modified and stored by machine learning. As described above, the same combination replacement rule is replaced by the replacement rule search unit 1231. When the combination replacement rule appears more than a certain number of times, the combination replacement rule is also stored in the replacement rule storage unit 16. The combination replacement rule may be manually checked.

【0124】図8(b)と図10と図6(b)を用い
て、置換管理部123の機能について具体的な説明を行
う。置換管理部123に「千秋楽(名詞)」に対する英
語エントリ”last performance of the season(名
詞)”が供給されているとする。図8(b)は第2自然
言語解析部122から供給された解析結果であり、図1
0は置換ルール格納部16に格納されている置換ルール
の例であり、図6(b)は第2自然言語対第3自然言語
辞書格納部19に格納されている英仏辞書の辞書エント
リの例である。
The function of the replacement management unit 123 will be specifically described with reference to FIGS. 8B, 10 and 6B. It is assumed that the English entry “last performance of the season (noun)” for “Chiaki (noun)” is supplied to the replacement management unit 123. FIG. 8B shows an analysis result supplied from the second natural language analysis unit 122, and FIG.
0 is an example of a replacement rule stored in the replacement rule storage unit 16, and FIG. 6B shows a dictionary entry of the English-French dictionary stored in the second natural language versus third natural language dictionary storage unit 19. It is an example.

【0125】置換ルール検索部1231では、例えば、
最も長い単位で検索できる置換ルールを優先して用いる
方法が考えられる。この場合、図8(b)に示す”last
performance of the season”の構文解析の結果から、
まず”last(形容詞)performance(名詞)of(前置
詞)the(定冠詞)season(名詞)”の置換ルールを検
索するが、図10に示すように置換ルール格納部16に
は格納されていないため、次に長い単位である、”of
(前置詞)the(定冠詞)season(名詞)”の置換ルー
ルを検索する。これに対しては、ルール番号5,6の置
換ルールの条件1が合致する。条件2を確認するため、
図6(b)に示す第2自然言語対第3自然言語辞書格納
部19から”season(名詞)”を検索し、英語エント
リ”season(名詞)”に対応する仏語エントリ”saison
(女性名詞)”を獲得する。該仏語エントリの品詞は
「女性名詞」なので、置換ルール6が合致する。そこ
で”of(前置詞)the(定冠詞)season(名詞)”は”d
e la saison(仏語前置詞句)”と置き換えられる。
In the replacement rule search unit 1231, for example,
A method of preferentially using a replacement rule that can be searched in the longest unit can be considered. In this case, “last” shown in FIG.
performance of the season ”
First, a replacement rule of “last (adjective) performance (noun) of (preposition) the (definite article) season (noun)” is searched. However, since the replacement rule is not stored in the replacement rule storage unit 16 as shown in FIG. The next longest unit is "of
(Preposition) the (definite article) season (noun) "is searched. In response to this, condition 1 of the replacement rules of rule numbers 5 and 6 is matched.
“Season (noun)” is searched from the second natural language-third natural language dictionary storage unit 19 shown in FIG. 6B, and the French entry “saison” corresponding to the English entry “season (noun)” is retrieved.
(Female noun) ". Since the part of speech of the French entry is" female noun ", the replacement rule 6 matches. So "of (preposition) the (definite article) season (noun)" is "d
e la saison (French prepositional phrase) ".

【0126】次に、同様に残りの”last(形容詞)perf
ormance(名詞)”の置換ルールを検索する。これに対
しては、ルール番号1,2の置換ルールの条件1が合致
し、図6(b)に示す第2自然言語対第3自然言語辞書
格納部19から”performance(名詞)”に対応する仏
語エントリとしては、”repre′sentation(女性名
詞)”および”spectacle(男性名詞)”を獲得する。
そこで”last(形容詞)performance(名詞)”は、”d
ernie′re repre′sentation(仏語名詞句)”あるいは
”dernie′r spectacle(仏語名詞句)”と置き換えら
れる。
Next, similarly, the remaining "last (adjective) perf
ormance (noun) ". In response to this, condition 1 of the replacement rule of rule numbers 1 and 2 is met, and the second natural language versus third natural language dictionary shown in FIG. As the French entry corresponding to “performance (noun)” from the storage unit 19, “repre'sentation (female noun)” and “spectacle (male noun)” are acquired.
So “last (adjective) performance (noun)” is “d
ernie're repre'sentation (French noun phrase) "or"dernie'r spectacle (French noun phrase) ".

【0127】以上の置換で獲得した”de la saison(仏
語前置詞句)”と、”dernie′re repre′sentation
(仏語名詞句)”あるいは”dernie′r spectacle(仏
語名詞句) ”に対して置換ルールを検索し、ルール番
号7の置換ルールを用いて”dernie′re repre′sentat
ion de la saison(名詞句)”あるいは、”dernie′r
spectacle de la saison(名詞句)”を得ることができ
る(図14のステップS12(Y es))。
"De la saison (French preposition phrase)" obtained by the above substitution and "dernie're repre'sentation"
(French noun phrase) "or"dernie'r spectacle (French noun phrase) "is searched for a replacement rule, and"dernie'rerepre'sentat"
ion de la saison (noun phrase) ”or“ dernie'r
spectacle de la saison (noun phrase) "can be obtained (step S12 (Yes) in FIG. 14).

【0128】以上から、日本語エントリ「千秋楽(名
詞)」に対する仏語エントリとして”dernie′re repr
e′sentatione de la saison(名詞句)”あるいは、”d
ernie′r spectacle de la saison(名詞句)”を得る
ことができる。
As described above, as a French entry for the Japanese entry "Chiakiraku (noun)", "dernie're repr
e'sentatione de la saison (noun phrase) "or" d
ernie'r spectacle de la saison (noun phrase) ".

【0129】ただし、第2自然言語対第3自然言語辞書
格納部19が複数の辞書を格納している場合には、”pe
rformance(名詞)”に対応する仏語エントリとして、
例えば”repre′sentation(女性名詞)”はどの辞書で
も記載されているが、”spectacle(男性名詞)”は一
部の辞書にしか記載されていないから、”repre′senta
tion(女性名詞)”の方を優先、ひいては”dernie′re
repre′sentation dela saison”の方を優先するとい
う重みづけを行うことも考えられる。
However, if the second natural language-third natural language dictionary storage unit 19 stores a plurality of dictionaries, "pe
rformance (noun) "as a French entry
For example, "repre'sentation (female noun)" is described in any dictionary, but "spectacle (male noun)" is described only in some dictionaries.
Option (female noun) ”, and eventually“ dernie're ”
It is also conceivable to give weight to give priority to "repre'sentation dela saison".

【0130】また、前記”last performance of the se
ason”に対する置き換えでは、図10に示す置換ルール
のうち、ルール番号6およびルール番号1あるいは2、
およびルール番号7を組み合わせて利用しているため、
図11に示す組み合わせ置換ルールを作成できる。この
組み合わせ置換ルールが、例えば予め決めておくなどし
た回数以上に出現すれば(図14のステップS14(Y
es))、置換ルール格納部16に格納される(図14
のステップS15)。
Also, the "last performance of the se"
ason ", among the replacement rules shown in FIG. 10, rule number 6 and rule number 1 or 2,
And rule number 7 in combination,
The combination replacement rule shown in FIG. 11 can be created. If this combination replacement rule appears more than a predetermined number of times, for example (step S14 (Y
es)), and stored in the replacement rule storage unit 16 (FIG. 14).
Step S15).

【0131】また、経済関係の辞書を作成していると想
定した場合、図8(c)に示す”bank clerk”の形態素
解析結果が置換管理部123に供給されたとすると、”
lastperformance of the season”の場合と同様に置き
換えることができる(図10に示すルール番号8および
9の置換ルールを利用)。その結果、日本語エントリ
「銀行員(名詞)」に対する仏語エントリとして、”em
ploye′ de banque”および”employe′e de banque”
および”greffier de banque”と、”employe′de riv
e”および”employe′e de rive”および”greffier de
rive”を得ることができる。
If it is assumed that an economic dictionary has been created, the morphological analysis result of “bank clerk” shown in FIG.
In the same manner as in the case of “last performance of the season” (using the replacement rules of rule numbers 8 and 9 shown in FIG. 10). As a result, as a French entry for the Japanese entry “bank employee (noun)”, “ em
ploye ′ de banque ”and“ employe′e de banque ”
And “greffier de banque” and “employe′de riv
e ”and“ employe′e de rive ”and“ greffier de
rive ”can be obtained.

【0132】また、置換管理部123は、供給された第
2自然言語エントリの解析結果をキーとして、第2自然
言語対第3自然言語辞書格納部19を検索し、更に第3
自然言語辞書格納部18を検索し、第2自然言語エント
リを第3自然言語エントリで置き換える第3自然言語辞
書検索置換機能を有する。
The replacement management unit 123 searches the second natural language-third natural language dictionary storage unit 19 using the analysis result of the supplied second natural language entry as a key, and further searches the third natural language dictionary storage unit 19 for the third natural language entry.
It has a third natural language dictionary search and replace function that searches the natural language dictionary storage unit 18 and replaces the second natural language entry with the third natural language entry.

【0133】第3自然言語辞書格納部18に格納されて
いる第3自然言語辞書には、少なくとも第3自然言語エ
ントリの原形と品詞と活用情報が格納されている。図1
2は第3自然言語辞書格納部18に格納されている仏語
辞書エントリの例であり、仏語の原形と品詞と変化形の
情報が格納されている。
The third natural language dictionary stored in the third natural language dictionary storage section 18 stores at least the original form, part of speech, and utilization information of the third natural language entry. FIG.
Reference numeral 2 denotes an example of a French dictionary entry stored in the third natural language dictionary storage unit 18, in which information on the original French form, part of speech, and variation is stored.

【0134】図12を用いて、前記機能を有する置換管
理部123について具体的に説明する。図2に示す日本
語エントリ「四季(名詞)」に対する英語エントリ”fo
ur seasons(名詞)”に対する解析結果が置換管理部1
23に供給された場合を考える。解析結果としては、前
記第2自然言語辞書利用解析機能を有する第2自然言語
解析部122の説明で述べたように、”four seasons
(名詞)”を”four(形容詞)”と”seasons(名
詞)”に分割し、図9に示した第2自然言語辞書格納部
17から”four”は形容詞で不変化であり、”season
s”は”season(名詞)”の複数形であるという情報が
供給されているとする(図14のステップS10)。
With reference to FIG. 12, the replacement management section 123 having the above-described functions will be specifically described. The English entry “fo” for the Japanese entry “four seasons (noun)” shown in FIG.
ur seasons (noun) ”is the analysis result
Consider the case where the data is supplied to the H.23. As described in the description of the second natural language analysis unit 122 having the second natural language dictionary use analysis function, the analysis result is “four seasons
(Noun) ”is divided into“ four (adjective) ”and“ seasons (noun) ”, and“ four ”is an adjective unchanged from the second natural language dictionary storage unit 17 shown in FIG.
It is assumed that information that "s" is a plural form of "season (noun)" is supplied (step S10 in FIG. 14).

【0135】まず、図6(b)に示す第2自然言語対第
3自然言語辞書格納部19を検索し、英語エントリ”fo
ur(形容詞)”と”season(名詞)”に対する仏語エン
トリ”quatre(形容詞)”と”saison(女性名詞)”を
獲得する。ここで、”season(名詞)”はもともと”se
asons”と複数形だったので、”saison(女性名詞)”
の複数形を図12から検索し、”saisons”を得”quatr
e saisons”と置き換えられる。
First, the second natural language-third natural language dictionary storage unit 19 shown in FIG. 6B is searched, and the English entry “fo” is searched.
Obtain the French entries “quatre (adjective)” and “saison (female noun)” for “ur (adjective)” and “season (noun)”, where “season (noun)” is originally “se
"saison" (female noun)
Search for plurals in FIG. 12 and get “saisons”
e saisons ”.

【0136】ただし、上記の例では、前記第3自然言語
辞書検索置換機能を有する置換管理部123は、第2自
然言語解析部122が第2自然言語辞書格納部17に格
納されている第2自然言語辞書を利用して行った第2自
然言語エントリの解析結果を用いて置き換えを行った
が、この置換管理部123に供給される第2自然言語エ
ントリの解析結果は、必ずしも第2自然言語辞書格納部
17を利用した解析結果である必要はなく、例えば形態
素解析を行った結果など、第2自然言語解析部122の
他の解析方法による解析結果でもよい。
However, in the above example, the replacement management section 123 having the third natural language dictionary search / replacement function includes the second natural language analysis section 122 in which the second natural language dictionary storage section 17 stores the second natural language dictionary storage section 17. Although the replacement is performed using the analysis result of the second natural language entry performed using the natural language dictionary, the analysis result of the second natural language entry supplied to the replacement management unit 123 is not necessarily the second natural language entry. The analysis result need not be the analysis result using the dictionary storage unit 17, but may be an analysis result by another analysis method of the second natural language analysis unit 122, such as a result of morphological analysis.

【0137】その他に、第2自然言語エントリの見出し
のみをキーとして用い、第2自然言語対第3自然言語辞
書格納部19を検索し、字面だけでも一致する第3自然
言語エントリを取り出す方法など、第2自然言語解析部
122での解析方法に応じて、置換方法は様々に考えら
れる。
In addition, using only the heading of the second natural language entry as a key, searching the second natural language / third natural language dictionary storage unit 19, and extracting the third natural language entry that matches only with the face, etc. Depending on the analysis method in the second natural language analysis unit 122, various replacement methods can be considered.

【0138】このように第1自然言語対第2自然言語辞
書エントリの第2自然言語エントリを第3自然言語エン
トリで置き換えることができた場合、該第1自然言語エ
ントリと第3自然言語エントリの組を訳語選択情報付与
部124に供給する。
When the second natural language entry of the first natural language to second natural language dictionary entry can be replaced with the third natural language entry, the first natural language entry and the third natural language entry are replaced. The set is supplied to the translated word selection information providing unit 124.

【0139】ただし、置換実行部1233において第1
自然言語対第2自然言語辞書エントリの第2自然言語エ
ントリを第3自然言語エントリに置き換えできなかった
場合でも、該第2自然言語エントリに対してまだ行って
いない解析方法が第2自然言語解析部122に残ってい
る場合、第2自然言語解析部122に該第2自然言語エ
ントリを戻して、再び同様の処理を行う(図14のステ
ップS9(Yes))。
It should be noted that the replacement execution unit 1233
Even if the second natural language entry of the natural language versus second natural language dictionary entry could not be replaced with the third natural language entry, the analysis method that has not been performed on the second natural language entry is the second natural language analysis. If it remains in the unit 122, the second natural language entry is returned to the second natural language analysis unit 122, and the same processing is performed again (step S9 (Yes) in FIG. 14).

【0140】次に、訳語選択情報付与部124について
追加説明をする。前述したように、訳語選択情報付与部
124では、供給された第3自然言語エントリをキーと
し、第3自然言語コーパス情報格納部20を検索し、格
納されている第3自然言語コーパスの統計情報を用い
て、獲得された第3自然言語エントリの尤もらしさを判
断し、あるいは複数の第3自然言語エントリが供給され
た場合に訳語選択のための重みづけを行い、獲得した第
1自然言語エントリと第3自然言語エントリの組を第1
自然言語対第3自然言語辞書格納部13へと格納する。
Next, the translated word selection information providing unit 124 will be additionally described. As described above, the translation word selection information providing unit 124 searches the third natural language corpus information storage unit 20 using the supplied third natural language entry as a key, and stores the stored statistical information of the third natural language corpus. Is used to determine the likelihood of the acquired third natural language entry, or when a plurality of third natural language entries are supplied, weighting is performed for selecting a translated word. And the first set of third natural language entries
It is stored in the natural language versus third natural language dictionary storage unit 13.

【0141】前述したように、図2に示す日本語エント
リ「銀行(名詞)」の例では、該日本語エントリに対応
する英語エントリ”bank(名詞)”から獲得した仏語エ
ントリを、第3自然言語コーパス情報格納部20に格納
された図7(a)に示すような仏語コーパス中の出現頻
度を用いて重みづけする場合を説明した。
As described above, in the example of the Japanese entry “bank (noun)” shown in FIG. 2, the French entry obtained from the English entry “bank (noun)” corresponding to the Japanese entry is stored in the third natural language. The case where weighting is performed using the appearance frequency in the French corpus as shown in FIG. 7A stored in the language corpus information storage unit 20 has been described.

【0142】ここでは第3自然言語コーパスの統計情報
として図7(b)に示すような第3自然言語コーパス中
の共起頻度を用いる例を説明する。例えば、経済関係の
辞書を作成したい場合を想定すると、第3自然言語コー
パス情報格納部20には経済関係の第3自然言語コーパ
スから獲得した統計情報を格納しておく。図7(b)は
経済関係の仏語コーパスから獲得された共起頻度の例で
あり、少なくとも仏語1およびその品詞1と、仏語2お
よびその品詞2と、それらの共起頻度が格納されてい
る。
Here, an example in which the co-occurrence frequency in the third natural language corpus as shown in FIG. 7B is used as the statistical information of the third natural language corpus will be described. For example, assuming that it is desired to create an economic dictionary, the third natural language corpus information storage unit 20 stores the statistical information obtained from the third economic natural language corpus. FIG. 7B shows an example of the co-occurrence frequency acquired from the French corpus of economic relations, in which at least French 1 and its part of speech 1, French 2 and its part of speech 2, and their co-occurrence frequencies are stored. .

【0143】図7(b)を用いて、訳語選択情報付与部
124の機能を具体的に説明する。経済関係の辞書を作
成したい場合を想定する。ここで、訳語選択情報付与部
124に「銀行員(名詞)」に対する仏語エントリとし
て”employe′ de banque”および”employe′e de ban
que”および”greffier de banque”と、”employe′ d
e rive”および”employe′e de rive”および”greffi
er de rive”が供給されたとする。第3自然言語コーパ
ス情報格納部20を検索すると図7(b)に示すよう
に、経済関係の仏語コーパスでは、”employe′(男性
名詞)”と”banque(女性名詞)”、および”employ
e′e(女性名詞)”と”hanque(女性名詞)”は共 起
するが、それ以外は共起しない。よって、供給された仏
語エントリの中でも”employe′ de banque”および”e
mploye′e de banque”が有望であると判断でき る(図
14のステップS7)。
With reference to FIG. 7B, the function of the translated word selection information providing unit 124 will be specifically described. Suppose you want to create an economic dictionary. Here, "employe 'de banque" and "employe'e de banque" and "employe'e de banque"
que ”and“ greffier de banque ”and“ employe ′ d
e rive ”and“ employe′e de rive ”and“ greffi
When the third natural language corpus information storage unit 20 is searched, as shown in FIG. 7B, "employe '(male noun)" and "banque" (Female noun) "and" employ
e′e (female noun) ”and“ hanque ”(feminine noun) co-occur, but otherwise do not, so the“ employe ′ de banque ”and“ e ”in the supplied French entries
mploye'e de banque "is promising (step S7 in FIG. 14).

【0144】また、”rive(女性名詞)”に関しては、
前記「銀行(名詞)」の例で説明したように、図7
(a)からも”banque(女性名詞)”を用いた仏語エン
トリの方が有望であることもわかる(図14のステップ
S7)。
As for “rive (female noun)”,
As described in the example of the "bank (noun)", FIG.
FIG. 14A also shows that a French entry using "banque (female noun)" is more promising (step S7 in FIG. 14).

【0145】「千秋楽(名詞)」の例に対しても同様に
重みづけを行う。ただし、この場合利用する仏語コーパ
スは経済関係に限定しない。「四季(名詞)」の例に関
しては獲得された仏語エントリは1つであるが、獲得さ
れた仏語エントリの尤もらしさの検証のため、同様に仏
語コーパスを参照して重みづけを行うことも考えられる
(図14のステップS7)。
The weighting is similarly applied to the example of “Chiakiraku (noun)”. However, the French corpus used in this case is not limited to economic relations. In the case of the “four seasons (noun)” example, only one French entry has been acquired, but in order to verify the likelihood of the acquired French entry, weighting may be performed with reference to a French corpus. (Step S7 in FIG. 14).

【0146】これらの結果は、第1自然言語対第3自然
言語辞書格納部13へ格納される。
These results are stored in the first natural language versus third natural language dictionary storage unit 13.

【0147】最後に、第1自然言語対第3自然言語辞書
格納部13について説明する。第1自然言語対第3自然
言語辞書格納部13には、少なくとも第1自然言語の見
出しおよびその品詞と、該第1自然言語エントリに対応
する第3自然言語の対訳表現およびその品詞と、必要で
あれば第3自然言語の訳語選択情報も格納することがで
きる。
Finally, the first natural language-third natural language dictionary storage unit 13 will be described. The first natural language-third natural language dictionary storage unit 13 stores at least a heading of the first natural language and its part of speech, a bilingual expression of the third natural language corresponding to the first natural language entry and its part of speech, and If so, the translation word selection information of the third natural language can also be stored.

【0148】図13(a)および(b)は、第1自然言
語対第3自然言語辞書格納部13に格納される第1自然
言語対第3自然言語辞書エントリの例である。図13
(a)は、第1自然言語の日本語見出しとその品詞と、
第3自然言語である仏語の該日本語エントリに対する対
訳表現とその品詞が格納されている例である。図13
(a)では、有望な仏語エントリに絞って第1自然言語
対第3自然言語辞書格納部13へと格納されている(図
14のステップS8)。図13(b)は、訳語選択のた
めの重みづけの情報をつけて、有望でない仏語エントリ
も格納されている例である。ただし、有望な仏語エント
リだけを残す場合、あるいは有望でない仏語エントリも
残す場合でも、一定の閾値を予め決めておくなどし、訳
語選択のための重みが閾値以下の仏語エントリは切り捨
てるなどの方法も考えられる。図13(b)でも、日本
語エントリ「銀行員(名詞)」に対する仏語エントリと
して獲得された”greffier de banque”および”emplo
y′e de rive”および”employe′e de rive”および”
greffier de rive”は重みが閾値以下であったとして切
り 捨てられている。なお、作成した第1自然言語対第
3自然言語辞書に対しては人手でチェックを入れること
も考えられる。
FIGS. 13A and 13B are examples of the first natural language-third natural language dictionary entries stored in the first natural language-third natural language dictionary storage unit 13. FIG. FIG.
(A) shows a Japanese headline of the first natural language and its part of speech,
This is an example in which a bilingual expression for the Japanese entry in French, which is a third natural language, and its part of speech are stored. FIG.
In (a), only promising French entries are stored in the first natural language versus third natural language dictionary storage unit 13 (step S8 in FIG. 14). FIG. 13B shows an example in which weight information for selecting a translated word is added, and unpromising French entries are also stored. However, even when leaving only promising French entries or leaving non-promising French entries, a certain threshold may be determined in advance, and French entries whose weight for selecting a translation is less than the threshold may be discarded. Conceivable. Also in FIG. 13B, “greffier de banque” and “emplo” acquired as French entries for the Japanese entry “bank employee (noun)”
y′e de rive ”and“ employe′e de rive ”and“
"greffier de rive" is discarded because the weight is less than or equal to the threshold. The created first natural language-third natural language dictionary may be manually checked.

【0149】上述した処理を第1自然言語対第2自然言
語辞書格納部10に格納されている辞書エントリがなく
なるまで実施し、該エントリがなくなると、処理を終了
する(ステップS1)。
The above-described processing is performed until there is no more dictionary entry stored in the first natural language-to-second natural language dictionary storage unit 10, and when there are no more entries, the processing is terminated (step S1).

【0150】なお、上記実施形態の辞書作成方法の処理
手順をプログラムとして記録媒体に記録して、この記録
媒体をコンピュータシステムに組み込むとともに、該記
録媒体に記録されたプログラムをコンピュータシステム
にダウンロードまたはインストールし、該プログラムで
コンピュータシステムを作動させることにより、辞書作
成方法を実施する辞書作成装置として機能させることが
できることは勿論であり、このような記録媒体を用いる
ことにより、その流通性を高めることができるものであ
る。
The processing procedure of the dictionary creation method of the above embodiment is recorded as a program on a recording medium, and this recording medium is incorporated in a computer system, and the program recorded on the recording medium is downloaded or installed in the computer system. By operating the computer system with the program, it is of course possible to function as a dictionary creation device that implements the dictionary creation method, and by using such a recording medium, it is possible to enhance its distribution. You can do it.

【0151】[0151]

【発明の効果】以上説明したように、本発明によれば、
第1自然言語対第2自然言語辞書格納部から第1自然言
語対第2自然言語辞書エントリを取り出し、この取り出
した第1自然言語対第2自然言語辞書エントリの第2自
然言語エントリに対応する第3自然言語エントリを第2
自然言語対第3自然言語辞書格納部から獲得し、この第
3自然言語エントリで第1自然言語対第2自然言語辞書
エントリの第2自然言語エントリを置き換えて第1自然
言語の見出しおよびその品詞と、該第1自然言語エント
リの対訳である第3自然言語の対訳およびその品詞とを
有する第1自然言語対第3自然言語の対訳辞書を作成し
て第1自然言語対第3自然言語辞書格納部に格納するの
で、第1自然言語対第2自然言語辞書および第2自然言
語対第3自然言語辞書を利用して、第1自然言語対第3
自然言語の組み合わせの辞書や対訳コーパスが無くて
も、第1自然言語対第3自然言語辞書を作成することが
できる。
As described above, according to the present invention,
The first natural language / second natural language dictionary entry is fetched from the first natural language / second natural language dictionary storage unit, and corresponds to the second natural language entry of the fetched first natural language / second natural language dictionary entry. Third natural language entry to second
The first natural language entry obtained from the natural language-third natural language dictionary storage unit, and the third natural language entry replaces the second natural language entry of the first natural language-second natural language dictionary entry. And a first natural language-third natural language bilingual dictionary having a third natural language bilingual translation and its part of speech, which is a bilingual translation of the first natural language entry, to produce a first natural language-third natural language dictionary Since the first natural language and the third natural language dictionary are stored in the storage unit, the first natural language and the third natural language dictionary are used to store the first natural language and the third natural language.
Even without a dictionary of a combination of natural languages or a bilingual corpus, a first natural language-third natural language dictionary can be created.

【0152】また、本発明によれば、辞書エントリ読み
込み部から供給された第1自然言語対第2自然言語辞書
エントリの第1自然言語エントリをキーとして第1自然
言語コーパス情報格納部を参照し、不必要な第1自然言
語対第2自然言語エントリを取り除くので、例えば分野
限定の辞書を作成する場合などには、不必要な辞書エン
トリを作成しないことになり、結果的に第1自然言語対
第3自然言語辞書の作成と利用において高速化および効
率化を図ることができる。また、分野限定の辞書を作成
する場合、利用する第1自然言語対第2自然言語辞書や
第2自然言語対第3自然言語辞書もその分野の辞書を用
いることができれば、更に信頼性の高い分野限定の第1
自然言語対第3自然言語辞書を作成することができる。
Further, according to the present invention, the first natural language corpus information storage is referred to by using the first natural language entry of the first natural language vs. second natural language dictionary entry supplied from the dictionary entry reading unit as a key. Since unnecessary first natural language versus second natural language entries are removed, unnecessary dictionary entries are not created when, for example, a dictionary limited to a field is created, and as a result, the first natural language is not created. The speed and efficiency of creation and use of the third natural language dictionary can be improved. In the case of creating a dictionary limited to a field, if the first natural language-to-second natural language dictionary and the second natural language-to-third natural language dictionary to be used can use the dictionary of the field, the reliability is higher. Field-limited first
A natural language versus third natural language dictionary can be created.

【0153】更に、本発明によれば、辞書エントリ読み
込みステップから供給された第1自然言語対第2自然言
語辞書エントリの第2自然言語エントリをキーとして第
2自然言語コーパス情報格納部を参照し、重みづけ情報
である訳語選択情報を付与するので、第1自然言語から
第2自然言語への訳語候補が複数ある場合でも、例えば
専門用語や分野特有の語としては、どの訳語がより適切
であるかがわかり、また複数の訳語候補の中でも、より
よく出現する訳語候補はどれであるかの優先順位をつけ
ることができる。更に、訳語候補が1つである場合で
も、該訳語候補の尤もらしさを判断でき、結果的に、よ
り信頼性の高い第1自然言語対第3自然言語辞書を作成
できる。また、第2自然言語の段階で訳語選択のための
情報を付与するので、第1自然言語および第2自然言語
を変えずに第3自然言語のみを変えるときにも同じ情報
を利用することができ、結果として第3自然言語を様々
な言語へと拡張するとき、第1自然言語対第3自然言語
辞書を効率的に作成することができる。
Further, according to the present invention, the second natural language corpus information storage unit is referred to by using the second natural language entry of the first natural language versus second natural language dictionary entry supplied from the dictionary entry reading step as a key. Since the translated word selection information, which is the weighting information, is added, even when there are a plurality of translated word candidates from the first natural language to the second natural language, for example, as a technical term or a field-specific word, which translated word is more appropriate. It is possible to know which word candidate exists, and to assign a priority to which of the plurality of candidate word candidates appears more frequently. Furthermore, even when there is one translation word candidate, the likelihood of the translation word candidate can be determined, and as a result, a more reliable first natural language versus third natural language dictionary can be created. Also, since information for selecting a translated word is added at the stage of the second natural language, the same information can be used when only the third natural language is changed without changing the first natural language and the second natural language. When the third natural language is extended to various languages as a result, the first natural language-third natural language dictionary can be efficiently created.

【0154】本発明によれば、第1自然言語対第2自然
言語辞書エントリの第2自然言語エントリを第3自然言
語エントリで置き換えることができなかった場合、該第
2自然言語エントリを解析し、この解析結果に基づき第
3自然言語エントリを獲得し、この獲得した第3自然言
語エントリで第2自然言語エントリを置き換えるので、
例えば第2自然言語エントリが複合語で、そのままの表
記では第2自然言語対第3自然言語辞書に登録されてい
ない場合でも、第2自然言語エントリに対して複合語を
構成する部分表現単位に分割するなどの解析を行い、各
部分表現が第2自然言語対第3自然言語辞書に登録され
ていれば、第1自然言語対第2自然言語辞書エントリの
第2自然言語エントリを第3自然言語エントリで置き換
えることができ、結果的にそのままの表記では置き換え
の困難な複合語などに対する第3自然言語エントリも獲
得して第1自然言語対第3自然言語辞書を作成できる。
According to the present invention, if the second natural language entry of the first natural language to second natural language dictionary entry cannot be replaced with the third natural language entry, the second natural language entry is analyzed. Since the third natural language entry is obtained based on the analysis result and the second natural language entry is replaced with the obtained third natural language entry,
For example, even if the second natural language entry is a compound word and the notation is not registered in the second natural language-third natural language dictionary, the second natural language entry may be used as a sub-expression unit forming a compound word for the second natural language entry. Analysis such as division is performed, and if each sub-expression is registered in the second natural language dictionary to the third natural language dictionary, the second natural language entry of the first natural language versus the second natural language dictionary entry is changed to the third natural language entry. It can be replaced with a language entry, and consequently, a third natural language entry for a compound word or the like that is difficult to replace with the notation as it is can also be obtained to create a first natural language-third natural language dictionary.

【0155】また、本発明によれば、第2自然言語解析
部の解析結果に基づき置換ルール格納部を検索して、置
換ルールを取り出し、この取り出した置換ルールを利用
し、該置換ルールが複数の場合は該複数の置換ルールを
組み合わせて利用して、第2自然言語対第3自然言語辞
書格納部から第3自然言語エントリを獲得するので、例
えば第2自然言語エントリが複合語や変化形またはそれ
らの組み合わせ等でそのままの表記では第2自然言語対
第3自然言語辞書に登録されていない場合でも、第2自
然言語エントリの解析結果と該解析結果に適した置換ル
ールと第2自然言語対第3自然言語辞書を用いて、より
複雑な第2自然言語エントリに対してもより確実に第1
自然言語対第2自然言語辞書エントリの第2自然言語エ
ントリを第3自然言語エントリで置き換えることができ
る。また、置換ルールを複数組み合わせて用いることに
より、第2自然言語エントリの解析結果を一括して置き
換えることができる置換ルールが置換ルール格納部に格
納されていない場合でも、第1自然言語対第2自然言語
辞書エントリの第2自然言語エントリを第3自然言語エ
ントリで置き換えることができ、結果的にそのままの表
記では置き換えの難しい複合語など、より複雑な第2自
然言語エントリに対する第3自然言語エントリも的確に
獲得して、第1自然言語対第3自然言語辞書を作成でき
る。更に、置換ルールを組み合わせて利用できるため、
置換ルール格納部に可能性のある全置換ルールを保有し
ている必要がなく、第1自然言語対第3自然言語辞書を
効率的に作成することができる。
Further, according to the present invention, the replacement rule storage section is searched based on the analysis result of the second natural language analysis section, and the replacement rule is extracted. In the case of, the third natural language entry is acquired from the second natural language-third natural language dictionary storage unit by using the plurality of replacement rules in combination, so that, for example, the second natural language entry is a compound word or a variant form. Alternatively, even if the notation is not registered in the second natural language versus third natural language dictionary as it is in a combination thereof, the analysis result of the second natural language entry, the replacement rule suitable for the analysis result, and the second natural language Using the third natural language dictionary to ensure that the first even for more complex second natural language entries
The second natural language entry of the natural language to second natural language dictionary entry may be replaced with a third natural language entry. Further, by using a plurality of replacement rules in combination, even if a replacement rule that can replace the analysis result of the second natural language entry in a lump is not stored in the replacement rule storage unit, the first natural language versus the second natural language entry can be used. A third natural language entry for a more complex second natural language entry, such as a compound word that is difficult to replace in its native form, such as a compound word that can replace the second natural language entry of the natural language dictionary entry with a third natural language entry And the first natural language dictionary can be created. Furthermore, because you can use a combination of replacement rules,
There is no need to store all possible replacement rules in the replacement rule storage unit, and the first natural language-third natural language dictionary can be created efficiently.

【0156】更に、本発明によれば、複数の置換ルール
を組み合わせて利用した場合、この組み合わせた置換ル
ールの利用回数を計数、この利用回数が所定の回数以上
になった場合、この組み合わせた置換ルールを置換ルー
ル格納部に格納するので、利用頻度が高い組み合わせ置
換ルールを獲得して置換ルール格納部に格納しておくこ
とにより、第1自然言語対第2自然言語辞書エントリの
第2自然言語エントリを第3自然言語エントリで置き換
える時の高速化を図ることができ、第1自然言語対第3
自然言語辞書を効率的に作成することができる。
Further, according to the present invention, when a plurality of replacement rules are used in combination, the number of usages of the combined replacement rule is counted, and when the number of usages exceeds a predetermined number, the combined replacement rule is used. Since the rules are stored in the replacement rule storage unit, a combination replacement rule that is frequently used is acquired and stored in the replacement rule storage unit, so that the second natural language of the first natural language versus second natural language dictionary entry is obtained. It is possible to increase the speed of replacing the entry with the third natural language entry.
A natural language dictionary can be created efficiently.

【0157】本発明によれば、第2自然言語の原形、品
詞および活用情報を格納している第2自然言語辞書を有
し、第2自然言語解析部は第2自然言語辞書格納部を検
索して、第2自然言語エントリを解析するので、例えば
第2自然言語エントリに変化形が含まれ、そのままの表
記では第2自然言語対第3自然言語辞書に登録されてい
ない場合でも、第2自然言語辞書から該第2自然言語エ
ントリに含まれる変化形の原形を獲得でき、この原形が
第2自然言語対第3自然言語辞書に登録されている場
合、第1自然言語対第2自然言語辞書エントリの第2自
然言語エントリを第3自然言語エントリに置き換えるこ
とができ、結果としてそのままの表記では置き換えが難
しい変化形などの第2自然言語エントリに対する第3自
然言語エントリも獲得でき、第1自然言語対第3自然言
語辞書を的確に作成することができる。
According to the present invention, there is provided the second natural language dictionary storing the original form, part of speech, and utilization information of the second natural language, and the second natural language analysis unit searches the second natural language dictionary storage unit. Then, since the second natural language entry is analyzed, even if, for example, the second natural language entry includes a variant and is not registered in the second natural language-third natural language dictionary as it is, the second natural language entry is analyzed. The original form of the variant included in the second natural language entry can be obtained from the natural language dictionary, and if this original form is registered in the second natural language versus third natural language dictionary, the first natural language versus the second natural language The second natural language entry of the dictionary entry can be replaced with the third natural language entry, and as a result, the third natural language entry for the second natural language entry such as a variant that is difficult to replace with the literal notation is also obtained. Can, it is possible to create precisely the first natural language versus the third natural language dictionary.

【0158】また、本発明によれば、第3自然言語の原
形、品詞および活用情報を格納している第3自然言語辞
書を有し、第2自然言語解析部の解析結果または前記置
換ルール検索部で取り出した置換ルールに基づき第3自
然言語辞書格納部を検索して、第1自然言語対第2自然
言語辞書エントリの第2自然言語エントリを第3自然言
語エントリで置き換えるので、例えば第2自然言語エン
トリに変化形が含まれ、そのままの表記では第2自然言
語対第3自然言語辞書に登録されていない場合に、該第
2自然言語エントリに含まれる変化形を原形に直して、
対応する第3自然言語エントリを第2自然言語対第3自
然言語辞書から原形で獲得した場合、第3自然言語辞書
を検索して第3自然言語エントリの原形を適切な変化形
の表記へと変換でき、結果としてそのままの表記では置
き換えが難しい変化形などの第2自然言語エントリに対
応する第3自然言語エントリも的確な表現へと変換し
て、第1自然言語対第3自然言語辞書を的確に作成する
ことができる。
Further, according to the present invention, there is provided a third natural language dictionary storing the original form, part of speech, and utilization information of the third natural language, and the analysis result of the second natural language analysis unit or the replacement rule search is provided. The third natural language dictionary storage unit is searched based on the replacement rule extracted by the unit, and the second natural language entry of the first natural language versus second natural language dictionary entry is replaced with the third natural language entry. If the natural language entry includes a variant and the notation is not registered in the second natural language versus third natural language dictionary, the variant included in the second natural language entry is converted to the original form,
When the corresponding third natural language entry is obtained in the original form from the second natural language pair to the third natural language dictionary, the third natural language dictionary is searched and the original form of the third natural language entry is converted into an appropriate variant notation. The third natural language entry corresponding to the second natural language entry, such as a variant that is difficult to replace with the notation as it is, can be converted into an accurate expression, and the first natural language-third natural language dictionary is converted. It can be created accurately.

【0159】更に、本発明によれば、第1自然言語対第
2自然言語辞書エントリの第2自然言語エントリが複数
獲得され、かつ該第2自然言語エントリに対する第3自
然言語エントリが重複して獲得された場合、この重複し
て獲得された第3自然言語エントリの方がより適切であ
ると判断するので、第2自然言語エントリの段階で訳語
候補が複数になった場合、複数の第2自然言語エントリ
から獲得された第3自然言語エントリが重複すれば、こ
の重複した第3自然言語エントリの方が単独で出現した
第3自然言語エントリよりも適切であるという訳語選択
情報を付与でき、結果として信頼性の高い第1自然言語
対第3自然言語辞書を作成することができる。
Further, according to the present invention, a plurality of second natural language entries of the first natural language versus second natural language dictionary entry are obtained, and the third natural language entry corresponding to the second natural language entry is duplicated. If acquired, the third natural language entry acquired in duplicate is determined to be more appropriate. Therefore, if there are a plurality of candidate translations at the stage of the second natural language entry, a plurality of second natural language entries are obtained. If the third natural language entries obtained from the natural language entries overlap, translation word selection information indicating that the duplicated third natural language entry is more appropriate than the third natural language entry that has appeared alone can be given, As a result, a highly reliable first natural language to third natural language dictionary can be created.

【0160】本発明によれば、第3自然言語コーパスの
統計情報を格納している第3自然言語コーパス情報格納
部を有し、この第3自然言語コーパス情報格納部の情報
を利用して、辞書作成管理部で獲得した第3自然言語エ
ントリが適切かどうかを示す訳語選択情報を付与するの
で、第1自然言語エントリから第2自然言語エントリを
介して第3自然言語エントリへと辿る間に訳語候補が増
加しても、例えば専門用語や分野特有の語など、どの訳
語がより適切であるかわかる。また、複数の訳語候補の
中で、よりよく用いられる語の優先順位を付与できる
し、更に第3自然言語の訳語候補が1つである場合でも
該訳語候補の尤もらしさを判断できる。更に、第2自然
言語エントリが複合語で、そのままの表記では第3自然
言語エントリを獲得できず、解析を行って第3自然言語
エントリを獲得する場合、該第3自然言語エントリ中の
単語候補が複数あっても、獲得した第3自然言語エント
リの中に含まれる単語間の共起情報などから、より適切
な語の組み合わせを選択でき、結果的に信頼性の高い第
1自然言語対第3自然言語辞書を作成することができ
る。
According to the present invention, there is provided a third natural language corpus information storage unit for storing the statistical information of the third natural language corpus, and the information of the third natural language corpus information storage unit is used. Since translation word selection information indicating whether the third natural language entry acquired by the dictionary creation management unit is appropriate is added, while tracing from the first natural language entry to the third natural language entry via the second natural language entry, Even if the number of translation candidates increases, it is possible to know which translation is more appropriate, such as a technical term or a field-specific word. In addition, a priority order of a word that is more frequently used among a plurality of translation word candidates can be given, and even when there is only one translation word candidate of the third natural language, the likelihood of the translation word candidate can be determined. Further, when the second natural language entry is a compound word and the third natural language entry cannot be obtained by the notation as it is, and the analysis is performed to obtain the third natural language entry, a word candidate in the third natural language entry is obtained. Even if there are a plurality of words, it is possible to select a more appropriate word combination from the co-occurrence information between words included in the acquired third natural language entry, and as a result, the first natural language versus the first 3. A natural language dictionary can be created.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態に係る辞書作成装置の構成
を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of a dictionary creation device according to an embodiment of the present invention.

【図2】図1の辞書作成装置に使用されている第1自然
言語対第2自然言語辞書格納部に格納されている第1自
然言語対第2自然言語辞書エントリを示す図である。
FIG. 2 is a diagram illustrating a first natural language-second natural language dictionary entry stored in a first natural language-second natural language dictionary storage unit used in the dictionary creation device of FIG. 1;

【図3】図1の辞書作成装置に使用されている第1自然
言語コーパス情報格納部に格納されている第1自然言語
コーパス情報を示す図である。
FIG. 3 is a diagram illustrating first natural language corpus information stored in a first natural language corpus information storage unit used in the dictionary creation device in FIG. 1;

【図4】図1の辞書作成装置に使用されている第2自然
言語コーパス情報格納部に格納されている第2自然言語
コーパス情報を示す図である。
FIG. 4 is a diagram showing second natural language corpus information stored in a second natural language corpus information storage unit used in the dictionary creation device of FIG. 1;

【図5】図1の辞書作成装置に使用されているエントリ
選択情報付与部の実行結果を示す図である。
FIG. 5 is a diagram illustrating an execution result of an entry selection information providing unit used in the dictionary creation device of FIG. 1;

【図6】図1の辞書作成装置に使用されている第2自然
言語対第3自然言語辞書格納部に格納されている第2自
然言語対第3自然言語辞書エントリを示す図である。
FIG. 6 is a diagram showing a second natural language-third natural language dictionary entry stored in a second natural language-third natural language dictionary storage unit used in the dictionary creation device of FIG. 1;

【図7】図1の辞書作成装置に使用されている第3自然
言語コーパス情報格納部に格納されている第3自然言語
コーパス情報を示す図である。
FIG. 7 is a diagram showing third natural language corpus information stored in a third natural language corpus information storage unit used in the dictionary creation device of FIG. 1;

【図8】図1の辞書作成装置に使用されている第2自然
言語解析部による第2自然言語エントリの解析結果を示
す図である。
FIG. 8 is a diagram showing an analysis result of a second natural language entry by a second natural language analysis unit used in the dictionary creation device of FIG. 1;

【図9】図1の辞書作成装置に使用されている第2自然
言語辞書に格納されている第2自然言語辞書エントリを
示す図である。
9 is a diagram showing a second natural language dictionary entry stored in a second natural language dictionary used in the dictionary creation device of FIG. 1;

【図10】図1の辞書作成装置に使用されている置換ル
ール格納部に格納されている置換ルールを示す図であ
る。
FIG. 10 is a diagram showing a replacement rule stored in a replacement rule storage unit used in the dictionary creation device of FIG. 1;

【図11】図1の辞書作成装置に使用されている置換ル
ール検索部に用いられる置換ルールを示す図である。
FIG. 11 is a diagram showing a replacement rule used in a replacement rule search unit used in the dictionary creation device of FIG. 1;

【図12】図1の辞書作成装置に使用されている第3自
然言語辞書格納部に格納されている第3自然言語辞書エ
ントリを示す図である。
FIG. 12 is a diagram illustrating a third natural language dictionary entry stored in a third natural language dictionary storage unit used in the dictionary creation device in FIG. 1;

【図13】図1の辞書作成装置に使用されている第1自
然言語対第3自然言語辞書格納部に格納される第1自然
言語対第3自然言語辞書エントリを示す図である。
13 is a diagram showing a first natural language-third natural language dictionary entry stored in a first natural language-third natural language dictionary storage unit used in the dictionary creation device of FIG. 1;

【図14】図1の辞書作成装置の作用を示すフローチャ
ートである。
FIG. 14 is a flowchart showing the operation of the dictionary creation device of FIG. 1;

【符号の説明】[Explanation of symbols]

10 第1自然言語対第2自然言語辞書格納部 11 辞書エントリ読み込み部 12 辞書作成管理部 13 第1自然言語対第3自然言語辞書格納部 14 第1自然言語コーパス情報格納部 15 第2自然言語コーパス情報格納部 16 置換ルール格納部 17 第2自然言語辞書格納部 18 第3自然言語辞書格納部 19 第2自然言語対第3自然言語辞書格納部 20 第3自然言語コーパス情報格納部 121 エントリ選択情報付与部 122 第2自然言語解析部 123 置換管理部 124 訳語選択情報付与部 1231 置換ルール検索部 1232 置換ルール作成部 1233 置換実行部 10 first natural language versus second natural language dictionary storage unit 11 dictionary entry reading unit 12 dictionary creation management unit 13 first natural language versus third natural language dictionary storage unit 14 first natural language corpus information storage unit 15 second natural language Corpus information storage unit 16 Replacement rule storage unit 17 Second natural language dictionary storage unit 18 Third natural language dictionary storage unit 19 Second natural language versus third natural language dictionary storage unit 20 Third natural language corpus information storage unit 121 Selection of entry Information addition unit 122 Second natural language analysis unit 123 Replacement management unit 124 Translated word selection information addition unit 1231 Replacement rule search unit 1232 Replacement rule creation unit 1233 Replacement execution unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 中岩 浩巳 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B091 AA01 BA02 CC16 EA07 EA17 ────────────────────────────────────────────────── ─── Continuing on the front page (72) Inventor Hiromi Nakaiwa 2-3-1, Otemachi, Chiyoda-ku, Tokyo F-term in Nippon Telegraph and Telephone Corporation (reference) 5B091 AA01 BA02 CC16 EA07 EA17

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 自然言語対の対訳辞書を作成する辞書作
成装置であって、 第1自然言語の見出しおよびその品詞と、該第1自然言
語エントリの対訳である第2自然言語の対訳表現および
その品詞とを有する第1自然言語対第2自然言語の辞書
を格納する第1自然言語対第2自然言語辞書格納部と、 第2自然言語の見出しおよびその品詞と、該第2自然言
語エントリの対訳である第3自然言語の対訳表現および
その品詞とを有する第2自然言語対第3自然言語辞書を
格納する第2自然言語対第3自然言語辞書格納部と、 前記第1自然言語対第2自然言語辞書格納部から第1自
然言語対第2自然言語辞書エントリを取り出す辞書エン
トリ読み込み部と、 この取り出した第1自然言語対第2自然言語辞書エント
リの第2自然言語エントリに対応する第3自然言語エン
トリを前記第2自然言語対第3自然言語辞書格納部から
獲得し、前記第1自然言語対第2自然言語辞書エントリ
の第2自然言語エントリを前記第3自然言語エントリで
置き換える辞書作成管理部と、 この第1自然言語エントリ対第2自然言語辞書エントリ
の第2自然言語エントリを第3自然言語エントリで置き
換えることにより生成される第1自然言語対第3自然言
語辞書エントリに基づき第1自然言語の見出しおよびそ
の品詞と、該第1自然言語エントリの対訳である第3自
然言語の対訳およびその品詞とを有する第1自然言語対
第3自然言語の対訳辞書を作成して格納する第1自然言
語対第3自然言語辞書格納部とを有することを特徴とす
る辞書作成装置。
1. A dictionary creating apparatus for creating a bilingual dictionary of a natural language pair, comprising: a heading of a first natural language and its part of speech; a bilingual expression of a second natural language which is a bilingual translation of the first natural language entry; A first natural language versus second natural language dictionary storage unit for storing a first natural language versus second natural language dictionary having the part of speech, a second natural language heading and its part of speech, and the second natural language entry A second natural language pair and a third natural language dictionary storage unit for storing a second natural language pair and a third natural language dictionary having a bilingual expression of a third natural language and its part of speech, which is a bilingual translation of the first natural language pair A dictionary entry reading unit for retrieving the first natural language pair to the second natural language dictionary entry from the second natural language dictionary storage unit; and a dictionary entry reading unit corresponding to the retrieved first natural language to second natural language dictionary entry. A third natural language entry is obtained from the second natural language to third natural language dictionary storage, and a second natural language entry of the first natural language to second natural language dictionary entry is replaced with the third natural language entry. A dictionary creation management unit, wherein a first natural language entry to a third natural language dictionary entry generated by replacing the second natural language entry of the first natural language entry to the second natural language dictionary entry with a third natural language entry; A first natural language-third natural language bilingual dictionary having a first natural language heading and its part of speech, a third natural language bilingual translation of the first natural language entry and its part of speech, and A dictionary creation device comprising: a first natural language-third natural language dictionary storage unit for storing.
【請求項2】 第1自然言語コーパスの統計情報を格納
している第1自然言語コーパス情報格納部を更に有し、 前記辞書作成管理部は、前記辞書エントリ読み込み部か
ら供給された第1自然言語対第2自然言語辞書エントリ
の第1自然言語エントリをキーとして前記第1自然言語
コーパス情報格納部を参照し、不必要な第1自然言語対
第2自然言語エントリを取り除くエントリ選択情報付与
部を有することを特徴とする請求項1記載の辞書作成装
置。
A first natural language corpus information storage unit that stores statistical information of the first natural language corpus, wherein the dictionary creation management unit is configured to output the first natural language corpus information supplied from the dictionary entry reading unit. An entry selection information providing unit that refers to the first natural language corpus information storage unit and uses the first natural language entry of the language-to-second natural language dictionary entry as a key to remove unnecessary first natural language-to-second natural language entries 2. The dictionary creation device according to claim 1, comprising:
【請求項3】 第2自然言語コーパスの統計情報を格納
している第2自然言語コーパス情報格納部を更に有し、 前記エントリ選択情報付与部は、前記辞書エントリ読み
込み部から供給された第1自然言語対第2自然言語辞書
エントリの第2自然言語エントリをキーとして前記第2
自然言語コーパス情報格納部を参照し、重みづけ情報で
ある訳語選択情報を付与する訳語選択情報/重みづけ情
報付与手段を有することを特徴とする請求項2記載の辞
書作成装置。
And a second natural language corpus information storage unit for storing statistical information of a second natural language corpus, wherein the entry selection information providing unit includes a first natural language corpus information storage unit. Using the second natural language entry of the natural language versus second natural language dictionary entry as a key
3. The dictionary creating apparatus according to claim 2, further comprising translation word selection information / weighting information provision means for referring to the natural language corpus information storage unit and providing translation word selection information as weighting information.
【請求項4】 前記辞書作成管理部は、第1自然言語対
第2自然言語辞書エントリの第2自然言語エントリを第
3自然言語エントリで置き換えることができなかった場
合、該第2自然言語エントリを解析する第2自然言語解
析部と、該第2自然言語解析部の解析結果に基づき第3
自然言語エントリを獲得し、この獲得した第3自然言語
エントリで前記第2自然言語エントリを置き換える置換
実行部とを有することを特徴とする請求項1,2または
3記載の辞書作成装置。
4. The dictionary creation management unit, when the second natural language entry of the first natural language-to-second natural language dictionary entry cannot be replaced with the third natural language entry, A second natural language analysis unit for analyzing the third language, and a third natural language analysis unit based on the analysis result of the second natural language analysis unit.
4. The dictionary creating apparatus according to claim 1, further comprising: a replacement execution unit that acquires a natural language entry and replaces the second natural language entry with the acquired third natural language entry.
【請求項5】 第2自然言語を第3自然言語に置き換え
る置換ルールを格納している置換ルール格納部を更に有
し、 前記辞書作成管理部は、前記第2自然言語解析部の解析
結果に基づき前記置換ルール格納部を検索して、置換ル
ールを取り出す置換ルール検索部を有し、 前記置換実行部は、前記置換ルール検索部で取り出した
置換ルールを利用し、該置換ルールが複数の場合は該複
数の置換ルールを組み合わせて利用して、前記第2自然
言語対第3自然言語辞書格納部から第3自然言語エント
リを獲得する手段を有することを特徴とする請求項4記
載の辞書作成装置。
5. The apparatus according to claim 1, further comprising: a replacement rule storage unit storing a replacement rule for replacing the second natural language with a third natural language, wherein the dictionary creation management unit stores the analysis result of the second natural language analysis unit. A replacement rule search unit that searches the replacement rule storage unit based on the replacement rule, and obtains a replacement rule. The replacement execution unit uses the replacement rule extracted by the replacement rule search unit. 5. The dictionary creation device according to claim 4, further comprising means for acquiring a third natural language entry from said second natural language to third natural language dictionary storage unit by using said plurality of replacement rules in combination. apparatus.
【請求項6】 前記辞書作成管理部は、前記置換実行部
において前記置換ルール検索部で取り出した複数の置換
ルールを組み合わせて利用した場合、この組み合わせた
置換ルールの利用回数を計数する利用回数計数手段と、
この計数した置換ルールの利用回数が所定の回数以上に
なった場合、この組み合わせた置換ルールを前記置換ル
ール格納部に格納する置換ルール作成部とを有すること
を特徴とする請求項5記載の辞書作成装置。
6. When the replacement execution unit uses a plurality of replacement rules extracted by the replacement rule search unit in combination, the dictionary creation management unit counts the number of times the combined replacement rules are used. Means,
6. The dictionary according to claim 5, further comprising: a replacement rule creating unit that stores the combined replacement rule in the replacement rule storage unit when the counted usage number of the replacement rule becomes equal to or more than a predetermined number. Creating device.
【請求項7】 第2自然言語の原形、品詞および活用情
報を格納している第2自然言語辞書を格納する第2自然
言語辞書格納部を更に有し、 前記第2自然言語解析部は、第2自然言語辞書格納部を
検索して、第2自然言語エントリを解析する手段を有す
ることを特徴とする請求項4乃至6のいずれかに記載の
辞書作成装置。
7. A second natural language dictionary storage unit for storing a second natural language dictionary storing an original form, part of speech, and utilization information of the second natural language, wherein the second natural language analysis unit comprises: 7. The dictionary creation device according to claim 4, further comprising means for searching a second natural language dictionary storage unit and analyzing the second natural language entry.
【請求項8】 第3自然言語の原形、品詞および活用情
報を格納している第3自然言語辞書を格納する第3自然
言語辞書格納部を更に有し、 前記置換実行部は、前記第2自然言語解析部の解析結果
または前記置換ルール検索部で取り出した置換ルールに
基づき前記第3自然言語辞書格納部を検索して、第1自
然言語対第2自然言語辞書エントリの第2自然言語エン
トリを第3自然言語エントリで置き換える手段を有する
ことを特徴とする請求項4乃至7のいずれかに記載の辞
書作成装置。
8. A third natural language dictionary storage unit for storing a third natural language dictionary storing an original form, a part of speech, and inflection information of the third natural language, wherein the replacement execution unit includes the second natural language dictionary. The third natural language dictionary storage unit is searched based on the analysis result of the natural language analysis unit or the replacement rule retrieved by the replacement rule search unit, and the second natural language entry of the first natural language versus second natural language dictionary entry is searched. The dictionary creating apparatus according to any one of claims 4 to 7, further comprising: means for replacing with a third natural language entry.
【請求項9】 前記辞書作成管理部は、第1自然言語対
第2自然言語辞書エントリの第2自然言語エントリが複
数獲得され、かつ該第2自然言語エントリに対する第3
自然言語エントリが重複して獲得された場合、この重複
して獲得された第3自然言語エントリの方がより適切で
あると判断する訳語選択情報付与部を有することを特徴
とする請求項1乃至8のいずれかに記載の辞書作成装
置。
9. The dictionary creation management unit obtains a plurality of second natural language entries of the first natural language versus second natural language dictionary entry, and generates a third natural language entry for the second natural language entry.
4. The method according to claim 1, further comprising a translation word selection information providing unit that determines that the third natural language entry acquired in duplicate is more appropriate when the natural language entry is acquired in duplicate. 8. The dictionary creation device according to any one of 8.
【請求項10】 第3自然言語コーパスの統計情報を格
納している第3自然言語コーパス情報格納部を更に有
し、 前記辞書作成管理部は、前記第3自然言語コーパス情報
格納部の情報を利用して、前記辞書作成管理部で獲得し
た第3自然言語エントリが適切かどうかを示す訳語選択
情報を付与する手段を有することを特徴とする請求項1
乃至9のいずれかに記載の辞書作成装置。
10. A third natural language corpus information storage unit storing statistical information of a third natural language corpus, wherein the dictionary creation management unit stores information of the third natural language corpus information storage unit. 2. The apparatus according to claim 1, further comprising means for providing translation word selection information indicating whether the third natural language entry acquired by the dictionary creation management unit is appropriate.
The dictionary creation device according to any one of claims 9 to 9.
【請求項11】 自然言語対の対訳辞書を作成する辞書
作成方法であって、 第1自然言語の見出しおよびその品詞と、該第1自然言
語エントリの対訳である第2自然言語の対訳表現および
その品詞とを有する第1自然言語対第2自然言語の辞書
を第1自然言語対第2自然言語辞書格納部に格納する第
1自然言語対第2自然言語辞書格納部格納ステップと、 第2自然言語の見出しおよびその品詞と、該第2自然言
語エントリの対訳である第3自然言語の対訳表現および
その品詞とを有する第2自然言語対第3自然言語辞書を
第2自然言語対第3自然言語辞書格納部に格納する第2
自然言語対第3自然言語辞書格納部格納ステップと、 前記第1自然言語対第2自然言語辞書格納部から第1自
然言語対第2自然言語辞書エントリを取り出す辞書エン
トリ読み込みステップと、 この取り出した第1自然言語対第2自然言語辞書エント
リの第2自然言語エントリに対応する第3自然言語エン
トリを前記第2自然言語対第3自然言語辞書格納部から
獲得し、前記第1自然言語対第2自然言語辞書エントリ
の第2自然言語エントリを前記第3自然言語エントリで
置き換える辞書作成管理ステップと、 この第1自然言語対第2自然言語辞書エントリの第2自
然言語エントリを第3自然言語エントリで置き換えるこ
とにより生成される第1自然言語対第3自然言語辞書エ
ントリに基づき第1自然言語の見出しおよびその品詞
と、該第1自然言語エントリの対訳である第3自然言語
の対訳およびその品詞とを有する第1自然言語対第3自
然言語の対訳辞書を作成して格納する第1自然言語対第
3自然言語辞書格納ステップとを有することを特徴とす
る辞書作成方法。
11. A dictionary creation method for creating a bilingual dictionary of a natural language pair, comprising: a heading and a part of speech of a first natural language; a bilingual expression of a second natural language that is a bilingual translation of the first natural language entry; A first natural language-second natural language dictionary storage unit storing a first natural language-second natural language dictionary having the part of speech in a first natural language-second natural language dictionary storage unit; A second natural language-third natural language dictionary having a natural language heading and its part of speech, a third natural language bilingual expression that is a bilingual translation of the second natural language entry, and its part of speech is stored in the second natural language-third language. Second stored in natural language dictionary storage
A natural language-to-third natural language dictionary storage unit storing step; a dictionary entry reading step of obtaining the first natural language-to-second natural language dictionary entry from the first natural language-to-second natural language dictionary storage unit; Obtaining a third natural language entry corresponding to the second natural language entry of the first natural language to second natural language dictionary entry from the second natural language to third natural language dictionary storage unit; A dictionary creation management step of replacing a second natural language entry of the second natural language dictionary entry with the third natural language entry; and replacing the second natural language entry of the first natural language versus second natural language dictionary entry with a third natural language entry And a part of speech of the first natural language based on the first natural language-third natural language dictionary entry generated by A first natural language-third natural language dictionary storing step of creating and storing a first natural language-third natural language bilingual dictionary having a third natural language bilingual translation of a natural language entry and its part of speech; A dictionary creation method comprising:
【請求項12】 第1自然言語コーパスの統計情報を第
1自然言語コーパス情報格納部に格納するステップを更
に有し、 前記辞書作成管理ステップは、前記辞書エントリ読み込
みステップから供給された第1自然言語対第2自然言語
辞書エントリの第1自然言語エントリをキーとして前記
第1自然言語コーパス情報格納部を参照し、不必要な第
1自然言語対第2自然言語エントリを取り除くエントリ
選択情報付与ステップを有することを特徴とする請求項
11記載の辞書作成方法。
12. The method according to claim 12, further comprising the step of storing statistical information of the first natural language corpus in a first natural language corpus information storage unit, wherein the dictionary creation management step includes the step of storing the first natural language corpus information supplied from the dictionary entry reading step. An entry selection information providing step of referring to the first natural language corpus information storage unit using the first natural language entry of the language-to-second natural language dictionary entry as a key and removing unnecessary first natural language-to-second natural language entries 12. The dictionary creation method according to claim 11, comprising:
【請求項13】 第2自然言語コーパスの統計情報を第
2自然言語コーパス情報格納部に格納するステップを更
に有し、 前記エントリ選択情報付与ステップは、前記辞書エント
リ読み込みステップから供給された第1自然言語対第2
自然言語辞書エントリの第2自然言語エントリをキーと
して前記第2自然言語コーパス情報格納部を参照し、重
みづけ情報である訳語選択情報を付与する訳語選択情報
/重みづけ情報付与ステップを有することを特徴とする
請求項12記載の辞書作成方法。
13. The method according to claim 13, further comprising the step of storing statistical information of the second natural language corpus in a second natural language corpus information storage unit, wherein the step of providing entry selection information includes the step of: Natural language versus second
A translation word selection information / weighting information providing step of referring to the second natural language corpus information storage unit using the second natural language entry of the natural language dictionary entry as a key and providing translation word selection information as weighting information. 13. The dictionary creation method according to claim 12, wherein:
【請求項14】 前記辞書作成管理ステップは、第1自
然言語対第2自然言語辞書エントリの第2自然言語エン
トリを第3自然言語エントリで置き換えることができな
かった場合、該第2自然言語エントリを解析する第2自
然言語解析ステップと、該第2自然言語解析ステップの
解析結果に基づき第3自然言語エントリを獲得し、この
獲得した第3自然言語エントリで前記第2自然言語エン
トリを置き換える置換実行ステップとを有することを特
徴とする請求項11,12または13記載の辞書作成方
法。
14. The dictionary creation management step, if the second natural language entry of the first natural language-to-second natural language dictionary entry cannot be replaced with the third natural language entry, the second natural language entry A second natural language analysis step of analyzing the second natural language entry, and obtaining a third natural language entry based on the analysis result of the second natural language analysis step, and replacing the second natural language entry with the obtained third natural language entry. 14. The dictionary creation method according to claim 11, further comprising an execution step.
【請求項15】 自然言語対の対訳辞書を作成する辞書
作成プログラムを記録した記録媒体であって、 第1自然言語の見出しおよびその品詞と、該第1自然言
語エントリの対訳である第2自然言語の対訳表現および
その品詞とを有する第1自然言語対第2自然言語の辞書
を第1自然言語対第2自然言語辞書格納部に格納する第
1自然言語対第2自然言語辞書格納部格納ステップと、 第2自然言語の見出しおよびその品詞と、該第2自然言
語エントリの対訳である第3自然言語の対訳表現および
その品詞とを有する第2自然言語対第3自然言語辞書を
第2自然言語対第3自然言語辞書格納部に格納する第2
自然言語対第3自然言語辞書格納部格納ステップと、 前記第1自然言語対第2自然言語辞書格納部から第1自
然言語対第2自然言語辞書エントリを取り出す辞書エン
トリ読み込みステップと、 この取り出した第1自然言語対第2自然言語辞書エント
リの第2自然言語エントリに対応する第3自然言語エン
トリを前記第2自然言語対第3自然言語辞書格納部から
獲得し、前記第1自然言語対第2自然言語辞書エントリ
の第2自然言語エントリを前記第3自然言語エントリで
置き換える辞書作成管理ステップと、 この第1自然言語対第2自然言語辞書エントリの第2自
然言語エントリを第3自然言語エントリで置き換えるこ
とにより生成される第1自然言語対第3自然言語辞書エ
ントリに基づき第1自然言語の見出しおよびその品詞
と、該第1自然言語エントリの対訳である第3自然言語
の対訳およびその品詞とを有する第1自然言語対第3自
然言語の対訳辞書を作成して格納する第1自然言語対第
3自然言語辞書格納ステップとを有することを特徴とす
る辞書作成プログラムを記録した記録媒体。
15. A recording medium storing a dictionary creation program for creating a bilingual dictionary of a natural language pair, comprising: a heading of a first natural language and its part of speech; and a second natural language which is a bilingual translation of the first natural language entry. A first natural language versus a second natural language dictionary storage for storing a first natural language versus a second natural language dictionary having a bilingual language expression and its part of speech in a first natural language versus a second natural language dictionary storage A second natural language-third natural language dictionary having a step, a heading of the second natural language and its part of speech, a bilingual expression of the third natural language which is a bilingual translation of the second natural language entry and its part of speech, The second language stored in the natural language-third natural language dictionary storage unit
A natural language-to-third natural language dictionary storage unit storing step; a dictionary entry reading step of obtaining the first natural language-to-second natural language dictionary entry from the first natural language-to-second natural language dictionary storage unit; Obtaining a third natural language entry corresponding to the second natural language entry of the first natural language to second natural language dictionary entry from the second natural language to third natural language dictionary storage unit; A dictionary creation management step of replacing a second natural language entry of the second natural language dictionary entry with the third natural language entry; and replacing the second natural language entry of the first natural language versus second natural language dictionary entry with a third natural language entry And a part of speech of the first natural language based on the first natural language-third natural language dictionary entry generated by A first natural language-third natural language dictionary storing step of creating and storing a first natural language-third natural language bilingual dictionary having a third natural language bilingual translation of a natural language entry and its part of speech; A storage medium storing a dictionary creation program, characterized by comprising:
JP2000306865A 2000-10-05 2000-10-05 Dictionary creation device and method, and recording medium recording dictionary creation program Expired - Fee Related JP3419748B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000306865A JP3419748B2 (en) 2000-10-05 2000-10-05 Dictionary creation device and method, and recording medium recording dictionary creation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000306865A JP3419748B2 (en) 2000-10-05 2000-10-05 Dictionary creation device and method, and recording medium recording dictionary creation program

Publications (2)

Publication Number Publication Date
JP2002117028A true JP2002117028A (en) 2002-04-19
JP3419748B2 JP3419748B2 (en) 2003-06-23

Family

ID=18787475

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000306865A Expired - Fee Related JP3419748B2 (en) 2000-10-05 2000-10-05 Dictionary creation device and method, and recording medium recording dictionary creation program

Country Status (1)

Country Link
JP (1) JP3419748B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193920A (en) * 2010-03-04 2011-09-21 腾讯科技(深圳)有限公司 Name word stock generating method and device as well as text input system
JP2016525250A (en) * 2013-11-05 2016-08-22 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド Bilingual corpus data expansion method, apparatus and storage medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193920A (en) * 2010-03-04 2011-09-21 腾讯科技(深圳)有限公司 Name word stock generating method and device as well as text input system
JP2016525250A (en) * 2013-11-05 2016-08-22 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド Bilingual corpus data expansion method, apparatus and storage medium
US9953024B2 (en) 2013-11-05 2018-04-24 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and device for expanding data of bilingual corpus, and storage medium

Also Published As

Publication number Publication date
JP3419748B2 (en) 2003-06-23

Similar Documents

Publication Publication Date Title
KR100453227B1 (en) Similar sentence retrieval method for translation aid
US9239826B2 (en) Method and system for generating new entries in natural language dictionary
Chen et al. A fully unsupervised word sense disambiguation method using dependency knowledge
WO2003083708A2 (en) Machine translation
Pettersson Spelling normalisation and linguistic analysis of historical text for information extraction
Jabbar et al. A survey on Urdu and Urdu like language stemmers and stemming techniques
Sawalha et al. Fine-grain morphological analyzer and part-of-speech tagger for Arabic text
Costa et al. Temporal information processing of a new language: Fast porting with minimal resources
Mara English-Wolaytta Machine Translation using Statistical Approach
Cosijn et al. Information access in indigenous languages: a case study in Zulu
Yeshambel et al. Evaluation of corpora, resources and tools for Amharic information retrieval
Zhang et al. Chinese OOV translation and post-translation query expansion in chinese--english cross-lingual information retrieval
Salam et al. Developing the bangladeshi national corpus-a balanced and representative bangla corpus
Knight et al. Integrating knowledge bases and statistics in MT
Sankaravelayuthan et al. English to tamil machine translation system using parallel corpus
JP3419748B2 (en) Dictionary creation device and method, and recording medium recording dictionary creation program
Karlgren et al. The challenges of language variation in information access
May et al. Surprise! What's in a Cebuano or Hindi Name?
Fox et al. Building the CODER lexicon: The Collins English Dictionary and its adverb definitions
Sankaravelayuthan et al. A Comprehensive Study of Shallow Parsing and Machine Translation in Malaylam
Eineborg et al. ILP in part-of-speech tagging—an overview
Lebbos Arabic information extraction methods a survey
Hosoda Hawaiian morphemes: Identification, usage, and application in information retrieval
Christensen Danish knowledge patterns and word sketches for semi-automatic extraction of terminological information
Szpektor et al. Cross lingual and semantic retrieval for cultural heritage appreciation

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees