JP4051369B2 - Apparatus, method and program for converting lexical data to data - Google Patents
Apparatus, method and program for converting lexical data to data Download PDFInfo
- Publication number
- JP4051369B2 JP4051369B2 JP2004287849A JP2004287849A JP4051369B2 JP 4051369 B2 JP4051369 B2 JP 4051369B2 JP 2004287849 A JP2004287849 A JP 2004287849A JP 2004287849 A JP2004287849 A JP 2004287849A JP 4051369 B2 JP4051369 B2 JP 4051369B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- logical
- words
- logical index
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 54
- 230000015654 memory Effects 0.000 claims description 291
- 238000012545 processing Methods 0.000 claims description 108
- 238000004458 analytical method Methods 0.000 claims description 46
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 6
- 238000007405 data analysis Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000470 constituent Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置、方法及びプログラムに関する。 The present invention relates to an apparatus, a method, and a program for converting a lexical phrase including a plurality of words into another data including one piece of information specified by the plurality of words.
例えば、銀行等では受信する決済指図電文等について、計算機を使用して取引先顧客情報(CIF)解析処理が必要になることがある(なお、CIFは顧客情報ファイル(Customer Information File)を意味する。)。詳細には、例えば電文中の字句「GETRONICS FOODS CO.,LTD 1−2−34 AKASAKA」の中の複数の単語「GETRONICS」、「FOODS」、「CO.,LTD」及び「AKASAKA」の組み合わせを顧客コード(即ち、CIFコード)「1234567」に変換することが必要になる。 For example, a bank or the like may require a customer information (CIF) analysis process using a computer for a settlement instruction message received (CIF means a customer information file). .) Specifically, for example, a combination of a plurality of words “GETRONICS”, “FOODS”, “CO., LTD”, and “AKASAKA” in the word “GETRONICS FOODS CO., LTD 1-2-34 AKASAKA” It is necessary to convert the customer code (that is, the CIF code) to “1234567”.
従来は、この変換処理を次のように行っていた。即ち、顧客コードを特定する複数の単語の組み合わせとそれに対応する顧客コードとの顧客コード・テーブルを予め記憶装置に格納しておく。次いで、入力データから変換すべき複数の単語を抽出して、その抽出された複数の単語と顧客コード・テーブルの中の複数の単語とを文字列比較を行い、一致した場合顧客コードに変換していた(そのような例として、特許文献1参照。)。 Conventionally, this conversion processing is performed as follows. That is, a customer code table of a combination of a plurality of words specifying a customer code and a corresponding customer code is stored in the storage device in advance. Next, a plurality of words to be converted are extracted from the input data, and the extracted plurality of words and a plurality of words in the customer code table are subjected to character string comparison. (See Patent Document 1 for such an example.)
しかしながら、このような文字列比較は、1文字毎(1バイト単位)で行うため、とりわけ大量のデータが対象になるときには、当該処理に要する検索時間(seek time)の関係上、高速に処理を行うことができないという問題があった。 However, since such character string comparison is performed for each character (in 1-byte units), especially when a large amount of data is targeted, the processing is performed at high speed due to the search time required for the processing. There was a problem that could not be done.
このような問題を克服しようとする方式として、電文中の字句をCIFコードに変換するために用いる辞書類をメイン・メモリ上にメモリ・アドレスをシンボルとしてシンボル化することがこの特許出願より前の特許出願において提案された(特許文献2参照)。詳細には、複数の単語のそれぞれとその属性情報を関連付けて二次記憶装置に予め登録してある基本語辞書と、基本語辞書に登録されている2つの単語を組み合わせた組と、キーとして選択された当該組の中の単語と当該組により特定される記号とを関連付けて二次記憶装置に予め登録してある核名称辞書と、当該記号と当該組に含まれない別の単語と当該記号及び別の単語により特定されるCIFコードとを関連付けて二次記憶装置に予め登録してあるフル名称辞書とをメイン・メモリ上にメモリ・アドレスをシンボルとしてシンボル化する。シンボル化された基本語辞書を参照して、被変換字句に含まれる単語に対応するアドレスを取得する。そのうちの2つのアドレス(一方をキーとする)が一致する組をシンボル化された核名称辞書から見つけ、次いで、もう1つのアドレスと一致する組をシンボル化されたフル名称辞書から見つけて、被変換字句を目的のCIFコードに変換する。 As a method for overcoming such a problem, it is possible to symbolize a dictionary used for converting a lexical in a message into a CIF code on a main memory using a memory address as a symbol. It was proposed in a patent application (see Patent Document 2). Specifically, a basic word dictionary associated with each of a plurality of words and their attribute information and registered in the secondary storage device in advance, a combination of two words registered in the basic word dictionary, and a key The nuclear name dictionary that is pre-registered in the secondary storage device in association with the selected word in the set and the symbol specified by the set, the symbol and another word not included in the set, and the The full name dictionary registered in advance in the secondary storage device in association with the symbol and the CIF code specified by another word is symbolized on the main memory using the memory address as a symbol. By referring to the symbolized basic word dictionary, an address corresponding to the word included in the converted lexical phrase is acquired. A pair that matches two addresses (one of which is a key) is found from the symbolized nuclear name dictionary, and then a pair that matches the other address is found from the symbolized full name dictionary, The conversion token is converted into a target CIF code.
前述のように、この方式は、各辞書を関連付けるキー(シンボル)を物理的メモリ・アドレスに直接割り当てる仕様としている。そのような仕様とした場合、コンピュータの特性として、メモリ・アドレスは動的に割り付けられてしまうために、プログラムをメモリ・ロードする度に、辞書相互間のキー関係を、取得したメモリ・アドレスに置き換え、生成する必要があり、この点でプログラム初期処理上、高負荷及び所要時間がかかる。 As described above, this method is a specification in which a key (symbol) that associates each dictionary is directly assigned to a physical memory address. When such a specification is used, the memory address is dynamically allocated as a characteristic of the computer. Therefore, each time the program is loaded into the memory, the key relationship between the dictionaries is changed to the acquired memory address. It is necessary to replace and generate, and in this respect, high load and required time are required in the program initial processing.
このような問題を克服しようとする方式として、それぞれの単語を表象する論理インデックスを予め割り振って、単語と対応の論理インデックスとを関連付けて辞書に格納し、これをメモリ上にメモリ展開することがこの特許出願より前の特許出願において提案された(特許文献3及び4参照)。
As a method for overcoming such a problem, a logical index representing each word is allocated in advance, and the word and the corresponding logical index are stored in a dictionary in association with each other, and this is expanded in a memory. It was proposed in patent applications prior to this patent application (see
また、単語を論理インデックスに変換する解析処理を行う場合、この解析処理すべき単語には、表記は異なるものの解析処理上同一の意味内容を有するものがある。これらの単語には、個々に異なる論理インデックスを割り振ってもよいが、解析処理上同一の意味内容を有するので、同一の論理インデックスを割り振っても解析処理上問題は生じないし、処理効率上無駄を省くことができる。そこで、このような表記は異なるものの解析処理上同一の意味内容を有する複数の単語を基本語辞書の単語の欄の1つの行に格納することがこの特許出願より前の特許出願において提案された(特許文献4参照)。 In addition, when performing an analysis process for converting a word into a logical index, some words to be analyzed have the same semantic content in the analysis process, although the notation is different. Although different logical indexes may be assigned to these words individually, they have the same semantic content in the analysis process, so even if the same logical index is assigned, no problem occurs in the analysis process, and there is a waste in processing efficiency. It can be omitted. Therefore, it has been proposed in patent applications prior to this patent application to store a plurality of words having the same semantic content in the analysis process although they are different in notation in one line of the word column of the basic word dictionary. (See Patent Document 4).
更に、字句をデータに変換する際に、一方の字句が他方の字句を含む包摂関係が生じている場合にも正しく変換できるようにし、解析処理精度の向上を図るため、字句を構成する単語の組の論理インデックスセットとそれに対応するCIFコードとが関連付けられて名称辞書に格納され、包摂される論理インデックスセットに含まれないので直接CIFコードを特定するために用いられないが、CIFコードを特定するのを補助する単語である不要語に対応する論理インデックスが、CIFコードと関連付けられて不要語辞書に格納され、不要語を含む字句の論理インデックスの組に変換されたものを、不要語の論理インデックスを含めた名称辞書の論理インデックスセットと比較(部分マッチング)を行って、CIFコードを特定することがこの特許出願より前の特許出願において提案された(特許文献5参照)。 Furthermore, when converting a lexical into data, in order to improve the accuracy of analysis processing so that one lexical can be correctly converted even if there is an inclusion relationship that includes the other lexical, A set of logical index sets and their corresponding CIF codes are stored in the name dictionary and are not included in the included logical index set, so they are not used directly to identify CIF codes, but identify CIF codes A logical index corresponding to an unnecessary word, which is a word that assists the user, is stored in the unnecessary word dictionary in association with the CIF code, and is converted into a set of lexical logical indexes including unnecessary words. The CIF code is specified by comparing (partial matching) with the logical index set of the name dictionary including the logical index. Proposed in prior patent application from the patent application (see Patent Document 5).
また、辞書上の単語にインデックスを付し、それをディスクの格納位置と対応付けて、アクセス時間を短縮化する方法は知られている(例えば、特許文献6参照)。
ところで、名称が例えば「THE BANK OF TOKYO−NAKAMORI LTD」であり、これに対して、CIFコードが例えば「8760000」が割り当てられ、基本語辞書には、上記の名称の各単語、即ち、「THE」、「BANK」、「OF」、「TOKYO−NAKAMORI」、「LTD」、並びに「TOKYO」及び「NAKAMORI」のそれぞれが割り当てられた論理インデックスと共に登録されており、そして名称辞書には、上記名称、CIFコードと共に、対応する論理インデックスの組が登録されていたとする。その場合、名称として「THE BANK OF TOKYO−NAKAMORI LTD」が入力されたときには、その名称の各単語を論理インデックスに変換して、その変換された論理インデックスの組と名称辞書に登録されている論理インデックスの組とを比較することによりCIFコードを特定することができる。しかし、前述した従来の方法では、名称として「THE BANK OF TOKYO NAKAMORI LTD」が入力されたとき、その名称の各単語を論理インデックスに変換して、その変換された論理インデックスの組と名称辞書に登録されている論理インデックスの組とを比較しても、「TOKYO」及び「NAKAMORI」の論理インデックスと「TOKYO−NAKAMORI」の論理インデックスとは異なるので、CIFコードを特定することができず、解析不能としてNGとなってしまう。 By the way, the name is “THE BANK OF TOKYO-NAKAMORI LTD”, for example, and the CIF code is assigned, for example, “870000”, and each word of the above-mentioned name, that is, “THE” is assigned to the basic word dictionary. ”,“ BANK ”,“ OF ”,“ TOKYO-NAKAMORI ”,“ LTD ”, and“ TOKYO ”and“ NAKAMORI ”are registered together with assigned logical indexes, and the name dictionary includes the above names. Assume that a set of corresponding logical indexes is registered together with the CIF code. In this case, when “THE BANK OF TOKYO-NAKAMORI LTD” is input as a name, each word of the name is converted into a logical index, and the logical set registered in the name dictionary and the set of converted logical indexes The CIF code can be specified by comparing with the set of indexes. However, in the above-described conventional method, when “THE BANK OF TOKYO NAKAMORI LTD” is input as a name, each word of the name is converted into a logical index, and the converted logical index set and name dictionary are converted into a logical dictionary. Even if the set of registered logical indexes is compared, the logical index of “TOKYO” and “NAKAMORI” is different from the logical index of “TOKYO-NAKAMORI”, so the CIF code cannot be specified and analyzed. It becomes NG as impossible.
このように、名称の入力データに、例えば2つの語をハイフンで連結するか否かのような僅かな相違が生じても従来の方法では、CIFコードを特定することができなかった。
本発明の課題は、複数の単語を含む字句、例えば名称の入力データとして、名称辞書に登録されている複数の単語を含む字句、例えば名称と多少異なる形式の単語が入力されても解析不能とせず、名称辞書に登録されている複数の単語を含む字句により特定される正しい1つの情報、例えばCIFコードに変換することができるようにして、解析力の向上を図ることにある。
Thus, even if a slight difference occurs in the input data of the name, for example, whether or not two words are connected with a hyphen, the CIF code cannot be specified by the conventional method.
It is an object of the present invention to make analysis impossible even if a lexical word including a plurality of words, for example, a lexical word including a plurality of words registered in the name dictionary, for example, a word having a slightly different form from the name, is input as name input data. First, it is possible to improve the analysis power by converting the information into one correct information specified by a lexical word including a plurality of words registered in the name dictionary, for example, a CIF code.
請求項1記載の発明に係る装置は、複数の単語を含む字句を、当該複数の単語により特定される1つの情報を含む別のデータに変換する装置であって、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、前記論理インデックスの組同士が包摂関係にある場合包摂される論理インデックスの組について、当該包摂される単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語の論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書と、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンとを備え、前記処理エンジンは、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開し、前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開し、変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する。 The device according to the invention of claim 1, wherein the lexical including a plurality of words, a device for converting the other data including one of the information specified by the plurality of words, each of the plurality of words, A basic word dictionary that is pre-registered in the storage means in association with a logical index that represents each word, and a set of logical indexes that correspond to a set of words that combine words registered in the basic word dictionary , Name dictionary pre-registered in storage means in association with one piece of information specified by the word set, and a logical index corresponding to some words included in the word set or included in the word set a set of logical root indexes corresponding to the set of part of a word, the logical index corresponding to a word set and format differences word word or the portion of the part or the parts of words or Serial pairs of logical root indexes corresponding to the set of word pairs and form difference of part of a word, and said one information specified by a set of the word corresponding to the set of logical indexes registered in the name dictionary The name learning dictionary that is associated and registered in advance in the storage means and the logical index group that is included when the logical index pair is inclusive relation are not included in the included word group, so It is unnecessary because it is not used when directly specifying one piece of information, but a logical index of an unnecessary word that is a word that assists in finally specifying the one piece of information is associated with the one piece of information in the storage means. comprising a unnecessary word dictionary registered in advance, and a processing engine that converts the lexical including the plurality of words into another data including one of information the identified, the processing engine Expands in memory a word registered in the basic word dictionary in association with a logical index representing each word, and sets a set of logical indexes registered in the name dictionary to each logical index. When the memory is expanded on the memory in association with the specified one information corresponding to the set, the name learning dictionary is searched using the specified one information as a key, and the specified one information is obtained. Corresponding to the logical index corresponding to the partial word or logical index set corresponding to the partial word set, and corresponding to the logical index corresponding to the malformed word or the heterogenous word set A set of logical indexes to be incorporated into the set of logical indexes, expanded in the memory, and stored in the unnecessary word dictionary. The logical index of the key word is associated with the one information and expanded in the memory, the lexical word to be converted is decomposed into words, and the basic word dictionary expanded in the memory on the memory is referred to. A logical index corresponding to the decomposed word is acquired and converted, and the logical index corresponding to the partial word or the logical index set corresponding to the partial word set and the different format word are corresponded A logical index of the unnecessary word is further included in the logical index set expanded in memory in a form in which a logical index or a set of logical indexes corresponding to the differently formed word set is incorporated in the logical index set . from a set, either composed of a plurality of logical index of the logical index corresponding to the decomposed words of the By selecting a set of logical indexes that matches the set of logical indexes and using one piece of information specified by the set of selected logical indexes, one piece of information that specifies the lexical word including the plurality of words Convert to another data containing.
請求項2記載の発明に係る装置は、複数の単語を含む字句を、当該複数の単語により特定される1つの情報を含む別のデータに変換する装置であって、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンと、データを含む情報を入力するための入力手段と、データを含む情報を表示する表示手段と、を備え、前記処理エンジンは、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開し、変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを前記表示手段に表示し、前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定し、前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録する。An apparatus according to the invention of
請求項3記載の発明に係る装置は、複数の単語を含む字句を、当該複数の単語により特定される1つの情報を含む別のデータに変換する装置であって、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンと、データを含む情報を入力するための入力手段と、データを含む情報を表示する表示手段と、を備え、前記処理エンジンは、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開し、変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合、その単語を特定し、当該特定された単語及び前記の分解された単語に対応する論理インデックスを前記表示手段に表示し、前記表示手段に表示された前記特定された単語及び前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、前記特定された単語及び前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の単語に論理インデックスを割り当てて、前記基本語辞書に登録し、前記差分の単語を対応する論理インデックスに置換して、前記特定された差分の単語及び論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録する。An apparatus according to the invention of
請求項4記載の発明に係る装置は、複数の単語を含む字句を、当該複数の単語により特定される1つの情報を含む別のデータに変換する装置であって、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、前記論理インデックスの組同士が包摂関係にある場合包摂される論理インデックスの組について、当該包摂される単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語の論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書と、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンと、データを含む情報を入力するための入力手段と、データを含む情報を表示する表示手段とを備え、前記処理エンジンは、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開し、前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開し、変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、前記いずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを前記表示手段に表示し、前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書及び前記不要語辞書を検索して、当該推定される1つの情報に対応する不要語を含めた論理インデックスの組を取得し、前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定し、前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録する。 An apparatus according to
請求項5記載の発明に係る装置は、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する変換装置であって、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する第1の処理エンジンとを備え、前記第1の処理エンジンは、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開し、変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する、前記変換装置のため、前記名称学習辞書に、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を登録する装置において、前記第1の処理エンジンが前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを予め格納する解析NG論理インデックスセット・ファイルと、データを含む情報を入力するための入力手段と、データを含む情報を表示する表示手段と、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を登録する第2の処理エンジンとを備え、前記第2の処理エンジンは、オペレータにより前記入力手段を介して入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記の分解された単語に対応する論理インデックスを検索して、前記表示手段に表示し、前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定し、前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録する。The device according to
請求項6記載の発明に係る方法は、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、前記論理インデックスの組同士が包摂関係にある場合包摂される論理インデックスの組について、当該包摂される単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語の論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書と、を備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップとを実行させる。According to a sixth aspect of the present invention, there is provided a basic word dictionary in which each of a plurality of words is associated with a logical index representing each word and is registered in advance in storage means, and is registered in the basic word dictionary. A set of logical indexes corresponding to a set of words obtained by combining existing words is included in a name dictionary that is registered in advance in storage means in association with one piece of information specified by the set of words, and included in the set of words A logical index corresponding to a partial word or a set of logical indexes corresponding to a partial set of words included in the set of words, and a different format from the partial word or the partial set of words. A logical index corresponding to a word, or a set of logical indexes corresponding to a pair of words that is different in form from the partial word or a set of the partial words, and a logic registered in the name dictionary. Name learning dictionary registered in advance in storage means in association with one piece of information specified by the set of words corresponding to a set of indexes, and a logical index to be included when the set of logical indexes is in an inclusion relationship Is not included in the set of included words and is not used when directly specifying the one information, but is a word that assists in finally specifying the one information. An unnecessary word dictionary in which a logical index of an unnecessary word is associated with the one information and registered in advance in a storage unit, and one piece of information that specifies a lexical word including a plurality of words by the plurality of words In a computer that converts the data into another data, the words registered in the basic word dictionary are associated with a logical index representing each word and stored in a memory. A step of expanding, and when the set of logical indexes registered in the name dictionary is associated with the specified one piece of information corresponding to each set of logical indexes and expanded in the memory, the specified The name learning dictionary is searched using one piece of information as a key, and a logical index corresponding to the partial word or a logical index corresponding to the partial set of words corresponding to the specified one piece of information. A set of a logical index corresponding to the different-form word or a set of logical indexes corresponding to the different-form word into the logical index set and expanding the memory in the memory; and the unnecessary word A step of developing a logical index of an unnecessary word registered in a dictionary in the memory in association with the one information Decomposing a lexical word to be converted into a word, referring to a basic word dictionary expanded in memory on the memory, obtaining and converting a logical index corresponding to the decomposed word, Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set The logic corresponding to the decomposed word from the set including the logical index of the unnecessary word in the logical index set expanded in memory in the form in which the set of the logical index is incorporated into the logical index set. A set of logical indexes that matches one of the sets of logical indexes composed of multiple logical indexes of the indexes Selecting and using one piece of information specified by the set of selected logical indexes to convert the lexical word containing the plurality of words into another data containing the one piece of specified information. Let
請求項7記載の発明に係る方法は、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書とを備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとを実行させる。According to a seventh aspect of the present invention, there is provided a basic word dictionary in which each of a plurality of words is associated with a logical index representing each word and is registered in advance in storage means, and is registered in the basic word dictionary. A set of logical indexes corresponding to a set of words obtained by combining existing words is included in a name dictionary that is registered in advance in storage means in association with one piece of information specified by the set of words, and included in the set of words A logical index corresponding to a partial word or a set of logical indexes corresponding to a partial set of words included in the set of words, and a different format from the partial word or the partial set of words. A logical index corresponding to a word, or a set of logical indexes corresponding to a pair of words that is different in form from the partial word or the partial set of words is registered in the name dictionary. A name learning dictionary registered in advance in the storage means in association with one piece of information specified by the set of words corresponding to a set of indexes, and a lexical phrase including a plurality of words is specified by the plurality of words A computer for converting into another data including one piece of information; a step of expanding a word registered in the basic word dictionary in a memory in association with a logical index representing each word; When a set of registered logical indexes is associated with the specified one information corresponding to each set of logical indexes and expanded in the memory, the name learning is performed using the specified one information as a key. A logical index corresponding to the part of the word or the part of the word corresponding to the specified information by searching the dictionary A logical index set corresponding to a set and a logical index corresponding to the different format word or a logical index set corresponding to the different format word are incorporated into the logical index set and expanded in the memory. A step of decomposing a lexical word to be converted into words, a step of obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory And a logical index corresponding to the partial word or a set of logical indexes corresponding to the partial set of words, and a logical index corresponding to the malformed word or a pair of malformed words. The memory-expanded logical index set in which the logical index set is incorporated into the logical index set. A logical index set that matches one of the logical index sets composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed word is selected, and the selected logical index is selected. Converting a lexical phrase including the plurality of words into another data including the specified information, and a logical index corresponding to the partial word. Alternatively, a set of logical indexes corresponding to the partial set of words and a logical index corresponding to the different-form words or a set of logical indexes corresponding to the different-form words are incorporated into the set of logical indexes. From the set of logical indices expanded in memory, the logical When selecting a logical index set that matches one of the logical index sets composed of a plurality of logical indexes in the list, if there is no matching logical index set, the decomposed word is A step of displaying a corresponding logical index on a display means, and an operator inferred from the logical index corresponding to the decomposed word displayed on the display means and input by the operator via the input means Searching the name dictionary using one information as a key to obtain a set of logical indexes corresponding to the estimated one information, and obtaining the logical index corresponding to the decomposed word Identifying a logical index of a difference from a set of logical indexes, The logical index constant by the differential as a logical OR relationship, said and a step of registering the name learning dictionary in association with one of the information and said estimated.
請求項8記載の発明に係る方法は、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書とを備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合、その単語を特定し、当該特定された単語及び前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、前記表示手段に表示された前記特定された単語及び前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、前記特定された単語及び前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の単語及び論理インデックスを特定するステップと、前記差分の単語に論理インデックスを割り当てて、前記基本語辞書に登録するステップと、前記差分の単語を対応する論理インデックスに置換して、前記特定された差分の単語及び論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとを実行させる。A method according to an eighth aspect of the invention includes a basic word dictionary registered in advance in a storage means in association with a logical index representing each word, and a plurality of words registered in the basic word dictionary. A set of logical indexes corresponding to a set of words obtained by combining existing words is included in a name dictionary that is registered in advance in storage means in association with one piece of information specified by the set of words, and included in the set of words A logical index corresponding to a partial word or a set of logical indexes corresponding to a partial set of words included in the set of words, and a different format from the partial word or the partial set of words. A logical index corresponding to a word, or a set of logical indexes corresponding to a pair of words that is different in form from the partial word or the partial set of words is registered in the name dictionary. A name learning dictionary registered in advance in the storage means in association with one piece of information specified by the set of words corresponding to a set of indexes, and a lexical phrase including a plurality of words is specified by the plurality of words A computer for converting into another data including one piece of information; a step of expanding a word registered in the basic word dictionary in a memory in association with a logical index representing each word; When a set of registered logical indexes is associated with the specified one information corresponding to each set of logical indexes and expanded in the memory, the name learning is performed using the specified one information as a key. A logical index corresponding to the part of the word or the part of the word corresponding to the specified information by searching the dictionary A logical index set corresponding to a set and a logical index corresponding to the different format word or a logical index set corresponding to the different format word are incorporated into the logical index set and expanded in the memory. A step of decomposing a lexical word to be converted into words, a step of obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory And a logical index corresponding to the partial word or a set of logical indexes corresponding to the partial set of words, and a logical index corresponding to the malformed word or a pair of malformed words. The memory-expanded logical index set in which the logical index set is incorporated into the logical index set. A logical index set that matches one of the logical index sets composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed word is selected, and the selected logical index is selected. Converting a lexical phrase including the plurality of words into another data including the specified information, and a basic word expanded in the memory When obtaining and converting a logical index corresponding to the decomposed word with reference to the dictionary, if there is a word for which a logical index cannot be obtained, the word is specified, the identified word and the decomposition Displaying a logical index corresponding to the designated word on the display means, and the identified word and the word displayed on the display means. One name estimated by the operator from the logical index corresponding to the decomposed word and searching the name dictionary using one piece of information input by the operator through the input means as a key Obtaining a set of logical indexes corresponding to, and identifying a difference word and logical index between the identified word and the logical index corresponding to the decomposed word and the obtained logical index set Assigning a logical index to the difference word and registering it in the basic word dictionary, replacing the difference word with a corresponding logical index, and replacing the identified difference word and logical index with each other. The name learning dictionary as a logical sum relationship and associated with the estimated one information And a step of registering.
請求項9記載の発明に係る方法は、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、前記論理インデックスの組同士が包摂関係にある場合包摂される論理インデックスの組について、当該包摂される単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語の論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書と、を備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、前記いずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書及び前記不要語辞書を検索して、当該推定される1つの情報に対応する不要語を含めた論理インデックスの組を取得するステップと、前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとを実行させる。The method according to the ninth aspect of the invention includes a basic word dictionary registered in advance in a storage means in association with a logical index representing each word, and a plurality of words registered in the basic word dictionary. A set of logical indexes corresponding to a set of words obtained by combining existing words is included in a name dictionary that is registered in advance in storage means in association with one piece of information specified by the set of words, and included in the set of words A logical index corresponding to a partial word or a set of logical indexes corresponding to a partial set of words included in the set of words, and a different format from the partial word or the partial set of words. A logical index corresponding to a word, or a set of logical indexes corresponding to a pair of words that is different in form from the partial word or the partial set of words is registered in the name dictionary. Name learning dictionary registered in advance in storage means in association with one piece of information specified by the set of words corresponding to a set of indexes, and a logical index to be included when the set of logical indexes is in an inclusion relationship Is not included in the set of included words and is not used when directly specifying the one information, but is a word that assists in finally specifying the one information. An unnecessary word dictionary in which a logical index of an unnecessary word is associated with the one information and registered in advance in a storage unit, and one piece of information that specifies a lexical word including a plurality of words by the plurality of words In a computer that converts the data into another data, the words registered in the basic word dictionary are associated with a logical index representing each word and stored in a memory. A step of expanding, and when the set of logical indexes registered in the name dictionary is associated with the specified one piece of information corresponding to each set of logical indexes and expanded in the memory, the specified The name learning dictionary is searched using one piece of information as a key, and a logical index corresponding to the partial word or a logical index corresponding to the partial set of words corresponding to the specified one piece of information. A set of a logical index corresponding to the different-form word or a set of logical indexes corresponding to the different-form word into the logical index set and expanding the memory in the memory; and the unnecessary word A step of developing a logical index of an unnecessary word registered in a dictionary in the memory in association with the one information Decomposing a lexical word to be converted into a word, referring to a basic word dictionary expanded in memory on the memory, obtaining and converting a logical index corresponding to the decomposed word, Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set The logic corresponding to the decomposed word from the set including the logical index of the unnecessary word in the logical index set expanded in memory in the form in which the set of the logical index is incorporated into the logical index set. A set of logical indexes that matches one of the sets of logical indexes composed of multiple logical indexes of the indexes Converting the lexical phrase including the plurality of words into another data including the specified one information by selecting and using one information specified by the selected set of logical indexes; and Displaying a logical index corresponding to the decomposed word on the display means when selecting a logical index set that matches any of the logical index sets, if there is no matching logical index set; The name dictionary and the unnecessary are estimated by an operator from the logical index corresponding to the decomposed word displayed on the display means and input by the operator via the input means as a key. A word dictionary is searched and a logical index including an unnecessary word corresponding to the one piece of estimated information is searched. Determining a logical index of a difference between the logical index corresponding to the decomposed word and the set of logical indexes acquired, and logically calculating the logical index of the identified difference. A step of registering in the name learning dictionary as a sum relation and associating with the estimated one information is executed.
請求項10記載の発明に係る方法は、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書とを備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを解析NG論理インデックスセット・ファイルに予め格納するステップと、オペレータにより前記入力手段を介して入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記の分解された単語に対応する論理インデックスを検索して、表示手段に表示するステップと、前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとを実行させる。The method according to
請求項11記載の発明に係るプログラムは、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、前記論理インデックスの組同士が包摂関係にある場合包摂される論理インデックスの組について、当該包摂される単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語の論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書と、を備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップとを実行させる。According to an eleventh aspect of the present invention, there is provided a basic word dictionary in which each of a plurality of words is associated with a logical index representing each word and registered in a storage unit in advance, and is registered in the basic word dictionary. A set of logical indexes corresponding to a set of words obtained by combining existing words is included in a name dictionary that is registered in advance in storage means in association with one piece of information specified by the set of words, and included in the set of words A logical index corresponding to a partial word or a set of logical indexes corresponding to a partial set of words included in the set of words, and a different format from the partial word or the partial set of words. A logical index corresponding to a word or a set of logical indexes corresponding to a pair of words that is different in form from the partial word or the set of partial words is registered in the name dictionary. The name learning dictionary registered in advance in storage means in association with one piece of information specified by the set of words corresponding to the set of logical indexes and the set of logical indexes are included if they are in an inclusion relationship. A set of logical indexes is not included in the included word set and is not used when directly specifying the one piece of information, but assists in finally identifying the one piece of information. An unnecessary word dictionary that is pre-registered in the storage means in association with the one piece of information, and that includes a plurality of words that are specified by the plurality of words. A computer that converts the data into another data including information, and associates the words registered in the basic word dictionary with a logical index representing each word. When the memory is expanded on the memory in association with the specified one piece of information corresponding to each logical index set. The name learning dictionary is searched using one piece of information as a key, and a logical index corresponding to the part of the word or a logic corresponding to the part of the pair of words corresponding to the one piece of specified information. A set of indexes and a logical index corresponding to the malformed word or a set of logical indexes corresponding to the malformed word are incorporated into the set of logical indexes and expanded in the memory; and The logical index of unnecessary words registered in the unnecessary word dictionary is associated with the one information and expanded in the memory. A step of decomposing a lexical word to be converted into a word, a step of obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory. , A logical index corresponding to the partial word or a logical index set corresponding to the partial word set, and a logical index corresponding to the malformed word or a logical index corresponding to the malformed word set. Corresponding to the decomposed word from the set including the logical index of the unnecessary word in the logical index set expanded in memory in a form in which the index set is incorporated into the logical index set. A logical index that matches one of the logical index sets that are composed of multiple logical indexes. A pair of words, and using one piece of information specified by the set of selected logical indexes, the lexical word containing the plurality of words is converted into another data containing the one piece of specified information. Step.
請求項12記載の発明に係るプログラムは、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書とを備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとを実行させる。The program according to the invention of
請求項13記載の発明に係るプログラムは、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書とを備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合、その単語を特定し、当該特定された単語及び前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、前記表示手段に表示された前記特定された単語及び前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、前記特定された単語及び前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の単語及び論理インデックスを特定するステップと、前記差分の単語に論理インデックスを割り当てて、前記基本語辞書に登録するステップと、前記差分の単語を対応する論理インデックスに置換して、前記特定された差分の単語及び論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとを実行させる。 According to a thirteenth aspect of the present invention, there is provided a basic word dictionary in which each of a plurality of words is associated with a logical index representing each word and registered in a storage unit in advance, and is registered in the basic word dictionary. a set of logical root indexes corresponding to the set of words that combine words each other are, the name dictionary registered in advance in the storage means in association with one information specified by a set of said word, included in the set of words A logical index corresponding to a partial word or a set of logical indexes corresponding to a partial set of words included in the set of words, and a different format from the partial word or the partial set of words . a set of logical root indexes corresponding to the logical indexes or set of words set and format differences of words or word of the part of the portion corresponding to a word, registered in the name dictionary That a single information in association with the name learning dictionary registered in advance in the storage means specified by said set of words corresponding to the set of logical index, identifies the token comprising a plurality of words by the plurality of words Expanding the words registered in the basic word dictionary in a memory in association with a logical index representing each word in a computer that converts the data into another data including one piece of information, and the name When a set of logical indexes registered in the dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is used as a key. searching the name learning dictionary, logical indexes or the one corresponding to one of information the specified, corresponding to a word of the portion A set of logical root indexes corresponding to the set of words, the logical index or the memory incorporating a set of logical indexes set of logical root indexes corresponding to the set of words of the form difference corresponding to a word of difference the form Expanding a memory into a memory, decomposing a lexical word to be converted into a word, referring to a basic word dictionary expanded in the memory on the memory, and obtaining a logical index corresponding to the decomposed word; A conversion step; a logical index corresponding to the partial word or a logical index set corresponding to the partial word set; and a logical index corresponding to the malformed word or the heterogenous word set. The logical index expanded in memory is incorporated into the set of logical indexes corresponding to A set of logical indexes that matches one of the sets of logical indexes composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed word, and selected by using one of information specified by a set of logical indexes have, converting the lexical including the plurality of words into another data including one of information the identified memory is expanded on the memory When there is a word for which a logical index cannot be obtained when obtaining and converting a logical index corresponding to the decomposed word with reference to the basic word dictionary, the word is identified, and the identified word and Displaying a logical index corresponding to the decomposed word on a display means; and the specified index displayed on the display means. The name is estimated by an operator from the logical index corresponding to the word and the decomposed word, and is estimated by searching the name dictionary using one piece of information input by the operator through the input means as a key. Obtaining a set of logical indexes corresponding to one piece of information, and a difference word and logical index between the logical index corresponding to the identified word and the decomposed word and the set of logical index obtained Identifying a difference index word, assigning a logical index to the difference word and registering it in the basic word dictionary, replacing the difference word with a corresponding logical index, and identifying the difference word and logic The name is related to an index as a logical sum and associated with the one piece of estimated information. Ru is executed and a step to be registered in the習辞statement.
請求項14記載の発明に係るプログラムは、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、前記論理インデックスの組同士が包摂関係にある場合包摂される論理インデックスの組について、当該包摂される単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語の論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書と、を備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、前記いずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書及び前記不要語辞書を検索して、当該推定される1つの情報に対応する不要語を含めた論理インデックスの組を取得するステップと、前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとを実行させる。According to a fourteenth aspect of the present invention, there is provided a basic word dictionary in which each of a plurality of words is associated with a logical index representing each word and is registered in advance in storage means, and is registered in the basic word dictionary. A set of logical indexes corresponding to a set of words obtained by combining existing words is associated with one piece of information specified by the set of words, and is included in the set of words and pre-registered in storage means A logical index corresponding to a partial word or a set of logical indexes corresponding to a partial set of words included in the set of words, and a different format from the partial word or the partial set of words. A logical index corresponding to a word or a set of logical indexes corresponding to a pair of words or a part of a word that is different in form from the partial word or the pair of words The name learning dictionary registered in advance in storage means in association with one piece of information specified by the set of words corresponding to the set of logical indexes and the set of logical indexes are included if they are in an inclusion relationship. A set of logical indexes is not included in the included word set and is not used when directly specifying the one piece of information, but assists in finally identifying the one piece of information. An unnecessary word dictionary that is pre-registered in the storage means in association with the one piece of information, and that includes a plurality of words that are specified by the plurality of words. A computer that converts the data into another data including information, and associates the words registered in the basic word dictionary with a logical index representing each word. When the memory is expanded on the memory in association with the specified one piece of information corresponding to each logical index set. The name learning dictionary is searched using one piece of information as a key, and a logical index corresponding to the part of the word or a logic corresponding to the part of the pair of words corresponding to the one piece of specified information. A set of indexes and a logical index corresponding to the malformed word or a set of logical indexes corresponding to the malformed word are incorporated into the set of logical indexes and expanded in the memory; and The logical index of unnecessary words registered in the unnecessary word dictionary is associated with the one information and expanded in the memory. A step of decomposing a lexical word to be converted into a word, a step of obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory. , A logical index corresponding to the partial word or a logical index set corresponding to the partial word set, and a logical index corresponding to the malformed word or a logical index corresponding to the malformed word set. Corresponding to the decomposed word from the set including the logical index of the unnecessary word in the logical index set expanded in memory in a form in which the index set is incorporated into the logical index set. A logical index that matches one of the logical index sets that are composed of multiple logical indexes. A pair of words, and using one piece of information specified by the set of selected logical indexes, the lexical word containing the plurality of words is converted into another data containing the one piece of specified information. When selecting a logical index set that matches the logical index set in any one of the steps, if there is no matching logical index set, the logical index corresponding to the decomposed word is displayed on the display means. And displaying the name by using one piece of information input by the operator via the input means as estimated from the logical index corresponding to the decomposed word displayed on the display means and the decomposed word displayed on the display means. A logical index including unnecessary words corresponding to the estimated one piece of information by searching the dictionary and the unnecessary word dictionary. Obtaining a set of files, identifying a logical index of a difference between the logical index corresponding to the decomposed word and the obtained set of logical indexes, and the logic of the identified difference A step of registering the index in the name learning dictionary in association with the estimated one piece of information as a logical sum relationship is performed.
請求項15記載の発明に係るプログラムは、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書とを備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを解析NG論理インデックスセット・ファイルに予め格納するステップと、オペレータにより前記入力手段を介して入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記の分解された単語に対応する論理インデックスを検索して、表示手段に表示するステップと、前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとを実行させる。According to a fifteenth aspect of the present invention, there is provided a basic word dictionary in which each of a plurality of words is associated with a logical index representing each word and registered in a storage unit in advance, and is registered in the basic word dictionary. A set of logical indexes corresponding to a set of words obtained by combining existing words is included in a name dictionary that is registered in advance in storage means in association with one piece of information specified by the set of words, and included in the set of words A logical index corresponding to a partial word or a set of logical indexes corresponding to a partial set of words included in the set of words, and a different format from the partial word or the partial set of words. A logical index corresponding to a word or a set of logical indexes corresponding to a pair of words or a part of a word that is different in form from the partial word or the pair of words A name learning dictionary pre-registered in the storage means in association with one piece of information specified by the set of words corresponding to the set of logical indexes, and specifying a lexical phrase including a plurality of words by the plurality of words Expanding the words registered in the basic word dictionary in a memory in association with a logical index representing each word in a computer that converts the data into another data including one piece of information, and the name When a set of logical indexes registered in the dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is used as a key. The name learning dictionary is searched, and the logical index corresponding to the part of words corresponding to the specified one information or the one A logical index set corresponding to the word set and a logical index corresponding to the different format word or a logical index set corresponding to the different format word are incorporated into the logical index set on the memory. Expanding a memory into a memory, decomposing a lexical word to be converted into a word, referring to a basic word dictionary expanded in the memory on the memory, and obtaining a logical index corresponding to the decomposed word; A conversion step; a logical index corresponding to the partial word or a logical index set corresponding to the partial word set; and a logical index corresponding to the malformed word or the heterogenous word set. The logical index set corresponding to is expanded in the form of the logical index incorporated in the logical index set. A set of logical indexes that matches one of the sets of logical indexes composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed word, and selected Using a piece of information specified by the set of logical indexes, converting a lexical phrase including the plurality of words into another data including the specified information, and corresponding to the partial word A logical index set corresponding to the set of logical indexes or the partial word set, and a logical index corresponding to the different format word or a set of logical indexes corresponding to the different format word. Corresponding to the decomposed word from the set of logical indexes expanded in memory in a form incorporated into the set When selecting a logical index set that matches any logical index set composed of a plurality of logical indexes among the logical indexes, if there is no matching logical index set, the decomposed word In response to a search command input via the input means by an operator in advance, a logical index corresponding to is stored in the analysis NG logical index set file, and at least applicable from the analysis NG logical index set file The logical index corresponding to the decomposed word is retrieved and displayed on the display means, and the operator estimates from the logical index corresponding to the decomposed word displayed on the display means, Input by the operator via the input means. Searching the name dictionary using one piece of information as a key to obtain a set of logical indexes corresponding to the estimated one piece of information, and obtaining the logical index corresponding to the decomposed word and the obtaining A step of specifying a logical index of a difference from the set of specified logical indexes, and registering the specified logical index of the difference as a logical sum relationship in association with the one piece of estimated information in the name learning dictionary And executing a step.
本発明の一態様によれば、名称学習辞書は不要語を含まないことが好ましい。 According to one aspect of the present invention, the name learning dictionary preferably does not include unnecessary words.
本発明は前述のような構成により、複数の単語を含む字句、例えば名称の入力データとして、名称辞書に登録されている複数の単語を含む、字句、例えば名称と多少異なる形式の単語が入力されても、名称辞書に登録されている複数の単語を含む字句により特定される正しい1つの情報例えばCIFコードに変換することができ、従って解析力の向上が図れる。 The present invention are shorted with a as described above arrangement, the lexical containing words of several, for example, as input data name, including a plurality of words registered in the name dictionary, lexical, word somewhat different form, for example, the name Can be converted into correct one information specified by a lexical word including a plurality of words registered in the name dictionary, for example, a CIF code, and thus the analysis power can be improved.
本発明の好適な実施形態を以下図面を参照して説明する。なお、図面を通して同一又は類似の参照番号は同一又は類似の構成要素を示す。
図1は、銀行等で受信する決済指図電文等について計算機を使用して取引先顧客情報(CIF)解析処理に本発明を適用した場合の好適な実施形態に従った字句をデータに変換する装置の基本構成を示す図である。図1において、10はメイン・フレーム・コンピュータ、パーソナル・コンピュータ、マイクロプロセッサ等の任意のデータ処理装置より構成される処理エンジンを、12はメイン・メモリを、14は基本語辞書を、16は名称辞書を、18は不要語辞書を、24は名称学習辞書をそれぞれ示す。基本語辞書14、名称辞書16、不要語辞書18及び名称学習辞書24は、磁気ディスク等のハード・ディスク(図示せず)に格納されているが、これに限定されず、いずれの他の形式の記憶装置に格納され得る。処理エンジン10として機能するデータ処理装置と、メイン・メモリ12、及び基本語辞書14、名称辞書16、不要語辞書18及び名称学習辞書24を格納するハード・ディスクとは通常のデータ・バス等(図示せず)により相互に結合されている。
Preferred embodiments of the present invention will be described below with reference to the drawings. Throughout the drawings, the same or similar reference numerals indicate the same or similar components.
FIG. 1 shows an apparatus for converting a lexical word into data according to a preferred embodiment when the present invention is applied to a customer customer information (CIF) analysis process using a computer for a settlement instruction message received at a bank or the like. It is a figure which shows the basic composition. In FIG. 1, 10 is a processing engine composed of an arbitrary data processing device such as a main frame computer, personal computer, microprocessor, 12 is a main memory, 14 is a basic word dictionary, and 16 is a name. A dictionary, 18 is an unnecessary word dictionary, and 24 is a name learning dictionary. The
図2は、基本語辞書14に事前に登録されている単語(以下、「基本語」とも言う。)をメイン・メモリ12上にメモリ展開した状態を示す。銀行等におけるCIF解析処理で扱う入力データは、通常アルファベット及びニューメリック(数字)から成り、従って、基本語辞書14に登録されている単語もアルファベット及びニューメリック(数字)から構成されている。なお、本明細書における単語あるいは基本語には、普通名詞、固有名詞、略語が含まれるのは勿論、その他、ある意味を有するいずれの一組の記号も含まれる。図2に示すように、基本語辞書14の一例は、項目として、単語、品詞、名称の属性、コードの属性、及び登録された各単語に対応する数字で表される論理インデックスを含む。この論理インデックスの数字は、CPU処理単位数を小さくするため、2進数で表現された数字であることが好ましい。本発明の基本語辞書としては基本語を登録するための単語の欄と、その単語に対応する数字の論理インデックスを格納するための論理インデックスの欄を少なくとも含めばよく、その他の項目は上記のものに限定されるものではない。論理インデックスは、基本語が基本語辞書14の単語の欄に登録されるとき、その単語に対応する数字(定値)が割り振られ、基本語辞書14の論理インデックスの欄に、登録される基本語と関連付けられて当該数字も格納、即ち登録される。基本語辞書14は、変換すべき字句に登録されていない基本語を含む場合、新たな基本語及びそれに対応する論理インデックスを登録し、また登録済みの基本語で使用しなくなった場合に当該基本語及びその対応の論理インデックスを削除できる。
FIG. 2 shows a state where words (hereinafter, also referred to as “basic words”) registered in advance in the
処理エンジン10は、変換処理を開始する前に、図2に示すように、基本語辞書14に登録されている基本語をメイン・メモリ12上にメモリ展開する。メモリ・アドレスは動的に割り付けられるので、プログラムをメモリ・ロードする度に、同じ単語が同一のメモリ・アドレスの場所に格納されるわけではなく、メモリ・アドレスが異なるのが一般的である。従って、この例では、単語の欄の基本語「AKASAKA」について、プログラムが所与の時点でメモリ・ロードされたとき動的に割り付けられるメイン・メモリ12上のメモリ・アドレスとして50番が割り付けられ、その場所に「AKASAKA」に関する情報が格納される。メモリ・アドレスとは対照的に、基本語「AKASAKA」は、メイン・メモリ12上で定値の論理インデックス「#100」と関連付けられて格納されていることに注目されたい。なお、高速処理の観点からは、基本語辞書14を全てメイン・メモリ12上にメモリ展開するのが好ましいが、変換すべき字句に含まれる基本語が事前に分かっている場合には、用いられる基本語だけをメイン・メモリ12上にメモリ展開してもよく、更に、用途によっては、変換処理速度が遅くなるが、基本語辞書14に登録されている基本語の一部分をメモリ展開し、未展開の基本語が変換処理に必要になったとき追加的にメモリ展開するようにしてもよい。
The
図3は、名称辞書16及び名称学習辞書24のそれぞれに事前に登録されている論理インデックスセットをメイン・メモリ12上にメモリ展開した状態を示す。なお、図3に示す例は、不要語辞書18を用いない場合である。図3にはまた、図2と同様の基本語辞書14に事前に登録されている基本語をメイン・メモリ12上にメモリ展開した状態をも示す。
FIG. 3 shows a state in which logical index sets registered in advance in the
図3に示すように、名称辞書16の項目は、論理インデックスセット、名称、及び名称に示される単語の組み合わせにより特定される1つの情報、例えば、この銀行の応用の例ではCIFコードから成る。名称辞書16の名称の欄には、基本語辞書14に登録されている基本語のうちで、CIFコードが特定される基本語の組み合わせに含まれる基本語が事前に登録されている。一例として、単語の組み合わせ「THE BANK OF TOKYO−NAKAMORI LTD」によりCIFコード「8760000」が特定されるとする。図3では、単語の組み合わせが1例のみ示されているが、実際には多数の登録されている。そこで、名称辞書16の第1行には「THE BANK OF TOKYO−NAKAMORI LTD」が文字列として登録されており、第2行目以下も同様に他の単語の組み合わせが文字列として登録されている。論理インデックスセットの欄には、これらの組み合わされた基本語に対応する論理インデックスの組が登録されている。例えば、名称辞書16の第1行には、名称「THE BANK OF TOKYO−NAKAMORI LTD」に対応して、「#501,#101,#502,#505,#104」が、基本語辞書14の論理インデックスの組として登録され、第2行目以下も別の論理インデックスの組として同様に登録されている。CIFコードの欄には、各名称に対応する固有の番号が登録される。例えば、名称辞書16の第1行には、「THE BANK OF TOKYO−NAKAMORI LTD」に対応するCIFコード「8760000」が登録され、第2行目以下も同様に別のCIFコードが登録されている。
As shown in FIG. 3, the item of the
名称辞書16は、変換すべき字句に、登録されていない基本語の組み合わせがある場合、新たな基本語を含む組み合わせを登録し、また登録済みの組み合わせで使用しなくなった場合に削除できる。
The
名称学習辞書24の項目は、図3に示すように、名称学習辞書語論理インデックスセット、名称学習語名称及びCIFコードから成る。名称学習語名称とは、名称辞書16に登録されている名称に用いられている単語又は単語の組と形式が異なる単語又は単語の組み合わせで入力データとして入力される可能性のあるものである。例えば、図3の例で具体的に説明すると、名称辞書16に登録されている単語「TOKYO−NAKAMORI」に対して単語「TOKYO」と単語「NAKAMORI」とをハイフンで接続せずに、スペースで2つの単語として入力される可能性がある場合、両者は、本明細書では名称学習語名称と称する。
As shown in FIG. 3, the items in the
ここで、3つの単語「TOKYO−NAKAMORI」、「TOKYO」、「NAKAMORI」は図3の基本語辞書14aに示されるように基本語辞書14に登録済みであるとする。なお、図2と図3は説明の目的が異なるため、登録されている単語は一致していない。ここでの説明は、図3におけるメモリ展開された基本語辞書14aの内容が図2に示す基本語辞書14に登録されているとしている。図3に示されるように、名称学習辞書24の名称学習語名称の項には、単語「TOKYO−NAKAMORI」と、単語「TOKYO」と単語「NAKAMORI」とをスペースで結合した単語の組とが論理和として定義され、それに対応して名称学習辞書語論理インデックスの項には、それらの単語に対応する論理インデックスが論理和として定義されている。更に、名称学習辞書24のCIFコードの項には、単語「TOKYO−NAKAMORI」を含む名称に対応するCIFコード「8760000」が登録されている。
Here, it is assumed that the three words “TOKYO-NAKAMORI”, “TOKYO”, and “NAKAMORI” have been registered in the
名称学習辞書24の名称学習辞書語論理インデックス及び名称学習語名称には、2つのみでなく、それより多くのものを論理和として定義可能である。また、名称学習辞書24は、新たな登録すべき単語又は単語の組み合わせの発生又は消滅が生じた場合追加の登録あるいは削除が可能である。なお、登録あるいは削除の方法は本発明では任意である。好適な登録方法については後述する。
The name learning dictionary word logical index and the name learning word name of the
次に、図1に示す装置の動作を図4のフローチャートを参照して説明する。
処理エンジン10は、ステップ100において初期処理を行う。図3を参照して説明したように、基本語辞書14に登録されている単語をメイン・メモリ12へメモリ展開する(その展開状態を図3の14aとして示す。)。次いで、名称辞書16に登録されている論理インデックスセットとCIFコードとを関連付けて、図3の参照番号16aで示されるようにメイン・メモリ12上へメモリ展開する。その際に、CIFコードをキーとして、名称学習辞書24を検索して名称学習辞書語論理インデックスセットが存在する場合には、該当の名称学習辞書語論理インデックスを全て名称辞書16の論理インデックスの中の対応する論理インデックスと置換してメモリ展開する。名称辞書16の論理インデックスセットの中の「#505」は、該当する名称学習辞書語論理インデックスが存在しない場合には、そのままメモリ展開されるが、この例では該当する名称学習辞書語論理インデックスセットが存在するので、「#505|#503,#105」(「|」は論理和を表す。)に置換して、図3の参照番号200で示すようにメイン・メモリ12にメモリ展開する。
Next, the operation of the apparatus shown in FIG. 1 will be described with reference to the flowchart of FIG.
The
処理エンジン10は、次に図4の入力データ解析110を行う。図5に示す入力データ例を参照して説明する。ステップ112において、図5の1に示すように、入力データとして「THE BANK OF TOKYO NAKAMORI LTD」が入力されたとする。次いで、図5の2に示すように、スペースを手がかりにして単語に分解する。処理エンジン10は、ステップ114において、図5の3に示すように、メイン・メモリ12上にメモリ展開された基本語辞書14aを参照して、参照番号60に示すように論理インデックスを取得する。次いで、図5の4に示すように、入力データを論理インデックスに変換する(62参照)。
Next, the
処理エンジン10は、続いてマッチング処理120を行う。処理エンジン10は、図4のステップ116で、変換された論理インデックスの組(図5の4の62参照)でメモリ展開された名称辞書16aを検索する。図3の参照番号64で示す論理インデックスセットは、実際には図5の5の参照番号66で示される2つの論理インデックスセットの組となるので、処理エンジン10は、参照番号62の入力データの論理インデックスの組と、参照番号66で示す2つの論理インデックスの組とを逐一比較する。その結果参照番号66の下側の組と入力データの論理インデックスの組とが一致するので、CIFコードとして「8760000」を特定することができ、入力データはこのCIFコードに変換される(図4のステップ118及び122、及び図5の参照番号68参照)。なお、一致しない場合は、処理エンジン10は、解析NGとして処理する(図4のステップ124参照)。
Next, the
次に、不要語辞書18を含む実施形態について以下に説明する。不要語辞書18は、名称間で包摂関係が生じている場合にも、CIFコードを特定する機能を果たすものである。ここで、包摂関係とは、顧客名称等の辞書登録されている複数の論理インデックスセット間において発生し、一方が他方の論理インデックスセットを包含した登録が行われている状態のことである。顧客名称等の重要部分を論理インデックスセットで表したとき、相異なる複数のCIFコード等の間では、一方が他方を含む包摂関係を生じることがあり得る。
Next, an embodiment including the
図6は、名称辞書16、名称学習辞書24及び不要語辞書18のそれぞれに事前に登録されている論理インデックスセット又は論理インデックスをメイン・メモリ12上にメモリ展開した状態を示す。図6にはまた、図2と同様の基本語辞書14に事前に登録されている基本語をメイン・メモリ12上にメモリ展開した状態をも示す。図6において、図3と同じ参照番号を付した構成要素は、図3の同一の参照番号により示す構成要素と同じであり、そのメモリ展開も同様であるので、説明を省く。
FIG. 6 shows a state where a logical index set or a logical index registered in advance in each of the
不要語辞書18の項目は、図6に示すように、CIFコード及び不要語の論理インデックスから成る。不要語は、名称辞書16の論理インデックスセットに登録されないため、CIFコードを直接特定する際に用いられない点で不要であるがCIFコードを最終的に特定するのを補助する単語である。なお、不要語は、多くの場合1つの単語であるが、複数の単語から成っていてもよい。図6に示す例では、CIFコードの欄に「8760000」が登録されており、この「8760000」に対して、「MARUNOUCHI」が不要語であるので、この「MARUNOUCHI」に対応する論理インデックス「#300」(図6に示すメモリ展開された基本語辞書14a参照)が不要語の論理インデックスの欄に登録されている。なお、不要語は1つの場合もあるが、このように複数の単語が不要語になり得るので、不要語辞書18の不要語の欄は、複数の単語の論理インデックスを登録することができる構造を有する。
As shown in FIG. 6, the items of the
不要語辞書18は、新たな包摂関係の発生あるいは消滅、あるいは新たな不要語の発生あるいは消滅の場合変更できる。
次に、不要語辞書18を含む図1に示す装置の動作を図4のフローチャートを再度参照して説明する。
The
Next, the operation of the apparatus shown in FIG. 1 including the
処理エンジン10は、ステップ100において初期処理を行う。図6を参照して説明したように、基本語辞書14に登録されている単語をメイン・メモリ12へメモリ展開する(その展開状態を図6の14aとして示す。)。次いで、名称辞書16に登録されている論理インデックスセットとCIFコードとを関連付けて、図6の参照番号16aで示されるようにメイン・メモリ12上へメモリ展開する。その際に、CIFコードをキーとして、名称学習辞書24を検索して名称学習辞書語論理インデックスが存在する場合には、該当の名称学習辞書語論理インデックスを全て名称辞書16の論理インデックスの中の対応する論理インデックスと置換してメモリ展開する。名称辞書16の論理インデックスセットの中の「#505」は、該当する名称学習辞書語論理インデックスが存在しない場合には、そのままメモリ展開されるが、この例では該当する名称学習辞書語論理インデックスが存在するので、「#505|#503,#105」(「|」は論理和を表す。)に置換して、参照番号200で示すようにメイン・メモリ12にメモリ展開する。更に、不要語辞書18に登録されているCIFコードと不要語の論理インデックスとを関連付けて、図6の参照番号18aに示されるようにメイン・メモリ12上へメモリ展開する。
The
処理エンジン10は、次に図4の入力データ解析110を行う。図7に示す入力データ例を参照して説明する。ステップ112において、図7の1に示すように、入力データとして「THE BANK OF TOKYO NAKAMORI LTD MARUNOUCHI」が入力されたとする。次いで、図7の2に示すように、スペースを手がかりにして単語に分解する。処理エンジン10は、ステップ114において、図7の3に示すように、メイン・メモリ12上にメモリ展開された基本語辞書14aを参照して、参照番号70に示すように論理インデックスを取得する。次いで、図7の4に示すように、入力データを論理インデックスに変換する(72参照)。
Next, the
処理エンジン10は、続いてマッチング処理120を行う。処理エンジン10は、図4のステップ116で、変換された論理インデックスの組(図7の4の72参照)でメモリ展開された名称辞書16aを検索する。ここで、図6の参照番号64で示す論理インデックスセットは、実際には図7の5の参照番号76で示される2つの論理インデックスセットの組となるので、処理エンジン10は、参照番号72の入力データの論理インデックスの組と、参照番号76で示す2つの論理インデックスの組とを逐一比較する。その際、CIFコードと関連付けられた不要語の論理インデックスが存在する場合には、上記2つの論理インデックスの組に該当する不要語の論理インデックスも含めて比較を行う。このケースでは、不要語としての「MARUNOUCHI」に対応する論理インデックス「#300」が存在するので、入力データの論理インデックスの組と、図7の参照番号76で示される2つの論理インデックスの組に「#300」を含めたもの(図7に「#300」は図示せず)とを比較する。その結果参照番号76の下側の組と入力データの論理インデックスの組とが一致するので、CIFコードとして「8760000」を特定することができ、入力データはこのCIFコードに変換される(図4のステップ118及び122、及び図7の参照番号78参照)。なお、一致しない場合は、処理エンジン10は、解析NGとして処理する(図4のステップ124参照)。
Next, the
なお、名称学習辞書24は不要語を含まないことが好ましい。
次に、図1の装置に利用され、名称学習辞書24へ論理インデックス等を登録する方法及び装置の本発明の好適な実施形態について、図8〜図20を参照して以下に説明する。
The
Next, a preferred embodiment of the method and apparatus for registering a logical index or the like in the
図8は、名称学習辞書24へ論理インデックス等を登録する方法及び装置の本発明の好適な実施形態を示す。図8において、410はメイン・フレーム・コンピュータ、パーソナル・コンピュータ、マイクロプロセッサ等の任意のデータ処理装置より構成される処理エンジンを、412はメイン・メモリを、14は基本語辞書を、16は名称辞書を、18は不要語辞書を、24は名称学習辞書をそれぞれ示す。処理エンジン410及びメイン・メモリ412は、図1の装置の処理エンジン10及びメイン・メモリ12と同じであっても別であってもよい。基本語辞書14、名称辞書16、不要語辞書18及び名称学習辞書24は図1の装置のものと同じである。26は、CIFを特定できず解析NGとなった論理インデックスセットを格納する解析NG論理インデックスセット・ファイルである。基本語辞書14、名称辞書16、不要語辞書18、名称学習辞書24及び解析NG論理インデックスセット・ファイル26は、磁気ディスク等のハード・ディスク(図示せず)に格納されているが、これに限定されず、いずれの他の形式の記憶装置に格納され得る。30はデータ等を入力するためのキーボード等の入力装置であり、32はデータ等を表示するための通常の液晶ディスプレイ等の表示装置である。処理エンジン410として機能するデータ処理装置と、メイン・メモリ412、及び基本語辞書14、名称辞書16、不要語辞書18、名称学習辞書24及び解析NG論理インデックスセット・ファイル26を格納するハード・ディスク、入力装置30及び表示装置32とは通常のデータ・バス等(図示せず)により相互に結合されている。なお、図8に示す装置の構成要素及び機能を図1の装置を拡張して組み込んでもよい。
FIG. 8 shows a preferred embodiment of the present invention of a method and apparatus for registering a logical index or the like in the
最初に、本発明の名称学習辞書24が存在しない従来までのCIF特定の概念を用いた場合を、図9及び図10を用いて説明する。
図9は、前述のように、名称辞書16及び図2の基本語辞書をそれぞれをメモリ展開した内容を示す。図10は、入力データが論理インデックスに変換されるまでの処理を示す。図8に示す装置に、入力データとして、図10の1に示す「THE BANK OF TOKYO NAKAMORI LTD」が入力されたとする。図10の2に示すように、スペースを手がかりにして単語を分解する。次いで、図10の3に示すように、メイン・メモリ412上の基本語辞書14a(図9)を参照して、論理インデックスを取得する。図10の4に示すように、入力データを論理インデックスに変換する。図10の5に示すように、入力データの論理インデックスで名称辞書16a(図9)を検索する。このとき、従来のマッチング処理では、入力データの論理インデックス「#501,#101,#502,#503,#105,#104」(図10の4の300参照)を使って、図9の名称辞書aを検索しても、検索できない論理インデックス「#503、#105」があるため、CIFを特定できず解析NGとなる。
First, the case of using the conventional concept of CIF identification in which the
FIG. 9 shows the contents of the
次に、本発明の好適な実施形態による名称学習辞書に論理インデックス等を登録する処理フローを図11及び図12を用いて説明する。
図11の1に記述されている論理インデックスセットは、前記の例でCIFが特定できずに解析NGとなった論理インデックスセット300である。処理エンジン410は、図12の入力データ取得200におけるステップ202で、この解析NGとなった論理インデックスセットを表示装置32に表示する。なお、これら解析NGとなったデータは、記憶装置の解析NG論理インデックスセット・ファイル26に保存しておき、オペレータによる入力装置30から入力されるコマンドに応答して、処理エンジン410が表示装置32に表示するようにしてもよい。
Next, a processing flow for registering a logical index or the like in the name learning dictionary according to a preferred embodiment of the present invention will be described with reference to FIGS.
The logical index set described in 1 of FIG. 11 is the logical index set 300 that has been analyzed NG because the CIF could not be specified in the above example. The
表示装置32に表示された論理インデックスセットに対して、オペレータが補正入力を行うことにより、処理エンジン410は入力データ取得を行う。詳細には、図12のステップ204及び図11の2に示すように、オペレータは、表示された論理インデックスセットから推定されるCIFコード「8760000」を入力装置30から入力する。次いで、処理エンジン410は、入力されたCIFコード「8760000」をキーにして名称辞書16aを検索し、名称辞書16aから論理インデックスセットを取得する(図11の2の302参照)。図11の例では、処理エンジン410は、図9に記述している名称辞書のCIFコード「8760000」の行を選択し、図12の登録単語判定処理206のステップ208において、論理インデックスセット「#501,#101,#502,#505,#104」を取得する(図11の2の302参照)。
The
続いて処理エンジン410は、図12の登録単語判定処理206の差分特定210を行う。詳細には、解析NGとなった論理インデックスセット「#501,#101,#502,#503,#105,#104」(図11の300)と、図11の2で取得した名称辞書16の論理インデックスセット「#501,#101,#502,#505,#104」(図11の302)の比較を図11の3で示すように行い、双方の間で同一なものは除いた論理インデックス、つまり差分の論理インデックスをそれぞれ特定する。図11の3で示すとおり、論理インデックス「#501」、「#101」、「#502」、「#104」は、解析NGとなったデータの論理インデックスと、名称辞書の論理インデックス双方に存在する同一の論理インデックスなので除外する。除外からもれた解析NGとなった論理インデックス「#503,#105」(図11の3の304参照)と名称辞書の論理インデックス「#505」(図11の3の306参照)を取得する。
Subsequently, the
続いて、処理エンジン410は、図12に示す辞書登録処理212を行う。図11の例では、論理インデックス変換ができなかった単語が存在しないので、図12のステップ214における判定で「有」となり、ステップ218に進み、基本語辞書14への登録は行わず、差分登録を行う。図13は、登録単語判定処理206にて取得した、解析NGの論理インデックス「#503,#105」と、名称辞書の論理インデックス「#505」を名称学習辞書24に論理和関係を用いて登録が行われている状態を示す。詳細には、図13に示すように、特定した差分の論理インデックス「#505」と、「#503,#105」を名称学習辞書24の論理インデックスセットの欄308に、論理和記号「|」を用いて、名称学習語論理インデックスを登録し、名称の欄310には、基本語辞書14から取得した単語を登録し、補正入力を行った際のCIFコードをCIFコードの欄312に登録する(図11の4の308〜312も参照)。ここで、名称学習語論理インデックスとは、名称辞書上に、記号「|」を用いて論理和関係を表して登録された論理インデックスのことである。登録の際には特にこの「|」記号を用いる必要はなく、論理和関係が明確になればよい。なお、図13は、登録後の辞書の状態を示し、登録の結果、上記で説明した図3と同じものとなっている。
Subsequently, the
次に、登録後の辞書(図13、即ち図3と同じ)に対して、図10にて解析NGのデータ「THE BANK OF TOKYO NAKAMORI LTD」が再び入力された場合について図14を参照して説明する。図14は、図5に示す場合と同じであり、上記で図5を参照して説明したのと同様にして、処理エンジン410(又は10)は、入力データに対して、CIF「8760000」を特定する。 Next, referring to FIG. 14 for the case where the analysis NG data “THE BANK OF TOKYO NAKAMORI LTD” is input again in FIG. 10 to the registered dictionary (same as FIG. 13, ie, FIG. 3). explain. FIG. 14 is the same as the case shown in FIG. 5, and the processing engine 410 (or 10) applies CIF “8700000000” to the input data in the same manner as described above with reference to FIG. 5. Identify.
結果としてマッチング対象が広がり、同義と認識できる個所に対してCIF特定の要素を増やすことができる。
次に、基本語辞書に単語「TOKYO」の登録が行われていなかった場合の解析NGのデータを、名称学習辞書24に登録する処理について図15〜図17を用いて説明する。図15は、単語「TOKYO」が登録されていない基本語辞書14のメモリ展開の状態及び名称辞書16のメモリ展開された状態を示す。図16は、基本語辞書14が図15に示すような状態において、入力データとして「THE BANK OF TOKYO NAKAMORI LTD」が入力され、CIFコード特定ができず、解析NGとなる処理経過を示す図である。図16の1〜3までは、「TOKYO」という文字列が基本語に登録されていなかったために論理インデックスに変換されずに、処理が進むが、その他は、前述の図10のときと処理は同様である。解析NGであるので、図16の4の320に示す、未変換単語「TOKYO」を含む論理インデックスセットが解析NG論理インデックスセット・ファイル26に記憶される。
As a result, the number of matching objects is widened, and the number of CIF specific elements can be increased for locations that can be recognized as synonymous.
Next, a process of registering the data of the analysis NG in the
図17は、未登録の単語を基本語辞書14に登録し、且つその単語を含めた単語の論理インデックスを名称学習辞書24に登録する処理を示す。図17の1では、図11の1と同様の処理が行われる。但し、表示装置32に表示される入力データの論理インデックスは図17の1の320に示されるように未変換単語「TOKYO」を含む点が図11に示す場合と異なる。図17の2は図11の2と同じ処理である。図17の3の処理も図11の3と同様の処理である。この場合、処理エンジン410は、未変換単語が含まれているので、図17の3の322に示されるように、入力データの差分の論理インデックスとして、未変換単語「TOKYO」と「#105」とを析出する。名称辞書16の差分の論理インデックスは図11の場合と同じである(図17の324と図11の306参照)。
。これらの処理は、図12のステップ202〜210における処理に対応する。
FIG. 17 shows a process of registering an unregistered word in the
. These processes correspond to the processes in
処理エンジン410は、図12のステップ214において、基本語登録有無判定処理を実行する。未変換単語が存在する、即ち「基本語登録済み」では無いので、ステップ216に進む。ステップ216において、処理エンジン410は、基本語登録処理を実行する。処理エンジン410は、図17の4に示すように、図17の3で差分として析出された単語「TOKYO」を基本語辞書14に、新たに論理インデックスを採番して基本語辞書14に登録する。例えば、図3の参照番号326に示すように登録される(なお、図3は基本語辞書14をメモリ展開した状態で示されているが、基本語辞書14においては図2の基本語辞書14に示すように格納されている。)。この際に採番する論理インデックスは、例のような「#503」であることは必ずしも必要でなく、固有の番号であれば任意である。次いで、処理エンジン410は、図12のステップ218を実行して、図17の5に示すような処理を実行する。この際、処理エンジン410は、未変換単語「TOKYO」(図17の322参照)を登録したとき採番した論理インデックス「#503」に置換してから、図11の4で説明した要領で、図17の330に示すように論理和関係を登録する。
The
次に、辞書として不要語辞書18を含むケースにおいて名称学習辞書に論理インデックス等を登録する処理を図18〜図20を参照して以下に説明する。
図18は、前述のように、名称辞書16、不要語辞書18及び図2の基本語辞書をそれぞれをメモリ展開した内容を示す。図19は、入力データが論理インデックスに変換されるまでの処理を示す。図8に示す装置に、入力データとして、図19の1に示す「THE BANK OF TOKYO NAKAMORI LTD MARUNOUCHI」が入力されたとする。図19の2に示すように、スペースを手がかりにして単語を分解する。図19の3に示すように、メイン・メモリ12上の基本語辞書14a(図18)を参照して、論理インデックスを取得する。次いで、図19の4に示すように、入力データを論理インデックスに変換する。図19の5に示すように、入力データの論理インデックスで名称辞書16a(図18)を検索する。このとき、図19の5には示されていないが、検索候補340の論理インデックスセットには、CIFコード「8760000」と関連した不要語「MARUNOUCHI」に対応する論理インデックス「#300」(図18の342参照)も含めて入力データの論理インデックスセットと比較する。そのような比較をしても、検索できない論理インデックス「#503、#105」があるため、CIFを特定できず解析NGとなる。
Next, a process of registering a logical index or the like in the name learning dictionary in a case where the
FIG. 18 shows the contents of the
次に、名称学習辞書に論理インデックス等を登録する処理フローを図20を用いて説明する。
図20の1及び2に示す処理は、図11の1及び2に示す処理と同様である。但し、処理エンジン410は、入力された推定のCIFコードをキーとして論理インデックスセットを取得する場合、名称辞書16ばかりでなく、不要語辞書18も検索して、不要語の論理インデックスも含めて論理インデックスセットを取得する(図20の2の342参照)。次いで、図20の3において、入力データの論理インデックスセットと不要語の論理インデックスを含めた名称辞書16の論理インデックスセットとを比較して、入力データ及び名称辞書16それぞれの差分の論理インデックスを析出する。それ以降の名称学習辞書24への論理インデックス等の登録処理(図20の4の処理)は、図11の4の処理と同じである。
Next, a processing flow for registering a logical index or the like in the name learning dictionary will be described with reference to FIG.
The processes shown in 1 and 2 of FIG. 20 are the same as the processes shown in 1 and 2 of FIG. However, when acquiring the logical index set using the input estimated CIF code as a key, the
図21は、名称辞書16及び名称学習辞書24をメモリ展開する際に、名称学習辞書24の内容を名称辞書16に組み入れずに、そのままそれぞれの辞書をメモリ展開する本発明の別の実施形態を示す。この実施形態では、処理エンジン10は、図4のステップ116で、変換された論理インデックスの組(図5の4の62参照)でメモリ展開された名称辞書16aを検索するとき、CIFコードをキーとして名称学習辞書24aも検索し、図5の5の参照番号66で示される2つの論理インデックスセットの組にし、図5の参照番号62の入力データの論理インデックスの組と、参照番号66で示す2つの論理インデックスの組とを逐一比較する。その結果参照番号66の下側の組と入力データの論理インデックスの組とが一致するので、CIFコードとして「8760000」を特定することができ、入力データはこのCIFコードに変換される(図4のステップ118及び122、及び図5の参照番号68参照)。なお、一致しない場合は、処理エンジン10は、解析NGとして処理する(図4のステップ124参照)。
FIG. 21 shows another embodiment of the present invention in which when the
なお、名称学習辞書への登録には不要語を含まないことが好ましい。
また、本発明は、処理エンジン10に処理エンジン410の機能を組み込み、且つ解析NG論理インデックスセット・ファイル26を持たないで、処理エンジン10が、図4の処理フローのステップ100〜124、及び図12の処理フローのステップ200〜218を連続的に実行するようにしてもよい。その場合は、処理エンジン10は、図4のステップ118における検索結果で解析NGとなったとき、ステップ124における解析NGを表示装置に表示し、且つ同時に図12のステップ202の代わりに解決NGの論理インデックスの組を表示装置32に表示する。処理エンジン10のその後の処理は、図12のステップ204以下を参照して上記で説明したのと同じである。
The registration to the name learning dictionary preferably does not include unnecessary words.
Further, the present invention incorporates the function of the
10,410 処理エンジン
12,412 メイン・メモリ
14 基本語辞書
16 名称辞書
18 不要語辞書
24 名称学習辞書
26 解析NG論理インデックスセット・ファイル
30 入力装置
32 表示装置
10,410 Processing engine 12,412
Claims (18)
複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、
前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、
前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、
前記論理インデックスの組同士が包摂関係にある場合包摂される論理インデックスの組について、当該包摂される単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語の論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書と、
前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンとを備え、
前記処理エンジンは、
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開し、
前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開し、
変換されるべき字句を単語に分解し、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する装置。 Lexical including a plurality of words, a device for converting the other data including one of the information specified by the plurality of words,
A basic word dictionary pre-registered in the storage means in association with each of a plurality of words and a logical index representing each word;
A set of logical root indexes corresponding to the set of words that combine words together registered in the basic dictionary, name dictionary registered in advance in the storage means in association with one information specified by a set of said word When,
Logical index or a set of logical root indexes corresponding to the set of part of a word contained in the set of words, the words of the word or the part of the portion corresponding to a portion of a word contained in the set of words the set and the set of logical root indexes corresponding to the logical index or the part of a word or set of words set and format differences of words of said part corresponding to a word format difference, registered in the name dictionary A name learning dictionary pre-registered in storage means in association with one piece of information specified by the set of words corresponding to the set of logical indexes being
When the logical index pairs are in an inclusion relationship, the included logical index pairs are not included in the included word set, and therefore are not used when directly identifying the one information. An unnecessary word dictionary in which a logical index of an unnecessary word that is a word that assists in finally identifying the one information is associated with the one information and is registered in advance in a storage unit;
A processing engine for converting a lexical phrase including the plurality of words into another data including the specified one piece of information,
The processing engine is
The words registered in the basic word dictionary are associated with a logical index representing each word and expanded in memory.
When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format A logical index corresponding to a different word or a set of logical indexes corresponding to a set of different words is incorporated into the logical index set and expanded in the memory,
A logical index of unnecessary words registered in the unnecessary word dictionary is associated with the one information and expanded in the memory;
Break the lexical word to be converted into words,
Referencing a basic word dictionary expanded in memory on the memory, obtaining and converting a logical index corresponding to the decomposed word,
Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set The logic corresponding to the decomposed word from the set including the logical index of the unnecessary word in the logical index set expanded in memory in the form of incorporating the set of the logical index into the logical index set. By selecting a set of logical indexes that matches one of the sets of logical indexes composed of a plurality of logical indexes, and using one piece of information specified by the set of selected logical indexes, An apparatus for converting a lexical phrase including a plurality of words into another data including the specified one piece of information.
複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、A basic word dictionary pre-registered in the storage means in association with each of the plurality of words and a logical index representing each word;
前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、A name dictionary in which a set of logical indexes corresponding to a set of words obtained by combining words registered in the basic word dictionary is associated with one piece of information specified by the set of words and registered in storage means in advance. When,
前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、A logical index corresponding to a part of words included in the set of words or a set of logical indexes corresponding to a part of words included in the set of words, and the part of words or the part of words A logical index corresponding to a pair of words and a different type of word, or a pair of logical indexes corresponding to a part of the word or a pair of words and a different type of word are registered in the name dictionary. A name learning dictionary pre-registered in storage means in association with one piece of information specified by the set of words corresponding to a set of logical indexes;
前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンと、A processing engine for converting a lexical phrase including the plurality of words into another data including the specified one information;
データを含む情報を入力するための入力手段と、An input means for inputting information including data;
データを含む情報を表示する表示手段と、を備え、Display means for displaying information including data, and
前記処理エンジンは、The processing engine is
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、The words registered in the basic word dictionary are associated with a logical index representing each word and expanded in memory.
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開し、When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format A logical index corresponding to a different word or a set of logical indexes corresponding to a set of different words is incorporated into the logical index set and expanded in the memory;
変換されるべき字句を単語に分解し、Break up the lexical terms to be converted into words,
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、Referencing a basic word dictionary expanded in memory on the memory, obtaining and converting a logical index corresponding to the decomposed word,
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any one of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the logical index set expanded in memory in a form in which the set is incorporated into the logical index set. By selecting a set of logical indexes that matches the set of logical indexes and using one piece of information specified by the selected set of logical indexes, the lexical phrase including the plurality of words is specified by 1 Along with other data that contains one piece of information,
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを前記表示手段に表示し、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any one of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the logical index set expanded in memory in a form in which the set is incorporated into the logical index set. In selecting a logical index set that matches the logical index set, if there is no matching logical index set, the logical index corresponding to the decomposed word is displayed on the display means;
前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、The name dictionary is searched by using one piece of information, which is estimated by the operator from the logical index corresponding to the decomposed word displayed on the display means and inputted through the input means as a key. , Obtain a set of logical indexes corresponding to the one piece of estimated information,
前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定し、Identifying a logical index of the difference between the logical index corresponding to the decomposed word and the set of obtained logical indexes;
前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録する装置。An apparatus for registering the logical index of the specified difference in the name learning dictionary as a logical sum relationship and in association with the one piece of estimated information.
複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、A basic word dictionary pre-registered in the storage means in association with each of the plurality of words and a logical index representing each word;
前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、A name dictionary in which a set of logical indexes corresponding to a set of words obtained by combining words registered in the basic word dictionary is associated with one piece of information specified by the set of words and registered in storage means in advance. When,
前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、A logical index corresponding to a part of words included in the set of words or a set of logical indexes corresponding to a part of words included in the set of words, and the part of words or the part of words A logical index corresponding to a pair of words and a different type of word, or a pair of logical indexes corresponding to a part of the word or a pair of words and a different type of word are registered in the name dictionary. A name learning dictionary pre-registered in storage means in association with one piece of information specified by the set of words corresponding to a set of logical indexes;
前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンと、A processing engine for converting a lexical phrase including the plurality of words into another data including the specified one information;
データを含む情報を入力するための入力手段と、An input means for inputting information including data;
データを含む情報を表示する表示手段と、を備え、Display means for displaying information including data, and
前記処理エンジンは、The processing engine is
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、The words registered in the basic word dictionary are associated with a logical index representing each word and expanded in memory.
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開し、When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format A logical index corresponding to a different word or a set of logical indexes corresponding to a set of different words is incorporated into the logical index set and expanded in the memory;
変換されるべき字句を単語に分解し、Break up the lexical terms to be converted into words,
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、Referencing a basic word dictionary expanded in memory on the memory, obtaining and converting a logical index corresponding to the decomposed word,
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any one of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the logical index set expanded in memory in a form in which the set is incorporated into the logical index set. By selecting a set of logical indexes that matches the set of logical indexes and using one piece of information specified by the selected set of logical indexes, the lexical phrase including the plurality of words is specified by 1 Along with other data that contains one piece of information,
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合、その単語を特定し、当該特定された単語及び前記の分解された単語に対応する論理インデックスを前記表示手段に表示し、When a logical index corresponding to the decomposed word is obtained and converted with reference to the basic word dictionary expanded in the memory on the memory, if there is a word for which a logical index cannot be obtained, the word is identified. Displaying on the display means a logical index corresponding to the identified word and the decomposed word;
前記表示手段に表示された前記特定された単語及び前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、The information is estimated by an operator from the logical index corresponding to the identified word and the decomposed word displayed on the display means, and the information input by the operator via the input means is used as the key. Search the name dictionary to obtain a set of logical indexes corresponding to the one piece of estimated information,
前記特定された単語及び前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の単語及び論理インデックスを特定し、Identifying a difference word and a logical index between a logical index corresponding to the identified word and the decomposed word and the set of the obtained logical index;
前記差分の単語に論理インデックスを割り当てて、前記基本語辞書に登録し、Assigning a logical index to the difference word and registering it in the basic word dictionary;
前記差分の単語を対応する論理インデックスに置換して、前記特定された差分の単語及び論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録する装置。An apparatus for replacing the difference word with a corresponding logical index and registering the identified difference word and the logical index in the name learning dictionary as a logical sum relationship and in association with the estimated one information.
複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、A basic word dictionary pre-registered in the storage means in association with each of the plurality of words and a logical index representing each word;
前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を、前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、A name dictionary in which a set of logical indexes corresponding to a set of words obtained by combining words registered in the basic word dictionary is associated with one piece of information specified by the set of words and registered in storage means in advance. When,
前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、A logical index corresponding to a part of words included in the set of words or a set of logical indexes corresponding to a part of words included in the set of words, and the part of words or the part of words A logical index corresponding to a pair of words and a different type of word, or a pair of logical indexes corresponding to a part of the word or a pair of words and a different type of word are registered in the name dictionary. A name learning dictionary pre-registered in storage means in association with one piece of information specified by the set of words corresponding to a set of logical indexes;
前記論理インデックスの組同士が包摂関係にある場合包摂される論理インデックスの組について、当該包摂される単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語の論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書と、When the logical index pairs are in an inclusive relationship, the included logical index pairs are not included in the included word set, and therefore are not used when directly identifying the one piece of information. An unnecessary word dictionary in which a logical index of an unnecessary word that is a word that assists in finally identifying the one information is associated with the one information and is registered in advance in a storage unit;
前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンと、A processing engine for converting a lexical phrase including the plurality of words into another data including the specified one information;
データを含む情報を入力するための入力手段と、An input means for inputting information including data;
データを含む情報を表示する表示手段とを備え、Display means for displaying information including data,
前記処理エンジンは、The processing engine is
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、The words registered in the basic word dictionary are associated with a logical index representing each word and expanded in memory.
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開し、When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format A logical index corresponding to a different word or a set of logical indexes corresponding to a set of different words is incorporated into the logical index set and expanded in the memory;
前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開し、A logical index of an unnecessary word registered in the unnecessary word dictionary is associated with the one information and expanded in the memory;
変換されるべき字句を単語に分解し、Break up the lexical terms to be converted into words,
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、Referencing a basic word dictionary expanded in memory on the memory, obtaining and converting a logical index corresponding to the decomposed word,
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set The logic corresponding to the decomposed word from the set including the logical index of the unnecessary word in the logical index set expanded in memory in the form of incorporating the set of the logical index into the logical index set. By selecting a set of logical indexes that matches any set of logical indexes composed of a plurality of logical indexes of the indexes, and using one piece of information specified by the selected set of logical indexes, Converting the lexical word including the plurality of words into another data including the one specified information;
前記いずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを前記表示手段に表示し、When selecting a logical index set that matches one of the logical index sets, if there is no matching logical index set, the logical index corresponding to the decomposed word is displayed on the display means. ,
前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書及び前記不要語辞書を検索して、当該推定される1つの情報に対応する不要語を含めた論理インデックスの組を取得し、The name dictionary and the unnecessary word are estimated by an operator from a logical index corresponding to the decomposed word displayed on the display means and input by the operator via the input means as a key. Search the dictionary to obtain a set of logical indexes including unnecessary words corresponding to the one piece of estimated information,
前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定し、Identifying a logical index of the difference between the logical index corresponding to the decomposed word and the set of obtained logical indexes;
前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録する装置。An apparatus for registering the logical index of the specified difference in the name learning dictionary as a logical sum relationship and in association with the one piece of estimated information.
複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、A basic word dictionary pre-registered in the storage means in association with each of the plurality of words and a logical index representing each word;
前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、A name dictionary pre-registered in storage means in association with one piece of information specified by the set of words, a set of logical indexes corresponding to a set of words obtained by combining words registered in the basic word dictionary ,
前記単語の組に含まれる一部の単語に対応する論理インデックス又は前記単語の組に含まれる一部の単語の組に対応する論理インデックスの組と、前記一部の単語又は前記一部の単語の組と形式違いの単語に対応する論理インデックス又は前記一部の単語又は前記一部の単語の組と形式違いの単語の組に対応する論理インデックスの組を、前記名称辞書に登録されている論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称学習辞書と、A logical index corresponding to a part of words included in the set of words or a set of logical indexes corresponding to a part of words included in the set of words, and the part of words or the part of words A logical index corresponding to a pair of words and a different type of word, or a pair of logical indexes corresponding to a part of the word or a pair of words and a different type of word are registered in the name dictionary. A name learning dictionary pre-registered in storage means in association with one piece of information specified by the set of words corresponding to a set of logical indexes;
前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する第1の処理エンジンとを備え、A first processing engine for converting a lexical phrase including the plurality of words into another data including the specified one piece of information,
前記第1の処理エンジンは、The first processing engine includes:
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、The words registered in the basic word dictionary are associated with a logical index representing each word and expanded in memory.
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開し、When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format A logical index corresponding to a different word or a set of logical indexes corresponding to a set of different words is incorporated into the logical index set and expanded in the memory;
変換されるべき字句を単語に分解し、Break up the lexical terms to be converted into words,
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、Referencing a basic word dictionary expanded in memory on the memory, obtaining and converting a logical index corresponding to the decomposed word,
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する、前記変換装置のため、前記名称学習辞書に、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を登録する装置において、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any one of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the logical index set expanded in memory in a form in which the set is incorporated into the logical index set. By selecting a set of logical indexes that matches the set of logical indexes and using one piece of information specified by the selected set of logical indexes, the lexical phrase including the plurality of words is specified by 1 For the conversion device for converting into another data including one piece of information, the name learning dictionary includes a pair of words. And a logical index set corresponding to the partial set of words and a logical index set corresponding to the different format word or a logical index set corresponding to the different format word set. ,
前記第1の処理エンジンが前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを予め格納する解析NG論理インデックスセット・ファイルと、The first processing engine has a logical index corresponding to the partial word or a logical index set corresponding to the partial word set, and a logical index corresponding to the malformed word or the malformed word. A plurality of logical indexes corresponding to the decomposed word from among the logical index sets expanded in memory in a form in which a logical index set corresponding to the set is incorporated into the logical index set. When selecting a set of logical indexes that matches any set of logical indexes composed of logical indexes, if there is no set of matching logical indexes, a logical index corresponding to the decomposed word is set in advance. Analysis NG logical index set file to be stored;
データを含む情報を入力するための入力手段と、An input means for inputting information including data;
データを含む情報を表示する表示手段と、Display means for displaying information including data;
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を登録する第2の処理エンジンとを備え、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set A second processing engine for registering a set of
前記第2の処理エンジンは、The second processing engine is
オペレータにより前記入力手段を介して入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記の分解された単語に対応する論理インデックスを検索して、前記表示手段に表示し、In response to a search command input by the operator via the input means, a logical index corresponding to at least the corresponding decomposed word is searched from the analysis NG logical index set file, and the display means Display
前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、The name dictionary is searched by using one piece of information, which is estimated by the operator from the logical index corresponding to the decomposed word displayed on the display means and inputted through the input means as a key. , Obtain a set of logical indexes corresponding to the one piece of estimated information,
前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定し、Identifying a logical index of the difference between the logical index corresponding to the decomposed word and the set of obtained logical indexes;
前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録する装置。An apparatus for registering the logical index of the specified difference in the name learning dictionary as a logical sum relationship and in association with the one piece of estimated information.
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、Associating words registered in the basic word dictionary with a logical index representing each word in a memory,
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format Incorporating a logical index corresponding to a different word or a set of logical indexes corresponding to the different set of words into the logical index set and expanding the memory on the memory;
前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、Associating a logical index of an unnecessary word registered in the unnecessary word dictionary with the one information in the memory,
変換されるべき字句を単語に分解するステップと、Breaking the lexical terms to be converted into words;
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップとLogical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set The logic corresponding to the decomposed word from the set including the logical index of the unnecessary word in the logical index set expanded in memory in the form in which the set of the logical index is incorporated into the logical index set. By selecting a set of logical indexes that matches one of the sets of logical indexes composed of a plurality of logical indexes, and using one piece of information specified by the set of selected logical indexes, Converting the lexical phrase including the plurality of words into another data including the one specified information;
を実行させる方法。How to run.
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、Associating words registered in the basic word dictionary with a logical index representing each word in a memory,
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format Incorporating a logical index corresponding to a different word or a set of logical indexes corresponding to the different set of words into the logical index set and expanding the memory on the memory;
変換されるべき字句を単語に分解するステップと、Breaking the lexical terms to be converted into words;
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any of the plurality of logical indexes among the logical indexes corresponding to the decomposed words is selected from the set of logical indexes expanded in the memory in a form in which the set is incorporated into the set of logical indexes. By selecting a set of logical indexes that matches the set of logical indexes and using one piece of information specified by the selected set of logical indexes, the lexical phrase including the plurality of words is specified by 1 Converting to another data containing one piece of information,
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any of the plurality of logical indexes among the logical indexes corresponding to the decomposed words is selected from the set of logical indexes expanded in the memory in a form in which the set is incorporated into the set of logical indexes. Displaying a logical index corresponding to the decomposed word on a display means when there is no matching logical index set when selecting a logical index set that matches the logical index set;
前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、The name dictionary is searched by using one piece of information, which is estimated by the operator from the logical index corresponding to the decomposed word displayed on the display means and inputted through the input means as a key. Obtaining a set of logical indexes corresponding to the one piece of estimated information;
前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、Identifying a logical index of a difference between a logical index corresponding to the decomposed word and the set of obtained logical indexes;
前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとRegistering the logical index of the identified difference in the name learning dictionary as a logical sum relationship and in association with the one piece of estimated information;
を実行させる方法。How to run.
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、Associating words registered in the basic word dictionary with a logical index representing each word in a memory,
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format Incorporating a logical index corresponding to a different word or a set of logical indexes corresponding to the different set of words into the logical index set and expanding the memory on the memory;
変換されるべき字句を単語に分解するステップと、Breaking the lexical terms to be converted into words;
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any of the plurality of logical indexes among the logical indexes corresponding to the decomposed words is selected from the set of logical indexes expanded in the memory in a form in which the set is incorporated into the set of logical indexes. By selecting a set of logical indexes that matches the set of logical indexes and using one piece of information specified by the selected set of logical indexes, the lexical phrase including the plurality of words is specified by 1 Converting to another data containing one piece of information,
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合、その単語を特定し、当該特定された単語及び前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、When a logical index corresponding to the decomposed word is obtained and converted with reference to the basic word dictionary expanded in the memory on the memory, if there is a word for which a logical index cannot be obtained, the word is identified. Displaying on the display means a logical index corresponding to the identified word and the decomposed word;
前記表示手段に表示された前記特定された単語及び前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、The name is obtained by using, as a key, one piece of information that is estimated by an operator from the logical index corresponding to the identified word displayed on the display unit and the decomposed word and input through the input unit. Searching the dictionary to obtain a set of logical indexes corresponding to the estimated one piece of information;
前記特定された単語及び前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の単語及び論理インデックスを特定するステップと、Identifying a difference word and a logical index between a logical index corresponding to the identified word and the decomposed word and the set of obtained logical indexes;
前記差分の単語に論理インデックスを割り当てて、前記基本語辞書に登録するステップと、Assigning a logical index to the difference word and registering it in the basic word dictionary;
前記差分の単語を対応する論理インデックスに置換して、前記特定された差分の単語及び論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとReplacing the difference word with a corresponding logical index and registering the identified difference word and logical index in the name learning dictionary as a logical sum relationship and in association with the estimated one information;
を実行させる方法。How to run.
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、Associating words registered in the basic word dictionary with a logical index representing each word in a memory,
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format Incorporating a logical index corresponding to a different word or a set of logical indexes corresponding to the different set of words into the logical index set and expanding the memory on the memory;
前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、Associating a logical index of an unnecessary word registered in the unnecessary word dictionary with the one information in the memory,
変換されるべき字句を単語に分解するステップと、Breaking the lexical terms to be converted into words;
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set The logic corresponding to the decomposed word from the set including the logical index of the unnecessary word in the logical index set expanded in memory in the form in which the set of the logical index is incorporated into the logical index set. By selecting a set of logical indexes that matches one of the sets of logical indexes composed of a plurality of logical indexes, and using one piece of information specified by the set of selected logical indexes, Converting the lexical phrase including the plurality of words into another data including the one specified information;
前記いずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、A step of displaying a logical index corresponding to the decomposed word on a display unit when a set of logical indexes that matches the set of any of the logical indexes does not exist; When,
前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書及び前記不要語辞書を検索して、当該推定される1つの情報に対応する不要語を含めた論理インデックスの組を取得するステップと、The name dictionary and the unnecessary word are estimated by an operator from the logical index corresponding to the decomposed word displayed on the display means and input by the operator through the input means as a key. Searching the dictionary to obtain a set of logical indexes including unnecessary words corresponding to the estimated one piece of information;
前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、Identifying a logical index of a difference between a logical index corresponding to the decomposed word and the set of obtained logical indexes;
前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとRegistering the logical index of the identified difference in the name learning dictionary as a logical sum relationship and in association with the one piece of estimated information;
を実行させる方法。How to run.
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、Associating words registered in the basic word dictionary with a logical index representing each word in a memory,
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format Incorporating a logical index corresponding to a different word or a set of logical indexes corresponding to the different set of words into the logical index set and expanding the memory on the memory;
変換されるべき字句を単語に分解するステップと、Breaking the lexical terms to be converted into words;
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any one of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the logical index set expanded in memory in a form in which the set is incorporated into the logical index set. By selecting a set of logical indexes that matches the set of logical indexes and using one piece of information specified by the selected set of logical indexes, the lexical phrase including the plurality of words is specified by 1 Converting to another data containing one piece of information,
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを解析NG論理インデックスセット・ファイルに予め格納するステップと、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any one of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the logical index set expanded in memory in a form in which the set is incorporated into the logical index set. When selecting a logical index pair that matches the logical index pair, if there is no matching logical index pair, the logical index corresponding to the decomposed word is stored in the analysis NG logical index set file. Storing in advance;
オペレータにより前記入力手段を介して入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記の分解された単語に対応する論理インデックスを検索して、表示手段に表示するステップと、In response to a search command input by the operator via the input means, a logical index corresponding to at least the corresponding decomposed word is searched from the analysis NG logical index set file and displayed on the display means. And steps to
前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、The name dictionary is searched by using one piece of information, which is estimated by the operator from the logical index corresponding to the decomposed word displayed on the display means and inputted through the input means as a key. Obtaining a set of logical indexes corresponding to the one piece of estimated information;
前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、Identifying a logical index of a difference between a logical index corresponding to the decomposed word and the set of obtained logical indexes;
前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとRegistering the logical index of the identified difference in the name learning dictionary as a logical sum relationship and in association with the one piece of estimated information;
を実行させる方法。How to run.
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、Associating words registered in the basic word dictionary with a logical index representing each word in a memory,
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format Incorporating a logical index corresponding to a different word or a set of logical indexes corresponding to the different set of words into the logical index set and expanding the memory on the memory;
前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、Associating a logical index of an unnecessary word registered in the unnecessary word dictionary with the one information in the memory,
変換されるべき字句を単語に分解するステップと、Breaking the lexical terms to be converted into words;
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップとLogical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set The logic corresponding to the decomposed word from the set including the logical index of the unnecessary word in the logical index set expanded in memory in the form in which the set of the logical index is incorporated into the logical index set. By selecting a set of logical indexes that matches one of the sets of logical indexes composed of a plurality of logical indexes, and using one piece of information specified by the set of selected logical indexes, Converting the lexical phrase including the plurality of words into another data including the one specified information;
を実行させるプログラム。A program that executes
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、Associating words registered in the basic word dictionary with a logical index representing each word in a memory,
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format Incorporating a logical index corresponding to a different word or a set of logical indexes corresponding to the different set of words into the logical index set and expanding the memory on the memory;
変換されるべき字句を単語に分解するステップと、Breaking the lexical terms to be converted into words;
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any of the plurality of logical indexes among the logical indexes corresponding to the decomposed words is selected from the set of logical indexes expanded in the memory in a form in which the set is incorporated into the set of logical indexes. By selecting a set of logical indexes that matches the set of logical indexes and using one piece of information specified by the selected set of logical indexes, the lexical phrase including the plurality of words is specified by 1 Converting to another data containing one piece of information,
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any of the plurality of logical indexes among the logical indexes corresponding to the decomposed words is selected from the set of logical indexes expanded in the memory in a form in which the set is incorporated into the set of logical indexes. Displaying a logical index corresponding to the decomposed word on a display means when there is no matching logical index set when selecting a logical index set that matches the logical index set;
前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、The name dictionary is searched by using one piece of information, which is estimated by the operator from the logical index corresponding to the decomposed word displayed on the display means and inputted through the input means as a key. Obtaining a set of logical indexes corresponding to the one piece of estimated information;
前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、Identifying a logical index of a difference between a logical index corresponding to the decomposed word and the set of obtained logical indexes;
前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップとRegistering the logical index of the identified difference in the name learning dictionary as a logical sum relationship and in association with the one piece of estimated information;
を実行させるプログラム。A program that executes
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、
変換されるべき字句を単語に分解するステップと、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合、その単語を特定し、当該特定された単語及び前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、
前記表示手段に表示された前記特定された単語及び前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、
前記特定された単語及び前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の単語及び論理インデックスを特定するステップと、
前記差分の単語に論理インデックスを割り当てて、前記基本語辞書に登録するステップと、
前記差分の単語を対応する論理インデックスに置換して、前記特定された差分の単語及び論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップと
を実行させるプログラム。 Corresponding to a basic word dictionary that is pre-registered in the storage means in association with a logical index that represents each word, and a set of words that combine words registered in the basic word dictionary a set of logical index, the name dictionary registered in advance in the storage means in association with one information specified by a set of said word, logical index or corresponding to a portion of a word contained in the set of words a set of logical root indexes corresponding to the set of word part included in the set of words, a logical index or the portion corresponding to a word set and format differences word word or the part of said portion the single of the word or a set of logical root indexes corresponding to the set of word pairs and format differences of words of said part, corresponding to the set of logical indexes registered in the name dictionary Another data including one information specified by the plurality of words, including a name learning dictionary previously registered in the storage means in association with one information specified by the set of On a computer that converts to
Associating words registered in the basic word dictionary with a logical index representing each word in a memory,
When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format Incorporating a logical index corresponding to a different word or a set of logical indexes corresponding to the different set of words into the logical index set and expanding the memory on the memory;
Breaking the lexical terms to be converted into words;
Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set set from among a set of logical indexes said memory development in the form incorporated in the set of the logical indexes, one composed of a plurality of logical index of the logical index corresponding to the decomposed words of the By selecting a set of logical indexes that matches the set of logical indexes and using one piece of information specified by the selected set of logical indexes, the lexical phrase including the plurality of words is specified by 1 Converting to another data containing one piece of information ,
When a logical index corresponding to the decomposed word is obtained and converted with reference to the basic word dictionary expanded in the memory on the memory, if there is a word for which a logical index cannot be obtained, the word is identified. Displaying on the display means a logical index corresponding to the identified word and the decomposed word;
The name is obtained by using, as a key, one piece of information that is estimated by an operator from the logical index corresponding to the identified word displayed on the display unit and the decomposed word and input through the input unit. Searching the dictionary to obtain a set of logical indexes corresponding to the estimated one piece of information;
Identifying a difference word and a logical index between a logical index corresponding to the identified word and the decomposed word and the set of obtained logical indexes;
Assigning a logical index to the difference word and registering it in the basic word dictionary;
Replacing the difference word with a corresponding logical index and registering the identified difference word and logical index in the name learning dictionary as a logical sum relationship and in association with the estimated one information; A program that executes <br/>.
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、
前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、
変換されるべき字句を単語に分解するステップと、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形で前記のメモリ展開された論理インデックスの組に、更に前記不要語の論理インデックスを含めたセットの中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、
前記いずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを表示手段に表示するステップと、
前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書及び前記不要語辞書を検索して、当該推定される1つの情報に対応する不要語を含めた論理インデックスの組を取得するステップと、
前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、
前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップと
を実行させるプログラム。 Corresponding to a basic word dictionary that is pre-registered in the storage means in association with a logical index that represents each word, and a set of words that combine words registered in the basic word dictionary A set of logical indexes associated with one piece of information specified by the set of words, a name dictionary registered in advance in storage means, and a logical index corresponding to some words included in the set of words or A set of logical indexes corresponding to a set of some words included in the set of words, a logical index corresponding to a word that is different in form from the some words or the set of some words, or the A logical index set corresponding to a word or a pair of partial words and a different set of words is referred to as a logical index set registered in the name dictionary. The name learning dictionary registered in advance in the storage means in association with one piece of information specified by the set of the logical index and the logical index set included when the logical index set is in an inclusion relationship are included. Since it is not included in a set of words and is not used when directly specifying the one information, a logical index of an unnecessary word that is a word that assists in finally specifying the one information is obtained. An unnecessary word dictionary registered in advance in storage means in association with the one information, and a computer for converting a lexical phrase including a plurality of words into another data including one information specified by the plurality of words In addition,
Associating words registered in the basic word dictionary with a logical index representing each word in a memory,
When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format Incorporating a logical index corresponding to a different word or a set of logical indexes corresponding to the different set of words into the logical index set and expanding the memory on the memory;
Associating a logical index of an unnecessary word registered in the unnecessary word dictionary with the one information in the memory,
Breaking the lexical terms to be converted into words;
Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set The logic corresponding to the decomposed word from the set including the logical index of the unnecessary word in the logical index set expanded in memory in the form in which the set of the logical index is incorporated into the logical index set. By selecting a set of logical indexes that matches one of the sets of logical indexes composed of a plurality of logical indexes, and using one piece of information specified by the set of selected logical indexes, Converting the lexical phrase including the plurality of words into another data including the one specified information;
A step of displaying a logical index corresponding to the decomposed word on a display unit when a set of logical indexes that matches the set of any of the logical indexes does not exist; When,
The name dictionary and the unnecessary word are estimated by an operator from a logical index corresponding to the decomposed word displayed on the display means and input by the operator via the input means as a key. Searching the dictionary to obtain a set of logical indexes including unnecessary words corresponding to the estimated one piece of information;
Identifying a logical index of a difference between a logical index corresponding to the decomposed word and the set of obtained logical indexes;
A program for executing the step of registering the logical index of the identified difference in the name learning dictionary as a logical sum relationship and in association with the one piece of estimated information .
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開するステップと、
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開するとき、前記特定される1つの情報をキーとして前記名称学習辞書を検索して、当該特定される1つの情報に対応する、前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んで前記メモリ上にメモリ展開するステップと、
変換されるべき字句を単語に分解するステップと、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、
前記一部の単語に対応する論理インデックス又は前記一部の単語の組に対応する論理インデックスの組と、前記形式違いの単語に対応する論理インデックス又は前記形式違いの単語の組に対応する論理インデックスの組を前記論理インデックスの組に組み込んだ形でメモリ展開された前記の論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択する際に、一致する論理インデックスの組が存在しない場合、前記の分解された単語に対応する論理インデックスを解析NG論理インデックスセット・ファイルに予め格納するステップと、
オペレータにより前記入力手段を介して入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記の分解された単語に対応する論理インデックスを検索して、表示手段に表示するステップと、
前記表示手段に表示された前記の分解された単語に対応する論理インデックスからオペレータによって推定されて、当該オペレータにより前記入力手段を介して入力された1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、
前記の分解された単語に対応する論理インデックスと前記の取得された論理インデックスの組との差分の論理インデックスを特定するステップと、
前記の特定された差分の論理インデックスを論理和関係として、且つ前記推定される1つの情報と関連付けて前記名称学習辞書に登録するステップと
を実行させるプログラム。 Corresponding to a basic word dictionary that is pre-registered in the storage means in association with a logical index that represents each word, and a set of words that combine words registered in the basic word dictionary A set of logical indexes associated with one piece of information specified by the set of words, a name dictionary registered in advance in storage means, and a logical index corresponding to some words included in the set of words or A set of logical indexes corresponding to a set of some words included in the set of words, a logical index corresponding to a word that is different in form from the some words or the set of some words, or the A logical index set corresponding to a word or a pair of partial words and a different set of words is referred to as a logical index set registered in the name dictionary. Another data including one information specified by the plurality of words, including a name learning dictionary previously registered in the storage means in association with one information specified by the set of On a computer that converts to
Associating words registered in the basic word dictionary with a logical index representing each word in a memory,
When a set of logical indexes registered in the name dictionary is associated with the specified information corresponding to each set of logical indexes and expanded in the memory, the specified information is a key. The name learning dictionary is searched, and the logical index corresponding to the partial word or the logical index pair corresponding to the partial word set corresponding to the specified one information, and the format Incorporating a logical index corresponding to a different word or a set of logical indexes corresponding to the different set of words into the logical index set and expanding the memory on the memory;
Breaking the lexical terms to be converted into words;
Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any one of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the logical index set expanded in memory in a form in which the set is incorporated into the logical index set. By selecting a set of logical indexes that matches the set of logical indexes and using one piece of information specified by the selected set of logical indexes, the lexical phrase including the plurality of words is specified by 1 Converting to another data containing one piece of information,
Logical index corresponding to the partial word or logical index set corresponding to the partial word set, logical index corresponding to the different format word or logical index corresponding to the different format word set Any one of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the logical index set expanded in memory in a form in which the set is incorporated into the logical index set. When selecting a logical index pair that matches the logical index pair, if there is no matching logical index pair, the logical index corresponding to the decomposed word is stored in the analysis NG logical index set file. Storing in advance;
In response to a search command input by the operator via the input means, a logical index corresponding to at least the corresponding decomposed word is searched from the analysis NG logical index set file and displayed on the display means. And steps to
The name dictionary is searched by using one piece of information, which is estimated by the operator from the logical index corresponding to the decomposed word displayed on the display means and input through the input means as a key. Obtaining a set of logical indexes corresponding to the one piece of estimated information;
Identifying a logical index of a difference between a logical index corresponding to the decomposed word and the set of obtained logical indexes;
A program for executing the step of registering the logical index of the identified difference in the name learning dictionary as a logical sum relationship and in association with the one piece of estimated information .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004287849A JP4051369B2 (en) | 2004-09-30 | 2004-09-30 | Apparatus, method and program for converting lexical data to data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004287849A JP4051369B2 (en) | 2004-09-30 | 2004-09-30 | Apparatus, method and program for converting lexical data to data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006099668A JP2006099668A (en) | 2006-04-13 |
JP4051369B2 true JP4051369B2 (en) | 2008-02-20 |
Family
ID=36239376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004287849A Expired - Fee Related JP4051369B2 (en) | 2004-09-30 | 2004-09-30 | Apparatus, method and program for converting lexical data to data |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4051369B2 (en) |
-
2004
- 2004-09-30 JP JP2004287849A patent/JP4051369B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006099668A (en) | 2006-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20070179932A1 (en) | Method for finding data, research engine and microprocessor therefor | |
JPS6091450A (en) | Table type language interpreter | |
JP2012248210A (en) | System and method for retrieving content of complicated language such as japanese | |
US20070050709A1 (en) | Character input aiding method and information processing apparatus | |
JP2002117027A (en) | Feeling information extracting method and recording medium for feeling information extracting program | |
US5890183A (en) | Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input | |
JP2005135113A (en) | Electronic equipment, related word extracting method, and program | |
WO2015075920A1 (en) | Input assistance device, input assistance method and recording medium | |
JP6589704B2 (en) | Sentence boundary estimation apparatus, method and program | |
JP4051369B2 (en) | Apparatus, method and program for converting lexical data to data | |
JP2008059389A (en) | Vocabulary candidate output system, vocabulary candidate output method, and vocabulary candidate output program | |
JP4251000B2 (en) | Kana-kanji conversion device, kana-kanji conversion method, and kana-kanji conversion program | |
JP4139805B2 (en) | Apparatus, method and program for converting lexical data to data | |
JP2009104475A (en) | Similar document retrieval device, and similar document retrieval method and program | |
JP2004334690A (en) | Character data inputting/outputting device and method, character data inputting/outputting program, and computer-readable recording medium | |
JP4111941B2 (en) | Apparatus, method and program for converting lexical data to data | |
JP2008210229A (en) | Device, method and program for retrieving intellectual property information | |
JP2007257188A (en) | Dictionary search device and its control program | |
JP5348699B2 (en) | Data classification system, data classification method and program | |
JP4061283B2 (en) | Apparatus, method and program for converting lexical data to data | |
JP2831837B2 (en) | Document search device | |
JP2011123542A (en) | Electronic equipment and information display program | |
JP2005275880A (en) | Device, method and program for converting word and phrase into data | |
JPS63262750A (en) | Data input system | |
JPH10198664A (en) | Japanese language input system and medium for recorded with japanese language input program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070806 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070720 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20070829 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4051369 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101207 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101207 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131207 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |