JP4139805B2 - Apparatus, method and program for converting lexical data to data - Google Patents

Apparatus, method and program for converting lexical data to data Download PDF

Info

Publication number
JP4139805B2
JP4139805B2 JP2004287919A JP2004287919A JP4139805B2 JP 4139805 B2 JP4139805 B2 JP 4139805B2 JP 2004287919 A JP2004287919 A JP 2004287919A JP 2004287919 A JP2004287919 A JP 2004287919A JP 4139805 B2 JP4139805 B2 JP 4139805B2
Authority
JP
Japan
Prior art keywords
word
words
logical
logical index
indexes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004287919A
Other languages
Japanese (ja)
Other versions
JP2006099672A (en
Inventor
達彦 相川
淳一 清水
一朗 中田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MUFG Bank Ltd
Original Assignee
Bank of Tokyo Mitsubishi UFJ Trust Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of Tokyo Mitsubishi UFJ Trust Co filed Critical Bank of Tokyo Mitsubishi UFJ Trust Co
Priority to JP2004287919A priority Critical patent/JP4139805B2/en
Publication of JP2006099672A publication Critical patent/JP2006099672A/en
Application granted granted Critical
Publication of JP4139805B2 publication Critical patent/JP4139805B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置、方法及びプログラムに関する。   The present invention relates to an apparatus, a method, and a program for converting a lexical phrase including a plurality of words into another data including one piece of information specified by the plurality of words.

例えば、銀行等では受信する決済指図電文等について、計算機を使用して取引先顧客情報(CIF)解析処理が必要になることがある(なお、CIFは顧客情報ファイル(Customer Information File)を意味する。)。詳細には、例えば電文中の字句「GETRONICS FOODS CO.,LTD 1−2−34 AKASAKA」の中の複数の単語「GETRONICS」、「FOODS」、「CO.,LTD」及び「AKASAKA」の組み合わせを顧客コード(即ち、CIFコード)「1234567」に変換することが必要になる。   For example, a bank or the like may require a customer information (CIF) analysis process using a computer for a settlement instruction message received (CIF means a customer information file). .) Specifically, for example, a combination of a plurality of words “GETRONICS”, “FOODS”, “CO., LTD”, and “AKASAKA” in the word “GETRONICS FOODS CO., LTD 1-2-34 AKASAKA” It is necessary to convert the customer code (that is, the CIF code) to “1234567”.

従来は、この変換処理を次のように行っていた。即ち、顧客コードを特定する複数の単語の組み合わせとそれに対応する顧客コードとの顧客コード・テーブルを予め記憶装置に格納しておく。次いで、入力データから変換すべき複数の単語を抽出して、その抽出された複数の単語と顧客コード・テーブルの中の複数の単語とを文字列比較を行い、一致した場合顧客コードに変換していた(そのような例として、特許文献1参照。)。   Conventionally, this conversion processing is performed as follows. That is, a customer code table of a combination of a plurality of words specifying a customer code and a corresponding customer code is stored in the storage device in advance. Next, a plurality of words to be converted are extracted from the input data, and the extracted plurality of words and a plurality of words in the customer code table are subjected to character string comparison. (See Patent Document 1 for such an example.)

しかしながら、このような文字列比較は、1文字毎(1バイト単位)で行うため、とりわけ大量のデータが対象になるときには、当該処理に要する検索時間(seek time)の関係上、高速に処理を行うことができないという問題があった。   However, since such character string comparison is performed for each character (in 1-byte units), especially when a large amount of data is targeted, the processing is performed at high speed due to the search time required for the processing. There was a problem that could not be done.

このような問題を克服しようとする方式として、電文中の字句をCIFコードに変換するために用いる辞書類をメイン・メモリ上にメモリ・アドレスをシンボルとしてシンボル化することがこの特許出願より前の特許出願において提案された(特許文献2参照)。詳細には、複数の単語のそれぞれとその属性情報を関連付けて二次記憶装置に予め登録してある基本語辞書と、基本語辞書に登録されている2つの単語を組み合わせた組と、キーとして選択された当該組の中の単語と当該組により特定される記号とを関連付けて二次記憶装置に予め登録してある核名称辞書と、当該記号と当該組に含まれない別の単語と当該記号及び別の単語により特定されるCIFコードとを関連付けて二次記憶装置に予め登録してあるフル名称辞書とをメイン・メモリ上にメモリ・アドレスをシンボルとしてシンボル化する。シンボル化された基本語辞書を参照して、被変換字句に含まれる単語に対応するアドレスを取得する。そのうちの2つのアドレス(一方をキーとする)が一致する組をシンボル化された核名称辞書から見つけ、次いで、もう1つのアドレスと一致する組をシンボル化されたフル名称辞書から見つけて、被変換字句を目的のCIFコードに変換する。   As a method for overcoming such a problem, it is possible to symbolize a dictionary used for converting a lexical in a message into a CIF code on a main memory using a memory address as a symbol. It was proposed in a patent application (see Patent Document 2). Specifically, a basic word dictionary associated with each of a plurality of words and their attribute information and registered in the secondary storage device in advance, a combination of two words registered in the basic word dictionary, and a key The nuclear name dictionary that is pre-registered in the secondary storage device in association with the selected word in the set and the symbol specified by the set, the symbol and another word not included in the set, and the The full name dictionary registered in advance in the secondary storage device in association with the symbol and the CIF code specified by another word is symbolized on the main memory using the memory address as a symbol. By referring to the symbolized basic word dictionary, an address corresponding to the word included in the converted lexical phrase is acquired. A pair that matches two addresses (one of which is a key) is found from the symbolized nuclear name dictionary, and then a pair that matches the other address is found from the symbolized full name dictionary, The conversion token is converted into a target CIF code.

前述のように、この方式は、各辞書を関連付けるキー(シンボル)を物理的メモリ・アドレスに直接割り当てる仕様としている。そのような仕様とした場合、コンピュータの特性として、メモリ・アドレスは動的に割り付けられてしまうために、プログラムをメモリ・ロードする度に、辞書相互間のキー関係を、取得したメモリ・アドレスに置き換え、生成する必要があり、この点でプログラム初期処理上、高負荷及び所要時間がかかる。   As described above, this method is a specification in which a key (symbol) that associates each dictionary is directly assigned to a physical memory address. When such a specification is used, the memory address is dynamically allocated as a characteristic of the computer. Therefore, each time the program is loaded into the memory, the key relationship between the dictionaries is changed to the acquired memory address. It is necessary to replace and generate, and in this respect, high load and required time are required in the program initial processing.

このような問題を克服しようとする方式として、それぞれの単語を表象する論理インデックスを予め割り振って、単語と対応の論理インデックスとを関連付けて辞書に格納し、これをメモリ上にメモリ展開することがこの特許出願より前の特許出願において提案された(特許文献3及び4参照)。   As a method for overcoming such a problem, a logical index representing each word is allocated in advance, and the word and the corresponding logical index are stored in a dictionary in association with each other, and this is expanded in a memory. It was proposed in patent applications prior to this patent application (see Patent Documents 3 and 4).

また、単語を論理インデックスに変換する解析処理を行う場合、この解析処理すべき単語には、表記は異なるものの解析処理上同一の意味内容を有するものがある。これらの単語には、個々に異なる論理インデックスを割り振ってもよいが、解析処理上同一の意味内容を有するので、同一の論理インデックスを割り振っても解析処理上問題は生じないし、処理効率上無駄を省くことができる。そこで、このような表記は異なるものの解析処理上同一の意味内容を有する複数の単語を基本語辞書の単語の欄の1つの行に格納することがこの特許出願より前の特許出願において提案された(特許文献4参照)。   In addition, when performing an analysis process for converting a word into a logical index, some words to be analyzed have the same semantic content in the analysis process, although the notation is different. Although different logical indexes may be assigned to these words individually, they have the same semantic content in the analysis process, so even if the same logical index is assigned, no problem occurs in the analysis process, and there is a waste in processing efficiency. It can be omitted. Therefore, it has been proposed in patent applications prior to this patent application to store a plurality of words having the same semantic content in the analysis process although they are different in notation in one line of the word column of the basic word dictionary. (See Patent Document 4).

更に、字句をデータに変換する際に、一方の字句が他方の字句を含む包摂関係が生じている場合にも正しく変換できるようにし、解析処理精度の向上を図るため、字句を構成する単語の組の論理インデックスセットとそれに対応するCIFコードとが関連付けられて名称辞書に格納され、包摂される論理インデックスセットに含まれないので直接CIFコードを特定するために用いられないが、CIFコードを特定するのを補助する単語である不要語に対応する論理インデックスが、CIFコードと関連付けられて不要語辞書に格納され、不要語を含む字句の論理インデックスの組に変換されたものを、不要語の論理インデックスを含めた名称辞書の論理インデックスセットと比較(部分マッチング)を行って、CIFコードを特定することがこの特許出願より前の特許出願において提案された(特許文献5参照)。   Furthermore, when converting a lexical into data, in order to improve the accuracy of analysis processing so that one lexical can be correctly converted even if there is an inclusion relationship that includes the other lexical, A set of logical index sets and their corresponding CIF codes are stored in the name dictionary and are not included in the included logical index set, so they are not used directly to identify CIF codes, but identify CIF codes A logical index corresponding to an unnecessary word, which is a word that assists the user, is stored in the unnecessary word dictionary in association with the CIF code, and is converted into a set of lexical logical indexes including unnecessary words. The CIF code is specified by comparing (partial matching) with the logical index set of the name dictionary including the logical index. Proposed in prior patent application from the patent application (see Patent Document 5).

また、辞書上の単語にインデックスを付し、それをディスクの格納位置と対応付けて、アクセス時間を短縮化する方法は知られている(例えば、特許文献6参照)。
特開2002−56005号公報 特願2003−115287号特許出願 特願2004−89101号特許出願 特願2004−89121号特許出願 特願2004−274422号特許出願 特開平7−36900号公報
In addition, a method for shortening access time by attaching an index to a word on a dictionary and associating it with a storage position on a disk is known (see, for example, Patent Document 6).
JP 2002-56005 A Patent application for Japanese Patent Application No. 2003-115287 Patent application for Japanese Patent Application No. 2004-89101 Patent application No. 2004-89121 Patent application for Japanese Patent Application No. 2004-274422 JP-A-7-36900

前述したように、表記は異なるものの解析処理上同一の意味内容を有する複数の単語を基本語辞書の単語の欄の1つの行に格納する(特許文献4参照)ことを行う場合、具体的には、オペレータが複数の単語と対応の論理インデックスを入力手段から入力することが必要である。複数の単語と対応の論理インデックスとを入力することは入力量が多いので間違いが発生しやすい。この問題は、既に基本語辞書に単語と対応の論理インデックスとが登録されていて、更に表記は異なるものの解析処理上同一の意味内容を有する別の単語を追加する場合もオペレータは追加の単語と対応の論理インデックスとを入力しなければならない。従って、追加の場合にも依然オペレータの入力量が多く間違いが発生しやすい。   As described above, when storing a plurality of words having different meanings but having the same meaning in the analysis process in one line of the word column of the basic word dictionary (see Patent Document 4), specifically, Requires an operator to input a plurality of words and corresponding logical indexes from the input means. Inputting a plurality of words and corresponding logical indexes is likely to cause errors because of the large amount of input. The problem is that even if a word and a corresponding logical index are already registered in the basic word dictionary and another word having the same meaning in the analysis processing is added although the notation is different, The corresponding logical index must be entered. Therefore, even when the information is added, the operator's input amount is still large and errors are likely to occur.

従って、本発明の課題は、表記は異なるものの解析処理上同一の意味内容を有する単語を基本語辞書に追加する際にオペレータが入力しなければならないデータ量をできるだけ少なくして、間違いを減らして、信頼性の高い基本語辞書のデータベースを生成することにある。   Therefore, an object of the present invention is to reduce the amount of data that an operator must input when adding words having different meanings but having the same meaning in the analysis process to the basic word dictionary as much as possible to reduce errors. It is to generate a highly reliable basic word dictionary database.

上記課題は、本発明の一局面に従った、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置であって、記憶手段に予め記憶され、単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書と、記憶手段に予め記憶され、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書と、前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、複数の単語を含む変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得し、前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に、記憶手段に記憶された解析NG論理インデックスセット・ファイルに格納する第1の処理エンジンと、データを含む情報を入力するための入力手段と、データを含む情報を表示するための表示手段と、前記入力手段から入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスを検索して前記表示手段に表示し、前記入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録する第2の処理エンジンと、を備えたことを特徴とする装置により解決される。 The above-described problem is an apparatus for converting a lexical phrase including a plurality of words into another data including one piece of information specified by the plurality of words according to one aspect of the present invention, and is stored in advance in a storage unit. A word field for storing words and a logical index field for storing a logical index representing the words stored in the word field, wherein each of the plurality of words is associated with a logical index representing each word. The plurality of word fields are registered in advance, and the word column has the same logical index attached to a plurality of words having the same semantic content and different notation in the analysis process for converting the word into a logical index. Corresponds to a basic word dictionary configured to be able to store words and a set of words that are pre-stored in the storage means and combined with words registered in the basic word dictionary The logical index set is the same as the name dictionary registered in advance in association with one piece of information specified by the word set, and the semantic content in the analysis process registered in the basic word dictionary is the same. A plurality of words having different notations are associated with the same logical index assigned to the plurality of words having different notations and expanded in memory, and a set of logical indexes registered in the name dictionary The memory is expanded in the memory in association with one piece of information specified by the set of words corresponding to each set of logical indexes, the lexical phrase to be converted including a plurality of words is decomposed into words, Referring to the basic word dictionary expanded in memory, a logical index corresponding to the decomposed word is obtained, and the memory-expanded logical index set is obtained A logical index set that matches any logical index set composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed word is selected, and 1 specified by the selected logical index set. By using one piece of information, the lexical phrase including the plurality of words is converted into another data including the one specified information, and the logical index corresponding to the decomposed word is obtained. If there is a word that cannot be acquired, the word is specified, and the specified word is stored in the analysis NG logical index set file stored in the storage unit together with the logical index of the word that has acquired the logical index among the decomposed words. First processing engine to store and input for entering information including data And at least the corresponding logical index could not be acquired from the analysis NG logical index set file in response to a search command input from the input means and display means for displaying information including data A word and a logical index stored together with the word are searched and displayed on the display means, and the logical index displayed on the display means inputted from the input means is not stored and stored together with the word. The name dictionary is searched using one piece of information estimated from the logical index as a key, a set of logical indexes corresponding to the one piece of estimated information is obtained, the word for which the logical index could not be obtained, and the A logical index stored with the word and a logical index obtained from the name dictionary. A second processing engine that identifies a difference word and a logical index with a set of pairs and registers the difference word as a synonym in the word field in the basic word dictionary corresponding to the difference logical index; It is solved by the apparatus characterized by comprising.

上記課題はまた、本発明の別の局面に従った、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置であって、記憶手段に予め記憶され、単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書と、記憶手段に予め記憶され、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書と、データを含む情報を入力するための入力手段と、データを含む情報を表示するための表示手段と、前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、複数の単語を含む変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得し、前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に前記表示手段に表示し、前記入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録する処理エンジンと、を備えたことを特徴とする装置により解決される。 The above object is also achieved by a separate in accordance with an aspect, an apparatus for converting the other data including one information specified lexical including a plurality of words by the plurality of words of the present invention, advance in the storage means A word field for storing words and a logical index field for storing a logical index representing the words stored in the word field, and each of the plurality of words is a logical index representing each word; The word column is registered in advance, and the word column is assigned the same logical index to a plurality of words having the same meaning and different notation in the analysis process for converting the word into a logical index. A basic word dictionary configured to be capable of storing a plurality of words, and a set of words obtained by combining words that are stored in the storage unit in advance and registered in the basic word dictionary A set of corresponding logical indexes displays a name dictionary registered in advance in association with one piece of information specified by the set of words, an input means for inputting information including data, and information including data A plurality of words that are registered in the basic word dictionary and have the same semantic content and different notation in the analysis process and are assigned to the different words with the notation And a logical index set registered in the name dictionary is associated with one piece of information specified by the word set corresponding to each logical index set. Expand the memory on the memory, disassemble the lexical word to be converted including a plurality of words into words, refer to the basic word dictionary expanded in the memory on the memory, A logical index corresponding to the solved word is obtained, and any one of the logical indexes composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed word is selected from the set of logical indexes expanded in the memory. By selecting a set of logical indexes that matches the set and using one piece of information specified by the set of selected logical indexes, another phrase containing the one piece of information that is specified When converting to data and obtaining a logical index corresponding to the decomposed word, if there is a word for which a logical index cannot be obtained, the word is identified, and the identified word is the logical index of the decomposed word Is displayed on the display means together with the logical index of the word that has been acquired, and the input means The name dictionary using, as a key, one piece of information estimated from the logical index of the word for which the logical index displayed in the display means and the word for which the logical index has been acquired among the decomposed words. To obtain a set of logical indexes corresponding to the one piece of estimated information, and a logical index of a word for which a logical index could be obtained among the words for which the logical index could not be obtained and the decomposed words, , Specifying a difference word and a logical index from a set of logical indexes acquired from the name dictionary, and registering the difference word as a synonym in the word field in the basic word dictionary corresponding to the difference logical index And a processing engine .

更に、上記課題は、本発明の一局面に従った、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する方法であって、単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書を記憶手段に記憶させるステップと、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書を記憶手段に記憶させるステップと、前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、複数の単語を含む変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得するステップと、前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に、記憶手段に記憶された解析NG論理インデックスセット・ファイルに格納するステップと、データを含む情報を入力するための入力手段から入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスを検索して、データを含む情報を表示するための表示手段に表示するステップと、前記入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録するステップと、を備えたことを特徴とする方法により解決される。 Furthermore, the subject is a method of converting a lexical phrase including a plurality of words into another data including one piece of information specified by the plurality of words, according to one aspect of the present invention, and storing the words It has at least a logical index field for storing a word field and a logical index representing the word stored in the word field, and each of the plurality of words is registered in advance in association with a logical index representing each word. In addition, the word column can store the plurality of words so that the same logical index is attached to a plurality of words having the same semantic content and different notation in the analysis processing for converting the word into a logical index. A step of storing the constructed basic word dictionary in the storage means, and a logical input corresponding to a set of words obtained by combining words registered in the basic word dictionary A step of storing a name dictionary registered in advance in association with one piece of information specified by the set of words in the storage means, and a step in the analysis process registered in the basic word dictionary Associating a plurality of words having the same semantic content but different notations with the same logical index assigned to the plurality of different notations in the memory, and registering them in the name dictionary Associating a set of logical indexes associated with one piece of information specified by the set of words corresponding to each set of logical indexes into the memory, and a lexical phrase to be converted comprising a plurality of words Decomposing into words, and referring to a basic word dictionary expanded in the memory, a logical index corresponding to the decomposed words is obtained. And a logical index set that matches one of the logical index sets of a plurality of logical indexes among the logical indexes corresponding to the decomposed word from the set of logical indexes expanded in the memory. Converting the lexical phrase including the plurality of words into another data including the specified one information by using one information specified by the selected set of logical indexes, and When acquiring a logical index corresponding to a decomposed word, if there is a word for which a logical index cannot be acquired, the word is specified, and the specified word is the logic of the word that has acquired a logical index among the decomposed words. The analysis NG logical index set file stored in the storage means together with the index And a word for which at least the corresponding logical index could not be obtained from the analysis NG logical index set file in response to a search command input from an input means for inputting information including data A logical index stored together with the word, and displaying on the display means for displaying information including data; and obtaining the logical index displayed on the display means, which is input from the input means Searching the name dictionary using as a key one word estimated from a word that could not be performed and a logical index stored together with the word, and obtaining a set of logical indexes corresponding to the one estimated information; , The word for which the logical index could not be obtained and stored together with the word A difference word and a logical index between a logical index and a set of logical indexes acquired from the name dictionary are identified, and the difference word is synonymous with the word field in the basic word dictionary corresponding to the difference logical index And a step of registering as a word .

更にまた、上記課題は、本発明の別の局面に従った、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する方法であって、単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書を記憶手段に記憶させるステップと、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書を記憶手段に記憶させるステップと、前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、複数の単語を含む変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得するステップと、前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に、データを含む情報を表示するための表示手段に表示するステップと、データを含む情報を入力するための入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録するステップと、を備えたことを特徴とする方法により解決される。 Furthermore, the above object is achieved by a separate in accordance with an aspect, a method of converting a lexical including a plurality of words to another data including one of the information specified by the plurality of words of the present invention, a word At least a logical index field for storing a word field to be stored and a logical index representing the word stored in the word field, and each of the plurality of words is pre-registered in association with a logical index representing each word In addition, the word column stores the plurality of words so that the same logical index is attached to a plurality of words having the same semantic content and different notation in the analysis processing for converting the word into a logical index. A basic word dictionary configured to be stored in a storage means, and a theory corresponding to a set of words obtained by combining words registered in the basic word dictionary A step of storing a name dictionary registered in advance in association with one piece of information specified by the set of words as a set of indexes, and a step of storing in the basic word dictionary Associating a plurality of words having the same semantic content but different notations with the same logical index assigned to the plurality of different notations in the memory, and registering them in the name dictionary Associating a set of logical indexes associated with one piece of information specified by the set of words corresponding to each set of logical indexes into the memory, and a lexical phrase to be converted comprising a plurality of words A logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory; And a logic that matches one of the logical index sets composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the set of logical indexes expanded in the memory. Selecting an index set and using one piece of information specified by the selected set of logical indexes to convert a lexical phrase including the plurality of words into another data including the specified one piece of information. When acquiring a logical index corresponding to the decomposed word, if there is a word for which a logical index cannot be acquired, the word is specified, and the specified word can be acquired from the decomposed word. A word displayed on the display means for displaying information including data together with a logical index of words. And the logic of the word that can be obtained from the input means for inputting information including data, the word that could not obtain the logical index displayed on the display means, and the word that could obtain the logical index among the decomposed words Searching the name dictionary using one piece of information estimated from the index as a key, obtaining a set of logical indexes corresponding to the one piece of estimated information, the word that could not obtain the logical index, and the The basic word corresponding to the logical index of the difference is specified by identifying a difference word and a logical index between the logical index of the word that has obtained the logical index among the decomposed words and the set of logical indexes acquired from the name dictionary Registering the difference word as a synonym in the word field in the dictionary; It is solved by a method characterized by comprising.

上記課題は、本発明の更に別の局面に従った、単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書を記憶する記憶手段と、データを含む情報を入力するための入力手段と、データを含む情報を表示するための表示手段と、を備えたコンピュータを、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置として機能させるためのプログラムであって、前記コンピュータを、前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、複数の単語を含む変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得し、前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に、記憶手段に記憶された解析NG論理インデックスセット・ファイルに格納する第1の処理エンジン、及び、前記入力手段から入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスを検索して前記表示手段に表示し、前記入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録する第2の処理エンジンとして機能させることを特徴とするプログラムにより解決される。 According to still another aspect of the present invention, the above-described problem has at least a word column for storing words and a logical index column for storing logical indexes representing words stored in the word columns, Each is registered in advance in association with a logical index representing each word, and the word field has a plurality of different meanings and the same semantic content in the analysis process for converting the word into a logical index. A basic word dictionary configured to be able to store the plurality of words so that the same logical index is attached to the word, and a logical index corresponding to a set of words obtained by combining words registered in the basic word dictionary A storage unit that stores a name dictionary registered in advance in association with one piece of information specified by the set of words, and information including data is input. A computer comprising an input means for displaying and a display means for displaying information including data, wherein a lexical phrase including a plurality of words is converted into another data including one piece of information specified by the plurality of words. A program for causing a computer to function as a conversion device, wherein a plurality of words that are registered in the basic word dictionary and have the same semantic content and different notation in the analysis process are different in the notation. A set of logical indexes associated with the same logical index assigned to a plurality of words is expanded in a memory and registered in the name dictionary. The memory is expanded on the memory in association with one piece of information specified by the above, the lexical phrase to be converted including a plurality of words is decomposed into words, and the memo The logical index corresponding to the decomposed word is obtained by referring to the basic word dictionary expanded in the memory, and the logical index corresponding to the decomposed word is selected from the set of logical indexes expanded in the memory. By selecting a logical index set that matches any logical index set composed of a plurality of logical indexes, and using one piece of information specified by the selected logical index set, the plurality of words are Converting the lexical word to be included into another data including the one specified information, and when obtaining a logical index corresponding to the decomposed word, if there is a word for which a logical index cannot be obtained, identify the word; For the identified word, the logical index of the word for which the logical index of the decomposed word can be obtained. And a first processing engine stored in the analysis NG logical index set file stored in the storage means together with the search, and in response to the search command input from the input means, from the analysis NG logical index set file At least the corresponding logical index could not be obtained and the logical index stored together with the word are searched and displayed on the display means, and the logical index displayed on the display means input from the input means Search the name dictionary using as a key one information estimated from a word that could not be acquired and a logical index stored together with the word, and obtain a set of logical indexes corresponding to the one estimated information, The logical index could not be obtained and stored together with the word A difference word and a logical index between a logical index and a set of logical indexes acquired from the name dictionary are specified, and the difference word is synonymous with the word field in the basic word dictionary corresponding to the difference logical index. This is solved by a program characterized by functioning as a second processing engine registered as a word .

上記課題は、本発明の別の局面に従った、単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書を記憶する記憶手段と、データを含む情報を入力するための入力手段と、データを含む情報を表示するための表示手段と、を備えたコンピュータを、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置として機能させるためのプログラムであって、前記コンピュータを、前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、複数の単語を含む変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得し、前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に前記表示手段に表示し、前記入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録する処理エンジンとして機能させることを特徴とするプログラムにより解決される。 According to another aspect of the present invention, the above-described problem includes at least a word column for storing words and a logical index column for storing logical indexes representing words stored in the word columns, and each of a plurality of words Are registered in advance in association with a logical index representing each word, and the word field has a plurality of words having the same semantic content in the analysis processing for converting the word into a logical index and different notations A basic word dictionary configured to be able to store the plurality of words so that the same logical index is attached to the same, and a set of logical indexes corresponding to a set of words obtained by combining words registered in the basic word dictionary Inputs a storage means for storing a name dictionary registered in advance in association with one piece of information specified by the set of words, and information including data A computer comprising input means for displaying and display means for displaying information including data, and converting a lexical phrase including a plurality of words into another data including one piece of information specified by the plurality of words A program for causing a computer to function as a plurality of words having the same meaning and different notation in the analysis process registered in the basic word dictionary. In association with the same logical index assigned to the word, the memory is expanded in the memory, and the set of logical indexes registered in the name dictionary is determined by the set of words corresponding to each set of logical indexes. The memory is expanded on the memory in association with one specified information, the lexical phrase to be converted including a plurality of words is decomposed into words, A logical index corresponding to the decomposed word is obtained by referring to a basic word dictionary expanded in memory, and a plurality of logical indexes corresponding to the decomposed word are selected from the set of logical indexes expanded in memory. A lexical phrase including the plurality of words is selected by selecting a logical index set that matches any logical index set composed of logical indexes and using one piece of information specified by the selected logical index set. Is converted into another data including the specified one information, and when obtaining a logical index corresponding to the decomposed word, if there is a word for which a logical index cannot be obtained, the word is identified, and the identification is performed. The logical index of the word that was able to obtain the logical index among the decomposed words In addition to the words that are displayed on the display means and input from the input means, the logical index displayed on the display means that could not be acquired, and the logical index of the words that were able to acquire the logical index among the decomposed words The name dictionary is searched using one piece of information as a key to obtain a set of logical indexes corresponding to the one piece of estimated information, and among the words that could not obtain the logical index and the decomposed words A word and a logical index of a difference between a logical index of a word for which a logical index can be obtained and a set of logical indexes obtained from the name dictionary are specified, and the word in the basic word dictionary corresponding to the logical index of the difference Function as a processing engine for registering the difference word as a synonym in the column. It is solved by a program and symptoms.

本発明の一態様によれば、差分の単語が1個であることが好ましい。   According to one aspect of the present invention, the number of difference words is preferably one.

本発明は、前述のような構成により、オペレータは複数の単語を含む字句を当該複数の単語により特定される1つの情報を入力するだけで、単語欄に単語が論理インデックス欄に対応の論理インデックスが既に登録されている基本語辞書において当該単語が登録されている単語欄に当該単語と解析処理上同一の意味内容を有する表記の異なる単語が自動的に登録されるので、オペレータが入力すべきデータ量が可能な限り少なく、従って間違いの発生が少なく、信頼性の高い基本語辞書のデータベースを生成することができる。   In the present invention, with the configuration as described above, an operator simply inputs one piece of information specified by a plurality of words for a lexical phrase including a plurality of words, and the logical index corresponding to the word in the word column corresponds to the logical index column. Is automatically registered in the word field where the word is registered in the basic word dictionary in which the word is already registered and has the same meaning content in the analysis processing as the word, so the operator should input It is possible to generate a highly reliable basic word dictionary database with a data amount as small as possible and therefore with few errors.

本発明の好適な実施形態を以下図面を参照して説明する。なお、図面を通して同一又は類似の参照番号は同一又は類似の構成要素を示す。
初めに、特許文献3を援用して、本発明を利用する字句をデータに変換する装置を説明する。図10は、例えば銀行等で受信する決済指図電文等について計算機を使用して取引先顧客情報(CIF)解析処理を行うために用いられる字句をデータに変換する装置の一例の基本構成を示す図である。図10において、10はメイン・フレーム・コンピュータ、パーソナル・コンピュータ、マイクロプロセッサ等の任意のデータ処理装置より構成される処理エンジンを、12はメイン・メモリを、14は基本語辞書を、16は名称辞書をそれぞれ示す。基本語辞書14及び名称辞書16は、磁気ディスク等のハード・ディスク(図示せず)に格納されているが、これに限定されず、いずれの他の形式の記憶装置に格納され得る。処理エンジン10として機能するデータ処理装置と、メイン・メモリ12、及び基本語辞書14及び名称辞書16を格納するハード・ディスクとは通常のデータ・バス等(図示せず)により相互に結合されている。
Preferred embodiments of the present invention will be described below with reference to the drawings. Throughout the drawings, the same or similar reference numerals indicate the same or similar components.
First, with reference to Patent Document 3, an apparatus for converting a lexical phrase using the present invention into data will be described. FIG. 10 is a diagram illustrating a basic configuration of an example of an apparatus that converts a lexical phrase used for performing customer customer information (CIF) analysis processing using a computer to a payment instruction message received at a bank or the like into data, for example. It is. In FIG. 10, 10 is a processing engine composed of an arbitrary data processing device such as a main frame computer, personal computer, microprocessor or the like, 12 is a main memory, 14 is a basic word dictionary, and 16 is a name. Each dictionary is shown. The basic word dictionary 14 and the name dictionary 16 are stored in a hard disk (not shown) such as a magnetic disk, but are not limited thereto, and can be stored in any other type of storage device. The data processing device functioning as the processing engine 10 and the main memory 12, the hard disk storing the basic word dictionary 14 and the name dictionary 16 are coupled to each other by a normal data bus or the like (not shown). Yes.

図11は、基本語辞書14に事前に登録されている単語(以下、「基本語」とも言う。)をメイン・メモリ12上にメモリ展開した状態を示す。銀行等におけるCIF解析処理で扱う入力データは、通常アルファベット及びニューメリック(数字)から成り、従って、基本語辞書14に登録されている単語もアルファベット及びニューメリック(数字)から構成されている。なお、本明細書における単語あるいは基本語には、普通名詞、固有名詞、略語が含まれるのは勿論、その他、ある意味を有するいずれの一組の記号も含まれる。図11に示すように、基本語辞書14の一例は、項目として、単語、品詞、名称の属性、コードの属性、及び登録された各単語に対応する数字で表される論理インデックスを含む。この論理インデックスの数字は、CPU処理単位数を小さくするため、2進数で表現された数字であることが好ましい。基本語辞書としては基本語を登録するための単語の欄と、その単語に対応する数字の論理インデックスを格納するための論理インデックスの欄を少なくとも含めばよく、その他の項目は上記のものに限定されるものではない。論理インデックスは、基本語が基本語辞書14の単語の欄に登録されるとき、その単語に対応する数字(定値)が割り振られ、基本語辞書14の論理インデックスの欄に、登録される基本語と関連付けられて当該数字も格納、即ち登録される。基本語辞書14は、変換すべき字句に登録されていない基本語を含む場合、新たな基本語及びそれに対応する論理インデックスを登録し、また登録済みの基本語で使用しなくなった場合に当該基本語及びその対応の論理インデックスを削除できる構造であることが好ましい。   FIG. 11 shows a state in which words registered in advance in the basic word dictionary 14 (hereinafter also referred to as “basic words”) are expanded in the main memory 12. The input data handled in the CIF analysis processing in a bank or the like is usually composed of alphabets and numerics (numeric characters), and therefore the words registered in the basic word dictionary 14 are also composed of alphabets and numerics (numeric characters). Note that the word or basic word in this specification includes not only common nouns, proper nouns, and abbreviations, but also any set of symbols having a certain meaning. As shown in FIG. 11, an example of the basic word dictionary 14 includes words, parts of speech, name attributes, code attributes, and logical indexes represented by numbers corresponding to the registered words. The number of the logical index is preferably a number expressed in binary to reduce the number of CPU processing units. The basic word dictionary should include at least a word column for registering a basic word and a logical index column for storing a logical index of a number corresponding to the word. Other items are limited to the above. Is not to be done. When a basic word is registered in the word column of the basic word dictionary 14, the logical index is assigned a number (fixed value) corresponding to the word, and is registered in the logical index column of the basic word dictionary 14. The number is also stored, that is, registered in association with. When the basic word dictionary 14 includes a basic word that is not registered in the lexical phrase to be converted, the basic word dictionary 14 registers a new basic word and a corresponding logical index, and when the basic word dictionary 14 is no longer used with the registered basic word, the basic word dictionary 14 The structure is preferably such that a word and its corresponding logical index can be deleted.

処理エンジン10は、変換処理を開始する前に、図11に示すように、基本語辞書14に登録されている基本語をメイン・メモリ12上にメモリ展開する。メモリ・アドレスは動的に割り付けられるので、プログラムをメモリ・ロードする度に、同じ単語が同一のメモリ・アドレスの場所に格納されるわけではなく、メモリ・アドレスが異なるのが一般的である。従って、この例では、単語の欄の基本語「AKASAKA」について、参照番号100で示されるように、プログラムが所与の時点でメモリ・ロードされたとき動的に割り付けられるメイン・メモリ12上のメモリ・アドレスとして50番が割り付けられ、その場所に「AKASAKA」に関する情報が格納される。メモリ・アドレスとは対照的に、基本語「AKASAKA」は、メイン・メモリ12上で定値の論理インデックス「#100」と関連付けられて格納されていることに注目されたい。なお、高速処理の観点からは、基本語辞書14を全てメイン・メモリ12上にメモリ展開するのが好ましいが、変換すべき字句に含まれる基本語が事前に分かっている場合には、用いられる基本語だけをメイン・メモリ12上にメモリ展開してもよく、更に、用途によっては、変換処理速度が遅くなるが、基本語辞書14に登録されている基本語の一部分をメモリ展開し、未展開の基本語が変換処理に必要になったとき追加的にメモリ展開するようにしてもよい。   The processing engine 10 expands the basic words registered in the basic word dictionary 14 in the main memory 12 as shown in FIG. 11 before starting the conversion process. Since memory addresses are dynamically allocated, the same word is not stored at the same memory address location each time a program is memory loaded, and the memory addresses are typically different. Thus, in this example, for the basic word “AKASAKA” in the word column, as indicated by reference numeral 100, on the main memory 12 that is dynamically allocated when the program is memory loaded at a given time. Number 50 is assigned as the memory address, and information relating to “AKASAKA” is stored at that location. Note that the basic word “AKASAKA” is stored in the main memory 12 in association with a fixed logical index “# 100”, in contrast to the memory address. From the viewpoint of high-speed processing, it is preferable that all the basic word dictionaries 14 are expanded in the main memory 12, but this is used when the basic words included in the lexical terms to be converted are known in advance. Only basic words may be expanded in the main memory 12, and depending on the application, the conversion processing speed may be slow, but a part of the basic words registered in the basic word dictionary 14 is expanded in the memory. When the basic word of expansion becomes necessary for the conversion process, the memory may be additionally expanded.

図12は、名称辞書16に事前に登録されている論理インデックスセットをメイン・メモリ12上にメモリ展開した状態を示す。なお、図12には、図11と同様の基本語辞書14に事前に登録されている基本語をメイン・メモリ12上にメモリ展開した状態をも示す。図12に示すように、名称辞書16の項目は、論理インデックスセット、名称、及び名称に示される単語の組み合わせにより特定される1つの情報、例えば、この銀行の応用の例ではCIFコードから成る。名称辞書16の名称の欄には、基本語辞書14に登録されている基本語のうちで、CIFコードが特定される基本語の組み合わせに含まれる基本語が事前に登録されている。一例として、単語の組み合わせ「GETRONICS FOODS CO.,LTD AKASAKA」によりCIFコード「123−45678」が、「GETRONICS SHOKUHIN OSAKA」により「101−23456」が、「GETRONICS BANK AKASAKA」により「102―34567」がそれぞれ特定されるとする。そこで、名称辞書16の第1行には「GETRONICS FOODS CO.,LTD AKASAKA」が、第2行には「GETRONICS SHOKUHIN OSAKA」が、第3行には「GETRONICS BANK AKASAKA」がそれぞれ文字列として登録されている。論理インデックスセットの欄には、これらの組み合わされた基本語に対応する論理インデックスの組が登録されている。例えば、名称辞書16の第1行には、名称「GETRONICS FOODS CO.,LTD AKASAKA」に対応して、「#107,#106,#104,#100」が、第2行には、名称「GETRONICS SHOKUHIN OSAKA」に対応して、「#107,#112,#111」が、第3行には、名称「GETRONICS BANK AKASAKA」に対応して、「#107,#101,#100」がそれぞれ基本語辞書14の論理インデックスの組として登録されている。CIFコードの欄には、各名称に対応する固有の番号が登録される。例えば、名称辞書16の第1行には、「GETRONICS FOODS CO.,LTD AKASAKA」に対応するCIFコード「123−45678」が、第2行には、「GETRONICS SHOKUHIN OSAKA」に対応するCIFコード「101−23456」が、第3行には、「GETRONICS BANK AKASAKA」に対応するCIFコード「102−34567」がそれぞれ登録されている。名称辞書16は、変換すべき字句に、登録されていない基本語の組み合わせがある場合、新たな基本語を含む組み合わせを登録し、また登録済みの組み合わせで使用しなくなった場合に削除できるようにされていることが好ましい。   FIG. 12 shows a state in which a logical index set registered in advance in the name dictionary 16 is expanded on the main memory 12. FIG. 12 also shows a state in which basic words registered in advance in the basic word dictionary 14 similar to FIG. 11 are expanded in the main memory 12. As shown in FIG. 12, the item of the name dictionary 16 includes one piece of information specified by a combination of a logical index set, a name, and a word indicated by the name, for example, a CIF code in this bank application example. Among the basic words registered in the basic word dictionary 14, basic words included in combinations of basic words for which the CIF code is specified are registered in advance in the name column of the name dictionary 16. As an example, the CIF code “123-45678” is obtained by the word combination “GETRONICS FOODS CO., LTD AKASAKA”, “101-23456” is obtained by “GETRONICS SHOKUHIN OSAKA”, and “102-34” is obtained by “GETRONICS BANK AKASAKA 56”. Assume that each is specified. Therefore, “GETRONICS FOODS CO., LTD AKASAKA” is registered in the first line of the name dictionary 16, “GETRONICS SHOKUHIN OSAKA” is registered in the second line, and “GETRONICS BANK AKASAKA” is registered in the third line. Has been. In the column of logical index set, a set of logical indexes corresponding to these combined basic words is registered. For example, “# 107, # 106, # 104, # 100” corresponding to the name “GETRONICS FOODS CO., LTD AKASAKA” is displayed in the first line of the name dictionary 16, and the name “ “# 107, # 112, # 111” corresponds to “GETRONICS SHOKUHIN OSAKA”, and “# 107, # 101, # 100” corresponds to the name “GETRONICS BANK AKASAKA” in the third row, respectively. It is registered as a set of logical indexes of the basic word dictionary 14. A unique number corresponding to each name is registered in the CIF code column. For example, the first line of the name dictionary 16 has a CIF code “123-45678” corresponding to “GETRONICS FOODS CO., LTD AKASAKA”, and the second line has a CIF code “123-5678” corresponding to “GETRONICS SHOKUHIN OSAKA”. “101-23456” is registered in the third row, and the CIF code “102-34567” corresponding to “GETRONICS BANK AKASAKA” is registered. The name dictionary 16 can be deleted when there is a combination of basic words that are not registered in the lexical phrase to be converted, and a combination that includes a new basic word is registered and can be deleted when the registered combination is no longer used. It is preferable that

処理エンジン10は、変換処理を開始する前に、名称辞書16に登録されている論理インデックスセットとCIFコードとを関連付けて、図12の参照番号16aで示されるようにメイン・メモリ12上へメモリ展開する。   Before starting the conversion process, the processing engine 10 associates the logical index set registered in the name dictionary 16 with the CIF code, and stores the memory on the main memory 12 as indicated by reference numeral 16a in FIG. expand.

次に、入力データの変換処理を図10〜図12並びに図13を参照して説明する。図13は、図10に示す変換装置に入力されたデータが変換される過程を説明するための図である。   Next, input data conversion processing will be described with reference to FIGS. FIG. 13 is a diagram for explaining a process in which data input to the conversion device shown in FIG. 10 is converted.

ここで、メイン・メモリ12上には前述したように基本語辞書14、及び名称辞書16がメモリ展開されているとする。そして、図13の参照番号40で示すデータが入力されたとする。処理エンジン10は、ステップ42に示されるように入力データ40を単語に分解する。この例では、参照番号40に示されるように、入力データは、アルファベット及びニューメリック(数字)から成り、単語間はスペースにより区切られている。処理エンジン10は、入力データ40文字列に含まれるスペースを区切りに入力データ40を単語に分解する。   Here, it is assumed that the basic word dictionary 14 and the name dictionary 16 are expanded on the main memory 12 as described above. Then, it is assumed that data indicated by reference numeral 40 in FIG. 13 is input. The processing engine 10 breaks the input data 40 into words as shown in step 42. In this example, as indicated by reference numeral 40, the input data is composed of alphabets and numerics (numeric characters), and the words are separated by spaces. The processing engine 10 breaks down the input data 40 into words with a space included in the input data 40 character string as a delimiter.

次いで、処理エンジン10は、ステップ44に示されるように、分解された単語に対応する論理インデックスを、図12に示すメイン・メモリ12上にメモリ展開された基本語辞書14aを参照して取得する。この例では、図12の基本語辞書14aの中の丸で囲った基本語に対応する論理インデックスが取得される。   Next, as shown in step 44, the processing engine 10 acquires the logical index corresponding to the decomposed word with reference to the basic word dictionary 14a expanded in the memory on the main memory 12 shown in FIG. . In this example, the logical index corresponding to the basic word circled in the basic word dictionary 14a of FIG. 12 is acquired.

次いで、処理エンジン10は、ステップ46において、分解された単語のうち、論理インデックスが取得できた単語については、当該単語を、取得できた論理インデックスに変換する。なお、<1−2−34>のように基本語辞書14aにはない場合にはそのままにしておく。この例では、変換後に、「#107」、「#106」、「#104」及び「#100」という論理インデックスが得られる。   Next, in step 46, the processing engine 10 converts the word that has been obtained with the logical index out of the decomposed words into the logical index that has been obtained. If <1-234> does not exist in the basic word dictionary 14a, it is left as it is. In this example, after conversion, logical indexes “# 107”, “# 106”, “# 104”, and “# 100” are obtained.

処理エンジン10は、ステップ48において、論理インデックス「#107」、「#106」、「#104」及び「#100」のうちの任意の組が、図12に示すメモリ展開された名称辞書16aの論理インデックスセットの中にあるか検索して、一致した場合にはその論理インデックスセットに対応するCIFコードを取得する。この例においては、論理インデックス「#107」、「#106」、「#104」及び「#100」の組み合わせが一致し、それに対応するCIFコード「123−45678」が取得される。その結果、入力データ即ち字句の中の「GETRONICS FOODS CO.,LTD AKASAKA」が所望のデータであるCIFコード「123−45678」に変換される。   In step 48, the processing engine 10 stores an arbitrary set of logical indexes “# 107”, “# 106”, “# 104”, and “# 100” in the name dictionary 16a expanded in the memory shown in FIG. A search is made as to whether there is a logical index set. If they match, a CIF code corresponding to the logical index set is obtained. In this example, the combinations of logical indexes “# 107”, “# 106”, “# 104”, and “# 100” match, and the corresponding CIF code “123-45678” is acquired. As a result, “GETRONICS FOODS CO., LTD AKASAKA” in the input data, that is, the lexical phrase is converted into CIF code “123-45678” which is desired data.

要約すると、上記装置は、入力された名称等の文字列を基礎となる単語に分割、それぞれを所定の論理インデックスに変換・抽出し、その組み合わせの要素の中にCIFコード等に対応するインデックス・セットが包含されるかどうかを判別し、包含されるときには当該入力名称等に対しCIFコード等を導出する。   In summary, the apparatus divides a character string such as an input name into basic words, converts and extracts each into a predetermined logical index, and includes an index / corresponding to a CIF code or the like in the combination element. It is determined whether or not the set is included, and when included, a CIF code or the like is derived for the input name or the like.

ここで、論理インデックスを用いる利点について説明する。前述のとおり、論理インデックスを用いることにより、本来、文字(1文字=1バイト)から構成される単語は2進数表現の数字に変換され、これに基づいて辞書検索が行われる。例えば、7文字で構成される単語「Shoyama」は、このままをメモリ展開する場合、通常7バイトを要するが、これに論理インデックス「207」を適用した場合、「207」は、2進数でビット表現すると「11001111」となり、8ビット(=1バイト)で表現が可能となる。そのため、論理インデックスは、それにより表象されるいずれの単語よりもCPU処理単位数を小さくする。このような論理インデックスを用いることにより、メモリ負荷及びCPU負担が軽減され、処理高速化が図れる。   Here, an advantage of using the logical index will be described. As described above, by using a logical index, a word originally composed of characters (1 character = 1 byte) is converted into a binary number, and a dictionary search is performed based on this. For example, the word “Shoyama” consisting of 7 characters normally requires 7 bytes to expand the memory as it is. However, when the logical index “207” is applied to this, “207” is expressed as a bit in binary. Then, “11001111” is obtained, which can be expressed by 8 bits (= 1 byte). Therefore, the logical index makes the number of CPU processing units smaller than any word represented by it. By using such a logical index, memory load and CPU load are reduced, and processing speed can be increased.

なお、図10の処理エンジン10内に記載されている処理ブロックと図13の処理ステップとは、図13のステップ42及び44が図10の単語認識ブロック20に、図13のステップ46及び48が名称認識ブロック22にそれぞれ対応する。   The processing blocks described in the processing engine 10 in FIG. 10 and the processing steps in FIG. 13 are the steps 42 and 44 in FIG. 13 being the word recognition block 20 in FIG. 10 and the steps 46 and 48 in FIG. Each corresponds to the name recognition block 22.

次に、前述した装置の変更形態を以下に説明する。上記装置と同じ構成、動作の部分は説明を省き、相違する部分のみを説明する。処理エンジン10は、入力データを受け取る前に、基本語辞書14をメイン・メモリ12上にメモリ展開するが、名称辞書16について事前にメイン・メモリ12上にメモリ展開しない。   Next, modifications of the above-described apparatus will be described below. The description of the same configuration and operation as the above apparatus will be omitted, and only the different parts will be described. The processing engine 10 expands the basic word dictionary 14 on the main memory 12 before receiving the input data, but does not expand the name dictionary 16 on the main memory 12 in advance.

次いで、処理エンジン10は、入力データを受け取り、図13のステップ44及び46までの処理を行う。処理エンジン10は、次いで、入力データに含まれる単語に対応する取得された論理インデックスを含む論理インデックスセットの全てを名称辞書16から抽出し、それらを図12の16aで示すようにメイン・メモリ12上にメモリ展開する。   Next, the processing engine 10 receives the input data and performs the processing up to steps 44 and 46 in FIG. The processing engine 10 then extracts all of the logical index sets, including the acquired logical index corresponding to the words included in the input data, from the name dictionary 16 and stores them in the main memory 12 as shown at 16a in FIG. Expand memory above.

次いで、処理エンジン10は、図13のステップ48と類似の処理を行う。詳細には、処理エンジン10は、入力データに含まれる単語に対応する取得された論理インデックス「#107」、「#106」、「#104」及び「#100」のうちの任意の組が、図12に示すメモリ展開された名称辞書16aの論理インデックスセットの中にあるか検索して、一致した場合にはその論理インデックスセットに対応するCIFコードとして「123−45678」を取得する。その結果、入力データ即ち字句の中の「GETRONICS FOODS CO.,LTD AKASAKA」が所望のデータであるCIFコード「123−45678」に変換される。この変更形態は、変換処理速度が前述の装置より遅くなるが、メイン・メモリ12の容量が少なくてよい。   Next, the processing engine 10 performs processing similar to step 48 of FIG. Specifically, the processing engine 10 determines that an arbitrary set of the obtained logical indexes “# 107”, “# 106”, “# 104”, and “# 100” corresponding to the words included in the input data is It is searched whether there is a logical index set in the name dictionary 16a expanded in memory shown in FIG. 12, and if they match, “123-45678” is acquired as the CIF code corresponding to the logical index set. As a result, “GETRONICS FOODS CO., LTD AKASAKA” in the input data, that is, the lexical phrase is converted into CIF code “123-45678” which is desired data. In this modified form, the conversion processing speed is slower than that of the above-mentioned apparatus, but the capacity of the main memory 12 may be small.

前述の装置においては、論理インデックスを予め定値として定義し、その論理インデックスを基本語と関連付けて基本語辞書14に格納し、これをメイン・メモリ12上にメモリ展開することにより、キーを、プログラムをメモリ・ロードする度に変化し得るメモリ・アドレスに変換する処理が不要となり、また辞書相互間のキー関係を、取得したメモリ・アドレスに置き換え、生成する必要がなくなるため、プログラム初期処理上負荷が軽減され、ロード時間を高速化することができる。また、論理インデックス及び論理インデックスセットにより構成された辞書解析により、解析処理自体の高速化が可能となる。   In the above-described apparatus, a logical index is defined as a fixed value in advance, the logical index is stored in the basic word dictionary 14 in association with a basic word, and this is expanded in the memory on the main memory 12, so that the key is programmed. Since there is no need to convert the memory address to a memory address that can change each time the memory is loaded, it is not necessary to replace the key relationship between dictionaries with the acquired memory address and generate it. Can be reduced, and the load time can be increased. Further, the analysis process itself can be speeded up by the dictionary analysis composed of the logical index and the logical index set.

更に、前述した装置の別の変更形態を以下に説明する。この変更形態では、基本語辞書14の単語の欄の1つの行に複数の単語を格納し得るようにする。前述した装置では、単語を論理インデックスに変換する解析処理を行っている。この解析処理すべき単語には、表記は異なるものの解析処理上同一の意味内容を有するものがある。これらの単語には、個々に異なる論理インデックスを割り振ってもよいが、解析処理上同一の意味内容を有するので、同一の論理インデックスを割り振っても解析処理上問題は生じないし、処理効率上無駄を省くことができる。そこで、このような表記は異なるものの解析処理上同一の意味内容を有する複数の単語を基本語辞書14の単語の欄の1つの行に格納する。格納の仕方の一例としては、各単語を識別できるように、単語と単語との間にスペースを挿入すればよい。なお、上記装置は、複数の単語の格納の仕方は、各単語が識別できればいずれの方法でもよい。例えば、「FOODS」と「FOOD」とは、解析処理上表記が異なるが解析処理上同一の意味内容を有する単語である。これらの単語を、図11の参照番号102に示されるように「FOODS」と「FOOD」との間にスペースを挿入して格納する。従って、「FOODS」と「FOOD」とには、同一の論理インデックス「#106」が割り振られることになる。   Further, another modification of the above-described apparatus will be described below. In this modification, a plurality of words can be stored in one row of the word column of the basic word dictionary 14. In the above-described apparatus, an analysis process for converting a word into a logical index is performed. Some words to be analyzed have different meanings but have the same meaning in the analysis process. Although different logical indexes may be assigned to these words individually, they have the same semantic content in the analysis process, so even if the same logical index is assigned, no problem occurs in the analysis process, and there is a waste in processing efficiency. It can be omitted. Therefore, a plurality of words having the same semantic content in the analysis processing are stored in one row of the word column of the basic word dictionary 14 although such notation is different. As an example of the storing method, a space may be inserted between words so that each word can be identified. In the above apparatus, any method may be used for storing a plurality of words as long as each word can be identified. For example, “FOODS” and “FOOD” are words having different meanings in the analysis process but different in notation in the analysis process. These words are stored by inserting a space between “FOODS” and “FOOD” as indicated by reference numeral 102 in FIG. Therefore, the same logical index “# 106” is allocated to “FOODS” and “FOOD”.

基本語辞書14の単語欄に2つの単語「FOODS」及び「FOOD」が格納されている場合には、それらの単語は、参照番号104に示されるように単語欄に2つの単語を含む「FOODS FOOD」の形式で、メイン・メモリ12上にメモリ展開される。そのため、メイン・メモリ12上で、単語「FOOD」も単語「FOODS」と同一の論理インデックス「#106」と関連付けされる。   When two words “FOODS” and “FOOD” are stored in the word field of the basic word dictionary 14, these words include “FOODS” including two words in the word field as indicated by reference numeral 104. The memory is expanded on the main memory 12 in the format of “FOOD”. Therefore, on the main memory 12, the word “FOOD” is also associated with the same logical index “# 106” as the word “FOODS”.

図13に示す入力データにおいて、「FOODS」の代わりに「FOOD」が入力された場合も、前述した装置と同様の動作により、「FOOD」は論理インデックス「#106」に変換され、図13のステップ46及び48における動作と同じ動作により、「GETRONICS FOOD CO.,LTD AKASAKA」は、「123−45678」に変換される。   In the input data shown in FIG. 13, when “FOOD” is input instead of “FOODS”, “FOOD” is converted into the logical index “# 106” by the same operation as the above-described apparatus, and FIG. “GETRONICS FOOD CO., LTD AKASAKA” is converted to “123-45678” by the same operation as in steps 46 and 48.

図14は、前述した解析処理上同一の意味内容を有する表記の異なる複数の単語に同一の論理インデックスを割り振る方法の理解を容易にするための概要を示す図である。参照番号110は、基本語辞書14における単語と論理インデックスとの対応関係を示し、単語「Syoyama」は単語「Shoyama」と、そして単語「&」は単語「and」とそれぞれ表記が異なるが解析処理上同一の意味内容を有するので、単語「Syoyama」には単語「Shoyama」と同じ論理インデックス「#207」が、また単語「&」には単語「and」と同じ論理インデックス「#206」が割り振られている。参照番号112は、名称辞書16における論理インデックスセットとCIFコードとの対応関係を示す。入力1に示されるような字句が入力された場合、分割1に示されるように単語に分割され、分割された各単語に対して参照番号110に示す単語−論理インデックスの対応関係を参照する、即ち辞書を適用すると、辞書適用に示される論理インデックスに変換される。一方、入力2に示されるような字句が入力された場合、分割2に示されるように単語に分割され、分割された各単語に対して参照番号110に示す単語と論理インデックスとの対応関係を参照する、即ち辞書を適用すると、辞書適用に示されるように入力1の場合と同じ論理インデックスに変換される。入力1及び入力2は同じ論理インデックスの組に変換されるので、CIF解析において、参照番号112に示される論理インデックスセットとCIFコードとの対応関係を参照すると、入力1も入力2も同じCIFコードに変換される。   FIG. 14 is a diagram showing an overview for facilitating understanding of a method of assigning the same logical index to a plurality of words having different notations having the same meaning and content in the analysis processing described above. Reference numeral 110 indicates a correspondence relationship between the words and the logical index in the basic word dictionary 14, the word “Syoyama” is different from the word “Shoyama”, and the word “&” is different from the word “and”, but is analyzed. Since the word “Syoyama” is assigned the same logical index “# 207” as the word “Shoyama”, the word “&” is assigned the same logical index “# 206” as the word “and”. It is. Reference numeral 112 indicates the correspondence between the logical index set in the name dictionary 16 and the CIF code. When a lexical word as shown in input 1 is inputted, it is divided into words as shown in division 1, and the word-logical index correspondence relationship indicated by reference number 110 is referred to for each divided word. That is, when a dictionary is applied, it is converted into a logical index shown in dictionary application. On the other hand, when a lexical word as shown in input 2 is input, it is divided into words as shown in division 2, and the correspondence between the word indicated by reference number 110 and the logical index is assigned to each divided word. When referring, that is, applying a dictionary, it is converted to the same logical index as input 1 as shown in Dictionary application. Since the input 1 and the input 2 are converted into the same set of logical indexes, when the correspondence relationship between the logical index set indicated by reference numeral 112 and the CIF code is referred to in the CIF analysis, both the input 1 and the input 2 have the same CIF code. Is converted to

解析処理上同一の意味内容を有する表記の異なる複数の単語に同一の論理インデックスを割り振る上記の変更形態では、それら複数の単語には解析処理上同一の意味内容を有するので同一の論理インデックスを割り振り、基本語辞書14の単語欄にそれら複数の単語を同一の論理インデックスと関連付けて格納することにより、メイン・メモリ及びハード・ディスク等の記憶装置のリソースが省資源となり、また処理効率が向上する。   In the above-described modification in which the same logical index is allocated to a plurality of words having the same meaning and content in the analysis process, the same logical index is allocated to the plurality of words because they have the same meaning and content in the analysis process. By storing the plurality of words in the word column of the basic word dictionary 14 in association with the same logical index, the resources of the storage device such as the main memory and the hard disk are saved, and the processing efficiency is improved. .

次に、表記は異なるものの解析処理上同一の意味内容を有する単語を基本語辞書に追加する際にオペレータが入力しなければならないデータ量をできるだけ少なくして、間違いを減らして、信頼性の高い基本語辞書のデータベースを生成するための本発明の好適な実施形態について以下に説明する。   Next, the amount of data that the operator must input when adding words with the same semantic content to the basic word dictionary in the analysis process, although they are different, is reduced as much as possible, reducing errors, and highly reliable A preferred embodiment of the present invention for generating a basic word dictionary database is described below.

最初に、本発明を適用せずに従来までのCIF特定の概念を用いた場合を、図2〜図4を用いて説明する。
図3は、名称辞書16及び図2の基本語辞書14をそれぞれをメモリ展開した内容を示す。この場合、単語「&」が基本語辞書14に登録されていないとする。図4は、入力データが論理インデックスに変換されるまでの処理を示す。図4の1に示されるように入力データ「THE NAKAMORI TRUST & BANK CORP」が入力されたとする。図4の2でスペースを手がかりにして単語に分解する。図4の3でメイン・メモリ212上の基本語辞書14aを参照して、論理インデックスを取得する。「&」は基本語辞書14に登録されていないので、そのままとなる。その結果、図4の4に示すように入力データは「&」を除いて論理インデックスに変換される。従来のマッチング処理では、図4の入力データの論理インデックス「#501,#105,#402,#101,#220」を使って、図3の名称辞書16aを検索しても、検索できない論理インデックス「#301」があるため、CIFを特定できず解析NGとなる。この処理フローの一例を図9の一部に示す。ステップ300において、基本語辞書14及び名称辞書16がメイン・メモリ212上にメモリ展開される。入力データ解析310のステップ312において、図4の1に示される入力データが入力され、当該入力データは、スペースを手がかりにして単語に分割される。続いて、ステップ314において、分割した単語を、メモリ展開された基本語辞書14aの単語に対応した論理インデックスに変換する。マッチング処理320のステップ322において、入力データの論理インデックスで名称辞書16aを検索する。次いで、ステップ324において、検索結果、即ち、入力データと名称辞書16aとの論理インデックスセットとにマッチングが成立すれば、OKとなりCIFが特定される(ステップ330)。一方、マッチングが成立しなければ、解析NGとなる(ステップ332)。
First, the case of using the conventional concept of CIF specification without applying the present invention will be described with reference to FIGS.
FIG. 3 shows the contents of the name dictionary 16 and the basic word dictionary 14 of FIG. In this case, it is assumed that the word “&” is not registered in the basic word dictionary 14. FIG. 4 shows a process until input data is converted into a logical index. Assume that input data “THE NAKAMORI TRUST & BANK CORP” is input as indicated by 1 in FIG. In FIG. 4 2, the space is used as a clue to break it down into words. The logical index is obtained by referring to the basic word dictionary 14a on the main memory 212 in 3 of FIG. Since “&” is not registered in the basic word dictionary 14, it remains as it is. As a result, as shown by 4 in FIG. 4, the input data is converted into a logical index except “&”. In the conventional matching process, the logical index “# 501, # 105, # 402, # 101, # 220” of the input data in FIG. 4 is used, and the logical index that cannot be searched even if the name dictionary 16a in FIG. 3 is searched. Since there is “# 301”, the CIF cannot be specified, and analysis NG occurs. An example of this processing flow is shown in part of FIG. In step 300, the basic word dictionary 14 and the name dictionary 16 are expanded in the main memory 212. In step 312 of the input data analysis 310, the input data shown in 1 of FIG. 4 is input, and the input data is divided into words using a space as a clue. Subsequently, in step 314, the divided words are converted into logical indexes corresponding to the words in the basic word dictionary 14a expanded in the memory. In step 322 of the matching process 320, the name dictionary 16a is searched with the logical index of the input data. Next, in step 324, if matching is established between the search results, that is, the logical index set of the input data and the name dictionary 16a, the result is OK and the CIF is specified (step 330). On the other hand, if the matching is not established, the analysis is NG (step 332).

図1は、図10を参照して説明した装置に利用され、表記は異なるものの解析処理上同一の意味内容を有する単語を基本語辞書に登録する本発明の装置の好適な一実施形態を示す。図1において、210はメイン・フレーム・コンピュータ、パーソナル・コンピュータ、マイクロプロセッサ等の任意のデータ処理装置より構成される処理エンジンを、212はメイン・メモリを、14は基本語辞書を、16は名称辞書をそれぞれ示す。処理エンジン210及びメイン・メモリ212は、前述の装置の処理エンジン10及びメイン・メモリ12と同じであっても別であってもよい。基本語辞書14及び名称辞書16は前述の装置のものと同じである。220は、CIFを特定できず解析NGとなった論理インデックス及び未変換の単語を含む不完全論理インデックスセット(図4の4に示す論理インデックスセット400参照)を格納する解析NG論理インデックスセット・ファイルである。基本語辞書14、名称辞書16及び解析NG論理インデックスセット・ファイル220は、磁気ディスク等のハード・ディスク(図示せず)に格納されているが、これに限定されず、いずれの他の形式の記憶装置に格納され得る。222はデータ等を入力するためのキーボード等の入力装置であり、224はデータ等を表示するための通常の液晶ディスプレイ等の表示装置である。処理エンジン210として機能するデータ処理装置と、メイン・メモリ212、及び基本語辞書14、名称辞書16及び解析NG論理インデックスセット・ファイル220を格納するハード・ディスク、入力装置222及び表示装置224とは通常のデータ・バス等(図示せず)により相互に結合されている。なお、図1に示す装置の構成要素及び機能を図10に示す装置を拡張して組み込むことも可能である。   FIG. 1 shows a preferred embodiment of the apparatus of the present invention which is used in the apparatus described with reference to FIG. 10 and registers words having the same semantic content in the analysis process, although having different notations, in the basic word dictionary. . In FIG. 1, 210 is a processing engine composed of an arbitrary data processing device such as a main frame computer, personal computer, or microprocessor, 212 is a main memory, 14 is a basic word dictionary, and 16 is a name. Each dictionary is shown. The processing engine 210 and the main memory 212 may be the same as or different from the processing engine 10 and the main memory 12 of the apparatus described above. The basic word dictionary 14 and the name dictionary 16 are the same as those of the aforementioned device. Reference numeral 220 denotes an analysis NG logical index set file that stores a logical index that cannot be identified as a CIF and is an analysis NG and an incomplete logical index set including unconverted words (see the logical index set 400 shown in 4 of FIG. 4). It is. The basic word dictionary 14, the name dictionary 16, and the analysis NG logical index set file 220 are stored in a hard disk (not shown) such as a magnetic disk, but are not limited to this, and are in any other format. It can be stored in a storage device. Reference numeral 222 denotes an input device such as a keyboard for inputting data and the like, and 224 denotes a display device such as a normal liquid crystal display for displaying data and the like. The data processing device that functions as the processing engine 210, the main memory 212, the basic word dictionary 14, the name dictionary 16, and the hard disk that stores the analysis NG logical index set file 220, the input device 222, and the display device 224 They are connected to each other by a normal data bus or the like (not shown). Note that the components and functions of the apparatus shown in FIG. 1 can be expanded and incorporated in the apparatus shown in FIG.

処理エンジン210は、図9の処理フローのステップ300〜332を実行する。処理エンジン210は、解析NGの場合には、図4の参照番号400に示されるような未変換の単語を含む不完全論理インデックスセットを解析NG論理インデックスセット・ファイル220に格納する。なお、処理エンジン210のこれらの機能は、前述の装置の処理エンジン10に組み込んでもよい。また、前述の装置の処理エンジン10が、ステップ300〜332を実行し、更に解析NGの場合には、図4の参照番号400に示されるような未変換の単語を含む不完全論理インデックスセットを解析NG論理インデックスセット・ファイル220に格納する処理を行ってもよい。   The processing engine 210 executes steps 300 to 332 of the processing flow of FIG. In the case of analysis NG, the processing engine 210 stores an incomplete logical index set including unconverted words as indicated by reference numeral 400 in FIG. 4 in the analysis NG logical index set file 220. Note that these functions of the processing engine 210 may be incorporated into the processing engine 10 of the above-described apparatus. Further, the processing engine 10 of the above-described apparatus executes steps 300 to 332, and in the case of analysis NG, an incomplete logical index set including an unconverted word as indicated by reference numeral 400 in FIG. Processing to store in the analysis NG logical index set file 220 may be performed.

次に、基本語辞書14に登録する処理フローを図5及び図9を用いて説明する。
図9の入力データ取得処理340のステップ342において、オペレータは入力装置222に、解析NG論理インデックスセット・ファイル220に格納されている不完全論理インデックスセットを表示装置224に表示させるよう指令するコマンドを入力する。次いで、処理エンジン210は、その指令に応答して、解析NG論理インデックスセット・ファイル220に格納されている不完全論理インデックスセットを表示装置224に表示する。なお、表示される不完全論理インデックスセットの表示の仕方は、一覧形式にしてもよく、特定のものに限定するようにしてもよく、使用形態に応じて任意である。図5の1に記述されている不完全論理インデックスセット402は、前記の例でCIFが特定できずに解析NGとなった論理インデックスセットである。
Next, a processing flow to be registered in the basic word dictionary 14 will be described with reference to FIGS.
In step 342 of the input data acquisition process 340 in FIG. 9, the operator instructs the input device 222 to display the incomplete logical index set stored in the analysis NG logical index set file 220 on the display device 224. input. Next, in response to the command, the processing engine 210 displays the incomplete logical index set stored in the analysis NG logical index set file 220 on the display device 224. The display method of the displayed incomplete logical index set may be in a list format, limited to a specific one, and is arbitrary according to the usage pattern. The incomplete logical index set 402 described in 1 of FIG. 5 is a logical index set that is analyzed NG because the CIF cannot be specified in the above example.

図9のステップ344において、表示装置224に表示された不完全論理インデックスセット402に対して、オペレータが補正入力を行うことにより、処理エンジン210は入力データ取得を行う。詳細には、オペレータは、図5の2に示されるように、表示された不完全論理インデックスセット402から推定されるCIFコード「9130000」(図5の404参照)を入力装置222から入力する。   In step 344 of FIG. 9, the processing engine 210 obtains input data when the operator makes a correction input to the incomplete logical index set 402 displayed on the display device 224. Specifically, as shown in 2 of FIG. 5, the operator inputs the CIF code “9130,000” (see 404 of FIG. 5) estimated from the displayed incomplete logical index set 402 from the input device 222.

図9の基本語辞書登録処理340のステップ352において、処理エンジン210は、補正入力されたCIFコード「9130000」をキーにして、名称辞書16を検索し、名称辞書16から論理インデックスセットを取得する。図5の例では、図3に記述している名称辞書16のCIFコード「9130000」の行が選択され、論理インデックスセット「#501,#105,#402,#301,#101,#220」を取得する(図5の2における参照番号406)。   In step 352 of the basic word dictionary registration processing 340 in FIG. 9, the processing engine 210 searches the name dictionary 16 using the corrected CIF code “9130,000” as a key, and acquires a logical index set from the name dictionary 16. . In the example of FIG. 5, the row of the CIF code “9130,000” of the name dictionary 16 described in FIG. 3 is selected, and the logical index set “# 501, # 105, # 402, # 301, # 101, # 220” is selected. (Reference number 406 in 2 of FIG. 5).

続いて、処理エンジン210は、登録単語判定処理を行う。詳細には、図9のステップ354において、処理エンジン210は、解析NGとなった取得不能の単語「&」を含んだ論理インデックスセット「#501,#105,#402,&,#101,#220」(図5の3の408)と、図5の2で取得した名称辞書16の論理インデックスセット「#501,#105,#402,#301,#101,#220」(図5の3の410)との比較を行い、双方の間で同一なものは除いた論理インデックス、つまり差分の論理インデックスをそれぞれ特定する。図5の3で示すとおり、論理インデックス「#501」、「#105」、「#402」、「#101」,「#220」は、解析NGとなったデータの論理インデックスと、名称辞書の論理インデックス双方に存在する同一の論理インデックスなので除外する。除外からもれた解析NGとなった単語「&」(図5の3の412参照)と名称辞書16の論理インデックス「#301」(図5の3の414参照)を取得する。なお、除外からもれた解析NGとなった単語、即ち差分の単語は、1個であることが好ましい。   Subsequently, the processing engine 210 performs a registered word determination process. Specifically, in step 354 of FIG. 9, the processing engine 210 determines that the logical index set “# 501, # 105, # 402, &, # 101, ## including the unacquirable word“ & ”that has been analyzed NG. 220 ”(408 in 3 of FIG. 5) and the logical index set“ # 501, # 105, # 402, # 301, # 101, # 220 ”of the name dictionary 16 acquired in 2 of FIG. 5 (3 in FIG. 5). 410), and the logical indexes excluding those that are the same between the two, that is, the logical indexes of the differences are specified. As indicated by 3 in FIG. 5, the logical indexes “# 501”, “# 105”, “# 402”, “# 101”, and “# 220” are the logical index of the data that has been analyzed NG and the name dictionary. Since it is the same logical index which exists in both logical indexes, it excludes. The word “&” (see 412 in 3 of FIG. 5) and the logical index “# 301” (see 414 of 3 in FIG. 5) of the name dictionary 16 are acquired as an analysis NG that is excluded from the exclusion. It should be noted that it is preferable that the number of the analysis NG that is excluded from the exclusion, that is, the difference word is one.

続いて、図9のステップ356において、処理エンジン210は、辞書登録処理を行う(図5の4も参照)。図5の例では、登録単語判定処理にて取得した、解析NGの単語「&」を、基本語辞書14に同義語として登録を行う。詳細には、図4の4及び図6における参照番号416に示すように、特定した差分の単語「&」を、基本語辞書14に登録済みの「AND」の欄に登録する。登録済みの「AND」に「&」が追加の形で登録された欄は、基本語辞書14をメモリ展開したとき、図6の参照番号418に示されるようになる。   Subsequently, in step 356 of FIG. 9, the processing engine 210 performs a dictionary registration process (see also 4 in FIG. 5). In the example of FIG. 5, the word “&” of analysis NG acquired in the registered word determination process is registered as a synonym in the basic word dictionary 14. Specifically, as indicated by 4 in FIG. 4 and reference numeral 416 in FIG. 6, the identified difference word “&” is registered in the “AND” field registered in the basic word dictionary 14. A column in which “&” is added to the registered “AND” is as indicated by reference numeral 418 in FIG. 6 when the basic word dictionary 14 is expanded in memory.

次に、図6の登録後の基本語辞書14に対して(なお、名称辞書16は変更なく、図3に示すのと同じである。)、前述の図4の解析NGのデータ「THE NAKAMORI TRUST & BANK CORP」が入力された場合について、図7及び図8を用いて説明する。   Next, with respect to the basic word dictionary 14 after registration in FIG. 6 (the name dictionary 16 is the same as shown in FIG. 3 without change), the data “THE NAKAMORI of the analysis NG in FIG. 4 described above is used. A case where “TRUST & BANK CORP” is input will be described with reference to FIGS. 7 and 8.

図7は、図6の登録後の基本語辞書14及び図3と同じ名称辞書16をメイン・メモリ212又は図10に示す12上にメモリ展開された状態を示す。
処理エンジン210(又は10)は、図8の1〜4に示されるように、図7に示すメモリ展開された基本語辞書14aを用いて、入力データを論理インデックスに変換する。このとき、前述の辞書登録により、図6及び図7に示すように基本語辞書14に、「AND」と「&」が論理インデックス「#301」を取得できるように登録されているため、入力データの単語は全て論理インデックスに変換され、変換後の論理インデックスセットは、「#501,#105,#402,#301,#101,#220」(図8の4の420参照)となる。この論理インデックスセットを使って、図7の名称辞書16aを検索すると、名称辞書16aに登録されている論理インデックスセット「#501,#105,#402,#301,#101,#220」とが検索できるため、CIF「9130000」が特定できるようになる。
7 shows a state in which the basic word dictionary 14 after registration in FIG. 6 and the same name dictionary 16 as in FIG. 3 are expanded in the main memory 212 or 12 shown in FIG.
The processing engine 210 (or 10) converts the input data into a logical index using the memory expanded basic word dictionary 14a shown in FIG. 7, as shown in 1-4 of FIG. At this time, as shown in FIG. 6 and FIG. 7, “AND” and “&” are registered in the basic word dictionary 14 so that the logical index “# 301” can be acquired. All data words are converted into logical indexes, and the converted logical index set is “# 501, # 105, # 402, # 301, # 101, # 220” (see 420 in 4 of FIG. 8). When the name dictionary 16a of FIG. 7 is searched using this logical index set, logical index sets “# 501, # 105, # 402, # 301, # 101, # 220” registered in the name dictionary 16a are obtained. Since the search is possible, the CIF “9130,000” can be specified.

結果として、入力データと名称辞書16の単語を登録する際に、差分が1:1として特定できた状態を同義語として登録することにより、マッチング対象が広がり、同義と認識できる個所に対してCIF特定の要素を増やすことができる。   As a result, when registering the input data and the word in the name dictionary 16 as a synonym, a state where the difference can be specified as 1: 1 is registered as a synonym. Specific factors can be increased.

なお、本発明は、処理エンジン10に処理エンジン210の機能を組み込み、且つ解析NG論理インデックスセット・ファイル220を持たないで、処理エンジン10が、図9の処理フローのステップ300から356を連続的に実行するようにしてもよい。その場合は、処理エンジン10は、ステップ324における検索結果で解析NGとなったとき、ステップ332における解析NGを表示装置に表示し、且つ同時にステップ342における不完全論理インデックスセットを表示装置に表示する。処理エンジン10のその後の処理は、図9を参照して上記で説明したのと同じである。   The present invention incorporates the functions of the processing engine 210 into the processing engine 10 and does not have the analysis NG logical index set file 220, and the processing engine 10 continuously performs steps 300 to 356 in the processing flow of FIG. You may make it perform to. In that case, the processing engine 10 displays the analysis NG in step 332 on the display device when the search result in step 324 becomes analysis NG, and simultaneously displays the incomplete logical index set in step 342 on the display device. . Subsequent processing of the processing engine 10 is the same as described above with reference to FIG.

図1は、銀行等で受信する決済指図電文等について計算機を使用して取引先顧客情報(CIF)解析処理を行うために用いられる字句をデータに変換する装置に利用され、表記は異なるものの解析処理上同一の意味内容を有する単語を基本語辞書に登録する本発明の装置の好適な一実施形態を示す。FIG. 1 is used for a device that converts a customer's customer information (CIF) analysis process using a computer to a payment instruction message received at a bank, etc. 1 shows a preferred embodiment of an apparatus of the present invention for registering words having the same semantic content in processing in a basic word dictionary. 図2は、基本語辞書14に事前に登録されている基本語をメイン・メモリ12上にメモリ展開した状態を示す。FIG. 2 shows a state in which basic words registered in advance in the basic word dictionary 14 are expanded in the main memory 12. 図3は、名称辞書16に事前に登録されている論理インデックスセットをメイン・メモリ12上にメモリ展開した状態を示す。FIG. 3 shows a state where a logical index set registered in advance in the name dictionary 16 is expanded in the main memory 12. 図4は、入力データを論理インデックスへ変換し、解析NGとなった例を示す。FIG. 4 shows an example in which input data is converted into a logical index and becomes analysis NG. 図5は、表記は異なるものの解析処理上同一の意味内容を有する単語を基本語辞書に登録する過程を示す。FIG. 5 shows a process of registering words having the same semantic contents in the analysis process in the basic word dictionary, although the notations are different. 図6は、表記は異なるものの解析処理上同一の意味内容を有する単語を基本語辞書に登録した後の基本語辞書14をメモリ展開した状態と共に示す。FIG. 6 shows the basic word dictionary 14 after the words having the same meaning and content in the analysis processing are registered in the basic word dictionary, although the notations are different, together with the state of memory expansion. 図7は、図6に示す登録後の基本語辞書14及び名称辞書16のメモリ展開した状態を示す。FIG. 7 shows the expanded state of the basic word dictionary 14 and the name dictionary 16 after registration shown in FIG. 図8は、表記は異なるものの解析処理上同一の意味内容を有する単語を基本語辞書に登録した後の基本語辞書14を用いて入力データの解析が可能となる例を示す。FIG. 8 shows an example in which the input data can be analyzed using the basic word dictionary 14 after the words having the same meaning and content in the analysis processing are registered in the basic word dictionary, although the notations are different. 図9は、表記は異なるものの解析処理上同一の意味内容を有する単語を基本語辞書に登録する処理フローを示す。FIG. 9 shows a processing flow for registering words having the same semantic content in the analysis processing, although the notations are different, in the basic word dictionary. 図10は、銀行等で受信する決済指図電文等について計算機を使用して取引先顧客情報(CIF)解析処理を行うために用いられる字句をデータに変換する装置の一例の基本構成を示す図である。FIG. 10 is a diagram showing a basic configuration of an example of an apparatus that converts a lexical phrase used for performing a customer customer information (CIF) analysis process using a computer to a payment instruction message received by a bank or the like into data. is there. 図11は、基本語辞書14に事前に登録されている基本語をメイン・メモリ12上にメモリ展開した状態を示す。FIG. 11 shows a state in which basic words registered in advance in the basic word dictionary 14 are expanded in the main memory 12. 図12は、名称辞書16に事前に登録されている論理インデックスセットをメイン・メモリ12上にメモリ展開した状態を示す。FIG. 12 shows a state in which a logical index set registered in advance in the name dictionary 16 is expanded on the main memory 12. 図13は、図10に示す変換装置に入力されたデータが変換される過程を説明するための図である。FIG. 13 is a diagram for explaining a process in which data input to the conversion device shown in FIG. 10 is converted. 図14は、解析処理上同一の意味内容を有する表記の異なる複数の単語に同一の論理インデックスを割り振る発明の理解を容易にするための概要を示す図である。FIG. 14 is a diagram showing an overview for facilitating understanding of the invention in which the same logical index is assigned to a plurality of differently expressed words having the same meaning and content in the analysis process.

符号の説明Explanation of symbols

10,210 処理エンジン
12,212 メイン・メモリ
14 基本語辞書
16 名称辞書
220 解析NG論理インデックスセット・ファイル
222 入力装置
224 表示装置
10, 210 Processing engine 12, 212 Main memory 14 Basic word dictionary 16 Name dictionary 220 Analysis NG logical index set file 222 Input device 224 Display device

Claims (9)

複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置であって、
記憶手段に予め記憶され、単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書と、
記憶手段に予め記憶され、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書と、
前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、複数の単語を含む変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得し、前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に、記憶手段に記憶された解析NG論理インデックスセット・ファイルに格納する第1の処理エンジンと、
データを含む情報を入力するための入力手段と、
データを含む情報を表示するための表示手段と、
前記入力手段から入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスを検索して前記表示手段に表示し、前記入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録する第2の処理エンジンと、
を備えたことを特徴とする装置。
An apparatus for converting a lexical word including a plurality of words into another data including one piece of information specified by the plurality of words,
At least a word field that stores words in advance and a logical index field that stores a logical index that represents the words stored in the word field, and each of the plurality of words represents each word. Are registered in advance in association with the logical index to be processed, and the word column has the same logical index attached to a plurality of words having the same meaning and different notation in the analysis processing for converting the word into the logical index. A basic word dictionary configured to be capable of storing the plurality of words,
A set of logical indexes corresponding to a set of words that are stored in advance in the storage means and registered in the basic word dictionary is associated with one piece of information specified by the set of words and registered in advance. Name dictionary,
Associating a plurality of words that are registered in the basic word dictionary and have the same semantic content and different notation in the analysis processing with the same logical index assigned to the plurality of words having different notations The memory is expanded on the memory, and the set of logical indexes registered in the name dictionary is associated with one piece of information specified by the set of words corresponding to each set of logical indexes, and the memory is expanded on the memory. , Decomposing a lexical phrase including a plurality of words into words, referring to a basic word dictionary expanded in memory on the memory, obtaining a logical index corresponding to the decomposed word, and extracting the logic expanded in the memory Any one of the logical indexes composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed word from the set of indexes. By selecting a set of logical indexes that matches the set of indexes and using one piece of information specified by the set of selected logical indexes, the lexical phrase including the plurality of words includes the one piece of information specified. When converting to another data and acquiring a logical index corresponding to the decomposed word, if there is a word for which a logical index cannot be acquired, the word is specified, and the specified word is determined among the decomposed words A first processing engine for storing in a parsing NG logical index set file stored in the storage means together with the logical index of the word for which the logical index could be obtained;
An input means for inputting information including data;
Display means for displaying information including data;
In response to a search command input from the input means, search the word that could not obtain at least the corresponding logical index from the analysis NG logical index set file and the logical index stored together with the word and display The name dictionary using, as a key, one piece of information estimated from a word that is displayed on the input means and is input from the input means and for which the logical index displayed on the display means cannot be obtained and the logical index stored together with the word To obtain a set of logical indexes corresponding to the one piece of estimated information, a word for which the logical index could not be obtained, a logical index stored with the word, and a logical index obtained from the name dictionary. Identify the difference words and logical index from the set of indexes A second processing engine of registering words in the difference as a synonym to the word column within said basic word dictionary corresponding to the logical indexes of the difference,
A device characterized by comprising:
複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置であって、
記憶手段に予め記憶され、単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書と、
記憶手段に予め記憶され、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書と、
データを含む情報を入力するための入力手段と、
データを含む情報を表示するための表示手段と、
前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、複数の単語を含む変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得し、前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に前記表示手段に表示し、前記入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録する処理エンジンと、
を備えたことを特徴とする装置。
An apparatus for converting a lexical word including a plurality of words into another data including one piece of information specified by the plurality of words,
At least a word field that stores words in advance and a logical index field that stores a logical index that represents the words stored in the word field, and each of the plurality of words represents each word. Are registered in advance in association with the logical index to be processed, and the word column has the same logical index attached to a plurality of words having the same meaning and different notation in the analysis processing for converting the word into the logical index. A basic word dictionary configured to be capable of storing the plurality of words,
A set of logical indexes corresponding to a set of words that are stored in advance in the storage means and registered in the basic word dictionary is associated with one piece of information specified by the set of words and registered in advance. Name dictionary,
An input means for inputting information including data;
Display means for displaying information including data;
Associating a plurality of words that are registered in the basic word dictionary and have the same semantic content and different notation in the analysis processing with the same logical index assigned to the plurality of words having different notations The memory is expanded on the memory, and the set of logical indexes registered in the name dictionary is associated with one piece of information specified by the set of words corresponding to each set of logical indexes, and the memory is expanded on the memory. , Decomposing a lexical phrase including a plurality of words into words, referring to a basic word dictionary expanded in memory on the memory, obtaining a logical index corresponding to the decomposed word, and extracting the logic expanded in the memory Any one of the logical indexes composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed word from the set of indexes. By selecting a set of logical indexes that matches the set of indexes and using one piece of information specified by the set of selected logical indexes, the lexical phrase including the plurality of words includes the one piece of information specified. When converting to another data and acquiring a logical index corresponding to the decomposed word, if there is a word for which a logical index cannot be acquired, the word is specified, and the specified word is determined among the decomposed words The logical index of the word that has been obtained with the logical index is displayed on the display unit together with the logical index of the word that has been obtained, and is input from the input unit. The name is used as a key with one piece of information estimated from the logical index of the word for which A dictionary is searched to obtain a set of logical indexes corresponding to the one piece of estimated information, and a logical index of a word for which a logical index can be obtained from the word that could not obtain the logical index and the decomposed word And the difference word and the logical index with the set of logical indexes acquired from the name dictionary, and the difference word as a synonym in the word field in the basic word dictionary corresponding to the difference logical index A processing engine to register,
A device characterized by comprising:
複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する方法であって、
単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書を記憶手段に記憶させるステップと、
前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書を記憶手段に記憶させるステップと、
前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開するステップと、
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、
複数の単語を含む変換されるべき字句を単語に分解するステップと、
前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得するステップと、
前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、
前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に、記憶手段に記憶された解析NG論理インデックスセット・ファイルに格納するステップと、
データを含む情報を入力するための入力手段から入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスを検索して、データを含む情報を表示するための表示手段に表示するステップと、
前記入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、
前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録するステップと、
を備えたことを特徴とする方法。
A method of converting a lexical word including a plurality of words into another data including one piece of information specified by the plurality of words,
At least a word field for storing words and a logical index field for storing a logical index representing the words stored in the word field, and each of the plurality of words is associated with a logical index representing each word in advance. The plurality of words are registered, and the word column has the same logical index attached to a plurality of words having the same semantic content and different notation in the analysis processing for converting the word into a logical index. Storing a basic word dictionary configured to be stored in a storage means;
A logical dictionary set corresponding to a set of words obtained by combining words registered in the basic word dictionary is stored as a name dictionary registered in advance in association with one piece of information specified by the set of words. Memorizing step;
Associating a plurality of words that are registered in the basic word dictionary and have the same semantic content and different notation in the analysis processing with the same logical index assigned to the plurality of words having different notations Expanding the memory on the memory; and
Expanding a set of logical indexes registered in the name dictionary in the memory in association with one piece of information specified by the set of words corresponding to each set of logical indexes;
Decomposing a lexical word to be converted containing multiple words into words;
Obtaining a logical index corresponding to the decomposed word by referring to a basic word dictionary expanded in memory on the memory;
A logical index set that matches any logical index set composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed words is selected from the memory-expanded logical index sets; Converting a lexical phrase including the plurality of words into another data including the specified one information by using one information specified by the selected set of logical indexes;
When acquiring a logical index corresponding to the decomposed word, if there is a word for which a logical index cannot be acquired, the word is specified, and the specified word is identified as a word of the word that has acquired the logical index among the decomposed words. Storing together with the logical index in an analysis NG logical index set file stored in the storage means;
In response to a search command input from input means for inputting information including data, at least the corresponding logical index could not be obtained from the analysis NG logical index set file and stored together with the word Retrieving a logical index and displaying it on a display means for displaying information including data;
The name dictionary is searched by using, as a key, a word input from the input unit and the information that is estimated from the logical index stored together with the word that could not be obtained from the logical index displayed on the display unit, Obtaining a set of logical indexes corresponding to the one piece of estimated information;
A difference word and a logical index between a word for which the logical index could not be obtained and a logical index stored together with the word and a set of logical indexes obtained from the name dictionary are specified, and the difference corresponds to the logical index Registering the difference word as a synonym in the word field in the basic word dictionary;
A method characterized by comprising :
複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する方法であって、
単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書を記憶手段に記憶させるステップと、
前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書を記憶手段に記憶させるステップと、
前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開するステップと、
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開するステップと、
複数の単語を含む変換されるべき字句を単語に分解するステップと、
前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得するステップと、
前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと、
前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に、データを含む情報を表示するための表示手段に表示するステップと、
データを含む情報を入力するための入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得するステップと、
前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録するステップと、
を備えたことを特徴とする方法。
A method of converting a lexical word including a plurality of words into another data including one piece of information specified by the plurality of words,
At least a word field for storing words and a logical index field for storing a logical index representing the words stored in the word field, and each of the plurality of words is associated with a logical index representing each word in advance. The plurality of words are registered, and the word column has the same logical index attached to a plurality of words having the same semantic content and different notation in the analysis processing for converting the word into a logical index. Storing a basic word dictionary configured to be stored in a storage means;
A logical dictionary set corresponding to a set of words obtained by combining words registered in the basic word dictionary is stored as a name dictionary registered in advance in association with one piece of information specified by the set of words. Memorizing step;
Associating a plurality of words that are registered in the basic word dictionary and have the same semantic content and different notation in the analysis processing with the same logical index assigned to the plurality of words having different notations Expanding the memory on the memory; and
Expanding a set of logical indexes registered in the name dictionary in the memory in association with one piece of information specified by the set of words corresponding to each set of logical indexes;
Decomposing a lexical word to be converted containing multiple words into words;
Obtaining a logical index corresponding to the decomposed word by referring to a basic word dictionary expanded in memory on the memory;
A logical index set that matches any logical index set composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed words is selected from the memory-expanded logical index sets; Converting a lexical phrase including the plurality of words into another data including the specified one information by using one information specified by the selected set of logical indexes;
When acquiring a logical index corresponding to the decomposed word, if there is a word for which a logical index cannot be acquired, the word is specified, and the specified word is identified as a word of the word that has acquired the logical index among the decomposed words. Displaying together with the logical index on a display means for displaying information including data;
Inferred from the logical index of the word that was able to acquire the logical index among the words that could not be acquired the logical index displayed on the display means and the decomposed words that were input from the input means for inputting information including data Searching the name dictionary using one piece of information as a key to obtain a set of logical indexes corresponding to the one piece of estimated information;
Identifying a word and a logical index of a difference between a logical index of a word from which the logical index could not be obtained and a logical index of a word from which the logical index could be obtained, and a set of logical indexes obtained from the name dictionary; Registering the difference word as a synonym in the word field in the basic word dictionary corresponding to the difference logical index;
A method characterized by comprising :
単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書を記憶する記憶手段と、
データを含む情報を入力するための入力手段と、
データを含む情報を表示するための表示手段と、
を備えたコンピュータを、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置として機能させるためのプログラムであって、
前記コンピュータを、
前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、複数の単語を含む変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得し、前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に、記憶手段に記憶された解析NG論理インデックスセット・ファイルに格納する第1の処理エンジン、
及び、前記入力手段から入力された検索指令に応答して、前記解析NG論理インデックスセット・ファイルから少なくとも該当する前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスを検索して前記表示手段に表示し、前記入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、前記論理インデックスを取得できなかった単語及び当該単語と共に格納された論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録する第2の処理エンジン
として機能させることを特徴とするプログラム。
At least a word field for storing words and a logical index field for storing a logical index representing the words stored in the word field, and each of the plurality of words is associated with a logical index representing each word in advance. The plurality of words are registered, and the word column has the same logical index attached to a plurality of words having the same semantic content and different notation in the analysis processing for converting the word into a logical index. A set of logical indexes corresponding to a set of words that is a combination of words registered in the basic word dictionary, and one piece of information specified by the set of words, Storage means for storing a name dictionary registered in advance in association;
An input means for inputting information including data;
Display means for displaying information including data;
A program for causing a computer including a plurality of words to function as a device that converts a lexical phrase including a plurality of words into another data including one piece of information specified by the plurality of words,
The computer,
Associating a plurality of words that are registered in the basic word dictionary and have the same semantic content and different notation in the analysis processing with the same logical index assigned to the plurality of words having different notations The memory is expanded on the memory, and the set of logical indexes registered in the name dictionary is associated with one piece of information specified by the set of words corresponding to each set of logical indexes, and the memory is expanded on the memory. , Decomposing a lexical phrase including a plurality of words into words, referring to a basic word dictionary expanded in memory on the memory, obtaining a logical index corresponding to the decomposed word, and extracting the logic expanded in the memory Any one of the logical indexes composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed word from the set of indexes. By selecting a set of logical indexes that matches the set of indexes and using one piece of information specified by the set of selected logical indexes, the lexical phrase including the plurality of words includes the one piece of information specified. When converting to another data and acquiring a logical index corresponding to the decomposed word, if there is a word for which a logical index cannot be acquired, the word is specified, and the specified word is determined among the decomposed words A first processing engine that stores a logical index of a word for which a logical index has been acquired in an analysis NG logical index set file stored in the storage means;
And, in response to the search command input from the input means, at least the corresponding logical index from the analysis NG logical index set file and the logical index stored together with the word are searched. The information displayed on the display means and input from the input means, the logical index displayed on the display means for which the logical index was not obtained, and one information estimated from the logical index stored together with the word as a key. The name dictionary is searched to obtain a set of logical indexes corresponding to the one piece of estimated information, and the logical index stored together with the words for which the logical index cannot be obtained and the words are obtained from the name dictionary. The difference word and logical index from the set of logical index Constant, and a second processing engine of registering words in the difference in the word column within said basic word dictionary corresponding to the logical indexes of the difference as a synonym
A program characterized by functioning as
単語を格納する単語欄及び該単語欄に格納された単語を表象する論理インデックスを格納する論理インデックス欄を少なくとも有し、複数の単語のそれぞれが、それぞれの単語を表象する論理インデックスと関連付けて予め登録されていると共に、前記単語欄が、単語を論理インデックスに変換するための解析処理上での意味内容が同一で表記の異なる複数の単語に同一の論理インデックスが付されるよう前記複数の単語を格納可能に構成された基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組が、前記単語の組により特定される1つの情報と関連付けて予め登録された名称辞書を記憶する記憶手段と、
データを含む情報を入力するための入力手段と、
データを含む情報を表示するための表示手段と、
を備えたコンピュータを、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置として機能させるためのプログラムであって、
前記コンピュータを、
前記基本語辞書に登録されている、前記解析処理上での意味内容が同一で表記の異なる複数の単語を、当該表記の異なる複数の単語に対して割り当てられている同一の論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記単語の組により特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、複数の単語を含む変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開した基本語辞書を参照して、前記分解した単語に対応する論理インデックスを取得し、前記メモリ展開した論理インデックスの組の中から、前記分解した単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択した論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換すると共に、前記分解した単語に対応する論理インデックスを取得する際に、論理インデックスを取得できない単語がある場合その単語を特定し、当該特定した単語を、前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと共に前記表示手段に表示し、前記入力手段から入力される、前記表示手段に表示した前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスから推定される1つの情報をキーとして前記名称辞書を検索して、当該推定される1つの情報に対応する論理インデックスの組を取得し、前記論理インデックスを取得できなかった単語及び前記分解した単語のうち論理インデックスを取得できた単語の論理インデックスと、前記名称辞書から取得した論理インデックスの組との差分の単語及び論理インデックスを特定し、前記差分の論理インデックスに対応する前記基本語辞書内の前記単語欄に前記差分の単語を同義語として登録する処理エンジン
として機能させることを特徴とするプログラム。
At least a word field for storing words and a logical index field for storing a logical index representing the words stored in the word field, and each of the plurality of words is associated with a logical index representing each word in advance. The plurality of words are registered, and the word column has the same logical index attached to a plurality of words having the same semantic content and different notation in the analysis processing for converting the word into a logical index. A set of logical indexes corresponding to a set of words that is a combination of words registered in the basic word dictionary, and one piece of information specified by the set of words, Storage means for storing a name dictionary registered in advance in association;
An input means for inputting information including data;
Display means for displaying information including data;
A program for causing a computer including a plurality of words to function as a device that converts a lexical phrase including a plurality of words into another data including one piece of information specified by the plurality of words,
The computer,
Associating a plurality of words that are registered in the basic word dictionary and have the same semantic content and different notation in the analysis processing with the same logical index assigned to the plurality of words having different notations The memory is expanded on the memory, and the set of logical indexes registered in the name dictionary is associated with one piece of information specified by the set of words corresponding to each set of logical indexes, and the memory is expanded on the memory. , Decomposing a lexical phrase including a plurality of words into words, referring to a basic word dictionary expanded in memory on the memory, obtaining a logical index corresponding to the decomposed word, and extracting the logic expanded in the memory Any one of the logical indexes composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed word from the set of indexes. By selecting a set of logical indexes that matches the set of indexes and using one piece of information specified by the set of selected logical indexes, the lexical phrase including the plurality of words includes the one piece of information specified. When converting to another data and acquiring a logical index corresponding to the decomposed word, if there is a word for which a logical index cannot be acquired, the word is specified, and the specified word is determined among the decomposed words The logical index of the word that has been obtained with the logical index is displayed on the display unit together with the logical index of the word that has been obtained, and is input from the input unit. The name is used as a key with one piece of information estimated from the logical index of the word for which A dictionary is searched to obtain a set of logical indexes corresponding to the one piece of estimated information, and a logical index of a word for which a logical index can be obtained from the word that could not obtain the logical index and the decomposed word And the difference word and the logical index with the set of logical indexes acquired from the name dictionary, and the difference word as a synonym in the word field in the basic word dictionary corresponding to the difference logical index Processing engine to register
A program characterized by functioning as
前記差分の単語が1個であることを特徴とする請求項1又は2記載の装置。 The apparatus according to claim 1, wherein the difference word is one. 前記差分の単語が1個であることを特徴とする請求項3又は4記載の方法。 5. The method according to claim 3, wherein the difference word is one. 前記差分の単語が1個であることを特徴とする請求項5又は6記載のプログラム。 7. The program according to claim 5, wherein the difference word is one.
JP2004287919A 2004-09-30 2004-09-30 Apparatus, method and program for converting lexical data to data Active JP4139805B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004287919A JP4139805B2 (en) 2004-09-30 2004-09-30 Apparatus, method and program for converting lexical data to data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004287919A JP4139805B2 (en) 2004-09-30 2004-09-30 Apparatus, method and program for converting lexical data to data

Publications (2)

Publication Number Publication Date
JP2006099672A JP2006099672A (en) 2006-04-13
JP4139805B2 true JP4139805B2 (en) 2008-08-27

Family

ID=36239380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004287919A Active JP4139805B2 (en) 2004-09-30 2004-09-30 Apparatus, method and program for converting lexical data to data

Country Status (1)

Country Link
JP (1) JP4139805B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5413153B2 (en) * 2009-11-26 2014-02-12 富士通株式会社 Data compression apparatus, data expansion apparatus, data compression program, and data expansion program

Also Published As

Publication number Publication date
JP2006099672A (en) 2006-04-13

Similar Documents

Publication Publication Date Title
US8190613B2 (en) System, method and program for creating index for database
US8069033B2 (en) Document based character ambiguity resolution
US20070179932A1 (en) Method for finding data, research engine and microprocessor therefor
US20070050709A1 (en) Character input aiding method and information processing apparatus
US20050251519A1 (en) Efficient language-dependent sorting of embedded numerics
JPH08314910A (en) Different kind of code character string transcribing device and electronic dictionary
JP2007128123A (en) Influential range extraction system
JP2018067264A (en) Data search program, data search device, and data search method
JP4139805B2 (en) Apparatus, method and program for converting lexical data to data
JP6589704B2 (en) Sentence boundary estimation apparatus, method and program
US7130470B1 (en) System and method of context-based sorting of character strings for use in data base applications
JP4734400B2 (en) Document search apparatus and program
JP4061283B2 (en) Apparatus, method and program for converting lexical data to data
JP4051369B2 (en) Apparatus, method and program for converting lexical data to data
JP2009104475A (en) Similar document retrieval device, and similar document retrieval method and program
JP2005275880A (en) Device, method and program for converting word and phrase into data
JP2004334690A (en) Character data inputting/outputting device and method, character data inputting/outputting program, and computer-readable recording medium
JP4111941B2 (en) Apparatus, method and program for converting lexical data to data
JP3187671B2 (en) Electronic dictionary display
JP4294386B2 (en) Different notation normalization processing apparatus, different notation normalization processing program, and storage medium
JPH08115330A (en) Method for retrieving similar document and device therefor
JP4303027B2 (en) Apparatus and method for converting lexical data to data
JP3241854B2 (en) Automatic word spelling correction device
JP2004199282A (en) Document retrieval device and documents registeration device
JP3972309B2 (en) Information conversion apparatus and program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071213

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071218

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080527

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080609

R150 Certificate of patent or registration of utility model

Ref document number: 4139805

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140613

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250