JP4111941B2 - Apparatus, method and program for converting lexical data to data - Google Patents
Apparatus, method and program for converting lexical data to data Download PDFInfo
- Publication number
- JP4111941B2 JP4111941B2 JP2004274422A JP2004274422A JP4111941B2 JP 4111941 B2 JP4111941 B2 JP 4111941B2 JP 2004274422 A JP2004274422 A JP 2004274422A JP 2004274422 A JP2004274422 A JP 2004274422A JP 4111941 B2 JP4111941 B2 JP 4111941B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- logical
- words
- information
- indexes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置、方法及びプログラムに関する。 The present invention relates to an apparatus, a method, and a program for converting a lexical phrase including a plurality of words into another data including one piece of information specified by the plurality of words.
例えば、銀行等では受信する決済指図電文等について、計算機を使用して取引先顧客情報(CIF)解析処理が必要になることがある(なお、CIFは顧客情報ファイル(Customer Information File)を意味する。)。詳細には、例えば電文中の字句「GETRONICS FOODS CO.,LTD 1−2−34 AKASAKA」の中の複数の単語「GETRONICS」、「FOODS」、「CO.,LTD」及び「AKASAKA」の組み合わせを顧客コード(即ち、CIFコード)「1234567」に変換することが必要になる。 For example, a bank or the like may require a customer information (CIF) analysis process using a computer for a settlement instruction message received (CIF means a customer information file). .) Specifically, for example, a combination of a plurality of words “GETRONICS”, “FOODS”, “CO., LTD”, and “AKASAKA” in the word “GETRONICS FOODS CO., LTD 1-2-34 AKASAKA” It is necessary to convert the customer code (that is, the CIF code) to “1234567”.
従来は、この変換処理を次のように行っていた。即ち、顧客コードを特定する複数の単語の組み合わせとそれに対応する顧客コードとの顧客コード・テーブルを予め記憶装置に格納しておく。次いで、入力データから変換すべき複数の単語を抽出して、その抽出された複数の単語と顧客コード・テーブルの中の複数の単語とを文字列比較を行い、一致した場合顧客コードに変換していた(そのような例として、特許文献1参照。)。 Conventionally, this conversion processing is performed as follows. That is, a customer code table of a combination of a plurality of words specifying a customer code and a corresponding customer code is stored in the storage device in advance. Next, a plurality of words to be converted are extracted from the input data, and the extracted plurality of words and a plurality of words in the customer code table are subjected to character string comparison. (See Patent Document 1 for such an example.)
しかしながら、このような文字列比較は、1文字毎(1バイト単位)で行うため、とりわけ大量のデータが対象になるときには、当該処理に要する検索時間(seek time)の関係上、高速に処理を行うことができないという問題があった。 However, since such character string comparison is performed for each character (in 1-byte units), especially when a large amount of data is targeted, the processing is performed at high speed due to the search time required for the processing. There was a problem that could not be done.
このような問題を克服しようとする方式として、電文中の字句をCIFコードに変換するために用いる辞書類をメイン・メモリに上にメモリ・アドレスをシンボルとしてシンボル化することがこの特許出願より前の特許出願において提案された(特許文献2参照)。詳細には、複数の単語のそれぞれとその属性情報を関連付けて二次記憶装置に予め登録してある基本語辞書と、基本語辞書に登録されている2つの単語を組み合わせた組と、キーとして選択された当該組の中の単語と当該組により特定される記号とを関連付けて二次記憶装置に予め登録してある核名称辞書と、当該記号と当該組に含まれない別の単語と当該記号及び別の単語により特定されるCIFコードとを関連付けて二次記憶装置に予め登録してあるフル名称辞書とをメイン・メモリ上にメモリ・アドレスをシンボルとしてシンボル化する。シンボル化された基本語辞書を参照して、被変換字句に含まれる単語に対応するアドレスを取得する。そのうちの2つのアドレス(一方をキーとする)が一致する組をシンボル化された核名称辞書から見つけ、次いで、もう1つのアドレスと一致する組をシンボル化されたフル名称辞書から見つけて、被変換字句を目的のCIFコードに変換する。 As a method for overcoming such a problem, prior to this patent application, a dictionary used for converting a lexical in a message to a CIF code is symbolized as a main memory on a memory address as a symbol. (See Patent Document 2). Specifically, a basic word dictionary associated with each of a plurality of words and their attribute information and registered in the secondary storage device in advance, a combination of two words registered in the basic word dictionary, and a key The nuclear name dictionary that is pre-registered in the secondary storage device in association with the selected word in the set and the symbol specified by the set, the symbol and another word not included in the set, and the The full name dictionary registered in advance in the secondary storage device in association with the symbol and the CIF code specified by another word is symbolized on the main memory using the memory address as a symbol. By referring to the symbolized basic word dictionary, an address corresponding to the word included in the converted lexical phrase is acquired. A pair that matches two addresses (one of which is a key) is found from the symbolized nuclear name dictionary, and then a pair that matches the other address is found from the symbolized full name dictionary, The conversion token is converted into a target CIF code.
前述のように、この方式は、各辞書を関連付けるキー(シンボル)を物理的メモリ・アドレスに直接割り当てる仕様としている。そのような仕様とした場合、コンピュータの特性として、メモリ・アドレスは動的に割り付けられてしまうために、プログラムをメモリ・ロードする度に、辞書相互間のキー関係を、取得したメモリ・アドレスに置き換え、生成する必要があり、この点でプログラム初期処理上、高負荷及び所要時間がかかる。 As described above, this method is a specification in which a key (symbol) that associates each dictionary is directly assigned to a physical memory address. When such a specification is used, the memory address is dynamically allocated as a characteristic of the computer. Therefore, each time the program is loaded into the memory, the key relationship between the dictionaries is changed to the acquired memory address. It is necessary to replace and generate, and in this respect, high load and required time are required in the program initial processing.
このような問題を克服しようとする方式として、それぞれの単語を表象する論理インデックスを予め割り振って、単語と対応の論理インデックスとを関連付けて辞書に格納し、これをメモリ上にメモリ展開することがこの特許出願より前の特許出願において提案された(特許文献3及び4参照)。 As a method for overcoming such a problem, a logical index representing each word is allocated in advance, and the word and the corresponding logical index are stored in a dictionary in association with each other, and this is expanded in a memory. It was proposed in patent applications prior to this patent application (see Patent Documents 3 and 4).
また、辞書上の単語にインデックスを付し、それをディスクの格納位置と対応付けて、アクセス時間を短縮化する方法は知られている(例えば、特許文献5参照)。
特許文献3及び4においては、1つの単語の組み合わせにより一義的にCIFコードが定まる必要があるので、登録される単語の組み合わせには重複が無く、また或る単語の組み合わせを他の単語の組み合わせが含む関係を持たないように登録されている。即ち、特許文献3及び4においては、CIFコードに対応する単語の組み合わせには、後述する包摂関係が生じていないことを前提としていた。しかし、実際には、図9の参照番号1000に示すように、CIFコード等に対応付けられて登録された論理インデックスセット間に包摂関係が生じる場合がある。この参照番号1000で示す例では、CIFコード「6950000」に対応する名称は「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」で、論理インデックスセットは(105,106,107,300)であり、一方CIFコード「6760000」に対応する名称は「NAKAMORI CO.,LTD MARUNOUCHI」で、論理インデックスセットは(105,107,300)である。従って、両者は、名称における単語の組み合わせにおいては、「NAKAMORI」「CO.,LTD」「MARUNOUCHI」が、また論理インデックスセットにおいては、105,107,300が、重複しているために包摂関係が発生している。包摂関係とは、このように、顧客名称等の辞書登録されている複数の論理インデックスセット間において発生し、一方が他方の論理インデックスセットを包含した登録が行われている状態のことである。
In Patent Documents 3 and 4, since it is necessary to uniquely define a CIF code by a combination of one word, there is no duplication in registered word combinations, and a certain word combination is combined with another word Is registered so that it does not have the relationship that includes. That is, Patent Documents 3 and 4 are based on the premise that the inclusion relationship described later does not occur in the combination of words corresponding to the CIF code. However, in practice, as indicated by
上記のように、顧客名称等の重要部分を論理インデックスセットで表したとき、相異なる複数のCIFコード等の間では、一方が他方を含む包摂関係を生じることがあり得る。図9の参照番号1000で示す例では、CIFコード「6950000」は論理インデックスセットとしては(105,106,107,300)と表現され、論理インデックスセット(105,107,300)のCIFコード「6760000」を包含する。この場合、入力文字列からより少ない論理インデックスセット(上記例では、CIFコードとして「6760000」)が完全に解析できたとしても、果たしてそれが正常な解析結果なのか、あるいは、より大きい論理インデックスセットの組み合わせなのか、辞書登録上、包摂関係が成立するために確定することができない。図9を参照してより詳細に説明すると、より一般的に論理インデックスが確定していない「AND」を含む「NAKAMORI AND CO.,LTD MARUNOUCHI」が入力されたとする。入力は単語に分割され、辞書1002を用いて論理インデックスに変換される(参照番号1004の「辞書適用」の欄参照)。そのとき、「AND」は辞書に登録されていないので、変換されない。従って、CIF解析に用いられる論理インデックスセットは(105,107,300)となる(参照番号1004の「CIF解析」の欄参照)。この論理インデックスセットに対して、参照番号1000で示すCIFコードと論理インデックスセットとの対応表を参照して、解析すると、参照番号1004の「解析結果」の欄に示すように、「6950000」又は「6760000」となり確定できない。従って、特許文献3及び4の技術では、かかる状態に立ち至った場合、目的とするCIFコードが不特定の故にエラー扱いを余儀なくされる。なお、エラー・リターンをしないようにした場合、却って不正確な処理を許容することにもなる。
As described above, when an important part such as a customer name is represented by a logical index set, an inclusion relationship in which one includes the other may occur between different CIF codes. In the example indicated by
本発明の課題は、字句をデータに変換する際に、包摂関係が生じている場合にも正しく変換できるようにし、解析処理精度の向上を図ることにある。 An object of the present invention is to improve the accuracy of analysis processing by converting a lexical phrase into data so that it can be correctly converted even when an inclusion relationship has occurred.
上記課題は、本発明の一局面に従った、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置であって、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を前記単語の組により特定される1つの情報と関連付け、且つ前記論理インデックスの組同士が包摂関係にある場合、包摂される論理インデックスの組について、当該包摂される論理インデックスの組に対応する単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語に対応する論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンとを備え、前記処理エンジンは、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組、及び不要語の論理インデックスを各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、不要語の論理インデックスを含めた前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する装置により解決される。 According to one aspect of the present invention, there is provided an apparatus for converting a lexical phrase including a plurality of words into another data including one piece of information specified by the plurality of words, wherein each of the plurality of words is converted. A basic word dictionary previously registered in the storage means in association with a logical index representing each word, and a set of logical indexes corresponding to a set of words obtained by combining words registered in the basic word dictionary associating one of information specified by a set of said word, and when said set between the logical index is subsumption relation, set for the logical index subsumed, the word corresponding to the set of logical root indexes are the subsumption A word that is unnecessary in that it is not used when directly specifying the one piece of information because it is not included in the set, but assists in finally specifying the one piece of information A logical index corresponding to a certain unnecessary word is associated with the one information in advance and registered in a storage means in advance, and a lexical word including the plurality of words is converted into another data including the specified information. A processing engine, and the processing engine associates a word registered in the basic word dictionary with a logical index representing each word, expands the memory in a memory, and registers the word in the name dictionary A logical index set and a logical index of an unnecessary word are associated with the specified one information corresponding to each logical index set and expanded in the memory, and a lexical word to be converted is decomposed into words, Referring to the basic word dictionary expanded in memory on the memory, the logical index corresponding to the decomposed word is obtained, converted, and the unnecessary word A logical index set that matches the logical index set corresponding to the decomposed word is selected from the memory expanded logical index sets including the logical index, and the selected logical index set is selected. By using one piece of information specified by a set, the problem is solved by a device that converts a lexical phrase including the plurality of words into another data including the specified one piece of information.
本発明の装置の一態様によれば、データを含む情報を入力するための入力手段、及びデータを含む情報を表示する表示手段を更に備え、前記処理エンジンは更に、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合その単語を特定して前記表示手段に表示し、前記入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記名称辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込むことが好ましい。 According to one aspect of the apparatus of the present invention, the apparatus further comprises input means for inputting information including data, and display means for displaying information including data, and the processing engine is further expanded in the memory. When referring to the basic word dictionary and obtaining and converting the logical index corresponding to the decomposed word, if there is a word for which the logical index cannot be obtained, the word is identified and displayed on the display means, In response to the information input by the input means indicating that the word displayed on the display means is an unnecessary word, the word is written in the basic word dictionary in association with the corresponding logical index; and The name dictionary is associated with one piece of information specified from a set of words excluding a word that is regarded as an unnecessary word among words included in a lexical word to be converted. It is preferable to write the logical index of the word, which is the word.
本発明の装置の別の態様によれば、前記処理エンジンは更に、不要語の論理インデックスを含めた前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスの組と一致する論理インデックスの組を選択する前に、不要語の論理インデックスを含めない前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組で且つ前記いずれかの論理インデックスの組の論理インデックスのみから構成される論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換することが好ましい。 According to another aspect of the apparatus of the present invention, the processing engine further includes a logic corresponding to the decomposed word from the memory expanded logical index set including a logical index of unnecessary words. Before selecting the logical index set that matches the index set, the logical index corresponding to the decomposed word is selected from the memory expanded logical index set that does not include the logical index of unnecessary words. Selecting a logical index set that is a set of logical indexes that matches a set of logical indexes composed of a plurality of logical indexes, and that is composed only of the logical indexes of the set of logical indexes, By using one piece of information specified by the set of the selected logical indexes, It is preferable to convert the token containing the word to another data including one of information the identified.
上記課題はまた、本発明の別の局面に従った、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換する装置であって、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記論理インデックスの組同士が包摂関係にある場合、包摂される論理インデックスの組について、当該包摂される論理インデックスの組に対応する単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語の論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書と、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンとを備え、前記処理エンジンは、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開し、変換されるべき字句を単語に分解し、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を一時的に取得し、包摂関係がある場合に、前記のメモリ展開された不要語辞書の中で、前記の一時的に取得された1つの情報に対応する不要語の論理インデックスが、前記の分解された単語に対応する論理インデックスのうちで前記1つの情報を一時的に取得する際に用いなかった論理インデックスと一致する場合、前記の一時的に取得された1つの情報を特定されるべき1つの情報として確定し、当該1つの情報を用いることにより前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する装置により解決される。 According to another aspect of the present invention, there is provided an apparatus for converting a lexical phrase including a plurality of words into another data including one piece of information specified by the plurality of words. A basic word dictionary registered in advance in the storage means in association with a logical index representing each word, and a logical index corresponding to a set of words obtained by combining words registered in the basic word dictionary If a name dictionary registered in advance in the storage means a set in association with one information specified by a set of said word, set between the logical index is subsumption relation, set for the logical index subsumed, one is a required wherein in that is not used in identifying said one information directly because it is not contained in the set of words that correspond to the set of logical root indexes are the subsumption An unnecessary word dictionary in which a logical index of an unnecessary word, which is a word that assists in finally specifying information, is associated with the one information in advance and registered in a storage unit, and a phrase including the plurality of words is specified. A processing engine that converts the data registered in the basic word dictionary to a logical index representing each word in a memory. The memory is expanded, the set of logical indexes registered in the name dictionary is associated with the specified one information corresponding to each set of logical indexes, the memory is expanded on the memory, and is registered in the unnecessary word dictionary A logical index of an unnecessary word that is generated is associated with the one information and expanded in the memory, and a lexical word to be converted is decomposed into words, The logical index corresponding to the decomposed word is obtained by referring to the basic word dictionary expanded in memory on the memory and converted from the set of logical indexes expanded in memory. One of the logical indexes corresponding to the selected word is selected from a plurality of logical indexes among the logical indexes corresponding to the word, and one specified by the selected logical index set is selected. When the information is temporarily acquired and there is an inclusion relationship, the logical index of the unnecessary word corresponding to the one temporarily acquired information in the memory expanded unnecessary word dictionary is If the logical index corresponding to the decomposed word matches the logical index that was not used when temporarily acquiring the one information, The one piece of information acquired temporarily is determined as one piece of information to be specified, and the lexical word including the plurality of words is determined by using the one piece of information. Solved by a device that converts data.
本発明の装置の一態様によれば、データを含む情報を入力するための入力手段、及びデータを含む情報を表示する表示手段を更に備え、前記処理エンジンは更に、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合その単語を特定して前記表示手段に表示し、前記入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記不要語辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込むことが好ましい。 According to one aspect of the apparatus of the present invention, the apparatus further comprises input means for inputting information including data, and display means for displaying information including data, and the processing engine is further expanded in the memory. When referring to the basic word dictionary and obtaining and converting the logical index corresponding to the decomposed word, if there is a word for which the logical index cannot be obtained, the word is identified and displayed on the display means, In response to the information input by the input means indicating that the word displayed on the display means is an unnecessary word, the word is written in the basic word dictionary in association with the corresponding logical index; and The unnecessary word dictionary is associated with one piece of information specified from a set of words excluding a word that is an unnecessary word among words included in a lexical word to be converted. It is preferable to write the logical index of words that are the Yogo.
本発明の装置の別の態様によれば、前記処理エンジンは更に、前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を一時的に取得する前に、前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組で且つ前記いずれかの論理インデックスの組の論理インデックスのみから構成される論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換することが好ましい。 According to another aspect of the apparatus of the present invention, the processing engine further includes a plurality of logical indexes of the logical indexes corresponding to the decomposed words from the memory expanded logical index set. Before the temporary acquisition of one piece of information specified by the selected logical index set, the memory expansion is performed. A set of logical indexes that match a set of logical indexes composed of a plurality of logical indexes among the logical indexes corresponding to the decomposed words, and any of the set of logical indexes Select a logical index set consisting only of the logical indexes of the set of logical indexes, and By using one of the information specified by logical index set that is, it is preferable to convert the token comprising a plurality of words to another data including one of information the identified.
更に、上記課題は、本発明の一局面に従った、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を前記単語の組により特定される1つの情報と関連付け、且つ前記論理インデックスの組同士が包摂関係にある場合、包摂される論理インデックスの組について、当該包摂される論理インデックスの組に対応する単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語に対応する論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある名称辞書とを備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、メモリ展開された基本語辞書を生成するステップと、前記名称辞書に登録されている論理インデックスの組、及び不要語の論理インデックスを各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された名称辞書を生成するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、包摂関係がある場合に、不要語の論理インデックスを含めた前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップとを実行させる方法により解決される。 Further, according to one aspect of the present invention, there is provided a basic word dictionary in which each of a plurality of words is associated with a logical index representing each word and registered in storage means in advance, and the basic word dictionary If a set of logical indexes corresponding to a set of words that is a combination of words registered in is associated with one piece of information specified by the set of words, and the sets of logical indexes are in an inclusion relationship, The set of logical indexes that are not included in the set of words corresponding to the included set of logical indexes and are not used when directly specifying the one piece of information, but the one piece of information A name that is pre-registered in the storage means in association with the one information, a logical index corresponding to an unnecessary word that is a word that assists in finally identifying And a writing, a lexical including a plurality of words in a computer to be converted to another data including one of the information specified by the plurality of words, a word registered in the basic word dictionary, each word A step of generating memory on a memory in association with a logical index to be represented to generate a basic word dictionary expanded in the memory , a set of logical indexes registered in the name dictionary, and a logical index of unnecessary words for each logical index Expanding the memory on the memory in association with the specified one information corresponding to the set of information, generating a memory expanded name dictionary, decomposing the lexical word to be converted into words, and the memory A step of acquiring and converting a logical index corresponding to the decomposed word by referring to the basic word dictionary expanded in the memory above. And a logical index that matches the logical index set corresponding to the decomposed word from the set of memory expanded logical indexes including the logical index of unnecessary words when there is an inclusion relationship Converting a lexical phrase including the plurality of words into another data including the specified information by using a piece of information specified by the selected set of logical indexes. It is solved by the method of executing .
本発明の方法の一態様によれば、前記コンピュータに、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合その単語を特定して表示手段に表示するステップと、入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記名称辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込むステップとを更に実行させることが好ましい。 According to one aspect of the method of the present invention, the computer refers to the basic word dictionary expanded in the memory and acquires and converts the logical index corresponding to the decomposed word. and Luz step displays on the display means to identify the word if there is a word that can not be acquired logical index has been input by the input means, the information indicating that the displayed words is unnecessary word on the display means In response, the word is written in the basic word dictionary in association with the corresponding logical index, and the word included in the lexical word to be converted is excluded from the unnecessary words in the name dictionary. It is preferable to further execute a step of writing a logical index of the word determined as the unnecessary word in association with one piece of information specified from the set of words.
本発明の別の態様によれば、前記コンピュータに、不要語の論理インデックスを含めた前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスの組と一致する論理インデックスの組を選択する前記のステップを実行させる前に、不要語の論理インデックスを含めない前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組で且つ前記いずれかの論理インデックスの組の論理インデックスのみから構成される論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップを更に実行させることが好ましい。 According to another aspect of the present invention, the computer includes a set of logical indexes corresponding to the decomposed words out of the memory expanded logical index sets including the logical indexes of unnecessary words. Before performing the step of selecting a set of matching logical indexes, the logic corresponding to the decomposed word from the memory expanded logical index set that does not include the logical index of unwanted words. A logical index set that matches a logical index set that is composed of a plurality of logical indexes of the indexes and that is composed only of the logical indexes of the logical index set is selected. And using one piece of information specified by the set of selected logical indexes More further it is preferable to perform the step of converting the other data including one of information the identified lexical including the plurality of words.
上記課題は、本発明の別の局面に従った、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記論理インデックスの組同士が包摂関係にある場合包摂される論理インデックスの組について、当該包摂される単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語に対応する論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書とを備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、メモリ展開された基本語辞書を生成するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された名称辞書を生成するステップと、前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された不要語辞書を生成するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を一時的に取得するステップと、包摂関係がある場合に、前記のメモリ展開された不要語辞書の中で、前記の一時的に取得された1つの情報に対応する不要語の論理インデックスが、前記の分解された単語に対応する論理インデックスのうちで前記1つの情報を一時的に取得する際に用いなかった論理インデックスと一致する場合、前記の一時的に取得された1つの情報を特定されるべき1つの情報として確定し、当該1つの情報を用いることにより前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップとを実行させる方法により解決される。 According to another aspect of the present invention, there is provided a basic word dictionary in which each of a plurality of words is associated with a logical index representing each word and registered in advance in storage means, and the basic word dictionary A name dictionary pre-registered in storage means in association with one piece of information specified by the set of words, a set of logical indexes corresponding to a set of words obtained by combining registered words, When a set is inclusive, a set of included logical indexes is not included in the included set of words and is unnecessary in that it is not used when directly specifying the one information. Unnecessary words in which a logical index corresponding to an unnecessary word, which is a word that assists in finally identifying one piece of information, is registered in advance in the storage means in association with the one information. And a writing, a lexical including a plurality of words in a computer to be converted to another data including one of the information specified by the plurality of words, a word registered in the basic word dictionary, each word A step of generating memory on a memory in association with a logical index to be represented and generating a memory-expanded basic word dictionary, and a set of logical indexes registered in the name dictionary corresponding to each logical index set and memory development on the memory in association with one information specified, and generating a memory expanded name dictionary, the logical indexes of unnecessary words said registered in the unnecessary word dictionary and the one information association and memory development on the memory Te, decomposing and generating a memory expanded unnecessary word dictionary, lexical be converted into words A step of acquiring and converting a logical index corresponding to the decomposed word by referring to the basic word dictionary expanded in the memory on the memory, and in the set of logical indexes expanded in the memory From the logical index corresponding to the decomposed word, a logical index set that matches any logical index set composed of a plurality of logical indexes is selected, and the selected logical index set is selected. A step of temporarily acquiring one piece of information specified by, and corresponding to the one piece of temporarily acquired information in the memory expanded unnecessary word dictionary when there is an inclusion relationship A logical index of unnecessary words is used to temporarily acquire the one information among the logical indexes corresponding to the decomposed words. If there is a match with the logical index that did not exist, the one piece of temporarily acquired information is determined as one piece of information to be specified, and by using the one piece of information, the phrase including the plurality of words is specified. It is solved by a method and a step of converting the other data including one of the information.
本発明の一態様によれば、前記コンピュータに、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合、その単語を特定して表示手段に表示するステップと、入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記不要語辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込むステップとを更に実行させることが好ましい。 According to one aspect of the present invention, when the computer acquires a logical index corresponding to the decomposed word by referring to the basic word dictionary expanded in the memory, the logical index is converted into the computer. If a word can not be obtained, and displaying on the display means to identify the word, is input by the input means, in response to information indicating that the words displayed on said display means is unnecessary word A word obtained by writing the word in the basic word dictionary in association with a corresponding logical index and excluding a word that is an unnecessary word from words included in a lexical word to be converted in the unnecessary word dictionary It is preferable to further execute a step of writing a logical index of the word determined as the unnecessary word in association with one piece of information specified from the set of
本発明の方法の別の態様によれば、前記コンピュータに、前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を一時的に取得する前記のステップを実行させる前に、前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組で且つ前記いずれかの論理インデックスの組の論理インデックスのみから構成される論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップを更に実行させることが好ましい。 According to another aspect of the method of the present invention, the computer comprises a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the set of memory-expanded logical indexes. Before selecting the set of logical indexes that matches any set of logical indexes to be executed and temporarily performing the step of obtaining one piece of information specified by the selected set of logical indexes. A set of logical indexes that matches one of the sets of logical indexes of the logical indexes corresponding to the decomposed words from the set of logical indexes expanded in memory. And a logical index composed only of logical indexes of any one of the logical index pairs. Converting a lexical phrase including the plurality of words into another data including the specified information by using a piece of information specified by the selected set of logical indexes. It is preferable to further execute .
上記課題は、本発明の一局面に従った、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を前記単語の組により特定される1つの情報と関連付け、且つ前記論理インデックスの組同士が包摂関係にある場合、包摂される論理インデックスの組について、当該包摂される論理インデックスの組に対応する単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語に対応する論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある名称辞書とを備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、メモリ展開された基本語辞書を生成するステップと、前記名称辞書に登録されている論理インデックスの組、及び不要語の論理インデックスを各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された名称辞書を生成するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、包摂関係がある場合に、不要語の論理インデックスを含めた前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップとを実行させるプログラムにより解決される。 According to one aspect of the present invention, there is provided a basic word dictionary in which each of a plurality of words is associated with a logical index representing each word and registered in advance in a storage unit, and is registered in the basic word dictionary. It is one of information that the set of logical root indexes corresponding to the set of words that combine words together are identified by the set of words and associating, and when said set between the logical index is subsumption relation, subsumed The logical index set is not included in the word set corresponding to the included logical index set and is not used when directly specifying the one information, but the one information is finalized. A name dictionary that is pre-registered in the storage means in association with the one piece of information, a logical index corresponding to an unnecessary word that is an assisting word A computer that converts a lexical word including a plurality of words into another data including one piece of information specified by the plurality of words, and a word representing each word registered in the basic word dictionary A step of expanding a memory on a memory in association with an index to generate a basic word dictionary expanded in the memory, a set of logical indexes registered in the name dictionary, and a logical index of unnecessary words into each set of logical indexes Expanding the memory on the memory in association with the corresponding one specified information, generating a memory expanded name dictionary, decomposing the lexical word to be converted into words, and storing the memory on the memory Obtaining and converting a logical index corresponding to the decomposed word with reference to the expanded basic word dictionary; When there is an inclusion relationship, a set of logical indexes matching the set of logical indexes corresponding to the decomposed words is selected from the set of logical indexes expanded in memory including the logical indexes of unnecessary words. Selecting and using one piece of information specified by the set of selected logical indexes to convert the lexical word containing the plurality of words into another data containing the one piece of specified information. It is solved by the program to make.
本発明のプログラムの一態様によれば、前記コンピュータに、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合その単語を特定して表示手段に表示するステップと、前記入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記名称辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込むステップと
を更に実行させることが好ましい。
According to one aspect of the program of the present invention, when acquiring and converting a logical index corresponding to the decomposed word with reference to the basic word dictionary expanded in the memory on the computer, If there is a word for which a logical index cannot be obtained, the step of identifying the word and displaying it on the display means, and responding to information input by the input means and indicating that the word displayed on the display means is an unnecessary word Then, the word is written in the basic word dictionary in association with the logical index corresponding to the word, and the unnecessary word is excluded from the words included in the lexical word to be converted in the name dictionary. It is preferable to further execute a step of writing a logical index of the word determined as the unnecessary word in association with one piece of information specified from the set of words. .
本発明の別の態様によれば、前記コンピュータに、不要語の論理インデックスを含めた前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスの組と一致する論理インデックスの組を選択する前記のステップを実行させる前に、不要語の論理インデックスを含めない前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組で且つ前記いずれかの論理インデックスの組の論理インデックスのみから構成される論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップを更に実行させることが好ましい。 According to another aspect of the present invention, the computer includes a set of logical indexes corresponding to the decomposed words out of the memory expanded logical index sets including the logical indexes of unnecessary words. Before performing the step of selecting a set of matching logical indexes, the logic corresponding to the decomposed word from the memory expanded logical index set that does not include the logical index of unwanted words. A logical index set that matches a logical index set that is composed of a plurality of logical indexes of the indexes and that is composed only of the logical indexes of the logical index set is selected. And using one piece of information specified by the set of selected logical indexes More further it is preferable to perform the step of converting the other data including one of information the identified lexical including the plurality of words.
上記課題は、本発明の別の局面に従った、複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、前記論理インデックスの組同士が包摂関係にある場合、包摂される論理インデックスの組について、当該包摂される論理インデックスの組に対応する単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語に対応する論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書とを備え、複数の単語を含む字句を当該複数の単語により特定される1つの情報を含む別のデータに変換するコンピュータに、前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、メモリ展開された基本語辞書を生成するステップと、前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された名称辞書を生成するステップと、前記不要語辞書に登録されている不要語に対応する論理インデックスを、各不要語に対応の論理インデックスに対応する前記1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された不要語辞書を生成するステップと、変換されるべき字句を単語に分解するステップと、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を一時的に取得するステップと、包摂関係がある場合に、前記のメモリ展開された不要語辞書の中で、前記の一時的に取得された1つの情報に対応する不要語の論理インデックスが、前記の分解された単語に対応する論理インデックスのうちで前記1つの情報を一時的に取得する際に用いなかった論理インデックスと一致する場合、前記の一時的に取得された1つの情報を特定されるべき1つの情報として確定し、当該1つの情報を用いることにより前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップとを実行させるプログラムにより解決される。 According to another aspect of the present invention, there is provided a basic word dictionary in which each of a plurality of words is associated with a logical index representing each word and registered in advance in storage means, and the basic word dictionary A name dictionary pre-registered in storage means in association with one piece of information specified by the set of words, a set of logical indexes corresponding to a set of words obtained by combining registered words, If set to each other in subsumption relation, for a set of logical index subsumed, not used in identifying said one information directly because it is not contained in the set of words that correspond to the set of logical root indexes are the subsumption A logical index corresponding to an unnecessary word that is unnecessary in terms of the word but assists in finally identifying the one information is associated with the one information. Registered in the basic word dictionary in a computer having an unnecessary word dictionary pre-registered in a memory and converting a lexical word including a plurality of words into another data including one information specified by the plurality of words A word which is associated with a logical index representing each word and expanded in memory to generate a basic word dictionary expanded in memory, and a set of logical indexes registered in the name dictionary A step of expanding the memory on the memory in association with the specified one information corresponding to each set of logical indexes, generating a name dictionary expanded in the memory, and an unnecessary word registered in the unnecessary word dictionary And a logical index corresponding to each of the unnecessary words is associated with the one information corresponding to the logical index corresponding to each unnecessary word and is expanded in the memory. A step of generating an unnecessary word dictionary expanded in a memory, a step of decomposing a lexical word to be converted into a word, and a reference to the basic word dictionary expanded in the memory to correspond to the decomposed word A logical index corresponding to the decomposed word out of the set of logical indexes expanded in the memory, and a step of acquiring and converting the logical index Selecting a set of logical indexes that matches the set of logical indexes, and temporarily acquiring one piece of information specified by the selected set of logical indexes; In the unnecessary word dictionary, the logical index of the unnecessary word corresponding to the one piece of temporarily acquired information is converted into the decomposition If the logical index corresponding to the word is identical to the logical index that was not used when the one piece of information was temporarily obtained, the one piece of the temporarily obtained information is to be identified. This is solved by a program that executes the step of determining as one piece of information and converting the lexical phrase including the plurality of words into another data including the specified one piece of information by using the one piece of information.
本発明のプログラムの一態様によれば、前記コンピュータに、前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合その単語を特定して表示手段に表示するステップと、入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記不要語辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込むステップとを実行させることが好ましい。 According to one aspect of the program of the present invention, when acquiring and converting a logical index corresponding to the decomposed word with reference to the basic word dictionary expanded in the memory on the computer, When there is a word for which a logical index cannot be obtained, the step of identifying the word and displaying it on the display means, and responding to information input by the input means and indicating that the word displayed on the display means is an unnecessary word The word is written in the basic word dictionary in association with the corresponding logical index, and the unnecessary word among the words included in the lexical word to be converted is excluded from the unnecessary word dictionary. It is preferable to execute a step of writing a logical index of the word determined as an unnecessary word in association with one piece of information specified from a set of words.
本発明のプログラムの別の態様によれば、前記コンピュータに、前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を一時的に取得する前記のステップを実行させる前に、前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組で且つ前記いずれかの論理インデックスの組の論理インデックスのみから構成される論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップを更に実行させることが好ましい。 According to another aspect of the program of the present invention, the computer comprises a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the set of logical indexes expanded in the memory. Before selecting the set of logical indexes that matches any set of logical indexes to be executed and temporarily performing the step of obtaining one piece of information specified by the selected set of logical indexes. A set of logical indexes that matches one of the sets of logical indexes of the logical indexes corresponding to the decomposed words from the set of logical indexes expanded in memory. And a logical in of only one logical index set of the logical index set. A lexical phrase including the plurality of words is converted into another data including the specified information by using a piece of information specified by the selected set of logical indexes. Preferably, the steps are further performed.
本発明は前述のような構成により、字句をデータに変換する際に、論理インデックスの組同士又は単語の組同士に包摂関係が生じている場合にも、包摂される論理インデックスの組又は単語の組について、当該包摂される単語の組に含まれないため求める1つの情報を直接特定する際に用いられない点で不要であるが当該1つの情報を最終的に特定するのを補助する単語である不要語を用い、入力された字句の単語の論理インデックスの組と名称辞書の論理インデックスセットとをマッチングするとき、不要語の論理インデックスを考慮してマッチングを取るので、求める1つの情報に正確に変換することができる。即ち、不要語の存在有無を判定することにより、包摂される方の論理インデックスセットの解析精度を向上させることができる。 According to the present invention, when a lexical phrase is converted into data, the inclusion of a set of logical indexes or words to be included is included even when an inclusion relationship is generated between sets of logical indexes or sets of words. A word that is not used when directly specifying one piece of information to be obtained because it is not included in the set of included words, but is a word that assists in finally specifying the one piece of information. When matching a set of logical indexes of input lexical words and a logical index set of a name dictionary using a certain unnecessary word, matching is performed in consideration of the logical index of unnecessary words, so it is accurate to one piece of information to be obtained. Can be converted to That is, by determining the presence / absence of unnecessary words, it is possible to improve the analysis accuracy of the included logical index set.
本発明の好適な実施形態を以下図面を参照して説明する。なお、図面を通して同一又は類似の参照番号は同一又は類似の構成要素を示す。
図1は、銀行等で受信する決済指図電文等について計算機を使用して取引先顧客情報(CIF)解析処理に本発明を適用した場合の好適な実施形態に従った字句をデータに変換する装置の基本構成を示す図である。図1において、10はメイン・フレーム・コンピュータ、パーソナル・コンピュータ、マイクロプロセッサ等の任意のデータ処理装置より構成される処理エンジンを、12はメイン・メモリを、14は基本語辞書を、16は名称辞書を、18は不要語辞書をそれぞれ示す。この字句をデータに変換する装置はまた、メイン・フレーム・コンピュータ、パーソナル・コンピュータに通常接続されているキーボード等の入力装置20及び通常の液晶ディスプレイ等の表示装置22を含み得る。基本語辞書14、名称辞書16及び不要語辞書18は、磁気ディスク等のハード・ディスク(図示せず)に格納されているが、これに限定されず、いずれの他の形式の記憶装置に格納され得る。処理エンジン10として機能するデータ処理装置と、メイン・メモリ12、及び基本語辞書14、名称辞書16及び不要語辞書18を格納するハード・ディスク、入力装置20及び表示装置22とは通常のデータ・バス等(図示せず)により相互に結合されている。
Preferred embodiments of the present invention will be described below with reference to the drawings. Throughout the drawings, the same or similar reference numerals indicate the same or similar components.
FIG. 1 shows an apparatus for converting a lexical word into data according to a preferred embodiment when the present invention is applied to a customer customer information (CIF) analysis process using a computer for a settlement instruction message received at a bank or the like. It is a figure which shows the basic composition. In FIG. 1, 10 is a processing engine composed of an arbitrary data processing device such as a main frame computer, personal computer, microprocessor, 12 is a main memory, 14 is a basic word dictionary, and 16 is a name.
図2は、基本語辞書14に事前に登録されている単語(以下、「基本語」とも言う。)をメイン・メモリ12上にメモリ展開した状態を示す。銀行等におけるCIF解析処理で扱う入力データは、通常アルファベット及びニューメリック(数字)から成り、従って、基本語辞書14に登録されている単語もアルファベット及びニューメリック(数字)から構成されている。なお、本明細書における単語あるいは基本語には、普通名詞、固有名詞、略語が含まれるのは勿論、その他、ある意味を有するいずれの一組の記号も含まれる。図2に示すように、基本語辞書14の一例は、項目として、単語、品詞、名称の属性、コードの属性、及び登録された各単語に対応する数字で表される論理インデックスを含む。この論理インデックスの数字は、CPU処理単位数を小さくするため、2進数で表現された数字であることが好ましい。本発明の基本語辞書としては基本語を登録するための単語の欄と、その単語に対応する数字の論理インデックスを格納するための論理インデックスの欄を少なくとも含めばよく、その他の項目は上記のものに限定されるものではない。論理インデックスは、基本語が基本語辞書14の単語の欄に登録されるとき、その単語に対応する数字(定値)が割り振られ、基本語辞書14の論理インデックスの欄に、登録される基本語と関連付けられて当該数字も格納、即ち登録される。基本語辞書14は、変換すべき字句に登録されていない基本語を含む場合、新たな基本語及びそれに対応する論理インデックスを登録し、また登録済みの基本語で使用しなくなった場合に当該基本語及びその対応の論理インデックスを削除できる。
FIG. 2 shows a state where words (hereinafter, also referred to as “basic words”) registered in advance in the
処理エンジン10は、変換処理を開始する前に、図2に示すように、基本語辞書14に登録されている基本語をメイン・メモリ12上にメモリ展開する。メモリ・アドレスは動的に割り付けられるので、プログラムをメモリ・ロードする度に、同じ単語が同一のメモリ・アドレスの場所に格納されるわけではなく、メモリ・アドレスが異なるのが一般的である。従って、この例では、単語の欄の基本語「AKASAKA」について、参照番号100で示されるように、プログラムが所与の時点でメモリ・ロードされたとき動的に割り付けられるメイン・メモリ12上のメモリ・アドレスとして50番が割り付けられ、その場所に「AKASAKA」に関する情報が格納される。メモリ・アドレスとは対照的に、基本語「AKASAKA」は、メイン・メモリ12上で定値の論理インデックス「#100」と関連付けられて格納されていることに注目されたい。なお、高速処理の観点からは、基本語辞書14を全てメイン・メモリ12上にメモリ展開するのが好ましいが、変換すべき字句に含まれる基本語が事前に分かっている場合には、用いられる基本語だけをメイン・メモリ12上にメモリ展開してもよく、更に、用途によっては、変換処理速度が遅くなるが、基本語辞書14に登録されている基本語の一部分をメモリ展開し、未展開の基本語が変換処理に必要になったとき追加的にメモリ展開するようにしてもよい。
The
図3は、名称辞書16及び不要語辞書18のそれぞれに事前に登録されている論理インデックス・セットをメイン・メモリ12上にメモリ展開した状態を示す。なお、図3には、図2と同様の基本語辞書14に事前に登録されている基本語をメイン・メモリ12上にメモリ展開した状態をも示す。
FIG. 3 shows a state in which the logical index set registered in advance in each of the
図3に示すように、名称辞書16の項目は、論理インデックス・セット、名称、及び名称に示される単語の組み合わせにより特定される1つの情報、例えば、この銀行の応用の例ではCIFコード、及び包摂関係が発生している個所を明示するための包摂コードから成る。この包摂コードは、包摂関係以前には無条件に解析されていた入力データに対して、「包摂関係が発生しているが故にCIFコードを特定してはならない」状態を明確にすることができ、誤解析の縮小に役立つものである。また、包摂コードにより、包摂関係が発生している場合に包摂関係を有する複数の論理インデックスセットの存在を明確にすることができる。名称辞書16の名称の欄には、基本語辞書14に登録されている基本語のうちで、CIFコードが特定される基本語の組み合わせに含まれる基本語が事前に登録されている。一例として、単語の組み合わせ「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」によりCIFコード「6950000」が、「NAKAMORI CO.,LTD MARUNOUCHI」により「6760000」がそれぞれ特定されるとする。そこで、名称辞書16の第1行には「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」が、第2行には「NAKAMORI CO.,LTD MARUNOUCHI」が、それぞれ文字列として登録されている。論理インデックス・セットの欄には、これらの組み合わされた基本語に対応する論理インデックスの組が登録されている。例えば、名称辞書16の第1行には、名称「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」に対応して、「#105,#106,#107,#300」が、第2行には、名称「NAKAMORI CO.,LTD MARUNOUCHI」に対応して、「#105,#107,#300」が、それぞれ基本語辞書14の論理インデックスの組として登録されている。CIFコードの欄には、各名称に対応する固有の番号が登録される。例えば、名称辞書16の第1行には、「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」に対応するCIFコード「6950000」が、第2行には、「NAKAMORI CO.,LTD MARUNOUCHI」に対応するCIFコード「6760000」が、それぞれ登録されている。
As shown in FIG. 3, the item in the
この例では、CIFコード「6950000」と「6760000」とは、包摂関係が発生しており、即ち、前者の論理インデックスの組が、後者の論理インデックスの組「#105,#107,#300」を含む。即ち、後者の論理インデックスの組は、前者の論理インデックスの組に包摂されている。そこで、この組に対する包摂コード番号として「#4000」を割り当て、図3に示すように包摂コードの欄の両方の行に「#4000」が登録される。CIFコード「6950000」の包摂コードの欄には、更に共通部分でない論理インデックスが登録される。この例では、「#106」(単語「ELECTRIC」が包摂コードの欄に登録される。 In this example, the CIF codes “6950000” and “6760000” have an inclusion relationship, that is, the former logical index set is the latter logical index set “# 105, # 107, # 300”. including. That is, the latter set of logical indexes is included in the former set of logical indexes. Therefore, “# 4000” is assigned as the inclusion code number for this set, and “# 4000” is registered in both lines of the inclusion code column as shown in FIG. A logical index that is not a common part is registered in the inclusion code column of the CIF code “6950000”. In this example, “# 106” (the word “ELECTRIC” is registered in the inclusion code column.
名称辞書16は、変換すべき字句に、登録されていない基本語の組み合わせがある場合、新たな基本語を含む組み合わせを登録し、また登録済みの組み合わせで使用しなくなった場合に削除できる。
The
不要語辞書18の項目は、図3に示すように、CIFコード及び不要語の論理インデックスから成る。不要語は、名称辞書16の論理インデックスセットに登録されないため、CIFコードを直接特定する際に用いられない点で不要であるがCIFコードを最終的に特定するのを補助する単語である。なお、不要語は、多くの場合1つの単語であるが、複数の単語から成っていてもよい。図3に示す例では、CIFコードの欄に「6760000」が登録されており、この「6760000」に対して、「AND」及び「OR」が不要語であるので、この「AND」及び「OR」にそれぞれ対応する論理インデックス「#301」及び「#108」(図2に示す基本語辞書14参照)が不要語の論理インデックスの欄に登録されている。なお、不要語は1つの場合もあるが、このように複数の単語が不要語になり得るので、不要語辞書18の不要語の欄は、複数の単語の論理インデックスを登録することができる構造を有する。
As shown in FIG. 3, the items in the
不要語辞書18は、新たな包摂関係の発生あるいは消滅、あるいは新たな不要語の発生あるいは消滅の場合変更できる。
次に、図1に示す装置の動作を図4のフローチャートを参照して説明する。
The
Next, the operation of the apparatus shown in FIG. 1 will be described with reference to the flowchart of FIG.
処理エンジン10は、ステップ100において初期処理を行う。図2を参照して説明したように、基本語辞書14に登録されている単語をメイン・メモリ12へメモリ展開する(その展開状態を図3の14aとして示す。)。次いで、名称辞書16に登録されている論理インデックスセットとCIFコード及び包摂コードとを関連付けて、図3の参照番号16aで示されるようにメイン・メモリ12上へメモリ展開し、そして不要語辞書18に登録されているCIFコードと不要語の論理インデックスとを関連付けて、図3の参照番号18aに示されるようにメイン・メモリ12上へメモリ展開する。
The
処理エンジン10は、次に入力データ解析20を行う。図5に示す入力データ例を参照して説明する。ステップ102において、図5の1に示すように、入力データ30、即ち「NAKAMORI AND CO.,LTD MARUNOUCHI」が入力されたとする。次いで、図5の2に示すように、スペースを手がかりにして単語に分解する。処理エンジン10は、ステップ104において、図5の3に示すように、メイン・メモリ12上にメモリ展開された基本語辞書14aを参照して、参照番号60に示すように論理インデックスを取得する。次いで、図5の4に示すように、入力データを論理インデックスに変換する。
Next, the
処理エンジン10は、続いてマッチング処理22を行う。
処理エンジン10は、ステップ106において、論理インデックスを取得できなかったことで論理インデックスに変換できなった単語が有るか否かを判定する。図5に示す例では、未変換語が無いので、処理プロセスは、ステップ108に進む。
Next, the
In
処理エンジン10は、ステップ108において、変換された論理インデックスの組とメイン・メモリ12上にメモリ展開された名称辞書16a(図3)の論理インデックスセットとが完全マッチングしているか否かを判定する。完全マッチングとは、両者の論理インデックスが全て過不足無く一致することを意味する。ここで、「NAKAMORI AND CO.,LTD MARUNOUCHI」は、それにCIFコードが与えられてなく、登録されていないとする。従って、処理エンジン10は、入力データに対応する論理インデックスの組「#105,#301,#107,#300」(図5の4)は、名称辞書16a(図3)に無いので、完全マッチングしていないと判定する。従って、処理プロセスは、ステップ110に進む。
In
処理エンジン10は、ステップ110において、変換された論理インデックスの組と、メイン・メモリ12上にメモリ展開された名称辞書16a及び不要語辞書18a(図3)の論理インデックスセット及び不要語の論理インデックスとが部分マッチングしているか否かを判定する。ここで、部分マッチングとは、不要語の論理インデックスを含めた論理インデックスセットの中で、ステップ104において変換された論理インデックスと最も多く一致する、即ち最も多く含む論理インデックスセットを選択することを意味する。詳細には、ステップ104において変換された論理インデックスの組は、「#105」、「#107」及び「#300」を含むので、名称辞書16aの第1行及び第2行が対象とされ、次いで、CIFコードをキーとして不要語辞書18aに不要語の論理インデックスの登録があるか確認する。CIFコード「6950000」の方は不要語辞書18aに不要語の登録が無く、一方「6760000」は、「#301」が登録されている。従って、処理エンジン10は、名称辞書16aの第1行の選択はしないで、第2行についての論理インデックスセット「#105,#107,#300」を選択し、更にそれに不要語辞書18aの不要語の論理インデックス「#301」又は「#108」を含めた論理インデックスセットを、入力データに対応する論理インデックスの組「#105,#301,#107,#300」(図5の4)と一致しているか判定する。このとき、辞書側の論理インデックスセットは、「#105,#107,#300,#301」と「#105,#107,#300,#108」の2つのセットがあると見て、それぞれのセットを入力データ側の論理インデックスの組と比較する。つまり、辞書側の論理インデックスセットは、不要語の登録数だけのセット数となり、その全てに対して比較を行う。図5の例では、辞書側の論理インデックスセット「#105,#107,#300,#301」と入力データ側の論理インデックスの組「#105,#301,#107,#300」が一致しているので、処理エンジン10は、名称辞書16aの第2行のCIFコード「6760000」を選択し、取得する(図1の参照番号32参照)。
In
従って、名称に包摂関係が有る場合でも、不要語を含めた部分マッチングを用いることにより、正しいCIFコードが取得され、入力データは正しいCIFコードに変換することができる。 Therefore, even when the names have an inclusion relationship, by using partial matching including unnecessary words, a correct CIF code can be acquired and input data can be converted into a correct CIF code.
処理エンジン10は、ステップ112において、入力データ「NAKAMORI AND CO.,LTD MARUNOUCHI」を、取得したCIFコード「6760000」に変換する。
In
次に、「AND」が不要語として登録されていない場合に、図5の入力データが入力されたときの処理プロセスを、図4及び図6を参照して以下に説明する。
図4に示すステップ100における初期処理は前述のとおりであり、説明を省く。
Next, the processing process when the input data of FIG. 5 is input when “AND” is not registered as an unnecessary word will be described below with reference to FIGS. 4 and 6.
The initial processing in
処理エンジン10は、入力データ解析20を行う。ステップ102において、図6の1に示すように、入力データ、即ち「NAKAMORI AND CO.,LTD MARUNOUCHI」が入力されたとする。次いで、図5の入力データの場合と同様に、スペースを手がかりにして単語に分解する(図6の2参照)。処理エンジン10は、ステップ104において、図6の3に示すように、メイン・メモリ12上にメモリ展開された基本語辞書14aを参照して、参照番号62に示すように論理インデックスを取得する。このとき、「AND」は、基本語辞書14に登録されていないので、論理インデックスを取得できない。次いで、図6の4に示すように、入力データを論理インデックスに変換する。ここで、「AND」は、論理インデックスを取得していないため、論理インデックスに変換されず、そのままの状態にされる。
The
処理エンジン10は、続いてマッチング処理22に進む。
処理エンジン10は、ステップ106において、論理インデックスを取得できなかったことで論理インデックスに変換できなった単語が有るか否かを判定する。「AND」が変換できていないので、処理エンジン10は、ステップ120に進む。ステップ120において、表示装置22に、例えば、図6の4に示す論理インデックスの組及び未変換の単語、即ち「#105 <AND> #107 #300」、及び入力データ「NAKAMORI AND CO.,LTD MARUNOUCHI」が表示される。オペレータは、表示されたこれらの情報、及び入力データに関連した情報、例えば、送信元(あるいは宛先)、送信地点の情報等から、入力データが「NAKAMORI CO.,LTD MARUNOUCHI」でCIFコードが「6760000」であることを特定でき、且つ「AND」が不要語としての性格を有すると判断した場合は、例えば、入力装置20から「AND」を入力すると、処理エンジン10は、図2の参照番号64に示されるように、この「AND」を固有の論理インデックスと関連付けて基本語辞書14に登録する。次いで、オペレータが「AND」を不要語として不要語辞書18に登録するよう入力装置20から指示を入力すると、処理エンジン10は、図3の参照番号66に示されるように、CIFコード「6760000」と関連付けて「AND」の論理インデックス「#301」を登録する。従って、不要語辞書18への登録後に、入力データ「NAKAMORI AND CO.,LTD MARUNOUCHI」が入力された場合、この入力は、包摂関係があっても、図5を参照して上記で説明した処理プロセスに従って、正しくCIFコード「6760000」に変換される。
The
In
ここで、入力データ「NAKAMORI OR CO.,LTD MARUNOUCHI」における「OR」が「AND」と同様に不要語としての性格を有するとする。最初にそのデータ「NAKAMORI OR CO.,LTD MARUNOUCHI」が入力されたとき、「NAKAMORI AND CO.,LTD MARUNOUCHI」の場合と同じように処理されて、図2の参照番号68で示されるように、「OR」が固有の論理インデックス「#108」と関連付けられて基本語辞書14に登録され、更に図3の参照番号66に示されるように、CIFコード「6760000」と関連付けられて論理インデックス「#108」が登録される。このように、不要語辞書18は、複数の不要語がCIFコードと関連付けられて登録することができる構造を有する。不要語「OR」の登録後に、「NAKAMORI OR CO.,LTD MARUNOUCHI」が入力された場合正しいCIFコードを特定するための処理プロセスは、前述した入力データ「NAKAMORI AND CO.,LTD MARUNOUCHI」の場合と同様である。
Here, it is assumed that “OR” in the input data “NAKAMORI OR CO., LTD. MARUNOUCHI” has a character as an unnecessary word like “AND”. When the data “NAKAMORI OR CO., LTD. MARUNOUCHI” is first input, it is processed in the same manner as in the case of “NAKAMORI AND CO., LTD. MARUNOUCHI”, and as indicated by
なお、不要語に関する基本語辞書14及び不要語辞書18の登録は、オペレータが可能性のある不要語を予め想定して、事前に登録することも可能である。また、不要語に割り当てられる固有の論理インデックスは、処理エンジン10が固有の論理インデックスを自動的に決定してもよく、またオペレータが選択してもよく、要は固有の論理インデックスが割り当てられれば、いずれの方法でもよい。
The
次に、入力データとして、「NAKAMORI CO.,LTD MARUNOUCHI」が入力された場合の処理プロセスについて図4及び図7を参照して説明する。図4のステップ100は前述の例と同じであるので説明を省く。図4のステップ102において、図7の1及び2に示すように、入力データは単語に分解される。次いで、図4のステップ104において、図7の3に示すように、分解された単語に対応する論理インデックスが参照番号70に示すように取得され、更に、図7の4に示すように単語の組は、論理インデックス「#105,#107,#300」に変換される。図4のステップ106における判定では、変換されなかった単語が無いので、処理プロセスは、ステップ108に進む。
Next, a processing process when “NAKAMORI CO., LTD. MARUNOUCHI” is input as input data will be described with reference to FIGS. 4 and 7. Since
次いで、ステップ108において、変換された論理インデックスの組「#105,#107,#300」とメイン・メモリ12上にメモリ展開された名称辞書16a(図3)の論理インデックスセットとが完全マッチングしているか否かが判定される。変換された論理インデックスの組「#105,#107,#300」が名称辞書16aの第2行の論理インデックスセット「#105,#107,#300」と全て過不足無く一致しているので、処理エンジン10による処理プロセスは、ステップ122に進む。処理エンジン10は、ステップ122において、名称辞書16aの第2行の論理インデックスセット「#105,#107,#300」に対応するCIFコード「6760000」を選択して、入力データ「NAKAMORI CO.,LTD MARUNOUCHI」をCIFコード「6760000」に変換する。従って、「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」と包摂関係を有する「NAKAMORI CO.,LTD MARUNOUCHI」についても正しいCIFコードに変換することができる。
Next, at
データとして「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」が入力された場合は、入力データ「NAKAMORI CO.,LTD MARUNOUCHI」の場合と同じ前述の処理により、ステップ108において、図3の名称辞書16aの第1行の論理インデックスセット「#105,#106,#107,#300」と完全マッチングし、ステップ122において、CIFコード「6950000」に変換される。従って、包摂関係があり且つ包摂している入力データについても正しいCIFコードに変換することができる。
When “NAKAMORI ELECTRIC CO., LTD. MARUNOUCHI” is input as data, the first process of the name dictionary 16a of FIG. 3 is performed in
なお、図4のステップ110において、部分マッチングが成立しない場合には、参照番号124で示すように解析不能として、その旨表示装置22に表示し、解析を中止し、オペレータによる解析に委ねる。これは、不正確な解析を回避するためである。
If the partial matching is not established in
次に、名称辞書16及び不要語辞書18の構造の変形態様を図8を参照して説明する。
不要語辞書18を独立して設ける代わりに、図8に示すように、名称辞書16′の論理インデックスセットの欄に、主要欄80と不要語欄82を設け、主要欄80にCIFコードと一対一に対応する論理インデックスセットを、不要語欄82に不要語の単語に対応する論理インデックスを登録する。なお、不要語欄82は、不要語の単語が複数ある場合、各単語に対応するそれぞれの論理インデックスを登録することができる構造を有する。また、不要語が存在しないときには、不要語欄82は空の状態となる。
Next, the deformation | transformation aspect of the structure of the
Instead of providing the
以下、図3に示す実施形態の場合の動作と異なる点についてのみ説明する。名称辞書16′がメイン・メモリ12上にメモリ展開されたものとする。図4のステップ108における完全マッチングは、入力データを変換して得られた論理インデックスの組とメイン・メモリ12上にメモリ展開された名称辞書16′aの主要欄80aの論理インデックスセットのみとを行う。完全マッチングの仕方は図3の実施形態の場合と同じである。
Only differences from the operation of the embodiment shown in FIG. 3 will be described below. It is assumed that the
図4のステップ110における部分マッチングは、入力データを変換して得られた論理インデックスの組と、主要欄80aの論理インデックスセットに不要語欄82aの不要語を加えたものとを行う。部分マッチングの仕方は図3の実施形態の場合と同じである。
The partial matching in
不要語欄82への不要語の論理インデックスの登録も不要語辞書18での不要語の登録と同じである。また、名称辞書16′の名称の欄に登録される名称に不要語を図8に示すように含めてもよく、また含めなくてもよい。
Registration of an unnecessary word logical index in the unnecessary word column 82 is the same as registration of an unnecessary word in the
次に、本発明の1つの変更形態について説明する。初めに、図10に示すような辞書の登録例を説明する。
図10は、名称辞書16”及び不要語辞書18”のそれぞれに事前に登録されている論理インデックス・セットをメイン・メモリ12上にメモリ展開した状態を示す。なお、図10には、図2と同様の基本語辞書14に事前に登録されている基本語をメイン・メモリ12上にメモリ展開した状態をも示す。名称辞書16”の名称の欄には、基本語辞書14に登録されている基本語のうちで、CIFコードが特定される基本語の組み合わせ「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」によりCIFコード「6950000」が、「NAKAMORI CO.,LTD MARUNOUCHI」により「6760000」が、「NAKAYAMA PRINTING CORP」により「8984000」がそれぞれ特定されるとする。そこで、名称辞書16”の第1行には「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」が、第2行には「NAKAMORI CO.,LTD MARUNOUCHI」が、第3行には「NAKAYAMA PRINTING CORP」が、それぞれ文字列として登録されている。論理インデックス・セットの欄には、これらの組み合わされた基本語に対応する論理インデックスの組が登録されている。例えば、名称辞書16”の第1行には、名称「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」に対応して、「#105,#106,#107,#300」が、第2行には、名称「NAKAMORI CO.,LTD MARUNOUCHI」に対応して、「#105,#107,#300」が、第3行には、名称「NAKAYAMA PRINTING CORP」に対応して、「#401,#210,#220」がそれぞれ基本語辞書14の論理インデックスの組として登録されている。CIFコードの欄には、各名称に対応する固有の番号が登録される。例えば、名称辞書16”の第1行には、「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」に対応するCIFコード「6950000」が、第2行には、「NAKAMORI CO.,LTD MARUNOUCHI」に対応するCIFコード「6760000」が、第3行には、「NAKAYAMA PRINTING CORP」に対応するCIFコード「8984000」が、それぞれ登録されている。
Next, one modified embodiment of the present invention will be described. First, an example of dictionary registration as shown in FIG. 10 will be described.
FIG. 10 shows a state in which a logical index set registered in advance in each of the
この例では、CIFコード「6950000」と「6760000」とは、包摂関係が発生しており、即ち、前者の論理インデックスの組が、後者の論理インデックスの組「#105,#107,#300」を含む。即ち、後者の論理インデックスの組は、前者の論理インデックスの組に包摂されている。そこで、この組に対する包摂コード番号として「#4000」を割り当て、図10に示すように包摂コードの欄の両方の行に「#4000」が登録される。CIFコード6950000の包摂コードの欄には、更に共通部分でない論理インデックスが登録される。この例では、「#106」(単語「ELECTRIC」)が包摂コードの欄に登録される。
In this example, the CIF codes “6950000” and “6760000” have an inclusion relationship, that is, the former logical index set is the latter logical index set “# 105, # 107, # 300”. including. That is, the latter set of logical indexes is included in the former set of logical indexes. Therefore, “# 4000” is assigned as the inclusion code number for this set, and “# 4000” is registered in both rows of the inclusion code column as shown in FIG. A logical index that is not a common part is registered in the inclusion code column of the
次に、前記の辞書登録(図10)のときに、図5のデータが入力されたときの処理プロセスを、図11のフローチャート及び図5を参照して以下に説明する。
図11に示すステップ100における初期処理及び入力データ解析20は前述のとおりであり、説明を省く。処理エンジン10は、続いてマッチング処理22′に進む。
Next, the processing process when the data of FIG. 5 is input during the dictionary registration (FIG. 10) will be described below with reference to the flowchart of FIG. 11 and FIG.
The initial processing and
処理エンジン10は、ステップ106において、論理インデックスを取得できなかったことで論理インデックスに変換出来なかった単語があるか否かを判定する。図5に示す例では、未変換語が無いので、処理プロセスは、ステップ108に進む。
In
処理エンジン10は、ステップ108′において、変換された論理インデックスの組とメイン・メモリ12上にメモリ展開された名称辞書16”b(図10)の論理インデックスセットとが完全マッチングしているか否かを判定する。図5に示す例では、完全マッチングではないので、処理プロセスはステップ110に進む。
In step 108 ', the
処理エンジン10は、ステップ110′において、変換された論理インデックスの組と、メイン・メモリ12上にメモリ展開された名称辞書16”b及び不要語辞書18”b(図10)の論理インデックスセット及び不要語の論理インデックスセットとが部分マッチングしているか否かを判定する。図5に示す例では、部分マッチングにて名称辞書16”bの第2行のCIFコード「6760000」を選択し、取得する(図1の参照番号32参照)。処理プロセスはステップ116に進む。
In
処理エンジン10は、ステップ116において、ステップ110において名称辞書16”bの取得したCIFコード「6760000」の行に包摂コードが登録されているか否かを判定する。図5に示す例では、名称辞書16”bに登録されているCIFコード「6760000」の行に包摂コード「4000」が存在するので、処理プロセスはステップ114に進む。
In
処理エンジン10は、ステップ114において包摂関係リスト出力を行う。詳細には、表示装置22に、ステップ116において取得した包摂コード「4000」をキーにして、名称辞書16”bを検索した結果、取得された名称を表示する。図5の例では、名称辞書16”bに登録されている名称「NAKAMORI ELECTRIC CO.,LTD MARUNOUCHI」と、名称「NAKAMORI CO.,LTD MARUNOUCHI」が表示される。これにより、該当の名称に包摂関係が発生していることと、包摂関係の要因となっている名称を明示し、名称辞書の補正候補として認識することができる。次いで処理プロセスはステップ118に進む。
The
処理エンジン10は、ステップ118において最終マッチング判定を行う。詳細には、特定されたCIFが、ステップ108′の完全マッチングと、ステップ110′の部分マッチングのどちらで特定されたかを判定する。ステップ108′の完全マッチングでCIFが特定されていた場合は、処理エンジン10はステップ112に進む。ステップ110′の部分マッチングでCIFが特定されていた場合には、変換された論理インデックスの組と、メイン・メモリ12上にメモリ展開された名称辞書16”b及び不要語辞書18”b(図10)の論理インデックスセット及び不要語の論理インデックスセットとが部分マッチングしているか否かを判定し、マッチングできた場合には処理エンジンはステップ112に進み、マッチングできなかった場合には処理エンジン10はステップ126に進む。
The
図5の例では、部分マッチングでCIF「6760000」が特定されたので、処理プロセスはステップ112に進み、CIF「6760000」を特定する。 In the example of FIG. 5, since CIF “6760000” has been identified by partial matching, the processing process proceeds to step 112 to identify CIF “6760000”.
10 処理エンジン
12 メイン・メモリ
14 基本語辞書
16 名称辞書
18 不要語辞書
20 入力装置
22 表示装置
10
Claims (18)
複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、
前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を前記単語の組により特定される1つの情報と関連付け、且つ前記論理インデックスの組同士が包摂関係にある場合、包摂される論理インデックスの組について、当該包摂される論理インデックスの組に対応する単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語に対応する論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、
前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンとを備え、
前記処理エンジンは、
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、
前記名称辞書に登録されている論理インデックスの組、及び不要語の論理インデックスを各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、
変換されるべき字句を単語に分解し、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、
不要語の論理インデックスを含めた前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する装置。 An apparatus for converting a lexical word including a plurality of words into another data including one piece of information specified by the plurality of words,
A basic word dictionary pre-registered in the storage means in association with each of a plurality of words and a logical index representing each word;
Associate a set of logical indexes corresponding to a set of words obtained by combining words registered in the basic word dictionary with one piece of information specified by the set of words, and the sets of logical indexes are inclusive relations In some cases , the set of included logical indexes is not included in the set of words corresponding to the included set of logical indexes, and is unnecessary in that it is not used when directly specifying the one piece of information. A name dictionary in which a logical index corresponding to an unnecessary word which is a word that assists in finally identifying the one information is associated with the one information and is registered in advance in storage means;
A processing engine for converting a lexical phrase including the plurality of words into another data including the specified one piece of information,
The processing engine is
The words registered in the basic word dictionary are associated with a logical index representing each word and expanded in memory.
A logical index set registered in the name dictionary and a logical index of an unnecessary word are associated with the specified one information corresponding to each logical index set and expanded in the memory;
Break the lexical word to be converted into words,
Referencing a basic word dictionary expanded in memory on the memory, obtaining and converting a logical index corresponding to the decomposed word,
A logical index set that matches the logical index set corresponding to the decomposed word is selected from the memory expanded logical index sets including the logical index of unnecessary words, and the selected An apparatus for converting a lexical word including the plurality of words into another data including the specified information by using one information specified by a set of logical indexes.
前記処理エンジンは更に、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合その単語を特定して前記表示手段に表示し、
前記入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記名称辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込む
請求項1記載の装置。 An input means for inputting information including data, and a display means for displaying information including data;
The processing engine further includes:
Referring to the basic word dictionary expanded in the memory, when acquiring and converting the logical index corresponding to the decomposed word, if there is a word for which the logical index cannot be acquired, specify the word Display on the display means;
In response to the information input by the input means indicating that the word displayed on the display means is an unnecessary word, the word is written in the basic word dictionary in association with the corresponding logical index; and The logical index of the word made into the said unnecessary word in association with one information specified from the word group except the word made into the said word dictionary except the word made into the unnecessary word in the word to be converted claim 1 Symbol mounting apparatus writes.
請求項1又は2記載の装置。 The processing engine further selects a logical index set that matches the logical index set corresponding to the decomposed word from the memory expanded logical index set including a logical index of an unnecessary word. Any one of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the set of the memory-expanded logical indexes that do not include the logical indexes of unnecessary words. A set of logical indexes that is identical to the set of logical indexes and is composed only of the logical indexes of the set of any of the logical indexes, and is specified by the selected set of logical indexes By using one piece of information, the lexical phrase including the plurality of words is identified. The apparatus of claim 1, wherein converting to another data including One information.
複数の単語のそれぞれを、それぞれの単語を表象する論理インデックスと関連付けて記憶手段に予め登録してある基本語辞書と、
前記基本語辞書に登録されている単語同士を組み合わせた単語の組に対応する論理インデックスの組を前記単語の組により特定される1つの情報と関連付けて記憶手段に予め登録してある名称辞書と、
前記論理インデックスの組同士が包摂関係にある場合、包摂される論理インデックスの組について、当該包摂される論理インデックスの組に対応する単語の組に含まれないため前記1つの情報を直接特定する際に用いられない点で不要であるが前記1つの情報を最終的に特定するのを補助する単語である不要語の論理インデックスを前記1つの情報と関連付けて記憶手段に予め登録してある不要語辞書と、
前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する処理エンジンとを備え、
前記処理エンジンは、
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、
前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開し、
変換されるべき字句を単語に分解し、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換し、
前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を一時的に取得し、包摂関係がある場合に、
前記のメモリ展開された不要語辞書の中で、前記の一時的に取得された1つの情報に対応する不要語の論理インデックスが、前記の分解された単語に対応する論理インデックスのうちで前記1つの情報を一時的に取得する際に用いなかった論理インデックスと一致する場合、前記の一時的に取得された1つの情報を特定されるべき1つの情報として確定し、当該1つの情報を用いることにより前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換する装置。 An apparatus for converting a lexical word including a plurality of words into another data including one piece of information specified by the plurality of words,
A basic word dictionary pre-registered in the storage means in association with each of a plurality of words and a logical index representing each word;
A name dictionary pre-registered in storage means in association with one piece of information specified by the set of words, a set of logical indexes corresponding to a set of words obtained by combining words registered in the basic word dictionary ,
When the set of logical indexes is inclusive , the set of included logical indexes is not included in the set of words corresponding to the included set of logical indexes, and thus when the one information is directly specified Unnecessary word that is unnecessary in that it is not used in the process, but is previously registered in the storage means in association with the one information in association with the logical index of the unnecessary word, which is a word that assists in finally identifying the one information. A dictionary,
A processing engine for converting a lexical phrase including the plurality of words into another data including the specified one piece of information,
The processing engine is
The words registered in the basic word dictionary are associated with a logical index representing each word and expanded in memory.
A set of logical indexes registered in the name dictionary is associated with the specified one piece of information corresponding to each set of logical indexes and expanded in the memory;
A logical index of unnecessary words registered in the unnecessary word dictionary is associated with the one information and expanded in the memory;
Break the lexical word to be converted into words,
Referencing a basic word dictionary expanded in memory on the memory, obtaining and converting a logical index corresponding to the decomposed word,
A set of logical indexes that matches one of the sets of logical indexes of the logical indexes corresponding to the decomposed words from the set of logical indexes expanded in memory. And temporarily acquiring one piece of information specified by the selected set of logical indexes, and there is an inclusion relationship,
In the unnecessary word dictionary expanded in the memory, the logical index of the unnecessary word corresponding to the one piece of temporarily acquired information is the logical index corresponding to the decomposed word. If it matches a logical index that was not used when temporarily acquiring one piece of information, the one piece of temporarily acquired information is determined as one piece of information to be specified, and the one piece of information is used An apparatus for converting a lexical phrase including the plurality of words into another data including the specified information.
前記処理エンジンは更に、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合その単語を特定して前記表示手段に表示し、
前記入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記不要語辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込む
請求項4記載の装置。 An input means for inputting information including data, and a display means for displaying information including data;
The processing engine further includes:
Referring to the basic word dictionary expanded in the memory, when acquiring and converting the logical index corresponding to the decomposed word, if there is a word for which the logical index cannot be acquired, specify the word Display on the display means;
In response to the information input by the input means indicating that the word displayed on the display means is an unnecessary word, the word is written in the basic word dictionary in association with the corresponding logical index; and In the unnecessary word dictionary, among the words included in the lexical word to be converted, the logic of the word determined as the unnecessary word in association with one piece of information specified from the word set excluding the word determined as the unnecessary word 4. Symbol mounting device writes index.
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、メモリ展開された基本語辞書を生成するステップと、
前記名称辞書に登録されている論理インデックスの組、及び不要語の論理インデックスを各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された名称辞書を生成するステップと、
変換されるべき字句を単語に分解するステップと、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、
包摂関係がある場合に、不要語の論理インデックスを含めた前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと
を実行させる方法。 Corresponding to a basic word dictionary that is pre-registered in the storage means in association with a logical index that represents each word, and a set of words that combine words registered in the basic word dictionary A set of logical indexes to be associated with one piece of information specified by the set of words, and when the sets of logical indexes are in an inclusive relationship, for the set of included logical indexes, An unnecessary word that is not included in a set of words corresponding to a set and is not used when directly specifying the one piece of information, but is a word that assists in finally specifying the one piece of information. A name dictionary pre-registered in the storage means in association with the one information, and a lexical phrase including a plurality of words The computer to convert into another data including one information specified by the word,
Associating words registered in the basic word dictionary with a logical index representing each word in a memory and generating a basic word dictionary expanded in memory ;
A logical index set registered in the name dictionary and a logical index of an unnecessary word are associated with the specified one information corresponding to each logical index pair, and are expanded in the memory. Generating a name dictionary;
Breaking the lexical terms to be converted into words;
Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
When there is an inclusion relationship, a set of logical indexes matching the set of logical indexes corresponding to the decomposed words is selected from the set of logical indexes expanded in memory including the logical indexes of unnecessary words. selected, by using a single information specified by a set of logical indexes the selected, and a step of converting the lexical including the plurality of words into another data including one of the information the specific how to make.
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合その単語を特定して表示手段に表示するステップと、
入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記名称辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込むステップと
を更に実行させる請求項7記載の方法。 In the computer,
Referring to the basic word dictionary expanded in the memory, when acquiring and converting the logical index corresponding to the decomposed word, if there is a word for which the logical index cannot be acquired, specify the word and Luz steps be displayed on the display means,
In response to the information input by the input means indicating that the word displayed on the display means is an unnecessary word, the word is written in the basic word dictionary in association with the corresponding logical index, and In the name dictionary, a logical index of the word determined as the unnecessary word in association with one piece of information specified from a set of words excluding the word determined as the unnecessary word among the words included in the lexical word to be converted the method of claim 7 Symbol mounting to further execute a step of writing.
不要語の論理インデックスを含めた前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスの組と一致する論理インデックスの組を選択する前記のステップを実行させる前に、不要語の論理インデックスを含めない前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組で且つ前記いずれかの論理インデックスの組の論理インデックスのみから構成される論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップを
更に実行させる請求項7又は8記載の方法。 In the computer,
The step of selecting the logical index set that matches the logical index set corresponding to the decomposed word from the memory expanded logical index set including the logical index of unnecessary words is performed. Any one of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the memory expanded logical index set that does not include the logical indexes of unnecessary words A set of logical indexes that is identical to the set of logical indexes and is composed only of the logical indexes of the set of any of the logical indexes, and is specified by the selected set of logical indexes By using one piece of information, the lexical word including the plurality of words is identified. Furthermore according to claim 7 or 8 A method according to execute a step of converting the other data including one information.
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、メモリ展開された基本語辞書を生成するステップと、
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された名称辞書を生成するステップと、
前記不要語辞書に登録されている不要語の論理インデックスを前記1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された不要語辞書を生成するステップと、
変換されるべき字句を単語に分解するステップと、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、
前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を一時的に取得するステップと、
包摂関係がある場合に、前記のメモリ展開された不要語辞書の中で、前記の一時的に取得された1つの情報に対応する不要語の論理インデックスが、前記の分解された単語に対応する論理インデックスのうちで前記1つの情報を一時的に取得する際に用いなかった論理インデックスと一致する場合、前記の一時的に取得された1つの情報を特定されるべき1つの情報として確定し、当該1つの情報を用いることにより前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと
を実行させる方法。 Corresponding to a basic word dictionary that is pre-registered in the storage means in association with a logical index that represents each word, and a set of words that combine words registered in the basic word dictionary A name dictionary pre-registered in storage means in association with one piece of information specified by the set of words and a set of logical indexes to be included when the sets of logical indexes are in an inclusion relationship A word that is not included in the set of included words and is not used when directly specifying the one information, but is a word that assists in finally specifying the one information. A logical index corresponding to a certain unnecessary word is provided in association with the one information and registered in advance in the storage means, and a word / phrase including a plurality of words is assigned. The computer to convert into another data including one information specified by a plurality of words,
Comprising the steps of a word registered in the basic dictionary, and memory development in memory in association with the logical index representation each word, to generate a memory expanded basic dictionary,
Correlating a set of logical indexes registered in the name dictionary with the one piece of specified information corresponding to each set of logical indexes in the memory, and generating a name dictionary expanded in the memory When,
Correlating a logical index of an unnecessary word registered in the unnecessary word dictionary with the one information in the memory, and generating an unnecessary word dictionary expanded in the memory ;
Breaking the lexical terms to be converted into words;
Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
A set of logical indexes that matches one of the sets of logical indexes of the logical indexes corresponding to the decomposed words from the set of logical indexes expanded in memory. And temporarily obtaining one piece of information specified by the selected set of logical indexes;
When there is an inclusion relationship, a logical index of an unnecessary word corresponding to the one piece of temporarily acquired information in the memory expanded unnecessary word dictionary corresponds to the decomposed word. If the logical index matches the logical index that was not used when temporarily acquiring the one information, the one temporarily acquired information is determined as one information to be specified, how to execute the steps of converting the lexical including the plurality of words by using the one piece of information to another data including one of information the identified.
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合、その単語を特定して表示手段に表示するステップと、
入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記不要語辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込むステップと
を更に実行させる請求項10記載の方法。 In the computer,
When a logical index corresponding to the decomposed word is obtained and converted with reference to the basic word dictionary expanded in the memory on the memory, if there is a word for which a logical index cannot be obtained , the word is identified. Displaying on the display means,
In response to the information input by the input means indicating that the word displayed on the display means is an unnecessary word, the word is written in the basic word dictionary in association with the corresponding logical index, and The logical index of the word made into the unnecessary word in association with one piece of information specified from the word set excluding the word made into the unnecessary word in the word to be converted in the unnecessary word dictionary claim 1 0 Symbol mounting method is further execute a step of writing.
前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を一時的に取得する前記のステップを実行させる前に、
前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組で且つ前記いずれかの論理インデックスの組の論理インデックスのみから構成される論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップ
を更に実行させる請求項10又は11記載の方法。 In the computer,
A set of logical indexes that matches one of the sets of logical indexes of the logical indexes corresponding to the decomposed words from the set of logical indexes expanded in memory. And executing the above step of temporarily obtaining one piece of information specified by the selected set of logical indexes,
A set of logical indexes that matches one of the sets of logical indexes of the logical indexes corresponding to the decomposed words from the set of logical indexes expanded in memory. And selecting a logical index set composed only of logical indexes of any one of the logical index sets, and using one piece of information specified by the selected logical index set, the plurality of words 12. The method according to claim 10 or 11 , further comprising the step of converting a lexical phrase including: to another data including the specified one piece of information.
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、メモリ展開された基本語辞書を生成するステップと、
前記名称辞書に登録されている論理インデックスの組、及び不要語の論理インデックスを各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された名称辞書を生成するステップと、
変換されるべき字句を単語に分解するステップと、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、
包摂関係がある場合に、不要語の論理インデックスを含めた前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと
を実行させるプログラム。 Corresponding to a basic word dictionary that is pre-registered in the storage means in association with a logical index that represents each word, and a set of words that combine words registered in the basic word dictionary associating one of information specified by a set of pairs of said word logical index, and when said set between the logical index is subsumption relation, for a set of logical index subsumed, the logical index is the subsumption stop word is set is not necessary in that is not used in identifying said one information directly because it is not included in the set of words corresponding to a word to assist in finally identifies the piece of information A name dictionary pre-registered in the storage means in association with the one information, and a lexical phrase including a plurality of words The computer to convert into another data including one information specified by the word,
Associating words registered in the basic word dictionary with a logical index representing each word in a memory and generating a basic word dictionary expanded in memory;
A logical index set registered in the name dictionary and a logical index of an unnecessary word are associated with the specified one information corresponding to each logical index pair, and are expanded in the memory. Generating a name dictionary;
Breaking the lexical terms to be converted into words;
Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
When there is an inclusion relationship, a set of logical indexes matching the set of logical indexes corresponding to the decomposed words is selected from the set of logical indexes expanded in memory including the logical indexes of unnecessary words. Selecting and using one piece of information specified by the set of selected logical indexes to convert the lexical word containing the plurality of words into another data containing the one piece of specified information. Program to make.
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合その単語を特定して表示手段に表示するステップと、
前記入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記名称辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込むステップと
を更に実行させる請求項13記載のプログラム。 In the computer,
Referring to the basic word dictionary expanded in the memory, when acquiring and converting the logical index corresponding to the decomposed word, if there is a word for which the logical index cannot be acquired, specify the word Displaying on the display means;
In response to the information input by the input means indicating that the word displayed on the display means is an unnecessary word, the word is written in the basic word dictionary in association with the corresponding logical index; and The logical index of the word made into the said unnecessary word in association with one information specified from the word group except the word made into the said word dictionary except the word made into the unnecessary word in the word to be converted Furthermore claim 13 Symbol mounting program and a step of writing.
不要語の論理インデックスを含めた前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスの組と一致する論理インデックスの組を選択する前記のステップを実行させる前に、不要語の論理インデックスを含めない前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組で且つ前記いずれかの論理インデックスの組の論理インデックスのみから構成される論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップを
更に実行させる請求項13又は14記載のプログラム。 In the computer,
The step of selecting the logical index set that matches the logical index set corresponding to the decomposed word from the memory expanded logical index set including the logical index of unnecessary words is performed. Any one of a plurality of logical indexes among the logical indexes corresponding to the decomposed words from the memory expanded logical index set that does not include the logical indexes of unnecessary words A set of logical indexes that is identical to the set of logical indexes and is composed only of the logical indexes of the set of any of the logical indexes, and is specified by the selected set of logical indexes By using one piece of information, the lexical word including the plurality of words is identified. Another claim 13 or 14, wherein the program is further perform the step of converting the data including a piece of information.
前記基本語辞書に登録されている単語を、それぞれの単語を表象する論理インデックスと関連付けてメモリ上にメモリ展開し、メモリ展開された基本語辞書を生成するステップと、
前記名称辞書に登録されている論理インデックスの組を、各論理インデックスの組に対応する前記特定される1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された名称辞書を生成するステップと、
前記不要語辞書に登録されている不要語に対応する論理インデックスを、各不要語に対応の論理インデックスに対応する前記1つの情報と関連付けて前記メモリ上にメモリ展開し、メモリ展開された不要語辞書を生成するステップと、
変換されるべき字句を単語に分解するステップと、
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換するステップと、
前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を一時的に取得するステップと、
包摂関係がある場合に、前記のメモリ展開された不要語辞書の中で、前記の一時的に取得された1つの情報に対応する不要語の論理インデックスが、前記の分解された単語に対応する論理インデックスのうちで前記1つの情報を一時的に取得する際に用いなかった論理インデックスと一致する場合、前記の一時的に取得された1つの情報を特定されるべき1つの情報として確定し、当該1つの情報を用いることにより前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップと
を実行させるプログラム。 Corresponding to a basic word dictionary that is pre-registered in the storage means in association with a logical index that represents each word, and a set of words that combine words registered in the basic word dictionary If the name dictionary a set of logical indexes registered in advance in the storage means in association with one of the information specified by said set of words, set between the logical index is subsumption relation, logical index subsumed Is not included in the set of words corresponding to the included logical index set, and is not used when directly specifying the one information. An unnecessary word dictionary in which a logical index corresponding to an unnecessary word that is an assisting word is associated with the one information and registered in advance in a storage unit; Provided, the computer converts the lexical including a plurality of words to another data including one of the information specified by the plurality of words,
Associating words registered in the basic word dictionary with a logical index representing each word in a memory and generating a basic word dictionary expanded in memory;
Correlating a set of logical indexes registered in the name dictionary with the one piece of specified information corresponding to each set of logical indexes in the memory, and generating a name dictionary expanded in the memory When,
The logical index corresponding to the unnecessary word registered in the unnecessary word dictionary is associated with the one information corresponding to the logical index corresponding to each unnecessary word and is expanded in the memory, and the unnecessary word expanded in the memory Creating a dictionary;
Breaking the lexical terms to be converted into words;
Obtaining and converting a logical index corresponding to the decomposed word with reference to a basic word dictionary expanded in the memory;
A set of logical indexes that matches one of the sets of logical indexes of the logical indexes corresponding to the decomposed words from the set of logical indexes expanded in memory. And temporarily obtaining one piece of information specified by the selected set of logical indexes;
When there is an inclusion relationship, a logical index of an unnecessary word corresponding to the one piece of temporarily acquired information in the memory expanded unnecessary word dictionary corresponds to the decomposed word. If the logical index matches the logical index that was not used when temporarily acquiring the one information, the one temporarily acquired information is determined as one information to be specified, A program for executing a step of converting a lexical phrase including the plurality of words into another data including the specified one information by using the one information.
前記メモリ上にメモリ展開された基本語辞書を参照して、前記の分解された単語に対応する論理インデックスを取得、変換する際に、論理インデックスを取得できない単語がある場合その単語を特定して表示手段に表示するステップと、
入力手段により入力された、前記表示手段に表示された単語が不要語であることを示す情報に応答して、前記基本語辞書に、当該単語をそれに対応する論理インデックスと関連付けて書き込み、且つ前記不要語辞書に、変換されるべき字句に含まれる単語の中で前記不要語とされた単語を除いた単語の組から特定される1つの情報と関連付けて前記不要語とされた単語の論理インデックスを書き込むステップと
を実行させる請求項16記載のプログラム。 In the computer,
Referring to the basic word dictionary expanded in the memory, when acquiring and converting the logical index corresponding to the decomposed word, if there is a word for which the logical index cannot be acquired, specify the word Displaying on the display means;
In response to the information input by the input means indicating that the word displayed on the display means is an unnecessary word, the word is written in the basic word dictionary in association with the corresponding logical index, and The logical index of the word made into the unnecessary word in association with one piece of information specified from the word set excluding the word made into the unnecessary word in the word to be converted in the unnecessary word dictionary 16. Symbol mounting program and a step of writing.
前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を一時的に取得する前記のステップを実行させる前に、前記のメモリ展開された論理インデックスの組の中から、前記の分解された単語に対応する論理インデックスのうちの複数の論理インデックスから構成されるいずれかの論理インデックスの組と一致する論理インデックスの組で且つ前記いずれかの論理インデックスの組の論理インデックスのみから構成される論理インデックスの組を選択し、当該選択された論理インデックスの組により特定される1つの情報を用いることにより、前記複数の単語を含む字句を前記特定される1つの情報を含む別のデータに変換するステップ
を更に実行させる請求項16又は17記載のプログラム。 In the computer,
A set of logical indexes that matches one of the sets of logical indexes of the logical indexes corresponding to the decomposed words from the set of logical indexes expanded in memory. Before executing the step of temporarily obtaining one piece of information specified by the selected set of logical indexes, from among the set of logical indexes expanded in the memory, A set of logical indexes that matches a set of any of the logical indexes configured from a plurality of logical indexes among the logical indexes corresponding to the decomposed words, and includes only the logical index of the set of any of the logical indexes Select a set of logical indexes to be selected, and Ri by using a single information identified, claim 16 or 17, wherein the program is further perform the step of converting the other data including one of information the identified lexical including the plurality of words.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004274422A JP4111941B2 (en) | 2004-09-22 | 2004-09-22 | Apparatus, method and program for converting lexical data to data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004274422A JP4111941B2 (en) | 2004-09-22 | 2004-09-22 | Apparatus, method and program for converting lexical data to data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006092065A JP2006092065A (en) | 2006-04-06 |
JP4111941B2 true JP4111941B2 (en) | 2008-07-02 |
Family
ID=36232998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004274422A Active JP4111941B2 (en) | 2004-09-22 | 2004-09-22 | Apparatus, method and program for converting lexical data to data |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4111941B2 (en) |
-
2004
- 2004-09-22 JP JP2004274422A patent/JP4111941B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2006092065A (en) | 2006-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6091450A (en) | Table type language interpreter | |
US11568150B2 (en) | Methods and apparatus to improve disambiguation and interpretation in automated text analysis using transducers applied on a structured language space | |
JP2002117027A (en) | Feeling information extracting method and recording medium for feeling information extracting program | |
JPH08314910A (en) | Different kind of code character string transcribing device and electronic dictionary | |
JP4111941B2 (en) | Apparatus, method and program for converting lexical data to data | |
JP5900486B2 (en) | Related specification mapping system, related specification mapping method and program | |
JP4051369B2 (en) | Apparatus, method and program for converting lexical data to data | |
JP2008210229A (en) | Device, method and program for retrieving intellectual property information | |
JP2010146273A (en) | Document retrieval device and program | |
JP4139805B2 (en) | Apparatus, method and program for converting lexical data to data | |
JP2009104475A (en) | Similar document retrieval device, and similar document retrieval method and program | |
JP4721344B2 (en) | Word search device, word search method and program | |
WO2023228351A1 (en) | Learning device, management sheet creation support device, program, learning method, and management sheet creation support method | |
JP4847210B2 (en) | Input conversion learning program, input conversion learning method, and input conversion learning device | |
JP4061283B2 (en) | Apparatus, method and program for converting lexical data to data | |
JPS62145463A (en) | Kana/kanji (japanese syllabary/chinese character) conversion system | |
JP4050768B2 (en) | Named expression extraction apparatus, method, program, and medium | |
JP3087699B2 (en) | Standard information simple input system and standard information simple input method | |
JP2007140781A (en) | Name analysis device, name analysis method and name analysis program | |
JPS63184864A (en) | Documentation device | |
JP2005275880A (en) | Device, method and program for converting word and phrase into data | |
JPH0785040A (en) | Inscription nonuniformity detecting method and kana/ kanji converting method | |
JP2003178263A (en) | Character recognizing device and recording medium | |
JPH10198693A (en) | Device and method for address book management | |
JPH10326276A (en) | Method and system for learing machine translation system dictionary and rule, and storage medium stored with learning program therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070720 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070821 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20070829 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080408 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4111941 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110418 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140418 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |