JP4076533B2 - Information conversion apparatus and program - Google Patents

Information conversion apparatus and program Download PDF

Info

Publication number
JP4076533B2
JP4076533B2 JP2004363961A JP2004363961A JP4076533B2 JP 4076533 B2 JP4076533 B2 JP 4076533B2 JP 2004363961 A JP2004363961 A JP 2004363961A JP 2004363961 A JP2004363961 A JP 2004363961A JP 4076533 B2 JP4076533 B2 JP 4076533B2
Authority
JP
Japan
Prior art keywords
words
character string
word
specific
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004363961A
Other languages
Japanese (ja)
Other versions
JP2006172151A (en
Inventor
一朗 中田
達彦 相川
淳一 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MUFG Bank Ltd
Original Assignee
Bank of Tokyo Mitsubishi UFJ Trust Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of Tokyo Mitsubishi UFJ Trust Co filed Critical Bank of Tokyo Mitsubishi UFJ Trust Co
Priority to JP2004363961A priority Critical patent/JP4076533B2/en
Publication of JP2006172151A publication Critical patent/JP2006172151A/en
Application granted granted Critical
Publication of JP4076533B2 publication Critical patent/JP4076533B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は情報変換装置及びプログラムに係り、特に、所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表していると推定される所定の対象に付与された識別情報へ変換する情報変換装置、及び、コンピュータを前記情報変換装置として機能させるための情報変換プログラムに関する。   The present invention relates to an information conversion apparatus and program, and in particular, every time a character string composed of a plurality of words combined to represent a predetermined object is input, the input character string is input to the program. The present invention relates to an information conversion device for converting into identification information given to a predetermined object presumed to be represented by a character string, and an information conversion program for causing a computer to function as the information conversion device.

異なる金融機関の口座への送金等の金融取引が依頼された場合には、当該金融取引に関係する顧客の名称(例えば送金入金先口座の名義人名等)が文字列として設定された電文が金融機関の間で電文が送受される。一方、金融機関では個々の顧客に顧客コード(この顧客コードは例えばCIF(Customer Information File:顧客情報ファイル)と称されている)を付与しており、金融機関内のコンピュータ・システムは、この顧客コードに基づいて顧客を識別し指示された金融取引を実行する構成となっているため、他の金融機関から電文を受信した場合には、受信した電文に設定されている顧客名称を表す文字列を、対応する顧客コードへ変換する必要がある。   When a financial transaction such as remittance to an account of a different financial institution is requested, a message in which the name of the customer related to the financial transaction (for example, the name of the holder of the remittance account) is set as a character string is financial Messages are sent and received between institutions. On the other hand, a financial institution assigns a customer code (this customer code is called, for example, a CIF (Customer Information File)) to each customer, and the computer system in the financial institution is the customer code. Since it is configured to identify customers based on codes and execute designated financial transactions, when receiving a message from another financial institution, a character string representing the customer name set in the received message Needs to be converted to the corresponding customer code.

上記に関連して特許文献1には、顧客コードを特定する複数の単語の組合わせとそれに対応する顧客コードを登録した顧客コードテーブルを予め記憶装置に格納しておき、入力データから変換すべき複数の単語を抽出し、抽出した複数の単語と顧客コードテーブルに登録されている複数の単語を比較し、一致した場合に顧客コードへ変換する技術が開示されている。   In relation to the above, Patent Document 1 discloses that a customer code table in which a combination of a plurality of words specifying a customer code and a corresponding customer code is registered in a storage device in advance and converted from input data. There is disclosed a technique for extracting a plurality of words, comparing the extracted plurality of words with a plurality of words registered in a customer code table, and converting them into a customer code if they match.

また、特許文献2には、単語から成る基本語辞書、2つの単語の組から成る核名称辞書、及び、当該組の記号と更に別の単語と目的のデータの組から成るフル名称辞書を、メインメモリ上にメモリアドレスをシンボルとしてシンボル化し、シンボル化した基本語辞書を参照して被変換字句に含まれる単語に対応するアドレスを取得し、そのうちの2つのアドレスが一致する組をシンボル化した核名称辞書から見つけ、次いでもう1つのアドレスと一致する組をシンボル化されたフル名称辞書から見つけることで、被変換字句を目的のデータに変換する技術が開示されている。
特開2002−56005号公報 特開2004−31873号公報
Patent Document 2 also includes a basic word dictionary composed of words, a nuclear name dictionary composed of a set of two words, and a full name dictionary composed of a set of a symbol and another word and target data. The memory address is symbolized on the main memory as a symbol, the address corresponding to the word contained in the converted lexical phrase is obtained by referring to the symbolized basic word dictionary, and the pair in which two addresses match is symbolized A technique for converting a converted lexical into target data by finding from a nuclear name dictionary and then finding a pair that matches another address from a symbolized full name dictionary is disclosed.
JP 2002-56005 A JP 2004-31873 A

但し、上記の電文に設定されている顧客名称は、金融取引の実行を依頼した依頼人によって指定された名称がそのまま文字列として設定されるため、例えば正規の名称に対して余計な単語が付加されていたり、正規の名称を構成する複数の単語の一部が欠落している等、正規の名称が正しく設定されていない場合がある。このため、従来より、受信した電文に設定されている顧客名称を表す文字列が正規の名称に対して余計な単語が付加されている文字列であった場合にも、正しい顧客コードへの変換を可能とするために、正規の顧客名称を表す文字列と顧客コードを対応付けて名称辞書に登録しておき、受信した電文に設定されている顧客名称を表す文字列(入力文字列)を名称辞書に登録されている各文字列(正規の顧客名称を表す文字列)と各々照合することで、構成する各単語が入力文字列中に各々存在している文字列を検索し、該当する文字列と対応付けられている顧客コードを入力文字列に対応する顧客コードと判断することが行われている。   However, for the customer name set in the above message, the name specified by the client who requested the execution of the financial transaction is set as it is as a character string, so an extra word is added to the regular name, for example. In some cases, the proper name is not set correctly, for example, some of a plurality of words constituting the canonical name are missing. For this reason, conventionally, even when the character string representing the customer name set in the received message is a character string with an extra word added to the legitimate name, conversion to the correct customer code In order to enable this, a character string representing an authorized customer name and a customer code are registered in the name dictionary in association with each other, and a character string (input character string) representing a customer name set in the received message is obtained. Each character string registered in the name dictionary (character string representing a regular customer name) is collated to search for a character string in which each constituent word is present in the input character string. A customer code associated with a character string is determined to be a customer code corresponding to an input character string.

しかしながら、上記の条件で検索を行ったとしても、例えば入力文字列「HAYASHI ELECTRIC CO.,LTD SHINZYUKU」に対して、検索により文字列「HAYASHI ELECTRIC CO.,LTD」と文字列「SHINZYUKU ELECTRIC CO.,LTD」が各々抽出される等、検索によって顧客名称を表す文字列が複数抽出されることがある。このような場合、入力文字列が抽出された複数の顧客名称の何れを表しているのかを自動的に判断することは困難であり、従来はオペレータの判断に委ねる以外の解決策がないので、オペレータに多大な負担がかかっているのが実情であった。   However, even if a search is performed under the above conditions, for example, for the input character string `` HAYASHI ELECTRIC CO., LTD SHINZYUKU '', the character string `` HAYASHI ELECTRIC CO., LTD '' and the character string `` SHINZYUKU ELECTRIC CO. , LTD "may be extracted, and a plurality of character strings representing customer names may be extracted by the search. In such a case, it is difficult to automatically determine which of the plurality of customer names from which the input character string is extracted, and conventionally there is no solution other than leaving it to the operator's decision. The actual situation is that a great burden is placed on the operator.

本発明は上記事実を考慮して成されたもので、所定の対象を表すために複数の単語が組合わされて構成された文字列を、該文字列が表していると推定される所定の対象に付与された識別情報へ変換することを、オペレータの手を煩わすことなく自動的に行える確率を向上させることができる情報変換装置及び情報変換プログラムを得ることが目的である。   The present invention has been made in consideration of the above facts, and a predetermined object presumed to represent a character string composed of a plurality of words combined to represent the predetermined object. It is an object to obtain an information conversion apparatus and an information conversion program that can improve the probability that conversion to identification information assigned to the item can be automatically performed without bothering an operator.

特定の対象(例えば特定の顧客)を表す目的で設定されたにも拘らず特定の対象の正規の名称と相違している文字列としては、前述のように正規の名称に対して余計な単語が付加されている文字列が挙げられるが、この種の文字列に付加されている余計な単語は、例えば「HAYASHI ELECTRIC CO.,LTD」には「SHINZYUKU」なる余計な単語が付加されていることが多い等のように、個々の対象毎に一定の単語であることが多い。そして、前述の例において、顧客名称「SHINZYUKU ELECTRIC CO.,LTD」を表す文字列に「HAYASHI」なる余計な単語は付加されることがないのであれば、入力文字列は顧客名称「HAYASHI ELECTRIC CO.,LTD」を表す文字列であると見なすことができる。本願発明者は上記事実に着目し、所定の対象を表すために複数の単語が組合わされて構成された文字列を、該文字列が表していると推定される所定の対象に付与された識別情報へ変換するにあたり、過去に識別情報への変換を行った文字列に付加されていた余計な単語(不要単語)を記憶しておいて、新たな文字列の変換に利用すれば、文字列を識別情報へ適正に自動変換できる確率を向上させることが可能であることに想到して本願発明を成すに至った。   A character string that is set for the purpose of representing a specific target (for example, a specific customer) but is different from the regular name of the specific target is an extra word for the regular name as described above. The extra word added to this type of string, for example, “HAYASHI ELECTRIC CO., LTD” has an extra word “SHINZYUKU” added to it. In many cases, it is a fixed word for each individual object. In the above example, if an extra word “HAYASHI” is not added to the character string representing the customer name “SHINZYUKU ELECTRIC CO., LTD”, the input character string is the customer name “HAYASHI ELECTRIC CO. ., LTD "can be regarded as a character string. The inventor of the present application pays attention to the above facts, and identifies a character string formed by combining a plurality of words to represent a predetermined object, given to the predetermined object estimated to be represented by the character string. When converting to information, if an extra word (unnecessary word) added to a character string that has been converted to identification information in the past is stored and used to convert a new character string, the character string The present invention has been made on the assumption that it is possible to improve the probability of appropriate automatic conversion to identification information.

上記に基づき請求項1記載の発明に係る情報変換装置は、所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表していると推定される前記所定の対象に付与された識別情報へ変換する情報変換装置であって、識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書を記憶する第1記憶手段と、過去に入力された、特定の対象を表し、かつ特定の対象に付与された識別情報と対応付けられて前記名称辞書に登録されている単語の組合わせに対して単一又は複数の特定単語を付加した単語の組合わせで構成された文字列における前記単一又は複数の特定単語が、前記特定の対象に付与された識別情報と対応付けられ、前記特定の対象の不要単語として登録された不要単語辞書を記憶する第2記憶手段と、入力された文字列を構成する単語の組合わせを前記名称辞書に登録されている単語の組合わせと各々比較することで、構成する各単語が前記入力された文字列中に各々存在している単語の組合わせを検索する検索手段と、前記検索手段による検索結果に基づいて、前記入力された文字列が表していると推定される対象を判断し、前記入力された文字列を前記判断した対象に付与された識別情報へ変換すると共に、前記検索手段による検索によって抽出された単語の組合わせの中に、前記入力された文字列を構成する複数の単語から単一又は複数の第1特定単語を除外した単語の組合わせと、前記入力された文字列を構成する複数の単語から単一又は複数の第2特定単語を除外した単語の組合わせが各々含まれていた場合に、前記第1特定単語を除外した単語の組合わせと対応付けられて前記名称辞書に登録されている第1の識別情報が、前記単一又は複数の第1特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索すると共に、前記第2特定単語を除外した単語の組合わせと対応付けられて前記名称辞書に登録されている第2の識別情報が、前記単一又は複数の第2特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索し、前記第1及び第2の識別情報の一方のみが前記単一又は複数の第1特定単語の少なくとも1つ、又は前記単一又は複数の第2特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されていた場合に、前記入力された文字列が、前記第1及び第2の識別情報のうち前記不要単語辞書に登録されている識別情報に対応する対象を表していると判断する変換手段と、を備えたことを特徴としている。   Based on the above, the information conversion apparatus according to the first aspect of the present invention provides an input character string each time a character string configured by combining a plurality of words to represent a predetermined object is input. An information conversion apparatus for converting into identification information given to the predetermined object presumed to be represented by the inputted character string, and for each object to which identification information is given, A first storage means for storing a name dictionary registered by associating a combination of words constituting a character string representing each identification object and a character string representing each object, and a specific object inputted in the past And a combination of words obtained by adding a single or a plurality of specific words to a combination of words registered in the name dictionary in association with identification information given to a specific object Said single or multiple in the string A second storage means for storing an unnecessary word dictionary registered as an unnecessary word of the specific target in association with identification information given to the specific target, and an input character string The combination of words to be searched is compared with the combination of words registered in the name dictionary, thereby searching for a combination of words in which each constituting word is present in the input character string. Based on a search means and a search result obtained by the search means, a target estimated to be represented by the input character string is determined, and the identification information given to the determined target is determined based on the input character string And a combination of words in which a single or plural first specific words are excluded from a plurality of words constituting the inputted character string in a combination of words extracted by a search by the search means And a word excluding the first specific word when a combination of words excluding a single or plural second specific words from a plurality of words constituting the input character string is included. Whether the first identification information registered in the name dictionary in association with the combination is registered in the unnecessary word dictionary in association with at least one of the single or plural first specific words. The second identification information registered in the name dictionary in association with a combination of words excluding the second specific word is searched for the single or plural second specific words. It is searched whether or not it is associated with at least one and registered in the unnecessary word dictionary, and only one of the first and second identification information is at least one of the single or plural first specific words, Or the single or plural When the unnecessary character dictionary is associated with at least one second specific word and registered in the unnecessary word dictionary, the input character string is registered in the unnecessary word dictionary out of the first and second identification information. Conversion means for determining that the object corresponding to the identification information is represented.

請求項1記載の発明に係る情報変換装置は、所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、入力された文字列を、入力された文字列が表していると推定される所定の対象に付与された識別情報へ変換する。上記の文字列としては、例えば金融機関の間で送受される電文に設定される顧客の名称を表す文字列が好適であるが、これに限られるものではなく、所定の対象を表すために複数の単語が組合わされて構成された文字列であればよい。請求項1記載の発明では、識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書が第1記憶手段に記憶されている。また、検索手段は、入力された文字列を構成する単語の組合わせを名称辞書に登録されている単語の組合わせと各々比較することで、構成する各単語が入力された文字列中に各々存在している単語の組合わせを検索し、変換手段は、検索手段による検索結果に基づいて、入力された文字列が表していると推定される対象を判断し、入力された文字列を判断した対象に付与された識別情報へ変換する。   The information conversion device according to the first aspect of the present invention provides an input character string that is input to a character string that is formed by combining a plurality of words to represent a predetermined object. It converts into the identification information given to the predetermined object estimated that the column represents. As the above character string, for example, a character string representing the name of a customer set in a message sent and received between financial institutions is suitable, but is not limited to this, and a plurality of characters are represented to represent a predetermined target. The character string may be a combination of words. In the invention described in claim 1, each individual object to which identification information is assigned is associated with a combination of identification information given to the individual object and a word constituting a character string representing the individual object. The registered name dictionary is stored in the first storage means. In addition, the search means compares each combination of words constituting the input character string with each combination of words registered in the name dictionary, so that each of the constituent words is included in the input character string. Search for a combination of existing words, and the conversion means determines an object that is assumed to be represented by the input character string based on the search result by the search means, and determines the input character string. It is converted into the identification information given to the target.

ここで、請求項1記載の発明では、過去に入力された、特定の対象を表し、かつ特定の対象に付与された識別情報と対応付けられて名称辞書に登録されている単語の組合わせに対して単一又は複数の特定単語を付加した単語の組合わせで構成された文字列における前記単一又は複数の特定単語が、特定の対象に付与された識別情報と対応付けられ、特定の対象の不要単語として登録された不要単語辞書が第2記憶手段に記憶されている。また変換手段は、検索手段による検索によって抽出された単語の組合わせの中に、入力された文字列を構成する複数の単語から単一又は複数の第1特定単語を除外した単語の組合わせと、入力された文字列を構成する複数の単語から単一又は複数の第2特定単語を除外した単語の組合わせが各々含まれていた場合に、第1特定単語を除外した単語の組合わせと対応付けられて名称辞書に登録されている第1の識別情報が、単一又は複数の第1特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索すると共に、第2特定単語を除外した単語の組合わせと対応付けられて名称辞書に登録されている第2の識別情報が、単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索する。そして変換手段は、第1及び第2の識別情報の一方のみが単一又は複数の第1特定単語の少なくとも1つ、又は単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されていた場合に、入力された文字列が、第1及び第2の識別情報のうち不要単語辞書に登録されている識別情報に対応する対象を表していると判断する。   In the first aspect of the present invention, a combination of words registered in the name dictionary associated with the identification information given in the past and representing the specific target and associated with the specific target is registered. On the other hand, the single or plural specific words in the character string composed of a combination of words to which the single or plural specific words are added are associated with the identification information given to the specific target, and the specific target An unnecessary word dictionary registered as an unnecessary word is stored in the second storage means. In addition, the conversion unit includes a combination of words obtained by excluding a single or a plurality of first specific words from a plurality of words constituting the input character string in a combination of words extracted by the search by the search unit. A combination of words excluding the first specific word when a combination of words excluding the single or plural second specific words from the plurality of words constituting the input character string is included. While searching whether or not the first identification information associated and registered in the name dictionary is associated with at least one of the single or plural first specific words and registered in the unnecessary word dictionary, The second identification information registered in the name dictionary in association with the combination of words excluding the second specific word is associated with at least one of the single or plural second specific words, and the unnecessary word dictionary Registered in Search whether or not. The conversion means is unnecessary because only one of the first and second identification information is associated with at least one of the single or plural first specific words, or at least one of the single or plural second specific words. If it is registered in the word dictionary, it is determined that the input character string represents a target corresponding to the identification information registered in the unnecessary word dictionary among the first and second identification information.

このように、請求項1記載の発明では、特定の対象の不要単語として不要単語辞書に登録されている単語が、入力された文字列が特定の対象を表しているか否かの判断に用いられ、例えば入力文字列「HAYASHI ELECTRIC CO.,LTD SHINZYUKU」に対して、検索手段による検索によって名称辞書から単語の組合わせ(文字列)「HAYASHI ELECTRIC CO.,LTD」と「SHINZYUKU ELECTRIC CO.,LTD」が各々抽出された場合にも、特定単語「SHINZYUKU」が単語の組合わせ「HAYASHI ELECTRIC CO.,LTD」に対応する対象の不要単語として不要単語辞書に登録されており、特定単語「HAYASHI」が単語の組合わせ「SHINZYUKU ELECTRIC CO.,LTD」に対応する対象の不要単語として不要単語辞書に登録されていなければ、入力文字列が単語の組合わせ「HAYASHI ELECTRIC CO.,LTD」に対応する対象を表していると自動的に判断され、対応する識別情報へ自動的に変換されることになる。従って、請求項1記載の発明によれば、所定の対象を表すために複数の単語が組合わされて構成された文字列を、該文字列が表していると推定される所定の対象に付与された識別情報へ変換することを、オペレータの手を煩わすことなく自動的に行える確率を向上させることができる。   As described above, in the invention described in claim 1, a word registered in the unnecessary word dictionary as an unnecessary word for a specific target is used for determining whether or not the input character string represents a specific target. For example, for the input character string “HAYASHI ELECTRIC CO., LTD SHINZYUKU”, a combination of words from the name dictionary (character string) “HAYASHI ELECTRIC CO., LTD” and “SHINZYUKU ELECTRIC CO., LTD” by searching by the search means ”Is extracted, the specific word“ SHINZYUKU ”is registered in the unnecessary word dictionary as the target unnecessary word corresponding to the word combination“ HAYASHI ELECTRIC CO., LTD ”, and the specific word“ HAYASHI ” Is not registered in the unnecessary word dictionary as an unnecessary word corresponding to the word combination “SHINZYUKU ELECTRIC CO., LTD”, the input string corresponds to the word combination “HAYASHI ELECTRIC CO., LTD”. Automatically determines that the object is represented It is, will be automatically converted to the corresponding identification information. Therefore, according to the first aspect of the present invention, a character string formed by combining a plurality of words to represent a predetermined object is given to the predetermined object estimated to be represented by the character string. It is possible to improve the probability that conversion to identification information can be automatically performed without bothering the operator.

なお、請求項1記載の発明において、第1の識別情報が単一又は複数の第1特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索すると共に、第2の識別情報が単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索した結果、第1及び第2の識別情報が単一又は複数の第1特定単語の少なくとも1つ、又は単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に各々登録されていた場合も考えられる。このような場合を考慮すると、請求項1記載の発明において、変換手段を、例えば請求項2に記載したように、第1及び第2識別情報のうち、第1特定単語又は第2特定単語に含まれている単語の中で、第1及び第2識別情報と各々対応付けられて不要単語辞書に登録されている単語(すなわち第1識別情報の不要単語及び第2識別情報の不要単語として不要単語辞書に重複登録されている単語)以外の単語(すなわち入力文字列に含まれており、かつ第1識別情報及び第2識別情報の何れか一方の不要単語として不要単語辞書に登録されている単語)と対応付けられている識別情報を判定し、入力された文字列が判定した識別情報に対応する対象を表していると判断するように構成することが好ましい。   In the first aspect of the invention, whether or not the first identification information is registered in the unnecessary word dictionary in association with at least one of the first specific word or the plurality of first specific words is searched. As a result of searching whether or not the identification information is associated with at least one of the single or plural second specific words and registered in the unnecessary word dictionary, the first and second identification information is single or plural There may be a case in which at least one of the first specific words or at least one of the single or plural second specific words is registered in the unnecessary word dictionary. In consideration of such a case, in the invention according to claim 1, the conversion means may convert the first specific word or the second specific word out of the first and second identification information as described in claim 2, for example. Among the included words, words that are associated with the first and second identification information and registered in the unnecessary word dictionary (that is, unnecessary as unnecessary words in the first identification information and unnecessary identification words in the second identification information) A word other than a word other than a word registered in the word dictionary (that is, it is included in the input character string and is registered in the unnecessary word dictionary as an unnecessary word of either the first identification information or the second identification information) It is preferable that the identification information associated with the word) is determined and it is determined that the input character string represents an object corresponding to the determined identification information.

請求項2記載の発明では、第1及び第2の識別情報が単一又は複数の第1特定単語の少なくとも1つ、又は単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に各々登録されていた場合に、第1特定単語又は第2特定単語として入力文字列に含まれており、第1識別情報及び第2識別情報の何れか一方の不要単語として不要単語辞書に登録されている単語に基づいて、入力文字列が表している対象を判断するので、入力文字列が表していると推定されるより確からしい対象を自動的に判断することができ、入力文字列を識別情報へ変換することをオペレータの手を煩わすことなく自動的に行える確率を更に向上させることができる。   In the invention described in claim 2, the first and second identification information is unnecessary to be associated with at least one of the single or plural first specific words or at least one of the single or plural second specific words. When it is registered in the word dictionary, it is included in the input character string as the first specific word or the second specific word, and is an unnecessary word dictionary as an unnecessary word of either the first identification information or the second identification information. Since the target represented by the input character string is determined based on the words registered in, it is possible to automatically determine the more probable target that the input character string is supposed to represent. It is possible to further improve the probability of automatically converting a column into identification information without bothering the operator.

また、請求項1記載の発明において、変換手段は、例えば請求項3に記載したように、第1の識別情報が単一又は複数の第1特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索すると共に、第2の識別情報が単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索した結果、第1及び第2の識別情報が単一又は複数の第1特定単語の少なくとも1つ、又は単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に各々登録されていた場合に、第1及び第2識別情報のうち、第1特定単語又は第2特定単語として入力文字列に含まれており、より多数の単語と対応付けられて不要単語辞書に登録されている識別情報を判定し、入力された文字列が判定した識別情報に対応する対象を表していると判断するように構成してもよい。   Further, in the invention according to claim 1, the conversion means, as described in claim 3, for example, includes the unnecessary word dictionary in which the first identification information is associated with at least one of the single or plural first specific words. As a result of searching whether or not the second identification information is registered in the unnecessary word dictionary in association with at least one of the single or plural second specific words, The first and second identification information is registered in the unnecessary word dictionary in association with at least one of the single or plural first specific words, or at least one of the single or plural second specific words. In this case, among the first and second identification information, the identification is included in the input character string as the first specific word or the second specific word and is registered in the unnecessary word dictionary in association with a larger number of words. Determine and enter information May be configured to string is judged to represent the object corresponding to the determined identification information.

請求項3記載の発明では、第1及び第2の識別情報が単一又は複数の第1特定単語の少なくとも1つ、又は単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に各々登録されていた場合に、第1特定単語又は第2特定単語として入力文字列に含まれている単語のうち不要単語辞書に不要単語として登録されている単語の数に基づいて、入力文字列が表している対象を判断するので、入力文字列が表していると推定されるより確からしい対象を自動的に判断することができ、請求項2記載の発明と同様に、入力文字列を識別情報へ変換することをオペレータの手を煩わすことなく自動的に行える確率を更に向上させることができる。   In the invention of claim 3, the first and second identification information is not required because it is associated with at least one of the single or plural first specific words or at least one of the single or plural second specific words. Based on the number of words registered as unnecessary words in the unnecessary word dictionary among the words included in the input character string as the first specific word or the second specific word when registered in the word dictionary, Since the target represented by the input character string is determined, it is possible to automatically determine a more probable target that is estimated to be represented by the input character string. It is possible to further improve the probability of automatically converting a column into identification information without bothering the operator.

また、請求項1記載の発明において、例えば請求項4に記載したように、第2記憶手段に記憶されている不要単語辞書には、過去に入力された文字列において、前記文字列が表す特定の対象の不要単語の出現頻度を表す頻度情報が、不要単語辞書に登録されている個々の不要単語について各々登録されており、変換手段は、検索手段による検索結果に基づいて、入力された文字列が表していると推定される対象を判断する毎に、入力された文字列に該文字列が表す特定の対象の不要単語が含まれているか否かに基づいて、不要単語辞書に登録されている特定の対象の不要単語の頻度情報を更新すると共に、検索手段による検索によって抽出された単語の組合わせの中に、入力された文字列を構成する複数の単語から単一又は複数の第1特定単語を除外した単語の組合わせと、入力された文字列を構成する複数の単語から単一又は複数の第2特定単語を除外した単語の組合わせが各々含まれており、第1の識別情報が単一又は複数の第1特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索すると共に、第2の識別情報が単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索した結果、第1及び第2の識別情報が単一又は複数の第1特定単語の少なくとも1つ、又は単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に各々登録されていた場合に、第1特定単語又は第2特定単語として入力文字列に含まれており、かつ第1及び第2識別情報と各々対応付けられて不要単語辞書に登録されている個々の不要単語の頻度情報に基づいて、入力された文字列が表している対象を判断するようにしてもよい。   In the invention described in claim 1, for example, as described in claim 4, in the unnecessary word dictionary stored in the second storage unit, the character string represented in the character string input in the past is specified. Frequency information indicating the appearance frequency of the unnecessary word of the target is registered for each unnecessary word registered in the unnecessary word dictionary, and the conversion means inputs the input characters based on the search result by the search means Each time an object that is estimated to be represented by a column is determined, the input character string is registered in the unnecessary word dictionary based on whether or not the input character string includes a specific target unnecessary word represented by the character string. Update the frequency information of unnecessary words of a specific target, and, among the combinations of words extracted by the search by the search means, single or multiple first words from a plurality of words constituting the input character string 1 specific unit And a combination of words excluding single or plural second specific words from a plurality of words constituting the input character string, and the first identification information is It is searched whether or not it is associated with at least one of the single or plural first specific words and registered in the unnecessary word dictionary, and the second identification information is at least one of the single or plural second specific words. As a result of searching whether or not it is registered in the unnecessary word dictionary in association with one, the first and second identification information is at least one of a single or a plurality of first specific words, or a single or a plurality of first When it is associated with at least one of the two specific words and registered in the unnecessary word dictionary, it is included in the input character string as the first specific word or the second specific word, and the first and second identification information Are associated with each Based on the individual frequency information of unnecessary words registered in the word dictionary, it may be determined on the object where the input character string represents.

請求項4記載の発明では、第1及び第2の識別情報が単一又は複数の第1特定単語の少なくとも1つ、又は単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に各々登録されていた場合に、第1特定単語又は第2特定単語として入力文字列に含まれており、かつ第1及び第2識別情報と各々対応付けられて不要単語辞書に登録されている個々の不要単語の出現頻度に基づいて、入力文字列が表している対象を判断するので、入力文字列が表していると推定されるより確からしい対象を自動的に判断することができ、請求項2及び請求項3記載の発明と同様に、入力文字列を識別情報へ変換することをオペレータの手を煩わすことなく自動的に行える確率を更に向上させることができる。   In the invention of claim 4, the first and second identification information is unnecessary to be associated with at least one of the single or plural first specific words, or at least one of the single or plural second specific words. If it is registered in the word dictionary, it is included in the input character string as the first specific word or the second specific word, and is registered in the unnecessary word dictionary in association with the first and second identification information. Since the target represented by the input character string is determined based on the appearance frequency of each unnecessary word, it is possible to automatically determine a more probable target that the input character string is supposed to represent. As in the inventions of claims 2 and 3, it is possible to further improve the probability that the input character string can be automatically converted into the identification information without bothering the operator.

なお、請求項1記載の発明において、第1の識別情報が単一又は複数の第1特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索すると共に、第2の識別情報が単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索した結果、第1及び第2の識別情報が何れも第1特定単語又は第2特定単語と対応付けられて不要単語辞書に登録されていなかった場合、変換手段は、例えば請求項5に記載したように、入力された文字列を表示装置に表示させることで、入力された文字列が表す対象の判断をオペレータに委ね、オペレータにより入力装置を介して入力された判断結果に基づいて、入力された文字列が表す対象を判断するように構成することができる。   In the first aspect of the invention, whether or not the first identification information is registered in the unnecessary word dictionary in association with at least one of the first specific word or the plurality of first specific words is searched. As a result of searching whether the identification information is associated with at least one of the single or plural second specific words and registered in the unnecessary word dictionary, both the first and second identification information are the first specific If the word or the second specific word is not registered in the unnecessary word dictionary, the conversion unit displays the input character string on the display device as described in claim 5, for example. It can be configured such that the determination of the object represented by the input character string is left to the operator, and the object represented by the input character string is determined based on the determination result input by the operator via the input device.

また、請求項1記載の発明において、例えば請求項6に記載したように、検索手段による検索によって抽出された単語の組合わせの中に、入力された文字列を構成する複数の単語から単一又は複数の特定単語を除外した単語の組合わせが含まれており、かつ変換手段により、入力された文字列が、特定単語を除外した単語の組合わせに対応する特定の対象を表していると判断された場合に、特定単語を特定の対象に付与された識別情報と対応付け、不要単語辞書に特定の対象の不要単語として登録する不要単語登録手段を設けることが好ましい。これにより、不要単語辞書への不要単語の登録が不要単語登録手段によって自動的に行われることになり、不要単語の登録等の煩雑な作業をオペレータが行う必要がなくなる。   Further, in the invention described in claim 1, for example, as described in claim 6, a single combination of a plurality of words constituting an input character string is included in a combination of words extracted by a search by a search means. Or a combination of words excluding a plurality of specific words is included, and the character string input by the conversion means represents a specific object corresponding to the combination of words excluding the specific words When it is determined, it is preferable to provide an unnecessary word registering unit that associates the specific word with the identification information given to the specific target and registers the specific word as an unnecessary word of the specific target in the unnecessary word dictionary. Thereby, unnecessary words are automatically registered in the unnecessary word dictionary by the unnecessary word registering means, and the operator does not need to perform complicated operations such as unnecessary word registration.

また、請求項1乃至請求項6の何れかに記載の発明において、例えば請求項7に記載したように、入力される文字列を構成する個々の単語に相当する文字列と個々の単語に付与された論理インデックスが対応付られけて予め各々登録された基本語辞書を記憶する第3記憶手段と、入力された文字列を構成する個々の単語に相当する文字列をキーにして前記基本語辞書の検索を各々行うことで、入力された文字列を、該文字列を構成する個々の単語を単位として論理インデックスへ変換する単語変換手段と、を更に設け、名称辞書には単語の組合わせとして論理インデックスの組合わせを登録しておき、不要単語辞書には不要単語として論理インデックスを登録しておき、検索手段及び変換手段は、入力された文字列として、入力された文字列が単語変換手段によって単語単位で変換されることで得られる論理インデックスの組合わせを用いて各処理を行うように構成することが好ましい。   Further, in the invention according to any one of claims 1 to 6, for example, as described in claim 7, character strings corresponding to individual words constituting the input character string and given to individual words A third storage means for storing a basic word dictionary registered in advance with a corresponding logical index, and the basic word using character strings corresponding to individual words constituting the input character string as a key. A word conversion means for converting the input character string into a logical index in units of individual words constituting the character string by performing a dictionary search, and the name dictionary includes a combination of words The logical index combination is registered as an unnecessary word dictionary, and the logical index is registered as an unnecessary word in the unnecessary word dictionary, and the search means and the conversion means are input character strings as input character strings. It is preferably configured to perform the processing by using a combination of logical indexes obtained by being converted word by word by word conversion means.

一般に文字列を表すテキストデータは情報量に比してデータ量が多く(例えば1文字を2バイトのデータで表現する文字コードを用いて表したテキストデータは文字数×2バイトのデータ量となる)、文字列をテキストデータのまま処理した場合、本発明に係る情報変換装置に加わる負荷の増大や処理遅延を招くと共に、名称辞書や不要単語辞書を記憶するために必要な記憶容量も増大する。これに対して請求項7記載の発明では、入力される文字列を構成する個々の単語に相当する文字列と個々の単語に付与された論理インデックス(単語コード情報)が対応付られけて予め各々登録された基本語辞書を第3記憶手段に記憶しておき、単語変換手段は、入力された文字列を構成する個々の単語に相当する文字列をキーにして基本語辞書の検索を各々行うことで、入力された文字列を、該文字列を構成する個々の単語を単位として論理インデックスへ変換するので、入力された文字列(変換対象の文字列)のデータ量を小さくすることができる。また、名称辞書に単語の組合わせとして論理インデックスの組合わせを登録しておき、不要単語辞書に不要単語として論理インデックスを登録しておくことで、これらの辞書を記憶するために必要な記憶容量も小さくすることができる。そして、検索手段及び変換手段が、入力された文字列として、入力された文字列が単語変換手段によって単語単位で変換されることで得られる論理インデックスの組合わせを用いて各処理を行うことにより、本発明に係る情報変換装置に加わる負荷の軽減・処理の高速化を実現することができる。   In general, text data representing a character string has a larger amount of data than the amount of information (for example, text data represented using a character code that represents one character as data of 2 bytes is the number of characters × 2 bytes of data). If the character string is processed as text data, the load applied to the information conversion apparatus according to the present invention and the processing delay are increased, and the storage capacity necessary for storing the name dictionary and the unnecessary word dictionary also increases. On the other hand, in the invention according to claim 7, the character strings corresponding to the individual words constituting the input character string and the logical index (word code information) assigned to the individual words are associated with each other in advance. Each registered basic word dictionary is stored in the third storage means, and the word conversion means searches the basic word dictionary by using the character strings corresponding to the individual words constituting the input character strings as keys. By doing so, the input character string is converted into a logical index in units of individual words constituting the character string, so that the data amount of the input character string (character string to be converted) can be reduced. it can. Also, by registering a combination of logical indexes as a combination of words in the name dictionary and registering a logical index as an unnecessary word in the unnecessary word dictionary, a storage capacity necessary for storing these dictionaries Can also be reduced. Then, the search means and the conversion means perform each process using a combination of logical indexes obtained by converting the input character string in word units by the word conversion means as the input character string. The load applied to the information conversion apparatus according to the present invention can be reduced and the processing speed can be increased.

請求項8記載の発明に係る情報変換プログラムは、コンピュータを、所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表していると推定される前記所定の対象に付与された識別情報へ変換する情報変換装置として機能させるための情報変換プログラムであって、前記コンピュータは、識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書を記憶する第1記憶手段と、過去に入力された、特定の対象を表し、かつ特定の対象に付与された識別情報と対応付けられて前記名称辞書に登録されている単語の組合わせに対して単一又は複数の特定単語を付加した単語の組合わせで構成された文字列における前記単一又は複数の特定単語が、前記特定の対象に付与された識別情報と対応付けられ、前記特定の対象の不要単語として登録された不要単語辞書を記憶する第2記憶手段と、を備え、前記コンピュータを、入力された文字列を構成する単語の組合わせを前記名称辞書に登録されている単語の組合わせと各々比較することで、構成する各単語が前記入力された文字列中に各々存在している単語の組合わせを検索する検索手段、及び、前記検索手段による検索結果に基づいて、前記入力された文字列が表していると推定される対象を判断し、前記入力された文字列を前記判断した対象に付与された識別情報へ変換すると共に、前記検索手段による検索によって抽出された単語の組合わせの中に、前記入力された文字列を構成する複数の単語から単一又は複数の特定単語を除外した単語の組合わせが含まれていた場合に、前記単一又は複数の特定単語を除外した単語の組合わせと対応付けられて前記名称辞書に登録されている特定の識別情報が、前記単一又は複数の特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索し、前記特定の識別情報が前記単一又は複数の特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されていた場合に、前記入力された文字列が、前記特定の識別情報が付与された対象を表していると判断する変換手段として機能させることを特徴としている。   The information conversion program according to the invention described in claim 8 is an information conversion program, wherein each time a character string composed of a plurality of words combined to represent a predetermined object is input, the input character string is An information conversion program for causing a computer to function as an information conversion device for converting into identification information assigned to the predetermined object presumed to be represented by the input character string, wherein the computer is provided with identification information. A first storage means for storing each registered name dictionary in association with identification information given to each object and a combination of words constituting a character string representing each object And a single or a plurality of special features for a combination of words registered in the name dictionary associated with identification information given in the past and representing a specific target and assigned to the specific target. The single or plural specific words in the character string composed of a combination of words with added words are associated with the identification information given to the specific target and registered as unnecessary words of the specific target Second storage means for storing an unnecessary word dictionary, and the computer compares each combination of words constituting the input character string with each combination of words registered in the name dictionary. And a search means for searching for a combination of words in which each of the constituent words is present in the input character string, and the input character string is represented based on a search result by the search means. A combination of words extracted by a search by the search means, and converting the input character string into identification information given to the determined object If a combination of words excluding a single or a plurality of specific words from a plurality of words constituting the input character string is included, the single or a plurality of specific words are excluded. Whether or not the specific identification information registered in the name dictionary in association with the combination of the registered words is registered in the unnecessary word dictionary in association with at least one of the single or plural specific words When the specific identification information is associated with at least one of the single or plural specific words and registered in the unnecessary word dictionary, the input character string is It is characterized by functioning as a conversion means for judging that it represents an object to which identification information is given.

請求項8記載の発明に係る情報変換プログラムは、上記の第1記憶手段及び第2記憶手段を備えたコンピュータを、上記の検索手段及び変換手段として機能させるためのプログラムであるので、上記コンピュータが請求項8記載の発明に係る情報変換プログラムを実行することにより、上記コンピュータが請求項1に記載の情報変換装置として機能することになり、請求項1記載の発明と同様に、所定の対象を表すために複数の単語が組合わされて構成された文字列を、該文字列が表していると推定される所定の対象に付与された識別情報へ変換することを、オペレータの手を煩わすことなく自動的に行える確率を向上させることができる。   An information conversion program according to an eighth aspect of the invention is a program for causing a computer including the first storage unit and the second storage unit to function as the search unit and the conversion unit. By executing the information conversion program according to the eighth aspect of the invention, the computer functions as the information conversion apparatus according to the first aspect. Converting a character string formed by combining a plurality of words to represent into identification information given to a predetermined object presumed to be represented by the character string, without bothering the operator The probability of being automatically performed can be improved.

以上説明したように本発明は、識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせを対応付けて名称辞書に各々登録しておくと共に、過去に入力された、特定の対象を表し、かつ特定の対象に付与された識別情報と対応付けられて名称辞書に登録されている単語の組合わせに対して単一又は複数の特定単語を付加した単語の組合わせで構成された文字列における単一又は複数の特定単語を、特定の対象に付与された識別情報と対応付け特定の対象の不要単語として不要単語辞書に登録しておき、入力された文字列を構成する単語の組合わせを名称辞書に登録されている単語の組合わせと各々比較することで、構成する各単語が入力された文字列中に各々存在している単語の組合わせを検索し、検索によって抽出された単語の組合わせの中に、入力された文字列を構成する複数の単語から単一又は複数の第1特定単語を除外した単語の組合わせと、入力された文字列を構成する複数の単語から単一又は複数の第2特定単語を除外した単語の組合わせが各々含まれていた場合に、第1特定単語を除外した単語の組合わせと対応付けられて名称辞書に登録されている第1の識別情報が、単一又は複数の第1特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索すると共に、第2特定単語を除外した単語の組合わせと対応付けられて名称辞書に登録されている第2の識別情報が、単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されているか否かを検索し、第1及び第2の識別情報の一方のみが単一又は複数の第1特定単語の少なくとも1つ、又は単一又は複数の第2特定単語の少なくとも1つと対応付けられて不要単語辞書に登録されていた場合に、入力された文字列が、第1及び第2の識別情報のうち不要単語辞書に登録されている識別情報に対応する対象を表していると判断するようにしたので、所定の対象を表すために複数の単語が組合わされて構成された文字列を、該文字列が表していると推定される所定の対象に付与された識別情報へ変換することを、オペレータの手を煩わすことなく自動的に行える確率を向上させることができる、という優れた効果を有する。   As described above, according to the present invention, for each object to which identification information is assigned, a combination of identification information given to each object and a combination of words constituting a character string representing each object is associated with a name dictionary. Each of the combinations of words registered in the name dictionary associated with the identification information given in the past and representing the specific target and associated with the specific target. One or more specific words in a character string composed of a combination of words to which one or more specific words are added are associated with identification information given to a specific target, and unnecessary words are used as unnecessary words of a specific target By registering in the dictionary and comparing each combination of words constituting the input character string with each combination of words registered in the name dictionary, each of the constituent words is included in the input character string. Each present A combination of words obtained by excluding a single or a plurality of first specific words from a plurality of words constituting an input character string in a combination of words extracted by the search. And a combination of words excluding the first specific word when a combination of words excluding a single or plural second specific words from a plurality of words constituting the input character string is included. And searching whether or not the first identification information registered in the name dictionary and associated with is registered in the unnecessary word dictionary in association with at least one of the single or plural first specific words. The second identification information registered in the name dictionary in association with the combination of words excluding the second specific word is associated with at least one of the single or plural second specific words and is an unnecessary word Registered in the dictionary Whether or not only one of the first and second identification information is associated with at least one of the single or plural first specific words, or at least one of the single or plural second specific words If it is registered in the unnecessary word dictionary, it is determined that the input character string represents a target corresponding to the identification information registered in the unnecessary word dictionary among the first and second identification information. Therefore, converting a character string formed by combining a plurality of words to represent a predetermined object into identification information given to the predetermined object estimated to be represented by the character string. In addition, it has an excellent effect that it is possible to improve the probability of being automatically performed without bothering the operator.

以下、図面を参照して本発明の実施形態の一例を詳細に説明する。図1には本実施形態に係るコンピュータ・システム10が示されている。コンピュータ・システム10は、特定金融機関の情報センタ等に設置されたコンピュータ12を含んで構成されている。コンピュータ12はメインフレーム・コンピュータから成り、CPU12A、ROM12B、RAM12C、入出力ポート12Dを備え、これらはアドレスバス、データバス、制御バス等のバス12Eを介して互いに接続されている。入出力ポート12Dには、各種の入出力機器として、通信制御装置14、ディスプレイ16、マウス18、キーボード20、HDD(ハードディスクドライブ)22が各々接続されている。   Hereinafter, an example of an embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 shows a computer system 10 according to the present embodiment. The computer system 10 includes a computer 12 installed in an information center of a specific financial institution. The computer 12 is composed of a mainframe computer and includes a CPU 12A, a ROM 12B, a RAM 12C, and an input / output port 12D, which are connected to each other via a bus 12E such as an address bus, a data bus, and a control bus. A communication control device 14, a display 16, a mouse 18, a keyboard 20, and an HDD (hard disk drive) 22 are connected to the input / output port 12D as various input / output devices.

HDD22には基本語辞書、名称辞書及び不要単語辞書(詳細は後述)が各々記憶されており、HDD22は本発明に係る第1記憶手段及び第2記憶手段に対応しており、請求項7に記載の第3記憶手段にも対応している。またコンピュータ12には、後述する顧客コード変換処理を行うための顧客コード変換プログラムがHDD22に予めインストールされている。この顧客コード変換プログラムは請求項8に記載の情報変換プログラムに対応しており、コンピュータ12のCPU12Aが上記各プログラムを実行することで、コンピュータ12は本発明に係る情報変換装置として機能する。なお、本発明に係る情報変換装置として機能するコンピュータはメインフレーム・コンピュータに限られるものではなく、例えばパーソナル・コンピュータやマイクロプロセッサ等、任意のコンピュータを適用可能である。   The HDD 22 stores a basic word dictionary, a name dictionary, and an unnecessary word dictionary (details will be described later), and the HDD 22 corresponds to the first storage means and the second storage means according to the present invention. This also corresponds to the third storage means described. Further, in the computer 12, a customer code conversion program for performing a customer code conversion process described later is installed in the HDD 22 in advance. This customer code conversion program corresponds to the information conversion program according to the eighth aspect, and the computer 12 functions as an information conversion apparatus according to the present invention by the CPU 12A of the computer 12 executing the above programs. The computer functioning as the information conversion apparatus according to the present invention is not limited to the mainframe computer, and any computer such as a personal computer or a microprocessor can be applied.

また、コンピュータ12の通信制御装置14は、特定の金融機関内に構築されたコンピュータ・ネットワーク26に接続されている。コンピュータ・ネットワーク26は多数台のコンピュータが通信回線を介して互いに接続されて構成されている。また、コンピュータ・ネットワーク26を構成する多数台のコンピュータの中には、コンピュータ12から指示された金融取引(例えば指示された口座への入金処理等)を行うためのコンピュータが含まれている。また、コンピュータ12の通信制御装置14は、ネットワーク28(銀行間のメッセージ交換のための国際間ネットワーク)を介して、海外の他の金融機関のコンピュータ30と接続されている。なお、以下ではコンピュータ12が設置された特定金融機関を第1の金融機関、コンピュータ30が設置された金融機関を第2の金融機関と称して区別する。   The communication control device 14 of the computer 12 is connected to a computer network 26 built in a specific financial institution. The computer network 26 is configured by connecting a large number of computers to each other via a communication line. In addition, among a large number of computers constituting the computer network 26, there are included computers for performing financial transactions instructed from the computer 12 (for example, depositing into an instructed account). Further, the communication control device 14 of the computer 12 is connected to a computer 30 of another overseas financial institution via a network 28 (international network for message exchange between banks). Hereinafter, the specific financial institution in which the computer 12 is installed is referred to as a first financial institution, and the financial institution in which the computer 30 is installed is referred to as a second financial institution.

次に本実施形態の作用を説明する。金融機関へ外国送金を依頼する際には、送金依頼人により、送金先口座の金融機関名、支店名、口座名義人名、口座番号、送金金額等の情報が指定される。第2の金融機関では、第1の金融機関に開設されている特定口座への送金が送金依頼人から依頼されると、特定口座への入金を第1の金融機関へ依頼する電文を作成するが、この電文には送金依頼人によって指定された各情報が設定され、このうち送金先口座の名義人名等の情報は文字列(テキストデータ)として電文に設定される。第2の金融機関は電文の作成が完了すると、作成した電文をコンピュータ30によってネットワーク28経由で第1の金融機関のコンピュータ12へ送信する。第1の金融機関のコンピュータ12は、ネットワーク28経由で他の金融機関から電文を受信すると、受信した電文に設定されている送金先口座の名義人名(第1の金融機関の顧客の名称)を表す文字列のテキストデータを取り出し、取り出した文字列のテキストデータを、第1の金融機関が個々の顧客を識別するために個々の顧客に付与している顧客コード(識別情報)へ変換する処理(後述する顧客コード変換処理)を行う。コンピュータ12のHDD22に記憶されている基本語辞書、名称辞書及び不要単語辞書は、顧客コード変換処理を実現するために設けられている。   Next, the operation of this embodiment will be described. When requesting a foreign remittance to a financial institution, the remittance requester specifies information such as the name of the financial institution, branch name, account holder name, account number, and amount of remittance of the remittance destination account. In the second financial institution, when remittance is requested from the remittance requester to the specific account established in the first financial institution, a message is generated to request the first financial institution to deposit money in the specific account. However, each piece of information designated by the remittance requester is set in this electronic message, and information such as the name of the holder of the remittance destination account is set in the electronic message as a character string (text data). When the creation of the message is completed, the second financial institution transmits the created message to the computer 12 of the first financial institution via the network 28 by the computer 30. When the computer 12 of the first financial institution receives a message from another financial institution via the network 28, the name of the name of the remittance destination account (name of the customer of the first financial institution) set in the received message. Processing for extracting text data of a character string to be represented and converting the text data of the extracted character string into a customer code (identification information) assigned to each customer by the first financial institution to identify each customer (Customer code conversion processing described later) is performed. The basic word dictionary, the name dictionary, and the unnecessary word dictionary stored in the HDD 22 of the computer 12 are provided to realize the customer code conversion process.

すなわち、顧客の名称を表す文字列は複数の単語が組合わされて構成されているが、第1の金融機関では、個々の顧客の名称を表す文字列を構成する個々の単語に複数桁の数値から成るコード情報(論理インデックスと称する)を予め各々付与しており、顧客コード変換処理では、受信した電文から取り出した顧客名称を表す変換対象の文字列を、該文字列を構成する各単語に対応する論理インデックスの組合わせ(論理インデックスセット)へ変換した後に処理する。このため、前述の基本語辞書には、例として図2(A)にも示すように、個々の単語を表すテキストデータと個々の単語に付与した論理インデックスに相当する数値データが対応付けられて各々登録されている(図2(A)では品詞、属性(名称)及び属性(コード)等の情報も個々の単語に付加されている)。また前述の名称辞書には、例として図2(B)にも示すように、個々の顧客の名称と、個々の顧客名称に対応する論理インデックスセットと、個々の顧客に付与した顧客コードが対応付けられて各々登録されている。   That is, the character string representing the customer name is formed by combining a plurality of words. However, in the first financial institution, a multi-digit numerical value is added to each word constituting the character string representing each customer name. In the customer code conversion process, a character string to be converted representing a customer name extracted from the received message is assigned to each word constituting the character string. Processing is performed after conversion to a combination (logical index set) of corresponding logical indexes. For this reason, as shown in FIG. 2A as an example, the basic word dictionary is associated with text data representing individual words and numerical data corresponding to the logical index assigned to each word. Each information is registered (in FIG. 2A, information such as part of speech, attribute (name) and attribute (code) is also added to each word). In addition, as shown in FIG. 2B as an example, the name dictionary described above corresponds to the names of individual customers, a logical index set corresponding to each customer name, and a customer code assigned to each customer. Each is attached and registered.

ところで、個々の顧客の名称の中には、第1の顧客の名称を表す文字列を構成する単語の組合わせに特定の単語を加えた組合わせが、第2の顧客の名称を表す文字列を構成する単語の組合わせに一致する関係(この関係を包摂関係という)を有する名称が存在している。例として図2(B)に示すように、顧客Bの名称を表す文字列「HAYASHI CO,.LTD」は「HAYASHI」と「CO,.LTD」の2個の単語から構成されている(図2(B)に示す論理インデックスを用いると、上記文字列の論理インデックスセットは「105,107」となる)が、この単語の組合わせに特定単語「ELECTRIC」を加えた単語の組合わせは、顧客Cの名称を表す文字列である「HAYASHI ELECTRIC CO,.LTD」(この文字列の論理インデックスセットは「105,106,107」となる)を構成する単語の組合わせに一致する。そして、変換対象の文字列が包摂関係を有する顧客名称に相当する文字列であった場合、変換対象の文字列が包摂関係を有する複数の顧客名称のうちの何れを表しているのかを一意に判断できないという問題がある。例えば変換対象の文字列が「HAYASHI CO,.LTD」であった場合、変換対象の文字列は上述した顧客Bの名称を表している可能性が高いものの、変換対象の文字列は顧客Cの名称を表す文字列「HAYASHI ELECTRIC CO,.LTD」における特定単語「ELECTRIC」(以下、この単語を包摂外単語という)が何らかの理由で欠落したものであり、変換対象の文字列が顧客Cの名称を表している、という可能性も否定できない。   By the way, among the names of the individual customers, a combination of a specific word added to a combination of words constituting the character string representing the name of the first customer is a character string representing the name of the second customer. There is a name having a relationship (this relationship is called an inclusion relationship) that matches the combination of the words that constitute. As an example, as shown in FIG. 2B, the character string “HAYASHI CO, .LTD” representing the name of the customer B is composed of two words “HAYASHI” and “CO, .LTD” (FIG. 2). If the logical index shown in FIG. 2 (B) is used, the logical index set of the above character string is “105,107”), but the combination of words obtained by adding the specific word “ELECTRIC” to this combination of words is the customer C Matches the combination of words constituting “HAYASHI ELECTRIC CO, .LTD” (the logical index set of this character string is “105,106,107”). When the character string to be converted is a character string corresponding to a customer name having an inclusion relationship, it uniquely identifies which of the plurality of customer names having an inclusion relationship the character string to be converted represents There is a problem that it cannot be judged. For example, if the character string to be converted is “HAYASHI CO, .LTD”, the character string to be converted is likely to represent the name of the customer B described above, but the character string to be converted is the customer C's name. The specific word “ELECTRIC” in the character string “HAYASHI ELECTRIC CO, .LTD” (hereinafter referred to as non-inclusive word) is missing for some reason, and the character string to be converted is the name of the customer C We cannot deny the possibility that it represents.

従って、顧客コード変換処理では、変換対象の文字列が包摂関係を有する名称を表している場合と包摂関係のない名称を表している場合とで異なる処理を行う必要がある。このため、名称辞書に登録されている各顧客の情報のうち、名称が包摂関係を有している顧客の情報には、例として図2(B)にも示すように、包摂関係を有していることを表す包摂コード(包摂識別情報)が付加されている。詳しくは、名称が包摂関係を有している複数の顧客(上述した第1の顧客及び第2の顧客)の情報には同一の包摂コードが付加されると共に、同一の包摂コードが付加された顧客のうち、名称に包摂外単語が加わっている顧客(第2の顧客)の包摂コードには、包摂外単語の論理インデックスも付加されている(図2(B)では、名称が「HAYASHI ELECTRIC CO,.LTD」である顧客Cの包摂コードに、包摂外単語「ELECTRIC」の論理インデックス「106」が付加されている例を示している)。   Therefore, in the customer code conversion process, it is necessary to perform different processing depending on whether the character string to be converted represents a name having an inclusion relationship or a name having an inclusion relationship. For this reason, out of the customer information registered in the name dictionary, the customer information whose name has an inclusion relationship has an inclusion relationship as shown in FIG. 2B as an example. An inclusion code (inclusion identification information) indicating that the Specifically, the same inclusion code is added to the information of a plurality of customers whose names have an inclusion relationship (the first customer and the second customer described above), and the same inclusion code is added. Among the customers, the logical index of the non-inclusive word is also added to the inclusion code of the customer (second customer) in which the non-inclusive word is added to the name (in FIG. 2B, the name is “HAYASHI ELECTRIC In this example, the logical index “106” of the non-inclusive word “ELECTRIC” is added to the inclusion code of the customer C, “CO, .LTD”).

なお、不要単語辞書については詳細は後述するが、特定顧客の名称を表す変換対象文字列が、名称辞書に登録されている特定顧客の論理インデックスセットが表す複数単語にそれ以外の余計な単語が付加された文字列であった場合に、前記余計な単語が特定顧客の顧客コードと対応付けられて、特定顧客の不要単語として不要単語辞書に登録される。   Although the details of the unnecessary word dictionary will be described later, the conversion target character string representing the name of the specific customer has a redundant word other than the plural words represented by the logical index set of the specific customer registered in the name dictionary. If it is an added character string, the extra word is associated with the customer code of the specific customer and registered as an unnecessary word of the specific customer in the unnecessary word dictionary.

続いて、他の金融機関より受信した電文から顧客名称を表す文字列のテキストデータを取り出した後に、コンピュータ12のCPU12Aが顧客コード変換プログラムを実行することでコンピュータ12によって行われる顧客コード変換処理について、図3を参照して説明する。なお、この顧客コード変換処理は、顧客名称を表す文字列のテキストデータを含む電文を他の金融機関から受信する毎に実行される。   Subsequently, after extracting text data of a character string representing a customer name from a message received from another financial institution, the customer code conversion process performed by the computer 12 by the CPU 12A of the computer 12 executing the customer code conversion program. This will be described with reference to FIG. This customer code conversion process is executed every time a telegram including text data of a character string representing a customer name is received from another financial institution.

ステップ50では、受信した電文から取り出した変換対象文字列を、該変換対象文字列中に存在するスペースを区切りとして複数の単語に分割する。ステップ52では、ステップ50における文字列の分割によって得られた複数の単語の中から未処理の単語のテキストデータを取り出し、次のステップ54では、取り出した単語のテキストデータをキーとして基本語辞書を検索する。この検索は、例えば基本語辞書全体をHDD22から読み出してメモリに展開した状態で、取り出した単語のテキストデータをメモリ(RAM12C等)に記憶させた後に、検索対象の単語のテキストデータをメモリに展開した基本語辞書に登録されている個々の単語のテキストデータと順に比較することで行ってもよいし、HDD22の基本語辞書から単一の単語のテキストデータを読み出してメモリに記憶させ、該メモリに記憶させたテキストデータをメモリに記憶している検索対象の単語のテキストデータと比較することを、検索対象の単語のテキストデータと一致するテキストデータが出現する迄繰り返すことで行うことも可能である。   In step 50, the conversion target character string extracted from the received electronic message is divided into a plurality of words with a space existing in the conversion target character string as a delimiter. In step 52, text data of an unprocessed word is extracted from a plurality of words obtained by dividing the character string in step 50. In the next step 54, a basic word dictionary is created using the text data of the extracted word as a key. Search for. In this search, for example, the entire basic word dictionary is read from the HDD 22 and expanded in the memory, the text data of the extracted word is stored in the memory (RAM 12C, etc.), and then the text data of the word to be searched is expanded in the memory. The data may be compared with the text data of the individual words registered in the basic word dictionary in order, or the text data of a single word is read from the basic word dictionary of the HDD 22 and stored in the memory. It is also possible to repeat the comparison of the text data stored in the text data with the text data of the search target word stored in the memory until text data matching the text data of the search target word appears. is there.

ステップ56では、ステップ54の検索により検索対象の単語が基本語辞書から抽出されたか否か、すなわち検索対象の単語が基本語辞書に登録されていたか否か判定する。判定が肯定された場合はステップ64へ移行し、抽出された検索対象の単語と対応付けられて基本語辞書に登録されている論理インデックス(数値データ)を取り出し、変換対象文字列を構成する単語の論理インデックスとしてメモリに記憶させた後にステップ66へ移行する。また、ステップ56の判定が否定された場合はステップ58へ移行し、検索対象の単語に付与する論理インデックスを、基本語辞書に既に登録されている論理インデックスと重複しないように決定する。またステップ60では、検索対象の単語のテキストデータを、ステップ58で決定した論理インデックス(の数値データ)と対応付けて基本語辞書に登録する。更にステップ62では、ステップ58で決定した論理インデックスを変換対象文字列を構成する単語の論理インデックスとしてメモリに記憶させた後にステップ66へ移行する。   In step 56, it is determined whether or not the search target word is extracted from the basic word dictionary by the search in step 54, that is, whether or not the search target word is registered in the basic word dictionary. If the determination is affirmative, the process proceeds to step 64, where the logical index (numerical data) associated with the extracted word to be searched and registered in the basic word dictionary is extracted, and the words constituting the conversion target character string The process proceeds to step 66 after being stored in the memory as a logical index. On the other hand, if the determination in step 56 is negative, the process proceeds to step 58 where the logical index assigned to the search target word is determined so as not to overlap with the logical index already registered in the basic word dictionary. In step 60, the text data of the search target word is registered in the basic word dictionary in association with the logical index (numerical data) determined in step 58. Further, in step 62, the logical index determined in step 58 is stored in the memory as a logical index of words constituting the conversion target character string, and then the process proceeds to step 66.

ステップ66では、変換対象文字列から全ての単語を取り出したか否か判定する。判定が否定された場合はステップ52に戻り、ステップ66の判定が肯定される迄ステップ52〜ステップ66を繰り返す。これにより、変換対象文字列を構成する個々の単語が論理インデックスへ各々変換されることになり、メモリには、変換対象文字列の論理インデックスの組合わせ(論理インデックスセット)が記憶されることになる。なお、ステップ52〜ステップ66は請求項7に記載の単語変換手段に対応している。   In step 66, it is determined whether all words have been extracted from the conversion target character string. If the determination is negative, the process returns to step 52, and steps 52 to 66 are repeated until the determination of step 66 is affirmed. As a result, each word constituting the conversion target character string is converted into a logical index, and a combination of logical indexes of the conversion target character string (logical index set) is stored in the memory. Become. Steps 52 to 66 correspond to the word conversion means described in claim 7.

ステップ66の判定が肯定されるとステップ68へ移行し、名称辞書から単一の顧客の情報を取り出してメモリに記憶させ、取り出した情報に含まれる論理インデックスセットを変換対象文字列の論理インデックスセットと比較する。なお、この論理インデックスセットの比較についても、名称辞書全体をHDD22から読み出してメモリに展開した後に行ってもよいし、HDD22から単一の顧客の情報を読み出してメモリに記憶させることを繰り返しながら行うことも可能である。次のステップ70では、変換対象文字列の論理インデックスセットが、名称辞書から取り出した論理インデックスセットを含む関係(名称辞書から取り出した論理インデックスセットを構成する各論理インデックスが、変換対象文字列の論理インデックスセットの中に全て存在している)か否か判定する。   If the determination in step 66 is affirmative, the process proceeds to step 68, where information on a single customer is extracted from the name dictionary and stored in the memory, and the logical index set included in the extracted information is converted into the logical index set of the character string to be converted. Compare with The comparison of the logical index sets may be performed after the entire name dictionary is read from the HDD 22 and expanded in the memory, or the single customer information is read from the HDD 22 and stored in the memory repeatedly. It is also possible. In the next step 70, the logical index set of the conversion target character string includes a logical index set extracted from the name dictionary (each logical index constituting the logical index set extracted from the name dictionary is converted into the logical string of the conversion target character string. Whether all exist in the index set).

判定が否定された場合は何ら処理を行うことなくステップ74へ移行するが、判定が肯定された場合はステップ72へ移行し、ステップ68で名称辞書より取り出した単一の顧客の情報から顧客コードを抽出すると共に、変換対象文字列の論理インデックスセットを構成する各論理インデックスのうち、名称辞書から取り出した論理インデックスセットに含まれていない論理インデックスの数(不一致単語数)を計数し、抽出した顧客コード及び計数した不一致単語数を、名称辞書から取り出した論理インデックスセットと対応付け検索結果情報としてメモリに記憶させた後にステップ74へ移行する。なお、ステップ72において、名称辞書から取り出した単一の顧客の情報に包摂コードも含まれている場合には、この包摂コードも抽出され検索結果情報としてメモリに記憶される。   If the determination is denied, the process proceeds to step 74 without performing any processing. If the determination is affirmed, the process proceeds to step 72, and the customer code is obtained from the single customer information extracted from the name dictionary in step 68. And the number of logical indexes (number of unmatched words) not included in the logical index set extracted from the name dictionary among the logical indexes constituting the logical index set of the conversion target character string is counted and extracted. After the customer code and the counted number of mismatch words are stored in the memory as the association search result information with the logical index set extracted from the name dictionary, the process proceeds to step 74. In step 72, if the single customer information extracted from the name dictionary includes an inclusion code, the inclusion code is also extracted and stored in the memory as search result information.

ステップ74では名称辞書に登録されている全ての論理インデックスを取り出したか(変換対象文字列の論理インデックスセットと比較したか)否か判定する。判定が否定された場合はステップ68に戻り、ステップ74の判定が肯定される迄ステップ68〜ステップ74を繰り返す。このステップ68〜ステップ74の検索処理では、ステップ70の判定条件に合致する論理インデックスセットとして、単一の論理インデックスセットが抽出されることが多いが、例えば変換対象文字列が、包摂関係を有し包摂外単語を含む顧客名称に相当する文字列(例えば先の例では「HAYASHI ELECTRIC CO,.LTD」)、又は該文字列に包摂外単語とは別の単語が更に加わっている文字列(例えば「HAYASHI ELECTRIC CO,.LTD SHINZYUKU」等)であった場合には、同一の包摂コードが付加されている複数の論理インデックスセットが各々抽出される。   In step 74, it is determined whether all the logical indexes registered in the name dictionary have been extracted (compared with the logical index set of the character string to be converted). If the determination is negative, the process returns to step 68, and steps 68 to 74 are repeated until the determination of step 74 is affirmed. In the search processing of step 68 to step 74, a single logical index set is often extracted as a logical index set that matches the determination condition of step 70. For example, the conversion target character string has an inclusion relationship. A character string corresponding to a customer name including a non-included word (for example, “HAYASHI ELECTRIC CO, .LTD” in the above example), or a character string in which a word different from the non-included word is further added to the character string ( For example, "HAYASHI ELECTRIC CO, .LTD SHINZYUKU"), a plurality of logical index sets to which the same inclusion code is added are extracted.

また、変換対象文字列が包摂関係を有していない場合にも、ステップ68〜ステップ74の検索処理により複数の論理インデックスセットが抽出されることがある。例えば文字列「AKASAKA BANK CO.,LTD SHINZYUKU」における単語の組合わせは、図2(B)に示す顧客Aの名称「AKASAKA BANK CO.,LTD」と顧客Eの名称「SHINZYUKU BANK CO.,LTD」の論理和に相当する単語の組合わせに一致しており、変換対象文字列が「AKASAKA BANK CO.,LTD SHINZYUKU」であった場合、顧客A及び顧客Eの論理インデックスセットが各々抽出される。なお、上述したステップ68〜74は本発明に係る検索手段に対応している。   Even when the conversion target character string does not have an inclusion relationship, a plurality of logical index sets may be extracted by the search processing of step 68 to step 74. For example, the combination of words in the character string “AKASAKA BANK CO., LTD SHINZYUKU” is the name “AKASAKA BANK CO., LTD” of customer A and the name “SHINZYUKU BANK CO., LTD” of customer E shown in FIG. ”And the conversion target character string is“ AKASAKA BANK CO., LTD SHINZYUKU ”, the logical index sets of customer A and customer E are respectively extracted. . Steps 68 to 74 described above correspond to the search means according to the present invention.

ステップ74の判定が肯定されるとステップ76へ移行し、顧客コード判定処理が行われる。この顧客コード判定処理について、図4を参照して説明する。ステップ80では、上述したステップ68〜ステップ74の検索処理により、ステップ70の判定条件に合致する論理インデックスセットが抽出されたか否か判定する。この判定が否定された場合は、受信した電文から取り出した変換対象文字列に重大な誤りがあると判断できるので、ステップ82へ移行し、ディスプレイ16に所定のメッセージを表示させる等によりオペレータを呼び出して処理を終了し、変換対象文字列が表す顧客名称及び顧客コードの判断をオペレータに委ねる。   If the determination in step 74 is affirmed, the process proceeds to step 76, and a customer code determination process is performed. This customer code determination process will be described with reference to FIG. In step 80, it is determined whether or not a logical index set that matches the determination condition in step 70 has been extracted by the search processing in steps 68 to 74 described above. If this determination is negative, it can be determined that there is a serious error in the conversion target character string extracted from the received message, so the process moves to step 82 and the operator is called by displaying a predetermined message on the display 16 or the like. The process is terminated, and the decision of the customer name and customer code represented by the conversion target character string is left to the operator.

一方、ステップ80の判定が肯定された場合はステップ83へ移行し、ステップ68〜ステップ74の検索処理により、ステップ70の判定条件に合致する論理インデックスセットが複数抽出されたか否か判定する。判定が否定された場合はステップ84へ移行するが、判定が肯定された場合はステップ126へ移行し、検索処理によって抽出された複数の論理インデックスセットの各々に対応してメモリに記憶されている各検索結果情報の中に、同一の包摂コードが各々含まれているか否かに基づいて、検索処理によって抽出された複数の論理インデックスセットに対応する顧客名称同士に包摂関係があるか否か判定する。この判定が否定された場合はステップ128で複数セット抽出時処理を行うが、判定が肯定された場合はステップ84へ移行する。なお、ステップ128の複数セット抽出時処理については後述する。   On the other hand, if the determination in step 80 is affirmed, the process proceeds to step 83, and it is determined whether a plurality of logical index sets that match the determination condition in step 70 have been extracted by the search processing in steps 68 to 74. If the determination is negative, the process proceeds to step 84. If the determination is affirmative, the process proceeds to step 126, and is stored in the memory corresponding to each of the plurality of logical index sets extracted by the search process. Based on whether the same inclusion code is included in each search result information, it is determined whether there is an inclusion relationship between customer names corresponding to a plurality of logical index sets extracted by the search process To do. If this determination is negative, multiple-set extraction processing is performed in step 128. If the determination is positive, the process proceeds to step 84. Note that the process for extracting a plurality of sets in step 128 will be described later.

ステップ84では、先のステップ68〜ステップ74の検索によってメモリに記憶された論理インデックスセットのうち、不一致単語数が最少の論理インデックスセット(以下、この論理インデックスセットを便宜上「第1の論理インデックスセット」と称する)を判定する。なお、ステップ68〜ステップ74の検索によって単一の論理インデックスセットのみが抽出(メモリに記憶)された場合には、以下の処理ではこの論理インデックスセットが第1の論理インデックスセットとして扱われる。ステップ86では、第1の論理インデックスセットに対応する検索結果情報の中に包摂コードが含まれているか否かに基づいて、第1の論理インデックスセットに対応する顧客名称に包摂関係があるか否か判定する。この判定が否定された場合にはステップ90へ移行し、変換対象文字列に対応する顧客コードとして、第1の論理インデックスセットに対応する顧客コードを出力する。   In step 84, among the logical index sets stored in the memory by the search in the previous step 68 to step 74, the logical index set having the smallest number of unmatched words (hereinafter, this logical index set is referred to as “first logical index set for convenience”). "). When only a single logical index set is extracted (stored in the memory) by the search in steps 68 to 74, this logical index set is treated as the first logical index set in the following processing. In step 86, based on whether or not an inclusion code is included in the search result information corresponding to the first logical index set, whether or not the customer name corresponding to the first logical index set has an inclusion relationship. To determine. If this determination is negative, the process proceeds to step 90, and the customer code corresponding to the first logical index set is output as the customer code corresponding to the conversion target character string.

例えば図2に示す例において、変換対象文字列が「AKASAKA BANK CO.,LTD」(論理インデックスセットは「100,101,107」)、或いは「AKASAKA BANK CO.,LTD MARUNOUCHI」(論理インデックスセットは「100,101,107,110」)であった場合には、先のステップ68〜ステップ74の処理により、ステップ70の判定条件に合致する論理インデックスセットとして、顧客Aの名称を表す文字列「AKASAKA BANK CO.,LTD」に対応する論理インデックスセット「100,101,107」が名称辞書から抽出される。ここで、抽出された論理インデックスセットが上記の論理インデックスセットのみであった場合(ステップ83の判定が否定された場合)、抽出された論理インデックスセット(第1の論理インデックスセット)に対応する包摂コードは名称辞書に登録されておらず(図2(B)を参照)、顧客Aの名称には包摂関係がないので、変換対象文字列が「AKASAKA BANK CO.,LTD」及び「AKASAKA BANK CO.,LTD MARUNOUCHI」の何れであっても、変換対象文字列は顧客Aの名称を表していると判断できる。このような場合は、上述のようにステップ86の判定が肯定されることで、ステップ90において、変換対象文字列に対応する顧客コードとして、第1の論理インデックスセットに対応する顧客コード「1230000」が出力されることになる。   For example, in the example shown in FIG. 2, the conversion target character string is “AKASAKA BANK CO., LTD” (logical index set is “100, 101, 107”) or “AKASAKA BANK CO., LTD MARUNOUCHI” (logical index set is “100, 101, 107, 110”). If it is, the processing of the previous step 68 to step 74 corresponds to the character string “AKASAKA BANK CO., LTD” representing the name of the customer A as a logical index set that matches the determination condition of step 70. The logical index set “100, 101, 107” is extracted from the name dictionary. Here, when the extracted logical index set is only the above-described logical index set (when the determination in step 83 is negative), the inclusion corresponding to the extracted logical index set (first logical index set). The code is not registered in the name dictionary (see Fig. 2 (B)), and the name of customer A has no inclusion relationship. ., LTD MARUNOUCHI ", it can be determined that the character string to be converted represents the name of customer A. In such a case, the determination in step 86 is affirmed as described above, and in step 90, the customer code “1230000” corresponding to the first logical index set is used as the customer code corresponding to the character string to be converted. Will be output.

また、次のステップ94では、変換対象文字列の論理インデックスセットが、出力した顧客コードに対応する顧客名称の論理インデックスセットと完全に一致しているか(不一致単語数が0か)否か判定する。判定が肯定された場合は顧客コード判定処理(顧客コード変換処理)を終了する。例えば前述の例において、変換対象文字列が「AKASAKA BANK CO.,LTD」であれば、変換対象文字列の論理インデックスセットは出力した顧客コードに対応する顧客名称の論理インデックスセットと完全に一致するので、ステップ94の判定が肯定されて処理を終了する。また、変換対象文字列が「AKASAKA BANK CO.,LTD MARUNOUCHI」の場合は、出力した顧客コードに対応する顧客名称を表す文字列「AKASAKA BANK CO.,LTD」に対して変換対象文字列には余計な単語「MARUNOUCHI」が付加されており、変換対象文字列の論理インデックスセットは出力した顧客コードに対応する顧客名称の論理インデックスセットと完全には一致していないので、ステップ94の判定が否定されてステップ96へ移行する。   In the next step 94, it is determined whether the logical index set of the character string to be converted completely matches the logical index set of the customer name corresponding to the output customer code (the number of mismatched words is 0). . If the determination is affirmative, the customer code determination process (customer code conversion process) is terminated. For example, in the above example, if the conversion target character string is “AKASAKA BANK CO., LTD”, the logical index set of the conversion target character string completely matches the logical index set of the customer name corresponding to the output customer code. Therefore, the determination at step 94 is affirmed and the process is terminated. If the conversion target character string is “AKASAKA BANK CO., LTD MARUNOUCHI”, the conversion target character string for the character string “AKASAKA BANK CO., LTD” representing the customer name corresponding to the output customer code The extra word “MARUNOUCHI” is added, and the logical index set of the conversion target character string does not completely match the logical index set of the customer name corresponding to the output customer code. Then, the process proceeds to step 96.

ここで、変換対象文字列に付加されている余計な単語(上記の例では単語「MARUNOUCHI」)は、変換対象文字列に対応する顧客コードの判定には本来不要な単語であるが、変換対象文字列と同一の顧客名称を表す文字列が今後入力された際に、該文字列にも同一の単語が付加されている可能性が高いので、変換対象文字列が表している顧客名称が今回出力した顧客コードに対応する顧客名称か否かを判断する際に上記の単語を利用できる可能性がある。このためステップ96では、まず出力した顧客コードをキーにして不要単語辞書を検索することで、出力した顧客コードが不要単語辞書に登録されているか否か、すなわち出力した顧客コードに対応する不要単語が不要単語辞書に登録されているか否かを確認した後に、登録されている不要単語の論理インデックスの中に、変換対象文字列に含まれており出力した顧客コードに対応する顧客名称を表す文字列には含まれていない不一致単語(上記の例では単語「MARUNOUCHI」)の論理インデックスが存在しているか否かを確認する。そして、不一致単語(の論理インデックス)が不要単語として未登録であれば、不一致単語の論理インデックスを、出力した顧客コードと対応付けて不要単語辞書に不要単語として登録した後に処理を終了する(図2(C)も参照)。   Here, the extra word added to the conversion target character string (in the above example, the word “MARUNOUCHI”) is a word that is essentially unnecessary for determining the customer code corresponding to the conversion target character string. When a character string representing the same customer name as the character string is input in the future, it is highly likely that the same word is added to the character string, so the customer name represented by the character string to be converted is There is a possibility that the word can be used when determining whether or not the customer name corresponds to the output customer code. For this reason, in step 96, first, an unnecessary word dictionary is searched using the output customer code as a key to determine whether the output customer code is registered in the unnecessary word dictionary, that is, an unnecessary word corresponding to the output customer code. After confirming whether or not is registered in the unnecessary word dictionary, the character representing the customer name corresponding to the output customer code included in the conversion target character string in the logical index of the registered unnecessary word Check whether there is a logical index of unmatched words (word "MARUNOUCHI" in the example above) that is not included in the column. If the unmatched word (logical index) is not registered as an unnecessary word, the logical index of the mismatch word is registered as an unnecessary word in the unnecessary word dictionary in association with the output customer code, and the process is terminated (FIG. 2 (C)).

なお、不一致単語が複数存在していた場合、ステップ96では各不一致単語の論理インデックスが不要単語として不要単語辞書に各々登録される。また、ステップ96において、不一致単語の論理インデックスが出力した顧客コードと対応付けられて不要単語辞書に既に登録されていた場合には、何ら処理が行われることなく処理が終了される。更に、ステップ96において、出力した顧客コードが不要単語辞書に登録されていなかった場合には、不一致単語の論理インデックスと出力した顧客コードが、互いに対応付けられて不要単語辞書に各々登録される。   If there are a plurality of mismatch words, the logical index of each mismatch word is registered in the unnecessary word dictionary as an unnecessary word in step 96. In step 96, if the logical index of the mismatched word is already registered in the unnecessary word dictionary in association with the output customer code, the process is terminated without performing any process. In step 96, if the output customer code is not registered in the unnecessary word dictionary, the logical index of the mismatched word and the output customer code are associated with each other and registered in the unnecessary word dictionary.

一方、ステップ86の判定が肯定された場合はステップ88へ移行し、メモリに記憶されている第1の論理インデックスセットの情報に含まれる包摂外単語の論理インデックスを参照し、この包摂外単語の論理インデックスが変換対象文字列の論理インデックスセットに含まれているか否かを判断することで、変換対象文字列に包摂外単語が含まれているか否か判定する。そして、判定が肯定された場合はステップ89へ移行し、ステップ68〜ステップ74の検索処理によって抽出された論理インデックスセットのうち、包摂外単語を含む論理インデックスセットに対応する顧客コードを、変換対象文字列に対応する顧客コードとして出力し、ステップ94へ移行する。   On the other hand, if the determination in step 86 is affirmative, the process proceeds to step 88, where the logical index of the non-included word included in the information of the first logical index set stored in the memory is referred to, and By determining whether or not the logical index is included in the logical index set of the conversion target character string, it is determined whether or not the non-inclusive word is included in the conversion target character string. If the determination is affirmative, the process proceeds to step 89, and the customer code corresponding to the logical index set including the non-inclusive word among the logical index sets extracted by the search processing of step 68 to step 74 is converted. The customer code corresponding to the character string is output and the process proceeds to step 94.

例えば図2の例において、変換対象文字列が「HAYASHI ELECTRIC CO,.LTD」(論理インデックスセットは「105,106,107」)、或いは「HAYASHI ELECTRIC CO,.LTD SHINZYUKU」(論理インデックスセットは「105,106,107,111」)であった場合、ステップ68〜ステップ74の検索処理において、ステップ70の判定条件に合致する論理インデックスセットとして、包摂関係を有する複数の顧客の論理インデックスセット、すなわち顧客Bの名称を表す文字列「HAYASHI CO,.LTD」に対応する論理インデックスセット「105,107」及び顧客Cの名称を表す文字列「HAYASHI ELECTRIC CO,.LTD」に対応する論理インデックスセット「105,106,107」が名称辞書から各々抽出されるが、変換対象文字列には上記の包摂関係における包摂外単語「ELECTRIC」が含まれているので、変換対象文字列は包摂外単語が含まれる顧客Cの名称を表していると判断できる。本実施形態に係る顧客コード変換処理では、上記のような場合にステップ83,126の判定が各々肯定された後に、ステップ88の判定が肯定されてステップ89へ移行することで、変換対象文字列に対応する顧客コードとして、名称に包摂外単語が含まれている顧客に付与されている顧客コード(上記の例では顧客Cに付与された顧客コード「3450000」)が出力されることになる。   For example, in the example of FIG. 2, the conversion target character string is “HAYASHI ELECTRIC CO, .LTD” (logical index set is “105,106,107”) or “HAYASHI ELECTRIC CO, .LTD SHINZYUKU” (logical index set is “105,106,107,111”). If there is, in the search processing of step 68 to step 74, as a logical index set that matches the determination condition of step 70, a logical index set of a plurality of customers having an inclusion relationship, that is, a character string “HAYASHI representing the name of customer B” The logical index set “105,107” corresponding to “CO, .LTD” and the logical index set “105,106,107” corresponding to the character string “HAYASHI ELECTRIC CO, .LTD” representing the name of the customer C are respectively extracted from the name dictionary. Because the conversion target character string includes the non-inclusive word "ELECTRIC" in the above inclusion relationship, the conversion target character string includes the non-inclusive word It can be determined that represents the name of that customer C. In the customer code conversion process according to the present embodiment, the determination in steps 83 and 126 is affirmed in the above case, and then the determination in step 88 is affirmed and the process proceeds to step 89. As a customer code corresponding to, a customer code assigned to a customer whose name includes an uninclusive word (customer code “3450000” assigned to customer C in the above example) is output.

また、上記の例において、変換対象文字列が「HAYASHI ELECTRIC CO,.LTD」であれば、変換対象文字列の論理インデックスセットは出力した顧客コードに対応する顧客名称の論理インデックスセットと完全に一致するので、ステップ94の判定が肯定されて処理を終了する。一方、変換対象文字列が「HAYASHI ELECTRIC CO,.LTD SHINZYUKU」の場合は、出力した顧客コードに対応する顧客名称を表す文字列「HAYASHI ELECTRIC CO,.LTD」に対して変換対象文字列には余計な単語「SHINZYUKU」が付加されており、変換対象文字列の論理インデックスセットは出力した顧客コードに対応する顧客名称の論理インデックスセットと完全には一致していないので、ステップ94の判定が否定されてステップ96へ移行する。そして、変換対象文字列に含まれており、出力した顧客コードに対応する顧客名称を表す文字列には含まれていない不一致単語(上記の例では単語「SHINZYUKU」)が、出力した顧客コードに対応する不要単語として登録されていなければ、当該不一致単語が出力した顧客コードに対応する不要単語辞書に登録される(図2(C)も参照)。なお、上述したステップ94,96は請求項6に記載の不要単語登録手段に対応しており、顧客コード判定処理(後述する複数セット抽出時処理を含む)のうち上記以外の各ステップは本発明に係る変換手段に対応している。   In the above example, if the conversion target character string is “HAYASHI ELECTRIC CO, .LTD”, the logical index set of the conversion target character string completely matches the logical index set of the customer name corresponding to the output customer code. Therefore, the determination in step 94 is affirmed and the process is terminated. On the other hand, if the conversion target character string is “HAYASHI ELECTRIC CO, .LTD SHINZYUKU”, the conversion target character string for the character string “HAYASHI ELECTRIC CO, .LTD” that represents the customer name corresponding to the output customer code An extra word “SHINZYUKU” is added, and the logical index set of the conversion target character string does not completely match the logical index set of the customer name corresponding to the output customer code, so the determination in step 94 is negative. Then, the process proceeds to step 96. A mismatch word that is included in the conversion target character string and not included in the character string that represents the customer name corresponding to the output customer code (in the above example, the word “SHINZYUKU”) is included in the output customer code. If it is not registered as a corresponding unnecessary word, it is registered in the unnecessary word dictionary corresponding to the customer code output by the mismatched word (see also FIG. 2 (C)). Note that the above-described steps 94 and 96 correspond to the unnecessary word registering means described in claim 6, and each of the steps other than the above in the customer code determination process (including the multiple set extraction process described later) is the present invention. Corresponds to the conversion means.

また、第1の論理インデックスセットに対応する顧客名称に包摂関係が有り、かつ変換対象文字列が上記包摂関係における包摂外単語を含まない文字列(例えば「HAYASHI CO,.LTD」))、或いは該文字列に包摂外単語とは別の単語が加わっている文字列(例えば「HAYASHI AND CO,.LTD」又は「HAYASHI CO,.LTD SHINZYUKU」)である場合、ステップ68〜ステップ74の検索処理では、ステップ70の判定条件に合致する論理インデックスセットとして、包摂関係を有する複数の顧客名称のうち包摂外単語を含まない顧客名称に対応する論理インデックスセット、すなわち顧客Bの名称を表す文字列「HAYASHI CO,.LTD」に対応する論理インデックスセット「105,107」のみが抽出されるが、変換対象文字列は、顧客Bの名称を表す文字列である可能性が高いものの、顧客Bの名称と包摂関係にある顧客Cの名称「HAYASHI ELECTRIC CO,.LTD」における特定単語「ELECTRIC」が何らかの理由で欠落した文字列である(顧客Cの名称を表す文字列である)可能性もある。   In addition, the customer name corresponding to the first logical index set has an inclusion relationship, and the character string to be converted does not include a non-inclusive word in the above inclusion relationship (for example, “HAYASHI CO, .LTD”)), or If the character string is a character string (for example, “HAYASHI AND CO, .LTD” or “HAYASHI CO, .LTD SHINZYUKU”) in which a word other than the non-inclusive word is added to the character string, the search processing of step 68 to step 74 Then, as a logical index set that matches the determination condition of step 70, a logical index set corresponding to a customer name that does not include a non-included word among a plurality of customer names having an inclusion relationship, that is, a character string “name of customer B” Only the logical index set “105,107” corresponding to “HAYASHI CO, .LTD” is extracted, but although the conversion target character string is likely to be a character string representing the name of customer B, customer B ’s There is a possibility that the specific word “ELECTRIC” in the name “HAYASHI ELECTRIC CO, .LTD” of the customer C inclusive relationship with the name is a missing character string for some reason (a character string representing the name of the customer C) .

上記の場合にはステップ88の判定が肯定されてステップ98へ移行し、変換対象文字列の論理インデックスセットが第1の論理インデックスセットと完全に一致しているか(不一致単語数が0か)否か判定する。判定が肯定された場合(例えば変換対象文字列が「HAYASHI CO,.LTD」の場合)は何ら処理を行うことなくステップ108へ移行するが、判定が否定された場合(例えば変換対象文字列が「HAYASHI AND CO,.LTD」又は「HAYASHI CO,.LTD SHINZYUKU」の場合)にはステップ100へ移行し、変換対象文字列の論理インデックスセットと第1の論理インデックスセットを比較することで、変換対象文字列中には存在しており第1の論理インデックスセットに対応する文字列には存在していない単語(不一致単語)の論理インデックスを抽出する。例えば変換対象文字列が「HAYASHI AND CO,.LTD」であり、第1の論理インデックスセットが顧客Bの論理インデックスセットである場合、不一致単語は「AND」であるので「AND」の論理インデックス「108」が抽出される。   In the above case, the determination in step 88 is affirmed and the process proceeds to step 98, and whether or not the logical index set of the character string to be converted completely matches the first logical index set (the number of mismatched words is 0). To determine. If the determination is affirmative (for example, if the conversion target character string is “HAYASHI CO, .LTD”), the process proceeds to step 108 without performing any processing, but if the determination is negative (for example, the conversion target character string is In the case of “HAYASHI AND CO, .LTD” or “HAYASHI CO, .LTD SHINZYUKU”, the process proceeds to step 100, and the conversion is performed by comparing the logical index set of the conversion target character string with the first logical index set. A logical index of a word (non-matching word) that exists in the target character string but does not exist in the character string corresponding to the first logical index set is extracted. For example, when the conversion target character string is “HAYASHI AND CO, .LTD” and the first logical index set is the logical index set of the customer B, the mismatch word is “AND”, so the logical index “AND” 108 "is extracted.

次のステップ102では、第1の論理インデックスセットに対応する顧客コードをキーにして不要単語辞書を検索する。この不要単語辞書の検索についても、不要単語辞書全体をHDD22から読み出してメモリに展開した後に行ってもよいし、HDD22から単一の顧客の情報を読み出してメモリに記憶させることを繰り返しながら行うことも可能である。次のステップ104では、ステップ102の検索によって該当する情報が抽出されたか否か判定する。判定が肯定された場合はステップ106へ移行し、ステップ102の検索によって抽出された情報の中に、先のステップ100で抽出した不一致単語の論理インデックスが含まれているか否か判定する。   In the next step 102, an unnecessary word dictionary is searched using the customer code corresponding to the first logical index set as a key. The search for the unnecessary word dictionary may be performed after the entire unnecessary word dictionary is read from the HDD 22 and expanded in the memory, or the single customer information is read from the HDD 22 and stored in the memory repeatedly. Is also possible. In the next step 104, it is determined whether or not the corresponding information is extracted by the search in step 102. If the determination is affirmative, the process proceeds to step 106, and it is determined whether or not the information extracted by the search in step 102 includes the logical index of the mismatch word extracted in the previous step 100.

ステップ106の判定が肯定された場合は、先のステップ100で論理インデックスが抽出された不一致単語が、第1の論理インデックスセットに対応する顧客名称についての不要単語として不要単語辞書に登録されているので、第1の論理インデックスセットに対応する顧客名称を表していると過去に判定された文字列の中に上記の不一致単語が付加された文字列が存在していたことになり(例えば上述した例では、顧客Bの名称を表していると過去に判定された文字列の中に上記の「AND」が付加された文字列が存在していたことになる)、変換対象文字列は第1の論理インデックスセットに対応する顧客名称を表している確率が非常に高いと判断できる。このため、ステップ106の判定が肯定された場合はステップ107へ移行し、変換対象文字列に対応する顧客コードとして、第1の論理インデックスセットに対応する顧客コードを出力して処理を終了する。   If the determination in step 106 is affirmative, the mismatch word from which the logical index has been extracted in the previous step 100 is registered in the unnecessary word dictionary as an unnecessary word for the customer name corresponding to the first logical index set. Therefore, when the customer name corresponding to the first logical index set is represented, the character string to which the above mismatch word is added exists in the character string determined in the past (for example, as described above) In the example, if the name of the customer B is represented, the character string to which the above “AND” is added exists in the character string determined in the past), and the conversion target character string is the first character string. It can be determined that the probability of representing the customer name corresponding to the logical index set is very high. For this reason, when the determination in step 106 is affirmed, the process proceeds to step 107, the customer code corresponding to the first logical index set is output as the customer code corresponding to the character string to be converted, and the process is terminated.

なお、先のステップ100において、不一致単語として複数の単語が抽出される場合もあるが、抽出された複数の不一致単語が、第1の論理インデックスセットに対応する顧客コードと対応付けて不要単語辞書に全て登録されていた場合にのみ、ステップ106の判定が肯定されるようにしてもよいし、抽出された複数の不一致単語のうちの何れか1つのみが、第1の論理インデックスセットに対応する顧客コードと対応付けて不要単語辞書に登録されていた場合にもステップ106の判定が肯定されるようにしてもよい(この場合はステップ96へ移行し、未登録の不一致単語を第1の論理インデックスセットに対応する顧客コードと対応付けて不要単語辞書に不要単語として登録することが好ましい)。   In the previous step 100, a plurality of words may be extracted as mismatch words, but the extracted plurality of mismatch words are associated with the customer code corresponding to the first logical index set and the unnecessary word dictionary. The determination in step 106 may be affirmed only when all are registered in the list, or only one of the plurality of extracted mismatch words corresponds to the first logical index set. The determination in step 106 may also be affirmed even if it is registered in the unnecessary word dictionary in association with the customer code (in this case, the process proceeds to step 96 where the unregistered unmatched word is assigned to the first word. Preferably, it is registered as an unnecessary word in the unnecessary word dictionary in association with the customer code corresponding to the logical index set).

一方、ステップ104又はステップ106の判定が肯定された場合には、第1の論理インデックスセットに対応する顧客名称を表していると過去に判定された文字列の中に、先のステップ100で論理インデックスが抽出された不一致単語が付加された文字列は存在しておらず、この不一致単語に基づいて変換対象文字列が第1の論理インデックスセットに対応する顧客名称を表していると判断することは困難である。このため、ステップ104又はステップ106の判定が肯定された場合はステップ108へ移行し、第1の論理インデックスセットに付加されている包摂コードをキーにして名称辞書を検索し、第1の論理インデックスセットに対応する顧客名称と包摂関係を有する顧客名称を表す第2の論理インデックスセットの情報を名称辞書から抽出する。   On the other hand, if the determination in step 104 or step 106 is affirmative, the logical character in the previous step 100 is included in the character string determined in the past as representing the customer name corresponding to the first logical index set. It is determined that there is no character string to which the mismatch word from which the index has been extracted is added, and the conversion target character string represents the customer name corresponding to the first logical index set based on the mismatch word. It is difficult. Therefore, if the determination in step 104 or step 106 is affirmed, the process proceeds to step 108, the name dictionary is searched using the inclusion code added to the first logical index set as a key, and the first logical index Information of the second logical index set representing the customer name having an inclusion relationship with the customer name corresponding to the set is extracted from the name dictionary.

次のステップ110では、変換対象文字列の論理インデックスセットと第2の論理インデックスセットを比較することで、変換対象文字列中には存在しており第2の論理インデックスセットに対応する文字列には存在していない不一致単語の論理インデックスを抽出する。例えば変換対象文字列が「HAYASHI CO,.LTD SHINZYUKU」であり、第2の論理インデックスセットが顧客Cの論理インデックスセットである場合、不一致単語「SHINZYUKU」の論理インデックス「118」が抽出される。次のステップ112では、第2の論理インデックスセットに対応する顧客コードをキーにして不要単語辞書を検索する。そしてステップ114では、ステップ112の検索によって該当する情報が抽出されたか否か判定する。判定が肯定された場合はステップ116へ移行し、ステップ112の検索によって抽出された情報の中に、先のステップ110で抽出した不一致単語の論理インデックスが含まれているか否か判定する。   In the next step 110, by comparing the logical index set of the conversion target character string with the second logical index set, the character string corresponding to the second logical index set exists in the conversion target character string. Extracts the logical index of non-matching mismatched words. For example, when the conversion target character string is “HAYASHI CO, .LTD SHINZYUKU” and the second logical index set is the logical index set of the customer C, the logical index “118” of the mismatch word “SHINZYUKU” is extracted. In the next step 112, an unnecessary word dictionary is searched using the customer code corresponding to the second logical index set as a key. In step 114, it is determined whether or not the corresponding information is extracted by the search in step 112. If the determination is affirmative, the process proceeds to step 116, and it is determined whether or not the information extracted by the search in step 112 includes the logical index of the unmatched word extracted in the previous step 110.

ステップ116の判定が肯定された場合は、先のステップ110で論理インデックスが抽出された不一致単語が、第2の論理インデックスセットに対応する顧客名称についての不要単語として不要単語辞書に登録されていることになるので、第2の論理インデックスセットに対応する顧客名称を表していると過去に判定された文字列の中に上記の不一致単語が付加された文字列が存在していたことになり、変換対象文字列は第2の論理インデックスセットに対応する顧客名称を表している確率が高いと判断できる。   If the determination in step 116 is affirmative, the mismatch word from which the logical index has been extracted in the previous step 110 is registered in the unnecessary word dictionary as an unnecessary word for the customer name corresponding to the second logical index set. Therefore, when the customer name corresponding to the second logical index set is represented, there is a character string to which the above mismatch word is added in the character string determined in the past. It can be determined that the conversion target character string has a high probability of representing the customer name corresponding to the second logical index set.

例えば変換対象文字列が「HAYASHI CO,.LTD SHINZYUKU」であり、このうちの単語「SHINZYUKU」が、第1の論理インデックスセットの不一致単語として抽出されたものの、第1の論理インデックスセットに対応する顧客Bについての不要単語として不要単語辞書に登録されていなかった一方で、第2の論理インデックスセットの不一致単語としても抽出され、第2の論理インデックスセットに対応する顧客Cについての不要単語として不要単語辞書に登録されていた場合には、顧客Cの名称を表していると過去に判定された文字列の中に上記の「SHINZYUKU」が付加された文字列が存在していたことになるため、変換対象文字列は単語「ELECTRIC」が欠落してはいるものの、顧客Cの名称を表す文字列である確率が高いと判断できる。このため、ステップ116の判定が肯定された場合はステップ118へ移行し、変換対象文字列に対応する顧客コードとして、第2の論理インデックスセットに対応する顧客コードを出力して処理を終了する。   For example, the conversion target character string is “HAYASHI CO, .LTD SHINZYUKU”, and the word “SHINZYUKU” is extracted as a mismatch word of the first logical index set, but corresponds to the first logical index set. While it was not registered in the unnecessary word dictionary as an unnecessary word for customer B, it is also extracted as a mismatched word in the second logical index set and is unnecessary as an unnecessary word for customer C corresponding to the second logical index set If it is registered in the word dictionary, the character string to which the above “SHINZYUKU” is added exists in the character string determined in the past as representing the name of the customer C. The character string to be converted can be determined to have a high probability of being a character string representing the name of the customer C although the word “ELECTRIC” is missing. For this reason, when the determination in step 116 is affirmed, the process proceeds to step 118, where the customer code corresponding to the second logical index set is output as the customer code corresponding to the character string to be converted, and the process ends.

なお、先のステップ110においても、不一致単語として複数の単語が抽出される場合もあるが、抽出された複数の不一致単語が、第2の論理インデックスセットに対応する顧客コードと対応付けて不要単語辞書に全て登録されていた場合にのみ、ステップ116の判定が肯定されるようにしてもよいし、抽出された複数の不一致単語のうちの何れか1つのみが、第2の論理インデックスセットに対応する顧客コードと対応付けて不要単語辞書に登録されていた場合にもステップ116の判定が肯定されるようにしてもよい(この場合もステップ96へ移行し、未登録の不一致単語を第2の論理インデックスセットに対応する顧客コードと対応付けて不要単語辞書に不要単語として登録することが好ましい)。   In the previous step 110, a plurality of words may be extracted as mismatched words, but the extracted plurality of mismatched words are unnecessary words associated with the customer code corresponding to the second logical index set. The determination in step 116 may be affirmed only when all of the words are registered in the dictionary, or only one of the extracted mismatch words is included in the second logical index set. The determination in step 116 may also be affirmed even if it is registered in the unnecessary word dictionary in association with the corresponding customer code (also in this case, the process proceeds to step 96, where the unregistered unmatched word is assigned to the second word. It is preferable to register it as an unnecessary word in the unnecessary word dictionary in association with the customer code corresponding to the logical index set).

一方、ステップ114又はステップ116の判定が肯定された場合には、第2の論理インデックスセットに対応する顧客名称を表していると過去に判定された文字列の中に、先のステップ110で論理インデックスが抽出された不一致単語が付加された文字列も存在していないので、変換対象文字列が第1の論理インデックスセットに対応する顧客名称と第2の論理インデックスセットに対応する顧客名称の何れを表しているかを判断することは困難である。このため、ステップ114又はステップ116の判定が肯定された場合はステップ120へ移行し、変換対象文字列をディスプレイ16に表示させると共に、第1及び第2の論理インデックスセットに対応する文字列、顧客コード等の情報をディスプレイ16に表示させ、更に所定のメッセージをディスプレイ16に表示させることで、変換対象文字列が表している顧客名称の判定をオペレータへ要請する。   On the other hand, if the determination in step 114 or step 116 is affirmative, the logical character in the previous step 110 is included in the character string determined in the past as representing the customer name corresponding to the second logical index set. Since there is no character string to which the inconsistent word from which the index is extracted is added, either the customer name corresponding to the first logical index set or the customer name corresponding to the second logical index set is the character string to be converted. It is difficult to determine whether or not For this reason, when the determination in step 114 or step 116 is affirmed, the process proceeds to step 120 to display the conversion target character string on the display 16 and to the character string corresponding to the first and second logical index sets, the customer Information such as a code is displayed on the display 16 and a predetermined message is displayed on the display 16 to request the operator to determine the customer name represented by the character string to be converted.

次のステップ122ではオペレータによる判定結果が入力されたか否か判定し、判定が肯定される迄ステップ122を繰り返す。顧客名称の判定が要請されると、オペレータは電文送信元の第2の金融機関へ問い合せる等の作業を行うことで、変換対象文字列が表している顧客名称を判定する。そして、判定結果を表す情報をキーボード20を介して入力する。これにより、ステップ122の判定が肯定されてステップ124へ移行し、変換対象文字列に対応する顧客コードとして、入力された判定結果に相当する顧客コードを出力した後にステップ94へ移行する。なお、ステップ120〜ステップ124は請求項5に記載の変換手段に対応している。   In the next step 122, it is determined whether or not a determination result by the operator has been input, and step 122 is repeated until the determination is affirmed. When the determination of the customer name is requested, the operator determines the customer name represented by the character string to be converted by performing an operation such as making an inquiry to the second financial institution that sent the message. Then, information indicating the determination result is input via the keyboard 20. As a result, the determination in step 122 is affirmed and the process proceeds to step 124. After the customer code corresponding to the input determination result is output as the customer code corresponding to the conversion target character string, the process proceeds to step 94. Steps 120 to 124 correspond to the conversion means described in claim 5.

従って、変換対象文字列が、オペレータによって判定された顧客名称に対して余計な単語が付加されている文字列であれば、ステップ94の判定が肯定されてステップ96へ移行し、変換対象文字列中の余計な単語が、判定された顧客についての不要単語として不要単語辞書に登録されることになるので、次回以降に、同一の顧客を表す文字列として、同一の単語(不要単語)が付加された文字列が出現した場合には、この不要単語に基づいてステップ106又はステップ116の判定が肯定されることで、オペレータの手を再度煩わすことなく変換対象文字列が表す顧客名称を自動的に判定することができる。   Therefore, if the character string to be converted is a character string in which an extra word is added to the customer name determined by the operator, the determination in step 94 is affirmed and the process proceeds to step 96, where the character string to be converted is converted. Since unnecessary words in the list are registered in the unnecessary word dictionary as unnecessary words for the determined customer, the same word (unnecessary word) is added as a character string representing the same customer after the next time. When the generated character string appears, the determination of step 106 or step 116 is affirmed based on this unnecessary word, so that the customer name represented by the conversion target character string is automatically determined without bothering the operator again. Can be determined.

続いて、ステップ68〜ステップ74の検索処理によって複数の論理インデックスセットが抽出され、抽出された複数の論理インデックスセットに対応する顧客名称同士に包摂関係が無い場合(抽出された複数の論理インデックスセットが、包摂関係の無い顧客名称に対応する論理インデックスセットのみから成る場合、或いは包摂関係の無い顧客名称に対応する論理インデックスセットと包摂関係の有る顧客名称に対応する論理インデックスセットが混在している場合)にステップ128で実行される複数セット抽出時処理について、図5のフローチャートを参照して説明する。   Subsequently, when a plurality of logical index sets are extracted by the search processing of step 68 to step 74, and there is no inclusion relationship between customer names corresponding to the extracted logical index sets (extracted logical index sets Is composed of only logical index sets corresponding to customer names having no inclusion relationship, or logical index sets corresponding to customer names having no inclusion relationship and logical index sets corresponding to customer names having inclusion relationship are mixed. In the case), the multiple-set extraction process executed in step 128 will be described with reference to the flowchart of FIG.

ステップ140では、検索処理によって抽出された複数の論理インデックスセットの各々に対応する検索結果情報を順次参照し、包摂コードが含まれている検索結果情報が存在しているか否かを判断することで、検索処理によって抽出された複数の論理インデックスセットの中に、対応する顧客名称が他の顧客名称と包摂関係がある論理インデックスセットが存在しているか否かを判定する。判定が否定された場合はステップ142へ移行し、検索処理によって抽出された複数の論理インデックスセットのみを処理対象に設定した後にステップ148へ移行する。一方、ステップ140の判定が肯定された場合はステップ144へ移行し、検索処理によって抽出された複数の論理インデックスセットのうち、対応する検索結果情報の中に包摂コードが存在している論理インデッスセット(対応する顧客名称が他の顧客名称と包摂関係がある論理インデックスセット)に対し、包摂コードをキーにして名称辞書を検索し、当該論理インデックスセットが表す顧客名称と包摂関係を有する顧客名称を表す他の論理インデックスセットの情報を名称辞書から抽出する。そして、次のステップ146において、検索処理によって抽出された複数の論理インデックスセットと、ステップ144で抽出した論理インデックスセットを処理対象に設定し、ステップ148へ移行する。   In step 140, the search result information corresponding to each of the plurality of logical index sets extracted by the search process is sequentially referred to, and it is determined whether or not the search result information including the inclusion code exists. In the plurality of logical index sets extracted by the search process, it is determined whether or not there is a logical index set in which the corresponding customer name has an inclusion relationship with other customer names. If the determination is negative, the process proceeds to step 142, and after only a plurality of logical index sets extracted by the search process are set as processing targets, the process proceeds to step 148. On the other hand, if the determination in step 140 is affirmative, the process proceeds to step 144, and a logical index in which an inclusion code exists in the corresponding search result information among the plurality of logical index sets extracted by the search process. For a set (logical index set in which the corresponding customer name has an inclusion relationship with other customer names), the name dictionary is searched using the inclusion code as a key, and the customer name having an inclusion relationship with the customer name represented by the logical index set Is extracted from the name dictionary. In the next step 146, the plurality of logical index sets extracted in the search process and the logical index set extracted in step 144 are set as processing targets, and the process proceeds to step 148.

次のステップ148では処理対象に設定した論理インデックスセットから未処理の単一の論理インデックスセットを取り出し、次のステップ150では、変換対象文字列の論理インデックスセットが取り出した論理インデックスセットと完全に一致しているか否か判定する。判定が肯定された場合はステップ160へ移行し、不要単語数(変換対象文字列中には存在しており取り出した論理インデックスセットに対応する文字列には存在していない不一致単語のうち、不要単語辞書に不要単語として登録されている単語の数)に0を設定し、この不要単語数を、取り出した論理インデックスセットに対応する顧客コードと対応付けてメモリに記憶させ、ステップ162へ移行する。   In the next step 148, a single unprocessed logical index set is extracted from the logical index set set as the processing target. In the next step 150, the logical index set of the conversion target character string is completely identical to the extracted logical index set. Determine if you are doing it. If the determination is affirmative, the process proceeds to step 160 and the number of unnecessary words (unnecessary among mismatched words that are present in the conversion target character string and not present in the character string corresponding to the extracted logical index set) The number of unnecessary words registered as unnecessary words in the word dictionary is set to 0, the number of unnecessary words is stored in the memory in association with the customer code corresponding to the extracted logical index set, and the process proceeds to step 162. .

一方、ステップ150の判定が否定された場合にはステップ152へ移行し、変換対象文字列の論理インデックスセットと取り出した論理インデックスセットを比較することで、変換対象文字列中には存在しており、取り出した論理インデックスセットに対応する文字列には存在していない不一致単語の論理インデックスを全て抽出する。またステップ153では、取り出した論理インデックスセットに対応する顧客コードをキーにして不要単語辞書を検索する。次のステップ154では、ステップ152の検索によって該当する情報が抽出されたか否か判定する。否定が肯定された場合はステップ106へ移行し、前述のように不要単語数=0を顧客コードと対応付けてメモリに記憶させる。また、ステップ154の判定が肯定された場合はステップ156へ移行し、ステップ152で抽出した不一致単語の論理インデックスが、ステップ153の検索によって抽出された情報に含まれる不要単語の論理インデックスの中に存在しているか否か判定する。   On the other hand, if the determination in step 150 is negative, the process proceeds to step 152, where the logical index set of the conversion target character string is compared with the extracted logical index set, and is present in the conversion target character string. Then, all logical indexes of unmatched words that do not exist in the character string corresponding to the extracted logical index set are extracted. In step 153, the unnecessary word dictionary is searched using the customer code corresponding to the extracted logical index set as a key. In the next step 154, it is determined whether or not the corresponding information is extracted by the search in step 152. When negative determination is affirmed, it transfers to step 106, and as above-mentioned, the number of unnecessary words = 0 is matched with a customer code, and is memorize | stored in memory. If the determination in step 154 is affirmed, the process proceeds to step 156, and the logical index of the mismatched word extracted in step 152 is included in the logical index of unnecessary words included in the information extracted by the search in step 153. Determine if it exists.

ステップ156の判定が否定された場合もステップ106へ移行し、不要単語数=0を顧客コードと対応付けてメモリに記憶させるが、ステップ156の判定が肯定された場合はステップ158へ移行し、ステップ152で論理インデックスを抽出した不一致単語のうち、取り出した論理インデックスセットに対応する不要単語として不要単語辞書に登録されている不一致単語の数(不要単語数)を計数し、計数結果を不要単語数に設定し、取り出した論理インデックスセットに対応する顧客コードと対応付けてメモリに記憶させると共に、不要単語として登録されている不一致単語の論理インデックスも顧客コードと対応付けてメモリに記憶させた後に、ステップ162へ移行する。   If the determination in step 156 is negative, the process proceeds to step 106, and the number of unnecessary words = 0 is stored in the memory in association with the customer code. However, if the determination in step 156 is affirmative, the process proceeds to step 158. Of the unmatched words from which the logical index is extracted in step 152, the number of unmatched words (number of unnecessary words) registered in the unnecessary word dictionary as unnecessary words corresponding to the extracted logical index set is counted, and the count result is used as an unnecessary word. The number is set and stored in the memory in association with the customer code corresponding to the extracted logical index set, and the logical index of the unmatched word registered as an unnecessary word is also stored in the memory in association with the customer code. The process proceeds to step 162.

ステップ162では、処理対象に設定した全ての論理インデックスセットを取り出したか否か判定する。判定が否定された場合はステップ148に戻り、ステップ162の判定が肯定される迄ステップ148〜ステップ162を繰り返す。これにより、処理対象に設定した全ての論理インデックスセットについて、不要単語数がメモリに各々記憶されると共に、不要単語数≧1の論理インデックスセットについては、不要単語として登録されている不一致単語の論理インデックスも各々メモリに記憶されることになる。ステップ162の判定が肯定されるとステップ164へ移行する。ステップ164では、処理対象に設定した各論理インデックスセットの不要単語数を順に参照しながら不要単語数が1以上となっている論理インデックスセットの数を計数し、計数結果に応じて処理を分岐する。   In step 162, it is determined whether or not all logical index sets set as processing targets have been extracted. If the determination is negative, the process returns to step 148, and steps 148 to 162 are repeated until the determination of step 162 is affirmed. As a result, the number of unnecessary words is stored in the memory for all logical index sets set as processing targets, and the logic of mismatched words registered as unnecessary words for the logical index set with the number of unnecessary words ≧ 1. Each index is also stored in the memory. If the determination at step 162 is affirmative, the routine proceeds to step 164. In step 164, the number of logical index sets in which the number of unnecessary words is 1 or more is counted while sequentially referring to the number of unnecessary words in each logical index set set as a processing target, and the process branches according to the count result. .

ここで、不要単語数が1以上となっている論理インデックスセットの数が0の場合(変換対象文字列における処理対象の各論理インデックスに対応する文字列との不一致単語が、何れも不要単語辞書に登録されていない場合)には、処理対象の個々の論理インデックスセットに対応する顧客名称の何れかを表していると過去に判定された文字列の中に、先のステップ153で論理インデックスが抽出された不一致単語が付加された文字列が存在していなかったことになるので、変換対象文字列が処理対象の個々の論理インデックスセットに対応する顧客名称の何れを表しているかを判断することは困難である。このため、不要単語数が1以上の論理インデックスセットの数が0の場合にはステップ174へ移行し、変換対象文字列をディスプレイ16に表示させると共に、処理対象の個々の論理インデックスセットに対応する文字列、顧客コード等の情報をディスプレイ16に表示させ、更に所定のメッセージをディスプレイ16に表示させることで、変換対象文字列が表している顧客名称の判定をオペレータへ要請する。   Here, when the number of logical index sets in which the number of unnecessary words is 1 or more is 0 (any word that does not match the character string corresponding to each logical index to be processed in the conversion target character string is an unnecessary word dictionary) In the case where the logical index is not registered in the previous step 153, the logical index is included in the character string previously determined to represent one of the customer names corresponding to each logical index set to be processed. Since there is no character string to which the extracted mismatched word is added, it is determined whether the conversion target character string represents a customer name corresponding to each logical index set to be processed. It is difficult. For this reason, when the number of logical index sets having one or more unnecessary words is zero, the process proceeds to step 174 to display the conversion target character string on the display 16 and to correspond to each logical index set to be processed. Information such as a character string and a customer code is displayed on the display 16 and a predetermined message is further displayed on the display 16 to request the operator to determine the customer name represented by the character string to be converted.

次のステップ176ではオペレータによる判定結果が入力されたか否か判定し、判定が肯定される迄ステップ176を繰り返す。要請に従い顧客名称を判定したオペレータが判定結果を表す情報をキーボード20を介して入力すると、ステップ176の判定が肯定されてステップ178へ移行し、変換対象文字列に対応する顧客コードとして、入力された判定結果に相当する顧客コードを出力した後にステップ94(図4参照)へ移行する。なお、ステップ174〜ステップ178は請求項5に記載の変換手段に対応している。この場合も、変換対象文字列が、オペレータによって判定された顧客名称に対して余計な単語(不一致単語)が付加されている文字列であれば、ステップ94の判定が肯定されてステップ96へ移行し、この不一致単語が、判定された顧客についての不要単語として不要単語辞書に登録されることになるので、次回以降に、同一の顧客を表す文字列として、同一の単語(不要単語)が付加された文字列が出現した場合には、この不要単語に基づき、オペレータの手を再度煩わすことなく変換対象文字列が表す顧客名称を自動的に判定することができる。   In the next step 176, it is determined whether or not a determination result by the operator has been input, and step 176 is repeated until the determination is affirmed. When the operator who has determined the customer name according to the request inputs information representing the determination result via the keyboard 20, the determination in step 176 is affirmed and the process proceeds to step 178, where the customer code corresponding to the character string to be converted is input. After outputting the customer code corresponding to the determination result, the process proceeds to step 94 (see FIG. 4). Steps 174 to 178 correspond to the conversion means described in claim 5. Also in this case, if the conversion target character string is a character string in which an extra word (mismatch word) is added to the customer name determined by the operator, the determination in step 94 is affirmed and the process proceeds to step 96. Since the mismatch word is registered in the unnecessary word dictionary as an unnecessary word for the determined customer, the same word (unnecessary word) is added as a character string representing the same customer from the next time onward. When the written character string appears, the customer name represented by the character string to be converted can be automatically determined based on the unnecessary word without trouble of the operator again.

また、不要単語数が1以上となっている論理インデックスセットの数が1の場合は、処理対象の個々の論理インデックスセットのうち、不要単語数が1以上となっている単一の論理インデックスセットについてのみ、先のステップ153で抽出された不一致単語のうち1個以上の不一致単語が不要単語として不要単語辞書に登録されているので、不要単語数が1以上となっている論理インデックスセットに対応する顧客名称を表していると過去に判定された文字列の中に、不要単語として登録されている上記の不一致単語が付加された文字列が存在していたことになり、変換対象文字列は不要単語数が1以上となっている論理インデックスセットに対応する顧客名称を表している確率が非常に高いと判断できる。   Further, when the number of logical index sets whose number of unnecessary words is 1 or more is 1, a single logical index set whose number of unnecessary words is 1 or more among the individual logical index sets to be processed. Only, since one or more mismatched words extracted in the previous step 153 are registered as unnecessary words in the unnecessary word dictionary, it corresponds to a logical index set in which the number of unnecessary words is 1 or more. The character string to which the above mismatched word registered as an unnecessary word was added in the character string determined in the past as representing the customer name to be converted, and the conversion target character string is It can be determined that the probability of representing the customer name corresponding to the logical index set in which the number of unnecessary words is 1 or more is very high.

例えば変換対象文字列が「AKASAKA BANK CO.,LTD SHINZYUKU」である場合、図2(B)に示す情報が名称辞書に登録されているとすると、検索処理によって顧客A(名称が「AKASAKA BANK CO.,LTD」)と顧客E(名称「SHINZYUKU BANK CO.,LTD」)論理インデックスセットが各々抽出される。変換対象文字列と顧客Aの名称との不一致単語は「SHINZYUKU」(論理インデックスは「111」)、変換対象文字列と顧客Eの名称との不一致単語は「AKASAKA」(論理インデックスは「100」)、であるが、図2(C)からも明らかなように、不要単語辞書には顧客Aの不要単語として「SHINZYUKU」が登録されており、これに伴って顧客Aの論理インデックスセットについては不要単語数=1となるのに対し、不要単語辞書には顧客Eの不要単語は登録されておらず、顧客Eの論理インデックスセットについては不要単語数=0となる。従って、顧客Aの名称を表していると過去に判定された文字列の中には不一致単語「SHINZYUKU」が付加された文字列が存在しているのに対し、顧客Eの名称を表していると過去に判定された文字列の中には不一致単語「AKASAKA」が付加された文字列が存在していないことになり、変換対象文字列は顧客Aの名称を表している確率が非常に高いと判断できる。   For example, when the conversion target character string is “AKASAKA BANK CO., LTD SHINZYUKU” and the information shown in FIG. 2B is registered in the name dictionary, the customer A (name “AKASAKA BANK CO ., LTD ") and customer E (named" SHINZYUKU BANK CO., LTD ") logical index sets are extracted respectively. The mismatch word between the conversion target character string and the name of customer A is “SHINZYUKU” (logical index is “111”), and the mismatch word between the conversion target character string and the name of customer E is “AKASAKA” (logical index is “100”). However, as is clear from FIG. 2C, “SHINZYUKU” is registered as an unnecessary word of the customer A in the unnecessary word dictionary, and the logical index set of the customer A is associated with this. Whereas the number of unnecessary words = 1, the unnecessary word of customer E is not registered in the unnecessary word dictionary, and the number of unnecessary words = 0 for the logical index set of customer E. Therefore, the character string to which the mismatch word “SHINZYUKU” is added exists in the character string determined in the past as representing the name of the customer A, while the name of the customer E is represented. The character string to which the mismatch word “AKASAKA” is added does not exist in the character strings determined in the past, and the conversion target character string has a very high probability of representing the name of the customer A. It can be judged.

このため、不要単語数が1以上となっている論理インデックスセットの数が1の場合はステップ164からステップ172へ移行し、変換対象文字列に対応する顧客コードとして、不要単語数が1以上となっている論理インデックスセットに対応する顧客コードを出力した後にステップ94(図4参照)へ移行する。この場合も、変換対象文字列が、出力した顧客コードに対応する顧客名称に対し、不要単語として未登録の余計な単語(不一致単語)が付加されている文字列であれば、ステップ94の判定が肯定されてステップ96へ移行し、この不一致単語が、出力した顧客コードに対応する顧客についての不要単語として不要単語辞書に登録されることになる。   For this reason, when the number of logical index sets in which the number of unnecessary words is 1 or more is 1, the process moves from step 164 to step 172, and the number of unnecessary words is 1 or more as the customer code corresponding to the conversion target character string. After outputting the customer code corresponding to the logical index set, the process proceeds to step 94 (see FIG. 4). Also in this case, if the character string to be converted is a character string in which an extra word (unmatched word) not registered as an unnecessary word is added to the customer name corresponding to the output customer code, the determination in step 94 is made. Is affirmed and the process proceeds to step 96, and the mismatch word is registered in the unnecessary word dictionary as an unnecessary word for the customer corresponding to the output customer code.

ところで、例えば変換対象文字列が「NAKADA AND AKASAKA BANK CO.,LTD SHINZYUKU BRANCH」である場合、図2(B)に示す情報が名称辞書に登録されているとすると、検索処理によって顧客A(「AKASAKA BANK CO.,LTD」)、顧客E(「SHINZYUKU BANK CO.,LTD」)及び顧客F(「NAKADA AND AKASAKA CO.,LTD」)の論理インデックスセットが各々抽出される。変換対象文字列と顧客Aの名称との不一致単語は「NAKADA」「AND」「AKASAKA」「SHINZYUKU」「BRANCH」であるが、図2(C)からも明らかなように、このうち不要単語辞書に顧客Aの不要単語として登録されているのは「AND」と「SHINZYUKU」のみであるので、顧客Aについては不要単語数=2となり、これら2個の不要単語の論理インデックスがメモリに記憶される。また、顧客Eについては「NAKADA」「AND」「AKASAKA」「BRANCH」が不一致単語となるが、不要単語辞書には顧客Eの不要単語が登録されていないので顧客Eについては不要単語数=0となる。更に、顧客Fについては「BANK」「SHINZYUKU」「BRANCH」が不一致単語となり、これらの不一致単語は顧客Fの不要単語として不要単語辞書に各々登録されているので、顧客Fについては不要単語数=3となり、3個の不要単語の論理インデックスがメモリに記憶される。この例では、不要単語数が1以上となっている論理インデックスセットの数が「2」となる。   By the way, for example, when the conversion target character string is “NAKADA AND AKASAKA BANK CO., LTD SHINZYUKU BRANCH”, if the information shown in FIG. 2B is registered in the name dictionary, the customer A (“ AKASAKA BANK CO., LTD "), customer E (" SHINZYUKU BANK CO., LTD ") and customer F (" NAKADA AND AKASAKA CO., LTD ") are extracted. The inconsistent words between the conversion target character string and the name of customer A are “NAKADA”, “AND”, “AKASAKA”, “SHINZYUKU”, and “BRANCH”, but as is apparent from FIG. Since only “AND” and “SHINZYUKU” are registered as unnecessary words of customer A, the number of unnecessary words is 2 for customer A, and the logical index of these two unnecessary words is stored in the memory. The For customer E, “NAKADA”, “AND”, “AKASAKA”, and “BRANCH” are mismatched words, but since the unnecessary word of customer E is not registered in the unnecessary word dictionary, the number of unnecessary words for customer E = 0. It becomes. Furthermore, for customer F, “BANK”, “SHINZYUKU”, and “BRANCH” are mismatched words, and these mismatched words are registered in the unnecessary word dictionary as unnecessary words of customer F, so the number of unnecessary words for customer F = 3 and the logical indexes of the three unnecessary words are stored in the memory. In this example, the number of logical index sets in which the number of unnecessary words is 1 or more is “2”.

ここで、変換対象文字列が表している顧客名称の判断には、処理対象の個々の論理インデックスセットの不要単語数を単純に比較してもよいが(本発明はこの態様も権利範囲に含まれる)、或る論理インデックスセットにおける不要単語が他の論理インデックスセットでも不要単語となっていた場合(不要単語が重複していた場合)、この不要単語に基づいて変換対象文字列が表している顧客名称を特定することは困難であるので、この不要単語を除外した方が判定精度が向上することが期待される。   Here, for the determination of the customer name represented by the conversion target character string, the number of unnecessary words in each logical index set to be processed may be simply compared (this invention is also included in the scope of rights). When an unnecessary word in a certain logical index set is an unnecessary word in another logical index set (when unnecessary words are duplicated), the conversion target character string is represented based on this unnecessary word. Since it is difficult to specify the customer name, it is expected that the determination accuracy is improved by removing this unnecessary word.

このため、不要単語数が1以上となっている論理インデックスセットの数が1よりも大きい(該当する論理インデックスセットが複数存在している)場合には、ステップ164からステップ166へ移行し、処理対象の個々の論理インデックスセットについてメモリに各々記憶した不要単語の論理インデックスを相互に比較することで、個々の論理インデックスセット(に対応する顧客コード)毎の不要単語の重複があるか否か判定する。判定が否定された場合は何ら処理を行うことなくステップ170へ移行するが、判定が肯定された場合はステップ168へ移行し、不要単語が重複している論理インデックスセット(に対応する顧客コード)の不要単語数を、重複している不要単語の数だけ減算した後にステップ170へ移行する。   For this reason, if the number of logical index sets whose number of unnecessary words is 1 or more is larger than 1 (a plurality of relevant logical index sets exist), the process proceeds from step 164 to step 166 to perform processing. By comparing the logical indexes of unnecessary words stored in the memory for each target logical index set with each other, it is determined whether or not there is an unnecessary word duplication for each logical index set (corresponding customer code). To do. If the determination is negative, the process proceeds to step 170 without performing any processing. If the determination is affirmative, the process proceeds to step 168, and a logical index set in which unnecessary words are duplicated (corresponding customer code). After subtracting the number of unnecessary words by the number of redundant unnecessary words, the process proceeds to step 170.

例えば前述の例では、顧客Aについての不要単語が「AND」と「SHINZYUKU」であり、顧客Fについての不要単語が「BANK」「SHINZYUKU」「BRANCH」であるので、不要単語「SHINZYUKU」が重複しており、ステップ168の処理により、顧客A及び顧客Fの不要単語数から各々1ずつ減算されることになる。この例では、顧客Aの不要単語数=1、顧客Fの不要単語数=2となるので、結果として不要単語数の大小関係は変わらないが、例えば、或る論理インデックスセットにおける不要単語の大多数が他の論理インデックスセットにおける不要単語と重複していた等の場合には、ステップ168の処理によって当該顧客の不要単語数が減少されることで不要単語数の大小関係が変化し、変換対象文字列が表している確率が高いと推定される顧客名称に対応する論理インデックスセットにおける不要単語数が相対的に増大することになる。   For example, in the above example, the unnecessary words for customer A are “AND” and “SHINZYUKU”, and the unnecessary words for customer F are “BANK”, “SHINZYUKU”, and “BRANCH”, so the unnecessary word “SHINZYUKU” is duplicated. In the process of step 168, one is subtracted from the number of unnecessary words of customer A and customer F, respectively. In this example, the number of unnecessary words of the customer A = 1 and the number of unnecessary words of the customer F = 2, and as a result, the size relationship of the number of unnecessary words does not change. For example, the number of unnecessary words in a certain logical index set is large. If a large number of words overlaps with unnecessary words in other logical index sets, the number of unnecessary words of the customer is reduced by the processing in step 168, so that the size relationship of the number of unnecessary words changes, and the conversion target The number of unnecessary words in the logical index set corresponding to the customer name presumed to have a high probability represented by the character string is relatively increased.

ステップ170では、処理対象に設定した各論理インデックスセットに対応してメモリに記憶されている不要単語数を順に参照し、不要単語数の最大値を抽出すると共に不要単語数が最大値となっている論理インデックスセットの数を計数した後に、この計数結果に基づいて、処理対象に設定した各論理インデックスセットの中に、不要単語数が最大値となっている論理インデックスセットが複数存在しているか否か判定する。不要単語数が最大値となっている論理インデックスセットが1個のみである場合、変換対象文字列はこの論理インデックスセットに対応する顧客名称を表している確率が高いと判断できる。このため、ステップ170の判定が否定された場合はステップ172へ移行し、変換対象文字列に対応する顧客コードとして、不要単語数が最大の論理インデックスセットに対応する顧客コードを出力した後にステップ94(図4参照)へ移行する。例えば前述の例では、変換対象文字列が、不要単語数が最大(不要単語数=2)となっている顧客Fの名称を表していると判断され、顧客Fの顧客コードが出力されることになる。   In step 170, the number of unnecessary words stored in the memory corresponding to each logical index set set as a processing target is sequentially referenced to extract the maximum number of unnecessary words and the number of unnecessary words becomes the maximum value. After counting the number of existing logical index sets, whether there are multiple logical index sets with the maximum number of unnecessary words in each logical index set set as the processing target based on the count result Judge whether or not. When there is only one logical index set having the maximum number of unnecessary words, it can be determined that the conversion target character string has a high probability of representing the customer name corresponding to this logical index set. Therefore, if the determination in step 170 is negative, the process proceeds to step 172, and after outputting the customer code corresponding to the logical index set having the largest number of unnecessary words as the customer code corresponding to the character string to be converted, step 94 is performed. (See FIG. 4). For example, in the above-described example, it is determined that the conversion target character string represents the name of the customer F having the maximum number of unnecessary words (the number of unnecessary words = 2), and the customer code of the customer F is output. become.

一方、不要単語数が最大の論理インデックスセットが複数存在している場合には、変換対象文字列が不要単語数最大の複数の論理インデックスセットに対応する顧客名称のうちの何れを表しているかを判断することは困難である。このため、ステップ170の判定が肯定された場合はステップ174へ移行する。この場合、前述のように変換対象文字列が表している顧客名称の判定がオペレータによって行われることになる。   On the other hand, when there are a plurality of logical index sets with the maximum number of unnecessary words, it is determined which of the customer names corresponding to the plurality of logical index sets with the maximum number of unnecessary words is the character string to be converted. It is difficult to judge. For this reason, when the determination at step 170 is affirmed, the routine proceeds to step 174. In this case, as described above, the operator determines the customer name represented by the conversion target character string.

このように、本実施形態では、変換対象文字列が表す顧客名称(顧客コード)の判断に際し、検索処理によって複数の論理インデックスセットが抽出された場合に、上述した複数セット抽出時処理により、変換対象文字列中には存在しており抽出された論理インデックスセットに対応する文字列には存在していない不一致単語が不要単語として不要単語辞書に登録されているか否か、前記不一致単語のうち不要単語として登録されている単語の数(不要単語数)、及び、個々の論理インデックスにおける不要単語の重複の有無に基づいて、変換対象文字列に対応する論理インデックスセット(顧客コード)を判断するので、変換対象文字列が表す顧客名称(顧客コード)の判断を、オペレータの手を煩わすことなく自動的に行える確率を向上させることができる。   As described above, in the present embodiment, when a plurality of logical index sets are extracted by the search process when the customer name (customer code) represented by the conversion target character string is determined, the conversion is performed by the above-described multiple set extraction process. Whether or not a mismatch word that exists in the target character string and does not exist in the character string corresponding to the extracted logical index set is registered as an unnecessary word in the unnecessary word dictionary, and is unnecessary among the mismatch words Since the logical index set (customer code) corresponding to the conversion target character string is determined based on the number of words registered as words (the number of unnecessary words) and the presence / absence of unnecessary word duplication in each logical index Improves the probability that the customer name (customer code) represented by the character string to be converted can be automatically determined without bothering the operator It can be.

なお、上記では検索処理によって複数の論理インデックスセットが抽出され、不要単語数≧1の論理インデックスセットが複数存在していた場合に、不要単語数と不要単語の重複の有無に基づいて変換対象文字列が表す顧客名称(顧客コード)を判断する例を説明したが、本発明はこれに限定されるものではなく、例えば不要単語数及び不要単語の重複の有無の何れか一方に基づいて変換対象文字列が表す顧客名称(顧客コード)を判断するようにしてもよいし、これに代えて、個々の不要単語について、対応する顧客名称を表す文字列に出現する回数(又は頻度)を不要単語辞書に記憶しておき、不要単語数≧1の論理インデックスセットが複数存在していた場合に、個々の不要単語が対応する顧客名称を表す文字列に出現する出現頻度も勘案して(例えば個々の不要単語を出現頻度に応じて重み付けして評価値を算出する等)、変換対象文字列が表していると推定される顧客名称(顧客コード)を判断するようにしてもよい。   In the above, when a plurality of logical index sets are extracted by the search process and there are a plurality of logical index sets with the number of unnecessary words ≧ 1, conversion target characters are determined based on the number of unnecessary words and the presence or absence of unnecessary words. Although the example which judges the customer name (customer code) which a row | line | column represents was demonstrated, this invention is not limited to this, For example, conversion object is based on either one of the number of unnecessary words and the presence or absence of unnecessary word duplication Alternatively, the customer name (customer code) represented by the character string may be determined. Alternatively, for each unnecessary word, the number of times (or frequency) that appears in the character string representing the corresponding customer name is determined as the unnecessary word. When there are a plurality of logical index sets with the number of unnecessary words ≧ 1 stored in the dictionary, the frequency of appearance of each unnecessary word in the character string representing the corresponding customer name To determine the customer name (customer code) estimated to be represented by the conversion target character string (for example, calculating an evaluation value by weighting each unnecessary word according to the appearance frequency). Also good.

不要単語の出現頻度は、例えば個々の顧客名称を表す文字列が入力された回数を個々の顧客名称毎に各々不要単語辞書に記憶すると共に、個々の不要単語について対応する顧客名称を表す文字列に出現した回数を不要単語辞書に記憶しておき(これらの入力回数及び出現回数は請求項4に記載の頻度情報に対応している)、変換対象文字列が或る顧客名称を表していると判断する毎に、当該顧客名称に対応する文字列の入力回数をインクリメントすると共に、変換対象文字列に含まれる不要単語の出現回数をインクリメントすることを繰り返し、特定の不要単語の出現頻度を演算する際には、該特定の不要単語の出現回数を、対応する顧客名称を表す文字列の入力回数で除算することで求めることができる。   The frequency of appearance of unnecessary words is, for example, stored in the unnecessary word dictionary for each individual customer name the number of times a character string representing each individual customer name is input, and a character string representing the corresponding customer name for each unnecessary word Is stored in the unnecessary word dictionary (the number of input times and the number of appearances correspond to the frequency information described in claim 4), and the character string to be converted represents a certain customer name. Each time it is judged, the number of times of input of the character string corresponding to the customer name is incremented, and the number of times of appearance of the unnecessary word included in the conversion target character string is repeated to calculate the appearance frequency of the specific unnecessary word. In this case, the number of appearances of the specific unnecessary word can be determined by dividing the number of appearances of the character string representing the corresponding customer name.

また、上記では不要単語の論理インデックスのみを顧客コードと対応付けて不要単語辞書に登録する態様を例に説明したが、本発明はこれに限定されるものではなく、例えば不要単語の登録時に、不要単語を含む文字列における不要単語の位置も情報として登録しておき、変換対象文字列における不要単語の位置が不要単語辞書に登録されている位置と一致しているか否かも考慮して、変換対象文字列が表す顧客名称を判断するようにしてもよいし、上述したように、不要単語辞書に各不要単語の出現頻度又は出現回数も登録すると共に、この出現頻度又は出現回数を適宜更新し、出現頻度又は出現回数が所定値以上の不要単語のみを、変換対象文字列が表す顧客名称の判断に用いるようにしてもよい。   In the above description, an example in which only the logical index of unnecessary words is associated with the customer code and registered in the unnecessary word dictionary has been described as an example, but the present invention is not limited to this. For example, when registering unnecessary words, The position of the unnecessary word in the character string including the unnecessary word is also registered as information, and the conversion is performed in consideration of whether the position of the unnecessary word in the conversion target character string matches the position registered in the unnecessary word dictionary. The customer name represented by the target character string may be determined. As described above, the appearance frequency or the number of appearances of each unnecessary word is registered in the unnecessary word dictionary, and the appearance frequency or the number of appearances is appropriately updated. Only unnecessary words whose appearance frequency or number of appearances is greater than or equal to a predetermined value may be used for determining the customer name represented by the conversion target character string.

また、上記では変換対象文字列から取り出した単語が基本語辞書に登録されていなかった場合に、該単語に論理インデックスを付与して基本語辞書に新規に登録する処理を行うことで、変換対象文字列を構成する全ての単語を論理インデックスへ各々変換する例を説明したが、これに限定されるものではなく、変換対象文字列を構成する各単語のうち基本語辞書に未登録の単語については、論理インデックスへ変換することなくテキストデータのまま以降の処理を行うようにしてもよい。この場合、不要単語辞書及び補助辞書には、論理インデックスとして登録される単語とテキストデータとして登録される単語が混在する可能性があるが、本発明はこのような態様も権利範囲に含むものである。   In addition, in the above, when a word extracted from the conversion target character string is not registered in the basic word dictionary, a logical index is assigned to the word and newly registered in the basic word dictionary, thereby performing conversion Although an example of converting all the words constituting a character string to a logical index has been described, the present invention is not limited to this, and words that are not registered in the basic word dictionary among the words constituting the character string to be converted In this case, the subsequent processing may be performed as it is without converting to the logical index. In this case, there is a possibility that words registered as logical indexes and words registered as text data may coexist in the unnecessary word dictionary and the auxiliary dictionary, but the present invention includes such an aspect within the scope of rights.

更に、上記では本発明に係る文字列として、顧客名称を表す文字列を例に説明したが、本発明はこれに限定されるものではなく、複数の単語が組合わされて成る任意の対象を表す文字列に適用可能である。   In the above description, the character string representing the customer name is described as an example of the character string according to the present invention. However, the present invention is not limited to this, and represents an arbitrary object formed by combining a plurality of words. Applicable to strings.

本実施形態に係るコンピュータ・システムの概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the computer system which concerns on this embodiment. (A)は基本語辞書の一例、(B)は名称辞書の一例、(C)は不要単語辞書の一例を各々示すイメージ図である。(A) is an example of a basic word dictionary, (B) is an example of a name dictionary, and (C) is an image diagram showing an example of an unnecessary word dictionary. 顧客コード変換処理の内容を示すフローチャートである。It is a flowchart which shows the content of the customer code conversion process. 顧客コード判定処理の内容を示すフローチャートである。It is a flowchart which shows the content of the customer code determination process. 複数セット抽出時処理の内容を示すフローチャートである。It is a flowchart which shows the content of the process at the time of multiple set extraction.

符号の説明Explanation of symbols

10 コンピュータ・システム
12 コンピュータ
16 ディスプレイ
18 マウス
20 キーボード
22 HDD
28 ネットワーク
30 コンピュータ
10 Computer System 12 Computer 16 Display 18 Mouse 20 Keyboard 22 HDD
28 network 30 computer

Claims (8)

所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表していると推定される前記所定の対象に付与された識別情報へ変換する情報変換装置であって、
識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書を記憶する第1記憶手段と、
過去に入力された、特定の対象を表し、かつ特定の対象に付与された識別情報と対応付けられて前記名称辞書に登録されている単語の組合わせに対して単一又は複数の特定単語を付加した単語の組合わせで構成された文字列における前記単一又は複数の特定単語が、前記特定の対象に付与された識別情報と対応付けられ、前記特定の対象の不要単語として登録された不要単語辞書を記憶する第2記憶手段と、
入力された文字列を構成する単語の組合わせを前記名称辞書に登録されている単語の組合わせと各々比較することで、構成する各単語が前記入力された文字列中に各々存在している単語の組合わせを検索する検索手段と、
前記検索手段による検索結果に基づいて、前記入力された文字列が表していると推定される対象を判断し、前記入力された文字列を前記判断した対象に付与された識別情報へ変換すると共に、前記検索手段による検索によって抽出された単語の組合わせの中に、前記入力された文字列を構成する複数の単語から単一又は複数の第1特定単語を除外した単語の組合わせと、前記入力された文字列を構成する複数の単語から単一又は複数の第2特定単語を除外した単語の組合わせが各々含まれていた場合に、前記第1特定単語を除外した単語の組合わせと対応付けられて前記名称辞書に登録されている第1の識別情報が、前記単一又は複数の第1特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索すると共に、前記第2特定単語を除外した単語の組合わせと対応付けられて前記名称辞書に登録されている第2の識別情報が、前記単一又は複数の第2特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索し、前記第1及び第2の識別情報の一方のみが前記単一又は複数の第1特定単語の少なくとも1つ、又は前記単一又は複数の第2特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されていた場合に、前記入力された文字列が、前記第1及び第2の識別情報のうち前記不要単語辞書に登録されている識別情報に対応する対象を表していると判断する変換手段と、
を備えたことを特徴とする情報変換装置。
Each time a character string composed of a plurality of words combined to represent a predetermined object is input, the input character string is presumed to be represented by the input character string. An information conversion device for converting into identification information given to the target of
For each object to which identification information is assigned, a name dictionary registered by associating a combination of identification information given to each object and a word constituting a character string representing each object is stored. First storage means;
A single or a plurality of specific words for a combination of words that have been input in the past and that are registered in the name dictionary in association with identification information assigned to the specific target The single or plural specific words in the character string configured by the combination of the added words are associated with the identification information given to the specific target and are registered as unnecessary words of the specific target Second storage means for storing a word dictionary;
By comparing each combination of words constituting the input character string with each combination of words registered in the name dictionary, each of the constituent words is present in the input character string. A search means for searching for word combinations;
Based on a search result by the search means, a target estimated to be represented by the input character string is determined, and the input character string is converted into identification information given to the determined target. A combination of words excluding a single or a plurality of first specific words from a plurality of words constituting the input character string in a combination of words extracted by a search by the search means; A combination of words excluding the first specific word when a combination of words excluding a single or plural second specific words is included from a plurality of words constituting the input character string; Search whether or not the first identification information associated and registered in the name dictionary is associated with at least one of the single or plural first specific words and registered in the unnecessary word dictionary Then Second identification information associated with a combination of words excluding the second specific word and registered in the name dictionary is associated with at least one of the single or plural second specific words Whether or not it is registered in the unnecessary word dictionary and only one of the first and second identification information is at least one of the single or plural first specific words, or the single or When the unnecessary character dictionary is associated with at least one of the plurality of second specific words and registered in the unnecessary word dictionary, the input character string is included in the unnecessary word dictionary of the first and second identification information. Conversion means for determining that the object corresponds to the registered identification information;
An information conversion device comprising:
前記変換手段は、前記第1の識別情報が前記単一又は複数の第1特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索すると共に、前記第2の識別情報が前記単一又は複数の第2特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索した結果、前記第1及び第2の識別情報が前記単一又は複数の第1特定単語の少なくとも1つ、又は前記単一又は複数の第2特定単語の少なくとも1つと対応付けられて前記不要単語辞書に各々登録されていた場合に、前記第1及び第2識別情報のうち、前記第1特定単語又は第2特定単語に含まれている単語の中で、第1及び第2識別情報と各々対応付けられて前記不要単語辞書に登録されている単語以外の単語と対応付けられている識別情報を判定し、前記入力された文字列が前記判定した識別情報に対応する対象を表していると判断することを特徴とする請求項1記載の情報変換装置。   The conversion means searches whether the first identification information is registered in the unnecessary word dictionary in association with at least one of the single or plural first specific words, and the second As a result of searching whether the identification information is associated with at least one of the single or plural second specific words and registered in the unnecessary word dictionary, the first and second identification information are the single Or the first and second when each of the first specific word is registered in the unnecessary word dictionary in association with at least one of the plurality of first specific words or at least one of the single or plural second specific words. Among the identification information, among the words included in the first specific word or the second specific word, other than the words registered in the unnecessary word dictionary associated with the first and second identification information, respectively. Associated with a word Determining the identification information are information converter according to claim 1, wherein said input character string is and determines that represent the object corresponding to the determined identification information. 前記変換手段は、前記第1の識別情報が前記単一又は複数の第1特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索すると共に、前記第2の識別情報が前記単一又は複数の第2特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索した結果、前記第1及び第2の識別情報が前記単一又は複数の第1特定単語の少なくとも1つ、又は前記単一又は複数の第2特定単語の少なくとも1つと対応付けられて前記不要単語辞書に各々登録されていた場合に、前記第1及び第2識別情報のうち、前記第1特定単語又は前記第2特定単語として入力文字列に含まれている、より多数の単語と対応付けられて前記不要単語辞書に登録されている識別情報を判定し、前記入力された文字列が前記判定した識別情報に対応する対象を表していると判断することを特徴とする請求項1記載の情報変換装置。   The conversion means searches whether the first identification information is registered in the unnecessary word dictionary in association with at least one of the single or plural first specific words, and the second As a result of searching whether the identification information is associated with at least one of the single or plural second specific words and registered in the unnecessary word dictionary, the first and second identification information are the single Or the first and second when each of the first specific word is registered in the unnecessary word dictionary in association with at least one of the first specific words or at least one of the single or plural second specific words. Among the identification information, the identification information that is included in the input character string as the first specific word or the second specific word and is associated with a larger number of words and registered in the unnecessary word dictionary is determined, The input Character string information converter according to claim 1, characterized in that it is determined that represents the object corresponding to the determined identification information. 前記第2記憶手段に記憶されている不要単語辞書には、過去に入力された文字列において、前記文字列が表す特定の対象の不要単語の出現頻度を表す頻度情報が、前記不要単語辞書に登録されている個々の不要単語について各々登録されており、
前記変換手段は、前記検索手段による検索結果に基づいて、前記入力された文字列が表していると推定される対象を判断する毎に、前記入力された文字列に該文字列が表す特定の対象の不要単語が含まれているか否かに基づいて、前記不要単語辞書に登録されている前記特定の対象の不要単語の頻度情報を更新すると共に、前記検索手段による検索によって抽出された単語の組合わせの中に、前記入力された文字列を構成する複数の単語から単一又は複数の第1特定単語を除外した単語の組合わせと、前記入力された文字列を構成する複数の単語から単一又は複数の第2特定単語を除外した単語の組合わせが各々含まれており、前記第1の識別情報が前記単一又は複数の第1特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索すると共に、前記第2の識別情報が前記単一又は複数の第2特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索した結果、前記第1及び第2の識別情報が前記単一又は複数の第1特定単語の少なくとも1つ、又は前記単一又は複数の第2特定単語の少なくとも1つと対応付けられて前記不要単語辞書に各々登録されていた場合に、前記第1特定単語又は前記第2特定単語として入力文字列に含まれており、かつ第1及び第2識別情報と各々対応付けられて前記不要単語辞書に登録されている個々の不要単語の頻度情報に基づいて、前記入力された文字列が表している対象を判断することを特徴とする請求項1記載の情報変換装置。
In the unnecessary word dictionary stored in the second storage unit, in the character string input in the past, frequency information indicating the frequency of appearance of a specific target unnecessary word represented by the character string is stored in the unnecessary word dictionary. Each registered unnecessary word is registered,
Each time the conversion means determines a target estimated to be represented by the input character string based on a search result by the search means, a specific character string that the character string represents in the input character string Based on whether or not the target unnecessary word is included, the frequency information of the unnecessary word of the specific target registered in the unnecessary word dictionary is updated, and the word extracted by the search by the search unit is updated. In a combination, a combination of words excluding a single or a plurality of first specific words from a plurality of words constituting the inputted character string, and a plurality of words constituting the inputted character string A combination of words excluding single or plural second specific words is included, and the first identification information is associated with at least one of the single or plural first specific words and is unnecessary. Add to word dictionary As a result of searching whether or not the second identification information is associated with at least one of the single or plural second specific words and registered in the unnecessary word dictionary. The first and second identification information are associated with at least one of the single or plural first specific words or at least one of the single or plural second specific words in the unnecessary word dictionary. When each is registered, it is included in the input character string as the first specific word or the second specific word, and is registered in the unnecessary word dictionary in association with the first and second identification information. The information conversion apparatus according to claim 1, wherein an object represented by the input character string is determined based on frequency information of each unnecessary word.
前記変換手段は、前記第1の識別情報が前記単一又は複数の第1特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索すると共に、前記第2の識別情報が前記単一又は複数の第2特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索した結果、前記第1及び第2の識別情報が何れも前記第1特定単語又は前記第2特定単語と対応付けられて前記不要単語辞書に登録されていなかった場合に、前記入力された文字列を表示装置に表示させることで、前記入力された文字列が表す対象の判断をオペレータに委ね、オペレータにより入力装置を介して入力された判断結果に基づいて、前記入力された文字列が表す対象を判断することを特徴とする請求項1記載の情報変換装置。   The conversion means searches whether the first identification information is registered in the unnecessary word dictionary in association with at least one of the single or plural first specific words, and the second As a result of searching whether the identification information is associated with at least one of the single or plural second specific words and registered in the unnecessary word dictionary, both the first and second identification information are the When the input character string is not registered in the unnecessary word dictionary in association with the first specific word or the second specific word, the input character string is displayed on the display device. 2. The information variable according to claim 1, wherein the determination of the object to be represented is entrusted to an operator, and the object to be represented by the input character string is determined based on a determination result input by the operator via the input device. Apparatus. 前記検索手段による検索によって抽出された単語の組合わせの中に、前記入力された文字列を構成する複数の単語から単一又は複数の特定単語を除外した単語の組合わせが含まれており、かつ前記変換手段により、前記入力された文字列が、前記特定単語を除外した単語の組合わせに対応する特定の対象を表していると判断された場合に、前記特定単語を前記特定の対象に付与された識別情報と対応付け、前記不要単語辞書に前記特定の対象の不要単語として登録する不要単語登録手段を更に備えたことを特徴とする請求項1記載の情報変換装置。   The combination of words extracted by the search by the search means includes a combination of words excluding a single or a plurality of specific words from a plurality of words constituting the input character string, And when the said conversion means judges that the said input character string represents the specific object corresponding to the combination of the word except the said specific word, the said specific word is made into the said specific object. 2. The information conversion apparatus according to claim 1, further comprising an unnecessary word registering unit that associates with the given identification information and registers the unnecessary word as the specific target unnecessary word in the unnecessary word dictionary. 入力される文字列を構成する個々の単語に相当する文字列と個々の単語に付与された論理インデックスが対応付られけて予め各々登録された基本語辞書を記憶する第3記憶手段と、
入力された文字列を構成する個々の単語に相当する文字列をキーにして前記基本語辞書の検索を各々行うことで、入力された文字列を、該文字列を構成する個々の単語を単位として論理インデックスへ変換する単語変換手段と、
を更に備え、
前記名称辞書には前記単語の組合わせとして前記論理インデックスの組合わせが登録され、前記不要単語辞書には前記不要単語として論理インデックスが登録されており、
前記検索手段及び前記変換手段は、前記入力された文字列として、前記入力された文字列が前記単語変換手段によって単語単位で変換されることで得られる論理インデックスの組合わせを用いて各処理を行うことを特徴とする請求項1乃至請求項6の何れか1項記載の情報変換装置。
Third storage means for storing a basic word dictionary registered in advance by associating a character string corresponding to each word constituting the input character string and a logical index assigned to each word;
By searching the basic word dictionary using character strings corresponding to individual words constituting the inputted character string as keys, the inputted character string is divided into individual words constituting the character string. A word conversion means for converting into a logical index as
Further comprising
In the name dictionary, the logical index combination is registered as a combination of the words, and in the unnecessary word dictionary, a logical index is registered as the unnecessary word,
The search means and the conversion means perform each processing using a combination of logical indexes obtained by converting the input character string in units of words by the word conversion means as the input character string. The information conversion device according to claim 1, wherein the information conversion device is performed.
コンピュータを、所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表していると推定される前記所定の対象に付与された識別情報へ変換する情報変換装置として機能させるための情報変換プログラムであって、
前記コンピュータは、識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書を記憶する第1記憶手段と、過去に入力された、特定の対象を表し、かつ特定の対象に付与された識別情報と対応付けられて前記名称辞書に登録されている単語の組合わせに対して単一又は複数の特定単語を付加した単語の組合わせで構成された文字列における前記単一又は複数の特定単語が、前記特定の対象に付与された識別情報と対応付けられ、前記特定の対象の不要単語として登録された不要単語辞書を記憶する第2記憶手段と、を備え、
前記コンピュータを、
入力された文字列を構成する単語の組合わせを前記名称辞書に登録されている単語の組合わせと各々比較することで、構成する各単語が前記入力された文字列中に各々存在している単語の組合わせを検索する検索手段、
及び、 前記検索手段による検索結果に基づいて、前記入力された文字列が表していると推定される対象を判断し、前記入力された文字列を前記判断した対象に付与された識別情報へ変換すると共に、前記検索手段による検索によって抽出された単語の組合わせの中に、前記入力された文字列を構成する複数の単語から単一又は複数の特定単語を除外した単語の組合わせが含まれていた場合に、前記単一又は複数の特定単語を除外した単語の組合わせと対応付けられて前記名称辞書に登録されている特定の識別情報が、前記単一又は複数の特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されているか否かを検索し、前記特定の識別情報が前記単一又は複数の特定単語の少なくとも1つと対応付けられて前記不要単語辞書に登録されていた場合に、前記入力された文字列が、前記特定の識別情報が付与された対象を表していると判断する変換手段
として機能させることを特徴とする情報変換プログラム。
Each time a character string composed of a plurality of words combined to represent a predetermined object is input, it is estimated that the input character string represents the input character string. An information conversion program for functioning as an information conversion device for converting into identification information given to the predetermined target,
For each object to which identification information is assigned, the computer registers each of the identification information assigned to each object and a combination of words constituting a character string representing each object, and registered A first storage means for storing a dictionary and a combination of words registered in the name dictionary in association with identification information given in the past and representing a specific target. The single or plural specific words in a character string composed of a combination of words to which a single or plural specific words are added are associated with the identification information given to the specific object, and the specific A second storage means for storing an unnecessary word dictionary registered as an unnecessary word of the target,
The computer,
By comparing each combination of words constituting the input character string with each combination of words registered in the name dictionary, each of the constituent words is present in the input character string. Search means for searching for word combinations,
And based on the search result by the search means, a target estimated to be represented by the input character string is determined, and the input character string is converted into identification information given to the determined target In addition, the combination of words extracted by the search by the search means includes a combination of words excluding a single word or a plurality of specific words from a plurality of words constituting the input character string. If the specific identification information registered in the name dictionary in association with a combination of words excluding the single or plural specific words is at least one of the single or plural specific words Whether the specific identification information is associated with at least one of the single or plural specific words and stored in the unnecessary word dictionary. An information conversion program that, when registered, causes the input character string to function as a conversion unit that determines that the character string represents an object to which the specific identification information is assigned.
JP2004363961A 2004-12-16 2004-12-16 Information conversion apparatus and program Active JP4076533B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004363961A JP4076533B2 (en) 2004-12-16 2004-12-16 Information conversion apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004363961A JP4076533B2 (en) 2004-12-16 2004-12-16 Information conversion apparatus and program

Publications (2)

Publication Number Publication Date
JP2006172151A JP2006172151A (en) 2006-06-29
JP4076533B2 true JP4076533B2 (en) 2008-04-16

Family

ID=36672836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004363961A Active JP4076533B2 (en) 2004-12-16 2004-12-16 Information conversion apparatus and program

Country Status (1)

Country Link
JP (1) JP4076533B2 (en)

Also Published As

Publication number Publication date
JP2006172151A (en) 2006-06-29

Similar Documents

Publication Publication Date Title
US7866542B2 (en) System and method for resolving identities that are indefinitely resolvable
JP5002751B2 (en) Two-step data validation and mapping for database access
US8055498B2 (en) Systems and methods for building an electronic dictionary of multi-word names and for performing fuzzy searches in the dictionary
JP4701292B2 (en) Computer system, method and computer program for creating term dictionary from specific expressions or technical terms contained in text data
US8756207B2 (en) Systems and methods for identifying potential duplicate entries in a database
JP2790466B2 (en) Character string search method and apparatus
US20170147688A1 (en) Automatically mining patterns for rule based data standardization systems
AU2019279987B2 (en) Automated document analysis comprising company name recognition
WO2023151252A1 (en) Feature matching rule construction and feature matching method and apparatus, device and medium
CN116415564B (en) Functional point amplification method and system based on knowledge graph
US20210133515A1 (en) Automated rule generation framework using machine learning for classification problems
CN112016967B (en) Transaction data processing method and device
JP4687089B2 (en) Duplicate record detection system and duplicate record detection program
CN116383412B (en) Functional point amplification method and system based on knowledge graph
JP4185399B2 (en) Customer data management apparatus, customer data management method, customer data management program, and recording medium storing customer data management program
JP2003173345A (en) Database generation device, database generation method, and database generation processing program
JP4076533B2 (en) Information conversion apparatus and program
CN115982310A (en) Link table generation method with verification function and electronic equipment
CN115906851A (en) Entity identification method and device, electronic equipment and storage medium
JP3131142B2 (en) Map data linkage system
US11341190B2 (en) Name matching using enhanced name keys
JP3972310B2 (en) Information conversion apparatus and program
JP3972309B2 (en) Information conversion apparatus and program
JP4139805B2 (en) Apparatus, method and program for converting lexical data to data
TWI844091B (en) Feature matching rule construction, feature matching method, device, equipment and medium

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080129

R150 Certificate of patent or registration of utility model

Ref document number: 4076533

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140208

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250