JP2006099346A

JP2006099346A - 情報変換装置及びプログラム

Info

Publication number: JP2006099346A
Application number: JP2004283740A
Authority: JP
Inventors: Ichiro Nakada; 一朗中田; Tatsuhiko Aikawa; 達彦相川; Junichi Shimizu; 淳一清水
Original assignee: Getronics Japan Co Ltd; Bank of Tokyo Mitsubishi UFJ Trust Co
Current assignee: MUFG Bank Ltd; NTT Data Getronics Corp
Priority date: 2004-09-29
Filing date: 2004-09-29
Publication date: 2006-04-13
Anticipated expiration: 2024-09-29
Also published as: JP3972310B2

Abstract

【課題】所定の対象を表すために複数の単語が組合わされて構成された文字列を該文字列が表していると推定される所定の対象に付与された識別情報へ変換する。
【解決手段】名称辞書に登録された情報では入力された文字列が表す顧客名称を判断できず、オペレータによって顧客名称が判断された場合に、入力文字列と判断された顧客名称の文字列を比較し、両文字列の不一致単語数が複数の場合には、顧客名称の文字列における不一致単語を正論理インデックスセットとして、入力文字列における不一致単語を副論理インデックスセットとして補助辞書に登録する((D)参照）。補助辞書に副論理インデックスセットとして登録されている各単語が次回以降に入力された文字列に含まれている場合には、入力文字列中の各単語を対応する正論理インデックスセットとして登録されている各単語に置換した文字列を生成し、生成した文字列も用いて入力文字列が表す顧客名称を判断する。
【選択図】図２

Description

本発明は情報変換装置及びプログラムに係り、特に、所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表していると推定される所定の対象に付与された識別情報へ変換する情報変換装置、及び、コンピュータを前記情報変換装置として機能させるための情報変換プログラムに関する。

異なる金融機関の口座への送金等の金融取引が依頼された場合には、当該金融取引に関係する顧客の名称（例えば送金入金先口座の名義人名等）が文字列として設定された電文が金融機関の間で電文が送受される。一方、金融機関では個々の顧客に顧客コード（この顧客コードは例えばＣＩＦ(Customer Information File：顧客情報ファイル)と称されている）を付与しており、金融機関内のコンピュータ・システムは、この顧客コードに基づいて顧客を識別し指示された金融取引を実行する構成となっているため、他の金融機関から電文を受信した場合には、受信した電文に設定されている顧客名称を表す文字列を、対応する顧客コードへ変換する必要がある。

上記に関連して特許文献１には、顧客コードを特定する複数の単語の組合わせとそれに対応する顧客コードを登録した顧客コードテーブルを予め記憶装置に格納しておき、入力データから変換すべき複数の単語を抽出し、抽出した複数の単語と顧客コードテーブルに登録されている複数の単語を比較し、一致した場合に顧客コードへ変換する技術が開示されている。
特開２００２−５６００５号公報

但し、上記の電文に設定されている顧客名称は、金融取引の実行を依頼した依頼人によって指定された名称がそのまま文字列として設定されるため、例えば正規の顧客名称に対して余計な単語が付加されていたり、正規の名称を構成する単語の一部が略称で設定されていたり（例えば単語「DEVELOPMENT」が「DEV」と略して設定される等）、正規の名称を構成する複数の単語の一部が欠落していたり、前記一部の単語にタイプミスに起因する誤字等が有る等、正規の名称が正しく設定されていない場合がある。これに対し、例えば「顧客名称を表す文字列を構成する各単語が、顧客コードへ変換すべき変換対象の文字列に全て含まれている」という条件を満たす顧客名称を、変換対象の文字列が表す顧客名称と判定するようにすれば、変換対象の文字列が正規の顧客名称に余計な単語が加わっている文字列である場合にも、変換対象の文字列が表す顧客名称を自動的かつ正確に判断することができる。

しかし、正規の名称を構成する単語の一部が略称で設定されていたり、正規の名称を構成する複数の単語の一部が欠落していたり、前記一部の単語にタイプミスに起因する誤字等が有る場合には、上記の判定を行ったとしても、変換対象の文字列が表す顧客名称を自動的に判定することは困難であり、変換対象の文字列が表す顧客名称の判定をオペレータに委ねざるを得ない。特に、例えば変換対象の文字列における特定の顧客名称を表す文字列との不一致単語の数と、特定の顧客名称を表す文字列における変換対象の文字列との不一致単語の数の少なくとも一方が複数の場合、各単語の対応関係を自動的に判断することは非常に困難であり、この種の文字列が出現する度にオペレータの手を煩わすことで、オペレータに多大な負担がかかることになる、という問題がある。

本発明は上記事実を考慮して成されたもので、所定の対象を表すために複数の単語が組合わされて構成された文字列を、該文字列が表していると推定される所定の対象に付与された識別情報へ変換することを、オペレータの手を煩わすことなく自動的に行える確率を向上させることができる情報変換装置及び情報変換プログラムを得ることが目的である。

上記目的を達成するために請求項１記載の発明に係る情報変換装置は、所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表している前記所定の対象に付与された識別情報へ変換する情報変換装置であって、識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書を記憶する第１記憶手段と、補助辞書を記憶する第２記憶手段と、入力された文字列を構成する単語の組合わせを前記名称辞書に登録されている単語の組合わせと各々比較することで、前記入力された文字列を構成する単語の組合わせと単語単位で完全一致又は部分一致する単語の組合わせを検索し、該検索の結果に基づいて、前記入力された文字列が表している対象の判断を試行し、該判断が不能の場合には、前記入力された文字列を表示装置に表示させることで、前記入力された文字列が表す対象の判断をオペレータに委ね、オペレータにより入力装置を介して入力された判断結果に基づいて、前記入力された文字列が表す対象を判断し、前記入力された文字列を前記判断した対象に付与された識別情報へ変換する変換手段と、前記入力された文字列が表す対象の判断がオペレータに委ねられた場合に、判断された対象を表す対象文字列を入力された文字列と比較し、前記対象文字列における前記入力文字列との不一致単語数が１個、かつ前記入力文字列における前記対象文字列との不一致単語数が１個の場合以外であれば、前記対象文字列における前記入力文字列との全ての不一致単語から成る主単語群と、前記入力文字列における前記対象文字列との全ての不一致単語から成る副単語群を対応付けて前記補助辞書に登録する単語登録手段と、を備え、前記変換手段は、入力文字列を前記補助辞書に登録されている前記副単語群と比較することで、前記入力文字列に特定の副単語群を構成する全ての単語が含まれているか否かを判断し、特定の副単語群を構成する全ての単語が前記入力文字列に含まれていた場合、前記入力文字列のうちの該当する単語を、前記特定の副単語群と対応付けられて前記補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列を生成し、生成した文字列も用いて前記入力された文字列が表している対象を判断することを特徴としている。

請求項１記載の発明に係る情報変換装置は、所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、入力された文字列を、入力された文字列が表していると推定される所定の対象に付与された識別情報へ変換する。上記の文字列としては、例えば金融機関の間で送受される電文に設定される顧客の名称を表す文字列が好適であるが、これに限られるものではなく、所定の対象を表すために複数の単語が組合わされて構成された文字列であればよい。請求項１記載の発明では、識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書が第１記憶手段に記憶されており、第２記憶手段には補助辞書が記憶されている。また変換手段は、入力された文字列を構成する単語の組合わせを名称辞書に登録されている単語の組合わせと各々比較することで、入力された文字列を構成する単語の組合わせと単語単位で完全一致又は部分一致する単語の組合わせを検索し、該検索の結果に基づいて、前記入力された文字列が表している対象の判断を試行する。そして、この判断が不能の場合には、入力された文字列を表示装置に表示させることで、入力された文字列が表す対象の判断をオペレータに委ね、オペレータにより入力装置を介して入力された判断結果に基づいて、入力された文字列が表す対象を判断し、入力された文字列を判断した対象に付与された識別情報へ変換する。

ここで、入力された文字列が、変換手段による前記入力文字列が表している対象の判断が不能な文字列であっても、該文字列が特定の対象を表しているとオペレータに判断された場合には、同一の文字列が再度入力された際に、再度入力された文字列は上記の特定の対象を表す文字列とみなすことができる。これに基づき請求項１記載の発明では、入力された文字列が表す対象の判断がオペレータに委ねられた場合に、判断された対象を表す対象文字列を入力された文字列と比較し、対象文字列における入力文字列との不一致単語数が１個、かつ入力文字列における対象文字列との不一致単語数が１個の場合以外であれば（すなわち、対象文字列における入力文字列との不一致単語数及び入力文字列における対象文字列との不一致単語数の少なくとも一方が複数の場合）、対象文字列における入力文字列との全ての不一致単語から成る主単語群と、入力文字列における前記対象文字列との全ての不一致単語から成る副単語群を対応付けて補助辞書に登録する単語登録手段が設けられている。

そして、請求項１記載の発明に係る変換手段は、入力文字列を補助辞書に登録されている副単語群と比較することで、入力文字列に特定の副単語群を構成する全ての単語が含まれているか否かを判断し、特定の副単語群を構成する全ての単語が入力文字列に含まれていた場合、入力文字列のうちの該当する単語を、特定の副単語群と対応付けられて補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列を生成し、生成した文字列も用いて入力された文字列が表している対象を判断する。これにより、過去に変換手段による対象の判断が不能であったために対象の判断がオペレータに委ねられた文字列が再度入力された場合にも、該入力文字列に含まれる特定の副単語群の各単語が、対応する特定の主単語群の各単語に置き換えた文字列に基づいて、入力文字列が、過去にオペレータによって判断された対象と同一の対象を表していると自動的に判断することができる。

このように、請求項１記載の発明では、特定の対象を表しているとオペレータに判断された入力文字列に含まれる素性（対象文字列に含まれる個々の単語との対応関係等）が不明な単語を、判断された対象を表す対象文字列における入力文字列との不一致単語（主単語群）と対応付け副単語群として補助辞書に登録しておき、入力文字列に副単語群が含まれていた場合に、これを一塊りに対応する主単語群へ置き換えた文字列も用いて、入力文字列が表す対象を判断するので、所定の対象を表すために複数の単語が組合わされて構成された文字列を、該文字列が表していると推定される所定の対象に付与された識別情報へ変換することを、オペレータの手を煩わすことなく自動的に行える確率を向上させることができる。

なお、請求項１記載の発明において、オペレータによって判断された対象を表す対象文字列を単語登録手段が入力文字列と比較した結果、対象文字列における入力文字列との不一致単語数が１個、かつ入力文字列における対象文字列との不一致単語数が１個の場合、不一致単語が１対１で対応しているので、入力文字列中の不一致単語は、対象文字列中の不一致単語の略語、或いは対象文字列中の不一致単語に対してタイプミスに起因する誤字が有る単語等のように、対象文字列中の不一致単語の同義語である可能性が極めて高い。上記を考慮すると、請求項１記載の発明において、例えば請求項２に記載したように、文字列を構成する個々の単語に関する情報を登録するための基本語辞書を記憶する第３記憶手段を設け、単語登録手段は、対象文字列における入力文字列との不一致単語数が１個、かつ入力文字列における対象文字列との不一致単語数が１個の場合は、入力文字列における対象文字列との不一致単語を、対象文字列における入力文字列との不一致単語の同義語として基本語辞書に登録し、変換手段による、入力文字列を構成する単語の組合わせと単語単位で完全一致又は部分一致する単語の組合わせの検索において、基本語辞書に第１の単語の同義語として登録されている第２の単語を含む入力文字列が、該入力文字列における第２の単語を第１の単語に置き換えた文字列と同一として扱われるように構成することが好ましい。

請求項２記載の発明では、対象文字列中の不一致単語と１対１の関係にある入力文字列中の不一致単語、すなわち対象文字列中の不一致単語の同義語である可能性が極めて高い単語を、対象文字列中の不一致単語の同義語として扱うので、この単語を補助辞書に登録し一塊りの単語群として扱う場合と比較して、入力文字列が表す対象の判断精度を向上させることができる。なお、基本語辞書に第１の単語の同義語として登録されている第２の単語を含む入力文字列が、該入力文字列における第２の単語を第１の単語に置き換えた文字列と同一として扱われるように構成することは、入力される文字列を構成する個々の単語に論理インデックスを付与しておき、入力された文字列を、該文字列を構成する個々の単語を単位として論理インデックスへ変換した後に検索等の処理を行う態様において、入力文字列に第１の単語が含まれている場合も入力文字列に第２の単語が含まれている場合も、これらの単語を同一の論理インデックスへ変換することによって実現できる。

また、請求項２記載の発明において、単語登録手段は、例えば請求項３に記載したように、入力文字列における対象文字列との不一致単語を、対象文字列における入力文字列との不一致単語の同義語として基本語辞書に登録する際に、入力文字列における対象文字列との不一致単語が、特定の副単語群を構成する単語として補助辞書に登録されており、かつ特定の副単語群に対応する特定の主単語群に、対象文字列における入力文字列との不一致単語が含まれているか否か判定し、判定が肯定された場合は入力文字列における対象文字列との不一致単語及び対象文字列における入力文字列との不一致単語を補助辞書から削除することが好ましい。これにより、補助辞書を記憶するための第２記憶手段の記憶容量を削減できると共に、補助辞書に登録されている単語のうち、基本語辞書に同義語として登録する単語（素性が明確化した単語）が補助辞書から削除されることで、補助辞書に登録されている単語群（素性が不明のために一塊りとして扱うべき単語群）の中に素性が明確化した単語が混在している状態が解消されることになり、補助辞書に登録されている情報の精度も向上する。

また、請求項１記載の発明において、補助辞書には副単語群として略語を含む単語群が登録される可能性があり、略語は入力文字列が何れの対象を表す文字列かに拘らず入力文字列に含まれている可能性があるので、補助辞書に登録した情報は、入力文字列が何れの対象を表す文字列かに拘らず共通に用いてもよいが、例えば請求項４に記載したように、単語登録手段は、主単語群及び副単語群を判断された対象に付与された識別情報と対応付けて補助辞書に登録し、変換手段は、特定の副単語群を構成する全ての単語が入力文字列に含まれていた場合に、入力文字列のうちの該当する単語を、特定の副単語群と対応付けられて補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列を生成し、特定の副単語群及び特定の主単語群と同一の特定識別情報と対応付けられて名称辞書に登録されている単語の組合わせが、生成した文字列を構成する単語の組合わせに含まれているか否か判定し、判定が肯定された場合に入力文字列を特定識別情報へ変換するように構成してもよい。この場合、特定識別情報と対応付けて補助辞書に登録された主単語群及び副単語群は、入力文字列が、特定識別情報が付与された特定の対象を表しているか否かを判断するときにのみ用いられることになる。

また、請求項４記載の発明において、例えば請求項５に記載したように、不要単語を登録するための不要単語辞書を記憶する第４記憶手段を更に設け、単語登録手段は、変換手段によって判断された対象を表す対象文字列を入力された文字列を比較し、対象文字列には入力文字列との不一致単語が存在しておらず、かつ入力文字列には対象文字列との不一致単語が存在していた場合に、入力文字列における対象文字列との不一致単語を、判断された対象に付与された特定識別情報と対応付け不要単語として不要単語辞書に登録すると共に、入力文字列における対象文字列との不一致単語が、特定識別情報に対応する特定の副単語群を構成する単語として補助辞書に登録されているか否か判定し、判定が肯定された場合は入力文字列における対象文字列との不一致単語を補助辞書から削除するようにしてもよい。

上記のように、対象文字列には入力文字列との不一致単語が存在しておらず、かつ入力文字列には対象文字列との不一致単語が存在していた場合、入力文字列中の不一致単語は、対象文字列を構成する各単語の何れにも対応していない単語、すなわち入力文字列が表す対象の判断において判断対象から除外すべき不要単語であると判断できる。但し、或る対象を表す文字列における不要単語が別の対象を表す文字列においても不要単語であるとは限らないため、請求項５記載の発明では、入力文字列における対象文字列との不一致単語を、判断された対象に付与された特定識別情報と対応付け不要単語として不要単語辞書に登録している。そして請求項５記載の発明では、上記の不一致単語が特定識別情報に対応する特定の副単語群を構成する単語として補助辞書に登録されていた場合に、当該不一致単語（不要単語）を補助辞書から削除するので、補助辞書を記憶するための第２記憶手段の記憶容量を削減できると共に、補助辞書に登録されている単語群（素性が不明のために一塊りとして扱うべき単語群）の中に素性が明確化した単語（不要単語辞書に不要単語として登録する単語）が混在している状態が解消されることになり、補助辞書に登録されている情報の精度も向上する。

また、請求項３又は請求項５記載の発明において、単語登録手段は、例えば請求項６に記載したように、補助辞書からの単語の削除を行うことで、特定の副単語群を構成する単語の数が１になり、かつ特定の副単語群に対応する特定の主単語群を構成する単語の数が１になるか否か判定し、判定が肯定された場合は、特定の副単語群を構成する単一の単語を、特定の副単語群に対応する特定の主単語群を構成する単一の単語の同義語として基本語辞書に登録すると共に、特定の副単語群及び特定の副単語に対応する特定の主単語群を補助辞書から削除することが好ましい。補助辞書からの単語の削除を行うことで特定の副単語群を構成する単語の数が１になり、かつ特定の副単語群に対応する特定の主単語群を構成する単語の数が１になった場合、これらの単語は同義語である可能性が極めて高い。上記の場合に、特定の副単語群を構成する単一の単語を、特定の副単語群に対応する特定の主単語群を構成する単一の単語の同義語として基本語辞書に登録すると共に、特定の副単語群及び特定の副単語に対応する特定の主単語群を補助辞書から削除することで、入力文字列が表す対象の判断精度を向上させることができると共に、補助辞書を記憶するための第２記憶手段の記憶容量を削減することができ、更に、補助辞書に登録されている単語群の中に素性が明確化した単語（同義語として登録する単語）が混在している状態が解消されることで、補助辞書に登録されている情報の精度も向上する。

請求項７記載の発明は、請求項１乃至請求項６の何れかに記載の発明において、入力される文字列を構成する個々の単語に相当する文字列と個々の単語に付与された論理インデックスが対応付られけて予め各々登録された基本語辞書を記憶する第３記憶手段と、入力された文字列を構成する個々の単語に相当する文字列をキーにして前記基本語辞書の検索を各々行うことで、入力された文字列を、該文字列を構成する個々の単語を単位として論理インデックスへ変換する単語変換手段と、を更に備え、前記基本語辞書以外の各辞書には、各単語が各単語に対応する前記論理インデックスとして登録されており、前記変換手段及び前記不要単語登録手段は、前記入力された文字列として、前記入力された文字列が前記単語変換手段によって単語単位で変換されることで得られる論理インデックスの組合わせを用いて各処理を行うことを特徴としている。

一般に文字列を表すテキストデータは情報量に比してデータ量が多く（例えば１文字を２バイトのデータで表現する文字コードを用いて表したテキストデータは文字数×２バイトのデータ量となる）、文字列をテキストデータのまま処理した場合、本発明に係る情報変換装置に加わる負荷の増大や処理遅延を招くと共に、基本語辞書や不要単語辞書を記憶するために必要な記憶容量も増大する。これに対して請求項７記載の発明では、入力される文字列を構成する個々の単語に相当する文字列と個々の単語に付与された論理インデックス（単語コード情報）が対応付られけて予め各々登録された基本語辞書を第３記憶手段に記憶しておき、単語変換手段は、入力された文字列を構成する個々の単語に相当する文字列をキーにして基本語辞書の検索を各々行うことで、入力された文字列を、該文字列を構成する個々の単語を単位として論理インデックスへ変換するので、入力された文字列（変換対象の文字列）のデータ量を小さくすることができる。また、基本語辞書以外の各辞書に、各単語を各単語に対応する論理インデックスとして登録しておくことで、これらの辞書を記憶するために必要な記憶容量も小さくすることができる。そして、変換手段及び不要単語登録手段が、入力された文字列として、入力された文字列が単語変換手段によって単語単位で変換されることで得られる論理インデックスの組合わせを用いて各処理を行うことにより、本発明に係る情報変換装置に加わる負荷の軽減・処理の高速化を実現することができる。

請求項８記載の発明に係る情報変換プログラムは、コンピュータを、所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表している前記所定の対象に付与された識別情報へ変換する情報変換装置として機能させるための情報変換プログラムであって、前記コンピュータは、識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書を記憶する第１記憶手段と、補助辞書を記憶する第２記憶手段を備え、前記コンピュータを、入力された文字列を構成する単語の組合わせを前記名称辞書に登録されている単語の組合わせと各々比較することで、前記入力された文字列を構成する単語の組合わせと単語単位で完全一致又は部分一致する単語の組合わせを検索し、該検索の結果に基づいて、前記入力された文字列が表している対象の判断を試行し、該判断が不能の場合には、前記入力された文字列を表示装置に表示させることで、前記入力された文字列が表す対象の判断をオペレータに委ね、オペレータにより入力装置を介して入力された判断結果に基づいて、前記入力された文字列が表す対象を判断し、前記入力された文字列を前記判断した対象に付与された識別情報へ変換する変換手段、及び、前記入力された文字列が表す対象の判断がオペレータに委ねられた場合に、判断された対象を表す対象文字列を入力された文字列と比較し、前記対象文字列における前記入力文字列との不一致単語数が１個、かつ前記入力文字列における前記対象文字列との不一致単語数が１個の場合以外であれば、前記対象文字列における前記入力文字列との全ての不一致単語から成る主単語群と、前記入力文字列における前記対象文字列との全ての不一致単語から成る副単語群を対応付けて前記補助辞書に登録する単語登録手段として機能させると共に、前記変換手段は、入力文字列を前記補助辞書に登録されている前記副単語群と比較することで、前記入力文字列に特定の副単語群を構成する全ての単語が含まれているか否かを判断し、特定の副単語群を構成する全ての単語が前記入力文字列に含まれていた場合、前記入力文字列のうちの該当する単語を、前記特定の副単語群と対応付けられて前記補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列を生成し、生成した文字列も用いて前記入力された文字列が表している対象を判断することを特徴としている。

請求項８記載の発明に係る情報変換プログラムは、上記の第１記憶手段及び第２記憶手段を備えたコンピュータを、上記の変換手段及び単語登録手段として機能させるためのプログラムであるので、上記のコンピュータが請求項８記載の発明に係る情報変換プログラムを実行することにより、上記のコンピュータが請求項１に記載の情報変換装置として機能することになり、請求項１記載の発明と同様に、所定の対象を表すために複数の単語が組合わされて構成された文字列を、該文字列が表していると推定される所定の対象に付与された識別情報へ変換することを、オペレータの手を煩わすことなく自動的に行える確率を向上させることができる。

以上説明したように本発明は、複数の単語が組合わされて構成された入力文字列が表す対象の判断がオペレータに委ねられた場合に、判断された対象を表す対象文字列を入力された文字列と比較し、対象文字列における入力文字列との不一致単語数が１個、かつ入力文字列における対象文字列との不一致単語数が１個の場合以外であれば、対象文字列における入力文字列との全ての不一致単語から成る主単語群と、入力文字列における対象文字列との全ての不一致単語から成る副単語群を対応付けて補助辞書に登録し、入力文字列に特定の副単語群を構成する全ての単語が含まれているか否かを判断し、特定の副単語群を構成する全ての単語が入力文字列に含まれていた場合、入力文字列のうちの該当する単語を、特定の副単語群と対応付けられて補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列も用いて、入力文字列が表している対象を判断するようにしたので、所定の対象を表すために複数の単語が組合わされて構成された文字列を、該文字列が表していると推定される所定の対象に付与された識別情報へ変換することを、オペレータの手を煩わすことなく自動的に行える確率を向上させることができる、という優れた効果を有する。

以下、図面を参照して本発明の実施形態の一例を詳細に説明する。図１には本実施形態に係るコンピュータ・システム１０が示されている。コンピュータ・システム１０は、特定金融機関の情報センタ等に設置されたコンピュータ１２を含んで構成されている。コンピュータ１２はメインフレーム・コンピュータから成り、ＣＰＵ１２Ａ、ＲＯＭ１２Ｂ、ＲＡＭ１２Ｃ、入出力ポート１２Ｄを備え、これらはアドレスバス、データバス、制御バス等のバス１２Ｅを介して互いに接続されている。入出力ポート１２Ｄには、各種の入出力機器として、通信制御装置１４、ディスプレイ１６、マウス１８、キーボード２０、ＨＤＤ（ハードディスクドライブ）２２が各々接続されている。

ＨＤＤ２２には基本語辞書、名称辞書、不要単語辞書及び補助辞書（詳細は後述）が各々記憶されており、ＨＤＤ２２は本発明に係る第１記憶手段及び第２記憶手段に対応しており、請求項２，７に記載の第３記憶手段にも対応している。またコンピュータ１２には、後述する顧客コード変換処理を行うための顧客コード変換プログラムがＨＤＤ２２に予めインストールされている。この顧客コード変換プログラムは請求項８に記載の情報変換プログラムに対応しており、コンピュータ１２のＣＰＵ１２Ａが上記各プログラムを実行することで、コンピュータ１２は本発明に係る情報変換装置として機能する。なお、本発明に係る情報変換装置として機能するコンピュータはメインフレーム・コンピュータに限られるものではなく、例えばパーソナル・コンピュータやマイクロプロセッサ等、任意のコンピュータを適用可能である。

また、コンピュータ１２の通信制御装置１４は、特定の金融機関内に構築されたコンピュータ・ネットワーク２６に接続されている。コンピュータ・ネットワーク２６は多数台のコンピュータが通信回線を介して互いに接続されて構成されている。また、コンピュータ・ネットワーク２６を構成する多数台のコンピュータの中には、コンピュータ１２から指示された金融取引（例えば指示された口座への入金処理等）を行うためのコンピュータが含まれている。また、コンピュータ１２の通信制御装置１４は、ネットワーク２８（銀行間のメッセージ交換のための国際間ネットワーク）を介して、海外の他の金融機関のコンピュータ３０と接続されている。なお、以下ではコンピュータ１２が設置された特定金融機関を第１の金融機関、コンピュータ３０が設置された金融機関を第２の金融機関と称して区別する。

次に本実施形態の作用を説明する。金融機関へ外国送金を依頼する際には、送金依頼人により、送金先口座の金融機関名、支店名、口座名義人名、口座番号、送金金額等の情報が指定される。第２の金融機関では、第１の金融機関に開設されている特定口座への送金が送金依頼人から依頼されると、特定口座への入金を第１の金融機関へ依頼する電文を作成するが、この電文には送金依頼人によって指定された各情報が設定され、このうち送金先口座の名義人名等の情報は文字列（テキストデータ）として電文に設定される。第２の金融機関は電文の作成が完了すると、作成した電文をコンピュータ３０によってネットワーク２８経由で第１の金融機関のコンピュータ１２へ送信する。第１の金融機関のコンピュータ１２は、ネットワーク２８経由で他の金融機関から電文を受信すると、受信した電文に設定されている送金先口座の名義人名（第１の金融機関の顧客の名称）を表す文字列のテキストデータを取り出し、取り出した文字列のテキストデータを、第１の金融機関が個々の顧客を識別するために個々の顧客に付与している顧客コード（識別情報）へ変換する処理（後述する顧客コード変換処理）を行う。コンピュータ１２のＨＤＤ２２に記憶されている基本語辞書、名称辞書、不要単語辞書及び補助辞書は、顧客コード変換処理を実現するために設けられている。

すなわち、顧客の名称を表す文字列は複数の単語が組合わされて構成されているが、第１の金融機関では、個々の顧客の名称を表す文字列を構成する個々の単語に複数桁の数値から成るコード情報（論理インデックスと称する）を予め各々付与しており、顧客コード変換処理では、受信した電文から取り出した顧客名称を表す変換対象の文字列を、該文字列を構成する各単語に対応する論理インデックスの組合わせ（論理インデックスセット）へ変換した後に処理する。このため、前述の基本語辞書には、例として図２(Ａ)にも示すように、個々の単語を表すテキストデータと個々の単語に付与した論理インデックスに相当する数値データが対応付けられて各々登録されている（図２(Ａ)では品詞、属性（名称）及び属性（コード）等の情報も個々の単語に付加されている）。また前述の名称辞書には、例として図２(Ｂ)にも示すように、個々の顧客の名称と、該名称に対応する論理インデックスセットと、個々の顧客に付与した顧客コードが対応付けられて各々登録されている。

ところで、個々の顧客の名称の中には、第１の顧客の名称を表す文字列を構成する単語の組合わせに特定の単語を加えた組合わせが、第２の顧客の名称を表す文字列を構成する単語の組合わせに一致する関係（この関係を包摂関係という）を有する名称が存在している。例として図２(Ｂ)に示すように、顧客Ｂの名称を表す文字列「NAKAMORI CO,.LTD」は「NAKAMORI」と「CO,.LTD」の２個の単語から構成されている（図２(Ｂ)に示す論理インデックスを用いると、上記文字列の論理インデックスセットは「105,107」となる）が、この単語の組合わせに特定単語「ELECTRIC」を加えた単語の組合わせは、顧客Ｃの名称を表す文字列である「NAKAMORI ELECTRIC CO,.LTD」(この文字列の論理インデックスセットは「105,106,107」となる）を構成する単語の組合わせに一致する。そして、変換対象の文字列が包摂関係を有する顧客名称に相当する文字列であった場合、変換対象の文字列が包摂関係を有する複数の顧客名称のうちの何れを表しているのかを一意に判断できないという問題がある。例えば変換対象の文字列が「NAKAMORI CO,.LTD」であった場合、変換対象の文字列は上述した顧客Ｂの名称を表している可能性が高いものの、変換対象の文字列は顧客Ｃの名称を表す文字列「NAKAMORI ELECTRIC CO,.LTD」における特定単語「ELECTRIC」（以下、この単語を包摂外単語という）が何らかの理由で欠落したものであり、変換対象の文字列が顧客Ｃの名称を表している、という可能性も否定できない。

従って、顧客コード変換処理では、変換対象の文字列が包摂関係を有する名称を表している場合と包摂関係のない名称を表している場合とで異なる処理を行う必要がある。このため、名称辞書に登録されている各顧客の情報のうち、名称が包摂関係を有している顧客の情報には、例として図２(Ｂ)にも示すように、包摂関係を有していることを表す包摂コード（包摂識別情報）が付加されている。詳しくは、名称が包摂関係を有している複数の顧客（上述した第１の顧客及び第２の顧客）の情報には同一の包摂コードが付加されると共に、同一の包摂コードが付加された顧客のうち、名称に包摂外単語が加わっている顧客（第２の顧客）の包摂コードには、包摂外単語の論理インデックスも付加されている（図２(Ｂ)では、名称が「NAKAMORI ELECTRIC CO,.LTD」である顧客Ｃの包摂コードに、包摂外単語「ELECTRIC」の論理インデックス「106」が付加されている例を示している）。

なお、不要単語辞書については詳細は後述するが、包摂関係を有する特定顧客の名称を表す変換対象文字列が、名称辞書に登録されている特定顧客の論理インデックスセットが表す複数単語にそれ以外の余計な単語が付加された文字列であった場合に、前記余計な単語が特定顧客の顧客コードと対応付けられて、特定顧客の不要単語として不要単語辞書に登録される。また、補助辞書についても詳細は後述するが、或る変換対象文字列がオペレータによって特定の顧客名称を表していると判断された場合に、特定の顧客名称を表す文字列における変換対象文字列との不一致単語の論理インデックスが主論理インデックスとして、変換対象文字列における特定の顧客名称を表す文字列との不一致単語の論理インデックスが副論理インデックスとして、補助辞書に対応付けされて登録される。

続いて、他の金融機関より受信した電文から顧客名称を表す文字列のテキストデータを取り出した後に、コンピュータ１２のＣＰＵ１２Ａが顧客コード変換プログラムを実行することでコンピュータ１２によって行われる顧客コード変換処理について、図３を参照して説明する。なお、この顧客コード変換処理は、顧客名称を表す文字列のテキストデータを含む電文を他の金融機関から受信する毎に実行される。また、図３に示す各ステップは本発明に係る変換手段に対応している。

ステップ５０では、受信した電文から取り出した変換対象文字列を、該変換対象文字列中に存在するスペースを区切りとして複数の単語に分割する。ステップ５２では、ステップ５０における文字列の分割によって得られた複数の単語の中から未処理の単語のテキストデータを取り出し、次のステップ５４では、取り出した単語のテキストデータをキーとして基本語辞書を検索する。この検索は、取り出した単語のテキストデータをメモリ（ＲＡＭ１２Ｃ等）に記憶させると共に、基本語辞書全体をＨＤＤ２２から読み出してメモリに展開した後に、検索対象の単語のテキストデータをメモリに展開した基本語辞書に登録されている個々の単語のテキストデータと順に比較することで行ってもよいし、ＨＤＤ２２から単一の単語のテキストデータを読み出してメモリに記憶させ、該メモリに記憶させたテキストデータを検索対象の単語のテキストデータと比較することを、検索対象の単語のテキストデータと一致するテキストデータが出現する迄繰り返すことで行うことも可能である。

ステップ５６では、ステップ５４の検索により検索対象の単語が基本語辞書から抽出されたか否か、すなわち検索対象の単語が基本語辞書に登録されていたか否か判定する。判定が肯定された場合はステップ６４へ移行し、抽出された検索対象の単語と対応付けられて基本語辞書に登録されている論理インデックス（数値データ）を取り出し、変換対象文字列を構成する単語の論理インデックスとしてメモリに記憶させた後にステップ６６へ移行する。また、ステップ５６の判定が否定された場合はステップ５８へ移行し、検索対象の単語に付与する論理インデックスを、基本語辞書に既に登録されている論理インデックスと重複しないように決定する。またステップ６０では、検索対象の単語のテキストデータを、ステップ５８で決定した論理インデックス（の数値データ）と対応付けて基本語辞書に登録する。更にステップ６２では、ステップ５８で決定した論理インデックスを変換対象文字列を構成する単語の論理インデックスとしてメモリに記憶させた後にステップ６６へ移行する。

ステップ６６では、変換対象文字列から全ての単語を取り出したか否か判定する。判定が否定された場合はステップ５２に戻り、ステップ６６の判定が肯定される迄ステップ５２〜ステップ６６を繰り返す。これにより、変換対象文字列を構成する個々の単語が論理インデックスへ各々変換されることになり、メモリには、変換対象文字列の論理インデックスセットが記憶されることになる。なお、ステップ５２〜ステップ６６は請求項７に記載の単語変換手段に対応している。

ステップ６６の判定が肯定されるとステップ６８へ移行し、名称辞書から単一の顧客の情報を取り出し、取り出した情報に含まれる論理インデックスセットを変換対象文字列の論理インデックスセットと比較する。なお、この論理インデックスセットの比較についても、名称辞書全体をＨＤＤ２２から読み出してメモリに展開した後に行ってもよいし、ＨＤＤ２２から単一の顧客の情報を読み出してメモリに記憶させることを繰り返しながら行うことも可能である。次のステップ７０では、変換対象文字列の論理インデックスセットが、名称辞書から取り出した論理インデックスセットを含む関係（名称辞書から取り出した論理インデックスセットを構成する各論理インデックスが、変換対象文字列の論理インデックスセットの中に全て存在している）か否か判定する。

判定が否定された場合は何ら処理を行うことなくステップ７４へ移行するが、判定が肯定された場合はステップ７２へ移行し、ステップ６８で名称辞書より取り出した単一の顧客の情報から顧客コードを抽出すると共に、変換対象文字列の論理インデックスセットを構成する各論理インデックスのうち、名称辞書から取り出した論理インデックスセットに含まれていない論理インデックスの数（不一致単語数）を計数し、抽出した顧客コード及び計数した不一致単語数を名称辞書から取り出した論理インデックスセットと対応付けてメモリに記憶させた後にステップ７４へ移行する。なお、ステップ７２において、名称辞書から取り出した単一の顧客の情報に包摂コードも含まれている場合には、この包摂コードも抽出されてメモリに記憶される。

ステップ７４では名称辞書に登録されている全ての論理インデックスを取り出したか（変換対象文字列の論理インデックスセットと比較したか）否か判定する。判定が否定された場合はステップ６８に戻り、ステップ７４の判定が肯定される迄ステップ６８〜ステップ７４を繰り返す。このステップ６８〜ステップ７４の検索処理により、ステップ７０の判定条件に合致する論理インデックスセットとして、通常は単一の論理インデックスセットが抽出され、変換対象文字列が、包摂関係を有し包摂外単語を含む顧客名称に相当する文字列（例えば先の例では「NAKAMORI ELECTRIC CO,.LTD」）又は該文字列に包摂外単語とは別の単語が加わっている文字列（例えば「NAKAMORI ELECTRIC CO,.LTD SHINZYUKU」等）である場合にのみ、同一の包摂コードが付加されている複数の論理インデックスセットが各々抽出される。

ステップ７４の判定が肯定されるとステップ７６へ移行し、上述したステップ６８〜ステップ７４の検索処理により、ステップ７０の判定条件に合致する論理インデックスセットが抽出されたか否か判定する。判定が肯定された場合はステップ９８へ移行して顧客コード判定処理が行われる。以下、この顧客コード判定処理について、図４を参照して説明する。なお、図４のうちステップ１２０〜１２４を除く各ステップは本発明に係る変換手段に対応している。

ステップ１１０では、先のステップ６８〜ステップ７４の検索によってメモリに記憶された論理インデックスセットのうち、不一致単語数が最少の論理インデックスセット（以下、この論理インデックスセットを便宜上「第１の論理インデックスセット」と称する）を判定する。なお、ステップ６８〜ステップ７４の検索によって単一の論理インデックスセットのみが抽出（メモリに記憶）された場合には、以下の処理ではこの論理インデックスセットが第１の論理インデックスセットとして扱われる。ステップ１１２では、第１の論理インデックスセットに対応する包摂コードがメモリに記憶されているか否かに基づいて、第１の論理インデックスセットに対応する顧客名称に包摂関係があるか否か判定する。この判定が否定された場合にはステップ１１８へ移行し、変換対象文字列に対応する顧客コードとして、第１の論理インデックスセットに対応する顧客コードを出力する。次のステップ１２０では出力した顧客コードが付与されている顧客の名称に包摂関係があるか否かが判定されるが、この場合は判定が否定されることで処理を終了する。

例えば図２に示す例において、変換対象文字列が「AKASAKA BANK CO.,LTD」(論理インデックスセットは「100,101,107」)或いは「AKASAKA BANK CO.,LTD MARUNOUCHI」(論理インデックスセットは「100,101,107,110」)であった場合には、先のステップ６８〜ステップ７４の処理により、ステップ７０の判定条件に合致する論理インデックスセットとして、顧客Ａの名称を表す文字列「AKASAKA BANK CO.,LTD」に対応する論理インデックスセット「100,101,107」が名称辞書から抽出される。そして、抽出された論理インデックスセット（第１の論理インデックスセット）に対応する包摂コードは名称辞書に登録されておらず（図２(Ｂ)を参照）、顧客Ａの名称には包摂関係がないので、変換対象文字列が「AKASAKA BANK CO.,LTD」及び「AKASAKA BANK CO.,LTD MARUNOUCHI」の何れであっても、変換対象文字列は顧客Ａの名称を表していると判断できる。このような場合は、上述のようにステップ１１２の判定が肯定されることで、ステップ１１８において、変換対象文字列に対応する顧客コードとして、第１の論理インデックスセットに対応する顧客コード「1230000」が出力されることになる。

一方、ステップ１１２の判定が肯定された場合はステップ１１４へ移行し、メモリに記憶されている第１の論理インデックスセットの情報に含まれる包摂外単語の論理インデックスを参照し、この包摂外単語の論理インデックスが変換対象文字列の論理インデックスセットに含まれているか否かを判断することで、変換対象文字列に包摂外単語が含まれているか否か判定する。そして、判定が肯定された場合はステップ１１６へ移行し、ステップ６８〜ステップ７４の検索処理によって抽出された論理インデックスセットのうち、包摂外単語を含む論理インデックスセットに対応する顧客コードを、変換対象文字列に対応する顧客コードとして出力し、ステップ１２０へ移行する。

例えば図２の例において、変換対象文字列が「NAKAMORI ELECTRIC CO,.LTD」(論理インデックスセットは「105,106,107」)或いは「NAKAMORI ELECTRIC CO,.LTD SHINZYUKU」(論理インデックスセットは「105,106,107,111」)であった場合、ステップ６８〜ステップ７４の検索処理において、ステップ７０の判定条件に合致する論理インデックスセットとして、包摂関係を有する複数の顧客名称に対応する論理インデックスセット、すなわち顧客Ｂの名称を表す文字列「NAKAMORI CO,.LTD」に対応する論理インデックスセット「105,107」及び顧客Ｃの名称を表す文字列「NAKAMORI ELECTRIC CO,.LTD」に対応する論理インデックスセット「105,106,107」が名称辞書から各々抽出されるが、変換対象文字列には上記の包摂関係における包摂外単語が含まれているので、変換対象文字列は包摂外単語が含まれる顧客Ｃの名称を表していると判断できる。本実施形態に係る顧客コード変換処理では、上記のような場合にステップ１１４の判定が肯定されてステップ１１６へ移行することで、変換対象文字列に対応する顧客コードとして、名称に包摂外単語が含まれている顧客に付与されている顧客コード（上記の例では顧客Ｃに付与された顧客コード「3450000」）が出力されることになる。

次のステップ１２０では、出力した顧客コードに対応する顧客名称に包摂関係があるか否かが判定されるが、この場合は判定が肯定されてステップ１２２へ移行し、変換対象文字列の論理インデックスセットが、出力した顧客コードに対応する顧客名称の論理インデックスセットと完全に一致しているか（不一致単語数が０か）否か判定する。前述の例において、変換対象文字列が「NAKAMORI ELECTRIC CO,.LTD」であれば、変換対象文字列の論理インデックスセットは出力した顧客コードに対応する顧客名称の論理インデックスセットと完全に一致するので、ステップ１２２の判定が肯定されて処理を終了する。

また、変換対象文字列が「NAKAMORI ELECTRIC CO,.LTD SHINZYUKU」の場合は、出力した顧客コードに対応する顧客名称を表す文字列「NAKAMORI ELECTRIC CO,.LTD」に対して変換対象文字列には余計な単語「SHINZYUKU」が付加されており、変換対象文字列の論理インデックスセットは出力した顧客コードに対応する顧客名称の論理インデックスセットと完全には一致していないので、ステップ１２２の判定が否定されてステップ１２４へ移行する。ここで、変換対象文字列に付加されている余計な単語は、変換対象文字列に対応する顧客コードの判定には本来不要な単語であるが、変換対象文字列と同一の顧客名称を表す文字列が今後入力された際に、該文字列にも同一の単語が付加されている可能性が高い一方で、変換対象文字列が表している顧客名称は包摂関係を有しているので、変換対象文字列が表している顧客名称の判断に上記の単語を利用できる可能性がある。このため、ステップ１２２では、変換対象文字列に含まれており、出力した顧客コードに対応する顧客名称を表す文字列には含まれていない不一致単語（上記の例では単語「SHINZYUKU」）の論理インデックスを、出力した顧客コードと対応付けて不要単語辞書に登録した後に処理を終了する（図２(Ｃ)も参照）。

また、第１の論理インデックスセットに対応する顧客名称に包摂関係が有り、かつ変換対象文字列が上記包摂関係における包摂外単語を含まない文字列（例えば「NAKAMORI CO,.LTD」))或いは該文字列に包摂外単語とは別の単語が加わっている文字列（例えば「NAKAMORI AND CO,.LTD」又は「NAKAMORI CO,.LTD SHINZYUKU」)である場合、ステップ６８〜ステップ７４の検索処理では、ステップ７０の判定条件に合致する論理インデックスセットとして、包摂関係を有する複数の顧客名称のうち包摂外単語を含まない顧客名称に対応する論理インデックスセット、すなわち顧客Ｂの名称を表す文字列「NAKAMORI CO,.LTD」に対応する論理インデックスセット「105,107」のみが抽出されるが、変換対象文字列は、顧客Ｂの名称を表す文字列である可能性が高いものの、顧客Ｂの名称と包摂関係にある顧客Ｃの名称「NAKAMORI ELECTRIC CO,.LTD」における特定単語「ELECTRIC」が何らかの理由で欠落した文字列である（顧客Ｃの名称を表す文字列である）可能性もある。

上記の場合にはステップ１１４の判定が肯定されてステップ１２６へ移行し、変換対象文字列の論理インデックスセットが第１の論理インデックスセットと完全に一致しているか（不一致単語数が０か）否か判定する。判定が肯定された場合（例えば変換対象文字列が「NAKAMORI CO,.LTD」の場合）は何ら処理を行うことなくステップ１３８へ移行するが、判定が否定された場合（例えば変換対象文字列が「NAKAMORI AND CO,.LTD」又は「NAKAMORI CO,.LTD SHINZYUKU」の場合）にはステップ１２８へ移行し、変換対象文字列の論理インデックスセットと第１の論理インデックスセットを比較することで、変換対象文字列中には存在しており第１の論理インデックスセットに対応する文字列には存在していない単語（不一致単語）の論理インデックスを抽出する。例えば変換対象文字列が「NAKAMORI AND CO,.LTD」であり、第１の論理インデックスセットが顧客Ｂの名称に対応する論理インデックスセットである場合、不一致単語は「AND」であるので「AND」の論理インデックス「108」が抽出される。

次のステップ１３０では、第１の論理インデックスセットに対応する顧客コードをキーにして不要単語辞書を検索する。この不要単語辞書の検索についても、不要単語辞書全体をＨＤＤ２２から読み出してメモリに展開した後に行ってもよいし、ＨＤＤ２２から単一の顧客の情報を読み出してメモリに記憶させることを繰り返しながら行うことも可能である。次のステップ１３２では、ステップ１３０の検索によって該当する情報が抽出されたか否か判定する。判定が肯定された場合はステップ１３４へ移行し、ステップ１３０の検索によって抽出された情報の中に、先のステップ１２８で抽出した不一致単語の論理インデックスが含まれているか否か判定する。

ステップ１３４の判定が肯定された場合は、先のステップ１２８で論理インデックスが抽出された不一致単語が、第１の論理インデックスセットに対応する顧客名称についての不要単語として不要単語辞書に登録されているので、第１の論理インデックスセットに対応する顧客名称を表していると過去に判定された文字列の中に上記の不一致単語が付加された文字列が存在していたことになり（例えば上述した例では、顧客Ｂの名称を表していると過去に判定された文字列の中に上記の「AND」が付加された文字列が存在していたことになる）、変換対象文字列は第１の論理インデックスセットに対応する顧客名称を表していると判断できる。このため、ステップ１３４の判定が肯定された場合はステップ１３６へ移行し、変換対象文字列に対応する顧客コードとして、第１の論理インデックスセットに対応する顧客コードを出力して処理を終了する。

一方、ステップ１３２又はステップ１３４の判定が肯定された場合には、第１の論理インデックスセットに対応する顧客名称を表していると過去に判定された文字列の中に、先のステップ１２８で論理インデックスが抽出された不一致単語が付加された文字列は存在しておらず、この不一致単語に基づいて変換対象文字列が第１の論理インデックスセットに対応する顧客名称を表していると判断することは困難である。このため、ステップ１３２又はステップ１３４の判定が肯定された場合はステップ１３８へ移行し、第１の論理インデックスセットに付加されている包摂コードをキーにして名称辞書を検索し、第１の論理インデックスセットに対応する顧客名称と包摂関係を有する顧客名称を表す第２の論理インデックスセットの情報を名称辞書から抽出する。

次のステップ１４０では、変換対象文字列の論理インデックスセットと第２の論理インデックスセットを比較することで、変換対象文字列中には存在しており第２の論理インデックスセットに対応する文字列には存在していない不一致単語の論理インデックスを抽出する。例えば変換対象文字列が「NAKAMORI CO,.LTD SHINZYUKU」であり、第２の論理インデックスセットが顧客Ｃの名称に対応する論理インデックスセットである場合、不一致単語「SHINZYUKU」の論理インデックス「118」が抽出される。次のステップ１４２では、第２の論理インデックスセットに対応する顧客コードをキーにして不要単語辞書を検索する。そしてステップ１４４では、ステップ１４２の検索によって該当する情報が抽出されたか否か判定する。判定が肯定された場合はステップ１４６へ移行し、ステップ１４２の検索によって抽出された情報の中に、先のステップ１４０で抽出した不一致単語の論理インデックスが含まれているか否か判定する。

ステップ１４６の判定が肯定された場合は、先のステップ１４０で論理インデックスが抽出された不一致単語が、第２の論理インデックスセットに対応する顧客名称についての不要単語として不要単語辞書に登録されていることになるので、第２の論理インデックスセットに対応する顧客名称を表していると過去に判定された文字列の中に上記の不一致単語が付加された文字列が存在していたことになり、変換対象文字列は第２の論理インデックスセットに対応する顧客名称を表している可能性が高いと判断できる。例えば変換対象文字列が「NAKAMORI CO,.LTD SHINZYUKU」であり、このうちの単語「SHINZYUKU」が、第１の論理インデックスセットの不一致単語として抽出されたものの、第１の論理インデックスセットに対応する顧客Ｂについての不要単語として不要単語辞書に登録されていなかった一方で、第２の論理インデックスセットの不一致単語としても抽出され、第２の論理インデックスセットに対応する顧客Ｃについての不要単語として不要単語辞書に登録されていた場合には、顧客Ｃの名称を表していると過去に判定された文字列の中に上記の「SHINZYUKU」が付加された文字列が存在していたことになるため、変換対象文字列は単語「ELECTRIC」が欠落してはいるものの、顧客Ｃの名称を表す文字列である可能性が高いと判断できる。このため、ステップ１４６の判定が肯定された場合はステップ１４８へ移行し、変換対象文字列に対応する顧客コードとして、第２の論理インデックスセットに対応する顧客コードを出力して処理を終了する。

一方、ステップ１４４又はステップ１４６の判定が肯定された場合には、第２の論理インデックスセットに対応する顧客名称を表していると過去に判定された文字列の中に、先のステップ１４０で論理インデックスが抽出された不一致単語が付加された文字列も存在していないので、変換対象文字列が第１の論理インデックスセットに対応する顧客名称と第２の論理インデックスセットに対応する顧客名称の何れを表しているかを判断することは困難である。このため、ステップ１４４又はステップ１４６の判定が肯定された場合はステップ１５０へ移行し、変換対象文字列をディスプレイ１６に表示させると共に、第１及び第２の論理インデックスセットに対応する文字列、顧客コード等の情報をディスプレイ１６に表示させ、更に所定のメッセージをディスプレイ１６に表示させることで、変換対象文字列が表している顧客名称の判定をオペレータへ要請する。

次のステップ１５２ではオペレータによる判定結果が入力されたか否か判定し、判定が肯定される迄ステップ１５２を繰り返す。顧客名称の判定が要請されると、オペレータは電文送信元の第２の金融機関へ問い合せる等の作業を行うことで、変換対象文字列が表している顧客名称を判定する。そして、判定結果を表す情報をキーボード２０を介して入力する。これにより、ステップ１５２の判定が肯定されてステップ１５４へ移行し、変換対象文字列に対応する顧客コードとして、入力された判定結果に相当する顧客コードを出力した後にステップ１２０へ移行する。

従って、変換対象文字列が、オペレータによって判定された顧客名称に対して余計な単語が付加されている文字列であれば、ステップ１２０，１２２の判定が肯定されてステップ１２４へ移行し、変換対象文字列中の余計な単語が、判定された顧客についての不要単語として不要単語辞書に登録されることになるので、次回以降に、同一の顧客を表す文字列として、同一の単語（不要単語）が付加された文字列が出現した場合には、この不要単語に基づいてステップ１３４又はステップ１４６の判定が肯定されることで、オペレータの手を再度煩わすことなく変換対象文字列が表す顧客名称を自動的に判定することができる。

次に、前述したステップ６８〜ステップ７４の検索処理において、ステップ７０の判定条件に合致する論理インデックスセットが抽出されなかった場合（ステップ７６の判定が否定された場合）の処理について説明する。なお、ステップ７６の判定が否定される場合としては、例えば顧客Ｄの名称が「NAKAMORI SOFTWARE DEVELOPMENT」であるのに対し、変換対象文字列が「NAKAMORI SOFT DEV」であった場合（この例では単語「SOFTWARE」及び「DEVELOPMENT」に対し、変換対象文字列では略語である「SOFT」及び「DEV」が設定されている）が挙げられる。

図３に示すように、ステップ７６の判定が否定された場合はステップ７８へ移行し、補助辞書から単一の副論理インデックスセットを取り出し、取り出した副論理インデックスセットを変換対象文字列の論理インデックスセットと比較し、次のステップ８０で変換対象文字列の論理インデックスセットが取り出した副論理インデックスセットを含む関係か否か、すなわち補助辞書から取り出した副論理インデックスセットが表す各不一致単語が変換対象文字列に全て含まれているか否か判定する。判定が否定された場合はステップ８２へ移行し、補助辞書に登録されている全ての副論理インデックスセットの取り出しを行ったか否か判定する。判定が否定された場合はステップ７８に戻り、ステップ８０又はステップ８２の判定が肯定される迄、ステップ７８〜ステップ８２を繰り返す。当初は補助辞書に何ら情報が登録されていないので、ステップ８２の判定が肯定されてステップ１００へ移行し、オペレータ判定処理が行われる。このオペレータ判定処理について、図５のフローチャートを参照して説明する。

オペレータ判定処理では、まずステップ１７０において、変換対象文字列及び所定のメッセージをディスプレイ１６に表示させることで、変換対象文字列が表している顧客名称及び対応する顧客コードの判定をオペレータへ要請する。次のステップ１７２ではオペレータによる判定結果が入力されたか否か判定し、判定が肯定される迄ステップ１７２を繰り返す。顧客名称及び顧客コードの判定が要請されると、オペレータはディスプレイ１６に表示された変換対象文字列を参照し、必要に応じて電文送信元の第２の金融機関へ問い合せる等の作業を行うことで、変換対象文字列が表している顧客名称及び対応する顧客コードを判定する。そして、判定した顧客コードをキーボード２０を介して入力する。これにより、ステップ１７２の判定が肯定されてステップ１７４へ移行し、変換対象文字列に対応する顧客コードとして、入力された顧客コードを出力する。なお、上記ステップ１７０〜ステップ１７４も本発明に係る変換手段に対応している。

オペレータ判定処理における次のステップ１７６以降の処理は本発明に係る単語登録手段に対応しており、まずステップ１７６では、変換対象文字列に対応する顧客コードとして出力した顧客コードをキーにして名称辞書を検索することで、出力した顧客コードが付与された顧客の正規の名称を表す論理インデックスセットを名称辞書から抽出する。ステップ１７８では、名称辞書から抽出した論理インデックスセットを変換対象文字列の論理インデックスセットと比較することで、正規の顧客名称を表す文字列における変換対象文字列との不一致単語数及び変換文字列における正規の顧客名称を表す文字列との不一致単語数を各々計数する。次のステップ１８０では、ステップ１７８で計数した正規の顧客名称を表す文字列における不一致単語数及び変換文字列における不一致単語数が各々「１」であったか否か判定する。

例えば顧客Ｄの正規の名称「NAKAMORI SOFTWARE DEVELOPMENT」に対して変換対象文字列が「NAKAMORI SOFT DEV」であった場合には、正規の顧客名称を表す文字列における不一致単語数及び変換対象文字列における不一致単語数が各々「２」であるので、ステップ１８０の判定が否定されてステップ１８４へ移行し、例として図２（Ｄ）に示すように、変換対象文字列における全ての不一致単語の論理インデックスを副論理インデックスセットとして補助辞書へ各々登録すると共に、正規の顧客名称を表す文字列における全ての不一致単語の論理インデックスを、先の副論理インデックスセットに対応する主論理インデックスセットとして補助辞書へ登録し、処理を終了する。なお、図２（Ｄ）は変換対象文字列における不一致単語「SOFT」及び「DEV」に各々論理インデックス「500」「501」が付与され、この論理インデックスが副論理インデックスセットとして補助辞書に登録されると共に、正規の顧客名称を表す文字列における不一致単語「SOFTWARE」及び「DEVELOPMENT」の論理インデックス「112」「113」が主論理インデックスセットとして登録された状態を例として示している。

次に、補助辞書に上記の情報が登録された状態で、変換対象文字列「NAKAMORI SOFT DEV」が再度入力された場合の処理について説明する。上記の変換対象文字列が再度入力された場合にも、ステップ６８〜ステップ７４の検索処理でステップ７０の判定条件に合致する論理インデックスセットは抽出されないので、ステップ７６の判定が否定されてステップ７８へ移行し、先にも説明したように、ステップ７８〜ステップ８２において、ステップ８０の判定条件に合致する副論理インデックスセットが補助辞書に登録されているか否かが検索される。この場合は単語「SOFT」「DEV」の論理インデックス「500,501」が副論理インデックスセットとして補助辞書に登録されているので、ステップ８０の判定が肯定されてステップ８４へ移行する。

ステップ８４では、補助辞書から取り出した副論理インデックスセットと対応付けて登録されている主論理インデックスセットを補助辞書から取り出す。この場合は単語「SOFTWARE」「DEVELOPMENT」の論理インデックス「112,113」が主論理インデックスセットとして取り出される。次のステップ８６では、変換対象文字列の論理インデックスセットのうち、補助辞書から取り出した副論理インデックスセットを構成する各論理インデックスと同一の論理インデックスを、補助辞書から取り出した主論理インデックスセットを構成する各論理インデックスへ置換する。なお、この処理は「入力文字列のうち特定の副単語群を構成する全ての単語を、特定の副単語群と対応付けられて補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列を生成」することに相当しており、例えば変換対象文字列「NAKAMORI SOFT DEV」の論理インデックスセット「105,500,501」は、上記処理により文字列「NAKAMORI SOFTWARE DEVELOPMENT」を表す論理インデックスセット「105,112,113」に置換されることになる。

ステップ８８では、単一の顧客の情報を名称辞書から取り出し、取り出した情報に含まれる前記顧客の名称の論理インデックスセットをステップ８６の置換処理を経た変換対象文字列の論理インデックスセットと比較する。次のステップ９０では、変換対象文字列の論理インデックスセットが、名称辞書から取り出した論理インデックスセットを含む関係か否か判定する。判定が否定された場合は何ら処理を行うことなくステップ９４へ移行するが、判定が肯定された場合はステップ９２へ移行し、ステップ８８で名称辞書より取り出した単一の顧客の情報から顧客コードを抽出すると共に、置換処理を経た変換対象文字列の論理インデックスセットを構成する各論理インデックスのうち、名称辞書から取り出した論理インデックスセットに含まれていない論理インデックスの数（不一致単語数）を計数し、抽出した顧客コード及び計数した不一致単語数を名称辞書から取り出した論理インデックスセットと対応付けてメモリに記憶させた後にステップ９４へ移行する。なお、ステップ９２において、名称辞書から取り出した単一の顧客の情報に包摂コードも含まれている場合には、この包摂コードも抽出されてメモリに記憶される。

ステップ９４では、名称辞書に登録されている全ての論理インデックスを取り出したか（ステップ８６の置換処理を経た変換対象文字列の論理インデックスセットと比較したか）否か判定する。判定が否定された場合はステップ８８に戻り、ステップ９４の判定が肯定される迄ステップ８８〜ステップ９４を繰り返す。このステップ８８〜ステップ９４の処理により、変換対象文字列「NAKAMORI SOFT DEV」に対し、正規の名称が「NAKAMORI SOFTWARE DEVELOPMENT」である顧客Ｄの情報が名称辞書から抽出されてメモリに記憶されることになる。ステップ９４の判定が肯定されるとステップ９６へ移行し、上述したステップ８８〜ステップ９４の検索処理により、置換処理を経た変換対象文字列の論理インデックスセットに含まれる関係にある論理インデックスセット（ステップ９０の判定条件に合致する論理インデックスセット）が名称辞書から抽出されたか否か判定する。この場合は判定が肯定されてステップ９８へ移行し、置換処理を経た変換対象文字列の論理インデックスセットに対して先に説明した顧客コード判定処理が行われることで変換対象文字列が表す顧客名称が自動的に判定され、変換対象文字列に対応する顧客コードがオペレータの手を煩わすことなく自動的に出力されることになる。

なお、本実施形態では補助辞書に登録されている情報（正論理インデックスセット及び副論理インデックスセット）が、変換対象文字列が何れの顧客の名称を表す文字列かに拘らず共通に用いられ、例えば変換対象文字列が「AKASAKA SOFT DEV」であり、この変換対象文字列に対し、該変換対象文字列の論理インデックスセットに含まれる関係の論理インデックスセット（ステップ７０の判定条件を満足する論理インデックスセット）が名称辞書に存在していなかった場合にも、変換対象文字列の論理インデックスセットが文字列「AKASAKA SOFTWARE DEVELOPMENT」の論理インデックスセットへ置換され、置換後の論理インデックスセットに含まれる関係の論理インデックスセットが名称辞書に存在しているか否かが再度検索されることになる。

また、ステップ９６の判定が否定された場合は、変換対象文字列の論理インデックスセットを置換前の論理インデックスセットへ戻した後にステップ７８に戻り、変換対象文字列の論理インデックスセットに含まれる関係にある他の副論理インデックスセットが補助辞書に登録されているか否かが再度検索され、該当する副論理インデックスセットが抽出されたときには上述したステップ８４〜ステップ９６が再度行われることになる。

続いて、変換対象文字列「NAKAMORI SOFTWARE DEV」が入力された場合の処理について説明する。上記の変換対象文字列が入力された場合にも、ステップ６８〜ステップ７４の検索処理でステップ７０の判定条件に合致する論理インデックスセットは抽出されないので、ステップ７６の判定が否定されてステップ７８へ移行し、ステップ７８〜ステップ８２において、変換対象文字列の論理インデックスセットに含まれる関係にある副論理インデックスセットが補助辞書に登録されているか否かが検索される。この場合、単語「SOFT」「DEV」の論理インデックス「500,501」が副論理インデックスセットとして補助辞書に登録されているものの、変換対象文字列の論理インデックスセットには単語「SOFT」の論理インデックス「500」が含まれていないので、ステップ８２の判定が肯定されることで前述のオペレータ判定処理が行われる。

オペレータ判定処理において、正規の名称が「NAKAMORI SOFTWARE DEVELOPMENT」である顧客Ｄに付与された顧客コードがオペレータによって入力されると、ステップ１７６で顧客Ｄの正規の名称を表す論理インデックスセットが名称辞書から抽出された後にステップ１７８へ移行するが、この場合、顧客Ｄの正規の名称を表す文字列における変換対象文字列との不一致単語は「DEVELOPMENT」のみで、変換文字列における顧客Ｄの正規の名称を表す文字列との不一致単語も「DEV」のみであるので、ステップ１８０の判定が肯定されてステップ１８２へ移行する。正規の顧客名称を表す文字列における不一致単語数及び変換対象文字列における不一致単語数が各々１の場合、個々の文字列中の不一致単語が１対１で対応しているので、変換対象文字列中の不一致単語は正規の顧客名称を表す文字列における不一致単語と同義語であるとみなすことができる。

このため、ステップ１８２では、基本語辞書に登録されている変換文字列中の不一致単語の論理インデックスを、正規の顧客名称を表す文字列中の不一致単語と同一の論理インデックスへ書き替えることで、変換対象文字列中の不一致単語を、正規の顧客名称を表す文字列中の不一致単語の同義語として基本語辞書に再登録する。例えば上記の例では、変換文字列中の不一致単語「DEV」が、正規の顧客名称を表す文字列中の不一致単語「DEVELOPMENT」の同義語として基本語辞書に再登録される。これにより、次回以降は変換対象文字列「NAKAMORI SOFTWARE DEV」が顧客Ｄの正規の名称「NAKAMORI SOFTWARE DEVELOPMENT」と同一の論理インデックスセットへ変換されることになり、変換対象文字列「NAKAMORI SOFTWARE DEV」が顧客Ｄの名称を表す文字列であることを、オペレータの手を煩わせることなく自動的に判断することができる。

ステップ１８６では単一の副論理インデックスセットを補助辞書から取り出し、次のステップ１８８では、ステップ１８６で取り出した副論理インデックスセットの中に、変換対象文字列中の不一致単語の論理インデックスが存在しているか否か判定する。判定が否定された場合はステップ２００へ移行し、補助辞書に登録されている全ての副論理インデックスセットを取り出したか否か判定する。判定が否定された場合はステップ１８６に戻り、ステップ１８６以降の処理を繰り返す。また、ステップ１８８の判定が肯定された場合はステップ１９０へ移行し、ステップ１８６で取り出した副論理インデックスセットと対応付けられて補助辞書に登録されている主論理インデックスセットを補助辞書から取り出す。次のステップ１９２では、ステップ１９０で補助辞書から取り出した主論理インデックスセットの中に、正規の顧客名称を表す文字列中の不一致単語の論理インデックスが存在しているか否か判定する。

判定が否定された場合は何ら処理を行うことなくステップ２００へ移行するが、判定が肯定された場合はステップ１９４へ移行し、補助辞書に登録されている副論理インデックスセット（ステップ１８６で取り出した副論理インデックスセットと同一の論理インデックスセット）から変換対象文字列中の不一致単語の論理インデックスを削除すると共に、補助辞書に登録されている主論理インデックスセット（ステップ１９０で取り出した副論理インデックスセットと同一の論理インデックスセット）から正規の顧客名称を表す文字列中の不一致単語の論理インデックスを削除する。例えば単語「DEV」を単語「DEVELOPMENT」の同義語として基本語辞書に再登録した場合には、ステップ１８６で単語「SOFT」及び「DEV」に対応する副論理インデックスセット「500,501」を補助辞書から取り出した際にステップ１８８の判定が肯定され、ステップ１９０で上記の副論理インデックスセットに対応する主論理インデックスセットとして、単語「SOFTWARE」及び「DEVELOPMENT」に対応する論理インデックスセット「112,113」が補助辞書から取り出されることでステップ１９２の判定が肯定される。そしてステップ１９４において、「DEV」及び「DEVELOPMENT」に対応する論理インデックスが主／副論理インデックスセットから削除されることで、副論理インデックスセットを構成する論理インデックスは「SOFT」の論理インデックス「500」のみとなり、主論理インデックスセットを構成する論理インデックスは単語「SOFTWARE」の論理インデックス「112」のみとなる。

このように、基本語辞書に同義語として登録した単語を補助辞書から削除することで、補助辞書を記憶するための記憶容量が削減される。また、補助辞書に副論理インデックスセットとして登録されている単語群（素性が不明のために一塊りとして扱うべき単語群）の中に、素性が明確化した単語（基本語辞書に同義語として登録した単語）が混在している状態が解消されることで、補助辞書に登録されている情報の精度も向上する。

次のステップ１９６では、ステップ１９４で主論理インデックスセット及び副論理インデックスセットから不一致単語の論理インデックスを削除することで、主論理インデックスセットを構成する論理インデックスの数及び副論理インデックスセットを構成する論理インデックスの数が各々１になったか否か、すなわち主論理インデックスセット及び副論理インデックスセットとして対応付けられている単語が１対１の関係へ変化したか否か判定する。判定が否定された場合は何ら処理を行うことなくステップ２００へ移行する。一方、ステップ１９６の判定が肯定された場合は、上記の主論理インデックスセット及び副論理インデックスセットによって１対１で対応付けられている単語は同義語である可能性が極めて高い。

このため、ステップ１９８において、上記の主論理インデックスセット及び副論理インデックスセット自体を補助辞書から削除すると共に、上記の副論理インデックスセットに論理インデックスが設定されていた単語を、先のステップ１８２と同様にして、上記の主論理インデックスセットに論理インデックスが設定されていた単語の同義語として基本辞書に再登録する。例えば前述の例では、単語「SOFT」の論理インデックス「500」のみから成る副論理インデックスセット及び単語「SOFTWARE」の論理インデックス「112」のみから成る主論理インデックスセットが補助辞書から削除され、単語「SOFT」が単語「SOFTWARE」の同義語として基本語辞書に再登録されることになる。これにより、先にも説明したように、補助辞書を記憶するための記憶容量を削減できると共に、補助辞書に登録されている情報の精度も向上する。

なお、上記では変換対象文字列から取り出した単語が基本語辞書に登録されていなかった場合に、該単語に論理インデックスを付与して基本語辞書に新規に登録する処理を行うことで、変換対象文字列を構成する全ての単語を論理インデックスへ各々変換する例を説明したが、これに限定されるものではなく、変換対象文字列を構成する各単語のうち基本語辞書に未登録の単語については、論理インデックスへ変換することなくテキストデータのまま以降の処理を行うようにしてもよい。この場合、不要単語辞書及び補助辞書には、論理インデックスとして登録される単語とテキストデータとして登録される単語が混在する可能性があるが、本発明はこのような態様も権利範囲に含むものである。

また、上記では補助辞書に登録されている特定の副論理インデックスセットを構成する各単語が変換対象文字列に全て含まれている場合（ステップ８０の判定が肯定された場合）に、変換対象文字列に含まれている上記各単語を、特定の副論理インデックスセットに対応する特定の主論理インデックスセットを構成する各単語に置換した文字列に相当する論理インデックスセットを生成し（ステップ８６）、生成した論理インデックスセットを各顧客名称の論理インデックスセットと各々比較することで、変換対象文字列が表す顧客名称を判断するようにしていたが、本発明はこれに限定されるものではなく、変換対象文字列が表す顧客名称がオペレータによって判断され、正規の顧客名称を表す文字列における変換対象文字列との不一致単語及び変換文字列における正規の顧客名称を表す文字列との不一致単語を正／副論理インデックスセットとして補助辞書に登録するにあたり、この正／副論理インデックスセットをオペレータによって判断された顧客名称に対応する顧客コードと対応付けて登録し、特定の顧客コードと対応付けられた正／副論理インデックスセットを、変換対象文字列が前記特定の顧客コードに対応する顧客名称を表しているか否かを判断するときにのみ用いるようにしてもよい。

具体的には、補助辞書に登録されている特定の副論理インデックスセットを構成する各単語が変換対象文字列に全て含まれている場合に、変換対象文字列に含まれている上記各単語を、特定の副論理インデックスセットに対応する特定の主論理インデックスセットを構成する各単語に置換した文字列に相当する論理インデックスセットを生成し、生成した論理インデックスセットを、上記の特定の正／副論理インデックスと同一の特定顧客コードと対応付けられて名称辞書に登録されている単一の論理インデックスセットとのみ比較することで、変換対象文字列が上記の特定顧客コードに対応する特定の顧客名称を表しているか否かを判断するようにしてもよい。なお、上記態様は請求項４記載の発明に対応している。

また、上記態様において、特定顧客コードと対応付けて特定単語を不要単語辞書に不要単語として登録する場合に、上記の特定顧客コードと対応付けられて補助辞書に登録されている副論理インデックスセットを参照し、当該副論理インデックスセットの中に前記特定単語の論理インデックスが存在している場合には、当該副論理インデックスセットから前記特定単語の論理インデックスを削除するようにしてもよい。これにより、補助辞書を記憶するための記憶容量を削減できると共に、補助辞書に登録されている副論理インデックスセットに対応する単語群（素性が不明のために一塊りとして扱うべき単語群）の中に、素性（不要単語であること）が明確化した特定単語が混在している状態が解消されることになり、補助辞書に登録されている情報の精度も向上させることができる。この態様は請求項５記載の発明に対応している。また、上記のように副論理インデックスセットから特定単語の論理インデックスを削除することで、主／副論理インデックスセットを構成する単語の数が各々１個となった場合にも、当該主／副論理インデックスセットを補助辞書から削除してもよいことは言うまでもない。

更に、上記では変換対象文字列が、該変換対象文字列が表す顧客名称の文字列と完全には一致しておらず（不一致単語数≧１）、かつ変換対象文字列が表す顧客名称に包摂関係がある場合にのみ、不一致単語を不要単語として登録する例を説明したが、これに限定されるものではなく、変換対象文字列が表す顧客名称に包摂関係がない場合にも、変換対象文字列が顧客名称の文字列と完全には一致していなければ、不一致単語を不要単語として不要単語辞書へ登録するようにしてもよい。

また、上記では副論理インデックスセットとして、基本語辞書に登録されている登録対象単語の論理インデックスを補助辞書へそのまま登録する例を説明したが、これに限定されるものではなく、基本語辞書に登録されている登録対象単語の論理インデックスに対し、副論理インデックスセットであることを表す所定の編集（例えば所定の記号「♭」を末尾に付加する等）を行った論理インデックスを、副論理インデックスセットとして補助辞書へ登録するようにしてもよい。

また、上記では本発明に係る文字列として、顧客名称を表す文字列を例に説明したが、本発明はこれに限定されるものではなく、複数の単語が組合わされて成る任意の対象を表す文字列に適用可能である。

本実施形態に係るコンピュータ・システムの概略構成を示すブロック図である。 (Ａ)は基本語辞書の一例、(Ｂ)は名称辞書の一例、(Ｃ)は不要単語辞書の一例、(Ｄ)は補助辞書の一例を各々示すイメージ図である。顧客コード変換処理の内容を示すフローチャートである。顧客コード判定処理の内容を示すフローチャートである。オペレータ判定処理の内容を示すフローチャートである。

符号の説明

１０コンピュータ・システム
１２コンピュータ
１６ディスプレイ
１８マウス
２０キーボード
２２ＨＤＤ
２８ネットワーク
３０コンピュータ

Claims

所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表している前記所定の対象に付与された識別情報へ変換する情報変換装置であって、
識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書を記憶する第１記憶手段と、
補助辞書を記憶する第２記憶手段と、
入力された文字列を構成する単語の組合わせを前記名称辞書に登録されている単語の組合わせと各々比較することで、前記入力された文字列を構成する単語の組合わせと単語単位で完全一致又は部分一致する単語の組合わせを検索し、該検索の結果に基づいて、前記入力された文字列が表している対象の判断を試行し、該判断が不能の場合には、前記入力された文字列を表示装置に表示させることで、前記入力された文字列が表す対象の判断をオペレータに委ね、オペレータにより入力装置を介して入力された判断結果に基づいて、前記入力された文字列が表す対象を判断し、前記入力された文字列を前記判断した対象に付与された識別情報へ変換する変換手段と、
前記入力された文字列が表す対象の判断がオペレータに委ねられた場合に、判断された対象を表す対象文字列を入力された文字列と比較し、前記対象文字列における前記入力文字列との不一致単語数が１個、かつ前記入力文字列における前記対象文字列との不一致単語数が１個の場合以外であれば、前記対象文字列における前記入力文字列との全ての不一致単語から成る主単語群と、前記入力文字列における前記対象文字列との全ての不一致単語から成る副単語群を対応付けて前記補助辞書に登録する単語登録手段と、
を備え、
前記変換手段は、入力文字列を前記補助辞書に登録されている前記副単語群と比較することで、前記入力文字列に特定の副単語群を構成する全ての単語が含まれているか否かを判断し、特定の副単語群を構成する全ての単語が前記入力文字列に含まれていた場合、前記入力文字列のうちの該当する単語を、前記特定の副単語群と対応付けられて前記補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列を生成し、生成した文字列も用いて前記入力された文字列が表している対象を判断することを特徴とする情報変換装置。
文字列を構成する個々の単語に関する情報を登録するための基本語辞書を記憶する第３記憶手段を備え、
前記単語登録手段は、前記対象文字列における前記入力文字列との不一致単語数が１個、かつ前記入力文字列における前記対象文字列との不一致単語数が１個の場合は、前記入力文字列における前記対象文字列との不一致単語を、前記対象文字列における前記入力文字列との不一致単語の同義語として前記基本語辞書に登録し、
前記変換手段による、前記入力文字列を構成する単語の組合わせと単語単位で完全一致又は部分一致する単語の組合わせの検索において、前記基本語辞書に第１の単語の同義語として登録されている第２の単語を含む入力文字列は、該入力文字列における前記第２の単語を前記第１の単語に置き換えた文字列と同一として扱われることを特徴とする請求項１記載の情報変換装置。
前記単語登録手段は、前記入力文字列における前記対象文字列との不一致単語を、前記対象文字列における前記入力文字列との不一致単語の同義語として前記基本語辞書に登録する際に、前記入力文字列における前記対象文字列との不一致単語が、特定の副単語群を構成する単語として前記補助辞書に登録されており、かつ前記特定の副単語群に対応する特定の主単語群に、前記対象文字列における前記入力文字列との不一致単語が含まれているか否か判定し、判定が肯定された場合は前記入力文字列における前記対象文字列との不一致単語及び前記対象文字列における前記入力文字列との不一致単語を前記補助辞書から削除することを特徴とする請求項２記載の情報変換装置。
前記単語登録手段は、前記主単語群及び前記副単語群を前記判断された対象に付与された識別情報と対応付けて前記補助辞書に登録し、
前記変換手段は、特定の副単語群を構成する全ての単語が前記入力文字列に含まれていた場合に、前記入力文字列のうちの該当する単語を、前記特定の副単語群と対応付けられて前記補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列を生成し、前記特定の副単語群及び前記特定の主単語群と同一の特定識別情報と対応付けられて前記名称辞書に登録されている単語の組合わせが、前記生成した文字列を構成する単語の組合わせに含まれているか否か判定し、判定が肯定された場合に前記入力文字列を前記特定識別情報へ変換することを特徴とする請求項１記載の情報変換装置。
不要単語を登録するための不要単語辞書を記憶する第４記憶手段を更に備え、
前記単語登録手段は、前記変換手段によって判断された対象を表す対象文字列を入力された文字列を比較し、前記対象文字列には前記入力文字列との不一致単語が存在しておらず、かつ前記入力文字列には前記対象文字列との不一致単語が存在していた場合に、前記入力文字列における前記対象文字列との不一致単語を、前記判断された対象に付与された特定識別情報と対応付け不要単語として前記不要単語辞書に登録すると共に、前記入力文字列における前記対象文字列との不一致単語が、前記特定識別情報に対応する特定の副単語群を構成する単語として前記補助辞書に登録されているか否か判定し、判定が肯定された場合は前記入力文字列における前記対象文字列との不一致単語を前記補助辞書から削除することを特徴とする請求項４記載の情報変換装置。
前記単語登録手段は、前記補助辞書からの単語の削除を行うことで、特定の副単語群を構成する単語の数が１になり、かつ前記特定の副単語群に対応する特定の主単語群を構成する単語の数が１になるか否か判定し、判定が肯定された場合は、前記特定の副単語群を構成する単一の単語を、前記特定の副単語群に対応する特定の主単語群を構成する単一の単語の同義語として前記基本語辞書に登録すると共に、前記特定の副単語群及び前記特定の副単語に対応する特定の主単語群を前記補助辞書から削除することを特徴とする請求項３又は請求項５記載の情報変換装置。
入力される文字列を構成する個々の単語に相当する文字列と個々の単語に付与された論理インデックスが対応付られけて予め各々登録された基本語辞書を記憶する第３記憶手段と、
入力された文字列を構成する個々の単語に相当する文字列をキーにして前記基本語辞書の検索を各々行うことで、入力された文字列を、該文字列を構成する個々の単語を単位として論理インデックスへ変換する単語変換手段と、
を更に備え、
前記基本語辞書以外の各辞書には、各単語が各単語に対応する前記論理インデックスとして登録されており、
前記変換手段及び前記不要単語登録手段は、前記入力された文字列として、前記入力された文字列が前記単語変換手段によって単語単位で変換されることで得られる論理インデックスの組合わせを用いて各処理を行うことを特徴とする請求項１乃至請求項６の何れか１項記載の情報変換装置。
コンピュータを、所定の対象を表すために複数の単語が組合わされて構成された文字列が入力される度に、該入力された文字列を、該入力された文字列が表している前記所定の対象に付与された識別情報へ変換する情報変換装置として機能させるための情報変換プログラムであって、
前記コンピュータは、識別情報が付与された個々の対象について、個々の対象に付与された識別情報と個々の対象を表す文字列を構成する単語の組合わせが対応付られけて各々登録された名称辞書を記憶する第１記憶手段と、補助辞書を記憶する第２記憶手段を備え、
前記コンピュータを、
入力された文字列を構成する単語の組合わせを前記名称辞書に登録されている単語の組合わせと各々比較することで、前記入力された文字列を構成する単語の組合わせと単語単位で完全一致又は部分一致する単語の組合わせを検索し、該検索の結果に基づいて、前記入力された文字列が表している対象の判断を試行し、該判断が不能の場合には、前記入力された文字列を表示装置に表示させることで、前記入力された文字列が表す対象の判断をオペレータに委ね、オペレータにより入力装置を介して入力された判断結果に基づいて、前記入力された文字列が表す対象を判断し、前記入力された文字列を前記判断した対象に付与された識別情報へ変換する変換手段、
及び、前記入力された文字列が表す対象の判断がオペレータに委ねられた場合に、判断された対象を表す対象文字列を入力された文字列と比較し、前記対象文字列における前記入力文字列との不一致単語数が１個、かつ前記入力文字列における前記対象文字列との不一致単語数が１個の場合以外であれば、前記対象文字列における前記入力文字列との全ての不一致単語から成る主単語群と、前記入力文字列における前記対象文字列との全ての不一致単語から成る副単語群を対応付けて前記補助辞書に登録する単語登録手段
として機能させると共に、
前記変換手段は、入力文字列を前記補助辞書に登録されている前記副単語群と比較することで、前記入力文字列に特定の副単語群を構成する全ての単語が含まれているか否かを判断し、特定の副単語群を構成する全ての単語が前記入力文字列に含まれていた場合、前記入力文字列のうちの該当する単語を、前記特定の副単語群と対応付けられて前記補助辞書に登録されている特定の主単語群を構成する単語に置き換えた文字列を生成し、生成した文字列も用いて前記入力された文字列が表している対象を判断する
ことを特徴とする情報変換プログラム。