JP3743252B2 - Alphabet notation corporate name search system and method, and recording medium recording the processing program - Google Patents
Alphabet notation corporate name search system and method, and recording medium recording the processing program Download PDFInfo
- Publication number
- JP3743252B2 JP3743252B2 JP2000085065A JP2000085065A JP3743252B2 JP 3743252 B2 JP3743252 B2 JP 3743252B2 JP 2000085065 A JP2000085065 A JP 2000085065A JP 2000085065 A JP2000085065 A JP 2000085065A JP 3743252 B2 JP3743252 B2 JP 3743252B2
- Authority
- JP
- Japan
- Prior art keywords
- corporate
- name
- type
- identification information
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、英語法人名等、アルファベット表記の法人名をコンピュータシステムを用いて検索する技術に係わり、特に、正確な法人名が分からない場合においても、対象の特定または候補の表示を可能とするアルファベット表記法人名検索システムと方法およびその処理プログラムを記録した記録媒体に関するものである。
【0002】
【従来の技術】
例えば、外資系法人や商社等においては、コンピュータを用いて顧客情報を英字で管理するシステムが多く存在する。このようなシステムで名称による検索を行う際、日本語法人名だけが分かっているが正確な英語法人名が分からない場合、日本語法人名から英語法人名を推測して完全一致または部分一致による検索を行うこととなる。
【0003】
しかしながら、このような単純な文字列の比較では、下記の要因により、検索条件と検索対象に不一致が生じる可能性がある。
【0004】
▲1▼日本語における「株式会社」や「有限会社」等の法人格種別を示す英語文字列は通常、「CO.,Ltd 」等に対応するが、各国の法制度の違いにより、1対1には対応できない。また、「株式会社」に対する「KK」等、正確な英語ではなく、日本語を略したアルファベット表記が一般で使用されている。
【0005】
▲2▼業種を示す文字列は、単にローマ字表記とする場合と、英訳する場合がある。英訳する場合は、同じ日本語業種名に対して、複数の英訳が存在しうる。
【0006】
このような要因により、完全一致に基づく検索を行うと、対象とする法人の検索を行うことができない可能性がある。例えば「〜建設」は、単に「KENSETSU」と日本語の読みをそのままローマ字化する場合と「CONSTRUCTION」や「CONSTRUCTIONS」等、英語に換える場合があり、いずれかでの検索は不可能となる。
【0007】
また、部分文字列が一致するものを候補として全て検索すると、同一企業グループに属する企業や、多く存在する姓、地名をもとに付与された法人名の場合、一致する法人数が非常に多くなるという問題が生じる。
【0008】
【発明が解決しようとする課題】
解決しようとする問題点は、従来の技術では、英語等のアルファベットで表記された法人名を検索する際、法人格の種別や業種を表す文字列が検索条件と厳密に一致しない場合、対象の特定または候補の表示を行うことができない点である。
【0009】
本発明の目的は、これら従来技術の課題を解決し、例えば、外資系法人や商社等における英字での顧客情報の管理を行うコンピュータシステムの利便性および性能を向上させることを可能とするアルファベット表記法人名検索システムと方法およびその処理プログラムを記録した記録媒体を提供することである。
【0010】
【課題を解決するための手段】
上記目的を達成するため、本発明のアルファベット表記法人名検索システムと方法は、例えば図1に示す構成とし、法人格種別名毎に各法人格種別の分類を示す法人種別コード105aを付与して格納した法人格種別辞書105と、業種名に当該業種の分類を示す業種コード106aを付与して格納した業種名辞書106とを用いて、英語法人名解析部102およびデータ登録部111により、予め入力された英語法人名(101)を、法人格種別、業種名、法人固有名に分離処理し、法人格種別コード105aと業種名コード106aを付与して、検索対象データ103として格納しておき、入力された検索条件(英語法人名)104についても英語法人名解析部102による同じ分離処理を行い、その後、英語法人名検索部107により、その分離した部分毎に、検索対象データ103との比較を行う。そして、その結果を予め定義した照合ルール108に基づき評価し、一定の基準を超えるものを対象として抽出する。例えば、法人固有名と業種名コード106aの業界コード106bが一致すれば、法人格種別コード105aと業種名コード106aの業態コード106cが不一致であっても、検索対象として抽出する。
【0011】
【発明の実施の形態】
以下、本発明の実施の形態を、図面により詳細に説明する。
図1は、本発明に係わるアルファベット表記法人名検索システムの構成例を示すブロック図である。
【0012】
本図1において、1はキーボードやマウス等からなる入力装置、2はCPU(Central Processing Unit)2aや主メモリ2b等からなり蓄積プログラム方式によるコンピュータ処理を行なう情報処理装置、3,4はHDD(Hard Disk Drive)等からなる外部記憶装置、5はCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等からなる表示装置、6は本発明に係わるプログラムやデータを記録したCD−ROM(Compact Disc-Read Only Memory)もしくはDVD(Digital Video Disc/Digital Versatile Disc)等からなる光ディスク、7は光ディスク6に記録されたプログラムおよびデータを読み出すための駆動装置、8はLAN(Local Area Network)カードやモデム等からなる通信装置である。
【0013】
光ディスク6に格納されたプログラムおよびデータを情報処理装置2により駆動装置7を介して外部記憶装置3,4内にインストールした後、外部記憶装置3,4から主メモリ2bに読み込みCPU2aで処理することにより、情報処理装置2内に英語法人名解析部102や英語法人名検索部107、辞書・ルール登録部、および、データ登録部111等の各機能が設けられ、本発明のアルファベット表記法人名検索システムが構成される。
【0014】
本例のアルファベット表記法人名検索システムは、特に、英語表記された法人名の検索を行うものであり、予め、辞書・ルール登録部110により外部記憶装置3内に、図6に具体例を示す法人格辞書105と、図7に具体例を示す業種名辞書106,および、図10に具体例を示す照合ルール108が格納されている。
【0015】
本図1において、光ディスク6と駆動装置7および通信装置8は除く、破線の左は検索対象の法人名データを蓄積する処理に係わる部分であり、また、破線の右は検索条件として入力された法人名に基づく検索/照会を行う処理に係わる部分である。
【0016】
データ(法人名)を蓄積する際は、光ディスク6や通信装置8あるいはFD(Flexible Disk)、入力装置1等を介して、英語法人名を含む顧客データ101を入力し、英語法人名解析102により、法人格種別辞書105と業種名辞書106を参照して、その英語法人名を▲1▼法人種別、▲2▼業種名、▲3▼法人固有名(▲1▼および▲2▼を分離した後の文字列)に分離し、データ登録部111により、外部記憶装置4に検索対象データ103として保管する。
【0017】
また、データ(法人名)の検索/照会の際は、例えばユーザが入力装置1から検索条件(英語法人名)104を入力すると、まず、データ蓄積での処理と同様に、英語法人名解析102により、法人格種別辞書105と業種名辞書106を参照して、その英語法人名を▲1▼法人種別、▲2▼業種名、▲3▼法人固有名に分離し、次に、英語法人名検索部107により、検索対象データ103から法人固有名が一致するデータを抽出し、照合ルール108を参照して、それらの一致度を判定し、一致度が予め定められた値以上の値となったデータを対象として、表示装置5の画面上に検索結果109として表示する。
【0018】
以下、このような構成のアルファベット表記法人名検索システムの処理動作を図2を用いて説明する。
図2は、本発明に係わるアルファベット表記法人名検索方法の処理動作例を示すフローチャートである。
【0019】
本例は、図1におけるアルファベット表記法人名検索システムの処理動作例を示すものであり、本図2においては、図1におけるアルファベット表記法人名検索システムによる法人名解析手順を大きく3つのステップ動作に分けている。
【0020】
第1は、ステップ301の英語法人名整形処理であり、この処理では、図3で詳細に示すように、▲1▼英子文字の大文字化、▲2▼記号の空白への置換、▲3▼連続する空白の1つの空白への置換を行う。
第2は、ステップ401の法人格種別分離処理であり、この処理では、図4で詳細に示すように、法人格種別を表す文字列を分離する。
そして、第3は、ステップ501の業種名分離処理であり、この処理では、図5で詳細に示すように、業種名を表す文字列を分離する。
【0021】
尚、このようにして、法人格種別および業種名を分離した後に残った文字列を法人固有名とする。
以下、このようなステップ301,401,501のそれぞれの処理の詳細を、図3〜図7を用いて説明する。
【0022】
図3は、図2におけるステップ301の英語法人名整形処理の詳細を示すフローチャートであり、図4は、図2におけるステップ401の法人格種別分離処理の詳細を示すフローチャート、図5は、図2におけるステップ501の業種名分離処理の詳細を示すフローチャート、図6は、図4における法人格種別分離処理で用いる図1の法人格種別辞書の具体例を示す説明図であり、図7は、図5における業種名分離処理で用いる図1の業種名辞書の具体例を示す説明図である。
【0023】
図3におけるステップ301の処理(英語法人名整形処理)では、英語法人名を先頭から末尾まで、1文字ずつずらしながら、次のステップ302〜306での処理を繰り返す。
【0024】
まず、ステップ302の処理において、英子文字を大文字に変換し、次に、ステップ303の処理で、各記号を空白に置換する。さらに、ステップ304〜306の処理において、連続する空白を1つの空白へ置換する。すなわち、ステップ304の処理では、直前に設定した文字が空白で、かつ、今回設定する文字も空白か否かを判別し、空白であればステップ305の処理に移り何もせず次の文字の処理へ移り、また、空白でなければステップ306の処理、すなわち、置き換え後の文字を整形後、英数名称に移す。
【0025】
図4におけるステップ401の処理(法人格種別分離処理)では、図1の法人格種別辞書105における法人格種別と、英語法人名の後方および前方文字列を比較するステップ402〜410での処理を、一致する法人格種別が見つかるか、または、法人格種別辞書105の終わりまで、繰り返し、一致する法人格種別が見つかれば、その文字列を業種名として分離する。
【0026】
通常、法人格種別を示す文字列は、英語表記(CO.,LTD等)の場合、法人名の最後尾に記載される。しかし、株式会社を「KK」と表記する等、日本語の法人格種別をローマ字表記した場合、前方に記載される場合もある。そこで、図6における法人格種別辞書105で示すように、検索対象とする法人格種別が、「前方付加」、「後方付加」が許可されているかを予め登録しておく。
【0027】
そして、最初のステップ402の処理において、後方付加が許可されているかを判定し、許可されている場合、ステップ403の処理で、法人格種別辞書105における法人格種別と、入力された英語法人名の後方文字列を比較し、ステップ404の処理で、それれぞれの文字列が一致するか否かを判定する。
【0028】
一致すれば、ステップ405の処理に移り、当該文字列を法人格種別として、英語法人名より分離し、図6に示す法人格種別辞書105における「法人格種別コード」を保管する。一致しなければ、あるいは、ステップ402での判定処理において、後方付加が許可されていないと判定された場合、ステップ406での処理により、前方付加が許可されているか否かを判定する。
【0029】
許可されている場合、ステップ407の処理に移り、法人格種別辞書105における法人格種別辞書と英語法人名の後方文字列を比較し、ステップ408の処理で、それぞれの文字列が一致するか否かを判定する。
【0030】
一致すれば、ステップ409の処理に移り、当該文字列を法人格種別として、英語法人名より分離し、図6に示す法人格種別辞書105における「法人格種別コード105a」を保管する。一致しなければ、あるいは、ステップ406での判定処理において、先頭付加が許可されていないと判定された場合、ステップ410での処理により、次の法人格種別辞書105における法人格種別の処理へ移る。
【0031】
図5におけるステップ501の処理(業種名分離処理)では、図7に示す業種名辞書106における業種名と、入力された英語法人名(法人格種別分離後)の後方文字列を比較し、これを、一致する業種名が見つかるか、または業種名辞書106の終わりまで繰り返す。
【0032】
尚、大部分の法人において、業種名は、▲1▼法人格種別が後方に記載されていた場合にはその直前、また、▲2▼法人格種別が前方に記載されていた場合には最後尾に記載される。そのため、業種名の分離においては、英語法人名(法人格種別分離後)の後方文字列だけを検索の対象とする。
【0033】
まず、最初のステップ502の処理において、図7に示す業種名辞書106における業種名と、入力された英語法人名の後方文字列を比較し、ステップ503の処理で、文字列が一致したか否かを判定する。
【0034】
一致した場合には、ステップ504での処理により、当該文字列を業種名として、英語法人名より分離し、図7に示す業種名辞書106における「業種名コード106a」を保管し、一致しなければ、ステップ505での処理により、次の業種名辞書106における業種名の処理へ移る。
尚、ステップ504での処理による業種名分離後の英語法人名は、法人固有名として保管する。
【0035】
以下、このような、英語法人名の解析動作を、図8を用いて具体的に説明する。
【0036】
図8は、図1における英語法人名解析部の処理動作の具体例を示す説明図である。
本図8において、801は図1における英語法人名を含む顧客データ101に含まれる英語法人名であり、具体的には「ABC Constructions
CO.,LTD.」となっている。
【0037】
この英語法人名801に対して、図1の英語法人名解析部102は、まず、図2および図3に示すステップ301の英語法人名整形処理を行い、整形後の英語法人名802を生成する。ここでは、「ABC CONSTRUCTIONS CO LTD 」と、全て大文字に、また、各記号「.」、「,」はスペース(空白)に変換され、かつ、連続するスペースは一つに削除され、整形されている。
【0038】
次に、図2および図4に示すステップ401の法人格種別分離処理を行い、法人格種別コード803を取得する。ここでは、法人格種別として「CO LTD」が分離され、図6に示す法人格種別辞書105の内容(法人格種別コード105a)に従って、「113」が法人格種別コード803として所得されている。
【0039】
さらに、この「CO LTD 」法人格種別が分離された残りの法人固有名、ここでは、「ABC CONSTRUCTIONS」に対して、図2および図5に示すステップ501の業種名分離処理を行い、業種名コード804を取得する。ここでは、業種名として「CONSTRUCTIONS」が分離され、図7に示す業種名辞書106の内容(業種名コード106a)に従って、「0101」が業種名コード804として取得されている。
【0040】
このようにして分離・取得された法人格種別と法人格種別コード、および、業種名と業種名コードからなる英語法人名データ805が、図1における検索対象データ103として登録される。
次に、このようにして英語法人名データ805などが登録された検索対象データ103を用いた英語法人名の検索動作、すなわち、図1における英語法人名検索部107の本発明に係わる処理動作例を説明する。
【0041】
図9は、図1における英語法人名検索部の処理動作例を示すフローチャートであり、図10は、図1における照合ルールの具体例を示す説明図、図11は、図1における英語法人名検索部による処理動作の具体例を示す説明図である。
【0042】
図9における処理は、図1における入力装置1から検索条件(英語法人名)104が入力され、この検索条件(英語法人名)104に対して、図1の英語法人名解析部102による図2〜図8で説明した処理を行ったの後の処理である。
【0043】
まず、ステップ901での比較処理により、英語法人名解析部102で分解した法人固有名、法人格種別コード、業種名コードの単位で、検索条件(英語法人名)104と検索対象データ103との比較を行う。次に、比較した結果を、図10にその詳細を示すルール照合902において予め定義してあるルールを参照し、当該検索対象データ103を抽出対象とするか否かを決定する。
【0044】
以下、このような処理動作を、図11に示す具体例を用いて説明する。
図11において、英語法人名1101と英語法人名データ1102は、図8で説明した図1における英語法人名を含む顧客データ101に含まれる英語法人名801と、その英語法人名解析処理結果の英語法人名データ805と同じものである。
【0045】
また、1104は、図1における入力装置1から入力された検索条件(英語法人名)104に対して図1における英語法人名解析部102による図2,3に示す英語法人名整形処理(ステップ301)を施した結果の具体例を示す整形後の英語法人名であり、ここでは、整形後の英語法人名1104は、「KK ABC
KENSETSU」として整形されている。
【0046】
また、1103は、この英語法人名1104に対する図1における英語法人名解析部102による図2,4,5の各処理で得られた英語法人名データであり、法人固有名「ABC」、法人格種別「KK」、法人格種別コード「121」、業種名「KENSETSU」、そして、業種名コード「0101」に、分離されかつ各コードが取得され付与されている。
【0047】
この英語法人名データ1103と、英語法人名データ1102との照合を例とした英語法人名の検索動作では、その法人固有名は共に「ABC」で同じであり、その比較結果は「一致」となる。また、法人格種別に関しては、それぞれの法人格種別が「CO LTD 」と「KK」で、かつ、その法人格種別コードがそれぞれ「113」と「121」であり「不一致」となっている。
【0048】
また、業種名に関しては、「CONSTRUCTIONS」と「KENSETSU」で異なっているが、その業種名コードにおいて「0101」で4桁とも一致している。
【0049】
このような比較結果を基に、図10に示す照合ルール108を参照する。この照合ルール108によれば、その条件欄108aに示すように、法人格種別コードは不一致(図中「N」)であっても、法人固有名と業種名コードの上下各2桁が一致(図中「Y」)すれば、図中の「1」のケースに該当し、その処理欄108bにおいて抽出対象としている(図中「○」)。従って、当該検索対象データは、抽出対象となる。
【0050】
尚、図10における照合ルール108の「2」のケースで示すように、法人固有名と、図7に示す業種名コード106aの業界コード106bが一致すれば、図6の法人格種別コード105aと、図7の業種名コード106aにおける業態コード106cが不一致であっても、検索対象として抽出する。
【0051】
以上、図1〜図11を用いて説明したように、本例のアルファベット表記法人名検索システムと方法では、法人格種別名毎に各法人格種別の分類を示す法人種別コード105aを付与して格納した法人格種別辞書105と、業種名に当該業種の分類を示す業種コード106aを付与して格納した業種名辞書106とを用いて、英語法人名解析部102およびデータ登録部111により、予め入力された英語法人名(英語法人名を含む顧客データ101)を、法人格種別、業種名、法人固有名に分離処理し、法人格種別コード105aと業種名コード106aを付与して、検索対象データ103として格納しておく。
【0052】
そして、入力された検索条件(英語法人名)104についても英語法人名解析部102による同じ分離処理を行い、その後、英語法人名検索部107により、その分離した部分毎に、検索対象データ103との比較を行う。その結果を予め定義した照合ルール108に基づき評価し、一定の基準を超えるものを対象として抽出する。例えば、固有名と業種名コード106aの業界コード106bが一致すれば、法人格種別コード105aと業種名コード106aの業態コード106cが不一致であっても、検索対象として抽出する。
【0053】
このことにより、英語表記された法人名を検索する際、検索条件の英語法人名においての法人格の種別や業種を表す文字列が、検索対象データ103とと厳密に一致しないときでも、対象の特定または候補の表示を行うことが可能となる。
【0054】
尚、本発明は、図1〜図11を用いて説明した例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。例えば、本例では、英語表記の法人名を例として説明しているが、ドイツ語やフランス語、イタリア語、オランダ語等、他のアルファベット表記の法人名に対しても適用できる。
【0055】
また、本例では、図1に示すように、検索対象データ103を、法人格種別辞書105や業種名辞書106、照合ルール108とは異なる外部記憶装置4に格納する構成としているが、同じ外部記憶装置3に格納する構成でも、また、それぞれ異なる記憶装置を用いることでも良い。
【0056】
また、本例では、光ディスク6を記録媒体として用いているが、FDを記録媒体として用いることでも良い。また、プログラムのインストールに関しても、通信装置8を介してネットワーク経由でプログラムをダウンロードしてインストールすることでも良い。
【0057】
【発明の効果】
本発明によれば、英語等のアルファベットで表記された法人名を検索する際、法人格の種別や業種を表す文字列が検索条件と厳密に一致しない場合でも、検索対象の特定または候補の表示を行うことができ、例えば、外資系法人や商社等における英字での顧客情報の管理を行うコンピュータシステムの利便性および性能を向上させることが可能である。
【図面の簡単な説明】
【図1】本発明に係わるアルファベット表記法人名検索システムの構成例を示すブロック図である。
【図2】図1におけるアルファベット表記法人名検索システムの本発明に係わる処理動作例を示すフローチャートである。
【図3】図2におけるステップ301の英語法人名整形処理の詳細を示すフローチャートである。
【図4】図2におけるステップ401の法人格種別分離処理の詳細を示すフローチャートである。
【図5】図2におけるステップ501の業種名分離処理の詳細を示すフローチャートである。
【図6】図4における法人格種別分離処理で用いる図1の法人格種別辞書の具体例を示す説明図である。
【図7】図5における業種名分離処理で用いる図1の業種名辞書の具体例を示す説明図である。
【図8】図1における英語法人名解析部の処理動作の具体例を示す説明図である。
【図9】図1における英語法人名検索部の処理動作例を示すフローチャートである。
【図10】図1における照合ルールの具体例を示す説明図である。
【図11】図1における英語法人名検索部による処理動作の具体例を示す説明図である。
【符号の説明】
1:入力装置、、2:情報処理装置、2a:CPU、2b:主メモリ、3,4:外部記憶装置、5:表示装置、6:光ディスク、7:駆動装置、8:通信装置、101:英語法人名を含む顧客データ、102:英語法人名解析部、103:検索対象データ、104:検索条件(英語法人名)、105:法人格種別辞書、105a:法人格種別コード、106:業種名辞書、106a:業種名コード、106b:業界コード、106c:業態コード、107:英語法人名検索部、108:照合ルール、108a:条件、108b:処理、109:検索結果、110:辞書・ルール登録部、111:データ登録部、801:英語法人名、802:整形後の英語法人名、803:法人格種別コード、804:業種名コード、805:英語法人名データ、1101:英語法人名、1102:英語法人名データ、1103:英語法人名データ、1104:整形後の英語法人名。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a technique for searching for an English-language corporate name or the like using a computer system, and in particular, even when an accurate corporate name is not known, it is possible to specify a target or display candidates. The present invention relates to an alphabetical corporate name search system and method, and a recording medium on which the processing program is recorded.
[0002]
[Prior art]
For example, in foreign corporations and trading companies, there are many systems that manage customer information in English using a computer. When performing a search by name in such a system, if only the Japanese corporation name is known but the exact English corporation name is not known, the English corporation name is inferred from the Japanese corporation name, resulting in complete or partial matching. A search will be performed.
[0003]
However, in such a simple character string comparison, there is a possibility that a mismatch occurs between the search condition and the search target due to the following factors.
[0004]
(1) The English character string indicating the corporate case type such as “corporation” or “limited company” in Japanese usually corresponds to “CO., Ltd”, etc., but one-to-one due to differences in legal systems in each country. Can not respond. In addition, an alphabet notation such as “KK” for “corporation” is generally used instead of accurate English.
[0005]
(2) The character string indicating the business type may be simply written in Roman letters or translated into English. In the case of English translation, there can be multiple English translations for the same Japanese industry name.
[0006]
Due to such factors, if a search based on a complete match is performed, there is a possibility that the target corporation cannot be searched. For example, “~ construction” may be simply converted into English, such as “KENSETSU” and the Japanese reading as it is, or “CONSTRUCTION” or “CONSTRUCTIONS”.
[0007]
In addition, if you search for all candidates with matching partial character strings, the number of matching corporations is very large for corporations that belong to the same corporate group or corporation names that are given based on many surnames and place names. Problem arises.
[0008]
[Problems to be solved by the invention]
The problem to be solved is that in the conventional technology, when searching for corporate names written in alphabets such as English, if the character string indicating the type of corporate case or the type of business does not exactly match the search conditions, the target is identified. Alternatively, the candidate cannot be displayed.
[0009]
The object of the present invention is to solve these problems of the prior art, for example, alphabet notation that makes it possible to improve the convenience and performance of a computer system that manages customer information in English characters in a foreign corporation, trading company, etc. It is an object of the present invention to provide a corporate name search system and method, and a recording medium recording the processing program.
[0010]
[Means for Solving the Problems]
In order to achieve the above object, the system and method for searching for an alphabetical corporate name according to the present invention has the configuration shown in FIG. 1, for example, and stores the
[0011]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a block diagram showing a configuration example of an alphabetical corporate name search system according to the present invention.
[0012]
In FIG. 1, 1 is an input device comprising a keyboard and mouse, 2 is an information processing device comprising a CPU (Central Processing Unit) 2a, a
[0013]
After the program and data stored in the optical disk 6 are installed in the
[0014]
The alphabet-incorporated corporate name search system of the present example particularly searches for a corporate name written in English. A specific example is shown in FIG. 6 in advance in the
[0015]
In FIG. 1, except for the optical disk 6, the
[0016]
When storing data (corporate name),
[0017]
When searching / inquiring data (corporate name), for example, when a user inputs a search condition (English corporate name) 104 from the
[0018]
The processing operation of the alphabet-incorporated corporate name search system configured as described above will be described below with reference to FIG.
FIG. 2 is a flowchart showing an example of the processing operation of the alphabetical corporate name search method according to the present invention.
[0019]
This example shows an example of processing operation of the alphabet-incorporated corporate name search system in FIG. 1. In FIG. 2, the corporate name analysis procedure by the alphabet-indicated corporate name search system in FIG. 1 is largely divided into three step operations. It is divided.
[0020]
The first is the English corporate name formatting process in
The second is a legal case type separation process in
The third is the industry name separation process in
[0021]
In this way, the character string remaining after separating the corporate case type and the business type name is used as the corporate unique name.
Hereinafter, details of each of the processes in
[0022]
FIG. 3 is a flowchart showing details of the English corporate name shaping process in
[0023]
In the process of
[0024]
First, in the process of
[0025]
In the process of
[0026]
Normally, the character string indicating the corporate case type is written at the end of the corporate name in the case of English notation (CO., LTD, etc.). However, when a Japanese corporate personality type is written in Roman letters, such as “KK”, it may be written forward. Therefore, as indicated by the corporate
[0027]
Then, in the
[0028]
If they match, the process proceeds to step 405 where the character string is separated from the English corporate name as the legal case type and the “corporate case type code” in the legal
[0029]
If permitted, the process proceeds to step 407, the corporate case type dictionary in the corporate
[0030]
If they match, the process proceeds to step 409, where the character string is separated from the English corporate name as the legal case type, and “corporate
[0031]
In the process of
[0032]
For most corporations, the name of the business type is (1) immediately before the corporate case type is listed at the back, and (2) at the end when the corporate case type is listed at the front. be written. For this reason, in the separation of industry names, only the back character string of the English corporate name (after separation of the corporate case type) is searched.
[0033]
First, in the process of the
[0034]
If they match, the process in
Note that the English corporate name after the separation of the industry name by the processing in
[0035]
Hereinafter, the English corporate name analysis operation will be specifically described with reference to FIG.
[0036]
FIG. 8 is an explanatory diagram showing a specific example of the processing operation of the English corporate name analysis unit in FIG.
In FIG. 8,
CO. , LTD. "
[0037]
For the English
[0038]
Next, the corporate case type separation process of
[0039]
Further, the business name separation process of
[0040]
The English
Next, an English corporate name search operation using the
[0041]
9 is a flowchart showing an example of processing operation of the English corporate name search unit in FIG. 1, FIG. 10 is an explanatory diagram showing a specific example of the matching rule in FIG. 1, and FIG. 11 is an English corporate name search in FIG. It is explanatory drawing which shows the specific example of the processing operation by a part.
[0042]
9, the search condition (English corporate name) 104 is input from the
[0043]
First, the comparison between the search condition (English corporate name) 104 and the
[0044]
Hereinafter, such processing operation will be described using a specific example shown in FIG.
In FIG. 11, the English
[0045]
1104 is an English corporate name shaping process shown in FIGS. 2 and 3 by the English corporate
“KENSETSU”.
[0046]
[0047]
In the English corporate name search operation in which the English
[0048]
In addition, regarding the industry name, “CONSTRUCTIONS” and “KENSETSU” are different, but “0101” in the industry name code matches all four digits.
[0049]
Based on such a comparison result, the
[0050]
As shown in the case of “2” of the
[0051]
As described above with reference to FIGS. 1 to 11, in the corporate name search system and method of the alphabetical notation of this example, the
[0052]
Then, the same separation process is performed by the English corporate
[0053]
As a result, when searching for a corporate name written in English, even if the character string representing the type of corporate case or the type of business in the English corporate name in the search condition does not exactly match the
[0054]
In addition, this invention is not limited to the example demonstrated using FIGS. 1-11, In the range which does not deviate from the summary, various changes are possible. For example, in this example, the corporate name in English is described as an example, but the present invention can also be applied to other alphabetical corporate names such as German, French, Italian, and Dutch.
[0055]
In this example, as shown in FIG. 1, the
[0056]
In this example, the optical disk 6 is used as a recording medium, but an FD may be used as a recording medium. As for the program installation, the program may be downloaded and installed via the network via the
[0057]
【The invention's effect】
According to the present invention, when searching for a corporate name written in alphabets such as English, even if the character string representing the type of corporate case or the business type does not exactly match the search condition, the search target specification or candidate display is displayed. For example, it is possible to improve the convenience and performance of a computer system that manages customer information in English characters in a foreign corporation or trading company.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration example of an alphabetical corporate name search system according to the present invention.
FIG. 2 is a flowchart showing an example of the processing operation according to the present invention of the alphabetical corporate name search system in FIG.
FIG. 3 is a flowchart showing details of an English corporate name shaping process in
4 is a flowchart showing details of a legal case type separation process in
FIG. 5 is a flowchart showing details of an industry name separation process in
6 is an explanatory diagram showing a specific example of the corporate case type dictionary of FIG. 1 used in the corporate case type separation process in FIG. 4;
7 is an explanatory diagram showing a specific example of the industry name dictionary of FIG. 1 used in the industry name separation process in FIG. 5;
8 is an explanatory diagram showing a specific example of the processing operation of the English corporate name analysis unit in FIG. 1. FIG.
FIG. 9 is a flowchart showing an example of processing operation of an English corporate name search unit in FIG. 1;
10 is an explanatory diagram showing a specific example of the collation rule in FIG. 1. FIG.
11 is an explanatory diagram showing a specific example of the processing operation by the English corporate name search unit in FIG. 1; FIG.
[Explanation of symbols]
1: input device, 2: information processing device, 2a: CPU, 2b: main memory, 3, 4: external storage device, 5: display device, 6: optical disk, 7: drive device, 8: communication device, 101: Customer data including English corporate name, 102: English corporate name analysis unit, 103: Search target data, 104: Search condition (English corporate name), 105: Corporate personality type dictionary, 105a: Corporate personality type code, 106: Industry name dictionary, 106a: industry name code, 106b: industry code, 106c: business type code, 107: English corporate name search unit, 108: collation rule, 108a: condition, 108b: processing, 109: search result, 110: dictionary / rule registration unit, 111: Data registration unit, 801: English corporate name, 802: English corporate name after shaping, 803: Corporate case type code, 804: Industry name code, 805: English corporate name data , 1101: English company name, 1102: English company name data, 1103: English company name data, 1104: English corporate name after the shaping.
Claims (5)
同じ法人格種別をそれぞれ異なる文字列で表記した複数の法人格種別名を当該法人格種別の識別情報に対応付けて予め上記記憶装置に法人格種別辞書として登録する第1の辞書登録手段と、
同じ業種をそれぞれ異なる文字列で表記した複数の業種名を当該業種の識別情報に対応付けて予め上記記憶装置に業種名辞書として登録する第2の辞書登録手段と、
上記法人名が入力されると、上記法人格種別辞書および上記業種名辞書を上記記憶装置から読み出して参照し、上記入力された法人名に含まれる法人格種別および業種を固有名から分離して特定し、特定した法人格種別および業種の各識別情報を取得し、取得した各識別情報を各々分離した法人格種別と業種に付与し固有名と共に上記記憶装置に検索対象データとして登録するデータ登録手段と、
検索条件として入力された法人名の少なくとも固有名と業種の識別情報とが上記データ登録手段で検索対象データとして登録された法人名の固有名と業種の識別情報と一致すれば、上記検索条件として入力された法人名と上記検索対象データとして登録された法人名とが対応するものとして条件付けた照合ルールを予め上記記憶装置に登録するルール登録手段と、
検索条件としての法人名が入力されると、上記法人格種別辞書および上記業種名辞書を上記記憶装置から読み出して参照し、上記検索条件として入力された法人名に含まれる法人格種別および業種を固有名から分離して特定し、特定した法人格種別および業種の各識別情報を取得し、取得した各識別情報と上記分離された固有名毎の比較を、上記ルール登録手段で登録した照合ルールを参照して行い、上記法人格種別の識別情報が一致しなくとも上記固有名と上記業種の識別情報とが一致する法人名を上記検索対象データから抽出する検索手段と
を有することを特徴とするアルファベット表記法人名検索システム。A system for searching for a corporate name including an alphabetical corporate name and a business name and a unique name using a computer comprising a storage device and a central processing unit,
A first dictionary registration means for previously registering a plurality of corporate personality type names representing the same corporate personality type with different character strings in association with identification information of the corporate personality type in advance in the storage device as a legal personality type dictionary;
A second dictionary registration means for previously registering a plurality of industry names representing the same industry with different character strings in association with identification information of the industry in advance as an industry name dictionary in the storage device;
When the corporate name is input, the corporate case type dictionary and the business type name dictionary are read from the storage device and referred to, and the corporate case type and business type included in the input corporate name are separated from the unique name and specified. Data registration means for acquiring each identification information of the specified corporate personality type and business type, assigning each acquired identification information to a separate corporate personality type and business type, and registering it as a search target data together with a unique name;
If at least the unique name of the corporate name entered as the search condition and the business type identification information match the business name unique name and the business type identification information registered as search target data by the data registration means, the search condition Rule registration means for preliminarily registering in the storage device a matching rule that is conditioned as a correspondence between the input corporate name and the corporate name registered as the search target data;
When a corporate name as a search condition is input, the corporate case type dictionary and the business type dictionary are read from the storage device and referred to, and the corporate case type and the business type included in the corporate name input as the search condition are specified. The identification information of the specified corporate case type and business type is acquired separately, and the comparison between each acquired identification information and the separated unique name is referred to the matching rule registered by the rule registration means. And a search means for extracting, from the search target data, a corporate name in which the unique name and the business type identification information match even if the identification information of the corporate case type does not match. Name search system.
同じ法人格種別をそれぞれ異なる文字列で表記した複数の法人格種別名を当該法人格種別の識別情報に対応付けて予め上記記憶装置に法人格種別辞書として登録する第1のステップと、
同じ業種をそれぞれ異なる文字列で表記した複数の業種名を当該業種の識別情報に対応付けて予め上記記憶装置に業種名辞書として登録する第2のステップと、
上記法人名が入力されると、上記法人格種別辞書および上記業種名辞書を上記記憶装置から読み出して参照し、上記入力された法人名に含まれる法人格種別および業種を固有名から分離して特定し、特定した法人格種別および業種の各識別情報を取得し、取得した各識別情報を各々分離した法人格種別と業種に付与し固有名と共に上記記憶装置に検索対象データとして登録する第3のステップと、
検索条件として入力された法人名の少なくとも固有名と業種の識別情報とが上記検索対象データとして登録された法人名の固有名と業種の識別情報と一致すれば、上記検索条件として入力された法人名と上記検索対象データとして登録された法人名とが対応するものとして条件付けた照合ルールを予め上記記憶装置に登録する第4のステップと、
検索条件としての法人名が入力されると、上記法人格種別辞書および上記業種名辞書を上記記憶装置から読み出して参照し、上記検索条件として入力された法人名に含まれる法人格種別および業種を固有名から分離して特定し、特定した法人格種別および業種の各識別情報を取得し、取得した各識別情報と上記分離された固有名毎の比較を、上記記憶装置に登録した照合ルールを参照して行い、上記法人格種別の識別情報が一致しなくとも上記固有名と上記業種の識別情報とが一致する法人名を上記検索対象データから抽出する第5のステップと
を有することを特徴とするアルファベット表記法人名検索方法。A method of searching for a corporate name including a corporate case type name and an industry name and a unique name written in alphabet using a computer comprising a storage device and a central processing unit,
A first step of previously registering a plurality of corporate personality type names representing the same corporate personality type with different character strings in association with identification information of the corporate personality type in the storage device in advance as a legal personality type dictionary;
A second step of previously registering a plurality of industry names representing the same industry with different character strings in association with identification information of the industry in advance as an industry name dictionary in the storage device;
When the corporate name is input, the corporate case type dictionary and the business type name dictionary are read from the storage device and referred to, and the corporate case type and business type included in the input corporate name are separated from the unique name and specified. A third step of acquiring each identification information of the specified corporate personality type and business type, assigning each acquired identification information to a separate corporate personality type and business type, and registering it as search target data together with a unique name;
If at least the unique name of the corporate name entered as a search condition and the identification information of the industry match the unique name of the corporate name registered as the search target data and the identification information of the industry, the corporation entered as the search condition A fourth step of previously registering in the storage device a matching rule that is conditioned as a name corresponding to a corporate name registered as the search target data;
When a corporate name as a search condition is input, the corporate case type dictionary and the business type dictionary are read from the storage device and referred to, and the corporate case type and the business type included in the corporate name input as the search condition are specified. The identification information of the identified corporate case type and type of business is acquired separately, and the comparison between each acquired identification information and the separated unique name is referred to the matching rule registered in the storage device. And a fifth step of extracting, from the search target data, a corporate name in which the unique name and the business type identification information match even if the identification information of the corporate case type does not match. Corporate name search method .
上記入力された法人名の文字列を全て大文字に変換し、
上記入力された法人名に含まれる記号を全てスペースに置き換え、
連続する上記スペースを一つに削除して、上記入力された法人名の文字列を整形するステップを有し、
整形した法人格種別と業種よび固有名で上記各ステップでの処理を行うことを特徴とするアルファベット表記法人名検索方法。It is the alphabet notation corporate name search method according to claim 2 ,
Convert the character string of the corporation name entered above to uppercase,
Replace all symbols in the entered corporate name with spaces,
Deleting the consecutive spaces into one, and shaping the character string of the input corporate name,
A method for retrieving a corporate name in alphabetical form, characterized in that the processing in each of the above steps is performed with a shaped corporate case type, a business type and a unique name.
上記法人名は、英語表記されていることを特徴とするアルファベット表記法人名検索方法。A method for searching an alphabetical corporate name according to claim 2 or claim 3 ,
The above-mentioned corporation name is written in English.
請求項2から請求項4のいずれかに記載のアルファベット表記法人名検索方法における各ステップを、上記コンピュータに実行させるための処理プログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。This is a recording medium for recording a processing procedure program of a method of searching for a corporate name including a corporate case type name, an industry name and a unique name written in alphabet using a computer including a storage device and a central processing unit in a readable manner on the computer. And
The steps of the kanji company name search method according to claims 2 to claim 4, a computer-readable recording medium characterized by recording a program to be executed by the computer.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000085065A JP3743252B2 (en) | 2000-03-24 | 2000-03-24 | Alphabet notation corporate name search system and method, and recording medium recording the processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000085065A JP3743252B2 (en) | 2000-03-24 | 2000-03-24 | Alphabet notation corporate name search system and method, and recording medium recording the processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001273306A JP2001273306A (en) | 2001-10-05 |
JP3743252B2 true JP3743252B2 (en) | 2006-02-08 |
Family
ID=18601452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000085065A Expired - Fee Related JP3743252B2 (en) | 2000-03-24 | 2000-03-24 | Alphabet notation corporate name search system and method, and recording medium recording the processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3743252B2 (en) |
-
2000
- 2000-03-24 JP JP2000085065A patent/JP3743252B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001273306A (en) | 2001-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5745745A (en) | Text search method and apparatus for structured documents | |
JP2968145B2 (en) | Advanced data collection method and data processing system | |
US5748953A (en) | Document search method wherein stored documents and search queries comprise segmented text data of spaced, nonconsecutive text elements and words segmented by predetermined symbols | |
JP4332356B2 (en) | Information retrieval apparatus and method, and control program | |
JP2987099B2 (en) | Document creation support system and term dictionary | |
JP4997966B2 (en) | Parallel translation example sentence search program, parallel translation example sentence search device, and parallel translation example sentence search method | |
US20050119875A1 (en) | Identifying related names | |
JPH07282063A (en) | Machine translation device | |
CN101911069A (en) | Method and system for discovery and modification of data clusters and synonyms | |
JPH0869476A (en) | Retrieval system | |
JP3743252B2 (en) | Alphabet notation corporate name search system and method, and recording medium recording the processing program | |
JPH06162115A (en) | Fuzzy retrieval system of map information system | |
JP3489237B2 (en) | Document search method | |
JP3398729B2 (en) | Automatic keyword extraction device and automatic keyword extraction method | |
JP3621614B2 (en) | Address analysis method, apparatus, and recording medium recording address analysis program | |
CN112883727B (en) | Method and device for determining association relationship between people | |
JP3470930B2 (en) | Natural language analysis method and device | |
JP2002163291A (en) | Similar document retrieving device and method, and recording recording medium | |
JP3897409B2 (en) | Information processing apparatus and method, and storage medium storing program | |
JP3241854B2 (en) | Automatic word spelling correction device | |
JP3081622B2 (en) | Telephone number stylization device and telephone number stylization method | |
JP4769379B2 (en) | Document search device | |
JP2000276467A (en) | Conversion device | |
JPH0827804B2 (en) | Japanese dictionary data management method | |
JPH01199263A (en) | Key word extracting device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050809 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051025 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051107 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081125 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091125 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091125 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101125 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101125 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111125 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121125 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121125 Year of fee payment: 7 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121125 Year of fee payment: 7 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131125 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |