JP4869448B1 - 名寄せ管理システム - Google Patents

名寄せ管理システム Download PDF

Info

Publication number
JP4869448B1
JP4869448B1 JP2011152197A JP2011152197A JP4869448B1 JP 4869448 B1 JP4869448 B1 JP 4869448B1 JP 2011152197 A JP2011152197 A JP 2011152197A JP 2011152197 A JP2011152197 A JP 2011152197A JP 4869448 B1 JP4869448 B1 JP 4869448B1
Authority
JP
Japan
Prior art keywords
customer information
normalized
name
coincidence
posting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011152197A
Other languages
English (en)
Other versions
JP2013020381A (ja
Inventor
誠一 相馬
稔幸 蜂巣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gourmet Navigator Inc
Original Assignee
Gourmet Navigator Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gourmet Navigator Inc filed Critical Gourmet Navigator Inc
Priority to JP2011152197A priority Critical patent/JP4869448B1/ja
Application granted granted Critical
Publication of JP4869448B1 publication Critical patent/JP4869448B1/ja
Publication of JP2013020381A publication Critical patent/JP2013020381A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】名寄せの徹底および名寄せの徹底による実務上の課題の解決という相反する課題を解決することが出来る名寄せ管理システムを提供する。
【解決手段】顧客情報DB12と、条件DB13と、顧客情報を顧客情報DB12に登録する顧客情報取得手段14と、正規化条件に基づいて新規登録された顧客情報を正規化し、新規正規化顧客情報として顧客情報DB12に登録する正規化手段15と、新規登録された正規化顧客情報と既存の正規化顧客情報との一致度を計算する一致度計算手段16と、新規正規化顧客情報と既存の正規化顧客情報とが一致か否かを判定する一致度判定手段17と、新規正規化顧客情報に一致度判定手段17により一致と判定された既存の正規化顧客情報と同一の識別番号を付与し顧客情報DB12に登録する識別番号付与手段18と、掲出条件に基づいて新規正規化顧客情報を掲出、又は不掲出する掲出手段19とを有する。
【選択図】図1

Description

本発明は、顧客情報の名寄せ管理システムに関する。
企業では顧客管理のために、顧客に関する情報がデータ化されて管理されている。しかし、同一の顧客情報であるにもかかわらず、異なる顧客情報として登録されていることがある。
例えば、図8に示す顧客管理のためのデータベースに記憶されている店名「ぐるなび有楽町店」の顧客情報と、店名「有楽町店ぐるなび」の顧客情報とは、データベース上では異なる顧客情報として登録されているとすると、データベース上では、あくまでも異なる店舗であるとして認識されることになる。しかしながら、これらが同一の顧客情報である場合、一つの顧客情報に統一して管理されなければならない。
上述した問題は、それぞれの顧客情報を入力した担当者が、自らの認識している情報で登録を行うことに起因する。これを防止するには、各担当者の認識を一致させる方法があるが、それをすべての顧客情報で行うのは事実上困難である。
そこで従来では、一般に、名寄せと呼ばれる作業を自動的に行うことで、異なる顧客情報を一つの顧客情報に統一する作業が行われる。名寄せ処理を行うコンピュータシステムの一例を下記特許文献に示す。
これら従来の名寄せ処理を行うコンピュータシステムでは、以下のような処理で行われることが一般的である。すなわち、第一に、比較対象となった2つの顧客情報のレコードの各項目(フィールド)について、所定のアルゴリズムを用いて、2つのフィールドにおける情報の一致の程度または不一致の程度(たとえばレーベンシュタイン距離)を算出し、各フィールドで算出した値を合計し、合計した値が所定の閾値以上ならば同一の顧客情報または異なる顧客情報(同一のレコードまたは異なるレコード)として判定する。そして、同一の顧客情報(同一のレコード)と判定した場合、所定の基準でいずれか一つの顧客情報(レコード)を採用し、他の一方の顧客情報(レコード)について、データベースから削除する。このように名寄せ処理を行うことで、データベースには一つの顧客情報しか残らないようにし、顧客情報の重複を防止している。
特開2011−8389号公報 特開2010−231253号公報 特開2010−122908号公報 特開2010−39535号公報 特開2009−151563号公報 特開2008−117220号公報 特開2004−348489号公報 特開2004−139237号公報 特開2004−78336号公報 特開2003−76838号公報 特開平7−296059号公報
このような従来の名寄せ処理を行うコンピュータシステムを用いることで、自動的に名寄せ処理を行うことが出来る。しかし、一般的な従来の名寄せ処理を行うコンピュータシステムの場合、上述のように、同一のレコードと判定された2つのレコードのうち、一方のレコード(採用されなかったレコード)を削除していることから、仮に、名寄せが間違っていた場合(これを「誤名寄せ」という)、再度、削除してしまった顧客情報を入力し直さなければならない。しかし、この作業を行うのには工数がかかり、対応も容易ではない。また、比較対象となった2つの顧客情報のうち、採用されなかった顧客情報を、何らかの理由から顧客情報として採用したかった、という場合もある。このような場合にも、再度、削除してしまった顧客情報を入力し直さなければならない。
このような事態に備えるため、実務上では、同一の顧客情報として判定する基準(上述の閾値)を高く設定する(すなわち同一の顧客情報として判定しにくくする)こととなる。その結果、誤名寄せによる情報の削除や非採用の情報の採用といった要望には対応しやすくなったものの、同一の顧客情報であるにもかかわらず、別の顧客情報として取り扱われている顧客情報が多く存在してしまうことから、本来の名寄せの目的を十分に果たすことができなくなっている。
加えて、たとえば出願人のように、飲食店に関する情報をウェブサイトで提供する企業の場合、会員である飲食店のほか、会員でない飲食店についてもウェブサイトで提供している。この場合、ウェブサイトに掲載している会員である飲食店については、容易にその情報を管理することが出来るが、非会員である飲食店については、営業担当者などがその存在を認識することでウェブサイトに掲載しているため、同一の飲食店であるにもかかわらず、異なる飲食店として複数の情報が登録されてしまう場合がある。
この場合、単に同一の飲食店が複数のウェブサイトで、重複して掲載されているにすぎないならば問題の程度も高くはない。しかし、同一の飲食店であるにもかかわらず、たとえば飲食店が移転したなど、飲食店に関する情報に変化があり、その情報の登録のタイミングの相違により、異なる情報が登録され、ウェブサイト上で掲載されている場合、顧客はどちらの情報が正しいのか認識できず、顧客の混乱を招くこととなる。そこで、適切な名寄せを行い、一つの情報に統一することが求められる。しかし、それを徹底すると、上述のように、誤名寄せによる情報の削除や非採用の情報の採用といった要望には対応には対応することが困難となってしまうことから、名寄せを徹底することも容易ではない。
さらに、非会員である飲食店の情報をウェブサイトで提供する場合、当該飲食店から掲載中止の依頼があった場合、その掲載を行わないことが企業倫理上、好ましい。しかし、上述のように同一の飲食店であるにもかかわらず複数のウェブサイトが存在してしまうと、削除漏れが発生する可能性が否定できない。
以上のように、名寄せを徹底するには、2つの顧客情報の一致、不一致の判定基準(上述の閾値)を低くすれば良いが、その場合には、名寄せを徹底することによる実務上の課題、たとえば誤名寄せによる情報の削除や非採用の情報の採用といった要望には対応することが出来なくなってしまう。
そこで、名寄せの徹底および名寄せの徹底による実務上の課題の解決という相反する課題を両立しうることが求められるが、従来の名寄せ処理のコンピュータシステムでは対応することが出来ない。
本発明者は上記課題に鑑み、本発明の名寄せ管理システムを発明した。
本発明の名寄せ管理システムは、各種顧客情報を格納する顧客情報データベースと、正規化条件と掲出条件とを格納する条件データベースと、入出力端末から顧客情報を取得し、前記顧客情報データベースに新規登録する顧客情報取得手段と、前記顧客情報データベースから前記新規登録された顧客情報と前記条件データベースから前記正規化条件とを取得し、前記正規化条件に基づいて前記新規登録された顧客情報を正規化し、新規正規化顧客情報として前記顧客情報データベースに登録する正規化手段と、前記顧客情報データベースから前記新規正規化顧客情報と既存の正規化顧客情報とを取得し、前記新規正規化顧客情報と前記既存の正規化顧客情報との一致度を計算する一致度計算手段と、前記一致度計算手段から算出された値により、前記新規正規化顧客情報と前記既存の正規化顧客情報とが一致か否かを判定する一致度判定手段と、前記新規正規化顧客情報に前記一致度判定手段により一致と判定された前記既存の正規化顧客情報と同一の識別番号を付与し前記顧客情報データベースに登録する識別番号付与手段と、前記条件データベースから前記掲出条件を取得し、前記掲出条件に基づいて同一の前記識別番号が付与された前記新規正規化顧客情報毎に掲出、又は不掲出する掲出手段とを有することを特徴とする。
この構成により、比較対象となった2以上の顧客情報の一致、不一致の判定基準を低くすることで名寄せを徹底することができる。また、掲出されなかった顧客情報を削除することなく、掲出された顧客情報と併せて、同一のグループであることを示す識別情報(GSI)を付与して管理をしている。その結果、一致と判定した2つの顧客情報が、実際には異なる顧客情報であった場合、認識次第、GSIを変更すれば、それぞれが別の顧客情報として処理可能となる。また、掲出されなかった顧客情報を何らかの理由で採用したい場合には、従来とは異なり、掲出されなかった顧客情報もレコード上に残っていることから、掲出されなかった顧客情報を、掲出する情報に変更することも容易にできる。

本発明の名寄せ管理システムは、前記正規化条件が前記新規顧客情報から所定の単語の削除を含むことを特徴とする。
この構成により、顧客情報から所定の単語、例えば名寄せ処理に不要な情報である業態名、モール名、施設名を示す文字列を削除できるため、名寄せ処理に要する工数の短縮化を図ることができる。
本発明の名寄せ管理システムは、前記顧客情報が店名と、店名の読みと、住所と、電話番号とを含み、前記正規化手段が前記正規化条件に基づいて前記店名と、前記店名の読みと、前記住所とを正規化することを特徴とする。
この構成により、顧客情報を入力する担当者による入力誤り等の可能性が高い前記店名と、前記住所とに対し、正規化を行うことにより、その後に行われる名寄せ処理に要する工数をより短縮化することが可能となる。
本発明の名寄せ管理システムは、前記掲出手段が同一の前記識別番号が付与された正規化顧客情報毎に掲出、又は不掲出することを特徴とする。
この構成により、同一のグループであると判定された複数の顧客情報を一度に掲出、又は不掲出することが可能となり、顧客情報の不掲出を要望された顧客に関する全ての顧客情報を容易に、且つ確実に不掲出することができると共に、再度顧客情報の掲出を要望された場合であっても、迅速な対応を図ることができる。
本発明の名寄せ管理システムは、前記一致度計算手段から算出された値が所定の閾値以上である場合、前記一致度判定手段は前記新規正規化顧客情報と前記既存の正規化顧客情報とが一致と判定することを特徴とする。
この構成により、名寄せの精度を向上させることができる。
本発明の名寄せ管理システムは、前記一致度計算手段から算出された値が所定の閾値以上となる既存の正規化顧客情報が複数ある場合、前記一致度判定手段は前記新規正規化顧客情報と前記一致度計算手段から算出された値が最も大きい前記既存の正規化顧客情報とが一致と判定する。
この構成により、名寄せ処理の精度をより向上させることができる。
本発明の名寄せ管理システムを用いることによって、名寄せの徹底および名寄せの徹底による実務上の課題の解決という相反する課題を解決することが出来る。すなわち、本発明では、比較対象となった2つの顧客情報の一致、不一致の判定基準を低くすることで名寄せを徹底することができるが、採用されなかった顧客情報を削除することなく、採用された顧客情報と併せて、同一のグループであることを示す識別情報(GSI)を付与して管理をしている。その結果、一致と判定した2つの顧客情報が、実際には異なる顧客情報であった場合、認識次第、GSIを変更すれば、それぞれが別の顧客情報として処理可能となる。また、採用されなかった顧客情報を何らかの理由で採用したい場合には、従来とは異なり、採用されなかった顧客情報もレコード上に残っていることから、採用されなかった顧客情報を、採用する情報に変更することも容易である。
さらに、飲食店に関する情報を提供するウェブサイトにおいて、非会員である飲食店に関する情報を掲載しており、当該飲食店から掲載中止の依頼があった場合、GSIに基づいて飲食店の情報(顧客情報)を管理することで、削除漏れを防止することも出来る。
本実施形態の名寄せ管理システムの全体の構成の一例を示す概念図。 本実施形態の顧客情報のレコードの項目の一例を示す図 本実施形態の顧客情報の正規化処理の一例を示す模式図。 本実施形態の顧客情報の名寄せ処理の一例を示す模式図。 (a)、(b)本実施形態の顧客情報の名寄せ処理の別例を示す模式図。 本実施形態の同一の識別番号が付与された顧客情報の一例を示す模式図。 本実施形態の名寄せ管理システムの処理手順を示すフローチャート。 従来の顧客情報の一例を示す模式図。
本発明に係る実施形態の名寄せ管理システムについて図面を参照して説明する。図1は本実施形態の名寄せ管理システムの全体の構成を示す概念図である。
〈本実施形態の名寄せ管理システムの構成〉
本実施形態の名寄せ管理システム10は、ネットワークNを介して入出力端末100とデータの送受信が可能である。
ネットワークNは、インターネット等のオープンネットワーク、LAN等のクローズド
ネットワーク、それらの組合せのイントラネット、公衆電話回線等のいずれであっても良く、有線・無線の別も問わない。
入出力端末100は、図1では一個のみ図示されているが、実際は管理会社の管理担当端末、飲食店等の顧客側端末及びユーザー端末等から構成される複数の情報端末であり、通常のコンピュータ端末の他、ネットワークN機能を有する携帯電話、PHS、スマートフォン等のいずれであっても良い。
名寄せ管理システム10は、制御部11と、各種顧客情報を格納する顧客情報データベース(顧客情報DB)12と、正規化条件と掲出条件とを格納する条件データベース(条件DB)13とを有し、また図示しないが主メモリと、各種処理プログラム及び必要なデータ等を記憶する記憶部とを有する。
制御部11は、記憶部に記憶された各種処理プログラムを主メモリにロードして、顧客情報取得手段14と、正規化手段15と、一致度計算手段16と、一致度判定手段17と、識別番号付与手段18と、掲出手段19とからなる各種手段を実現する。
顧客情報取得手段14は、入出力端末100から新規に顧客情報を取得し、顧客情報DB12に新規登録する手段である。この際、顧客情報取得手段14は当該顧客情報毎に固有の店番号を付与する。本実施形態の顧客情報21のレコードの各項目は、図2に示す通り店番号と、店名と、店名の読みと、住所と、電話番号と、後述するGSIとである。
正規化手段15は、顧客情報DB12から新規登録された顧客情報21と条件DB13から正規化条件とを取得し、図3に示すように正規化条件に基づいて新規登録された顧客情報21を正規化し、新規正規化顧客情報22として顧客情報DBに登録する手段である。本実施形態の正規化条件は、顧客情報の店名及び店名の読みに対する正規化条件と、顧客情報の住所に対する正規化条件とを有する。
顧客情報の店名及び店名の読みに対する正規化条件は、所定の単語の削除、カタカナの全角変換及びアルファベットの半角大文字変換等である。ここで、所定の単語の削除である修飾語の削除とは、業態名や、モール名や、施設名を店名及び店名の読みから削除することであり、図3に示すように登録された顧客情報21の店名が「居酒屋ぐるなび有楽町店」である場合、正規化により業態名である「居酒屋」が削除され、正規化後の正規化顧客情報22の店名は「ぐるなび有楽町店」となる。ここで、削除用の修飾語は、予め条件DB13に登録させておくとよく、適宜修飾語の追加、変更、削除は可能である。また、カタカナの全角変換とは、店名及び店名の読みに半角のカタカナが登録されている場合は、全角のカタカナに変換することである。さらに、アルファベットの半角大文字変換とは、店名にアルファベットの全角大文字や、アルファベットの全角小文字や、アルファベットの半角小文字が登録されている場合は、半角大文字のアルファベットへ変換することである。
顧客情報の住所に対する正規化条件は、番地の変更、大字小字の削除、漢数字の変換等である。ここで、番地の変更とは、例えば「1丁目2番地3号」と登録されている場合は、「1−2−3」と変更することである。また、大字小字の削除とは、住所に「大字」、又は「小字」含まれている場合は、その「大字」、又は「小字」を削除することである。さらに、漢数字の変換とは、例えば「三−2−1」と登録されている場合は、「3−2−1」に変換することである。なお、京都の住所である場合、「上る」を「上」と、「下る」を「下」と変換させることも可能である。
一致度計算手段16は、顧客情報DB12から新規正規化顧客情報31と既存の正規化顧客情報32とを取得し、新規正規化顧客情報31と既存の正規化顧客情報32との一致度を計算する手段である(名寄せ処理)。図4に示す通り、本実施形態の一致度計算手段16は、レーベンシュタイン編集距離により新規正規化顧客情報31のレコードの項目である店名、店名の読み、住所、電話番号と前記既存の正規化顧客情報32のレコードの項目である店名、店名の読み、住所、電話番号とについて、それぞれ各項目毎に一致度を計算し、算出された各一致度を合計する。ここで、一致度計算手段16が店名の一致度を計算する場合、新規正規化顧客情報31の店名と既存の正規化顧客情報32の店名との内、文字数が大きい方の店名の文字列について、文字列を構成する先頭一文字を一文字ずつ当該文字列の最後尾に移動、即ち文字列「ぐるなび有楽町店」を「ぐるなび有楽町店→るなび有楽町店ぐ→なび有楽町店ぐる→び有楽町店ぐるな→有楽町店ぐるなび・・・」としつつ、もう一方の店名の文字列と文字の移動毎に一致度を計算し、最も大きい値を店名の一致度とする。なお、既存の正規化顧客情報32は、新規正規化顧客情報31と同一の市区町村の正規化顧客情報一覧表に含まれるものである。
また、図5に示すように既存の正規化顧客情報が2以上ある場合、一致度計算手段16は、新規正規化顧客情報41と、既存の正規化顧客情報42、43との一致度をそれぞれ計算する。
一致度判定手段17は、一致度計算手段16から算出された値により、新規正規化顧客情報と既存の正規化顧客情報とが一致か否かを判定する手段である。本実施形態では、一致度計算手段16から算出された値が所定の閾値以上であれば、新規正規化顧客情報と既存の正規化顧客情報とが一致として判定される。具体的には、レーベンシュタイン編集距離により新規正規化顧客情報21のレコードの項目である店名、店名の読み、住所、電話番号と既存の正規化顧客情報22のレコードの項目である店名、店名の読み、住所、電話番号とについて、一致度計算手段16がそれぞれ各項目毎に一致度を計算し、算出された各値を合計した値が所定の閾値以上であれば、一致と判定する。一方、当該合計した値が所定の閾値未満であれば、一致していないと判定する。また、一致度計算手段16から算出された値が所定の閾値以上となる既存の正規化顧客情報が複数ある場合、一致度判定手段17は新規正規化顧客情報と一致度計算手段16から算出された値が最も大きい既存の正規化顧客情報とが一致と判定する。
識別番号付与手段18は、新規正規化顧客情報に一致度判定手段17により一致と判定された既存の正規化顧客情報と同一の識別番号(GSI)を付与し顧客情報DB12に登録する手段である。図6に示す通り本実施形態の識別番号付与手段18は、新規正規化顧客情報に既存の正規化顧客情報に付与されたGSIと同一のGSIを付与し、当該3個の正規化顧客情報全てを顧客情報DB12に登録する。なお、新規正規化顧客情報が全ての既存の正規化顧客情報と一致しない場合は、新規正規化顧客情報に新規GSIが付与される。
掲出手段19は、条件DB13から掲出条件を取得し、掲出条件に基づいて新規正規化顧客情報を掲出、又は不掲出する手段である。ここで、掲出条件、即ち掲出順位ルールが、例えば、加盟店であるとすると、図6に示す顧客情報の内、店舗種別に加盟店を登録されている顧客情報が掲出され、他の顧客情報は掲出されないこととなる。なお、掲出手段は任意に設定可能であり、最も新規に登録された顧客情報を掲出する等の設定ができる。
また、掲出手段19は同一のGSIが付与された顧客情報毎に一度の手続で掲出、又は不掲出することも可能である。
名寄せ管理システム10に於ける各手段、データベースは、その機能が論理的に区別されているのみであって、物理上あるいは事実上は同一の領域を為していても良い。又データベースの代わりにデータファイルであっても良いことは言うまでもなく、データベースとの記載にはデータファイルをも含んでいる。
〈本実施形態の名寄せ管理システムの処理手順〉
次に、名寄せ管理システム10の処理手順を説明する。図7は名寄せ管理システム10の処理手順を示すフローチャートである。
ステップS101において、顧客情報取得手段14は、入出力端末100から新規に顧客情報を取得し、顧客情報DB12に新規登録する。この際、顧客情報取得手段14は当該顧客情報に固有の店番号を付与する。本実施形態では、図2に示す通り顧客情報21は店番号と、店名と、店名の読みと、住所と、電話番号及びGSIを含むものである。
ステップS102において、正規化手段15は、顧客情報DB12から新規登録された顧客情報21と条件DB13から正規化条件とを取得し、正規化条件に基づいて新規登録された顧客情報を正規化し、新規正規化顧客情報22として顧客情報DBに登録する。本実施形態では、顧客情報の店名及び店名の読みと、顧客情報の住所に対し、正規化処理が行われる。正規化条件である修飾語の削除は、例えば図3に示すように登録された店名が「居酒屋ぐるなび有楽町店」である場合、正規化により業態名である「居酒屋」が削除され、正規化後の店名は「ぐるなび有楽町店」となる。
ステップS103において、一致度計算手段16は、顧客情報DB12から新規正規化顧客情報31と同一市区町村の既存の顧客情報一覧に含まれる正規化顧客情報32とを取得する。ここで、新規正規化顧客情報21と同一の市区町村の正規化顧客情報32を取得することにより、一致度計算手段16による一致度の計算回数を減らすことができ、処理時間の短縮を図ることができる。
ステップS104において、一致度計算手段16は、新規正規化顧客情報31と既存の正規化顧客情報32との一致度を計算する(名寄せ処理)。本実施形態では、図4に示すようにレーベンシュタイン編集距離により新規正規化顧客情報31のレコードの項目である店名、店名の読み、住所、電話番号と既存の正規化顧客情報32のレコードの項目である店名、店名の読み、住所、電話番号とについて、一致度計算手段16がそれぞれ各項目毎に一致度を計算し、算出された各値を合計した値が所定の閾値以上であれば、一致と判定する。ここで、一致度計算手段16が店名の一致度を計算する場合、新規正規化顧客情報31の店名と既存の正規化顧客情報32の店名との内、文字数が大きい方の店名の文字列について、文字列を構成する先頭一文字を一文字ずつ当該文字列の最後尾に移動、即ち文字列「ぐるなび有楽町店」を「ぐるなび有楽町店→るなび有楽町店ぐ→なび有楽町店ぐる→び有楽町店ぐるな→有楽町店ぐるなび・・・」としつつ、もう一方の店名の文字列と文字の移動毎に一致度を計算し、最も大きい値を店名の一致度とする。
ステップS105において、一致度計算手段16は、取得した新規正規化顧客情報31と同一市区町村の既存の正規化顧客情報一覧の最終行まで一致度の計算が終了している場合はステップS106に進み、終了していない場合はステップS104に戻り、名寄せ処理を継続する。
ステップS106において、一致度判定手段17は、一致度計算手段16から算出された値により、新規正規化顧客情報31と既存の正規化顧客情報32とが一致か否かを判定する。本実施形態では、一致度計算手段16から算出された値が所定の閾値以上であれば、一致として判定される。本実施形態では、図4に示すようにレーベンシュタイン編集距離により新規正規化顧客情報31のレコードの項目である店名、店名の読み、住所、電話番号と既存の正規化顧客情報32のレコードの項目である店名、店名の読み、住所、電話番号とについて、一致度計算手段16が算出した各一致度を合計した値が所定の閾値以上である場合、一致と判定し、ステップS107に進む。一方、当該合計した値が所定の閾値未満であれば、不一致と判定し、ステップS108に進む。なお、一致度計算手段16から算出された値が所定の閾値以上となる既存の正規化顧客情報が複数ある場合、一致度判定手段17は新規正規化顧客情報と一致度計算手段16から算出された値が最も大きい既存の正規化顧客情報とが一致と判定する。
ステップS107において、識別番号付与手段18は、新規正規化顧客情報に対し、一致度判定手段17により一致と判定された既存の正規化顧客情報と同一の識別番号(GSI)を付与し顧客情報DB12に登録する。本実施形態では、図6に示すように同一のGSIが付与されることになる。ここで、同一のGSIが付与された複数の既存の正規化顧客情報の中に新規正規化顧客情報と一致と判定された既存の正規化顧客情報が含まれていれば、新規正規化顧客情報と一致しないと判定された既存の正規化顧客情報が含まれたとしても、識別番号付与手段18は新規正規化顧客情報に対し一致と判定された既存の正規化顧客情報と同一のGSIを付与する。
ステップS108において、識別番号付与手段18は、新規正規化顧客情報が全ての既存の正規化顧客情報と一致しない場合は、新規正規化顧客情報に新規GSIが付与される。
ステップS109において、掲出手段19は、掲出条件、即ち掲出順位ルールに基づいて新規正規化顧客情報を掲出、又は不掲出する。当該掲出順位ルールが、例えば、加盟店であるとすると、図6に示す顧客情報の内、店舗種別に加盟店を登録されている顧客情報が掲出され、他の顧客情報は掲出されないこととなる。また、掲出手段19は同一のGSIが付与された全ての顧客情報に対し、一度の手続により掲出、又は不掲出することも可能である。
〈本実施形態の名寄せ管理システムの効果〉
名寄せ管理システム10は、新規登録された顧客情報に対し、正規化手段15による正規化処理を実施することにより、その後に実施する名寄せ処理工数の短縮を図ることが可能となる。また、名寄せ管理システム10は、一致度計算手段16と一致度判定手段17とにより、新規正規化顧客情報が既存の正規化顧客情報と一致するか否かを判定するため、比較対象となった2つの顧客情報の一致、不一致の判定基準を低くすることで名寄せを徹底することが可能となる。さらに、名寄せ管理システム10は、識別番号付与手段18により、正規化顧客情報に一致と判定された既存の正規化顧客情報と同一の識別番号を付与するため、同一の識別番号が付与された顧客情報毎に掲出、又は不掲出することが容易にでき、また掲出条件に合致した顧客情報を掲出、又は不掲出することも容易に可能となる。
名寄せ管理システム10は、正規化手段15による正規化顧客情報のレコードの項目である店名及び店名の読みと、住所に対し、正規化処理を実施することにより、正規化処理工数を短縮できる。
名寄せ管理システム10は、一致度計算手段16により算出された値により、新規正規化顧客情報と既存の正規化顧客情報とが一致か否かを判定するレーベンシュタイン編集距離により新規正規化顧客情報のレコードの項目である店名、店名の読み、住所、電話番号と前記既存の正規化顧客情報のレコードの項目である店名、店名の読み、住所、電話番号とについて、それぞれ各項目毎に一致度を計算し、算出された各一致度を合計するため、名寄せの精度の向上が可能となる。
名寄せ管理システム10は、一致度計算手段16が店名の一致度を計算する場合、新規正規化顧客情報の店名と既存の正規化顧客情報の店名との内、文字数が大きい方の店名の文字列について、文字列を構成する先頭一文字を一文字ずつ当該文字列の最後尾に移動しつつ、もう一方の店名の文字列と文字の移動毎に一致度を計算し、最も大きい値を店名の一致度とすることにより、漏れのない名寄せが可能となる。
名寄せ管理システム10は、同一のGSIが付与された複数の既存の正規化顧客情報の中に新規正規化顧客情報と一致と判定された既存の正規化顧客情報が含まれていれば、新規正規化顧客情報と一致しないと判定された既存の正規化顧客情報が含まれたとしても、識別番号付与手段18は新規正規化顧客情報に対し一致と判定された既存の正規化顧客情報と同一のGSIを付与するため、名寄せの徹底を図ることができる。
〔本実施形態の変形例等〕
本明細書開示の発明は、各発明や実施形態の構成の他に、適用可能な範囲で、これらの部分的な構成を本明細書開示の他の構成に変更して特定したもの、或いはこれらの構成に本明細書開示の他の構成を付加して特定したもの、或いはこれらの部分的な構成を部分的な作用効果が得られる限度で削除して特定した上位概念化したものを含み、下記の変形例等も包含する。
本発明は、飲食店等の様々な顧客情報を管理する顧客情報共有システムに利用することができる。
10…名寄せ管理システム 11…制御部
12…顧客情報DB 13…条件DB
14…顧客情報取得手段 15…正規化手段
16…一致度計算手段 17…一致度判定手段
18…識別番号付与手段 19…掲出手段
21…顧客情報 22…正規化顧客情報
31…新規正規化顧客情報 32…既存の正規化顧客情報
41…新規正規化顧客情報 42…既存の正規化顧客情報
43…既存の正規化顧客情報 100…入出力端末
N…ネットワーク

Claims (5)

  1. 各種顧客情報を格納する顧客情報データベースと、
    正規化条件と掲出条件とを格納する条件データベースと、
    入出力端末から顧客情報を取得し、前記顧客情報データベースに新規登録する顧客情報取得手段と、
    前記顧客情報データベースから前記新規登録された顧客情報と前記条件データベースから前記正規化条件とを取得し、前記正規化条件に基づいて前記新規登録された顧客情報を正規化し、新規正規化顧客情報として前記顧客情報データベースに登録する正規化手段と、
    前記顧客情報データベースから前記新規正規化顧客情報と既存の正規化顧客情報とを取得し、前記新規登録された正規化顧客情報と前記既存の正規化顧客情報との一致度を計算する一致度計算手段と、
    前記一致度計算手段から算出された値により、前記新規正規化顧客情報と前記既存の正規化顧客情報とが一致か否かを判定する一致度判定手段と、
    前記新規正規化顧客情報に前記一致度判定手段により一致と判定された前記既存の正規化顧客情報と同一の識別番号を付与し前記顧客情報データベースに登録する識別番号付与手段と、
    前記条件データベースから前記掲出条件を取得し、前記掲出条件に基づいて同一の前記識別番号が付与された前記新規正規化顧客情報毎に掲出、又は不掲出する掲出手段と、
    を有する
    ことを特徴とする名寄せ管理システム。
  2. 前記正規化条件が前記新規顧客情報から所定の単語の削除を含む
    ことを特徴とする請求項1記載の名寄せ管理システム。
  3. 前記顧客情報が店名と、店名の読みと、住所と、電話番号とを含み、
    前記正規化手段が前記正規化条件に基づいて前記店名と、前記店名の読みと、前記住所とを正規化する
    ことを特徴とする請求項1または2記載の名寄せ管理システム。
  4. 前記一致度計算手段から算出された値が所定の閾値以上である場合、前記一致度判定手段は前記新規正規化顧客情報と前記既存の正規化顧客情報とが一致と判定する
    ことを特徴とする請求項1からの何れかに記載の名寄せ管理システム。
  5. 前記一致度計算手段から算出された値が所定の閾値以上となる既存の正規化顧客情報が複数ある場合、
    前記一致度判定手段は前記新規正規化顧客情報と前記一致度計算手段から算出された値が最も大きい前記既存の正規化顧客情報とが一致と判定する
    ことを特徴とする請求項記載の名寄せ管理システム。
JP2011152197A 2011-07-08 2011-07-08 名寄せ管理システム Expired - Fee Related JP4869448B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011152197A JP4869448B1 (ja) 2011-07-08 2011-07-08 名寄せ管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011152197A JP4869448B1 (ja) 2011-07-08 2011-07-08 名寄せ管理システム

Publications (2)

Publication Number Publication Date
JP4869448B1 true JP4869448B1 (ja) 2012-02-08
JP2013020381A JP2013020381A (ja) 2013-01-31

Family

ID=45781892

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011152197A Expired - Fee Related JP4869448B1 (ja) 2011-07-08 2011-07-08 名寄せ管理システム

Country Status (1)

Country Link
JP (1) JP4869448B1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7411362B2 (ja) * 2019-09-10 2024-01-11 株式会社オービック 反社情報照合装置、反社情報照合方法、及び反社情報照合プログラム
JP7211992B2 (ja) * 2020-02-28 2023-01-24 ユーソナー株式会社 事業者情報管理システム及びサーバ

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08297709A (ja) * 1995-04-27 1996-11-12 Omron Corp 情報データ処理装置及び情報データ処理方法
JP2001325425A (ja) * 2000-05-15 2001-11-22 Fujitsu Ltd 名寄せ処理システム
JP2003076838A (ja) * 2001-09-04 2003-03-14 Mizuho Bank Ltd 名寄せ処理方法及び名寄せ処理プログラム
JP2003173280A (ja) * 2001-12-05 2003-06-20 Nippon Telegr & Teleph Corp <Ntt> データベース生成装置、データベース生成方法及びデータベース生成プログラム
JP2003173345A (ja) * 2001-12-05 2003-06-20 Nippon Telegr & Teleph Corp <Ntt> データベース生成装置、データベース生成方法及びデータベース生成処理プログラム
JP2004139237A (ja) * 2002-10-16 2004-05-13 Toshiba Corp 名寄せ方法および名寄せシステム並びに会計処理方法および会計処理システム
JP2004303117A (ja) * 2003-04-01 2004-10-28 Hitachi Ltd 名寄せデータベース設計支援方法およびシステム
JP2004348489A (ja) * 2003-05-22 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 顧客データ管理システム、顧客データ管理装置、顧客データ管理方法および顧客データ管理用プログラム
JP2007206787A (ja) * 2006-01-31 2007-08-16 Hitachi Information Systems Ltd 重複可能性者の検出表示システム、同検出表示方法及び同検出プログラム
JP2008117220A (ja) * 2006-11-06 2008-05-22 Fuji Xerox Co Ltd ユーザー管理システム、ユーザー管理プログラムおよびユーザー管理方法
JP2010027031A (ja) * 2008-06-18 2010-02-04 Yahoo Japan Corp 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム
JP2010026602A (ja) * 2008-07-15 2010-02-04 B2B Solutions Co Ltd 企業情報提供サービスシステム
JP2010039535A (ja) * 2008-07-31 2010-02-18 Ns Solutions Corp 情報処理装置、名寄せ方法及びプログラム
JP2010122908A (ja) * 2008-11-19 2010-06-03 Ns Solutions Corp 情報処理装置、情報処理方法及びプログラム
JP2010122880A (ja) * 2008-11-19 2010-06-03 Hitachi Ltd データ集計処理方法及びシステム
JP2010231253A (ja) * 2009-03-25 2010-10-14 Hitachi Ltd データ名寄せ処理装置及び方法

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08297709A (ja) * 1995-04-27 1996-11-12 Omron Corp 情報データ処理装置及び情報データ処理方法
JP2001325425A (ja) * 2000-05-15 2001-11-22 Fujitsu Ltd 名寄せ処理システム
JP2003076838A (ja) * 2001-09-04 2003-03-14 Mizuho Bank Ltd 名寄せ処理方法及び名寄せ処理プログラム
JP2003173280A (ja) * 2001-12-05 2003-06-20 Nippon Telegr & Teleph Corp <Ntt> データベース生成装置、データベース生成方法及びデータベース生成プログラム
JP2003173345A (ja) * 2001-12-05 2003-06-20 Nippon Telegr & Teleph Corp <Ntt> データベース生成装置、データベース生成方法及びデータベース生成処理プログラム
JP2004139237A (ja) * 2002-10-16 2004-05-13 Toshiba Corp 名寄せ方法および名寄せシステム並びに会計処理方法および会計処理システム
JP2004303117A (ja) * 2003-04-01 2004-10-28 Hitachi Ltd 名寄せデータベース設計支援方法およびシステム
JP2004348489A (ja) * 2003-05-22 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 顧客データ管理システム、顧客データ管理装置、顧客データ管理方法および顧客データ管理用プログラム
JP2007206787A (ja) * 2006-01-31 2007-08-16 Hitachi Information Systems Ltd 重複可能性者の検出表示システム、同検出表示方法及び同検出プログラム
JP2008117220A (ja) * 2006-11-06 2008-05-22 Fuji Xerox Co Ltd ユーザー管理システム、ユーザー管理プログラムおよびユーザー管理方法
JP2010027031A (ja) * 2008-06-18 2010-02-04 Yahoo Japan Corp 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム
JP2010026602A (ja) * 2008-07-15 2010-02-04 B2B Solutions Co Ltd 企業情報提供サービスシステム
JP2010039535A (ja) * 2008-07-31 2010-02-18 Ns Solutions Corp 情報処理装置、名寄せ方法及びプログラム
JP2010122908A (ja) * 2008-11-19 2010-06-03 Ns Solutions Corp 情報処理装置、情報処理方法及びプログラム
JP2010122880A (ja) * 2008-11-19 2010-06-03 Hitachi Ltd データ集計処理方法及びシステム
JP2010231253A (ja) * 2009-03-25 2010-10-14 Hitachi Ltd データ名寄せ処理装置及び方法

Also Published As

Publication number Publication date
JP2013020381A (ja) 2013-01-31

Similar Documents

Publication Publication Date Title
JP6893209B2 (ja) 構造化されたマルチフィールドファイルのレイアウトの自動解釈
CN109919652A (zh) 用户群体分类方法、装置、设备及存储介质
US10198471B2 (en) Joining semantically-related data using big table corpora
US9501563B2 (en) Server, information-management method, information-management program, and computer-readable recording medium with said program recorded thereon
EP2235648A2 (en) Dynamic machine assisted informatics
CN111881377A (zh) 位置兴趣点的处理方法及装置
US9158790B2 (en) Server, dictionary creation method, dictionary creation program, and computer-readable recording medium recording the program
Chen et al. Identifying home locations in human mobility data: an open-source R package for comparison and reproducibility
CN109902129B (zh) 基于大数据分析的保险代理人归类方法及相关设备
JP4869448B1 (ja) 名寄せ管理システム
Alcalá-Ordóñez et al. Tourism and economic development: a literature review to highlight main empirical findings
CN107391543B (zh) 一种无线热点的类型识别方法和装置
JP4518168B2 (ja) 関連文書提示システム及びプログラム
JP4575305B2 (ja) 閲覧管理システム、閲覧管理方法および閲覧管理プログラム
CN109727056B (zh) 金融机构推荐方法、设备、存储介质及装置
CN108388610B (zh) 数据etl处理方法及装置
WO2020202327A1 (ja) 学習システム、学習方法、及びプログラム
US8626766B1 (en) Systems and methods for ranking and importing business listings
CN109636578A (zh) 信贷信息的风险检测方法、装置、设备及可读存储介质
CN109919811B (zh) 基于大数据的保险代理人培养方案生成方法及相关设备
JP7156660B2 (ja) 観光情報整理装置、観光情報整理方法、およびプログラム
JP2017010591A (ja) 来店認証システム
JP4828653B1 (ja) サーバ、辞書生成方法、辞書生成プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
KR20210079001A (ko) 데이터베이스를 기반으로 기업의 문제를 해결하는 장치 및 방법
CN111949639A (zh) 品牌库创建方法及系统、品牌查询与分析平台

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111108

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111115

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees