CN110737644B - 客户信息整合的方法、装置及计算机可读存储介质 - Google Patents
客户信息整合的方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110737644B CN110737644B CN201910970984.9A CN201910970984A CN110737644B CN 110737644 B CN110737644 B CN 110737644B CN 201910970984 A CN201910970984 A CN 201910970984A CN 110737644 B CN110737644 B CN 110737644B
- Authority
- CN
- China
- Prior art keywords
- information
- client
- hash value
- hash
- customer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2255—Hash tables
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及大数据技术,揭露了一种客户信息整合的方法,包括:从客户信息系统中收集客户信息,其中,所述客户信息包括客户基本信息和客户业务信息,将所述客户基本信息存入本地数据库中,将所述客户业务信息存入本地预设的电子台账中;对所述客户基本信息进行预处理和哈希操作,得到客户标准信息的散列值,通过哈希函数对所述散列值进行关联处理,并根据关联处理后的所述散列值,生成所述客户标准信息的唯一标识;将所述电子台账中的所述客户业务信息的存储文档按所述客户标准信息的唯一标识进行命名,从而实现了客户信息的整合。本发明还提出一种客户信息整合的装置以及一种计算机可读存储介质。本发明实现了客户信息的快速整合。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种客户信息整合的方法、装置及计算机可读存储介质。
背景技术
目前市面上的客户信息系统通常是将客户的所有信息全部存储在数据库中。对单个客户的信息,都要通过查询语句进行反复查询,才能得到客户的完整信息,查询效率极低,且单个客户自身的信息之间没有关联,可维护性差。例如,对于一个客户的信息查询主要基于所述客户的五要素,例如姓名、生日、性别、证件类型以及证件号,进行查询。当查询或者新增一条客户信息的时候,如果所要查询或者新增的客户信息的五要素与数据库中其他客户的五要素之间存在一个或者几个元素相同的情况,则需要在数据库依次根据所述客户五要素进行所述客户信息的查询,需要查询数据库多次,查询效率较低。
发明内容
本发明提供一种客户信息整合的方法、装置及计算机可读存储介质,其主要目的在于提供一种客户信息整合方案,以实现客户信息的精确查询。
为实现上述目的,本发明提供的一种客户信息整合的方法,包括:
从客户信息系统中收集客户信息,其中,所述客户信息包括客户基本信息和客户业务信息,将所述客户基本信息存入本地数据库中,将所述客户业务信息存入本地预设的电子台账中;
对所述客户基本信息进行预处理操作,得到客户标准信息;
对所述客户标准信息进行哈希操作,得到所述客户标准信息的散列值,通过哈希函数对所述散列值进行关联处理,并根据关联处理后的所述客户标准信息的散列值,生成所述客户标准信息的唯一标识;
将所述电子台账中的所述客户业务信息的存储文档按所述客户标准信息的唯一标识进行命名,从而实现客户信息的整合。
可选地,所述客户基本信息包括:姓名、生日、性别、证件类型以及证件号;所述客户业务信息包括客户通过所述客户信息系统所进行的业务活动产生的数据。
可选地,所述预处理操作包括:
按照预设提取规则从所述客户基本信息的“姓名”信息中提取一个或者多个字母,得到所述“姓名”信息的字母代表;
对所述客户基本信息中的“生日”信息进行填补处理,将所述“生日”信息转换为预设长度的数字形式;
对所述客户基本信息中的“性别”信息和“证件类型”信息照预设量化规则进行量化处理,将所述“性别”信息和“证件类型”信息转换为数值形式。
可选地,所述哈希操作包括:
将所述客户标准信息中的“姓名”信息的字母代表的ASCII码值执行均值取整计算,作为所述“姓名”信息的散列值;
截取所述客户标准信息中的“生日”信息的“年份”的预设位数数字与“月”、“日”执行均值取整计算,作为所述“生日”信息的散列值;
将所述客户标准信息中的“性别”和“证件类型”信息的数值形式的值分别作为所述“性别”和“证件类型”信息对应的散列值;
截取所述客户标准信息中的“证件号”信息中预设位数的数值,并执行求和操作,将所述求和操作得到的结果作为所述“证件号”信息的散列值。
可选地,所述关联处理的计算方法包括:
H(key)=a*key+b
其中,key表示所述客户标准信息的散列值,a、b分别表示在[1,10]区间中的一个随机整数,H(key)表示所述客户标准信息的存储单元位址。
此外,为实现上述目的,本发明还提供一种客户信息整合的装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的客户信息整合的程序,所述客户信息整合的程序被所述处理器执行时实现如下步骤:
从客户信息系统中收集客户信息,其中,所述客户信息包括客户基本信息和客户业务信息,将所述客户基本信息存入本地数据库中,将所述客户业务信息存入本地预设的电子台账中;
对所述客户基本信息进行预处理操作,得到客户标准信息;
对所述客户标准信息进行哈希操作,得到所述客户标准信息的散列值,通过哈希函数对所述散列值进行关联处理,并根据关联处理后的所述客户标准信息的散列值,生成所述客户标准信息的唯一标识;
将所述电子台账中的所述客户业务信息的存储文档按所述客户标准信息的唯一标识进行命名,从而实现客户信息的整合。
可选地,所述客户基本信息包括:姓名、生日、性别、证件类型以及证件号;所述客户业务信息包括客户通过所述客户信息系统所进行的业务活动产生的数据。
可选地,所述预处理操作包括:
按照预设提取规则从所述客户基本信息的“姓名”信息中提取一个或者多个字母,得到所述“姓名”信息的字母代表;
对所述客户基本信息中的“生日”信息进行填补处理,将所述“生日”信息转换为预设长度的数字形式;
对所述客户基本信息中的“性别”信息和“证件类型”信息照预设量化规则进行量化处理,将所述“性别”信息和“证件类型”信息转换为数值形式。
可选地,所述哈希操作包括:
将所述客户标准信息中的“姓名”信息的字母代表的ASCII码值执行均值取整计算,作为所述“姓名”信息的散列值;
截取所述客户标准信息中的“生日”信息的“年份”的预设位数数字与“月”、“日”执行均值取整计算,作为所述“生日”信息的散列值;
将所述客户标准信息中的“性别”和“证件类型”信息的数值形式的值分别作为所述“性别”和“证件类型”信息对应的散列值;
截取所述客户标准信息中的“证件号”信息中预设位数的数值,并执行求和操作,将所述求和操作得到的结果作为所述“证件号”信息的散列值。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有客户信息整合的程序,所述客户信息整合的程序可被一个或者多个处理器执行,以实现如上所述的客户信息整合的方法的步骤。
本发明提出的客户信息整合的方法、装置及计算机可读存储介质,从客户信息系统中获取客户基本信息和客户业务信息,对所述客户基本信息通过哈希操作进行关联处理后,根据所述关联处理生成一个唯一标识用于识别所述客户基本信息,并根据该唯一标识对存储所述客户业务信息的存储文档进行命名,从而实现了客户基本信息和客户业务信息的整合。
附图说明
图1为本发明一实施例提供的客户信息整合的方法的流程示意图;
图2为本发明一实施例提供的客户信息整合的装置的内部结构示意图;
图3为本发明一实施例提供的客户信息整合的装置中客户信息整合的程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种客户信息整合的方法。参照图1所示,为本发明一实施例提供的客户信息整合的方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,客户信息整合的方法包括:
S1、从客户信息系统中收集客户信息,其中,所述客户信息包括客户基本信息和客户业务信息,将所述客户基本信息存入本地数据库中,将所述客户业务信息存入本地预设的电子台账中。
本发明较佳实施例中,所述客户信息系统可以是目前任何具有客户信息录入操作的业务处理系统,如:证券交易系统、学籍管理系统、病历修正系统等。
本发明较佳实施例可以通过SQL数据库查询语言对所述客户信息系统的数据库中的客户信息进行逐条读取,每读取一条所述客户信息,就将所述客户信息划分为客户基本信息和客户业务信息。其中,所述客户基本信息包括:姓名、生日、性别、证件类型以及证件号。所述客户业务信息包括客户通过所述客户信息系统所进行的业务活动产生的数据,以证券交易系统为例,所述客户业务信息包括:单日最大交易额、单日交易次数、交易累计收益等。
进一步地,本发明将所述客户基本信息存储在本地数据库中,将所述客户业务信息存储在所述本地预设的电子台账中。所述电子台账是根据不同用户的需求,在本地的服务器预先生成的电子表格组,用于存放大量的客户业务信息。
S2、对所述客户基本信息进行预处理操作,得到客户标准信息。
本发明较佳实施例中,所述预处理操作包括:格式统一、长度统一以及量化处理。
详细地,本发明所述格式统一操作包括按照预设提取规则从所述客户基本信息的“姓名”信息中提取一个或者多个字母,得到所述“姓名”信息的字母代表。如果客户姓名是中文名,则首先需要将所述中文名转换成拼音形式,并按照预设提取规则,即提取拼音的首字母。
所述长度统一操作包括对所述客户基本信息中的“生日”信息进行填补处理,将所述“生日”信息转换为预设长度为YYYY-MM-DD的数字形式。例如,所述客户的生日为“1976年4月16日”,则长度统一处理为“1976—04—16”的数字形式。
所述量化操作包括对所述客户基本信息中的“性别”信息和“证件类型”信息按照预设量化规则进行量化处理,将所述“性别”信息和“证件类型”信息转换为数值形式。例如,对所述客户的“性别”信息的量化规则包括:若客户“性别”为男,则统一量化为1,如果为女则统一量化为2;对所述客户“证件类型”的量化规则包括:客户身份证(包括临时身份证)量化处理为1,客户户口本量化处理为2,客户军警证量化处理为3,客户护照量化处理为4等。
本发明通过对所述客户基本信息进行上述格式统一、长度统一以及量化的预处理操作后生成所述客户标准信息。
S3、对所述客户标准信息进行哈希操作,得到所述客户标准信息的散列值,并对所述散列值进行关联处理,根据关联处理后的所述客户标准信息的散列值,生成所述客户标准信息的唯一标识。
所述哈希(hash)操作是将任意长度的输入通过散列算法变换成固定长度的输出,其输出的值即为散列值。本发明通过hash function函数对所述客户标准信息进行哈希操作,得到所述客户标准信息的散列值。
较佳地,本发明所述哈希操作包括:
将所述客户标准信息中的“姓名”信息的字母代表的ASCII码值执行均值取整计算,作为所述“姓名”信息的散列值;
截取所述客户标准信息中的“生日”信息的“年份”的预设位数数字与“月”、“日”执行均值取整计算,作为所述“生日”信息的散列值;
将所述客户标准信息中的“性别”和“证件类型”信息的数值形式的值分别作为所述“性别”和“证件类型”信息对应的散列值;
截取所述客户标准信息中的“证件号”信息中预设位数的数值,并执行求和操作,将所述求和操作得到的结果作为所述“证件号”信息的散列值。
本发明实施例以如下所述客户标准信息为例进行哈希操作的说明:
所述客户标准信息包括:姓名、生日、性别、证件类型以及证件号。
详细地,所述哈希操作包括:将姓名的ASCII码值执行均值取整计算,为“姓名”信息的散列值;截取生日中年份的最后两位与月、日执行均值取整计算,为“生日”信息的散列值;将性别的数值形式的值和证件类型的数值形式的值分别作为所述“性别”和“证件类型”信息的散列值;截取证件号中的最后四位数字,并计算该最后四位数字的和,作为“证件号”信息的散列值。
进一步地,本发明通过哈希函数对所述散列值进行关联处理。其中,所述哈希函数的计算公式包括:
H(key)=a*key+b
其中,key表示所述客户标准信息的散列值,a、b分别表示在[1,10]区间中的一个随机整数,H(key)表示所述客户标准信息的存储单元位址。
详细地,所述关联处理包括:
1、通过随机数命令在[1,10]区间随机产生整数a1和b1,将所述客户标准信息的其中一个散列值,如“姓名”的散列值记为key1,连同所述a1和b1代入所述哈希函数的计算公式中,得到H(key1),并将所述“姓名”信息存储至散列表(hashmap)中的第H(key1))个单元;
2、将所述客户标准信息的另一个散列值,如“生日”的散列值,记为key2,连同a2、b2(a2、b2的产生方式同a1、b1一样)代入所述哈希函数的计算公式中,得到H(key2),将所述“生日”信息存储至散列表(hashmap)中的第H(key2))个单元,同时将所述H(key2)的值存储至所述hashmap中第H(key1)个单元中,完成所述客户标准信息中“姓名”和“生日”信息的关联;
3、将所述客户标准信息的第三个散列值,如“证件号”的散列值,记为key3,连同a3、b3(a3、b3的产生方式同a1、b1一样)代入所述哈希函数的计算公式中,得到H(key3),将所述“证件号”信息存储至散列表(hashmap)中的第H(key3))个单元,同时将所述H(key3)的值存储至所述hashmap中第H(key1)个单元中,完成所述客户标准信息中“姓名”和“证件号”信息的关联;
4、按照上述2和3相同的方式,完成所述客户标准信息中“姓名”和“性别”及“证件类型”信息的关联。
如上述的例子中,若a1=2,b1=1,“姓名”的散列值为75,计算得到H(key1)=2*75+1=151,则将所述“姓名”的值存储在所述hashmap的第151单元;进一步地,若a2=4,b2=2,生日“1992-01-20”的散列值为37,则计算得到H(key2)=37*4+2=150,则将所述“生日”的值1992-01-20存储在所述hashmap中的第150个单元中,同时将数字150也存储于所述hashmap的第151个单元,用以标示所述“生日”的值1992-01-20将被存储在所述hashmap中的第150个单元中,这样就完成“姓名”和“生日”的关联。
与所述客户标准信息中的“姓名”和“生日”信息的散列值关联原理,完成所述客户标准信息所述信息之间的散列值关联,从而完成所述散列值的关联处理。
进一步地,本发明根据关联处理后的所述客户标准信息的散列值,生成所述客户标准信息的唯一标识,如将所述H(key1)的值作为所述客户标准信息的唯一标识(main_id)。
S4、将所述电子台账中的所述客户业务信息的存储文档按所述客户标准信息的唯一标识进行命名,从而实现客户信息的整合。
本发明将电子台账中的所述客户业务信息的存储文档命名为对应的所述客户标准信息的唯一标识main_id,因此,所述main_id既关联了所述客户标准信息,又关联了所述客户业务信息,从而根据所述main_id可以查找到客户的所有信息,从而实现了客户信息的快速整合。
本发明还提供一种客户信息整合的装置。参照图2所示,为本发明一实施例提供的客户信息整合的装置的内部结构示意图。
在本实施例中,所述客户信息整合的装置1可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备,也可以是一种服务器等。该客户信息整合的装置1至少包括存储器11、处理器12,通信总线13,以及网络接口14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是客户信息整合的装置1的内部存储单元,例如该客户信息整合的装置1的硬盘。存储器11在另一些实施例中也可以是客户信息整合的装置1的外部存储设备,例如客户信息整合的装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括客户信息整合的装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于客户信息整合的装置1的应用软件及各类数据,例如客户信息整合的程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行客户信息整合的程序01等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该装置1与其他电子设备之间建立通信连接。
可选地,该装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在客户信息整合的装置1中处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11-14以及客户信息整合的程序01的客户信息整合的装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对客户信息整合的装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的装置1实施例中,存储器11中存储有客户信息整合的程序01;处理器12执行存储器11中存储的客户信息整合的程序01时实现如下步骤:
步骤一、从客户信息系统中收集客户信息,其中,所述客户信息包括客户基本信息和客户业务信息,将所述客户基本信息存入本地数据库中,将所述客户业务信息存入本地预设的电子台账中。
本发明较佳实施例中,所述客户信息系统可以是目前任何具有客户信息录入操作的业务处理系统,如:证券交易系统、学籍管理系统、病历修正系统等。
本发明较佳实施例可以通过SQL数据库查询语言对所述客户信息系统的数据库中的客户信息进行逐条读取,每读取一条所述客户信息,就将所述客户信息划分为客户基本信息和客户业务信息。其中,所述客户基本信息包括:姓名、生日、性别、证件类型以及证件号。所述客户业务信息包括客户通过所述客户信息系统所进行的业务活动产生的数据,以证券交易系统为例,所述客户业务信息包括:单日最大交易额、单日交易次数、交易累计收益等。
进一步地,本发明将所述客户基本信息存储在本地数据库中,将所述客户业务信息存储在所述本地预设的电子台账中。所述电子台账是根据不同用户的需求,在本地的服务器预先生成的电子表格组,用于存放大量的客户业务信息。
步骤二、对所述客户基本信息进行预处理操作,得到客户标准信息。
本发明较佳实施例中,所述预处理操作包括:格式统一、长度统一以及量化处理。
详细地,本发明所述格式统一操作包括按照预设提取规则从所述客户基本信息的“姓名”信息中提取一个或者多个字母,得到所述“姓名”信息的字母代表。如果客户姓名是中文名,则首先需要将所述中文名转换成拼音形式,并按照预设提取规则,即提取拼音的首字母。
所述长度统一操作包括对所述客户基本信息中的“生日”信息进行填补处理,将所述“生日”信息转换为预设长度为YYYY-MM-DD的数字形式。例如,所述客户的生日为“1976年4月16日”,则长度统一处理为“1976—04—16”的数字形式。
所述量化操作包括对所述客户基本信息中的“性别”信息和“证件类型”信息按照预设量化规则进行量化处理,将所述“性别”信息和“证件类型”信息转换为数值形式。例如,对所述客户的“性别”信息的量化规则包括:若客户“性别”为男,则统一量化为1,如果为女则统一量化为2;对所述客户“证件类型”的量化规则包括:客户身份证(包括临时身份证)量化处理为1,客户户口本量化处理为2,客户军警证量化处理为3,客户护照量化处理为4等。
本发明通过对所述客户基本信息进行上述格式统一、长度统一以及量化的预处理操作后生成所述客户标准信息。
步骤三、对所述客户标准信息进行哈希操作,得到所述客户标准信息的散列值,并对所述散列值进行关联处理,根据关联处理后的所述客户标准信息的散列值,生成所述客户标准信息的唯一标识。
所述哈希(hash)操作是将任意长度的输入通过散列算法变换成固定长度的输出,其输出的值即为散列值。本发明通过hash function函数对所述客户标准信息进行哈希操作,得到所述客户标准信息的散列值。
较佳地,本发明所述哈希操作包括:
将所述客户标准信息中的“姓名”信息的字母代表的ASCII码值执行均值取整计算,作为所述“姓名”信息的散列值;
截取所述客户标准信息中的“生日”信息的“年份”的预设位数数字与“月”、“日”执行均值取整计算,作为所述“生日”信息的散列值;
将所述客户标准信息中的“性别”和“证件类型”信息的数值形式的值分别作为所述“性别”和“证件类型”信息对应的散列值;
截取所述客户标准信息中的“证件号”信息中预设位数的数值,并执行求和操作,将所述求和操作得到的结果作为所述“证件号”信息的散列值。
本发明实施例以如下所述客户标准信息为例进行哈希操作的说明:
所述客户标准信息包括:姓名、生日、性别、证件类型以及证件号。
详细地,所述哈希操作包括:将姓名的ASCII码值执行均值取整计算,为“姓名”信息的散列值;截取生日中年份的最后两位与月、日执行均值取整计算,为“生日”信息的散列值;将性别的数值形式的值和证件类型的数值形式的值分别作为所述“性别”和“证件类型”信息的散列值;截取证件号中的最后四位数字,并计算该最后四位数字的和,作为“证件号”信息的散列值。
进一步地,本发明通过哈希函数对所述散列值进行关联处理。其中,所述哈希函数的计算公式包括:
H(key)=a*key+b
其中,key表示所述客户标准信息的散列值,a、b分别表示在[1,10]区间中的一个随机整数,H(key)表示所述客户标准信息的存储单元位址。
详细地,所述关联处理包括:
1、通过随机数命令在[1,10]区间随机产生整数a1和b1,将所述客户标准信息的其中一个散列值,如“姓名”的散列值记为key1,连同所述a1和b1代入所述哈希函数的计算公式中,得到H(key1),并将所述“姓名”信息存储至散列表(hashmap)中的第H(key1))个单元;
2、将所述客户标准信息的另一个散列值,如“生日”的散列值,记为key2,连同a2、b2(a2、b2的产生方式同a1、b1一样)代入所述哈希函数的计算公式中,得到H(key2),将所述“生日”信息存储至散列表(hashmap)中的第H(key2))个单元,同时将所述H(key2)的值存储至所述hashmap中第H(key1)个单元中,完成所述客户标准信息中“姓名”和“生日”信息的关联;
3、将所述客户标准信息的第三个散列值,如“证件号”的散列值,记为key3,连同a3、b3(a3、b3的产生方式同a1、b1一样)代入所述哈希函数的计算公式中,得到H(key3),将所述“证件号”信息存储至散列表(hashmap)中的第H(key3))个单元,同时将所述H(key3)的值存储至所述hashmap中第H(key1)个单元中,完成所述客户标准信息中“姓名”和“证件号”信息的关联;
4、按照上述2和3相同的方式,完成所述客户标准信息中“姓名”和“性别”及“证件类型”信息的关联。
如上述的例子中,若a1=2,b1=1,“姓名”的散列值为75,计算得到H(key1)=2*75+1=151,则将所述“姓名”的值存储在所述hashmap的第151单元;进一步地,若a2=4,b2=2,生日“1992-01-20”的散列值为37,则计算得到H(key2)=37*4+2=150,则将所述“生日”的值1992-01-20存储在所述hashmap中的第150个单元中,同时将数字150也存储于所述hashmap的第151个单元,用以标示所述“生日”的值1992-01-20将被存储在所述hashmap中的第150个单元中,这样就完成“姓名”和“生日”的关联。
与所述客户标准信息中的“姓名”和“生日”信息的散列值关联原理,完成所述客户标准信息所述信息之间的散列值关联,从而完成所述散列值的关联处理。
进一步地,本发明根据关联处理后的所述客户标准信息的散列值,生成所述客户标准信息的唯一标识,如将所述H(key1)的值作为所述客户标准信息的唯一标识(main_id)
步骤四、将所述电子台账中的所述客户业务信息的存储文档按所述客户标准信息的唯一标识进行命名,从而实现客户信息的整合。
本发明将电子台账中的所述客户业务信息的存储文档命名为对应的所述客户标准信息的唯一标识main_id,因此,所述main_id既关联了所述客户标准信息,又关联了所述客户业务信息,从而根据所述main_id可以查找到客户的所有信息,从而实现了客户信息的快速整合。
可选地,在其他实施例中,客户信息整合的程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述客户信息整合的程序在客户信息整合的装置中的执行过程。
例如,参照图3所示,为本发明客户信息整合的装置一实施例中的客户信息整合的程序的程序模块示意图,该实施例中,所述客户信息整合的程序可以被分割为信息存储模块10、信息预处理模块20、唯一标识生成模块30以及命名模块40,示例性地:
所述信息存储模块10用于:从客户信息系统中收集客户信息,其中,所述客户信息包括客户基本信息和客户业务信息,将所述客户基本信息存入本地数据库中,将所述客户业务信息存入本地预设的电子台账中。
所述信息预处理模块20用于:对所述客户基本信息进行预处理操作,得到客户标准信息。
所述唯一标识生成模块30用于:对所述客户标准信息进行哈希操作,得到所述客户标准信息的散列值,通过哈希函数对所述散列值进行关联处理,并根据关联处理后的所述客户标准信息的散列值,生成所述客户标准信息的唯一标识。
所述命名模块40用于:将所述电子台账中的所述客户业务信息的存储文档按所述客户标准信息的唯一标识进行命名,从而实现客户信息的整合。
上述信息存储模块10、信息预处理模块20、唯一标识生成模块30以及命名模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有客户信息整合的程序,所述客户信息整合的程序可被一个或多个处理器执行,以实现如下操作:
从客户信息系统中收集客户信息,其中,所述客户信息包括客户基本信息和客户业务信息,将所述客户基本信息存入本地数据库中,将所述客户业务信息存入本地预设的电子台账中;
对所述客户基本信息进行预处理操作,得到客户标准信息;
对所述客户标准信息进行哈希操作,得到所述客户标准信息的散列值,通过哈希函数对所述散列值进行关联处理,并根据关联处理后的所述客户标准信息的散列值,生成所述客户标准信息的唯一标识;
将所述电子台账中的所述客户业务信息的存储文档按所述客户标准信息的唯一标识进行命名,从而实现客户信息的整合。
本发明计算机可读存储介质具体实施方式与上述客户信息整合的装置和方法各实施例基本相同,在此不作累述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种客户信息整合的方法,其特征在于,所述方法包括:
从客户信息系统中收集客户信息,其中,所述客户信息包括客户基本信息和客户业务信息,将所述客户基本信息存入本地数据库中,将所述客户业务信息存入本地预设的电子台账中;
对所述客户基本信息进行预处理操作,得到客户标准信息;
对所述客户标准信息进行哈希操作,得到所述客户标准信息的散列值,通过哈希函数对所述散列值进行关联处理;所述关联处理包括以下步骤:步骤①、通过随机数命令在[1 ,10]区间随机产生整数a1和b1,将所述客户标准信息的其中一个散列值记为key1,连同所述a1和b1代入所述哈希函数的计算公式中,得到H(key1),并将散列值key1对应的信息存储至散列表中的第H(key1)个单元;步骤②、通过随机数命令在[1 ,10]区间随机产生整数a2和b2,将所述客户标准信息的另一个散列值记为key2,连同a2、b2代入所述哈希函数的计算公式中,得到H(key2),将散列值key2对应的信息存储至所述散列表中的第H(key2)个单元,同时将所述H(key2)的值存储至所述散列表中第H(key1)个单元中,完成所述客户标准信息中散列值key1对应的信息和散列值key2对应的信息的关联;步骤③、按照上述步骤①和步骤②相同的方式,完成所述客户标准信息中各个散列值对应的信息和散列值key1对应的信息的关联;
根据关联处理后的所述客户标准信息的散列值,生成所述客户标准信息的唯一标识;
将所述电子台账中的所述客户业务信息的存储文档按所述客户标准信息的唯一标识进行命名,从而实现客户信息的整合。
2.如权利要求1所述的客户信息整合的方法,其特征在于,所述客户基本信息包括:姓名、生日、性别、证件类型以及证件号;所述客户业务信息包括客户通过所述客户信息系统所进行的业务活动产生的数据。
3.如权利要求2所述的客户信息整合的方法,其特征在于,所述预处理操作包括:
按照预设提取规则从所述客户基本信息的“姓名”信息中提取一个或者多个字母,得到所述“姓名”信息的字母代表;
对所述客户基本信息中的“生日”信息进行填补处理,将所述“生日”信息转换为预设长度的数字形式;
对所述客户基本信息中的“性别”信息和“证件类型”信息照预设量化规则进行量化处理,将所述“性别”信息和“证件类型”信息转换为数值形式。
4.如权利要求3所述的客户信息整合的方法,其特征在于,所述哈希操作包括:
将所述客户标准信息中的“姓名”信息的字母代表的ASCII码值执行均值取整计算,作为所述“姓名”信息的散列值;
截取所述客户标准信息中的“生日”信息的“年份”的预设位数数字与“月”、“日”执行均值取整计算,作为所述“生日”信息的散列值;
将所述客户标准信息中的“性别”和“证件类型”信息的数值形式的值分别作为所述“性别”和“证件类型”信息对应的散列值;
截取所述客户标准信息中的“证件号”信息中预设位数的数值,并执行求和操作,将所述求和操作得到的结果作为所述“证件号”信息的散列值。
5.如权利要求4中所述的客户信息整合的方法,其特征在于,所述关联处理的计算方法包括:
H(key)=a*key+b
其中,key表示所述客户标准信息的散列值,a、b分别表示在[1,10]区间中的一个随机整数,H(key)表示所述客户标准信息的存储单元位址。
6.一种客户信息整合的装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的客户信息整合的程序,所述客户信息整合的程序被所述处理器执行时实现如下步骤:
从客户信息系统中收集客户信息,其中,所述客户信息包括客户基本信息和客户业务信息,将所述客户基本信息存入本地数据库中,将所述客户业务信息存入本地预设的电子台账中;
对所述客户基本信息进行预处理操作,得到客户标准信息;
对所述客户标准信息进行哈希操作,得到所述客户标准信息的散列值,通过哈希函数对所述散列值进行关联处理;所述关联处理包括以下步骤:步骤①、通过随机数命令在[1 ,10]区间随机产生整数a1和b1,将所述客户标准信息的其中一个散列值记为key1,连同所述a1和b1代入所述哈希函数的计算公式中,得到H(key1),并将散列值key1对应的信息存储至散列表中的第H(key1)个单元;步骤②、通过随机数命令在[1 ,10]区间随机产生整数a2和b2,将所述客户标准信息的另一个散列值记为key2,连同a2、b2代入所述哈希函数的计算公式中,得到H(key2),将散列值key2对应的信息存储至所述散列表中的第H(key2)个单元,同时将所述H(key2)的值存储至所述散列表中第H(key1)个单元中,完成所述客户标准信息中散列值key1对应的信息和散列值key2对应的信息的关联;步骤③、按照上述步骤①和步骤②相同的方式,完成所述客户标准信息中各个散列值对应的信息和散列值key1对应的信息的关联;
根据关联处理后的所述客户标准信息的散列值,生成所述客户标准信息的唯一标识;
将所述电子台账中的所述客户业务信息的存储文档按所述客户标准信息的唯一标识进行命名,从而实现客户信息的整合。
7.如权利要求6所述的客户信息整合的装置,其特征在于,所述客户基本信息包括:姓名、生日、性别、证件类型以及证件号;所述客户业务信息包括客户通过所述客户信息系统所进行的业务活动产生的数据。
8.如权利要求7所述的客户信息整合的装置,其特征在于,所述预处理操作包括:
按照预设提取规则从所述客户基本信息的“姓名”信息中提取一个或者多个字母,得到所述“姓名”信息的字母代表;
对所述客户基本信息中的“生日”信息进行填补处理,将所述“生日”信息转换为预设长度的数字形式;
对所述客户基本信息中的“性别”信息和“证件类型”信息照预设量化规则进行量化处理,将所述“性别”信息和“证件类型”信息转换为数值形式。
9.如权利要求8所述的客户信息整合的装置,其特征在于,所述哈希操作包括:
将所述客户标准信息中的“姓名”信息的字母代表的ASCII码值执行均值取整计算,作为所述“姓名”信息的散列值;
截取所述客户标准信息中的“生日”信息的“年份”的预设位数数字与“月”、“日”执行均值取整计算,作为所述“生日”信息的散列值;
将所述客户标准信息中的“性别”和“证件类型”信息的数值形式的值分别作为所述“性别”和“证件类型”信息对应的散列值;
截取所述客户标准信息中的“证件号”信息中预设位数的数值,并执行求和操作,将所述求和操作得到的结果作为所述“证件号”信息的散列值。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有客户信息整合的程序,所述客户信息整合的程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的客户信息整合的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910970984.9A CN110737644B (zh) | 2019-10-12 | 2019-10-12 | 客户信息整合的方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910970984.9A CN110737644B (zh) | 2019-10-12 | 2019-10-12 | 客户信息整合的方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110737644A CN110737644A (zh) | 2020-01-31 |
CN110737644B true CN110737644B (zh) | 2023-06-23 |
Family
ID=69269915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910970984.9A Active CN110737644B (zh) | 2019-10-12 | 2019-10-12 | 客户信息整合的方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110737644B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111383050A (zh) * | 2020-02-21 | 2020-07-07 | 中国平安财产保险股份有限公司 | 产品数据整合及分析方法、装置及计算机可读存储介质 |
CN112381657A (zh) * | 2020-11-10 | 2021-02-19 | 中国人寿保险股份有限公司 | 一种保险信息整合方法及装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009169490A (ja) * | 2008-01-11 | 2009-07-30 | Fuji Xerox Co Ltd | ユーザ属性情報管理プログラム、ユーザ属性情報確認プログラム、ユーザ属性情報管理装置、ユーザ属性情報確認装置及びユーザ属性情報管理システム |
KR101327434B1 (ko) * | 2010-10-20 | 2013-11-20 | 비씨카드(주) | 고객 단말기의 맥 어드레스 정보를 이용한 결제 방법 및 시스템 |
US8706739B1 (en) * | 2012-04-26 | 2014-04-22 | Narus, Inc. | Joining user profiles across online social networks |
US9129118B1 (en) * | 2013-05-03 | 2015-09-08 | Amazon Technologies, Inc. | Mapping identifying information |
CN104462396B (zh) * | 2014-12-10 | 2017-12-19 | 北京国双科技有限公司 | 字符串处理方法和装置 |
CN106789002B (zh) * | 2016-12-14 | 2019-11-15 | 长沙理工大学 | 一种基于身份信息的eeid标识生成方法 |
CN107562533B (zh) * | 2017-07-28 | 2021-08-06 | 创新先进技术有限公司 | 一种数据加载处理方法及装置 |
US10771459B2 (en) * | 2017-09-04 | 2020-09-08 | Electronics And Telecommunications Research Institute | Terminal apparatus, server apparatus, blockchain and method for FIDO universal authentication using the same |
CN109040006A (zh) * | 2018-06-06 | 2018-12-18 | 中融万博网络科技有限公司 | 一种秘信系统方法 |
-
2019
- 2019-10-12 CN CN201910970984.9A patent/CN110737644B/zh active Active
Non-Patent Citations (1)
Title |
---|
高维分布式局部敏感哈希索引方法;林朝晖;于俊清;何云峰;管涛;艾列富;;计算机科学与探索;第7卷(第9期);第811-818页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110737644A (zh) | 2020-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108694657B (zh) | 客户识别装置、方法及计算机可读存储介质 | |
CN112347214B (zh) | 目标区域划分方法、装置、电子设备及存储介质 | |
CN109636582B (zh) | 信贷信息管理方法、装置、设备和存储介质 | |
CN110457311B (zh) | 自动生成对账文件的方法、服务器及存储介质 | |
CN110737644B (zh) | 客户信息整合的方法、装置及计算机可读存储介质 | |
CN112613917A (zh) | 基于用户画像的信息推送方法、装置、设备及存储介质 | |
CN109544266B (zh) | 产品数据推送方法、装置及计算机可读存储介质 | |
CN114979120B (zh) | 数据上传方法、装置、设备及存储介质 | |
CN109739992B (zh) | 一种获取关联信息的方法及终端 | |
CN111026753A (zh) | 基于树形结构的标签存储方法及装置 | |
US8538013B2 (en) | Rules-driven hash building | |
CN112000692B (zh) | 页面查询反馈方法、装置、计算机设备及可读存储介质 | |
CN111159183B (zh) | 报表生成方法、电子装置及计算机可读存储介质 | |
CN112182174A (zh) | 业务问答知识查询方法、装置、计算机设备和存储介质 | |
US20150142502A1 (en) | Methods and systems for creating tasks | |
CN110866042A (zh) | 表格智能查询方法、装置及计算机可读存储介质 | |
CN111581486A (zh) | 一种信息分配方法及装置 | |
CN113051389B (zh) | 知识推送方法及装置 | |
CN112256853A (zh) | 问题生成方法、装置、设备及计算机可读存储介质 | |
CN114157634B (zh) | 唯一账号识别方法、装置、设备及存储介质 | |
US11709856B2 (en) | Data mapper tool | |
CN112182107B (zh) | 名单数据获取方法、装置、计算机设备及存储介质 | |
CN114614972A (zh) | 数据对齐方法、系统、电子装置及存储介质 | |
EP3667585A1 (en) | Calling card information management system and calling card information management program | |
CN111221917B (zh) | 智能分区存储方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |