CN110147813B - 一种用户画像构建方法、装置、存储介质和服务器 - Google Patents

一种用户画像构建方法、装置、存储介质和服务器 Download PDF

Info

Publication number
CN110147813B
CN110147813B CN201910272592.5A CN201910272592A CN110147813B CN 110147813 B CN110147813 B CN 110147813B CN 201910272592 A CN201910272592 A CN 201910272592A CN 110147813 B CN110147813 B CN 110147813B
Authority
CN
China
Prior art keywords
shareholder
investor
matching
characteristic information
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910272592.5A
Other languages
English (en)
Other versions
CN110147813A (zh
Inventor
王建华
顾鹏
郑札鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Valueonline Technology Co ltd
Original Assignee
Shenzhen Valueonline Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Valueonline Technology Co ltd filed Critical Shenzhen Valueonline Technology Co ltd
Priority to CN201910272592.5A priority Critical patent/CN110147813B/zh
Publication of CN110147813A publication Critical patent/CN110147813A/zh
Application granted granted Critical
Publication of CN110147813B publication Critical patent/CN110147813B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提供了一种用户画像构建方法、装置、存储介质和服务器,包括:获取股东名册上股东的特征信息;获取第三方公开披露的投资者的特征信息;根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度;若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像。本发明使得构建的画像精度更搞,提高画像的有效性。

Description

一种用户画像构建方法、装置、存储介质和服务器
技术领域
本发明涉及信息处理领域,尤其涉及一种用户画像构建方法、装置、存储介质和服务器。
背景技术
随着目前国内A股市场发展,投资者权益保护的深入,对于上市公司而言,投资者关系是未来公司资本价值的重要抓手。上市公司在投资者关系管理的过程中,需对投资人作全面了解。
现有技术中,上市公司为了了解各投资者,通过对股东名册上的信息进行统计分析。然而,对股东名册上的信息进行统计分析得到的分析结果,并不能准确代表投资者,用户画像构建不准确。
发明内容
本发明实施例提供了一种用户画像构建方法、装置、存储介质和服务器,以解决现有技术中,对股东名册上的信息进行统计分析得到的分析结果,并不能准确代表投资者,用户画像构建不准确的问题。
本发明实施例的第一方面提供了一种用户画像构建方法,包括:
获取股东名册上股东的特征信息;
获取第三方公开披露的投资者的特征信息;
根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度;
若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像。
本发明实施例的第二方面提供了一种用户画像构建装置,包括:
第一信息获取单元,用于获取股东名册上股东的特征信息;
第二信息获取单元,用于获取第三方公开披露的投资者的特征信息;
匹配度计算单元,用于根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度;
画像构建单元,用于若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像。
本发明实施例的第三方面提供了一种服务器,包括存储器以及处理器,所述存储器存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
获取股东名册上股东的特征信息;
获取第三方公开披露的投资者的特征信息;
根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度;
若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
获取股东名册上股东的特征信息;
获取第三方公开披露的投资者的特征信息;
根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度;
若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像。
本发明实施例中,通过获取股东名册上股东的特征信息,获取第三方公开披露的投资者的特征信息,然后根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度,若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像,本方案中,还将外部披露的投资者与股东匹配,获取股东的外部投资信息,结合股东名册上的股东信息与外部的投资信息进行画像,从而使得构建的画像精度更高,提高画像的有效性,大大提升画像的可利用率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的用户画像构建方法的实现流程图;
图2是本发明实施例提供的用户画像构建方法S103的具体实现流程图;
图3是本发明实施例提供的用户画像构建方法步骤B2的具体实现流程图;
图4是本发明实施例提供的用户画像构建装置的结构框图;
图5是本发明实施例提供的服务器的示意图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1示出了本发明实施例提供的用户画像构建方法的实现流程,该方法流程包括步骤S101至S104。各步骤的具体实现原理如下:
S101:获取股东名册上股东的特征信息。
在本发明实施例中,服务器导入股东名册,对所述股东名册进行解析,获取所述股东名册上股东的特征信息。具体地,导入的所述股东名册为dbf/excel文件,解析所述股东名册的数据结构,获取股东的特征信息,所述股东的特征信息包括股东名称以及每一期的持股信息,所述持股信息包括期次、股东代码、股东证件号、持股数量、持股比例、股东类型、股东联系方式以及股东地址。
可选地,在本发明实施例中,根据所述股东的特征信息,建立二元关系组。所述二元关系组包括标签和股东证件号。其中,所述标签为预先定义的分类标签,根据所述股东的特征信息确定与所述股东对应的标签。
S102:获取第三方公开披露的投资者的特征信息。
在本发明实施例中,获取第三方公开披露的投资者的特征信息,所述第三方可以是工商单位等官方机构,或者是第三方财经数据库。具体地,获取全国各省市工商系统公开披露的工商信息,所述工商信息包括投资者的特征信息,所述投资者的特征信息包括投资者身份信息及其投资行为信息,所述投资行为包括股票交易、历史调研信息、公布的媒体资讯等。
S103:根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度。
在本发明实施例中,由于第三方公开披露的投资者,可能是上述股东名册上的股东,也可能不是,因此,为了确定上述第三方公开披露的投资者是否为所述股东名册上的股东,根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度,根据匹配度确定所述投资者与所述股东是否匹配。具体地,若所述匹配度未达到预设匹配度阈值,则所述投资者与所述股东不匹配。
可选地,在本发明实施例中,在上述步骤S103之前,对第三方公开披露的投资者进行初步筛选,确定用于与所述股东进行匹配计算的投资者,从而提高匹配的效率。
可选地,作为本发明的一个实施例,所述股东的特征信息包括股东名称与股东地域特征,所述投资者的特征信息包括投资者名称、投资者地域特征以及历史持仓特征,如图2所示,上述S103的具体实现流程如下:
A1:将所述股东名称与所述投资者名称进行匹配,获取名称匹配值。具体地,将所述股东名称和所述投资者名册比对,若名称一致,则所述名称匹配值为1,若不一致,则所述名称匹配值为0。
A2:将所述股东地域特征与所述投资地域特征进行匹配,获取地域匹配值。若地域特征一致,则所述地域匹配值为1,若不一致,则所述地域匹配值为0。
A3:根据所述投资者的历史持仓特征,确定持仓匹配值。具体地,所述历史持仓特征是指投资者是否持有过该家公司的股票。进一步地,获取所述投资者近3个月的历史持仓特征,确定该投资者近三个月是否有持仓。若所述投资者有持仓,则所述持仓匹配值为1,否则,所述持仓匹配值为0。
A4:根据所述名称匹配值、所述地域匹配值以及所述持仓匹配值,确定所述股东与所述投资者的匹配度。
在本发明实施例中,由于外部投资者不存在证件号码无法做精准匹配,通过股东名称、地域特征、历史持仓特征进行智能计算,建立多元归因模型,计算匹配度。具体地,上述步骤A4具体包括:详述如下:
A41:获取匹配调整系数,所述匹配调整系数包括名称匹配调整系数、地域匹配调整系数以及历史持仓调整系数。
A42:根据如下公式计算所述股东与所述投资者的匹配度:
M=ax+by+cz;
其中,x为所述名称匹配值,a为名称匹配调整系数,y为所述地域匹配值,b为地域匹配调整系数,z为所述持仓匹配值,c为历史持仓调整系数。其中,a为0.5,b为0.3,c为0.2。具体地,对于x,比较股东名称与投资者名册是否一致;对于y,比较股东地域特征与所述投资地域特征,地域特征包括<国际I,省P,市C,县T,地址A>的关系,y=max(1*A,0.8*T,0.5*C,0.2*P),I,P,C,T,A取值(0,1);z表示历史持仓特征中是否存在持仓历史,z:=Exits(持仓历史,3),代表3个月内是否有过持仓的公开披露数据,x、y、z的取值为[0,1]。
S104:若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像。
在本发明实施例中,若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像。具体地,连接第三方服务器,获取所述投资者的投资信息,根据所述投资者的特征信息、投资信息以及所述股东的特征信息,构建所述股东的画像。
可选地,作为本发明的一个实施例,上述步骤S104具体包括:
B1:若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息,获取所述投资者的历史投资信息。具体地,若所述匹配度达到预设匹配度阈值,则所述投资者与所述股东匹配,即认定所述投资者与所述股东为同一用户。
B2:根据所述历史投资信息与所述股东的特征信息,构建所述股东的画像。
在本发明实施例中,所述股东的画像包括持仓的情况、规模情况、基金产品、相关人员、基本股东简介等。
可选地,所述股东的特征信息还包括持股信息,如图3所示,上述步骤B2具体包括:
B21:根据所述股东的持股信息,获取所述股东的内部画像。根据所述股东的持股信息进行分析,具体地,建立单期分析、多期多维度对比机制,所述单期分析包括了股东名册上股东总户数和筹码集中度的情况,机构与自然人的情况,信用持股情况,集中度的情况。还对股东结构进行分析,确定股东的股东性质、所处地域、持股分布,所述股东性质包括自然人股东、企业股东和非企业股东;所述多期分析包括对持股变化情况进行分析,包括增持、减持、新进、退出,若所述股东为重要股东,进行重要股东分析,包括公募、国家队、外资的持股与变化情况的分析。所述重要股东为占股数超过预设股数的股东。通过根据所述股东的持股信息进行分析,根据分析结果,确定所述股东的内部画像。可选地,将多期分析对比的结果,自动生成word/pdf版本的分析报告,供用户参考。
可选地,所述内部画像还包括所述股东与其他股东的关联关系。具体地,应用网络化分析引擎分析各个股东的股东信息,确定各个股东的关联关系,并建立关联标记。
B22:根据所述历史投资信息,获取所述股东的外部画像。在本实施例中,根据所述历史投资信息,确定所述投资者的投资习惯,具体地,根据所述历史投资信息与经过训练的神经网络模型,确定所述投资者的投资习惯,根据所述投资者的投资习惯,确定所述股东的外部画像。
B23:根据所述内部画像与所述外部画像,构建所述股东的画像。具体地,结合所述股东的股东分析结果与外部投资习惯,构建所述股东的画像。
本发明实施例中,通过获取股东名册上股东的特征信息,获取第三方公开披露的投资者的特征信息,然后根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度,若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像,本方案中,还将外部披露的投资者与股东匹配,获取股东的外部投资信息,结合股东名册上的股东信息与外部的投资信息进行画像,从而使得构建的画像精度更高,提高画像的有效性,大大提升画像的可利用率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的用户画像构建方法,图4示出了本申请实施例提供的用户画像构建装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图4,该用户画像构建装置包括:第一信息获取单元41,第二信息获取单元42,匹配度计算单元43,画像构建单元44,其中:
第一信息获取单元41,用于获取股东名册上股东的特征信息;
第二信息获取单元42,用于获取第三方公开披露的投资者的特征信息;
匹配度计算单元43,用于根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度;
画像构建单元44,用于若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像。
可选地,所述股东的特征信息包括股东名称与股东地域特征,所述投资者的特征信息包括投资者名称、投资者地域特征以及历史持仓特征,所述匹配度计算单元43包括:
第一匹配值获取模块,用于将所述股东名称与所述投资者名称进行匹配,获取名称匹配值;
第二匹配值获取模块,用于将所述股东地域特征与所述投资地域特征进行匹配,获取地域匹配值;
第二匹配值获取模块,用于根据所述投资者的历史持仓特征,确定持仓匹配值;
匹配度计算模块,用于根据所述名称匹配值、所述地域匹配值以及所述持仓匹配值,确定所述股东与所述投资者的匹配度。
可选地,所述匹配度计算模块具体包括:
系数获取子模块,用于获取匹配调整系数,所述匹配调整系数包括名称匹配调整系数、地域匹配调整系数以及历史持仓调整系数;
匹配计算子模块,用于根据如下公式计算所述股东与所述投资者的匹配度:
M=ax+by+cz;
其中,x为所述名称匹配值,a为名称匹配调整系数,y为所述地域匹配值,b为地域匹配调整系数,z为所述持仓匹配值,c为历史持仓调整系数。
可选地,所述画像构建单元44包括:
投资信息获取模块,用于若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息,获取所述投资者的历史投资信息;
画像构建模块,用于根据所述历史投资信息与所述股东的特征信息,构建所述股东的画像。
可选地,所述股东的特征信息还包括持股信息,所述画像构建模块具体包括:
内部画像确定子模块,用于根据所述股东的持股信息,获取所述股东的内部画像;
外部画像确定子模块,用于根据所述历史投资信息,获取所述股东的外部画像;
画像构建子模块,用于根据所述内部画像与所述外部画像,构建所述股东的画像。
本发明实施例中,通过获取股东名册上股东的特征信息,获取第三方公开披露的投资者的特征信息,然后根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度,若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像,本方案中,还将外部披露的投资者与股东匹配,获取股东的外部投资信息,结合股东名册上的股东信息与外部的投资信息进行画像,从而使得构建的画像精度更高,提高画像的有效性,大大提升画像的可利用率。
图5是本发明一实施例提供的服务器的示意图。如图5所示,该实施例的服务器5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52,例如用户画像构建程序。所述处理器50执行所述计算机程序52时实现上述各个投资者的认证方法实施例中的步骤,例如图1所示的步骤101至104。或者,所述处理器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图4所示单元41至44的功能。
示例性的,所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述处理器50执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述服务器5中的执行过程。例如,所述计算机程序52可以被第一信息获取单元、第二信息获取单元、匹配度计算单元以及画像构建单元,各单元具体功能如下:
第一信息获取单元,用于获取股东名册上股东的特征信息;
第二信息获取单元,用于获取第三方公开披露的投资者的特征信息;
匹配度计算单元,用于根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度;
画像构建单元,用于若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像。
所述服务器5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等智能计算设备。所述服务器可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是服务器5的示例,并不构成对服务器5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述服务器还可以包括输入输出设备、网络接入设备、总线等。
所述处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51可以是所述服务器5的内部存储单元,例如服务器5的硬盘或内存。所述存储器51也可以是所述服务器5的外部存储设备,例如所述服务器5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括所述服务器5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述服务器所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (7)

1.一种用户画像构建方法,其特征在于,包括:
获取股东名册上股东的特征信息;
获取第三方公开披露的投资者的特征信息;
根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度;
若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像;
所述股东的特征信息包括股东名称与股东地域特征,所述投资者的特征信息包括投资者名称、投资者地域特征以及历史持仓特征,所述根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度的步骤,包括:
将所述股东名称与所述投资者名称进行匹配,获取名称匹配值;
将所述股东地域特征与所述投资者 地域特征进行匹配,获取地域匹配值;
根据所述投资者的历史持仓特征,确定持仓匹配值;
根据所述名称匹配值、所述地域匹配值以及所述持仓匹配值,确定所述股东与所述投资者的匹配度;
所述根据所述名称匹配值、所述地域匹配值以及所述持仓匹配值,确定所述股东与所述投资者的匹配度的步骤,包括:
获取匹配调整系数,所述匹配调整系数包括名称匹配调整系数、地域匹配调整系数以及历史持仓调整系数;
根据如下公式计算所述股东与所述投资者的匹配度:
M=ax+by+cz;
其中,x为所述名称匹配值,a为名称匹配调整系数,y为所述地域匹配值,b为地域匹配调整系数,z为所述持仓匹配值,c为历史持仓调整系数,
对于x,比较股东名称与投资者名册是否一致;对于y,比较股东地域特征与所述投资者地域特征,地域特征包括<国际I,省P,市C,县T,地址A>的关系,y=max(1*A,0.8*T,0.5*C,0.2*P),I,P,C,T,A取值(0,1);z表示历史持仓特征中是否存在持仓历史,z:=Exits(持仓历史,3),代表3个月内是否有过持仓的公开披露数据,x、y、z的取值为[0,1]。
2.根据权利要求1所述的用户画像构建方法,其特征在于,所述若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像的步骤,包括:
若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息,获取所述投资者的历史投资信息;
根据所述历史投资信息与所述股东的特征信息,构建所述股东的画像。
3.根据权利要求2所述的用户画像构建方法,其特征在于,所述股东的特征信息还包括持股信息,所述根据所述历史投资信息与所述股东的特征信息,构建所述股东的画像的步骤,包括:
根据所述股东的持股信息,获取所述股东的内部画像;
根据所述历史投资信息,获取所述股东的外部画像;
根据所述内部画像与所述外部画像,构建所述股东的画像。
4.一种用户画像构建装置,其特征在于,所述用户画像构建装置包括:
第一信息获取单元,用于获取股东名册上股东的特征信息;
第二信息获取单元,用于获取第三方公开披露的投资者的特征信息;
匹配度计算单元,用于根据所述股东的特征信息与所述投资者的特征信息,计算所述股东与所述投资者的匹配度;
画像构建单元,用于若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息与所述股东的特征信息,构建所述股东的画像;
所述股东的特征信息包括股东名称与股东地域特征,所述投资者的特征信息包括投资者名称、投资者地域特征以及历史持仓特征,所述匹配度计算单元包括:
第一匹配值获取模块,用于将所述股东名称与所述投资者名称进行匹配,获取名称匹配值;
第二匹配值获取模块,用于将所述股东地域特征与所述投资者 地域特征进行匹配,获取地域匹配值;
第二匹配值获取模块,用于根据所述投资者的历史持仓特征,确定持仓匹配值;
匹配度计算模块,用于根据所述名称匹配值、所述地域匹配值以及所述持仓匹配值,确定所述股东与所述投资者的匹配度;
所述根据所述名称匹配值、所述地域匹配值以及所述持仓匹配值,确定所述股东与所述投资者的匹配度的步骤,包括:
获取匹配调整系数,所述匹配调整系数包括名称匹配调整系数、地域匹配调整系数以及历史持仓调整系数;
根据如下公式计算所述股东与所述投资者的匹配度:
M=ax+by+cz;
其中,x为所述名称匹配值,a为名称匹配调整系数,y为所述地域匹配值,b为地域匹配调整系数,z为所述持仓匹配值,c为历史持仓调整系数,
对于x,比较股东名称与投资者名册是否一致;对于y,比较股东地域特征与所述投资者地域特征,地域特征包括<国际I,省P,市C,县T,地址A>的关系,y=max(1*A,0.8*T,0.5*C,0.2*P),I,P,C,T,A取值(0,1);z表示历史持仓特征中是否存在持仓历史,z:=Exits(持仓历史,3),代表3个月内是否有过持仓的公开披露数据,x、y、z的取值为[0,1]。
5.根据权利要求4所述的用户画像构建装置,其特征在于,所述画像构建单元包括:
投资信息获取模块,用于若所述匹配度达到预设匹配度阈值,则根据所述投资者的特征信息,获取所述投资者的历史投资信息;
画像构建模块,用于根据所述历史投资信息与所述股东的特征信息,构建所述股东的画像。
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3中任一项所述用户画像构建方法的步骤。
7.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3中任一项所述用户画像构建方法的步骤。
CN201910272592.5A 2019-04-04 2019-04-04 一种用户画像构建方法、装置、存储介质和服务器 Active CN110147813B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910272592.5A CN110147813B (zh) 2019-04-04 2019-04-04 一种用户画像构建方法、装置、存储介质和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910272592.5A CN110147813B (zh) 2019-04-04 2019-04-04 一种用户画像构建方法、装置、存储介质和服务器

Publications (2)

Publication Number Publication Date
CN110147813A CN110147813A (zh) 2019-08-20
CN110147813B true CN110147813B (zh) 2021-06-15

Family

ID=67589521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910272592.5A Active CN110147813B (zh) 2019-04-04 2019-04-04 一种用户画像构建方法、装置、存储介质和服务器

Country Status (1)

Country Link
CN (1) CN110147813B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107742253A (zh) * 2017-09-29 2018-02-27 搜易贷(北京)金融信息服务有限公司 一种基于用户行为分析的自动化运营方法
CN108572967A (zh) * 2017-03-09 2018-09-25 神州数码系统集成服务有限公司 一种创建企业画像的方法及装置
CN109146527A (zh) * 2018-08-31 2019-01-04 万翼科技有限公司 投标资格的校验方法、服务器及存储介质
CN109255716A (zh) * 2018-09-04 2019-01-22 中国平安财产保险股份有限公司 债券评级方法、装置、计算机设备及存储介质
CN109509040A (zh) * 2019-01-03 2019-03-22 广发证券股份有限公司 预测基金潜在客户的建模方法、营销方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033872A (zh) * 2009-09-28 2011-04-27 陈曦 一种资本关联关系的生成方法和设备
CN102043847A (zh) * 2010-12-09 2011-05-04 龙信数据(北京)有限公司 基于条件检索的公司股东投资关系自动分析系统及方法
JP4978976B1 (ja) * 2011-10-13 2012-07-18 インベスター・ネットワークス株式会社 株主管理装置、株主管理方法及びプログラム
CN107103536A (zh) * 2017-05-25 2017-08-29 深圳开拓者科技有限公司 一种交易持仓数的监控方法及系统
CN109189809B (zh) * 2018-10-17 2020-01-03 北京金堤科技有限公司 一种股东名称关联匹配的方法和装置
CN109189867B (zh) * 2018-10-23 2021-09-17 中山大学 基于公司知识图谱的关系发现方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108572967A (zh) * 2017-03-09 2018-09-25 神州数码系统集成服务有限公司 一种创建企业画像的方法及装置
CN107742253A (zh) * 2017-09-29 2018-02-27 搜易贷(北京)金融信息服务有限公司 一种基于用户行为分析的自动化运营方法
CN109146527A (zh) * 2018-08-31 2019-01-04 万翼科技有限公司 投标资格的校验方法、服务器及存储介质
CN109255716A (zh) * 2018-09-04 2019-01-22 中国平安财产保险股份有限公司 债券评级方法、装置、计算机设备及存储介质
CN109509040A (zh) * 2019-01-03 2019-03-22 广发证券股份有限公司 预测基金潜在客户的建模方法、营销方法及装置

Also Published As

Publication number Publication date
CN110147813A (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
Hensher et al. An error component logit analysis of corporate bankruptcy and insolvency risk in Australia
CN108763277B (zh) 一种数据分析方法、计算机可读存储介质及终端设备
CN107993143A (zh) 一种信贷风险评估方法及系统
US20020040336A1 (en) System and method for stock options market management
CN111401777A (zh) 企业风险的评估方法、装置、终端设备及存储介质
CN110991936A (zh) 企业评分评级方法、装置、设备及介质
CN110796539A (zh) 一种征信评估方法及装置
WO2012156426A1 (en) Method for calculation of time weighted returns for private equity
CN109767333A (zh) 选基方法、装置、电子设备及计算机可读存储介质
Devolder et al. Iterated VaR or CTE measures: A false good idea?
CN110147813B (zh) 一种用户画像构建方法、装置、存储介质和服务器
Van den Broek et al. Cointegration-based pairs trading framework with application to the cryptocurrency market
CN111695077A (zh) 资产信息推送方法、终端设备及可读存储介质
CN114707733A (zh) 风险指标的预测方法、装置、电子设备及存储介质
Takahashi et al. Generating a target payoff distribution with the cheapest dynamic portfolio: an application to hedge fund replication
CN110008264B (zh) 成本核算系统的数据采集方法和装置
CN112487209A (zh) 基于知识图谱的串标行为分析方法、终端设备及存储介质
CN113870010A (zh) 基于机器学习的数据处理方法、装置、设备及存储介质
CN112465564A (zh) 一种供应商推荐方法、装置、终端
CN112529628A (zh) 客户标签的生成方法、装置、计算机设备及存储介质
CN111861560A (zh) 一种企业估值方法、装置、存储介质及计算机设备
CN114022228B (zh) 一种经济信息数据处理方法、系统、计算机设备及存储介质
CN114155038B (zh) 受疫情影响用户识别方法
Radikoko Testing The Random Walk (Rw) Behaviour of Botswana’s Equity Returns
Elaut et al. Duration dependence, behavioral restrictions, and the market timing ability of commodity trading advisors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant