CN109783471A - 企业画像小程序化方法、装置、计算机设备及存储介质 - Google Patents

企业画像小程序化方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109783471A
CN109783471A CN201811533664.9A CN201811533664A CN109783471A CN 109783471 A CN109783471 A CN 109783471A CN 201811533664 A CN201811533664 A CN 201811533664A CN 109783471 A CN109783471 A CN 109783471A
Authority
CN
China
Prior art keywords
enterprise
portrait
business data
small routine
searching keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811533664.9A
Other languages
English (en)
Inventor
刘军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Financial Technology Co Ltd Shanghai
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Priority to CN201811533664.9A priority Critical patent/CN109783471A/zh
Publication of CN109783471A publication Critical patent/CN109783471A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据分析领域,尤其涉及一种企业画像小程序化方法、装置、计算机设备及存储介质。企业画像小程序化方法包括:获取现有的各企业数据后建立数据库;获取用户输入的查询请求;根据所述查询请求从所述数据库中搜索对应的企业数据;根据所述企业数据建立对应的企业画像,并通过企业画像小程序端口展示所述企业画像。本发明通过将生成的企业画像通过企业画像小程序进行展示,无需下载客户端,直接输入企业名称或注册号即可生成企业画像,从微信小程序端口更易于传播。

Description

企业画像小程序化方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据分析领域,具体涉及企业画像小程序化方法、装置、计算机设备及存储介质。
背景技术
企业画像即企业形象和声誉,在互联网上以碎片化方式呈现,所述企业画像指从全媒体海量数据中获得企业在网民中的认知度,绘制出全面的企业网络形象,建立企业的画像。如同个人用户画像的数据来源较为多元和丰富,所述数据来源包括电商交易的数据、社交类的数据、网络行为的数据等,通过这些数据对个人描述的用户画像,其目标是更为精准,企业画像有类似之处,企业亦有自己的社会身份,相关行业会获得企业丰富的大数据,既有传统的关于财务信息的来源、也有从社交媒体上获得企业的信息、采购的信息、公用事业的信息、物流信息和供应链方面的信息等等,利用这些方面的信息对企业进行画像,亦会综合各个数据源的能力和跨语言处理信息的能力对企业的身份进行识别。目前常用的企业画像方法是基于标签的企业定性画像以及基于一特定领域的模型画像,基于标签的企业画像是从大量数据中获取企业特征词库,通过预先构建的领域知识库进行特征词扩展,获取企业画像标签;基于某一特征领域的模型画像是针对企业信用、企业风险等特定领域建立风险指标,并确定不同指标的权重参数,建立企业评价等级,生成企业画像。
目前市场上用于分析企业画像的小工具很少,没有形成完整的企业画像系统,大部分企业的形象数据在互联网上仍然以碎片化方式存在;大部分企业不愿意去下载客户端去生成企业画像报告,下载了客户端的企业也不愿意在客户端端录入太多企业敏感信息,造成生成了的企业画像不全面,故而所述企业画像在客户端进行营销推广。
发明内容
基于此,有必要针对目前市场上缺乏分析企业画像的小工具,缺乏完整的企业画像系统等问题,提供一种企业画像小程序化方法、装置、计算机设备及存储介质。
一种企业画像小程序化方法,所述企业画像小程序化方法,包括如下步骤:
获取现有的各企业数据后建立数据库;
获取用户输入的查询请求;
根据所述查询请求从所述数据库中搜索对应的企业数据;
根据所述企业数据建立对应的企业画像,并通过企业画像小程序端口展示所述企业画像。
在一个实施例中,所述获取现有的各企业数据后建立数据库,包括:
利用网络爬虫从现有各平台中爬取企业数据,所述企业数据包括企业名称、企业股东、企业对外投资、企业历史变更、企业行业数据、与企业相关的网络文本;
根据所述企业数据,提取企业的特征词,根据所述企业数据和所述特征词生成对应的数据报告;
将所述数据报告进行存储后建立所述数据库。
在一个实施例中,所述获取用户输入的查询请求,包括:
在微信客户端设置企业画像小程序,所述企业画像小程序包括注册界面、登陆界面、输入界面和展示界面;
在用户完成所述注册界面和所述登陆界面的操作后,从所述输入界面中获取用户输入的查询请求,并取所述查询请求中包含的查询关键词。
在一个实施例中,所述根据所述查询请求从所述数据库中搜索对应的企业数据,包括:
提取用户输入的所述查询请求中包含的查询关键词;
根据所述查询关键词,从所述数据库中搜索与所述查询关键词对应或相近的企业数据,若所述数据库中存在所述查询关键词对应的所述企业数据,则根据所述企业数据对应的数据报告建立对应的企业画像后反馈至用户;
若所述数据库中不存在与所述查询关键词对应的所述企业数据,但存在与所述查询关键词相近的所述企业数据时,则计算所述查询关键词与其相近的所述企业数据之间的相似度;
再将所述相似度与预设的相似度阈值进行比较,当所述相似度高于所述相似度阈值时,则根据其相近的所述企业数据对应的所述数据报告建立企业画像并反馈至用户,当所述相似度低于所述相似度阈值时,则不反馈企业画像给用户。
在一个实施例中,所述若所述数据库中不存在与所述查询关键词对应的所述企业数据,但存在与所述查询关键词相近的所述企业数据时,则计算所述查询关键词与其相近的所述企业数据之间的相似度,包括:
计算所述查询请求中的查询关键词的长度、与所述查询请求相近的所述企业数据中的企业名称的长度、所述查询关键词与所述企业名称重合的长度;
根据所述查询关键词的长度、所述企业名称的长度、所述查询关键词与所述企业名称重合的长度,根据公式(1)计算所述查询请求与所述企业数据间的相似度;
公式(1)中n表示相似度,a表示所述查询关键词的长度,b表示所述企业名称的长度,a∩b表示所述查询关键词和所述企业名称重合的长度,a∪b表示所述查询关键词中与所述企业名称不重合部分的长度、所述企业名称中与所述查询关键词不重复部分的长度、所述查询关键词与所述企业名称重合部分的长度之和。
在一个实施例中,所述根据所述企业数据建立对应的企业画像,并通过企业画像小程序端口展示所述企业画像,包括:
根据所述企业数据对应的数据报告,通过回归模型建立企业画像后将所述企业画像存储于所述数据库中;
从所述数据库中提取所述企业画像后传送至企业画像小程序中的展示界面中进行展示。
在一个实施例中,所述根据所述企业数据对应的数据报告,通过回归模型建立企业画像后将所述企业画像存储于所述数据库中,包括:
根据所述回归模型建立企业画像,所述回归模型的公式如下:
公式(2)中,因变量Y=(y0,...,ym)T表示所述企业数据中的企业的特征词概率,yi∈[0,1],m表示所述企业的特征词的个数,自变量X=(x0,...,xn)T表示目标企业相关网络文本的主体分布概率,xi∈[0,1],n表示主体的个数,ωi T表示回归系数矩阵,ω0 T表示残差矩阵。
基于相同的构思,本申请还提供了一种企业画像小程序化装置,所述企业画像小程序化装置包括:
建立模块,设置为获取现有的各企业数据后建立数据库;
获取模块,设置为获取用户输入的查询请求;
搜索模块,设置为根据所述查询请求从所述数据库中搜索对应的企业数据;
展示模块,设置为根据所述企业数据建立对应的企业画像,并通过企业画像小程序端口展示所述企业画像。
基于相同的技术构思,本申请实施例还提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行上述企业画像小程序化方法的步骤。
基于相同的技术构思,本申请实施例还提供了一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个所述处理器执行如上述企业画像小程序化方法的步骤。
上述企业画像小程序化方法、装置、计算机设备及存储介质,通过获取现有的各企业数据后建立数据库;获取用户输入的查询请求;根据所述查询请求从所述数据库中搜索对应的企业数据;根据所述企业数据建立对应的企业画像,并通过企业画像小程序端口展示所述企业画像。因此,将生成的企业画像通过企业画像小程序进行展示,无需下载客户端,直接输入企业名称或注册号即可生成企业画像,从微信小程序端口更易于传播。
附图说明
图1为申请在一个实施例中企业画像小程序化方法的流程图;
图2为申请在一个实施例中建立数据库的流程图;
图3为申请在一个实施例中搜索数据的流程图;
图4为申请在一个实施例中企业画像小程序化装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为本申请在一个实施例中提供的企业画像小程序化方法的流程图,如图所示,包括:
S1、获取现有的各企业数据后建立数据库;
本步骤中通过从现有平台中获取各企业数据,并根据获取到的所示企业数据生成对应的数据报告,将所示数据报告进行存储后建立数据库。
S2、获取用户输入的查询请求;
本步骤中通过在微信客户端设置企业画像小程序,通过所述企业画像小程序获取用户的查询请求,比如用户A需要获得企业B的企业画像,用户A在所述企业画像小程序中输入企业B的企业名称或者企业代码等查询请求。
S3、根据所述查询请求从所述数据库中搜索对应的企业数据;
本步骤中根据用户输入的查询请求中的关键词,从所述数据库中搜索对应的所述企业数据,若所述数据库中存在所述所述查询请求对应的所述企业数据,则生成对应的企业画像;若所述数据库中存在与所述查询请求相近的所述企业数据,则计算所述查询请求与所述企业数据间的相似度,再将所述相似度与阈值进行比较,当所述相似度高于所述阈值时,则生成对应的所述企业画像,当所述相似度低于所述阈值时,则不生成所述企业画像。
S4、根据所述企业数据建立对应的企业画像,并通过企业画像小程序端口展示所述企业画像;
本步骤中根据获取到的所述企业数据,通过回归模型建立对应的所述企业画像,在通过所述企业画像小程序将所述企业画像进行展示。
本实施例通过获取各平台的企业数据后建立数据库,并通过回归模型根据所述企业数据建立对应的企业画像,将所述企业画像通过设置在微信客户端的企业画像小程序端口进行展示,从而无需下载客户端,使得企业画像的获取过程更加简单方便,更加易于企业画像的传播。
图2为申请在一个实施例中提供的建立数据库的流程图,如图所示,包括:
S101、利用网络爬虫从现有各平台中爬取企业数据,所述企业数据包括企业名称、企业股东、企业对外投资、企业历史变更、企业行业数据、与企业相关的网络文本;
本步骤中通过网络爬虫从各平台爬取企业数据,比如从前海征信、启信宝及其它网络平台中获取所述企业数据。
S102、根据所述企业数据,提取企业的特征词,根据所述企业数据和所述特征词生成对应的数据报告;
本步骤中将获取到的企业数据进行整合,比如从多个平台均获取了企业B的部分数据信息,则将企业B的所有的数据信息整合到企业B所在的节点中,再根据企业B的所有数据信息提取企业B的特征词,根据企业B的所述企业数据和所述特征词生成企业B的数据报告。
S103、将所述数据报告进行存储后建立所述数据库;
本步骤将各企业的所述数据报告进行分类存储比并建立数据库,比如企业B和企业C均属于通信行业,则将企业B和企业C的所述数据报告存储于所述数据库中的通信行业分类中。
本实施例从各平台通过网络爬取企业数据,并将所述企业数据进行初步整合生成数据报告,将所述数据报告进行存储后建立数据库,为后续根据用户的查询请求搜索对应的所述企业数据提供了基础。
在一个实施例中,所述获取用户输入的查询请求,包括:
在微信客户端设置企业画像小程序,所述企业画像小程序包括注册界面、登陆界面、输入界面和展示界面;
本步骤中根据微信小程序的设置过程在微信客户端设置企业画像小程序,所述企业画像小程序中的注册界面、登陆界面只在用户首次使用的时候出现,在用户首次使用以后,当用户进入所述企业画像小程序以后,直接进入输入界面。
在用户完成所述注册界面和所述登陆界面的操作后,从所述输入界面中获取用户输入的查询请求,并提取所述查询请求中包含的查询关键词;
本步骤中获取用户在输入界面输入的查询请求,根据所述查询请求提取其中的查询关键词,比如用户在企业画像小程序的前台中输入查询请求D,后台则从前台中获取该查询请求D后并提取该查询请求D中所包含的查询关键词。
本实施例中通过提取用户输入的查询请求中的关键词,为后续从数据库中搜索到对应的企业数据提供了基础,根据关键词能够更加快速的匹配到对应的企业数据。
图3为本申请在一个实施例中提供的搜索数据的流程图,如图所示,包括:
S301、提取用户输入的所述查询请求中包含的查询关键词;
本步骤中根据用户输入的所述查询请求提取其查询关键词,比如所述查询请求为“中国移动有限公司上海分公司松江大学城网点”,则提取其关键词为“通信行业-移动-上海-松江大学城网点”。
S302、根据所述查询关键词,从所述数据库中搜索与所述查询关键词对应或相近的企业数据,若所述数据库中存在所述查询关键词对应的所述企业数据,则根据所述企业数据对应的数据报告建立对应的企业画像后反馈至用户;
本步骤中根据所述查询关键词从所述数据库中搜索对应的所述企业数据,比如所述查询关键词为“通信行业-移动-上海-松江大学城网点”,所述数据库中找到了对应的“通信行业-移动-上海-松江大学城网点”企业数据,则根据该“通信行业-移动-上海-松江大学城网点”企业数据生成对应的“通信行业-移动-上海-松江大学城网点”企业画像。
S303、若所述数据库中不存在与所述查询关键词对应的所述企业数据,但存在与所述查询关键词相近的所述企业数据时,则计算所述查询关键词与其相近的所述企业数据之间的相似度;
本步骤中若所述数据库中只存在与所述查询关键词相近的所述企业数据时,则计算所述查询关键词的相似度,比如所述查询关键词为“通信行业-移动-上海-松江大学城网点”,所述数据库中只存在“通信行业-移动-上海分公司”企业数据,则计算“通信行业-移动-上海-松江大学城网点”与“通信行业-移动-上海分公司”之间的相似度。
S304、再将所述相似度与预设的相似度阈值进行比较,当所述相似度高于所述相似度阈值时,则根据其相近的所述企业数据对应的所述数据报告建立企业画像并反馈至用户,当所述相似度低于所述相似度阈值时,则不反馈企业画像给用户;
本步骤中将所述查询关键词的相似度计算结果与阈值进行比较,只有当所述相似度高于所述阈值时,才根据其相近的所述企业数据生成对应的所述企业画像,比如查询请求E的相似度计算结果为0.7,查询请求F的相似度计算结果为0.3,阈值为0.5,则查询请求请求E可根据其相近的所述企业数据生成对应的所述企业画像,而查询请求F则不生成对应的所述企业画像。
本实施例通过提取所述查询请求中的所述查询关键词从所述数据库中搜索对应的所述企业数据,并根据所述企业数据生成所述企业画像,能够快速的生成所述查询请求的所述企业画像,也可根据所述查询请求推荐相近的企业的所述企业画像,给用户提供了更多的选择空间。
在一个实施例中,若所述数据库中不存在与所述查询关键词对应的所述企业数据,但存在与所述查询关键词相近的所述企业数据时,则计算所述查询关键词与其相近的所述企业数据之间的相似度,包括:
计算所述查询请求中的查询关键词的长度、与所述查询请求相近的所述企业数据中的企业名称的长度、所述查询关键词与所述企业名称重合的长度;
本步骤中根据配置的字符读取装置读取所述查询请求中的查询关键词的长度、所述企业数据中的企业名称的长度、以及所述查询关键词与所述企业名称重合的长度。
根据所述查询关键词的长度、所述企业名称的长度、所述查询关键词与所述企业名称重合的长度,根据公式(1)计算所述查询请求与所述企业数据间的相似度;
公式(1)中n表示相似度,a表示所述查询关键词的长度,b表示所述企业名称的长度,a∩b表示所述查询关键词和所述企业名称重合的长度,a∪b表示所述查询关键词中与所述企业名称不重合部分的长度、所述企业名称中与所述查询关键词不重复部分的长度、所述查询关键词与所述企业名称重合部分的长度之和;
本步骤中将读取到的所述查询关键词的长度、所述企业名称的长度、以及前两者重合部分的长度代入公式中计算所述查询请求的相似度。
本实施例通过计算所述查询请求的相似度,为后续是否需要生成所述查询请求的所述企业画像提供依据。
在一个实施例中,所述根据所述企业数据建立对应的企业画像,并通过企业画像小程序端口展示所述企业画像,包括:
根据所述企业数据对应的数据报告,通过回归模型建立企业画像后将所述企业画像存储于所述数据库中;
本步骤中对于可生成所述企业画像的所述企业数据,从所述数据库中获取所述企业数据对应的所述数据报告,在通过回归模型根据所述数据报告生成所述企业画像,并将所述企业画像存储于所述数据库中。
从所述数据库中提取所述企业画像后传送至企业画像小程序中的展示界面中进行展示;
本步骤中当获取到用户的查询所述企业画像的指令时,即从所述数据库中提取所述企业画像,并将所述企业画像传送至所述企业画像小程序中进行展示。
本实施例中通过所述企业画像小程序展示所述企业画像,简化了用户获取所述企业画像的流程,还可以通过转发二维码或者链接的方式将所述企业画像在朋友圈进行分享,更加利于所述企业画像的传播。
在一个实施例中,所述根据所述企业数据对应的数据报告,通过回归模型建立企业画像后将所述企业画像存储于所述数据库中,包括:
根据所述回归模型建立企业画像,所述回归模型的公式如下:
公式(2)中,因变量Y=(y0,...,ym)T表示所述企业数据中的企业的特征词概率,yi∈[0,1],m表示所述企业的特征词的个数,自变量X=(x0,...,xn)T表示目标企业相关网络文本的主体分布概率,xi∈[0,1],n表示主体的个数,ωi T表示回归系数矩阵,ω0 T表示残差矩阵;
本步骤中的回归系数矩阵和残差矩阵通过最小二乘方法进行估计,比如,设a1,a2,...,am分别为b1,b2,...,bm的最小二乘估计值,则ωi T=a0+a1xk1+a2xk2+...+amxkmo T,k=1,2,...,n。
本实施例中通过回归模型建立所述企业画像,对所述企业画像的分析更加准确。
基于相同的构思,本申请还提供了一种企业画像小程序化装置,如图4所示,所述企业画像小程序化装置包括建立模块、获取模块、搜索模块和展示模块,其中:建立模块,设置为获取现有的各企业数据后建立数据库;获取模块,设置为获取用户输入的查询请求;搜索模块,设置为根据所述查询请求从所述数据库中搜索对应的企业数据;展示模块,设置为根据所述企业数据建立对应的企业画像,并通过企业画像小程序端口展示所述企业画像。
在一个实施例中,所述建立模块包括:
爬取单元,设置为利用网络爬虫从现有各平台中爬取企业数据,所述企业数据包括企业名称、企业股东、企业对外投资、企业历史变更、企业行业数据、与企业相关的网络文本;
提取单元,设置为根据所述企业数据,提取企业的特征词,根据所述企业数据和所述特征词生成对应的数据报告;
建立数据库单元,设置为将所述数据报告进行存储后建立所述数据库。
在一个实施例中,所述获取模块包括:
设置单元,设置为在微信客户端设置企业画像小程序,所述企业画像小程序包括注册界面、登陆界面、输入界面和展示界面;
输入单元,设置为在用户完成所述注册界面和所述登陆界面的操作后,从所述输入界面中获取用户输入的查询请求,并提取所述查询请求中包含的查询关键词。
在一个实施例中,所述搜索模块包括:
提取关键词单元,设置为提取用户输入的所述查询请求中包含的查询关键词;
搜索数据单元,设置为根据所述查询关键词,从所述数据库中搜索与所述查询关键词对应或相近的企业数据,若所述数据库中存在所述查询关键词对应的所述企业数据,则根据所述企业数据对应的数据报告建立对应的企业画像后反馈至用户;
计算单元,设置为若所述数据库中不存在与所述查询关键词对应的所述企业数据,但存在与所述查询关键词相近的所述企业数据时,则计算所述查询关键词与其相近的所述企业数据之间的相似度;
比较单元,设置为再将所述相似度与预设的相似度阈值进行比较,当所述相似度高于所述相似度阈值时,则根据其相近的所述企业数据对应的所述数据报告建立企业画像并反馈至用户,当所述相似度低于所述相似度阈值时,则不反馈企业画像给用户。
在一个实施例中,所述计算单元包括:
计算长度单元,设置为计算所述查询请求中的查询关键词的长度、与所述查询请求相近的所述企业数据中的企业名称的长度、所述查询关键词与所述企业名称重合的长度;
计算相似度单元,设置为根据所述查询关键词的长度、所述企业名称的长度、所述查询关键词与所述企业名称重合的长度,根据公式(1)计算所述查询请求与所述企业数据间的相似度;
公式(1)中n表示相似度,a表示所述查询关键词的长度,b表示所述企业名称的长度,a∩b表示所述查询关键词和所述企业名称重合的长度,a∪b表示所述查询关键词中与所述企业名称不重合部分的长度、所述企业名称中与所述查询关键词不重复部分的长度、所述查询关键词与所述企业名称重合部分的长度之和。
在一个实施例中,所述展示模块包括:
建立单元,设置为根据所述企业数据对应的数据报告,通过回归模型建立企业画像后将所述企业画像存储于所述数据库中;
展示单元,设置为从所述数据库中提取所述企业画像后传送至企业画像小程序中的展示界面中进行展示。
在一个实施例中,所述建立单元包括:
建立画像单元,设置为根据所述回归模型建立企业画像,所述回归模型的公式如下:
公式(2)中,因变量Y=(y0,...,ym)T表示所述企业数据中的企业的特征词概率,yi∈[0,1],m表示所述企业的特征词的个数,自变量X=(x0,...,xn)T表示目标企业相关网络文本的主体分布概率,xi∈[0,1],n表示主体的个数,ωi T表示回归系数矩阵,ω0 T表示残差矩阵。
基于相同的技术构思,本申请实施例还提供一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时,使得一个或多个所述处理器执行计算机可读指令时实现上述各实施例中的企业画像小程序化方法的步骤。
基于相同的技术构思,本申请实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个所述处理器执行所述计算机可读指令时实现上述各实施例中的企业画像小程序化方法的步骤。其中,所述存储介质可以为非易失性存储介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明一些示例性实施例,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种企业画像小程序化方法,其特征在于,所述企业画像小程序化方法,包括:
获取现有的各企业数据后建立数据库;
获取用户输入的查询请求;
根据所述查询请求从所述数据库中搜索对应的企业数据;
根据所述企业数据建立对应的企业画像,并通过企业画像小程序端口展示所述企业画像。
2.如权利要求1所述的一种企业画像小程序方法,其特征在于,所述获取现有的各企业数据后建立数据库,包括:
利用网络爬虫从现有各平台中爬取企业数据,所述企业数据包括企业名称、企业股东、企业对外投资、企业历史变更、企业行业数据、与企业相关的网络文本;
根据所述企业数据,提取企业的特征词,根据所述企业数据和所述特征词生成对应的数据报告;
将所述数据报告进行存储后建立所述数据库。
3.如权利要求1所述的一种企业画像小程序化方法,其特征在于,所述获取用户输入的查询请求,包括:
在微信客户端设置企业画像小程序,所述企业画像小程序包括注册界面、登陆界面、输入界面和展示界面;
在用户完成所述注册界面和所述登陆界面的操作后,从所述输入界面中获取用户输入的查询请求,并提取所述查询请求中包含的查询关键词。
4.如权利要求1所述的一种企业画像小程序化方法,其特征在于,所述根据所述查询请求从所述数据库中搜索对应的企业数据,包括:
提取用户输入的所述查询请求中包含的查询关键词;
根据所述查询关键词,从所述数据库中搜索与所述查询关键词对应或相近的企业数据,若所述数据库中存在所述查询关键词对应的所述企业数据,则根据所述企业数据对应的数据报告建立对应的企业画像后反馈至用户;
若所述数据库中不存在与所述查询关键词对应的所述企业数据,但存在与所述查询关键词相近的所述企业数据时,则计算所述查询关键词与其相近的所述企业数据之间的相似度;
再将所述相似度与预设的相似度阈值进行比较,当所述相似度高于所述相似度阈值时,则根据其相近的所述企业数据对应的所述数据报告建立企业画像并反馈至用户,当所述相似度低于所述相似度阈值时,则不反馈企业画像给用户。
5.如权利要求4所述的一种企业画像小程序化方法,其特征在于,所述若所述数据库中不存在与所述查询关键词对应的所述企业数据,但存在与所述查询关键词相近的所述企业数据时,则计算所述查询关键词与其相近的所述企业数据之间的相似度,包括:
计算所述查询请求中的查询关键词的长度、与所述查询请求相近的所述企业数据中的企业名称的长度、所述查询关键词与所述企业名称重合的长度;
根据所述查询关键词的长度、所述企业名称的长度、所述查询关键词与所述企业名称重合的长度,根据公式(1)计算所述查询请求与所述企业数据间的相似度;
公式(1)中n表示相似度,a表示所述查询关键词的长度,b表示所述企业名称的长度,a∩b表示所述查询关键词和所述企业名称重合的长度,a∪b表示所述查询关键词中与所述企业名称不重合部分的长度、所述企业名称中与所述查询关键词不重复部分的长度、所述查询关键词与所述企业名称重合部分的长度之和。
6.如权利要求2所述的一种企业画像小程序化方法,其特征在于,所述根据所述企业数据建立对应的企业画像,并通过企业画像小程序端口展示所述企业画像,包括:
根据所述企业数据对应的数据报告,通过回归模型建立企业画像后将所述企业画像存储于所述数据库中;
从所述数据库中提取所述企业画像后传送至企业画像小程序中的展示界面中进行展示。
7.如权利要求6所述的一种企业画像小程序化方法,其特征在于,所述根据所述企业数据对应的数据报告,通过回归模型建立企业画像后将所述企业画像存储于所述数据库中,包括:
根据所述回归模型建立企业画像,所述回归模型的公式如下:
公式(2)中,因变量Y=(y0,...,ym)T表示所述企业数据中的企业的特征词概率,yi∈[0,1],m表示所述企业的特征词的个数,自变量X=(x0,...,xn)T表示目标企业相关网络文本的主体分布概率,xi∈[0,1],n表示主体的个数,ωi T表示回归系数矩阵,ω0 T表示残差矩阵。
8.一种企业画像小程序化装置,其特征在于,所述企业画像小程序化装置包括:
建立模块,设置为获取现有的各企业数据后建立数据库;
获取模块,设置为获取用户输入的查询请求;
搜索模块,设置为根据所述查询请求从所述数据库中搜索对应的企业数据;
展示模块,设置为根据所述企业数据建立对应的企业画像,并通过企业画像小程序端口展示所述企业画像。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述企业画像小程序化方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述企业画像小程序化方法的步骤。
CN201811533664.9A 2018-12-14 2018-12-14 企业画像小程序化方法、装置、计算机设备及存储介质 Pending CN109783471A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811533664.9A CN109783471A (zh) 2018-12-14 2018-12-14 企业画像小程序化方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811533664.9A CN109783471A (zh) 2018-12-14 2018-12-14 企业画像小程序化方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN109783471A true CN109783471A (zh) 2019-05-21

Family

ID=66496973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811533664.9A Pending CN109783471A (zh) 2018-12-14 2018-12-14 企业画像小程序化方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109783471A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110278245A (zh) * 2019-05-23 2019-09-24 平安科技(深圳)有限公司 基于区块链的app消息共享方法、系统、装置及存储介质
CN111400591A (zh) * 2020-03-11 2020-07-10 腾讯科技(北京)有限公司 资讯信息推荐方法、装置、电子设备及存储介质
CN112818203A (zh) * 2021-01-07 2021-05-18 合肥新青罗数字技术有限公司 企业画像大数据分析的方法与系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110278245A (zh) * 2019-05-23 2019-09-24 平安科技(深圳)有限公司 基于区块链的app消息共享方法、系统、装置及存储介质
CN111400591A (zh) * 2020-03-11 2020-07-10 腾讯科技(北京)有限公司 资讯信息推荐方法、装置、电子设备及存储介质
CN111400591B (zh) * 2020-03-11 2023-04-07 深圳市雅阅科技有限公司 资讯信息推荐方法、装置、电子设备及存储介质
CN112818203A (zh) * 2021-01-07 2021-05-18 合肥新青罗数字技术有限公司 企业画像大数据分析的方法与系统

Similar Documents

Publication Publication Date Title
US8719179B2 (en) Recruiting service graphical user interface
US20090198746A1 (en) Generating anonymous log entries
CN109685355A (zh) 企业风险识别方法、装置和计算机可读存储介质
WO2021114454A1 (zh) 一种检测爬虫请求的方法和装置
CN102456057B (zh) 基于网上交易平台的检索方法、装置和服务器
CN109783471A (zh) 企业画像小程序化方法、装置、计算机设备及存储介质
CN110597962A (zh) 搜索结果展示方法、装置、介质及电子设备
US10719529B2 (en) Presenting a trusted tag cloud
Tang et al. Spatial task assignment based on information gain in crowdsourcing
CN108710664A (zh) 一种热词分析方法、计算机可读存储介质及终端设备
CN112487212A (zh) 领域知识图谱的构建方法及装置
CN113254630A (zh) 一种面向全球综合观测成果的领域知识图谱推荐方法
CN107330010B (zh) 一种基于机器学习的后台路径爆破方法
CN105589916B (zh) 显式和隐式兴趣知识的提取方法
CN115510249A (zh) 一种知识图谱的构建方法及装置、电子设备、存储介质
CN117786088A (zh) 一种威胁的语言模型分析方法、装置、介质及电子设备
WO2022125096A1 (en) Method and system for resume data extraction
CN115599345A (zh) 一种基于知识图谱的应用安全需求分析推荐方法
CN114363002B (zh) 一种网络攻击关系图的生成方法及装置
CN115859273A (zh) 一种数据库异常访问的检测方法、装置、设备及存储介质
CN109962907B (zh) 基于大数据的用户身份识别方法及终端设备
Bhattacharyya et al. Cloud computing for suitable data management and security within organisations
US20200327110A1 (en) Method and System for Interactive Search Indexing
US20190304040A1 (en) System and Method for Vetting Potential Jurors
KR20200141571A (ko) 블록체인 기반의 경찰 인력 통합인사관리 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination