CN116383406A - 企业画像的生成方法、计算机设备及计算机可读存储介质 - Google Patents
企业画像的生成方法、计算机设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN116383406A CN116383406A CN202310288306.0A CN202310288306A CN116383406A CN 116383406 A CN116383406 A CN 116383406A CN 202310288306 A CN202310288306 A CN 202310288306A CN 116383406 A CN116383406 A CN 116383406A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- information
- entities
- generating
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000004590 computer program Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000001172 regenerating effect Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 11
- 238000005065 mining Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 2
- 239000013598 vector Substances 0.000 description 7
- 238000000605 extraction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种企业画像的生成方法、计算机设备及计算机可读存储介质,涉及数据处理技术领域,方法包括获取目标企业信息;根据所述目标企业信息确定所述目标企业信息的实体及全部实体之间的关联关系;识别各实体对应的语种并对识别到的语种进行标识,得到标识信息;根据全部实体、所述关联关系和所述标识信息生成企业知识图谱;根据所述企业知识图谱生成与所述目标企业信息对应的企业画像。本发明能够基于指示图谱对企业进行多维度精准分析,得到精准且符合企业自身需求的企业画像,便于企业进行商机挖掘和线索分析。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种企业画像的生成方法、计算机设备及计算机可读存储介质。
背景技术
随着贸易自由化日趋加深,在经济全球化背景下,国际竞争日趋激烈,国际企业之间的贸易越来越多,国际企业贸易信息面临语言、地区及信息分散等诸多因素的影响,不同企业间难以进行深入了解,需要企业花费大量的时间和精力进行信息反复收集和比对分析。
目前有针对国际贸易企业数据或交易情况等信息进行挖掘,或结合企业的客户关系管理(Customer Relationship Management,简称CRM)系统的方式形成贸易企业画像,均注重企业自身信息的展示,随着企业贸易商品和进出口类型不断的多元化,现有的贸易企业画像自身展示信息过于繁杂,甚至将直接导致企业错过潜在商机。
发明内容
有鉴于此,本申请的目的之一在于提供一种企业画像的生成方法、计算机设备及计算机可读存储介质,能够至少解决上述部分技术问题。
第一方面,本申请实施例提供了一种企业画像的生成方法,所述方法包括:
获取目标企业信息;
根据所述目标企业信息确定所述目标企业信息的实体及全部实体之间的关联关系;
识别各实体对应的语种并对识别到的语种进行标识,得到标识信息;
根据全部实体、所述关联关系和所述标识信息生成企业知识图谱;
根据所述企业知识图谱生成与所述目标企业信息对应的企业画像。
在一种可能的实施方式中,所述获取目标企业信息,包括:
获取不同信息源的初始企业信息,所述初始企业信息包括至少两种初始信息项;
根据至少两种所述初始信息项形成初始企业信息集,并基于所述初始企业信息集确定所述目标企业信息。
在一种可能的实施方式中,所述根据所述目标企业信息确定所述目标企业信息的实体及全部实体之间的关联关系之后,所述方法还包括:
为不同实体分别设置权重;
所述根据全部实体、所述关联关系和所述标识信息生成企业知识图谱,包括:
根据全部实体、各个实体对应的权重、所述关联关系和所述标识信息生成企业知识图谱。
在一种可能的实施方式中,所述为不同实体分别设置权重之后,所述方法还包括:
获取各个实体的信息源并计算各个实体的相似度;
将第一实体的权重增加第一数值,所述第一实体为所述信息源不同且内容的相似度在第一预设相似度范围内的实体;
将第二实体的权重增加第二数值,所述第二实体为经翻译为预设语种后内容的相似度在第二预设相似度范围内的实体。
在一种可能的实施方式中,所述根据全部实体、各个实体对应的权重、所述关联关系和所述标识信息生成企业知识图谱,包括:
将全部实体、各个实体对应的权重和所述标识信息存入图数据库,得到图节点;
将所述关联关系存入图数据库,得到关系边;
根据所述图节点和所述关系边确定所述企业知识图谱。
在一种可能的实施方式中,所述根据所述图节点和所述关系边确定所述企业知识图谱之后,所述方法还包括:
按预设时间间隔更新所述图数据库;
基于更新后的数据库对应新的图节点和新的关系边重新生成所述企业知识图谱。
在一种可能的实施方式中,所述根据所述企业知识图谱生成与所述目标企业信息对应的企业画像之后,所述方法还包括:
获取第一用户对应的第一企业信息,所述第一企业信息包括至少两个第一信息项;
在检测全部实体的标识信息和预设标识相同的情况下,根据预设计算规则计算全部实体和全部所述第一信息项之间的第一相似度;
根据第三实体所在的企业知识图谱生成第一企业画像,其中,所述第三实体为大于或等于预设相似度的第一相似度对应的实体。
在一种可能的实施方式中,所述根据所述企业知识图谱生成与所述目标企业信息对应的企业画像之后,所述方法还包括:
获取所述第一企业信息中各第一信息项的展示权限优先级;
根据所述展示权限优先级和大于或等于所述预设相似度的第一相似度确定所述第三实体,并根据所述第三实体所在的企业知识图谱生成所述第一企业画像。
第三方面,本申请实施例提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述计算机程序在被所述处理器执行时,实现第一方面提供的企业画像的生成方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被一个或多个处理器执行时,实现第一方面提供的企业画像的生成方法。
本申请实施例提供的企业画像的生成方法,通过获取目标企业信息,并根据目标企业信息确定目标企业信息的实体及全部实体之间的关联关系,接着识别各实体对应的语种并对识别到的语种进行标识,得到标识信息,然后根据全部实体、关联关系和标识信息生成企业知识图谱,最后根据企业知识图谱生成与目标企业信息对应的企业画像,能够基于指示图谱对企业进行多维度精准分析,得到精准且符合企业自身需求的企业画像,便于企业进行商机挖掘和线索分析。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,应当理解,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种企业画像的生成方法的方法流程图;
图2为本申请实施例提供的一种计算机设备内部结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
再本申请的各种实施例汇总,表述“或”或“A或/和B中的至少一个”包括同时列出的文字的任何组合或所有组合。例如,表述“A或B”或“A或/和B中的至少一个”可包括A、可包括B或可包括A和B二者。
在本申请的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
请参见图1,图1为本申请实施例提供的一种企业画像的生成方法流程图,以下将对该方法的各个步骤进行详细阐述。
S110,获取目标企业信息。
本实施例中的目标企业信息可以是国外的外贸企业信息,也可以包括国内的进出口外贸企业信息。一般情况下,企业信息内容越多,企业信息覆盖面越广,可以对企业分析的越准确和全面,可选的,目标企业信息还可以包括国内的其他一般的非外贸的企业信息,为便于描述,本实施例及下述实施例均用企业信息表示外贸企业信息和一般的非外贸的企业信息。本实施例可以通过下述实施例中的计算机设备来获取目标企业信息。
考虑到企业信息散步在互联网的各个平台,除企业自身官网外,往往在大众社交平台以及贸易交易平台上均会充斥着各种企业信息。
在一些实施例中,采集目标企业的名称或其他可以表示目标企业的标识,通过名称或其他的标识对目标企业的官网信息、社交平台账号、外贸交易平台、海外海关公开信息进行收集。其中,其他可以表示目标企业的标识包括公司别称、公司标志图形或统一社会信用代码中的至少一种,本实施例可以通过上述目标企业的标识在互联网上快速获取目标企业的相关信息。
在一些实施例中,在获取各网页或平台授权许可的情况下,可以基于常规的爬虫技术获取目标企业的相关信息。
可选的,获取目标企业信息,包括:
获取不同信息源的初始企业信息,初始企业信息包括至少两种初始信息项;
根据至少两种初始信息项形成初始企业信息集,并基于初始企业信息集确定目标企业信息。
本实施例中的不同信息源可以理解为上述实施例中的不同官网或其他社交平台,初始信息项包括企业名称或别称、企业简介、企业主营业务或产品、企业所在区域、企业规模、联系人信息如职位、邮箱和电话、企业规模、企业成立时间、进出口区域、海关进出口记录如时间、地区、贸易对象、贸易产品和贸易规模、展会信息如时间、地区和产品等以及各个初始信息项对应的信息源和信息更新时间。
具体的,各个初始信息项组成初始企业信息集,本实施例可以基于初始信息集对初始信息进行筛选得到目标企业信息,其中,对初始信息进行筛选可以是滤除掉隐私信息或重复信息,得到与目标企业关联性高的目标企业信息,基于目标企业信息可以对目标企业进行精准分析。
S120,根据目标企业信息确定目标企业信息的实体及全部实体之间的关联关系。
在本实施例中,可以对上述实施例中得到的目标企业信息进行信息抽取,确定目标企业信息的实体,以及各个实体之间的关联关系,具体的,可以通过通用信息抽取(Universal Information Extraction,简称UIE)算法对目标企业信息进行信息抽取。
具体的,实体可以是A公司、B公司或C公司等具体名称,关联关系可以表示三家公司的关系,如B公司和C公司均是A公司的子公司。
S130,识别各实体对应的语种并对识别到的语种进行标识,得到标识信息。
考虑到目标企业信息多为国际贸易企业信息的情况,企业信息存在多种语言,信息种类过于繁杂,本实施例可以对实体进行语种识别,并对识别后的实体进行标识,得到每个实体对应的标识信息,其中,标识信息用于基于对应本体的语种,标识信息包括纯阿拉伯数字、纯英文字母或阿拉伯数字与英文字母的组合中的至少一种,标识信息还可以用如中文等统一、规范的语言表示,具体可根据实际情况进行选择,本实施例在此不做限定。
具体的,本实施例中可以使用Optimaize公司开源的Language Detect数据库完成对实体语种的识别,识别准确率高。
S140,根据全部实体、关联关系和标识信息生成企业知识图谱。
在得到实体、各实体之间的关联关系后,本实施例可以将全部实体和标识信息存入节点,各个实体之间的关联关系形成边,根据多个节点和多条边生成上述实施例中的目标企业信息的企业知识图谱,对目标企业进行多维度可视化图形展示。
S150,根据企业知识图谱生成与目标企业信息对应的企业画像。
在本实施例中,在得到企业知识图谱之后可以根据实际的展示需求生成与目标企业对应的企业画像。
由上述分析可知,本申请实施例提供的企业画像的生成方法,通过获取目标企业信息,并根据目标企业信息确定目标企业信息的实体及全部实体之间的关联关系,接着识别各实体对应的语种并对识别到的语种进行标识,得到标识信息,然后根据全部实体、关联关系和标识信息生成企业知识图谱,最后根据企业知识图谱生成与目标企业信息对应的企业画像,能够基于指示图谱对企业进行多维度精准分析,得到精准且符合企业自身需求的企业画像,便于企业进行商机挖掘和线索分析。
上述实施例中的生成的企业知识图谱可以对目标企业的目标企业信息进行多维度精准展示,为进一步提高目标信息展示的精准性和实用性,在一种可能的实施方式中,根据目标企业信息确定目标企业信息的实体及全部实体之间的关联关系之后,所述方法还包括:
为不同实体分别设置权重;
根据全部实体、关联关系和标识信息生成企业知识图谱,包括:
根据全部实体、各个实体对应的权重、关联关系和标识信息生成企业知识图谱。
在本实施例中,可以通过根据实际的展示需求为不同实体设置权重,本实施例中的权重可以参与到生成企业知识图谱的过程中,示例性的,在企业知识图谱中,权重小的实体所在的节点可以作为权重大的实体的节点的子节点或后代节点。
上述实施例为不同实体设置权重可以是根据设定的检测条件,如检测并判断出部分实体和预设实体相同或相似,则设置该部分实体的权重较大一些,容易忽视目标企业信息的时效性,难以对需要用户关注又变化快的实体进行优先级展示。
在一种可能的实施方式中,为不同实体分别设置权重之后,所述方法还包括:
获取各个实体的信息源并计算各个实体的相似度;
将第一实体的权重增加第一数值,第一实体为信息源不同且内容的相似度在第一预设相似度范围内的实体;
将第二实体的权重增加第二数值,第二实体为经翻译为预设语种后内容的相似度在第二预设相似度范围内的实体。
在本实施例中,可以通过信息源和实体的具体内容判断出需要用户关注但同时又变化快的实体进行权重的叠加,提高对应实体的展示优先级,增强企业知识图谱、企业画像的时效性、可靠性和准确性。
具体的,若部分实体来自不同信息源,但相似度在第一预设相似度范围内,表明该部分实体较为重要,可以相应增加该部分实体对应的权重,相似度不在第一预设相似度范围内的实体按原来设置的权重在企业知识图谱中进行展示。
不同标识对应的实体指的是不同语种的实体,对于不同语种的实体,需要先翻译成统一语言如中文或英文,然后检测翻译后的内容的相似度,并增加翻译后的内容的相似度在第二预设相似度范围内的实体的权重,同样的,经同一翻译后,对于相似度不在第二预设相似度范围内的实体按原来设置的权重在企业知识图谱中进行展示。
其中,第一预设相似度范围和第二预设相似度范围可以设置相同,也可以根据实际需求设置为不同的相似度范围。本实施例中的相似度可以包括字、词、句和段落中的至少一种的重合度。
需要说明的是,在完成权重的设定之后,将各个实体的具体内容翻译为统一的、规范化的语言如中文,并对翻译后的内容进行存储。
可选的,根据全部实体、各个实体对应的权重、关联关系和标识信息生成企业知识图谱,包括:
将全部实体、各个实体对应的权重和标识信息存入图数据库,得到图节点;
将关联关系存入图数据库,得到关系边;
根据图节点和关系边确定企业知识图谱。
在明确实体、各实体的权重、各实体之间的关联关系之后,可以通过存储进图数据库的形式得到图节点和关系边,进而可根据图节点和关系边生成企业知识图谱。
在生成企业知识图谱后,仍需保证后续对企业知识图谱的更新,能够基于指示图谱对企业进行多维度精准分析基础上提高企业知识图谱的有效性和准确性。
在一种可能的实施方式中,根据图节点和关系边确定企业知识图谱之后,所述方法还包括:
按预设时间间隔更新图数据库;
基于更新后的数据库对应新的图节点和新的关系边重新生成企业知识图谱。
在本实施例中,设定预设时间间隔能够定时对图数据库进行更新,保证图数据库的有效性和准确性,进而保证了企业知识图谱的有效性和准确性。
在一种可能的实施方式中,根据企业知识图谱生成与目标企业信息对应的企业画像之后,所述方法还包括:
获取第一用户对应的第一企业信息,第一企业信息包括至少两个第一信息项;
在检测全部实体的标识信息和预设标识相同的情况下,根据预设计算规则计算全部实体和全部第一信息项之间的第一相似度;
根据第三实体所在的企业知识图谱生成第一企业画像,其中,第三实体为大于或等于预设相似度的第一相似度对应的实体。
本实施例中的第一用户可以理解为进行企业查看的用户,在获取第一用户对应的第一企业信息之前,计算机设备可以对第一用户的登录请求信息进行验证,并在验证通过后根据登录请求信息获取第一用户所在的企业信息,也即第一企业信息。
其中,第一企业信息包括企业进/出经营产品、经营行业、企业主要进/出口地区、支持进/出口货运方式、历史或典型贸易记录信、进/出口规模、进/出口地区、贸易对象企业规模或类型中的第一信息项的至少两种。
计算机设备在向第一用户展示企业画像之前,需要对被展示企业的各个实体和第一用户所在的第一企业的各个信息项做相关性判断,可以将相关性较高的实体对应的企业画像向第一用户展示,提高向第一用户展示的企业画像的精准性和可靠性。
本实施例中的预设计算规则可以是基于Word2vec模型确定词向量的计算方式,具体的,可以先根据Word2vec模型确定上述实施例中的经翻译后的各实体的第一类词向量,再根据Word2vec模型确定第一企业信息的各第一信息项的第二类词向量,再基于第一类词向量和第二类词向量计算第一用户的搜索词和与搜索词对应的扩展词的相似度,本实施例中的预设相似度和上述是实施例中的第一预设相似度范围、第二预设相似度范围不同。
在一些实施例中,计算第一用户的搜索词和与搜索词对应的扩展词的相似度为余弦相似度。
另外,上述实施例中的Word2vec模型可以基于产品百科信息和产品介绍文字进行训练得到,也可以是结合海量贸易产品介绍信息进行迁移训练得到。
本实施例能够通过计算上述实施例中的经翻译后的各实体的第一类词向量,及第一企业信息的各第一信息项的第二类词向量之间的相似度确定向第一用户展示的企业画像,如将相似度由高到低排序并向第一用户展示排名在前10的相似度对应第三实体所对应的企业画像,能够向第一用户展示符合第一用户实际需求的企业画像,实用性较高。
在一种可能的实施方式中,根据企业知识图谱生成与目标企业信息对应的企业画像之后,所述方法还包括:
获取第一企业信息中各第一信息项的展示权限优先级;
根据展示权限优先级和大于或等于预设相似度的第一相似度确定第三实体,并根据第三实体所在的企业知识图谱生成第一企业画像。
在本实施例中,第一企业信息中的全部第一信息项的展示权限优先级可以预先设定,根据上述实施例确定的相似度和本实施例获取的各第一信息项的展示权限优先级一定确定向第一用户展示的企业画像。
具体的,可以将上述实施例确定的各个相似度乘以对应第一信息项的展示权限优先级,并将乘积结果由大到小降序排列,向第一用户展示排在前10的乘积结果对应的实体所在的企业画像。本实施例通过引入各第一信息项的展示权限优先级,可以进一步提高向第一用户展示企业画像的精准性和实用性。
综上,本申请实施例提供的企业画像的生成方法,通过获取目标企业信息,并根据目标企业信息确定目标企业信息的实体及全部实体之间的关联关系,接着识别各实体对应的语种并对识别到的语种进行标识,得到标识信息,然后根据全部实体、关联关系和标识信息生成企业知识图谱,最后根据企业知识图谱生成与目标企业信息对应的企业画像,能够基于指示图谱对企业进行多维度精准分析,并且可以根据用户密切相关的第一信息项的展示权限优先级和第一信息项与实体之间的相似度,进一步确定向用户展示的企业画像,得到精准且符合企业自身需求的企业画像,便于企业进行商机挖掘和线索分析。
本申请还提供一种计算机设备,请参见图2,图2为本申请实施例提供的一种计算机设备内部结构图。其中,计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现上述实施例中应用于计算机设备的企业画像的生成方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行企业画像的生成方法方法。本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本申请实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如方法实施例中的企业画像的生成方法。
本申请提供的企业画像的生成方法、计算机设备和计算机可读存储介质,通过获取目标企业信息,并根据目标企业信息确定目标企业信息的实体及全部实体之间的关联关系,接着识别各实体对应的语种并对识别到的语种进行标识,得到标识信息,然后根据全部实体、关联关系和标识信息生成企业知识图谱,最后根据企业知识图谱生成与目标企业信息对应的企业画像,能够基于指示图谱对企业进行多维度精准分析,得到精准且符合企业自身需求的企业画像,便于企业进行商机挖掘和线索分析。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRA M)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRD RAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
Claims (10)
1.一种企业画像的生成方法,其特征在于,所述方法包括:
获取目标企业信息;
根据所述目标企业信息确定所述目标企业信息的实体及全部实体之间的关联关系;
识别各实体对应的语种并对识别到的语种进行标识,得到标识信息;
根据全部实体、所述关联关系和所述标识信息生成企业知识图谱;
根据所述企业知识图谱生成与所述目标企业信息对应的企业画像。
2.如权利要求1所述的企业画像的生成方法,其特征在于,所述获取目标企业信息,包括:
获取不同信息源的初始企业信息,所述初始企业信息包括至少两种初始信息项;
根据至少两种所述初始信息项形成初始企业信息集,并基于所述初始企业信息集确定所述目标企业信息。
3.如权利要求2所述的企业画像的生成方法,其特征在于,所述根据所述目标企业信息确定所述目标企业信息的实体及全部实体之间的关联关系之后,所述方法还包括:
为不同实体分别设置权重;
所述根据全部实体、所述关联关系和所述标识信息生成企业知识图谱,包括:
根据全部实体、各个实体对应的权重、所述关联关系和所述标识信息生成企业知识图谱。
4.如权利要求3所述的企业画像的生成方法,其特征在于,所述为不同实体分别设置权重之后,所述方法还包括:
获取各个实体的信息源并计算各个实体的相似度;
将第一实体的权重增加第一数值,所述第一实体为所述信息源不同且内容的相似度在第一预设相似度范围内的实体;
将第二实体的权重增加第二数值,所述第二实体为经翻译为预设语种后内容的相似度在第二预设相似度范围内的实体。
5.如权利要求3所述的企业画像的生成方法,其特征在于,所述根据全部实体、各个实体对应的权重、所述关联关系和所述标识信息生成企业知识图谱,包括:
将全部实体、各个实体对应的权重和所述标识信息存入图数据库,得到图节点;
将所述关联关系存入图数据库,得到关系边;
根据所述图节点和所述关系边确定所述企业知识图谱。
6.如权利要求5所述的企业画像的生成方法,其特征在于,所述根据所述图节点和所述关系边确定所述企业知识图谱之后,所述方法还包括:
按预设时间间隔更新所述图数据库;
基于更新后的数据库对应新的图节点和新的关系边重新生成所述企业知识图谱。
7.如权利要求1所述的企业画像的生成方法,其特征在于,所述根据所述企业知识图谱生成与所述目标企业信息对应的企业画像之后,所述方法还包括:
获取第一用户对应的第一企业信息,所述第一企业信息包括至少两个第一信息项;
在检测全部实体的标识信息和预设标识相同的情况下,根据预设计算规则计算全部实体和全部所述第一信息项之间的第一相似度;
根据第三实体所在的企业知识图谱生成第一企业画像,其中,所述第三实体为大于或等于预设相似度的第一相似度对应的实体。
8.如权利要求7所述的企业画像的生成方法,其特征在于,所述根据所述企业知识图谱生成与所述目标企业信息对应的企业画像之后,所述方法还包括:
获取所述第一企业信息中各第一信息项的展示权限优先级;
根据所述展示权限优先级和大于或等于所述预设相似度的第一相似度确定所述第三实体,并根据所述第三实体所在的企业知识图谱生成所述第一企业画像。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述计算机程序在被所述处理器执行时实现权利要求1-8中任一项所述的企业画像的生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序在被一个或多个处理器执行时,实现权利要求1-8中任一项所述的企业画像的生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310288306.0A CN116383406A (zh) | 2023-03-16 | 2023-03-16 | 企业画像的生成方法、计算机设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310288306.0A CN116383406A (zh) | 2023-03-16 | 2023-03-16 | 企业画像的生成方法、计算机设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116383406A true CN116383406A (zh) | 2023-07-04 |
Family
ID=86968669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310288306.0A Pending CN116383406A (zh) | 2023-03-16 | 2023-03-16 | 企业画像的生成方法、计算机设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116383406A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117390232A (zh) * | 2023-11-30 | 2024-01-12 | 金网络(北京)数字科技有限公司 | 一种企业画像构建方法、系统、设备及存储介质 |
-
2023
- 2023-03-16 CN CN202310288306.0A patent/CN116383406A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117390232A (zh) * | 2023-11-30 | 2024-01-12 | 金网络(北京)数字科技有限公司 | 一种企业画像构建方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11734233B2 (en) | Method for classifying an unmanaged dataset | |
US9785989B2 (en) | Determining a characteristic group | |
CN109543925B (zh) | 基于机器学习的风险预测方法、装置、计算机设备和存储介质 | |
US20170308595A1 (en) | Learning from historical logs and recommending database operations on a data-asset in an etl tool | |
CN107291697A (zh) | 一种语义分析方法、电子设备、存储介质及其诊断系统 | |
McNeish | Should we use F-tests for model fit instead of chi-square in overidentified structural equation models? | |
Boldyreva et al. | Creating collections of descriptors of events and processes based on Internet queries | |
CN111782824B (zh) | 信息查询方法、装置、系统和介质 | |
CN109857853B (zh) | 基于电子书的搜索方法、电子设备及计算机存储介质 | |
US12008047B2 (en) | Providing an object-based response to a natural language query | |
CN116383406A (zh) | 企业画像的生成方法、计算机设备及计算机可读存储介质 | |
Tadesse et al. | Does China’s trade defy cultural barriers? | |
US20210097197A1 (en) | Systems and methods for detecting personally identifiable information | |
JP2020514681A (ja) | 物質検出方法、装置、電子機器、およびコンピュータ可読記憶媒体 | |
EP3828731A1 (en) | A method and analytical engine for a semantic analysis of textual data | |
Fountzoula et al. | Decision‐Making Methods in the Public Sector during 2010–2020: A Systematic Review | |
Hu et al. | Decoding the morphological evolution of open clusters | |
US11803796B2 (en) | System, method, electronic device, and storage medium for identifying risk event based on social information | |
Kaur et al. | Sashakt: a job portal for women using text extraction and text summarization | |
Carter et al. | Markov regime-switching tests: asymptotic critical values | |
Mitsuzuka et al. | Analysis of CSR activities affecting corporate value using machine learning | |
CN111699472A (zh) | 确定用于开发、设计和/或部署不同技术领域的复杂的嵌入式或信息物理系统,特别是其中使用的复杂的软件架构的措施的方法和计算机程序产品 | |
CN116644102A (zh) | 投资对象的智能遴选方法、系统终端及计算机可读存储介质 | |
CN115018625A (zh) | 征信融合报告生成方法、装置、设备及存储介质 | |
CN114240553A (zh) | 车辆保险产品的推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |