CN114357005A - 科创信息的生成方法、装置、终端及存储介质 - Google Patents
科创信息的生成方法、装置、终端及存储介质 Download PDFInfo
- Publication number
- CN114357005A CN114357005A CN202111302850.3A CN202111302850A CN114357005A CN 114357005 A CN114357005 A CN 114357005A CN 202111302850 A CN202111302850 A CN 202111302850A CN 114357005 A CN114357005 A CN 114357005A
- Authority
- CN
- China
- Prior art keywords
- information
- scientific
- enterprise user
- database
- enterprise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种科创信息的生成方法、装置、终端及存储介质。方法包括:基于第一企业用户的标识信息,建立第一企业用户的画像;依据第一企业用户的画像,确定企业用户数据库;对多个第一科创信息依次进行分类、标签化和分词处理,得到科创信息数据库;基于企业用户数据库、科创信息数据库和第二企业用户的画像,生成第二企业用户的画像对应的第二科创信息。本发明通过建立的企业用户数据库和科创信息数据库对初始内容推荐模型进行训练,得到目标内容推荐模型,以通过目标内容推荐模型和第二企业用户的画像,直接生成第二企业用户的画像对应的第二科创信息,采用自动化方式,无需人工处理,提高了获取科创信息的获取效率。
Description
技术领域
本申请涉及信息推送技术领域,具体而言,涉及一种科创信息的生成方法、 装置、终端及存储介质。
背景技术
科创信息(即科技创新信息)对于企业来说尤为重要,同时企业如何获取 对应的科创信息成为亟待解决的问题。
目前,企业主要以人工操作方式获取科创信息,即通过网络查阅资料、与对 手企业交流以及关注市场实时动态以获取相关的科创信息。
但是,采用上述方法获取科创信息存在效率低的问题。
发明内容
本申请的主要目的在于提供一种科创信息的生成方法、装置、终端及存储介 质,以解决相关技术中获取科创信息存在效率低的问题。
为了实现上述目的,第一方面,本申请提供了一种科创信息的生成方法,包 括:
基于第一企业用户的标识信息,建立第一企业用户的画像;
依据第一企业用户的画像,确定企业用户数据库;
对多个第一科创信息依次进行分类、标签化和分词处理,得到科创信息数据 库;
基于企业用户数据库、科创信息数据库和第二企业用户的画像,生成第二企 业用户的画像对应的第二科创信息。
在一种可能的实现方式中,基于第一企业用户的标识信息,建立第一企业用 户的画像,包括:
接收第一企业用户的标识信息;
识别第一企业用户的标识信息,并判断第一企业用户是否为新用户;
若第一企业用户为新用户,建立第一企业用户的画像。
在一种可能的实现方式中,依据第一企业用户的画像,确定企业用户数据库, 包括:
采集第一企业用户的企业信息;
将企业信息和画像进行匹配,得到第一企业用户信息;
将第一企业用户信息进行数据转换,得到多个第一企业用户数据,并基于多 个第一企业用户数据建立企业用户数据库,其中,多个第一企业用户信息与多个 第一企业用户数据一一对应。
在一种可能的实现方式中,对多个第一科创信息依次进行分类、标签化和分 词处理,得到科创信息数据库,包括:
对多个第一科创信息依次进行分类、标签化,得到多个第二科创信息;
将多个第二科创信息中的多个科创标题进行分词处理,得到多个第三科创信 息,其中,多个第一科创信息、多个第二科创信息、多个科创标题以及多个第三 科创信息一一对应;
对多个第三科创信息进行数据转换,得到多个目标科创信息数据,并基于多 个目标科创信息数据建立科创信息数据库,其中,多个第三科创信息与多个目标 科创信息数据一一对应。
在一种可能的实现方式中,对多个第一科创信息依次进行分类、标签化,得 到多个第二科创信息,包括:
对多个第一科创信息按照行业进行分类,得到每个行业对应的至少一个第四 科创信息;
针对每个行业,对至少一个第四科创信息进行标签化,得到携带有标签索引 的至少一个第四科创信息;
将所有行业携带标签索引的至少一个第四科创信息进行汇总,得到多个第二 科创信息。
在一种可能的实现方式中,基于企业用户数据库、科创信息数据库和第二企 业用户的画像,生成第二企业用户的画像对应的第二科创信息,包括:
基于企业用户数据库和科创信息数据库,建立模型训练集;
利用模型训练集对初始内容推荐模型进行训练,得到目标内容推荐模型;
将第二企业用户的画像输入目标内容推荐模型,生成第二科创信息。
在一种可能的实现方式中,基于企业用户数据库和科创信息数据库,建立模 型训练集,包括:
从企业用户数据库中提取预设数量的目标企业用户数据;
从科创信息数据库中提取与目标企业用户数据匹配的预设数量的目标科创信息;
将预设数量的目标企业用户数据和预设数量的目标科创信息进行组合,得到 模型训练集。
第二方面,本发明实施例提供了一种科创信息的生成装置,包括:
企业画像建立模块,用于基于第一企业用户的标识信息,建立第一企业用户 的画像;
第一数据库建立模块,用于依据第一企业用户的画像,确定企业用户数据库;
第二数据库建立模块,用于对多个第一科创信息依次进行分类、标签化和分 词处理,得到科创信息数据库;
科创信息生成模块,用于基于企业用户数据库、科创信息数据库和第二企业 用户的画像,生成第二企业用户的画像对应的第二科创信息。
第三方面,本发明实施例提供了一种终端,包括存储器、处理器以及存储在 存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上 任一种科创信息的生成方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储 介质存储有计算机程序,计算机程序被处理器执行时实现如上任一种科创信息的 生成方法的步骤。
本发明实施例提供了一种科创信息的生成方法、装置、终端及存储介质,包 括:基于第一企业用户的标识信息,建立第一企业用户的画像,然后依据第一企 业用户的画像,确定企业用户数据库,再对多个第一科创信息依次进行分类、标 签化和分词处理,得到科创信息数据库,最后基于企业用户数据库、科创信息数 据库和第二企业用户的画像,生成第二企业用户的画像对应的第二科创信息。本 发明通过建立的企业用户数据库和科创信息数据库对初始内容推荐模型进行训练, 得到目标内容推荐模型,以通过目标内容推荐模型和第二企业用户的画像,直接 生成第二企业用户的画像对应的第二科创信息,采用自动化方式,无需人工处理, 提高了获取科创信息的获取效率。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的 其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解 释本申请,并不构成对本申请的不当限定。在附图中:
图1是本发明实施例提供的一种科创信息的生成方法的实现流程图;
图2是本发明实施例提供的一种科创信息的生成装置的结构示意图;
图3是本发明实施例提供的终端的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实 施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所 描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中 的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第 三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺 序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述 的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行 顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实 施例的实施过程构成任何限定。
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在 于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产 品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的 或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一 种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B,可以表示: 单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后 关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、 B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、 B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A与 B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根 据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。 A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或 “当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的 实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实 施例来进行说明。
在一个实施例中,如图1所示,提供了一种科创信息的生成方法,包括以下 步骤:
步骤S101:基于第一企业用户的标识信息,建立第一企业用户的画像;
步骤S102:依据第一企业用户的画像,确定企业用户数据库;
步骤S103:对多个第一科创信息依次进行分类、标签化和分词处理,得到科 创信息数据库;
步骤S104:基于企业用户数据库、科创信息数据库和第二企业用户的画像, 生成第二企业用户的画像对应的第二科创信息。
其中,标识信息是用于识别第一企业用户的信息,可采用任意信息方式,例 如数字或字母等,此处不做具体限定。
具体的,当接收到第一企业用户的标识信息后,对标识信息进行解析,根据 解析结果建立第一企业用户的画像,再将第一企业用户的画像存储至数据库,形 成企业用户数据库。然后基于企业用户数据库和科创信息数据库中的数据,对初 始内容推荐模型进行训练,得到目标内容推荐模型,最后将第二企业用户的画像 输入目标内容推荐模型,直接输出第二企业用户的画像对应的第二科创信息。
本发明实施例提供了一种科创信息的生成方法,包括:基于第一企业用户的 标识信息,建立第一企业用户的画像,然后依据第一企业用户的画像,确定企业 用户数据库,再对多个第一科创信息依次进行分类、标签化和分词处理,得到科 创信息数据库,最后基于企业用户数据库、科创信息数据库和第二企业用户的画 像,生成第二企业用户的画像对应的第二科创信息。本发明通过建立的企业用户 数据库和科创信息数据库对初始内容推荐模型进行训练,得到目标内容推荐模型, 以通过目标内容推荐模型和第二企业用户的画像,直接生成第二企业用户的画像 对应的第二科创信息,采用自动化方式,无需人工处理,提高了获取科创信息的 获取效率。
在一实施例中,步骤S101包括:
步骤S201:接收第一企业用户的标识信息;
步骤S202:识别第一企业用户的标识信息,并判断第一企业用户是否为新用 户;
步骤S203:若第一企业用户为新用户,建立第一企业用户的画像。
当接收到第一企业用户的标识信息后,会对标识信息进行解析,得到解析结 果。其中,解析结果包括第一企业用户为新用户和第一企业用户为非新用户,若 第一企业用户为新用户时,建立第一企业用户的画像;若第一企业用户为非新用 户时,则无需建立第一企业用户的画像。
在一实施例中,步骤S102包括:
步骤S301:采集第一企业用户的企业信息;
步骤S302:将企业信息和画像进行匹配,得到第一企业用户信息;
步骤S303:将第一企业用户信息进行数据转换,得到多个第一企业用户数据, 并基于多个第一企业用户数据建立企业用户数据库,其中,多个第一企业用户信 息与多个第一企业用户数据一一对应。
当建立第一企业用户的画像后,还需采集第一企业用户的企业信息,其中, 企业信息包括企业基本信息、知识产权信息、投融资信息、资质信息等。上述企 业信息需要经过数据处理,转换成数据库对应的格式后进行存储。
在一实施例中,步骤S103包括:
步骤S401:对多个第一科创信息依次进行分类、标签化,得到多个第二科创 信息。
具体的,对多个第一科创信息按照行业进行分类,得到每个行业对应的至少 一个第四科创信息;针对每个行业,对至少一个第四科创信息进行标签化,得到 携带有标签索引的至少一个第四科创信息;将所有行业携带标签索引的至少一个 第四科创信息进行汇总,得到多个第二科创信息。
进一步的,行业包括金融行业、知识产权行业等,以行业仅包括金融行业和 知识产权行业为例进行说明。将4个第一科创信息按照行业进行分类,得到金融 行业对应的2个第四科创信息和知识产权行业对应的2个第四科创信息,分别将 金融行业对应的2个第四科创信息和知识产权行业对应的2个第四科创信息均进 行标签化,得到4个携带有标签索引的第四科创信息,由4个携带有标签索引的 第四科创信息构成4个第二科创信息。
步骤S402:将多个第二科创信息中的多个科创标题进行分词处理,得到多个 第三科创信息,其中,多个第一科创信息、多个第二科创信息、多个科创标题以 及多个第三科创信息一一对应。
具体的,对科创标题进行中文拼音拆分,拼音首字母拆分。便于检索时候可 以进行拼音检索、拼音首字母检索、关键词检索。对关键词进行补全,便于建立 数据索引和分词。采用分布式处理方式,多线程数据加工,可以大大提高数据加 工效率,提高数据检索精准度。
步骤S403:对多个第三科创信息进行数据转换,得到多个目标科创信息数据, 并基于多个目标科创信息数据建立科创信息数据库,其中,多个第三科创信息与 多个目标科创信息数据一一对应。
具体的,由于第三科创信息为中文GB2312格式数据,对此类格式数据进行 数据清洗时候有乱码现象,因此,需将中文GB2312格式数据编码转成UTF8编码。
在一实施例中,步骤S104包括:
步骤S501:基于企业用户数据库和科创信息数据库,建立模型训练集。
具体的,建立模型训练集的方式为:从企业用户数据库中提取预设数量的目 标企业用户数据,再从科创信息数据库中提取与目标企业用户数据匹配的预设数 量的目标科创信息,然后将预设数量的目标企业用户数据和预设数量的目标科创 信息进行组合,得到模型训练集。其中,预设数量不进行具体限定。
步骤S502:利用模型训练集对初始内容推荐模型进行训练,得到目标内容推 荐模型;
步骤S503:将第二企业用户的画像输入目标内容推荐模型,生成第二科创信 息。
具体的,初始内容推荐模型可为BP神经网络模型,初始内容推荐模型经训练 集进行训练后,形成所需要的目标内容推荐模型。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各 过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程 构成任何限定。
以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对 应的方法实施例。
图2示出了本发明实施例提供的一种科创信息的生成装置的结构示意图,为 了便于说明,仅示出了与本发明实施例相关的部分,一种科创信息的生成装置包 括企业画像建立模块21、第一数据库建立模块22、第二数据库建立模块23和科 创信息生成模块24,具体如下:
企业画像建立模块21,用于基于第一企业用户的标识信息,建立第一企业用 户的画像;
第一数据库建立模块22,用于依据第一企业用户的画像,确定企业用户数据 库;
第二数据库建立模块23,用于对多个第一科创信息依次进行分类、标签化和 分词处理,得到科创信息数据库;
科创信息生成模块24,用于基于企业用户数据库、科创信息数据库和第二企 业用户的画像,生成第二企业用户的画像对应的第二科创信息。
在一种可能的实现方式中,企业画像建立模块21包括:
标识信息接收子模块,用于接收第一企业用户的标识信息;
标识信息识别子模块,用于识别第一企业用户的标识信息,并判断第一企业 用户是否为新用户;
画像建立子模块,用于若第一企业用户为新用户,建立第一企业用户的画像。
在一种可能的实现方式中,第一数据库建立模块22包括:
企业信息采集子模块,用于采集第一企业用户的企业信息;
数据匹配子模块,用于将企业信息和画像进行匹配,得到第一企业用户信息;
第一数据库建立子模块,用于将第一企业用户信息进行数据转换,得到多个 第一企业用户数据,并基于多个第一企业用户数据建立企业用户数据库,其中, 多个第一企业用户信息与多个第一企业用户数据一一对应。
在一种可能的实现方式中,第二数据库建立模块23包括:
第一处理子模块,用于对多个第一科创信息依次进行分类、标签化,得到多 个第二科创信息;
第二处理子模块,用于将多个第二科创信息中的多个科创标题进行分词处理, 得到多个第三科创信息,其中,多个第一科创信息、多个第二科创信息、多个科 创标题以及多个第三科创信息一一对应;
第三处理子模块,用于对多个第三科创信息进行数据转换,得到多个目标科 创信息数据,并基于多个目标科创信息数据建立科创信息数据库,其中,多个第 三科创信息与多个目标科创信息数据一一对应。
在一种可能的实现方式中,第一处理子模块包括:
第一处理单元,用于对多个第一科创信息按照行业进行分类,得到每个行业 对应的至少一个第四科创信息;
第二处理单元,用于针对每个行业,对至少一个第四科创信息进行标签化, 得到携带有标签索引的至少一个第四科创信息;
第三处理单元,用于将所有行业携带标签索引的至少一个第四科创信息进行 汇总,得到多个第二科创信息。
在一种可能的实现方式中,科创信息生成模块24包括:
训练集建立子模块,用于基于企业用户数据库和科创信息数据库,建立模型 训练集;
模型训练子模块,用于利用模型训练集对初始内容推荐模型进行训练,得到 目标内容推荐模型;
科创信息生成子模块,用于将第二企业用户的画像输入目标内容推荐模型, 生成第二科创信息。
在一种可能的实现方式中,训练集建立子模块包括:
第一数据提取单元,用于从企业用户数据库中提取预设数量的目标企业用户 数据;
第二数据提取单元,用于从科创信息数据库中提取与目标企业用户数据匹配 的预设数量的目标科创信息;
训练集建立单元,用于将预设数量的目标企业用户数据和预设数量的目标科 创信息进行组合,得到模型训练集。
图3是本发明实施例提供的终端的示意图。如图3所示,该实施例的终端3 包括:处理器30、存储器31以及存储在存储器31中并可在处理器30上运行的计 算机程序32。处理器30执行计算机程序32时实现上述各个科创信息的生成方法 实施例中的步骤,例如图1所示的步骤101至步骤104。或者,处理器30执行计 算机程序32时实现上述各装置实施例中各模块/单元的功能,例如图2所示模块/ 单元21至24的功能。
本发明还提供一种可读存储介质,可读存储介质中存储有计算机程序,计算 机程序被处理器执行时用于实现上述的各种实施方式提供的方法。
其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质 包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质 可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至 处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质 写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储 介质可以位于专用集成电路(Application Specific Integrated Circuits,简称: ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和可读存储介质也 可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、 随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在 可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令, 至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。
在上述设备的实施例中,应理解,处理器可以是中央处理单元(英文:CentralProcessing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英 文:DigitalSignal Processor,简称:DSP)、专用集成电路(英文:Application Specific IntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或 者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以 直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完 成。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实 施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以 对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同 替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技 术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种科创信息的生成方法,其特征在于,包括:
基于第一企业用户的标识信息,建立所述第一企业用户的画像;
依据所述第一企业用户的画像,确定企业用户数据库;
对多个第一科创信息依次进行分类、标签化和分词处理,得到科创信息数据库;
基于所述企业用户数据库、所述科创信息数据库和第二企业用户的画像,生成所述第二企业用户的画像对应的第二科创信息。
2.如权利要求1所述的科创信息的生成方法,其特征在于,所述基于第一企业用户的标识信息,建立所述第一企业用户的画像,包括:
接收所述第一企业用户的标识信息;
识别所述第一企业用户的标识信息,并判断所述第一企业用户是否为新用户;
若所述第一企业用户为新用户,建立所述第一企业用户的画像。
3.如权利要求2所述的科创信息的生成方法,其特征在于,所述依据所述第一企业用户的画像,确定企业用户数据库,包括:
采集所述第一企业用户的企业信息;
将所述企业信息和所述画像进行匹配,得到第一企业用户信息;
将所述第一企业用户信息进行数据转换,得到多个第一企业用户数据,并基于所述多个第一企业用户数据建立所述企业用户数据库,其中,所述多个第一企业用户信息与所述多个第一企业用户数据一一对应。
4.如权利要求3所述的科创信息的生成方法,其特征在于,所述对多个第一科创信息依次进行分类、标签化和分词处理,得到科创信息数据库,包括:
对所述多个第一科创信息依次进行分类、标签化,得到多个第二科创信息;
将所述多个第二科创信息中的多个科创标题进行分词处理,得到多个第三科创信息,其中,所述多个第一科创信息、所述多个第二科创信息、所述多个科创标题以及所述多个第三科创信息一一对应;
对所述多个第三科创信息进行数据转换,得到多个目标科创信息数据,并基于所述多个目标科创信息数据建立所述科创信息数据库,其中,所述多个第三科创信息与所述多个目标科创信息数据一一对应。
5.如权利要求4所述的科创信息的生成方法,其特征在于,所述对所述多个第一科创信息依次进行分类、标签化,得到多个第二科创信息,包括:
对所述多个第一科创信息按照行业进行分类,得到每个行业对应的至少一个第四科创信息;
针对每个行业,对所述至少一个第四科创信息进行标签化,得到携带有标签索引的至少一个第四科创信息;
将所有行业携带标签索引的至少一个第四科创信息进行汇总,得到所述多个第二科创信息。
6.如权利要求5所述的科创信息的生成方法,其特征在于,所述基于所述企业用户数据库、所述科创信息数据库和第二企业用户的画像,生成所述第二企业用户的画像对应的第二科创信息,包括:
基于所述企业用户数据库和所述科创信息数据库,建立模型训练集;
利用所述模型训练集对初始内容推荐模型进行训练,得到目标内容推荐模型;
将所述第二企业用户的画像输入所述目标内容推荐模型,生成所述第二科创信息。
7.如权利要求6所述的科创信息的生成方法,其特征在于,所述基于所述企业用户数据库和所述科创信息数据库,建立模型训练集,包括:
从所述企业用户数据库中提取预设数量的目标企业用户数据;
从所述科创信息数据库中提取与所述目标企业用户数据匹配的预设数量的目标科创信息;
将所述预设数量的目标企业用户数据和所述预设数量的目标科创信息进行组合,得到所述模型训练集。
8.一种科创信息的生成装置,其特征在于,包括:
企业画像建立模块,用于基于第一企业用户的标识信息,建立所述第一企业用户的画像;
第一数据库建立模块,用于依据所述第一企业用户的画像,确定企业用户数据库;
第二数据库建立模块,用于对多个第一科创信息依次进行分类、标签化和分词处理,得到科创信息数据库;
科创信息生成模块,用于基于所述企业用户数据库、所述科创信息数据库和第二企业用户的画像,生成所述第二企业用户的画像对应的第二科创信息。
9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述科创信息的生成方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行所述计算机程序时实现如权利要求1至7中任一项所述科创信息的生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111302850.3A CN114357005A (zh) | 2021-11-04 | 2021-11-04 | 科创信息的生成方法、装置、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111302850.3A CN114357005A (zh) | 2021-11-04 | 2021-11-04 | 科创信息的生成方法、装置、终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114357005A true CN114357005A (zh) | 2022-04-15 |
Family
ID=81096396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111302850.3A Pending CN114357005A (zh) | 2021-11-04 | 2021-11-04 | 科创信息的生成方法、装置、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114357005A (zh) |
-
2021
- 2021-11-04 CN CN202111302850.3A patent/CN114357005A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109872162B (zh) | 一种处理用户投诉信息的风控分类识别方法及系统 | |
CN112035599B (zh) | 基于垂直搜索的查询方法、装置、计算机设备及存储介质 | |
CN112163424A (zh) | 数据的标注方法、装置、设备和介质 | |
CN110909123B (zh) | 一种数据提取方法、装置、终端设备及存储介质 | |
CN110210038B (zh) | 核心实体确定方法及其系统、服务器和计算机可读介质 | |
CN111782793A (zh) | 智能客服处理方法和系统及设备 | |
CN111563382A (zh) | 文本信息的获取方法、装置、存储介质及计算机设备 | |
US20190258629A1 (en) | Data mining method based on mixed-type data | |
CN111831810A (zh) | 智能问答方法、装置、设备及存储介质 | |
CN110532449B (zh) | 一种业务文档的处理方法、装置、设备和存储介质 | |
CN111325019A (zh) | 词库的更新方法及装置、电子设备 | |
CN110750626A (zh) | 一种基于场景的任务驱动的多轮对话方法及系统 | |
CN112699671A (zh) | 一种语言标注方法、装置、计算机设备和存储介质 | |
CN115687790B (zh) | 基于大数据的广告推送方法、系统及云平台 | |
CN111104422A (zh) | 一种数据推荐模型的训练方法、装置、设备及存储介质 | |
CN114254109B (zh) | 用于确定行业类别的方法及装置 | |
CN114357005A (zh) | 科创信息的生成方法、装置、终端及存储介质 | |
CN114495138A (zh) | 一种智能文档识别与特征提取方法、装置平台和存储介质 | |
CN114373068A (zh) | 一种行业场景化的ocr模型实现系统、方法及设备 | |
CN110909538B (zh) | 问答内容的识别方法、装置、终端设备及介质 | |
CN114281942A (zh) | 问答处理方法、相关设备及可读存储介质 | |
CN113128231A (zh) | 一种数据质检方法、装置、存储介质和电子设备 | |
CN111931480A (zh) | 文本主要内容的确定方法、装置、存储介质及计算机设备 | |
CN113641746B (zh) | 文档结构化方法、装置、电子设备和存储介质 | |
CN110706309B (zh) | 用于生成鱼骨图的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |