CN113611427A - 用户画像生成方法、装置、设备及存储介质 - Google Patents

用户画像生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113611427A
CN113611427A CN202110919504.3A CN202110919504A CN113611427A CN 113611427 A CN113611427 A CN 113611427A CN 202110919504 A CN202110919504 A CN 202110919504A CN 113611427 A CN113611427 A CN 113611427A
Authority
CN
China
Prior art keywords
data
target
user
fusion
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110919504.3A
Other languages
English (en)
Other versions
CN113611427B (zh
Inventor
刘舒萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Medical Health Technology Service Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN202110919504.3A priority Critical patent/CN113611427B/zh
Publication of CN113611427A publication Critical patent/CN113611427A/zh
Application granted granted Critical
Publication of CN113611427B publication Critical patent/CN113611427B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数字医疗领域,公开了一种用户画像生成方法、装置、设备及存储介质,用于提高用户画像生成的准确率。所述用户画像生成方法包括:对目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对目标症状数据进行编码处理,得到目标向量;将目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;将目标数据输入预置的神经网络模型中进行融合映射,得到映射数据;对特征数据和映射数据进行数据融合,得到融合数据;将融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据目标相似度生成目标用户的用户画像。此外,本发明还涉及区块链技术,用户画像可存储于区块链节点中。

Description

用户画像生成方法、装置、设备及存储介质
技术领域
本发明涉及用户画像领域,尤其涉及一种用户画像生成方法、装置、设备及存储介质。
背景技术
随着计算机技术的高速发展,通过机器人与用户进行沟通并处理用户需求的效率十分高而且能节省较大的人工成本。随着医疗信息化的进程加快,电子病例和健康档案的建立,正在实现通过人工智能技术对碎片化医学信息进行整理和分析,从而提高医疗服务质量。随着深度学习技术的兴起,深度学习模型,可以支持疾病辅助诊断、健康管理、远程会诊等功能。
目前,用户画像生成通常是基于用户的医疗数据,数据是医疗数据,如个人健康档案、处方、检查报告等数据,通过深度学习模型对用户的医疗数据进行处理生成用户画像,但是通过单一的深度学习模型进行处理用户的医疗数据,生成的用户画像准确率低。
发明内容
本发明提供了一种用户画像生成方法、装置、设备及存储介质,用于提高用户画像生成的准确率。
本发明第一方面提供了一种用户画像生成方法,所述用户画像生成方法包括:获取目标用户的目标症状数据,所述目标症状数据用于指示所述目标用户对应的多个症状名称;对所述目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对所述目标症状数据进行编码处理,得到目标向量;将所述目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;将所述目标数据输入预置的神经网络模型中进行融合映射,得到映射数据;对所述特征数据和所述映射数据进行数据融合,得到融合数据;将所述融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据所述目标相似度生成所述目标用户的用户画像。
可选的,在本发明第一方面的第一种实现方式中,在所述获取目标用户的目标症状数据之前,还包括:获取多个样本数据,并对所述多个样本数据进行实体和属性数据抽取,得到多个样本目标数据;将所述多个样本目标数据输入预置的第一训练模型中进行特征提取,得到多个样本映射数据;分别计算所述多个样本映射数据的损失值,得到多个第一损失值;根据所述多个第一损失值对所述第一训练模型进行参数调整,直至所述第一训练模型收敛,得到神经网络模型。
可选的,在本发明第一方面的第二种实现方式中,在所述获取目标用户的症状数据之前,在所述获取多个样本数据之后,还包括:对所述多个样本数据进行编码处理,得到多个样本目标向量;将所述多个样本目标向量输入预置的第二训练模型中进行语义分析,得到多个样本特征数据;分别计算所述多个样本特征数据的损失值,得到多个第二损失值;根据所述多个第二损失值对所述第二训练模型进行参数调整,直至所述第二训练模型收敛,得到数据处理模型。
可选的,在本发明第一方面的第三种实现方式中,所述对所述目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对所述目标症状数据进行编码处理,得到目标向量,包括:基于预置的关键词库对所述目标症状数据进行实体和属性数据抽取,得到目标数据;对所述目标症状数据进行词向量转换,得到目标词向量,并对所述目标症状数据进行段向量转换,得到目标段向量,以及对所述目标症状数据进行位置向量转换,得到目标位置向量;对所述目标词向量、所述目标段向量和所述目标位置向量进行拼接,得到目标向量。
可选的,在本发明第一方面的第四种实现方式中,所述将所述目标向量输入预置的数据处理模型中进行特征提取,得到特征数据,包括:将所述目标向量输入预置的数据处理模型中,所述数据处理模型包括:编码器和解码器;通过所述编码器对所述目标向量进行编码转换,得到目标输入向量;通过所述解码器对所述目标输入向量进行语义特征提取,得到特征数据。
可选的,在本发明第一方面的第五种实现方式中,所述将所述目标数据输入预置的神经网络模型中进行融合映射,得到映射数据,包括:将所述目标数据输入预置的神经网络模型中,所述神经网络模型包括:多层聚合层和嵌入层;通过所述多层聚合层对所述目标数据进行特征信息融合,得到目标融合信息;通过所述嵌入层对所述目标融合信息进行数据映射,得到映射数据。
可选的,在本发明第一方面的第六种实现方式中,所述将所述融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据所述目标相似度生成所述目标用户的用户画像,包括:将所述融合数据输入预置的线性回归层,通过所述线性回归层对所述融合数据进行逻辑回归运算,得到目标相似度;调用预置的用户标签库,根据所述目标相似度对所述目标用户进行用户标签匹配,得到所述目标用户对应的用户标签;将所述用户标签作为所述目标用户的用户画像。
本发明第二方面提供了一种用户画像生成装置,所述用户画像生成装置包括:获取模块,用于获取目标用户的目标症状数据,所述目标症状数据用于指示所述目标用户对应的多个症状名称;编码模块,用于对所述目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对所述目标症状数据进行编码处理,得到目标向量;处理模块,用于将所述目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;提取模块,用于将所述目标数据输入预置的神经网络模型中进行融合映射,得到映射数据;融合模块,用于对所述特征数据和所述映射数据进行数据融合,得到融合数据;生成模块,用于将所述融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据所述目标相似度生成所述目标用户的用户画像。
可选的,在本发明第二方面的第一种实现方式中,所述用户画像生成装置还包括:第一训练模块,用于获取多个样本数据,并对所述多个样本数据进行实体和属性数据抽取,得到多个样本目标数据;将所述多个样本目标数据输入预置的第一训练模型中进行特征提取,得到多个样本映射数据;分别计算所述多个样本映射数据的损失值,得到多个第一损失值;根据所述多个第一损失值对所述第一训练模型进行参数调整,直至所述第一训练模型收敛,得到神经网络模型。
可选的,在本发明第二方面的第二种实现方式中,所述用户画像生成装置还包括:第二训练模块,用于对所述多个样本数据进行编码处理,得到多个样本目标向量;将所述多个样本目标向量输入预置的第二训练模型中进行语义分析,得到多个样本特征数据;分别计算所述多个样本特征数据的损失值,得到多个第二损失值;根据所述多个第二损失值对所述第二训练模型进行参数调整,直至所述第二训练模型收敛,得到数据处理模型。
可选的,在本发明第二方面的第三种实现方式中,所述编码模块具体用于:对所述多个样本数据进行编码处理,得到多个样本目标向量;将所述多个样本目标向量输入预置的第二训练模型中进行语义分析,得到多个样本特征数据;分别计算所述多个样本特征数据的损失值,得到多个第二损失值;根据所述多个第二损失值对所述第二训练模型进行参数调整,直至所述第二训练模型收敛,得到数据处理模型。
可选的,在本发明第二方面的第四种实现方式中,所述处理模块具体用于:将所述目标向量输入预置的数据处理模型中,所述数据处理模型包括:编码器和解码器;通过所述编码器对所述目标向量进行编码转换,得到目标输入向量;通过所述解码器对所述目标输入向量进行语义特征提取,得到特征数据。
可选的,在本发明第二方面的第五种实现方式中,所述提取模块具体用于:将所述目标数据输入预置的神经网络模型中,所述神经网络模型包括:多层聚合层和嵌入层;通过所述多层聚合层对所述目标数据进行特征信息融合,得到目标融合信息;通过所述嵌入层对所述目标融合信息进行数据映射,得到映射数据。
可选的,在本发明第二方面的第六种实现方式中,所述生成模块具体用于:将所述融合数据输入预置的线性回归层,通过所述线性回归层对所述融合数据进行逻辑回归运算,得到目标相似度;调用预置的用户标签库,根据所述目标相似度对所述目标用户进行用户标签匹配,得到所述目标用户对应的用户标签;将所述用户标签作为所述目标用户的用户画像。
本发明第三方面提供了一种用户画像生成设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述用户画像生成设备执行上述的用户画像生成方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的用户画像生成方法。
本发明提供的技术方案中,通过对目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对目标症状数据进行编码处理,得到目标向量,编码处理可以使目标症状数据被神经网络模型有效的识别;将目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;将目标数据输入预置的神经网络模型中进行融合映射,得到映射数据,深度学习网络有效的提升了特征提取的准确率;对特征数据和所述映射数据进行数据融合,得到融合数据;将融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据目标相似度生成目标用户的用户画像,提高了用户画像生成的准确率。
附图说明
图1为本发明实施例中用户画像生成方法的一个实施例示意图;
图2为本发明实施例中用户画像生成方法的另一个实施例示意图;
图3为本发明实施例中用户画像生成装置的一个实施例示意图;
图4为本发明实施例中用户画像生成装置的另一个实施例示意图;
图5为本发明实施例中用户画像生成设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种用户画像生成方法、装置、设备及存储介质,用于提高用户画像生成的准确率。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中用户画像生成方法的第一个实施例包括:
101、获取目标用户的目标症状数据,目标症状数据用于指示目标用户对应的多个症状名称;
可以理解的是,本发明的执行主体可以为用户画像生成装置,还可以是服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
具体的,为了保证目标症状数据的真实性,目标症状数据的获取可以为医疗网站、医疗机构数据库等,进一步地,目标症状数据是包括多个症状名称的文本数据,目标症状数据可以通过预置的爬虫从医疗网站或者医疗机构数据中获取,其中,医疗网站或者医疗机构数据记录目标用户的多个症状名称生成文本数据(也就是,目标症状数据),也可以由目标用户直接输入多个症状名称从而得到目标症状数据。
102、对目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对目标症状数据进行编码处理,得到目标向量;
具体的,服务器对目标症状数据进行实体词和属性词抽取并将抽取得到的实体词和属性词作为目标数据,其中,实体词例如:皮肤、大脑等;属性词例如:红肿、头痛等。服务器对目标症状数据进行编码处理,得到目标向量。
103、将目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;
具体的,服务器将目标向量输入预置的数据处理模型中,其中,数据处理模型为图神经网络模型(graphsage),数据处理模型包括:编码器和解码器,其中,编码器用于对目标向量进行编码转换,解码器用于对目标输入向量进行语义特征提取,得到特征数据。
104、将目标数据输入预置的神经网络模型中进行融合映射,得到映射数据;
需要说明的是,预置的神经网络模型包括:多层聚合层和嵌入层,神经网络模型可以为bert模型。进一步地,服务器通过预置神经网络模型对目标数据进行特征信息融合和向量编码处理,得到映射数据。此外,神经网络模型能够应用于多种不同的领域中,如:语音识别、医疗诊断、应用程序的测试等。
105、对特征数据和映射数据进行数据融合,得到融合数据;
具体的,服务器对特征数据和映射数据进行数据融合,得到融合数据,进一步地,服务器对特征数据和映射数据进行拼接,得到融合数据。例如:当特征数据为[1,2,5],映射数据为[0,3,3]时,得到的融合数据为[1,2,5,0,3,3]。
106、将融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据目标相似度生成目标用户的用户画像。
具体的,服务器将融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,服务器选取目标相似度对应最大的用户标签生成目标用户对应的用户画像,用户画像由用户标签组成。例如:当目标相似度为0.4384时,服务器确定用户标签是体弱标签,当目标相似度为0.5231时,服务器确定用户标签是正常标签,服务器确定用户标签是正常的目标相似度最大,服务器将用户标签是正常标签作为目标用户对应的用户画像。
进一步地,服务器将用户画像存储于区块链数据库中,具体此处不做限定。
本发明实施例中,通过对目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对目标症状数据进行编码处理,得到目标向量,编码处理可以使目标症状数据被神经网络模型有效的识别;将目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;将目标数据输入预置的神经网络模型中进行融合映射,得到映射数据,深度学习网络有效的提升了特征提取的准确率,提高了用户画像生成的准确率。
请参阅图2,本发明实施例中用户画像生成方法的第二个实施例包括:
201、获取目标用户的目标症状数据,目标症状数据用于指示目标用户对应的多个症状名称;
具体的,服务器在获取目标用户的目标症状数据过程中,为了便于对目标症状数据进行区分,目标症状数据会携带相应的症状标签,并且每个症状标签的目标症状数据都会伴随有影响该症状数据关联因子的关联数据,目标症状数据是医疗数据,如个人健康档案、处方、检查报告等数据。
202、基于预置的关键词库对目标症状数据进行实体和属性数据抽取,得到目标数据;
具体的,服务器基于预置的关键词库对目标症状数据进行实体和属性数据抽取,得到目标数据,其中,预置的关键词库中包括多个实体词和属性词,例如:收缩压、舒张压;服务器对目标症状数据进行词向量转换,得到目标词向量,服务器对目标症状数据进行段向量转换,得到目标段向量,服务器对目标症状数据进行位置向量转换,得到目标位置向量。
203、对目标症状数据进行词向量转换,得到目标词向量,并对目标症状数据进行段向量转换,得到目标段向量,以及对目标症状数据进行位置向量转换,得到目标位置向量;
具体的,服务器对目标症状数据进行词向量转换,得到目标词向量,服务器对目标症状数据进行段向量转换,得到目标段向量,服务器对目标症状数据进行位置向量转换,得到目标位置向量。
204、对目标词向量、目标段向量和目标位置向量进行拼接,得到目标向量;
具体的,服务器对目标词向量、目标段向量和目标位置向量进行拼接,得到目标向量。例如:当目标词向量为[1,2,3],目标段向量为[2]和目标位置向量[4]时,服务器对目标词向量、目标段向量和目标位置向量进行拼接,得到目标向量为[1,2,3,2,4]。
205、将目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;
需要说明的是,数据处理模型包括:编码器和解码器,其中,数据处理模型可以为图神经网络模型,编码器是基于空间的图卷积网络,编码器的注意机制是在聚合特征信息时,将注意机制用于确定节点邻域的权重,编码器的神经网络结构将目标向量的顶点表示为低维向量,得到目标输入向量;服务器通过解码器对目标输入向量进行节点值预测,得到目标输入向量的语义特征(也就是,特征数据)。
具体的,本实施例详细描述数据处理模型的训练过程,其中,多个样本数据为带有标注信息的症状数据,第二训练模型为图神经网络模型(graphsage),服务器分别对多个样本数据进行向量编码,得到多个样本目标向量,服务器分别将多个样本目标向量输入预置的第二训练模型(也就是,图神经网络模型),通过第二训练模型分别对多个样本目标向量进行语义特征提取,得到多个样本特征数据,服务器调用预置的第二损失函数分别计算样本映射数据的多个第二损失值,服务器根据多个第二损失值和预设目标值对第二训练模型的参数进行调整,直至第二训练模型收敛,服务器将收敛的第二训练模型作为数据处理模型。
206、将目标数据输入预置的神经网络模型中进行融合映射,得到映射数据;
具体的,服务器对神经网络模型进行训练,训练主要分为两个阶段:预训练阶段和适应训练阶段,进一步地,预训练阶段是在多个数据集上根据一些预训练任务训练得到,适应训练阶段是服务器对下游任务的时候进行微调,例如文本分类,词性标注等,神经网络模型无需调整结构就可以在不同的任务上进行微调。服务器通过多层聚合层对目标数据进行特征信息融合,得到目标融合信息;服务器通过嵌入层对目标融合信息进行数据映射,得到映射数据,其中,嵌入层为embedding层。
具体的,本实施例详细描述神经网络模型的训练过程,其中,多个样本数据为标注有实体和属性信息的症状数据,第一训练模型为词向量模型(bert),服务器从预置的数据库中提取多个样本数据,服务器分别对多个样本数据进行实体和属性数据抽取,得到多个样本目标数据,服务器分别将多个样本目标数据输入预置的第一训练模型(也就是,词向量模型),通过第一训练模型分别对多个样本目标数据进行语义特征提取,得到多个样本映射数据,服务器调用预置的第一损失函数分别计算样本映射数据的多个第一损失值,服务器根据多个第一损失值和预置的损失值阈值对第一训练模型的参数进行调整,直至第一训练模型收敛,服务器将收敛的第一训练模型作为神经网络模型。
207、对特征数据和映射数据进行数据融合,得到融合数据;
具体的,服务器对特征数据和映射数据进行数据融合,得到融合数据,进一步地,服务器对特征数据和映射数据进行拼接,得到融合数据。例如:当特征数据为[1,2,3],映射数据为[1,3,5]时,得到的融合数据为[1,2,3,1,3,5]。
208、将融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据目标相似度生成目标用户的用户画像。
具体的,服务器根据目标相似度的大小选取目标相似度对应用户标签的最大值,得到用户标签的最大值,服务器从预置的用户标签库中查找目标相似度对应的用户标签,得到用户标签,服务器根据用户标签生成目标用户对应的用户画像,用户画像由用户标签组成。例如:当目标相似度为0.6325时,服务器确定用户标签是高频型标签,当目标相似度为0.5655时,服务器确定用户标签是低频型标签,服务器对目标相似度进行比较,服务器将目标相似度最大的0.5231对应的用户标签(也就是,高频型标签)作为目标用户对应的用户画像。
进一步地,服务器将用户画像存储于区块链数据库中,具体此处不做限定。
本发明实施例中,通过对目标症状数据中的实体和属性数据进行抽取,得到目标数据,对目标症状数据进行词向量转换,得到目标词向量,并对目标症状数据进行段向量转换,得到目标段向量,以及对目标症状数据进行位置向量转换,得到目标位置向量;对目标词向量、目标段向量和目标位置向量进行拼接,得到目标向量,通过对目标症状数据进行向量编码有效提高了神经网络模型的识别准确率,从而提高了用户画像生成的准确率。
上面对本发明实施例中用户画像生成方法进行了描述,下面对本发明实施例中用户画像生成装置进行描述,请参阅图3,本发明实施例中用户画像生成装置第一个实施例包括:
获取模块301,用于获取目标用户的目标症状数据,所述目标症状数据用于指示所述目标用户对应的多个症状名称;
编码模块302,用于对所述目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对所述目标症状数据进行编码处理,得到目标向量;
处理模块303,用于将所述目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;
提取模块304,用于将所述目标数据输入预置的神经网络模型中进行融合映射,得到映射数据;
融合模块305,用于对所述特征数据和所述映射数据进行数据融合,得到融合数据;
生成模块306,用于将所述融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据所述目标相似度生成所述目标用户的用户画像。
进一步地,服务器将用户画像存储于区块链数据库中,具体此处不做限定。
本发明实施例中,通过对目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对目标症状数据进行编码处理,得到目标向量,编码处理可以使目标症状数据被神经网络模型有效的识别;将目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;将目标数据输入预置的神经网络模型中进行融合映射,得到映射数据,深度学习网络有效的提升了特征提取的准确率;对特征数据和所述映射数据进行数据融合,得到融合数据;将融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据目标相似度生成目标用户的用户画像,提高了用户画像生成的准确率。
请参阅图4,本发明实施例中用户画像生成装置第二个实施例包括:
获取模块301,用于获取目标用户的目标症状数据,所述目标症状数据用于指示所述目标用户对应的多个症状名称;
编码模块302,用于对所述目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对所述目标症状数据进行编码处理,得到目标向量;
处理模块303,用于将所述目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;
提取模块304,用于将所述目标数据输入预置的神经网络模型中进行融合映射,得到映射数据;
融合模块305,用于对所述特征数据和所述映射数据进行数据融合,得到融合数据;
生成模块306,用于将所述融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据所述目标相似度生成所述目标用户的用户画像。
可选的,所述用户画像生成装置还包括:第一训练模块307,用于获取多个样本数据,并对所述多个样本数据进行实体和属性数据抽取,得到多个样本目标数据;将所述多个样本目标数据输入预置的第一训练模型中进行特征提取,得到多个样本映射数据;分别计算所述多个样本映射数据的损失值,得到多个第一损失值;根据所述多个第一损失值对所述第一训练模型进行参数调整,直至所述第一训练模型收敛,得到神经网络模型。
可选的,所述用户画像生成装置还包括:第二训练模块308,用于对所述多个样本数据进行编码处理,得到多个样本目标向量;将所述多个样本目标向量输入预置的第二训练模型中进行语义分析,得到多个样本特征数据;分别计算所述多个样本特征数据的损失值,得到多个第二损失值;根据所述多个第二损失值对所述第二训练模型进行参数调整,直至所述第二训练模型收敛,得到数据处理模型。
可选的,所述编码模块302具体用于:对所述多个样本数据进行编码处理,得到多个样本目标向量;将所述多个样本目标向量输入预置的第二训练模型中进行语义分析,得到多个样本特征数据;分别计算所述多个样本特征数据的损失值,得到多个第二损失值;根据所述多个第二损失值对所述第二训练模型进行参数调整,直至所述第二训练模型收敛,得到数据处理模型。
可选的,所述处理模块303具体用于:将所述目标向量输入预置的数据处理模型中,所述数据处理模型包括:编码器和解码器;通过所述编码器对所述目标向量进行编码转换,得到目标输入向量;通过所述解码器对所述目标输入向量进行语义特征提取,得到特征数据。
可选的,所述提取模块304具体用于:将所述目标数据输入预置的神经网络模型中,所述神经网络模型包括:多层聚合层和嵌入层;通过所述多层聚合层对所述目标数据进行特征信息融合,得到目标融合信息;通过所述嵌入层对所述目标融合信息进行数据映射,得到映射数据。
可选的,所述生成模块305具体用于:将所述融合数据输入预置的线性回归层,通过所述线性回归层对所述融合数据进行逻辑回归运算,得到目标相似度;调用预置的用户标签库,根据所述目标相似度对所述目标用户进行用户标签匹配,得到所述目标用户对应的用户标签;将所述用户标签作为所述目标用户的用户画像。
进一步地,服务器将用户画像存储于区块链数据库中,具体此处不做限定。
本发明实施例中,通过对目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对目标症状数据进行编码处理,得到目标向量,编码处理可以使目标症状数据被神经网络模型有效的识别;将目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;将目标数据输入预置的神经网络模型中进行融合映射,得到映射数据,深度学习网络有效的提升了特征提取的准确率;对特征数据和所述映射数据进行数据融合,得到融合数据;将融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据目标相似度生成目标用户的用户画像,提高了用户画像生成的准确率。
上面图3和图4从模块化功能实体的角度对本发明实施例中的用户画像生成装置进行详细描述,下面从硬件处理的角度对本发明实施例中用户画像生成设备进行详细描述。
图5是本发明实施例提供的一种用户画像生成设备的结构示意图,该用户画像生成设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对用户画像生成设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在用户画像生成设备500上执行存储介质530中的一系列指令操作。
用户画像生成设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的用户画像生成设备结构并不构成对用户画像生成设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种用户画像生成设备,所述用户画像生成设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述用户画像生成方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述用户画像生成方法的步骤。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种用户画像生成方法,其特征在于,所述用户画像生成方法包括:
获取目标用户的目标症状数据,所述目标症状数据用于指示所述目标用户对应的多个症状名称;
对所述目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对所述目标症状数据进行编码处理,得到目标向量;
将所述目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;
将所述目标数据输入预置的神经网络模型中进行融合映射,得到映射数据;
对所述特征数据和所述映射数据进行数据融合,得到融合数据;
将所述融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据所述目标相似度生成所述目标用户的用户画像。
2.根据权利要求1所述的用户画像生成方法,其特征在于,在所述获取目标用户的目标症状数据之前,还包括:
获取多个样本数据,并对所述多个样本数据进行实体和属性数据抽取,得到多个样本目标数据;
将所述多个样本目标数据输入预置的第一训练模型中进行特征提取,得到多个样本映射数据;
分别计算所述多个样本映射数据的损失值,得到多个第一损失值;
根据所述多个第一损失值对所述第一训练模型进行参数调整,直至所述第一训练模型收敛,得到神经网络模型。
3.根据权利要求1所述的用户画像生成方法,其特征在于,在所述获取目标用户的症状数据之前,在所述获取多个样本数据之后,还包括:
对所述多个样本数据进行编码处理,得到多个样本目标向量;
将所述多个样本目标向量输入预置的第二训练模型中进行语义分析,得到多个样本特征数据;
分别计算所述多个样本特征数据的损失值,得到多个第二损失值;
根据所述多个第二损失值对所述第二训练模型进行参数调整,直至所述第二训练模型收敛,得到数据处理模型。
4.根据权利要求1所述的用户画像生成方法,其特征在于,所述对所述目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对所述目标症状数据进行编码处理,得到目标向量,包括:
基于预置的关键词库对所述目标症状数据进行实体和属性数据抽取,得到目标数据;
对所述目标症状数据进行词向量转换,得到目标词向量,并对所述目标症状数据进行段向量转换,得到目标段向量,以及对所述目标症状数据进行位置向量转换,得到目标位置向量;
对所述目标词向量、所述目标段向量和所述目标位置向量进行拼接,得到目标向量。
5.根据权利要求1所述的用户画像生成方法,其特征在于,所述将所述目标向量输入预置的数据处理模型中进行特征提取,得到特征数据,包括:
将所述目标向量输入预置的数据处理模型中,所述数据处理模型包括:编码器和解码器;
通过所述编码器对所述目标向量进行编码转换,得到目标输入向量;
通过所述解码器对所述目标输入向量进行语义特征提取,得到特征数据。
6.根据权利要求1所述的用户画像生成方法,其特征在于,所述将所述目标数据输入预置的神经网络模型中进行融合映射,得到映射数据,包括:
将所述目标数据输入预置的神经网络模型中,所述神经网络模型包括:多层聚合层和嵌入层;
通过所述多层聚合层对所述目标数据进行特征信息融合,得到目标融合信息;
通过所述嵌入层对所述目标融合信息进行数据映射,得到映射数据。
7.根据权利要求1-6中任一项所述的用户画像生成方法,其特征在于,所述将所述融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据所述目标相似度生成所述目标用户的用户画像,包括:
将所述融合数据输入预置的线性回归层,通过所述线性回归层对所述融合数据进行逻辑回归运算,得到目标相似度;
调用预置的用户标签库,根据所述目标相似度对所述目标用户进行用户标签匹配,得到所述目标用户对应的用户标签;
将所述用户标签作为所述目标用户的用户画像。
8.一种用户画像生成装置,其特征在于,所述用户画像生成装置包括:
获取模块,用于获取目标用户的目标症状数据,所述目标症状数据用于指示所述目标用户对应的多个症状名称;
编码模块,用于对所述目标症状数据中的实体和属性数据进行抽取,得到目标数据,并对所述目标症状数据进行编码处理,得到目标向量;
处理模块,用于将所述目标向量输入预置的数据处理模型中进行特征提取,得到特征数据;
提取模块,用于将所述目标数据输入预置的神经网络模型中进行融合映射,得到映射数据;
融合模块,用于对所述特征数据和所述映射数据进行数据融合,得到融合数据;
生成模块,用于将所述融合数据输入预置的线性回归层进行逻辑回归运算,得到目标相似度,并根据所述目标相似度生成所述目标用户的用户画像。
9.一种用户画像生成设备,其特征在于,所述用户画像生成设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述用户画像生成设备执行如权利要求1-7中任一项所述的用户画像生成方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述的用户画像生成方法。
CN202110919504.3A 2021-08-11 2021-08-11 用户画像生成方法、装置、设备及存储介质 Active CN113611427B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110919504.3A CN113611427B (zh) 2021-08-11 2021-08-11 用户画像生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110919504.3A CN113611427B (zh) 2021-08-11 2021-08-11 用户画像生成方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113611427A true CN113611427A (zh) 2021-11-05
CN113611427B CN113611427B (zh) 2024-09-10

Family

ID=78308195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110919504.3A Active CN113611427B (zh) 2021-08-11 2021-08-11 用户画像生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113611427B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115294682A (zh) * 2022-10-09 2022-11-04 深圳壹家智能锁有限公司 智能门锁的数据管理方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918671A (zh) * 2019-03-12 2019-06-21 西南交通大学 基于卷积循环神经网络的电子病历实体关系抽取方法
CN110069631A (zh) * 2019-04-08 2019-07-30 腾讯科技(深圳)有限公司 一种文本处理方法、装置以及相关设备
CN110197728A (zh) * 2019-03-12 2019-09-03 平安科技(深圳)有限公司 糖尿病的预测方法、装置及计算机设备
CN111597348A (zh) * 2020-04-27 2020-08-28 平安科技(深圳)有限公司 用户画像方法、装置、计算机设备和存储介质
CN112035757A (zh) * 2020-08-28 2020-12-04 康键信息技术(深圳)有限公司 医疗瀑布流推送方法、装置、设备及存储介质
CN112232889A (zh) * 2020-11-06 2021-01-15 腾讯科技(深圳)有限公司 一种用户兴趣画像扩展方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918671A (zh) * 2019-03-12 2019-06-21 西南交通大学 基于卷积循环神经网络的电子病历实体关系抽取方法
CN110197728A (zh) * 2019-03-12 2019-09-03 平安科技(深圳)有限公司 糖尿病的预测方法、装置及计算机设备
CN110069631A (zh) * 2019-04-08 2019-07-30 腾讯科技(深圳)有限公司 一种文本处理方法、装置以及相关设备
CN111597348A (zh) * 2020-04-27 2020-08-28 平安科技(深圳)有限公司 用户画像方法、装置、计算机设备和存储介质
CN112035757A (zh) * 2020-08-28 2020-12-04 康键信息技术(深圳)有限公司 医疗瀑布流推送方法、装置、设备及存储介质
CN112232889A (zh) * 2020-11-06 2021-01-15 腾讯科技(深圳)有限公司 一种用户兴趣画像扩展方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115294682A (zh) * 2022-10-09 2022-11-04 深圳壹家智能锁有限公司 智能门锁的数据管理方法、装置、设备及存储介质
CN115294682B (zh) * 2022-10-09 2022-12-06 深圳壹家智能锁有限公司 智能门锁的数据管理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113611427B (zh) 2024-09-10

Similar Documents

Publication Publication Date Title
CN111709233B (zh) 基于多注意力卷积神经网络的智能导诊方法及系统
CN109190110A (zh) 一种命名实体识别模型的训练方法、系统及电子设备
CN112434535B (zh) 基于多模型的要素抽取方法、装置、设备及存储介质
WO2022068160A1 (zh) 基于人工智能的重症问诊数据识别方法、装置、设备及介质
CN111710383A (zh) 病历质控方法、装置、计算机设备和存储介质
CN113836928B (zh) 文本实体生成方法、装置、设备及存储介质
CN113705733A (zh) 医疗票据图像处理方法及装置、电子设备、存储介质
CN113221570B (zh) 基于线上问诊信息的处理方法、装置、设备及存储介质
CN112287069A (zh) 基于语音语义的信息检索方法、装置及计算机设备
CN113868419A (zh) 基于人工智能的文本分类方法、装置、设备及介质
CN116484867A (zh) 命名实体识别方法及装置、存储介质、计算机设备
CN113611427B (zh) 用户画像生成方法、装置、设备及存储介质
CN113656601A (zh) 医患匹配方法、装置、设备及存储介质
CN117350291A (zh) 一种电子病历命名实体识别方法、装置、设备及存储介质
CN112199954A (zh) 基于语音语义的疾病实体匹配方法、装置及计算机设备
CN116737933A (zh) 文本分类方法、装置、电子设备及计算机可读存储介质
CN116741358A (zh) 问诊挂号推荐方法、装置、设备及存储介质
CN116702776A (zh) 基于跨中西医的多任务语义划分方法、装置、设备及介质
CN116109980A (zh) 一种基于视频文本匹配的动作识别方法
CN114936326A (zh) 基于人工智能的信息推荐方法、装置、设备及存储介质
CN115859984A (zh) 医疗命名实体识别模型训练方法、装置、设备及介质
CN114566295A (zh) 线上问诊方法、装置、设备及存储介质
CN113627514A (zh) 知识图谱的数据处理方法、装置、电子设备和存储介质
CN111723582A (zh) 智能语义分类方法、装置、设备及存储介质
CN118153692B (zh) 基于语义的跨模态知识联想方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220530

Address after: 518000 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd.

Address before: Room 12G, Area H, 666 Beijing East Road, Huangpu District, Shanghai 200001

Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd.

GR01 Patent grant