CN115525838A - 一种基于大数据用户画像的健康知识推荐方法及系统 - Google Patents
一种基于大数据用户画像的健康知识推荐方法及系统 Download PDFInfo
- Publication number
- CN115525838A CN115525838A CN202211187093.4A CN202211187093A CN115525838A CN 115525838 A CN115525838 A CN 115525838A CN 202211187093 A CN202211187093 A CN 202211187093A CN 115525838 A CN115525838 A CN 115525838A
- Authority
- CN
- China
- Prior art keywords
- user
- article
- recommendation
- knowledge
- big data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000036541 health Effects 0.000 title claims abstract description 27
- 238000010276 construction Methods 0.000 claims abstract description 10
- 230000011218 segmentation Effects 0.000 claims abstract description 10
- 230000006399 behavior Effects 0.000 claims description 32
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 239000003814 drug Substances 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 11
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于健康知识推荐技术领域,具体提供了一种基于大数据用户画像的健康知识推荐方法及系统,其中方法包括:根据用户固有属性及用户多维度行为记录,构建多维度的用户画像;根据关键词对知识文章进行领域细分得到文章分类;结合用户画像及文章分类对用户进行兴趣推荐。通过多维度用户画像构建,用户相似度,文章内容关键词提取等手段,完成了用户画像构建和文章领域细分就可以根据用户画像进行兴趣推荐,同时也可以根据用户相似度来推荐相似用户浏览过的知识文章。将相似推荐和兴趣推荐结合来对用户进行知识文章推荐,提高推荐的精准度和个性化。
Description
技术领域
本发明涉及健康知识推荐技术领域,更具体地,涉及一种基于大数据用户画像的健康知识推荐方法及系统。
背景技术
在当前自媒体时代,越来越多的人习惯通过网络去获取知识和一些生活小技巧和常识。药店平台和医院平台也提供基本的问诊购药服务之外也会有专门的知识模块进行科普。然而现有的一些药店和医院平台的知识文章推荐,大多只是对文章的随机推送或进行简单推荐,并没有重视用户与其推荐文章之间的关联性。用户在平台上的行为与知识推荐模块并没有产生交叉,或者只是简单地对近期行为进行推荐。这样的原因一部分是在于用户在这些平台方的行为较为单一,用户画像单薄,对于单人用户无法通过其行为数据构建完整的用户画像。另一部分在于推荐的文章内容细分度不够,无法形成多标签体系与用户画像进行对应。
发明内容
本发明针对现有技术中存在的健康知识文章推荐内容细分度较差,用户行为较为单一,用户画像单薄,无法形成多标签体系与用户画像进行对应的技术问题。
本发明提供了一种基于大数据用户画像的健康知识推荐方法,包括以下步骤:
S1,根据用户固有属性及用户多维度行为记录,构建多维度的用户画像;
S2,根据关键词对知识文章进行领域细分得到文章分类;
S3,结合用户画像及文章分类对用户进行兴趣推荐。
优选地,所述S1具体包括:从药店及医院平台获取用户多维度行为记录,所述用户多维度行为记录包括用户的问诊行为记录、购药行为记录、推荐文章点击记录、文章浏览记录和系统登录登出时间记录。
优选地,所述S1中用户固有属性具体包括:性别、年龄、籍贯、既往病史及治疗史。
优选地,所述S1还包括:使用协同过滤的方法对多用户进行关联寻找相似用户,推荐相似用户浏览记录,形成相似度推荐。
优选地,所述S3之后还包括:结合相似度推荐及兴趣推荐完成对用户的知识文章推荐。
优选地,所述S2具体包括:先对知识文章内容采用TF-IDF算法进行关键词提取,然后根据知识文章内容的关键词对知识文章进行领域细分。
优选地,所述S2具体包括以下步骤:
S21,对于文章中任意一个关键词的词频TF和/或逆文档频率IDF大于阈值时,计算出所述关键词与所述文章的相关性值=TF*IDF;
S22,按照步骤S21的方法,计算多个关键词的相关性值,以此对文章内容领域进行细分。
本发明还提供了一种基于大数据用户画像的健康知识推荐系统,所述系统用于实现基于大数据用户画像的健康知识推荐方法,包括:
用户画像构建模块,用于根据用户固有属性及用户多维度行为记录,构建多维度的用户画像;
领域分类模块,用于根据关键词对知识文章进行领域细分得到文章分类;
推荐模块,用于结合用户画像及文章分类对用户进行兴趣推荐。
本发明还提供了一种电子设备,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现基于大数据用户画像的健康知识推荐方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现基于大数据用户画像的健康知识推荐方法的步骤。
有益效果:本发明提供的一种基于大数据用户画像的健康知识推荐方法及系统,其中方法包括:根据用户固有属性及用户多维度行为记录,构建多维度的用户画像;根据关键词对知识文章进行领域细分得到文章分类;结合用户画像及文章分类对用户进行兴趣推荐。通过多维度用户画像构建,用户相似度,文章内容关键词提取等手段,完成了用户画像构建和文章领域细分就可以根据用户画像进行兴趣推荐,同时也可以根据用户相似度来推荐相似用户浏览过的知识文章。将相似推荐和兴趣推荐结合来对用户进行知识文章推荐,提高推荐的精准度和个性化。
附图说明
图1为本发明提供的一种基于大数据用户画像的健康知识推荐方法流程图;
图2为本发明提供的一种可能的电子设备的硬件结构示意图;
图3为本发明提供的一种可能的计算机可读存储介质的硬件结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
图1为本发明提供的一种基于大数据用户画像的健康知识推荐方法,包括:
S1,根据用户固有属性及用户多维度行为记录,构建多维度的用户画像;固有属性具体包括:性别、年龄、籍贯、既往病史及治疗史。
具体地,从药店及医院平台获取用户多维度行为记录,所述用户多维度行为记录包括用户的问诊行为记录、购药行为记录、推荐文章点击记录、文章浏览记录和系统登录登出时间记录。
S2,根据关键词对知识文章进行领域细分得到文章分类;
S3,结合用户画像及文章分类对用户进行兴趣推荐。
针对当前用户行为较为单一,用户画像单薄的问题。多维度记录用户行为信息,多用户进行关联。针对推荐文章细分度不够,充分挖掘文章信息,找到关联文章,挖掘关键词进行细分。具体通过多维度用户画像构建,用户相似度,文章内容关键词提取等手段,完成了用户画像构建和文章领域细分就可以根据用户画像进行兴趣推荐,同时也可以根据用户相似度来推荐相似用户浏览过的知识文章。将相似推荐和兴趣推荐结合来对用户进行知识文章推荐,提高推荐的精准度和个性化。
优选的方案,首先为了解决用户行为单一,历史记录数据不足导致用户画像不够丰满的问题,本发明采取多维度记录用户信息,包括用户的问诊行为记录、购药行为记录、推荐文章点击记录和登录登出时间记录等。
优选的方案,所述S1还包括:使用协同过滤的方法对多用户进行关联寻找相似用户,推荐相似用户浏览记录,形成相似度推荐。除了对用户行为进行多维度记录,对多用户进行关联寻找相似用户也是完善用户画像的一种手段。使用协同过滤的方法找到用户之间的相似度。
优选的方案,为了对推荐知识文章进行细分,可以对文章内容进行深度挖掘找到多个关键词。对文章内容采用TF-IDF算法进行关键词提取,提取出多个关键词即是多个细分领域。完成用户画像构建和文章领域细分就可以根据用户画像进行兴趣推荐,同时也可以根据用户相似度来推荐相似用户浏览过的知识文章。
具体地,利用基于用户的协同过滤(UserCF)对用户进行相似度计算,找到相似用户,为用户推荐其相似用户看过的文章。结合这两种推荐方式即可完成对用户的知识文章推荐。将相似推荐和兴趣推荐结合来对用户进行知识文章推荐,提高推荐的精准度和个性化。
进一步的方案,所述S2具体包括:先对知识文章内容采用TF-IDF算法进行关键词提取,然后根据知识文章内容的关键词对知识文章进行领域细分。具体包括:
S21,对于文章中任意一个关键词的词频TF和/或逆文档频率IDF大于阈值时,计算出所述关键词与所述文章的相关性值=TF*IDF;
S22,按照步骤S21的方法,计算多个关键词的相关性值,以此对文章内容领域进行细分。
在一个具体的实施场景中:
对于文章内容采用TF-IDF算法进行关键词提取,如某篇文章中糖尿病的词频(term frequency,TF)和逆文档频率(inverse document frequency,IDF)都较大,其中逆向文件频率(inverse document frequency,IDF)是一个词语普遍重要性的度量。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到。则计算出糖尿病与该文章的相关性=TF*IDF。计算多个关键词的相关性值,取前几个则可作为文章的关键词,以此对文章内容领域进行细分。结合文章分类和用户画像可以进行兴趣推荐。
本发明实施例还提供了一种基于大数据用户画像的健康知识推荐系统,所述系统用于实现基于大数据用户画像的健康知识推荐方法,包括:
用户画像构建模块,用于根据用户固有属性及用户多维度行为记录,构建多维度的用户画像;
领域分类模块,用于根据关键词对知识文章进行领域细分得到文章分类;
推荐模块,用于结合用户画像及文章分类对用户进行兴趣推荐。
请参阅图2为本发明实施例提供的电子设备的实施例示意图。如图2所示,本发明实施例提了一种电子设备,包括存储器1310、处理器1320及存储在存储器1310上并可在处理器1320上运行的计算机程序1311,处理器1320执行计算机程序1311时实现以下步骤:S1,根据用户固有属性及用户多维度行为记录,构建多维度的用户画像;
S2,根据关键词对知识文章进行领域细分得到文章分类;
S3,结合用户画像及文章分类对用户进行兴趣推荐。
请参阅图3为本发明提供的一种计算机可读存储介质的实施例示意图。如图3所示,本实施例提供了一种计算机可读存储介质1400,其上存储有计算机程序1411,该计算机程序1411被处理器执行时实现如下步骤:S1,根据用户固有属性及用户多维度行为记录,构建多维度的用户画像;
S2,根据关键词对知识文章进行领域细分得到文章分类;
S3,结合用户画像及文章分类对用户进行兴趣推荐。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
Claims (10)
1.一种基于大数据用户画像的健康知识推荐方法,其特征在于,包括以下步骤:
S1,根据用户固有属性及用户多维度行为记录,构建多维度的用户画像;
S2,根据关键词对知识文章进行领域细分得到文章分类;
S3,结合用户画像及文章分类对用户进行兴趣推荐。
2.根据权利要求1所述的基于大数据用户画像的健康知识推荐方法,其特征在于,所述S1具体包括:从药店及医院平台获取用户多维度行为记录,所述用户多维度行为记录包括用户的问诊行为记录、购药行为记录、推荐文章点击记录、文章浏览记录和系统登录登出时间记录。
3.根据权利要求1所述的基于大数据用户画像的健康知识推荐方法,其特征在于,所述S1中用户固有属性具体包括:性别、年龄、籍贯、既往病史及治疗史。
4.根据权利要求1所述的基于大数据用户画像的健康知识推荐方法,其特征在于,所述S1还包括:使用协同过滤的方法对多用户进行关联寻找相似用户,推荐相似用户浏览记录,形成相似度推荐。
5.根据权利要求4所述的基于大数据用户画像的健康知识推荐方法,其特征在于,所述S3之后还包括:结合相似度推荐及兴趣推荐完成对用户的知识文章推荐。
6.根据权利要求1所述的基于大数据用户画像的健康知识推荐方法,其特征在于,所述S2具体包括:先对知识文章内容采用TF-IDF算法进行关键词提取,然后根据知识文章内容的关键词对知识文章进行领域细分。
7.根据权利要求6所述的基于大数据用户画像的健康知识推荐方法,其特征在于,所述S2具体包括以下步骤:
S21,对于文章中任意一个关键词的词频TF和/或逆文档频率IDF大于阈值时,计算出所述关键词与所述文章的相关性值=TF*IDF;
S22,按照步骤S21的方法,计算多个关键词的相关性值,以此对文章内容领域进行细分。
8.一种基于大数据用户画像的健康知识推荐系统,其特征在于,所述系统用于实现如权利要求1-7任一项所述的基于大数据用户画像的健康知识推荐方法,包括:
用户画像构建模块,用于根据用户固有属性及用户多维度行为记录,构建多维度的用户画像;
领域分类模块,用于根据关键词对知识文章进行领域细分得到文章分类;
推荐模块,用于结合用户画像及文章分类对用户进行兴趣推荐。
9.一种电子设备,其特征在于,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现如权利要求1-7任一项所述的基于大数据用户画像的健康知识推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现如权利要求1-7任一项所述的基于大数据用户画像的健康知识推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211187093.4A CN115525838A (zh) | 2022-09-28 | 2022-09-28 | 一种基于大数据用户画像的健康知识推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211187093.4A CN115525838A (zh) | 2022-09-28 | 2022-09-28 | 一种基于大数据用户画像的健康知识推荐方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115525838A true CN115525838A (zh) | 2022-12-27 |
Family
ID=84700065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211187093.4A Withdrawn CN115525838A (zh) | 2022-09-28 | 2022-09-28 | 一种基于大数据用户画像的健康知识推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115525838A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116226539A (zh) * | 2023-05-04 | 2023-06-06 | 浙江保融科技股份有限公司 | 一种自动化内容推荐方法及系统 |
CN117372093A (zh) * | 2023-09-20 | 2024-01-09 | 北京约来健康科技有限公司 | 一种内容推荐方法、系统、电子设备及介质 |
-
2022
- 2022-09-28 CN CN202211187093.4A patent/CN115525838A/zh not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116226539A (zh) * | 2023-05-04 | 2023-06-06 | 浙江保融科技股份有限公司 | 一种自动化内容推荐方法及系统 |
CN116226539B (zh) * | 2023-05-04 | 2023-07-18 | 浙江保融科技股份有限公司 | 一种自动化内容推荐方法及系统 |
CN117372093A (zh) * | 2023-09-20 | 2024-01-09 | 北京约来健康科技有限公司 | 一种内容推荐方法、系统、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Eke et al. | A survey of user profiling: State-of-the-art, challenges, and solutions | |
Anandhan et al. | Social media recommender systems: review and open research issues | |
Kosinski et al. | Mining big data to extract patterns and predict real-life outcomes. | |
Abu-Salih et al. | CredSaT: Credibility ranking of users in big social data incorporating semantic analysis and temporal factor | |
Bouadjenek et al. | Social networks and information retrieval, how are they converging? A survey, a taxonomy and an analysis of social information retrieval approaches and platforms | |
Liu et al. | Social temporal collaborative ranking for context aware movie recommendation | |
US8589434B2 (en) | Recommendations based on topic clusters | |
CN115525838A (zh) | 一种基于大数据用户画像的健康知识推荐方法及系统 | |
Pawlicka et al. | A systematic review of recommender systems and their applications in cybersecurity | |
KR20160075739A (ko) | 소셜 데이터 네트워크에 있어서의 인플루언서들을 결정하기 위한 시스템 및 방법 | |
Yan et al. | Generating electronic health records with multiple data types and constraints | |
CN111522886B (zh) | 一种信息推荐方法、终端及存储介质 | |
Feldman et al. | Beyond volume: The impact of complex healthcare data on the machine learning pipeline | |
CN104615741B (zh) | 一种基于云计算的冷启动项目推荐的方法及装置 | |
Xie et al. | A hybrid semantic item model for recipe search by example | |
Sisodia et al. | Fast prediction of web user browsing behaviours using most interesting patterns | |
Wee et al. | Mean rank, equipercentile, and regression mapping of world health organization quality of life brief (WHOQOL-BREF) to EuroQoL 5 dimensions 5 levels (EQ-5D-5L) utilities | |
CN106294502B (zh) | 一种电子书信息处理方法及装置 | |
Vink et al. | Multiple imputation of squared terms | |
CN111010592A (zh) | 一种视频推荐方法、装置、电子设备及存储介质 | |
CN105493084A (zh) | 社交摘录扩充 | |
Doerfel et al. | An analysis of tag-recommender evaluation procedures | |
Neve et al. | Hybrid reciprocal recommender systems: Integrating item-to-user principles in reciprocal recommendation | |
EP2824589A1 (en) | Method for enriching a multimedia content, and corresponding device. | |
CN110795640B (zh) | 一种弥补群组成员差异的自适应组推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20221227 |