CN115862806A - 一种基于隐私保护的健康画像构建方法 - Google Patents

一种基于隐私保护的健康画像构建方法 Download PDF

Info

Publication number
CN115862806A
CN115862806A CN202211594056.5A CN202211594056A CN115862806A CN 115862806 A CN115862806 A CN 115862806A CN 202211594056 A CN202211594056 A CN 202211594056A CN 115862806 A CN115862806 A CN 115862806A
Authority
CN
China
Prior art keywords
user
medicine
portrait
analyzing
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202211594056.5A
Other languages
English (en)
Inventor
严毓培
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai City Polytechnic
Original Assignee
Zhuhai City Polytechnic
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai City Polytechnic filed Critical Zhuhai City Polytechnic
Priority to CN202211594056.5A priority Critical patent/CN115862806A/zh
Publication of CN115862806A publication Critical patent/CN115862806A/zh
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请提供一种基于隐私保护的健康画像构建方法,包括:确定药物画像;根据用户购药记录,分析用户病情;基于用户病情及用户信息,确定用户画像;根据用户画像,分析隐私保护需求;基于用户点击行为,分析不同场景用户对画像的敏感程度;基于用户对药物画像的敏感程度,调整用户画像;基于用户画像及交互场景,进行用户画像交互。

Description

一种基于隐私保护的健康画像构建方法
技术领域
本发明涉及信息技术领域,尤其涉及一种基于隐私保护的健康画像构建方法。
背景技术
用户画像是一种常规的平台推荐技术,但对于药物的推荐,经常不仅仅要求精准,而且还可能跟用户的操作环境有关。因为用户的屏幕,并不是永远都只有自己能看见。例如,一个痔疮患者,并不希望自己的病情被旁边的人知道。因此如果因为他购买了痔疮药物,但平台经常推荐痔疮相关药物,就会让人知道他的隐私和病情,导致病情泄露。但是感冒药并不会有相同问题,以为它不属于隐私药物,因此可以以最精准的方式推荐,不用考虑其他隐私保护因素。因此,有没有办法让药物推荐具有隐私保护的能力,在推荐不当时,用户能不能通过自己的选择,手动修改画像。在什么样的场景下,可以推荐隐私类药物。这些都是未解决的问题
发明内容
本发明提供了一种基于隐私保护的健康画像构建方法,主要包括:
确定药物画像,所述确定药物画像,具体包括:根据药品的适用症状,分析药品营销类画像,根据药品评论,分析药品的隐私类画像,根据药品价格,销售量,治疗效果及适用症状,分析药品的通用类画像;根据用户购药记录,分析用户病情;基于用户病情及用户信息,确定用户画像;根据用户画像,分析隐私保护需求,所述根据用户画像,分析隐私保护需求,具体包括:根据病情隐私程度,判断需要保护的画像的类别和数量,基于差分隐私保护,保护用户购药隐私;基于用户点击行为,分析不同场景用户对画像的敏感程度,所述基于用户点击行为,分析不同场景用户对画像的敏感程度,具体包括:识别用户点击行为,基于用户点击行为,分析交互场景,基于点击行为及使用场景,分析用户对画像的敏感程度;基于用户对药物画像的敏感程度,调整用户画像;基于用户画像及交互场景,进行用户画像交互。
进一步可选地,所述确定药物画像包括:
首先,确定药品画像的相关数据,包括药品的价格、销售量、适用症状和评论;确定药物画像,包括药品的营销类画像,隐私类画像及通用类画像;通过对外卖平台进行数据爬取,获取药品的销售量,价格,适用症状及评论;根据所述药品画像的相关数据进行数据预处理,对数据进行分类并整理归纳;对预处理后的数据利用ETL方式进行数据清洗,删除缺失数据、重复数据与错误数据,提取有效数据;包括:根据药品的适用症状,分析药品营销类画像;根据药品评论,分析药品的隐私类画像;根据药品价格,销售量,治疗效果及适用症状,分析药品的通用类画像;
所述根据药品的适用症状,分析药品营销类画像,具体包括:
根据药品的适用症状,确定药品购买者群体的特征信息,包括药品购买者群体的年龄段,性别;基于药品购买者群体的特征信息及患病症状,分析药品购买者群体因患病产生的生活需求;基于药品购买者因患病产生的生活需求,分析与其生活需求相关领域并提取对应领域的特征信息;结合药品购买者因患病产生的生活需求相关领域的特征信息,以及药品购买者群体的特征信息,采用K-means聚类算法,获取药品相对于所述药品购买者群体的营销类画像。
所述根据药品评论,分析药品的隐私类画像,具体包括:
基于爬取并进行数据清洗后获取的药品评论信息,采用互信息和左右熵,以Tire树为数据结构提取所述药品评论信息中的关键性词语;基于提取的所述药品评论信息中的至少一个关键性词语,采用多权TF-IDF算法计算各关键性词语对于药品评论占据的权重;确定在药品评论中占据权重高的关键性词语,并在药品评论信息中检索获取所述权重高的关键性词语的相关评论;根据所述与关键性词语相关评论的评论量及点击量,建立药品的隐私性分析模型,即P=H/C,所述P为隐私度,所述H为点击量,所述C为评论量;基于药品的评论关键性词语及隐私性分析模型,获取药品的隐私类画像。
所述根据药品价格,销售量,治疗效果及适用症状,分析药品的通用类画像,具体包括:
根据药品价格,销售量及适用症状,提取药品适用群体的特征信息;基于药品适用群体的特征信息,分析药品适用群体的购药需求及消费心理;结合药品适用群体的购买需求及消费心理,比较相同治疗症状,处于不同价位药品的销售量,分析药品的销售情况;通过比较同类药品的销售情况,治疗效果及价格,分析同类不同价位药品对于药品适用群体的性价比;根据分析获取的同类不同价位的药品性价比,获取药品的通用类画像。
进一步可选地,所述根据用户购药记录,分析用户病情包括:
所述用户病情包括用户的患病类别,患病严重程度,治疗的疗程;基于用户的历史药品购买记录获取药品信息,按照药品所属疾病类型对药品进行分类及归纳整理,获取药品涵盖的疾病类型;基于已划分的疾病类型,对应疾病常见症状及各疾病药品适用症状,对比分析用户所患疾病,对应症状,以及患病症状对应疾病的患病严重程度;根据用户患病症状及患病严重程度,结合疾病不同疗程阶段症状,对比分析用户所处的治疗疗程阶段。
进一步可选地,所述基于用户病情及用户信息,确定用户画像包括:
首先,确定用户信息,包括用户的属性特征,用户评价数据,以及用户行为数据;所述用户的属性特征,包括用户的年龄,性别;所述用户评价数据,包括对应商品是个否有差评、差评率、累计评论数分段信息;所述用户行为数据,包括对应商品的浏览商品详情页行为、加购物车行为、删购物车行为、下单行为、关注行为和点击行为信息;对用户的属性特征,用户评价数据,以及用户行为数据采取独热编码;基于用户信息及药品画像,使用GBDT梯度提升决策树模型构建用户画像预测模型,确定用户画像。
进一步可选地,所述根据用户画像,分析隐私保护需求包括:
利用数据挖掘技术,分析用户画像包含的特征字段,字节的含义;采用K近邻分类算法对用户画像特征信息对应的缺失信息进行插补;基于用户画像,判断用户是否具有疾病,以及相应的病情;根据用户的病情,分析对应患病症状的治疗药品;根据获取的对应治疗药品,通过查询药品信息,并与同类药品对比分析,并结合药品的适用症状,适用群体特征,确定药品的画像;获取对应治疗药物的隐私类画像,并结合用户画像,分析用户所患疾病及病情,通过比较分析获取需要进行隐私保护的药物画像及用户画像信息;包括:根据病情隐私程度,判断需要保护的画像的类别和数量;基于差分隐私保护,保护用户购药隐私;
所述根据病情隐私程度,判断需要保护的画像的类别和数量,具体包括:
根据用户患病病情,确定对应症状治疗药品的画像,包括营销类画像,隐私类画像,以及通用类画像;根据用户患病症状,以及因患病产生的生活需求领域的隐私性,对比其他药品,分析药品营销类画像的保护必要程度;根据用户所患疾病症状对应治疗药品的评论关键词语,对比分析药品隐私类画像的保护必要程度;根据用户所属群体的特征信息,对比分析药品通用类画像的保护必要程度;建立用户隐私性保护模型,将用户个人信息,所患疾病,对应治疗药品,以及药品需要进行隐私性保护的画像类别及数量,进行归纳整理。
所述基于差分隐私保护,保护用户购药隐私,具体包括:
基于差分隐私保护机制,保护用户画像及购药隐私;根据用户画像及药品画像,生成符合用户药物购买行为规律的主题特征词;利用多项先验分布模型模拟用户药物购买行为的决策过程,对用户决策过程中的行为进行概率预测;针对多项先验分布中的隐含变量,采用Gibbs抽样方法,迭代计算符合用户药物购买行为规律的主题特征词的预测模型参数;根据计算获取的模型参数,向获取符合用户药物购买行为规律的主题特征词的采样过程添加Laplace噪声,影响计数统计结果;通过对计数统计结果的影响,干扰潜在符合用户药物购买行为规律的主题特征词的联合概率分布,降低隐私信息被推断攻击的风险,保护用户画像与药品画像。
进一步可选地,所述基于用户点击行为,分析不同场景用户对画像的敏感程度包括:
首先,确定用户的点击行为数据,包括用户对于药品广告的点击行为数据与用户于当前页面的点击行为数据;采集的用户点击行为数据利用ETL方式进行数据清洗,删除缺失数据、重复数据与错误数据,提取数据连贯完整程度高的用户有效数据;其中,点击行为数据包括对页面的点击,搜索,分享,下载,评论,上传行为;根据用户对于当前页面的点击行为数据,分析用户的接收到广告时所处的使用场景;基于用户对于药品广告的点击行为数据,并结合用户当前的使用场景,通过对比分析相同场景下不同用户对于药品广告的点击行为数据,对各场景下用户对于药品广告的的敏感程度进行分级划分;包括:识别用户点击行为;基于用户点击行为,分析交互场景;基于点击行为及使用场景,分析用户对画像的敏感程度;
所述识别用户点击行为,具体包括:
基于用户的HTTP流,对网络端用户的点击行为进行识别;从用户的混合HTTP请求流中提取观测特征序列;通过识别模块把特征序列映射到由两个行为模型实例组成的或然概率判决空间;根据判决空间中的综合行为分类器,判定混合HTTP请求流片段中第一个请求的点击属性;根据第一个请求的点击属性,将请求流分离为点击序列和自动请求序列两种类别;根据请求流的类别不同,采用隐马尔可夫模型框架的状态链在不同类别下,对用户点击行为轮廓进行判定;基于用户点击行为轮廓的判定结果,按照不同点击属性分类获取用户对应的点击行为数据。
所述基于用户点击行为,分析交互场景,具体包括:
根据不同场景样本点击行为数据的标注取值、场景特征和预设损失函数,训练场景预测概率数据模型;基于不同场景样本数据,确定场景预测概率数据模型的训练样本与测试样本;通过测试集对场景预测概率数据模型进行测试,并且调整参数,不断训练,提高模型的精确度;基于用户点击行为数据,获取用户接收到药物画像前后时间段用户点击行为数据;根据用户的点击行为数据及所述场景预测概率数据模型,对目标用户的当前的操作场景进行分析预测。
所述基于点击行为及使用场景,分析用户对画像的敏感程度,具体包括:
获取用户接收到药物画像后,用户对于药物画像的反应时间间隔,以及进行的点击行为;基于用户的点击行为和场景预测概率数据模型,分析用户接收到药物画像前后时间段的所处的交互场景;基于不同场景下用户对于药物画像敏感度分析的样本数据,构建敏感程度分析模型;基于用户接收到药物画像前后时间段的交互场景,用户对于药物画像的反应时间间隔,以及进行的点击行为,分析获取用户对于提供的药物画像的敏感程度。
进一步可选地,所述基于用户对药物画像的敏感程度,调整用户画像包括:
基于用户画像,将药物画像发送至对应用户画像的用户客户端;根据用户对于药物画像的点击行为数据,及当前的交互场景,分析用户对于药物画像的敏感程度;基于用户对于接收到的药物画像的敏感程度,分析用户对于当前药物画像的购买意向;根据用户对于当前药物画像的购买意向,对于用户画像进行相应的调整;根据调整后的用户画像,对于药物画像的推荐频率,种类,时间,设计界面进行调整。
一种基于隐私保护的健康画像构建方法其特征在于,所述系统包括:
基于用户画像及当前用户的交互场景,分析用户对于药物画像的敏感程度;基于用户对于药物画像的敏感程度,及调整后的用户画像,对于药物画像的交互方式进行调整;根据使用场景及用户画像,选择适当的药物画像推荐场景,时间及频率;并制定对应的销售策略,包括调整药品价格,制定个性化广告内容,选取广告投放平台及网页界面;根据同类治疗症状,对于处于不同价位的药品的销售量,对于药品的价格进行调整。
本发明实施例提供的技术方案可以包括以下有益效果:
本发明通过对药物隐私类的用户画像推荐进行针对性判断,使用户画像得到修正,并且判断推荐场景,使用户隐私得到最大保护,并使用户乐于接受用户画像的药物推荐。
附图说明
图1为本发明的一种基于隐私保护的健康画像构建方法的流程图。
图2为本发明的一种基于隐私保护的健康画像构建方法的示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1为本发明的一种基于隐私保护的健康画像构建方法流程图。如图1所示,本实施例一种基于隐私保护的健康画像构建方法具体可以包括:
步骤101,确定药物画像。
首先,确定药品画像的相关数据,包括药品的价格、销售量、适用症状和评论;确定药物画像,包括药品的营销类画像,隐私类画像及通用类画像;通过对外卖平台进行数据爬取,获取药品的销售量,价格,适用症状及评论;根据所述药品画像的相关数据进行数据预处理,对数据进行分类并整理归纳。对预处理后的数据利用ETL方式进行数据清洗,删除缺失数据、重复数据与错误数据,提取有效数据;例如,通过美团买药爬取的药品画像的相关数据,若获得的药品评论信息有多条评价为默认评价,则不计入评价信息。例如,剔除评论中的无效信息,包括存在的空格,表情,特殊符号。
根据药品的适用症状,分析药品营销类画像。
根据药品的适用症状,确定药品购买者群体的特征信息,包括药品购买者群体的年龄段,性别;基于药品购买者群体的特征信息及患病症状,分析药品购买者群体因患病产生的生活需求;基于药品购买者因患病产生的生活需求,分析与其生活需求相关领域并提取对应领域的特征信息;结合药品购买者因患病产生的生活需求相关领域的特征信息,以及药品购买者群体的特征信息,采用K-means聚类算法,获取药品相对于所述药品购买者群体的营销类画像;药品购买者群体的营销类画像,包括药品适用群体因患病产生的生活需求相关领域;其中,生活需求相关领域包括,生活需求用品的适用场景,购买途径,类型,使用方式,价格定位;例如,痔疮患者张三的症状对应生活需求相关领域为卫生用品领域,适用于上厕所情景,可通过超市及电商平台购买,对应类型为卫生用品,价格定位为低价商品,具体对应的需求用品为卫生纸,则卫生纸的特征信息包括吸水性强,无致病菌,质地柔软,卫生用品,抽纸,卷纸,生活必需品,低价,环保;例如,痔疮患者张三,男,年龄35岁,因患有痔疮,因而对于卫生纸的品质要求较高,因此可提取卫生纸销售领域的特征信息,以及处于30-40岁年龄段的男性消费群体的特征信息,用来构建药品的个性化营销类画像,获取其侧重领域及关注点。
根据药品评论,分析药品的隐私类画像。
基于爬取并进行数据清洗后获取的药品评论信息,采用互信息和左右熵,以Tire树为数据结构提取所述药品评论信息中的关键性词语;基于提取的所述药品评论信息中的至少一个关键性词语,采用多权TF-IDF算法计算各关键性词语对于药品评论占据的权重;确定在药品评论中占据权重高的关键性词语,并在药品评论信息中检索获取所述权重高的关键性词语的相关评论;根据所述与关键性词语相关评论的评论量及点击量,建立药品的隐私性分析模型,即P=H/C,所述P为隐私度,所述H为点击量,所述C为评论量;基于药品的评论关键性词语及隐私性分析模型,获取药品的隐私类画像;关键性词语为除去语气助词,连词等功能性词语,在评论信息中出现频率高,具有一定情绪表达及功能描述性的词语;例如,评论“这个药品太好用了”,则提取关键词可得“好用”一词;互信息是一个词语中包含的关于另一个词语的信息量,即两个词共同出现的概率。左右熵衡量预选词的自由度,左右熵越大,说明该预选词越有可能是独立词语。例如,痔疮药马应龙的点击量为5000,而评论量为20,痔疮药的隐私度为250,感冒药的点击量为5000,评论量为250,则感冒药的隐私度为20,可见马应龙的隐私性高。
根据药品价格,销售量,治疗效果及适用症状,分析药品的通用类画像。
根据药品价格,销售量及适用症状,提取药品适用群体的特征信息;基于药品适用群体的特征信息,分析药品适用群体的购药需求及消费心理;结合药品适用群体的购买需求及消费心理,比较相同治疗症状,处于不同价位药品的销售量,分析药品的销售情况;通过比较同类药品的销售情况,治疗效果及价格,分析同类不同价位药品对于药品适用群体的性价比;根据分析获取的同类不同价位的药品性价比,获取药品的通用类画像;药品适用群体的特征信息,指适用群体代表性特征,包括该群体所处的年龄分段,性别,经济状况,地区,家庭状况;药品的通用类画像包括药品的性价比,治疗症状特征,适用群体特征;例如,阳痿患者普遍为50岁左右的男性,该药品适用群体均对于对应治疗药品需求较高,且具有较高经济基础,因此对应药品价格普遍高,而药品A售价200元,月销售量5w,药品B售价300元,月销售量1w,而药品A与药品B的治疗效果相近,因此药品A的性价比更高。
步骤102,根据用户购药记录,分析用户病情。
所述用户病情包括用户的患病类别,患病严重程度,治疗的疗程;基于用户的历史药品购买记录获取药品信息,按照药品所属疾病类型对药品进行分类及归纳整理,获取药品涵盖的疾病类型;基于已划分的疾病类型,对应疾病常见症状及各疾病药品适用症状,对比分析用户所患疾病,对应症状,以及患病症状对应疾病的患病严重程度;根据用户患病症状及患病严重程度,结合疾病不同疗程阶段症状,对比分析用户所处的治疗疗程阶段;例如,药品代购人想要购买的药品为阿司匹林、西乐葆、双氯芬酸钠、倍他乐克、硝酸异山梨酯、维拉帕米,分析可得有类风湿性关炎缓解急性期关节肿胀、疼痛,且处于冠心病稳定期,有发作性的胸痛,同时伴有胸闷不适。
步骤103,基于用户病情及用户信息,确定用户画像。
首先,确定用户信息,包括用户的属性特征,用户评价数据,以及用户行为数据;所述用户的属性特征,包括用户的年龄,性别;所述用户评价数据,包括对应商品是个否有差评、差评率、累计评论数分段信息;所述用户行为数据,包括对应商品的浏览商品详情页行为、加购物车行为、删购物车行为、下单行为、关注行为和点击行为信息;对用户的属性特征,用户评价数据,以及用户行为数据采取独热编码;基于用户信息及药品画像,使用GBDT梯度提升决策树模型构建用户画像预测模型,确定用户画像;用户画像为详细的刻画一个人的特性,包括年龄,性别,职业,身高,体重等,同时也包括一个人习惯及偏好;GBDT梯度提升决策树模型不仅具有分类预测功能,也能实现回归预测,决策树的学习率设置为0.05;用户画像确定机器学习的训练样本与测试样本;通过测试集对用户画像预测模型进行测试并且调整参数,不断训练,提高模型的精确度。
步骤104,根据用户画像,分析隐私保护需求。
利用数据挖掘技术,分析用户画像包含的特征字段,字节的含义;采用K近邻分类算法对用户画像特征信息对应的缺失信息进行插补;基于用户画像,判断用户是否具有疾病,以及相应的病情;根据用户的病情,分析对应患病症状的治疗药品;根据获取的对应治疗药品,通过查询药品信息,并与同类药品对比分析,并结合药品的适用症状,适用群体特征,确定药品的画像;获取对应治疗药物的隐私类画像,并结合用户画像,分析用户所患疾病及病情,通过比较分析获取需要进行隐私保护的药物画像及用户画像信息;例如,对于张三的画像由于采集数据不全面,得出的画像信息并不具有代表性,采用K近邻分类算法进行插补,首先寻找与张三特征信息最相近的K个样本,其次将这K个样本的相应变量值众数作为张三缺失的画像信息,对张三画像信息进行插补。以感冒药的隐私性为划分界限,结合隐私类画像评定隐私性的方式,对于隐私性高于感冒药的药品评定为需进行隐私保护。
根据病情隐私程度,判断需要保护的画像的类别和数量。
根据用户患病病情,确定对应症状治疗药品的画像,包括营销类画像,隐私类画像,以及通用类画像;根据用户患病症状,以及因患病产生的生活需求领域的隐私性,对比其他药品,分析药品营销类画像的保护必要程度;根据用户所患疾病症状对应治疗药品的评论关键词语,对比分析药品隐私类画像的保护必要程度;根据用户所属群体的特征信息,对比分析药品通用类画像的保护必要程度;建立用户隐私性保护模型,将用户个人信息,所患疾病,对应治疗药品,以及药品需要进行隐私性保护的画像类别及数量,进行归纳整理;默认用户的个人信息是需进行隐私保护;以感冒药作的药物画像为界限,通过与感冒药的各类画像信息进行比较,划分用户患病症状对应的治疗药品,是否达到需要进行保护的程度。
基于差分隐私保护,保护用户购药隐私。
基于差分隐私保护机制,保护用户画像及购药隐私;根据用户画像及药品画像,生成符合用户药物购买行为规律的主题特征词;利用多项先验分布模型模拟用户药物购买行为的决策过程,对用户决策过程中的行为进行概率预测;针对多项先验分布中的隐含变量,采用Gibbs抽样方法,迭代计算符合用户药物购买行为规律的主题特征词的预测模型参数;根据计算获取的模型参数,向获取符合用户药物购买行为规律的主题特征词的采样过程添加Laplace噪声,影响计数统计结果;通过对计数统计结果的影响,干扰潜在符合用户药物购买行为规律的主题特征词的联合概率分布,降低隐私信息被推断攻击的风险,保护用户画像与药品画像;差分隐私保护是密码学中的一种手段,旨在提供一种当从统计数据库查询时,最大化数据查询的准确性,同时最大限度减少识别其记录的机会;符合用户药物购买行为规律的主题特征词包括时间,内容,空间,社会关系,地理位置;由于多项先验分布模型存在隐含变量,适用最大似然估计联合概率分布中的参数困难,则采用Gibbs方法对数据进行多维采样,迭代计算出变量参数;例如,张三符合用户药物购买行为规律的特征词为夜晚网页浏览率高,高薪阶层,浏览新闻页面频率高,点击广告频率低,网络购物平台点击率高;在添加Laplace噪声时,将差分隐私因子平均分配到每次的采样计算中;为了保护用户主题偏好的隐私性,防止攻击者获取活动项目的排名,采用噪声加扰的方法保护用户画像与药物画像中行为的排序输出顺序。
步骤105,基于用户点击行为,分析不同场景用户对画像的敏感程度。
首先,确定用户的点击行为数据,包括用户对于药品广告的点击行为数据与用户于当前页面的点击行为数据;采集的用户点击行为数据利用ETL方式进行数据清洗,删除缺失数据、重复数据与错误数据,提取数据连贯完整程度高的用户有效数据;其中,点击行为数据包括对页面的点击,搜索,分享,下载,评论,上传行为;根据用户对于当前页面的点击行为数据,分析用户的接收到广告时所处的使用场景;基于用户对于药品广告的点击行为数据,并结合用户当前的使用场景,通过对比分析相同场景下不同用户对于药品广告的点击行为数据,对各场景下用户对于药品广告的的敏感程度进行分级划分;仅在用户接收到药物画像的前后5分钟的时间段范围内,对用户点击行为进行针对性的识别获取,并在此基础上,对于获取的用户点击行为数据进行进一步分析,分析用户对于药物画像的敏感程度;完整程度高的用户有效数据,需具备点击行为的时间,次数,当前页面,导向链接,内容信息。
识别用户点击行为。
基于用户的HTTP流,对网络端用户的点击行为进行识别;从用户的混合HTTP请求流中提取观测特征序列;通过识别模块把特征序列映射到由两个行为模型实例组成的或然概率判决空间;根据判决空间中的综合行为分类器,判定混合HTTP请求流片段中第一个请求的点击属性;根据第一个请求的点击属性,将请求流分离为点击序列和自动请求序列两种类别;根据请求流的类别不同,采用隐马尔可夫模型框架的状态链在不同类别下,对用户点击行为轮廓进行判定;基于用户点击行为轮廓的判定结果,按照不同点击属性分类获取用户对应的点击行为数据;在不涉及用户隐私的条件下获取用户完整的点击路径;隐马尔可夫模型架构,描述点击流与非点击流的时变行为过程,模型的隐状态代表驱动网络流的行为模式,隐状态的跳转代表行为模式的变化,隐马尔可夫模型架构的观测值表示在特定驱动模式下,网络流的外在行为特征。
基于用户点击行为,分析交互场景。
根据不同场景样本点击行为数据的标注取值、场景特征和预设损失函数,训练场景预测概率数据模型;基于不同场景样本数据,确定场景预测概率数据模型的训练样本与测试样本;通过测试集对场景预测概率数据模型进行测试,并且调整参数,不断训练,提高模型的精确度;基于用户点击行为数据,获取用户接收到药物画像前后时间段用户点击行为数据;根据用户的点击行为数据及所述场景预测概率数据模型,对目标用户的当前的操作场景进行分析预测;例如,基于用户的点击行为数据,使用场景预测概率数据模型,对张三和李四当前的使用场景进行分析预测,得出张三在进行办公,李四在观看网页视频。
基于点击行为及使用场景,分析用户对画像的敏感程度。
获取用户接收到药物画像后,用户对于药物画像的反应时间间隔,以及进行的点击行为;基于用户的点击行为和场景预测概率数据模型,分析用户接收到药物画像前后时间段的所处的交互场景;基于不同场景下用户对于药物画像敏感度分析的样本数据,构建敏感程度分析模型;基于用户接收到药物画像前后时间段的交互场景,用户对于药物画像的反应时间间隔,以及进行的点击行为,分析获取用户对于提供的药物画像的敏感程度;对于使用场景的分析预测,基于用户接收到药物画像的前后5分钟的点击行为数据进行分析;例如,用户接收到药物画像时正在打游戏,注意力集中,没有注意到药物画像,在该交互场景下的用户对于药物画像的敏感程度反应时间划分标准时间增加30s。
步骤106,基于用户对药物画像的敏感程度,调整用户画像。
基于用户画像,将药物画像发送至对应用户画像的用户客户端;根据用户对于药物画像的点击行为数据,及当前的交互场景,分析用户对于药物画像的敏感程度;基于用户对于接收到的药物画像的敏感程度,分析用户对于当前药物画像的购买意向;根据用户对于当前药物画像的购买意向,对于用户画像进行相应的调整;根据调整后的用户画像,对于药物画像的推荐频率,种类,时间,设计界面进行调整;例如,获取的用户点击行为数据显示,张三在接收到药物马应龙的药物画像时,正在办公,且接收到药物画像3s后即关闭,则表明在当前场景下,张三对于药物画像的购买意向低,改变药物画像的发送时间及降低频率;例如,获取的用户点击行为数据显示,李四在接收到药物马应龙的药物画像时,正在打游戏,且接收到药物画像3s后即点击广告页面详情,则表明在当前场景下,张三对于药物画像的购买意向高,提高药物画像的发送频率。
步骤107,基于用户画像及交互场景,进行用户画像交互。
基于用户画像及当前用户的交互场景,分析用户对于药物画像的敏感程度;基于用户对于药物画像的敏感程度,及调整后的用户画像,对于药物画像的交互方式进行调整;根据使用场景及用户画像,选择适当的药物画像推荐场景,时间及频率;并制定对应的销售策略,包括调整药品价格,制定个性化广告内容,选取广告投放平台及网页界面;根据同类治疗症状,对于处于不同价位的药品的销售量,对于药品的价格进行调整;例如,痔疮患者张三同时收到两种马应龙推荐画像,产品A广告界面鲜明且价格较低,产品B广告内容直白且含有较多敏感词汇,则张三会倾向于选择产品A;张三在白天工作时间办公场景下,对于药物A的画像的敏感程度较高,因此需调整至下班居家时间对于张三进行药物画像的推送。
以上仅列举了本发明的一些优选实施方式,但本发明并不局限于此,还可以作出许多的改进和变换。只要是在本发明基本原理基础上所作出的改进与变换,均应视为落入本发明的保护范围内。

Claims (8)

1.一种基于隐私保护的健康画像构建方法,其特征在于,所述方法包括:
确定药物画像,所述确定药物画像,具体包括:根据药品的适用症状,分析药品营销类画像,根据药品评论,分析药品的隐私类画像,根据药品价格,销售量,治疗效果及适用症状,分析药品的通用类画像;根据用户购药记录,分析用户病情;基于用户病情及用户信息,确定用户画像;根据用户画像,分析隐私保护需求,所述根据用户画像,分析隐私保护需求,具体包括:根据病情隐私程度,判断需要保护的画像的类别和数量,基于差分隐私保护,保护用户购药隐私;基于用户点击行为,分析不同场景用户对画像的敏感程度,所述基于用户点击行为,分析不同场景用户对画像的敏感程度,具体包括:识别用户点击行为,基于用户点击行为,分析交互场景,基于点击行为及使用场景,分析用户对画像的敏感程度;基于用户对药物画像的敏感程度,调整用户画像;基于用户画像及交互场景,进行用户画像交互。
2.根据权利要求1所述的方法,其中,所述确定药物画像,包括:
首先,确定药品画像的相关数据,包括药品的价格、销售量、适用症状和评论;确定药物画像,包括药品的营销类画像,隐私类画像及通用类画像;通过对外卖平台进行数据爬取,获取药品的销售量,价格,适用症状及评论;根据所述药品画像的相关数据进行数据预处理,对数据进行分类并整理归纳;对预处理后的数据利用ETL方式进行数据清洗,删除缺失数据、重复数据与错误数据,提取有效数据;包括:根据药品的适用症状,分析药品营销类画像;根据药品评论,分析药品的隐私类画像;根据药品价格,销售量,治疗效果及适用症状,分析药品的通用类画像;
所述根据药品的适用症状,分析药品营销类画像,具体包括:
根据药品的适用症状,确定药品购买者群体的特征信息,包括药品购买者群体的年龄段,性别;基于药品购买者群体的特征信息及患病症状,分析药品购买者群体因患病产生的生活需求;基于药品购买者因患病产生的生活需求,分析与其生活需求相关领域并提取对应领域的特征信息;结合药品购买者因患病产生的生活需求相关领域的特征信息,以及药品购买者群体的特征信息,采用K-means聚类算法,获取药品相对于所述药品购买者群体的营销类画像;
所述根据药品评论,分析药品的隐私类画像,具体包括:
基于爬取并进行数据清洗后获取的药品评论信息,采用互信息和左右熵,以Tire树为数据结构提取所述药品评论信息中的关键性词语;基于提取的所述药品评论信息中的至少一个关键性词语,采用多权TF-IDF算法计算各关键性词语对于药品评论占据的权重;确定在药品评论中占据权重高的关键性词语,并在药品评论信息中检索获取所述权重高的关键性词语的相关评论;根据所述与关键性词语相关评论的评论量及点击量,建立药品的隐私性分析模型,即P=H/C,所述P为隐私度,所述H为点击量,所述C为评论量;基于药品的评论关键性词语及隐私性分析模型,获取药品的隐私类画像;
所述根据药品价格,销售量,治疗效果及适用症状,分析药品的通用类画像,具体包括:
根据药品价格,销售量及适用症状,提取药品适用群体的特征信息;基于药品适用群体的特征信息,分析药品适用群体的购药需求及消费心理;结合药品适用群体的购买需求及消费心理,比较相同治疗症状,处于不同价位药品的销售量,分析药品的销售情况;通过比较同类药品的销售情况,治疗效果及价格,分析同类不同价位药品对于药品适用群体的性价比;根据分析获取的同类不同价位的药品性价比,获取药品的通用类画像。
3.根据权利要求1所述的方法,其中,所述根据用户购药记录,分析用户病情,包括:
所述用户病情包括用户的患病类别,患病严重程度,治疗的疗程;基于用户的历史药品购买记录获取药品信息,按照药品所属疾病类型对药品进行分类及归纳整理,获取药品涵盖的疾病类型;基于已划分的疾病类型,对应疾病常见症状及各疾病药品适用症状,对比分析用户所患疾病,对应症状,以及患病症状对应疾病的患病严重程度;根据用户患病症状及患病严重程度,结合疾病不同疗程阶段症状,对比分析用户所处的治疗疗程阶段。
4.根据权利要求1所述的方法,其中,所述基于用户病情及用户信息,确定用户画像,包括:
首先,确定用户信息,包括用户的属性特征,用户评价数据,以及用户行为数据;所述用户的属性特征,包括用户的年龄,性别;所述用户评价数据,包括对应商品是个否有差评、差评率、累计评论数分段信息;所述用户行为数据,包括对应商品的浏览商品详情页行为、加购物车行为、删购物车行为、下单行为、关注行为和点击行为信息;对用户的属性特征,用户评价数据,以及用户行为数据采取独热编码;基于用户信息及药品画像,使用GBDT梯度提升决策树模型构建用户画像预测模型,确定用户画像。
5.根据权利要求1所述的方法,其中,所述根据用户画像,分析隐私保护需求,包括:
利用数据挖掘技术,分析用户画像包含的特征字段,字节的含义;采用K近邻分类算法对用户画像特征信息对应的缺失信息进行插补;基于用户画像,判断用户是否具有疾病,以及相应的病情;根据用户的病情,分析对应患病症状的治疗药品;根据获取的对应治疗药品,通过查询药品信息,并与同类药品对比分析,并结合药品的适用症状,适用群体特征,确定药品的画像;获取对应治疗药物的隐私类画像,并结合用户画像,分析用户所患疾病及病情,通过比较分析获取需要进行隐私保护的药物画像及用户画像信息;包括:根据病情隐私程度,判断需要保护的画像的类别和数量;基于差分隐私保护,保护用户购药隐私;
所述根据病情隐私程度,判断需要保护的画像的类别和数量,具体包括:
根据用户患病病情,确定对应症状治疗药品的画像,包括营销类画像,隐私类画像,以及通用类画像;根据用户患病症状,以及因患病产生的生活需求领域的隐私性,对比其他药品,分析药品营销类画像的保护必要程度;根据用户所患疾病症状对应治疗药品的评论关键词语,对比分析药品隐私类画像的保护必要程度;根据用户所属群体的特征信息,对比分析药品通用类画像的保护必要程度;建立用户隐私性保护模型,将用户个人信息,所患疾病,对应治疗药品,以及药品需要进行隐私性保护的画像类别及数量,进行归纳整理;
所述基于差分隐私保护,保护用户购药隐私,具体包括:
基于差分隐私保护机制,保护用户画像及购药隐私;根据用户画像及药品画像,生成符合用户药物购买行为规律的主题特征词;利用多项先验分布模型模拟用户药物购买行为的决策过程,对用户决策过程中的行为进行概率预测;针对多项先验分布中的隐含变量,采用Gibbs抽样方法,迭代计算符合用户药物购买行为规律的主题特征词的预测模型参数;根据计算获取的模型参数,向获取符合用户药物购买行为规律的主题特征词的采样过程添加Laplace噪声,影响计数统计结果;通过对计数统计结果的影响,干扰潜在符合用户药物购买行为规律的主题特征词的联合概率分布,降低隐私信息被推断攻击的风险,保护用户画像与药品画像。
6.根据权利要求1所述的方法,其中,所述基于用户点击行为,分析不同场景用户对画像的敏感程度,包括:
首先,确定用户的点击行为数据,包括用户对于药品广告的点击行为数据与用户于当前页面的点击行为数据;采集的用户点击行为数据利用ETL方式进行数据清洗,删除缺失数据、重复数据与错误数据,提取数据连贯完整程度高的用户有效数据;其中,点击行为数据包括对页面的点击,搜索,分享,下载,评论,上传行为;根据用户对于当前页面的点击行为数据,分析用户的接收到广告时所处的使用场景;基于用户对于药品广告的点击行为数据,并结合用户当前的使用场景,通过对比分析相同场景下不同用户对于药品广告的点击行为数据,对各场景下用户对于药品广告的的敏感程度进行分级划分;包括:识别用户点击行为;基于用户点击行为,分析交互场景;基于点击行为及使用场景,分析用户对画像的敏感程度;
所述识别用户点击行为,具体包括:
基于用户的HTTP流,对网络端用户的点击行为进行识别;从用户的混合HTTP请求流中提取观测特征序列;通过识别模块把特征序列映射到由两个行为模型实例组成的或然概率判决空间;根据判决空间中的综合行为分类器,判定混合HTTP请求流片段中第一个请求的点击属性;根据第一个请求的点击属性,将请求流分离为点击序列和自动请求序列两种类别;根据请求流的类别不同,采用隐马尔可夫模型框架的状态链在不同类别下,对用户点击行为轮廓进行判定;基于用户点击行为轮廓的判定结果,按照不同点击属性分类获取用户对应的点击行为数据;
所述基于用户点击行为,分析交互场景,具体包括:
根据不同场景样本点击行为数据的标注取值、场景特征和预设损失函数,训练场景预测概率数据模型;基于不同场景样本数据,确定场景预测概率数据模型的训练样本与测试样本;通过测试集对场景预测概率数据模型进行测试,并且调整参数,不断训练,提高模型的精确度;基于用户点击行为数据,获取用户接收到药物画像前后时间段用户点击行为数据;根据用户的点击行为数据及所述场景预测概率数据模型,对目标用户的当前的操作场景进行分析预测;
所述基于点击行为及使用场景,分析用户对画像的敏感程度,具体包括:
获取用户接收到药物画像后,用户对于药物画像的反应时间间隔,以及进行的点击行为;基于用户的点击行为和场景预测概率数据模型,分析用户接收到药物画像前后时间段的所处的交互场景;基于不同场景下用户对于药物画像敏感度分析的样本数据,构建敏感程度分析模型;基于用户接收到药物画像前后时间段的交互场景,用户对于药物画像的反应时间间隔,以及进行的点击行为,分析获取用户对于提供的药物画像的敏感程度。
7.根据权利要求1所述的方法,其中,所述基于用户对药物画像的敏感程度,调整用户画像,包括:
基于用户画像,将药物画像发送至对应用户画像的用户客户端;根据用户对于药物画像的点击行为数据,及当前的交互场景,分析用户对于药物画像的敏感程度;基于用户对于接收到的药物画像的敏感程度,分析用户对于当前药物画像的购买意向;根据用户对于当前药物画像的购买意向,对于用户画像进行相应的调整;根据调整后的用户画像,对于药物画像的推荐频率,种类,时间,设计界面进行调整。
8.根据权利要求1所述的方法,其中,所述基于用户画像及交互场景,进行用户画像交互,包括:
基于用户画像及当前用户的交互场景,分析用户对于药物画像的敏感程度;基于用户对于药物画像的敏感程度,及调整后的用户画像,对于药物画像的交互方式进行调整;根据使用场景及用户画像,选择适当的药物画像推荐场景,时间及频率;并制定对应的销售策略,包括调整药品价格,制定个性化广告内容,选取广告投放平台及网页界面;根据同类治疗症状,对于处于不同价位的药品的销售量,对于药品的价格进行调整。
CN202211594056.5A 2022-12-13 2022-12-13 一种基于隐私保护的健康画像构建方法 Withdrawn CN115862806A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211594056.5A CN115862806A (zh) 2022-12-13 2022-12-13 一种基于隐私保护的健康画像构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211594056.5A CN115862806A (zh) 2022-12-13 2022-12-13 一种基于隐私保护的健康画像构建方法

Publications (1)

Publication Number Publication Date
CN115862806A true CN115862806A (zh) 2023-03-28

Family

ID=85672305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211594056.5A Withdrawn CN115862806A (zh) 2022-12-13 2022-12-13 一种基于隐私保护的健康画像构建方法

Country Status (1)

Country Link
CN (1) CN115862806A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116980522A (zh) * 2023-09-22 2023-10-31 湖南三湘银行股份有限公司 一种基于智能质检客户画像的通知的系统和方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116980522A (zh) * 2023-09-22 2023-10-31 湖南三湘银行股份有限公司 一种基于智能质检客户画像的通知的系统和方法
CN116980522B (zh) * 2023-09-22 2024-01-09 湖南三湘银行股份有限公司 一种基于智能质检客户画像的通知的系统和方法

Similar Documents

Publication Publication Date Title
Lekakos et al. Improving the prediction accuracy of recommendation algorithms: Approaches anchored on human factors
KR101807561B1 (ko) 소셜 네트워킹 엔진의 사용자들에게 콘텐츠를 다이렉팅하는 시스템 및 방법
CN108876526A (zh) 商品推荐方法、装置和计算机可读存储介质
KR102227552B1 (ko) 상황인지 알고리즘 기반 리뷰 카테고리를 이용한 음식점 노출 개인화 서비스 제공 시스템
US20090248496A1 (en) System and method for automating market analysis from anonymous behavior profiles
CN107004203A (zh) 信息处理系统以及方法
CA2632156A1 (en) Information retrieval system and method using a bayesian algorithm based on probabilistic similarity scores
CN116894709A (zh) 一种广告商品推荐方法和系统
JP6679451B2 (ja) 選択装置、選択方法および選択プログラム
JP6018338B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
CN112597398B (zh) 药品推荐模型应用方法及系统
KR20030058660A (ko) 개인화 시스템에서 사용자의 컨텐트 선호도를 이용한협업필터링 학습방법
CN115862806A (zh) 一种基于隐私保护的健康画像构建方法
JP6767465B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
Chen et al. Application of SVM model based on collaborative filtering hybrid algorithm in e-commerce recommendation
CN108416611B (zh) 一种超市路径推荐系统及其方法
CN111460300B (zh) 网络内容推送方法、装置及存储介质
WO2008032037A1 (en) Method and system for filtering and searching data using word frequencies
JP6779965B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2016174791A (ja) コンテンツ推奨システムおよびコンテンツ推奨方法
JP2002150147A (ja) 情報提供システム及び方法並びに情報提供用プログラムを記録した記録媒体
Racherla Graph Neural Network for Service Recommender System in Digital Service Marketplace
JP6679705B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
Ghose et al. Designing ranking systems for hotels on travel search engines to enhance user experience
US20220180417A1 (en) Item proposal system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20230328