CN110321424B - 一种基于深度学习的艾滋病人员行为分析方法 - Google Patents

一种基于深度学习的艾滋病人员行为分析方法 Download PDF

Info

Publication number
CN110321424B
CN110321424B CN201910517313.7A CN201910517313A CN110321424B CN 110321424 B CN110321424 B CN 110321424B CN 201910517313 A CN201910517313 A CN 201910517313A CN 110321424 B CN110321424 B CN 110321424B
Authority
CN
China
Prior art keywords
aids
behavior
network
user
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910517313.7A
Other languages
English (en)
Other versions
CN110321424A (zh
Inventor
李巧勤
王志华
朱俊林
陆佳鑫
刘勇国
杨尚明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201910517313.7A priority Critical patent/CN110321424B/zh
Publication of CN110321424A publication Critical patent/CN110321424A/zh
Application granted granted Critical
Publication of CN110321424B publication Critical patent/CN110321424B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Epidemiology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Fuzzy Systems (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于深度学习的艾滋病人员行为分析方法,包括采集用户行为数据;基于用户行为数据,分析用户多维时空信息,构建用户行为画像。本发明基于网络、地理位置、社交通信行为分析,对艾滋病人进行行为画像,在网络、地理位置、社交通信等多维度上构建针对用户的描述性标签属性。利用这些标签属性,对艾滋病人多方面的真实个人特征进行描绘勾勒,用于描述相关的特征、行为及偏好。发现艾滋病人群的潜在社会交往规律,发现艾滋病高危人群、潜在艾滋病传播者和艾滋病传播路径,辅助提前介入艾滋病干预环节工作。

Description

一种基于深度学习的艾滋病人员行为分析方法
技术领域
本发明涉及一种艾滋病人员行为分析方法,具体地说,涉及一种基于深度学习的艾滋病人员行为分析方法。
背景技术
艾滋病作为一种传染疾病,主要通过危险性行为和共用不洁注射器吸毒等一系列自主行为在人群中扩散,这些行为一般发生在密切接触或具有特定关系的群体中,同时说明艾滋病是遵循一种结构化的网络传播模式,而非随机分布于独立个体间。挖掘艾滋病用户行为对于辅助艾滋病防疫工作开展,引导提高艾滋病人形成健康良好的行为习惯具有重大意义。
当前大数据背景下的用户行为分析往往集中于网络社交行为,网络异常攻击行为等等,如在社交网站发布状态,评论状态,在电商网站浏览商品,购买商品,点评商品等,而对于医疗领域用户信息行为分析等方面的研究较少。“互联网+”在医疗领域越来越扮演不可替代的作用,但是对于传染病病人的信息规律分析,挖掘艾滋病等传染病相关人群的网络、出行、社交行为规律,基于海量数据多维分析发现传染病传播规律以及潜在高危感染人群等方面需要进一步研究。
发明内容
本发明的目的是提供了一种基于深度学习的艾滋病人员行为分析方法,基于网络行为、地理位置、社交通信等行为分析,构建艾滋病员多维行为分析,通过数据分析助力艾滋疾病的防控,为艾滋病人群以及高危人群的精准干预提供基础。
为了解决上述技术问题,本发明公开了一种基于深度学习的艾滋病人员行为分析方法,具体步骤包括:
采集用户行为数据;
基于用户行为数据,分析用户多维时空信息,构建用户行为画像。
进一步地,用户行为数据包括浏览器网址网络浏览IP地址信息、地理位置信息和社交通信信息。
进一步地,基于用户行为数据,分析用户多维时空信息,构建用户行为画像,包括网络行为分析、地理位置行为分析和社交通信行为分析。
进一步地,网络行为分析,具体为:
对于网络浏览IP地址,使用通用全文爬虫架构获取各网址内容,选择聚类中心作为文章的关键词,使用word2vec计算k-means聚类过程中的词间相似度,关键词的提取过程如下:
第一步:通过jieba分词工具对语料进行分词,根据停用词表去除停用词;
第二步:合并词串,词语之间用空格分割;训练word2vec获得词向量;
第三步:新输入文本,对处理好的词进行k-means聚类,在聚类过程中使用word2vec训练出的词向量计算两个词之间的距离,最后选择每个类别中距离聚类中心最近的词作为关键词;同时作为补充,添加敏感词发现方法,基于TF-IDF分析统计关键词频,对比艾滋语料库捕获出现频率低却属于特定敏感信息的词语;
基于上述关键词挖掘分析与特定关键词语捕获,可获得艾滋病员网络行为分析结果。
进一步地,地理位置行为分析,具体为:
获取艾滋病志愿者GPS信息与对应的时间维度,基于DBSCAN算法聚类分析地理位置聚类中心,根据地理位置聚类中心辐射200米,获取周围地理位置信息;
聚类结果可得到多人群情况下个人聚类中心与辐射区域,辐射区域覆盖面越高,表示艾滋病人群活动越密集;
基于挖掘结果得到艾滋病员活动区域,根据活动区域的特征属性表示,对比分析网络行为属性与活动区域属性,使用相似性度量集合关联分析区域属性与用户个人信息属性,挖掘基于地理位置的用户行为方式与艾滋病地理传播、传播时间的关系。
进一步地,基于地理位置的用户行为方式与艾滋病地理传播关系的挖掘,具体为:
基于用户网络行为与地理位置聚类分析,使用LSTM网络分别学习行为分析与地理位置的多维表示;基于向量空间模型将每个对象的多维表示关联聚集以综合表示,以此类推,获取群体对象网络行为分析与用户地理位置分析的多维表示;通过空间向量夹角的余弦值来计算相似性,可以获得艾滋人群与非艾滋人群的空间多维综合表示相似度,挖掘基于地理位置的用户行为方式与艾滋病传播关系。
进一步地,基于地理位置的用户行为方式与艾滋病传播时间关系的挖掘,具体为:
基于用户网络行为与地理位置聚类分析,使用LSTM网络分别学习变长时间维度下行为分析与地理位置的多维表示,获得不同时间维度对应下的网络行为与地理位置关系,挖掘基于地理位置的用户行为方式与艾滋病传播时间关系。
进一步地,社交通信行为分析,具体为:
每个艾滋病人作为一个社区网络节点,对存在通话联系的两个节点建立边关系;基于多局部社区检测(multiple local community detection)算法,根据社交通信统计分析将信息嵌入社区网络,生成局部具有重叠性质的社交网络,建立艾滋病人社交通信行为网络,通过社区网络分析各成员家庭、社会交往关系,以采取精准化干预措施,做好艾滋疾病防控;
基于通话行为的多局部社区发现的具体算法步骤为:
第一步:根据给定的用户属性和通话记录表,统计以下数据:每个节点的总通话时间、总通话数量,每条边的总通话时间、总通话数量,以及主被叫作为用户统计属性;
第二步:每个用户作为一个网络节点,构建节点间边的带权无向图,其边权值的计算方法与通话记录存在关联;
同时考虑通话时间、通话地点、通话数量、主被叫等属性。在通话记录网络中,根据节点之间的相似性计算边的权值,同时将用户相似度作为边权值的因素之一,通过多元Logistic回归分析,以计算不同属性之间的边权值;
第三步:基于余弦相似度计算不同通话之间的相似度,以相似度聚类,构建基于用户通话行为的局部多重叠社交通信网络。
与现有技术相比,本发明可以获得包括以下技术效果:
本发明基于网络、地理位置、社交通信行为分析,对艾滋病人进行行为画像,在网络、地理位置、社交通信等多维度上构建针对用户的描述性标签属性。利用这些标签属性,对艾滋病人多方面的真实个人特征进行描绘勾勒,用于描述相关的特征、行为及偏好。发现艾滋病人群的潜在社会交往规律,发现艾滋病高危人群、潜在艾滋病传播者和艾滋病传播路径,辅助提前介入艾滋病干预环节工作。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例中艾滋病用户多维分析方法流程图;
图2是本发明实施例中艾滋病用户网络浏览信息主题提取结果;
图3是本发明实施例中艾滋病用户网络浏览不良信息关键词提取结果;
图4是本发明实施例中艾滋病聚集地分析结果;
图5是本发明实施例中艾滋病用户通信行为社区发现结果。
具体实施方式
以下将配合实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本发明基于艾滋病人员志愿者移动端收集用户的网络行为、地理行为、社交行为等多维时空泛化数据,构建艾滋病防控数据库,存储用户行为数据。基于深度学习等算法建模分析艾滋病人行为规律,包括基于用户网络浏览内容,挖掘网络行为特征,同时发现与艾滋病传播相关特定的网络内容,实现精准宣教干预。记录分析艾滋病人位置聚类中心、行为轨迹等地理位置行为信息,根据用户间地理位置的时间属性相似度评估用户间的交流情况和用户高频访问场所分析,挖掘用户行为活动的区域和规律。建立艾滋病人社交通信行为网络,挖掘艾滋病人社交社区,分析社区内各成员关系,发现艾滋人群潜在传播途径与传播者。
图1是本发明艾滋病用户多维分析方法流程图,本发明公开了一种基于深度学习的艾滋病人员行为分析方法,具体步骤包括:
步骤S1,采集用户行为数据;通过艾滋病员志愿者智能手机获取用户行为监测权限,用户行为数据包括浏览器网址网络浏览IP地址信息、地理位置信息和社交通信信息。
考虑移动端联系次数按照平均每天7-8次计算,授权通话记录信息数据包括主叫、被叫、通话时长等;地理位置信息采取每隔10分钟采集的方式。
步骤S2,基于用户行为数据,分析用户多维时空信息,构建用户行为画像;包括网络行为分析、地理位置行为分析和社交通信行为分析。
(一)网络行为分析,具体为:
对于网络浏览IP地址,使用通用全文爬虫架构获取各网址内容,选择聚类中心作为文章的关键词,使用word2vec计算k-means聚类过程中的词间相似度,关键词的提取过程如下:
第一步:通过jieba分词工具对语料进行分词,根据停用词表去除停用词;
第二步:合并词串,词语之间用空格分割;训练word2vec获得词向量;
第三步:新输入文本,对处理好的词进行k-means聚类,在聚类过程中使用word2vec训练出的词向量计算两个词之间的距离,最后选择每个类别中距离聚类中心最近的词作为关键词;同时作为补充,添加敏感词发现方法,基于TF-IDF分析统计关键词频,对比艾滋语料库捕获出现频率低却属于特定敏感信息的词语;
基于上述关键词挖掘分析与特定关键词语捕获,可获得艾滋病员网络行为分析结果。
提取艾滋病人网络浏览内容,基于word2vec提取论文关键词。统计分析艾滋病人关键词频,挖掘网络浏览行为习惯,抽出与艾滋病传播密切相关浏览行为,实行精准艾滋防控宣教干预。
图2为用户网络浏览信息主题提取结果展示。通过获取手机浏览器网址,解析获取网址内容,再基于word2vec与kmeans组合模型生成网址内容主题,并作词云与统计分析,获得与艾滋病传播密切相关浏览主题。
图3为用户网络浏览不良信息关键词提取结果展示。通过获取手机浏览器网址,解析获取网址内容,基于TF-IDF算法分析获取艾滋病传播密切相关内容敏感词,并作词云与统计分析展示。
(二)地理位置行为分析,具体为:
获取艾滋病志愿者GPS信息与对应的时间维度,基于DBSCAN算法聚类分析地理位置聚类中心,根据地理位置聚类中心辐射200米,获取周围地理位置信息;
聚类结果可得到多人群情况下个人聚类中心与辐射区域,辐射区域覆盖面越高,表示艾滋病人群活动越密集;
基于挖掘结果得到艾滋病员活动区域,根据活动区域的特征属性表示,对比分析网络行为属性与活动区域属性,使用相似性度量集合关联分析区域属性与用户个人信息属性,挖掘基于地理位置的用户行为方式与艾滋病地理传播、传播时间的关系。
同时基于艾滋病员行为轨迹记录,可得到艾滋病员活动区域与行为轨迹之间的趋势估计,实现精准预测分析,辅助艾滋病防控。
其中基于地理位置的用户行为方式与艾滋病地理传播关系的挖掘,具体为:
基于用户网络行为与地理位置聚类分析,使用LSTM网络分别学习行为分析与地理位置的多维表示;基于向量空间模型将每个对象的多维表示关联聚集以综合表示,以此类推,获取群体对象网络行为分析与用户地理位置分析的多维表示;通过空间向量夹角的余弦值来计算相似性,可以获得艾滋人群与非艾滋人群的空间多维综合表示相似度,挖掘基于地理位置的用户行为方式与艾滋病传播关系。
其中基于地理位置的用户行为方式与艾滋病传播时间关系的挖掘,具体为:
基于用户网络行为与地理位置聚类分析,使用LSTM网络分别学习变长时间维度下行为分析与地理位置的多维表示,获得不同时间维度对应下的网络行为与地理位置关系,挖掘基于地理位置的用户行为方式与艾滋病传播时间关系。
图4为艾滋病人员聚集地分析结果展示。基于DBSCAN等学习算法精确分析艾滋病人活动地理位置聚类中心,以及周围常活动区域。
(三)社交通信行为分析,具体为:
每个艾滋病人作为一个社区网络节点,对存在通话联系的两个节点建立边关系;基于多局部社区检测(multiple local community detection)算法,根据社交通信统计分析将信息嵌入社区网络,生成局部具有重叠性质的社交网络,建立艾滋病人社交通信行为网络,通过社区网络分析各成员家庭、社会交往关系,以采取精准化干预措施,做好艾滋疾病防控;
图5为艾滋病员用户通信行为社区发现结果展示。基于多局部社区检测(multiplelocal community detection)算法,以部分艾滋病人为种子,构建局部社交网络。
基于通话行为的多局部社区发现的具体算法步骤为:
第一步:根据给定的用户属性和通话记录表,统计以下数据:每个节点的总通话时间、总通话数量,每条边的总通话时间、总通话数量,以及主被叫作为用户统计属性;
第二步:每个用户作为一个网络节点,构建节点间边的带权无向图,其边权值的计算方法与通话记录存在关联;
同时考虑通话时间、通话地点、通话数量、主被叫等属性。在通话记录网络中,根据节点之间的相似性计算边的权值,同时将用户相似度作为边权值的因素之一,通过多元Logistic回归分析,以计算不同属性之间的边权值;
第三步:基于余弦相似度计算不同通话之间的相似度,以相似度聚类,构建基于用户通话行为的局部多重叠社交通信网络。
基于社区发现,分析社区边的度,权值较大则节点之间联系密切,即与艾滋病患者边权值越大,联系越密切,属于潜在易感染人群。
本发明采用基于词义分析关键词的深度学习方法,相比于词频分析关键词的TF-IDF方法具有较大的改进。基于词向量的关键词提取方法可以充分利用语料的信息,通过语义解决当关键词个数增加时词频特征无法提供词语重要程度信息的问题,对篇幅长、内容丰富文章进行关键词提取的准确率与实用性要明显优于其他方法。同时,基于TF-IDF方法捕获频率低但属于异常网络行为作为艾滋病病员网络行为分析补充。
本发明采用多局部社区发现算法构建社交网络。由于全局社区发现需要发现所有的网络,复杂度过高,需要投入更多的成本。局部社区的出现,就是为了解决全局社区的这个弊端,局部社区发现在局部范围内,根据某个或某些点,快速的发现这些点所在的社区,进而避免全局计算所带来的高时空开销,因而时间复杂度通常是接近线性的,因此而优于全局社区发现。
本发明采用基于网络文本分析,地理位置分析,社交通信分析等行为分析,构建艾滋病员多维行为分析,通过数据分析助力艾滋疾病的防控,基于分析艾滋人群网络、日常出行与社交行为规律,探求艾滋传播规律,发现潜在高危人群,为艾滋病人群以及高危人群的精准干预提供基础。
上述说明示出并描述了发明的若干优选实施例,但如前所述,应当理解发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离发明的精神和范围,则都应在发明所附权利要求的保护范围内。

Claims (4)

1.一种基于深度学习的艾滋病人员行为分析方法,其特征在于,具体步骤包括:
采集用户行为数据;
基于用户行为数据,分析用户多维时空信息,构建用户行为画像;
所述用户行为数据包括浏览器网址、网络浏览IP地址信息、地理位置信息和社交通信信息;
所述基于用户行为数据,分析用户多维时空信息,构建用户行为画像,包括网络行为分析、地理位置行为分析和社交通信行为分析;
所述网络行为分析,具体为:
对于网络浏览IP地址,使用通用全文爬虫架构获取各网址内容,选择聚类中心作为文章的关键词,使用word2vec计算k-means聚类过程中的词间相似度,关键词的提取过程如下:
第一步:通过jieba分词工具对语料进行分词,根据停用词表去除停用词;
第二步:合并词串,词语之间用空格分割;训练word2vec获得词向量;
第三步:新输入文本,对处理好的词进行k-means聚类,在聚类过程中使用word2vec训练出的词向量计算两个词之间的距离,最后选择每个类别中距离聚类中心最近的词作为关键词;同时作为补充,添加敏感词发现方法,基于TF-IDF分析统计关键词频,对比艾滋语料库捕获出现频率低却属于特定敏感信息的词语;
基于上述关键词挖掘分析与特定关键词语捕获,可获得艾滋病员网络行为分析结果;
所述地理位置行为分析,具体为:
获取艾滋病志愿者GPS信息与对应的时间维度,基于DBSCAN算法聚类分析地理位置聚类中心,根据地理位置聚类中心辐射200米,获取周围地理位置信息;
聚类结果可得到多人群情况下个人聚类中心与辐射区域,辐射区域覆盖面越高,表示艾滋病员群活动越密集;
基于挖掘结果得到艾滋病员活动区域,根据活动区域的特征属性表示,对比分析网络行为属性与活动区域属性,使用相似性度量集合关联分析区域属性与用户个人信息属性,挖掘基于地理位置的用户行为方式与艾滋病地理传播、传播时间的关系。
2.根据权利要求1所述的基于深度学习的艾滋病人员行为分析方法,其特征在于,所述基于地理位置的用户行为方式与艾滋病地理传播关系的挖掘,具体为:
基于用户网络行为与地理位置聚类分析,使用LSTM网络分别学习行为分析与地理位置的多维表示;基于向量空间模型将每个对象的多维表示关联聚集以综合表示,以此类推,获取群体对象网络行为分析与用户地理位置分析的多维表示;通过空间向量夹角的余弦值来计算相似性,可以获得艾滋人群与非艾滋人群的空间多维综合表示相似度,挖掘基于地理位置的用户行为方式与艾滋病传播关系。
3.根据权利要求1或2所述的基于深度学习的艾滋病人员行为分析方法,其特征在于,所述基于地理位置的用户行为方式与艾滋病传播时间关系的挖掘,具体为:
基于用户网络行为与地理位置聚类分析,使用LSTM网络分别学习变长时间维度下行为分析与地理位置的多维表示,获得不同时间维度对应下的网络行为与地理位置关系,挖掘基于地理位置的用户行为方式与艾滋病传播时间关系。
4.根据权利要求3所述的基于深度学习的艾滋病人员行为分析方法,其特征在于,所述社交通信行为分析,具体为:
每个艾滋病人作为一个社区网络节点,对存在通话联系的两个节点建立边关系;基于多局部社区检测算法,根据社交通信统计分析将信息嵌入社区网络,生成局部具有重叠性质的社交网络,建立艾滋病人社交通信行为网络,通过社区网络分析各成员家庭、社会交往关系,以采取精准化干预措施,做好艾滋疾病防控;
基于通话行为的多局部社区发现的具体算法步骤为:
第一步:根据给定的用户属性和通话记录表,统计以下数据:每个节点的总通话时间、总通话数量,每条边的总通话时间、总通话数量,以及主被叫作为用户统计属性;
第二步:每个用户作为一个网络节点,构建节点间边的带权无向图,其边权值的计算方法与通话记录存在关联;
同时考虑通话时间、通话地点、通话数量、主被叫属性;在通话记录网络中,根据节点之间的相似性计算边的权值,同时将用户相似度作为边权值的因素之一,通过多元Logistic回归分析,以计算不同属性之间的边权值;
第三步:基于余弦相似度计算不同通话之间的相似度,以相似度聚类,构建基于用户通话行为的局部多重叠社交通信网络。
CN201910517313.7A 2019-06-14 2019-06-14 一种基于深度学习的艾滋病人员行为分析方法 Expired - Fee Related CN110321424B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910517313.7A CN110321424B (zh) 2019-06-14 2019-06-14 一种基于深度学习的艾滋病人员行为分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910517313.7A CN110321424B (zh) 2019-06-14 2019-06-14 一种基于深度学习的艾滋病人员行为分析方法

Publications (2)

Publication Number Publication Date
CN110321424A CN110321424A (zh) 2019-10-11
CN110321424B true CN110321424B (zh) 2021-07-27

Family

ID=68119648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910517313.7A Expired - Fee Related CN110321424B (zh) 2019-06-14 2019-06-14 一种基于深度学习的艾滋病人员行为分析方法

Country Status (1)

Country Link
CN (1) CN110321424B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111312406B (zh) * 2020-03-15 2020-11-13 薪得付信息技术(山东)有限公司 一种疫情标签数据处理方法及系统
CN111563190B (zh) * 2020-04-07 2023-03-14 中国电子科技集团公司第二十九研究所 一种区域网络用户行为的多维度分析与监管方法及系统
CN111540477B (zh) * 2020-04-20 2021-04-30 中国科学院地理科学与资源研究所 基于手机数据的呼吸道传染病密切接触者识别方法
CN112069964A (zh) * 2020-08-31 2020-12-11 天津大学 基于图像识别技术的异常人物关系网络挖掘方法
CN112331361B (zh) * 2020-11-06 2023-06-16 中国联合网络通信集团有限公司 一种密切接触者的确定方法及装置
CN113299407B (zh) * 2021-06-16 2023-08-08 四川省疾病预防控制中心 基于新兴时空热点分析的重点人群艾滋病干预方法
CN114999667B (zh) * 2022-04-01 2024-04-05 山东大学 一种考虑交通干预的传染病跨区域传播预测方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004065348A1 (en) * 2003-01-23 2004-08-05 Pfizer Products Inc. Pharmaceutically acceptable salts of sertraline and pharmaceutical compositions thereof
CN104166708A (zh) * 2014-08-11 2014-11-26 肇庆学院 基于社交网络和半马尔可夫过程的手机病毒传播建模方法
CN105335618A (zh) * 2015-11-10 2016-02-17 成都数联易康科技有限公司 一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法
CN106384009A (zh) * 2016-09-28 2017-02-08 湖南老码信息科技有限责任公司 一种基于增量式神经网络模型的hiv预测方法和预测系统
CN106529177A (zh) * 2016-11-12 2017-03-22 杭州电子科技大学 一种基于医疗大数据的患者画像方法及装置
CN106682807A (zh) * 2015-11-11 2017-05-17 广州市疾病预防控制中心 男男性行为者艾滋病感染风险互联网自我评估系统
CN107103028A (zh) * 2017-03-03 2017-08-29 北京小度信息科技有限公司 一种信息处理方法及装置
CN107122352A (zh) * 2017-05-18 2017-09-01 成都四方伟业软件股份有限公司 一种基于k‑means、word2vec的抽取关键词的方法
CN108417274A (zh) * 2018-03-06 2018-08-17 东南大学 流行病预测方法、系统及设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004065348A1 (en) * 2003-01-23 2004-08-05 Pfizer Products Inc. Pharmaceutically acceptable salts of sertraline and pharmaceutical compositions thereof
CN104166708A (zh) * 2014-08-11 2014-11-26 肇庆学院 基于社交网络和半马尔可夫过程的手机病毒传播建模方法
CN105335618A (zh) * 2015-11-10 2016-02-17 成都数联易康科技有限公司 一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法
CN106682807A (zh) * 2015-11-11 2017-05-17 广州市疾病预防控制中心 男男性行为者艾滋病感染风险互联网自我评估系统
CN106384009A (zh) * 2016-09-28 2017-02-08 湖南老码信息科技有限责任公司 一种基于增量式神经网络模型的hiv预测方法和预测系统
CN106529177A (zh) * 2016-11-12 2017-03-22 杭州电子科技大学 一种基于医疗大数据的患者画像方法及装置
CN107103028A (zh) * 2017-03-03 2017-08-29 北京小度信息科技有限公司 一种信息处理方法及装置
CN107122352A (zh) * 2017-05-18 2017-09-01 成都四方伟业软件股份有限公司 一种基于k‑means、word2vec的抽取关键词的方法
CN108417274A (zh) * 2018-03-06 2018-08-17 东南大学 流行病预测方法、系统及设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"A Critical Assessment of Theories/Models Used in Health Communication for HIV/AIDS";Collins O. Airhihenbuwa 等;《Journal of Health Communication》;20121011;第5卷(第sup1期);第5-15页 *
"Social Networks Benchmark Dataset for Diseases Classification";Muhannad Quwaider 等;《2016 4th International Conference on Future Internet of Things and Cloud Workshops》;20160824;第234-239页 *
"哈工大研究团队:利用社交媒体分析艾滋病人群日常生活状态";匿名;《知乎》;20170615;第1-4页 *
"基于LSTM的船舶航迹预测模型";权波 等;《计算机科学》;20181115;第45卷(第11A期);第126-131页 *

Also Published As

Publication number Publication date
CN110321424A (zh) 2019-10-11

Similar Documents

Publication Publication Date Title
CN110321424B (zh) 一种基于深度学习的艾滋病人员行为分析方法
CN110462604B (zh) 基于设备使用关联互联网设备的数据处理系统和方法
Zhong et al. A cyber security data triage operation retrieval system
Parwez et al. Big data analytics for user-activity analysis and user-anomaly detection in mobile wireless network
Gambs et al. De-anonymization attack on geolocated data
Ratkiewicz et al. Detecting and tracking political abuse in social media
Shittu et al. Intrusion alert prioritisation and attack detection using post-correlation analysis
CN103218431B (zh) 一种能识别网页信息自动采集的系统
Taha et al. Using the spanning tree of a criminal network for identifying its leaders
Abraham et al. Investigative profiling with computer forensic log data and association rules
CN111049818B (zh) 一种基于网络流量大数据的异常信息发现方法
Mengshoel et al. Will we connect again? machine learning for link prediction in mobile social networks
Zulfadhilah et al. Cyber profiling using log analysis and k-means clustering
EP2250763A2 (en) Arrangements for networks
Folorunso et al. Ca-NIDS: A network intrusion detection system using combinatorial algorithm approach
Rupa Devi et al. A review on network intrusion detection system using machine learning
Drosou et al. An enhanced graph analytics platform (gap) providing insight in big network data
Han et al. Linking social network accounts by modeling user spatiotemporal habits
Wang et al. Co-location social networks: Linking the physical world and cyberspace
KR101621735B1 (ko) 추천 검색어 제공 방법 및 시스템
CN105447148B (zh) 一种Cookie标识关联方法及装置
CN110704612A (zh) 一种社交群体发现方法、装置和存储介质
Jenson et al. Mining location information from users' spatio-temporal data
Sharma et al. Comparative Analysis of Different Algorithms in Link Prediction on Social Networks
US11403324B2 (en) Method for real-time cohort creation based on entity attributes derived from partially observable location data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210727

CF01 Termination of patent right due to non-payment of annual fee