CN113963413A - 基于人工智能的疫情排查方法、装置、电子设备及介质 - Google Patents
基于人工智能的疫情排查方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN113963413A CN113963413A CN202111257942.4A CN202111257942A CN113963413A CN 113963413 A CN113963413 A CN 113963413A CN 202111257942 A CN202111257942 A CN 202111257942A CN 113963413 A CN113963413 A CN 113963413A
- Authority
- CN
- China
- Prior art keywords
- target
- disease
- user
- determining
- track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 45
- 238000011835 investigation Methods 0.000 title claims abstract description 36
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 298
- 201000010099 disease Diseases 0.000 claims abstract description 262
- 230000006399 behavior Effects 0.000 claims abstract description 61
- 238000012545 processing Methods 0.000 claims abstract description 54
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 208000024891 symptom Diseases 0.000 claims description 44
- 238000012549 training Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 13
- 238000005206 flow analysis Methods 0.000 claims description 12
- 230000003139 buffering effect Effects 0.000 claims description 8
- 238000013024 troubleshooting Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 208000035475 disorder Diseases 0.000 description 36
- 206010068319 Oropharyngeal pain Diseases 0.000 description 16
- 201000007100 Pharyngitis Diseases 0.000 description 16
- 206010011224 Cough Diseases 0.000 description 14
- 230000035922 thirst Effects 0.000 description 14
- 208000035473 Communicable disease Diseases 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 208000015181 infectious disease Diseases 0.000 description 9
- 241000282414 Homo sapiens Species 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 206010012735 Diarrhoea Diseases 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 238000005111 flow chemistry technique Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 208000035474 group of disease Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及人工智能技术领域,提供一种基于人工智能的疫情排查方法、装置、电子设备及介质,所述方法包括:对包含目标用户的视频流数据进行流分析处理,得到目标用户对应的人脸特征数据;根据人脸特征数据进行人脸识别,确定目标用户对应的用户行为轨迹;基于用户行为轨迹,确定多个目标轨迹点;对所述多个目标轨迹点进行检索,确定每个目标轨迹点对应的目标值;并基于每个目标轨迹点对应的目标值,确定目标用户对应的轨迹风险值;确定目标用户对应的用户病症,并基于病症风险树和用户病症,确定目标用户对应的患病风险值;将轨迹风险值和患病风险值输入半监督学习模型,得到目标用户对应的风险标签。本申请提高了疫情排查的效率。
Description
技术领域
本申请涉及人工智能技术领域,具体涉及一种基于人工智能的疫情排查方法、装置、电子设备及介质。
背景技术
传染病是由各种病原体引起的能在人与人、动物与动物或者人与动物之间相互传播的一类疾病,其所具有的易传染性,威胁着人类的健康。传统的疫情排查方式主要是人工询问,但是询问得到的信息不一定是真实的,这导致对疫情的分析不准确。患有相同的传染病的患者通常会出现相似的症状,但是很多传染病的初始症状与普通疾病相似,所以患者经常意识不到自己患有传染病,以为是普通疾病,只是在诊所或者药店拿了基础药物服用。
当前诊所、药店在接收患者时没有合理的检测手段检测出患者是否患有传染病,不能及时的发现患者患有传染病的事实,难以实现早发现早隔离早治疗。同时,不能及时发现患有传染病的患者,也会导致传染病的进一步传播,带来更多的损失。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的疫情排查方法、装置、电子设备及介质,基于人工智能从目标用户的个人信息和用户轨迹等两个角度实现疫情排查,提高了风险监测的准确性,从而提高了疫情排查的效率。
第一方面,本申请提供了一种基于人工智能的疫情排查方法,所述方法包括:
对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据;
根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹;
基于所述用户行为轨迹,确定多个目标轨迹点;
按照预设的检索任务对所述多个目标轨迹点进行检索,确定每个所述目标轨迹点对应的目标值;并基于每个所述目标轨迹点对应的目标值,确定所述目标用户对应的轨迹风险值;
确定所述目标用户对应的用户病症,并基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值;
将所述轨迹风险值和所述患病风险值输入预先训练完成的半监督学习模型,得到所述目标用户对应的风险标签。
根据本申请的一个可选的实施方式,所述对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据包括:
对对包含目标用户的视频流数据进行序列化处理,得到视频帧数据;
将所述视频帧数据缓存于可容错数据队列;
对所述可容错数据队列中的所述视频帧数据进行消费处理,得到所述目标用户对应的人脸特征数据。
根据本申请的一个可选的实施方式,所述根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹包括:
获取预构建的人脸识别模型,并确定所述预构建的人脸识别模型对应的识别范围;
采集所述识别范围内的用户对应的历史人脸特征数据;
基于采集到的所述历史人脸特征数据,对所述预构建的人脸识别模型进行模型训练,得到训练完成的人脸识别模型;
将所述人脸特征数据输入所述训练完成的人脸识别模型,得到所述目标用户对应的用户身份;
基于所述用户身份,确定所述目标用户对应的用户行为轨迹。
根据本申请的一个可选的实施方式,所述基于所述用户行为轨迹,确定多个目标轨迹点包括:
根据所述用户行为轨迹,确定所述用户行为轨迹对应的轨迹路线;
基于地理坐标系统,确定所述轨迹路线中的多个轨迹点,并计算每个所述轨迹点在预设时间间隔内对应的人流量;
若有一轨迹点在预设时间间隔内对应的人流量大于或等于预设人流量阈值,则将该轨迹点确定为目标轨迹点。
根据本申请的一个可选的实施方式,所述基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值包括:
使用预设的医学词库对所述用户病症进行处理,得到多个病症词;
根据所述多个病症词遍历预先构建的病症风险树,确定每个所述病症词对应的节点;
确定每个所述节点对应的节点值及对应的节点层级;
基于所述节点层级和所述节点值,确定所述目标用户对应的患病风险值。
根据本申请的一个可选的实施方式,所述根据所述多个病症词遍历预先构建的病症风险树之前,所述方法还包括:
获取目标疾病对应的多个患者病例,并基于所述多个患者病例确定多个病症特征;
根据所述多个病症特征,确定多个第一病症词组,每个所述第一病症词组有且仅有一个病症特征;
从所述多个病症特征中任意选取两个病症特征,组成多个第二病症词组,每个所述第二病症词组中包括两个病症特征;
分别计算每个所述第一病症词组和每个所述第二病症词组的基尼指数,并基于所述基尼指数在所述第一病症词组和所述第二病症词组中,确定目标词组;
基于所述目标词组,构建所述目标疾病对应的病症风险树。
根据本申请的一个可选的实施方式,所述基于所述目标词组,构建所述目标疾病对应的病症风险树包括:
确定所述病症为病症风险树的根节点,将所述目标词组对应的病症特征作为第一父节点,对所述根节点进行二分叉处理;
在所述多个患者病例对应的多个病症特征中,确定所述目标词组对应的多个病症特征;
基于所述目标词组对应的多个病症特征,确定多个病症词组,并计算每个所述病症词组的基尼指数;
基于所述基尼指数,对所述第一父节点进行二分叉处理,得到构建完成的病症风险树。
第二方面,本申请提供了一种基于人工智能的疫情排查装置,所述装置包括:
特征提取模块,用于对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据;
人脸识别模块,用于根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹;
目标确定模块,用于基于所述用户行为轨迹,确定多个目标轨迹点;
风险计算模块,用于按照预设的检索任务对所述多个目标轨迹点进行检索,确定每个所述目标轨迹点对应的目标值;并基于每个所述目标轨迹点对应的目标值,确定所述目标用户对应的轨迹风险值;
疾病匹配模块,用于确定所述目标用户对应的用户病症,并基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值;
标签生成模块,用于将所述轨迹风险值和所述患病风险值输入预先训练完成的半监督学习模型,得到所述目标用户对应的风险标签。
第三方面,本申请提供了一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述基于人工智能的疫情排查方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人工智能的疫情排查方法。
综上所述,本申请所述的基于人工智能的疫情排查方法、装置、电子设备及介质,通过对包含目标用户的视频流数据进行流分析处理,提取所述目标用户对应的人脸特征数据,根据流分析处理可以提高提取人脸特征数据的效率和准确率;并根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹;然后基于所述用户行为轨迹,确定多个目标轨迹点;按照预设的检索任务分别对所述多个目标轨迹点进行检索,确定每个所述目标轨迹点对应的目标值;并基于所述多个目标轨迹点分别对应的目标值,确定所述目标用户对应的轨迹风险值,基于用户行为轨迹中多个目标轨迹点来确定目标用户的轨迹风险值,可以使确定的轨迹风险值包含更多的信息,提高轨迹风险值的准确率;接着确定所述目标用户对应的用户病症,并基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值;基于病症风险树可以加快计算目标用户的患病风险值的速率和准确率,从而提高风险判断的数据;最后将所述轨迹风险值和所述患病风险值输入预先训练完成的半监督学习模型,得到所述目标用户对应的风险标签,可以准确的判断出目标用户患病的风险值,提高了用户风险判断的准确率,提高了传染病排查的效率。
附图说明
图1是本申请实施例一提供的基于人工智能的疫情排查方法的流程图。
图2是本申请实施例二提供的基于人工智能的疫情排查装置的结构图。
图3是本申请实施例三提供的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施例对本申请进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述在一个可选的实施方式中实施例的目的,不是旨在于限制本申请。
本申请实施例提供的基于人工智能的疫情排查方法由电子设备执行,相应地,基于人工智能的疫情排查装置运行于电子设备中。所述电子设备可以包括手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等。
本申请实施例可以基于人工智能从目标用户的个人信息和用户轨迹等两个角度实现疫情排查,提高了风险监测的准确性。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
实施例一
图1是本申请实施例一提供的基于人工智能的疫情排查方法的流程图。所述基于人工智能的疫情排查方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据。
包含目标用户的视频流数据可以是通过具有图像采集能力的拍摄设备实时采集的数据。例如,拍摄设备可以是药店门口的监控摄像头,此时视频流数据可以是药店门口的监控摄像头拍摄的视频数据,拍摄设备也可以是药店门口的人脸验证设备,此时视频流数据可以是药店门口的人脸验证设备拍摄的视频数据。当然,拍摄设备还可以是其他能够进行图像采集的物联网(The Internet of Things,IOT)设备,视频流数据可以是该拍摄设备采集的视频数据,本申请实施例对此不做特殊限定。
人脸特征数据用于实现人脸识别,可以是实时采集到的视频流数据中包含的目标用户的脸部图像特征的数据。
在一个可选的实施方式中,所述对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据包括:
对对包含目标用户的视频流数据进行序列化处理,得到视频帧数据;
将所述视频帧数据缓存于可容错数据队列;
对所述可容错数据队列中的所述视频帧数据进行消费处理,得到所述目标用户对应的人脸特征数据。
其中,视频帧数据可以是指将视频流数据进行序列化处理后得到的视频帧,通过将视频流数据序列化,能够有效降低需要处理的数据量,提升数据处理的效率。可容错数据队列可以是具有容错机制的消息队列,可以有效提高实时视频流数据的处理效率。
本申请实施例中的流分析技术的实现可以基于OpenCV、Apache KafKa、ApacheSpark等开源流处理框架。例如,可以通过视频流采集单元OpenCV接收拍摄设备传送的视频流数据,将视频流数据序列化为视频帧数据,并将视频帧数据缓存在视频数据缓冲单元Apache KafKa中,视频数据缓冲单元Apache KafKa用于实现视频流数据的可容错数据队列,然后视频流处理单元Apache Spark消费Apache KafKa缓冲的视频帧数据并进行分析处理,检测出目标用户对应的人脸特征数据。采用消费者-生产者模型,通过生产者线程(OpenCV)读取拍摄设备传送的视频流数据,将视频流数据序列化得到视频帧数据,将得到的视频帧数据存入queue队列(可容错数据队列),最后通过消费者线程(视频流处理单元Apache Spark)对存入可容错数据队列中的视频帧数据进行消费处理,可以避免解码发生错误,导致视频流读取卡死的情况发生。
当然,此处仅是示意性举例说明,流分析服务还可以是以其他方式实现的,本申请实施例对此不做特殊限定。
S12,根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹。
可以基于预先训练的人脸识别模型对所述人脸特征数据进行识别,从而确定目标用户对应的用户身份。基于所述目标用户对应的用户身份,确定所述目标用户对应的用户行为轨迹,其中所述用户行为轨迹为预设时间间隔内的行为轨迹,例如,为14天内的行为轨迹、一个月内的行为轨迹等,在此不做任何限定。获取到的用户行为轨迹可以存储至区块链中。
在一个可选的实施方式中,所述根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹包括:
获取预构建的人脸识别模型,并确定所述预构建的人脸识别模型对应的识别范围;
采集所述识别范围内的用户对应的历史人脸特征数据;
基于采集到的所述历史人脸特征数据,对所述预构建的人脸识别模型进行模型训练,得到训练完成的人脸识别模型;
将所述人脸特征数据输入所述训练完成的人脸识别模型,得到所述目标用户对应的用户身份;
基于所述用户身份,确定所述目标用户对应的用户行为轨迹。
可以基于预构建的人脸识别模型对应的应用场景,确定所述预构建的人脸识别模型对应的识别范围。例如,一构建的人脸识别模型对应的应用场景是对进入药店A的用户进行识别,可以基于药店A的地理坐标,确定该人脸识别模型对应的识别范围。可以预先设置半径值,以药店A为圆点,按照半径值画圈,圈中的范围为该人脸识别模型对应的识别范围。
选择药店(诊所)时,用户通常是就近选择,因此前往药店(诊所)的用户通常是居住在附近或者工作在附近的用户。可以基于预设的规则,确定人脸识别模型对应的识别范围,识别范围为可能前往药店(诊所)的用户居住的范围。根据人脸识别模型的应用场景确定,可以减少模型训练的样本,减少人脸识别模型的训练量,从而加快人脸识别模型的训练数据。同时,由于模型训练的样本减少,可以减小人脸识别模型的模型体积,方便安装。
示例性的,可以选用Google Tensorflow开源机器学习框架训练人脸识别模型。举例而言,可以选用深度神经网络模型,并编写训练模型代码,将预先采集的历史人脸特征数据,如可以是存储在区块链网络中所述识别范围内用户对应的历史人脸特征数据导入深度神经网络模型中,通过编写的训练模型代码对该深度神经网络模型进行训练,得到初步训练完成的人脸识别模型;然后将采集的历史人脸特征数据导入初步训练完成的人脸识别模型中进行人脸识别,验证模型的识别准确率。在识别准确率较低时,调整初步训练完成的人脸识别模型的模型参数,重新进行模型训练,得到识别准确率更高的人脸识别模型,不断重复该训练验证过程,直到得到识别准确率满足要求的人脸识别模型,并将其作为最终的人脸识别模型,即训练完成的人脸识别模型。
示例性的,若将所述人脸特征数据输入所述训练完成的人脸识别模型,不能得到所述目标用户对应的用户身份,所述方法还包括:确定所述训练完成的人脸识别模型对应的区域层级;将所述人脸特征数据输入区域层级大于所述训练完成的人脸识别模型对应的区域层级的人脸识别模型,得到所述目标用户对应的用户信息。不同的人脸识别模型可以为不同的区域层级,区域层级高的人脸识别模型可以包括更多的训练样本,可能识别出更多的人脸特征数据,对应的模型体积也越大。
S13,基于所述用户行为轨迹,确定多个目标轨迹点。
根据目标用户的用户行为轨迹,确定目标用户经过的地点,可以将经过的地点确定为多个目标轨迹点。
在一个可选的实施方式中,所述基于所述用户行为轨迹,确定多个目标轨迹点包括:
根据所述用户行为轨迹,确定所述用户行为轨迹对应的轨迹路线;
基于地理坐标系统,确定所述轨迹路线中的多个轨迹点,并计算每个所述轨迹点在预设时间间隔内对应的人流量;
若有一轨迹点在预设时间间隔内对应的人流量大于或等于预设人流量阈值,则将该轨迹点确定为目标轨迹点。
所述地理坐标系统可以包括高德坐标系和百度坐标系等。根据所述地理坐标系统中对地点的标注,在轨迹路线中确定多个轨迹点。例如,将轨迹路线中包括地理坐标系统标注的点确定为轨迹点。即若轨迹路线中的一个点在地理坐标系统中存在标注,确定该点为轨迹路线对应的轨迹点。
S14,按照预设的检索任务对所述多个目标轨迹点进行检索,确定每个所述目标轨迹点对应的目标值;并基于每个所述目标轨迹点对应的目标值,确定所述目标用户对应的轨迹风险值。
检索任务可以按照实际情况进行预设,例如可以包括确定在预设时间间隔内,以目标轨迹点为中心的预设范围内中是否存在预设用户,所述预设用户可以为患有某种疾病的用户,即确定目标用户的用户轨迹与预设用户的用户轨迹是否存在交集。根据在预设时间间隔内,以目标轨迹点为中心的预设范围内是否存在预设用户,来确定每个目标轨迹点对应的目标值。
在一个可选的实施方式中,可以将每个所述目标轨迹点对应的目标值相加,得到所述目标用户对应的轨迹风险值;也可以将每个所述目标轨迹点对应的目标值相乘,得到所述目标用户对应的轨迹风险值。
示例性的,若在预设时间间隔内,以一目标轨迹点为中心的预设范围内不存在预设用户,可以将该目标轨迹点对应的目标值确定为0。若在预设时间间隔内,以一目标轨迹点为中心的预设范围内存在预设用户,可以根据预设用户出现的位置与目标轨迹点的距离和/或预设用户出现的时间,确定该目标轨迹点对应的目标值。例如,预设用户出现的位置与目标轨迹点的距离越近,该目标轨迹点对应的目标值越大,预设用户出现的位置与目标轨迹点的距离越远,该目标轨迹点对应的目标值越小;预设用户出现的时间与目标用户出现在该目标轨迹点的时间相隔越短,该目标轨迹点对应的目标值越大,预设用户出现的时间与目标用户出现在该目标轨迹点的时间相隔越长,该目标轨迹点对应的目标值越小。
S15,确定所述目标用户对应的用户病症,并基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值。
可以基于目标用户的自述病情,确定目标用户对应的用户病症;或者可以基于客户的输入确定目标用户对应的用户病症。通过将目标用户对应的用户病症遍历预先构建的目标疾病对应的病症风险树,确定目标用户患有目标疾病的可能性,即确定患病风险值。其中,目标疾病为需要进行排查的疾病,如传染病等。
在一个可选的实施方式中,所述基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值包括:
使用预设的医学词库对所述用户病症进行处理,得到多个病症词;
根据所述多个病症词遍历预先构建的病症风险树,确定每个所述病症词对应的节点;
确定每个所述节点对应的节点值及对应的节点层级;
基于所述节点层级和所述节点值,确定所述目标用户对应的患病风险值。
可以基于预设的医学词库对用户病症中的口语化症状进行相应的处理,替换为符合要求的病症词。例如,将用户病症中的口语化症状“喉咙有些疼痛”替换为病症词“咽喉痛”,将用户病症中的口语化症状“拉肚子”替换为病症词“腹泻”。
预先构建的病症风险树包括多个节点,每个节点包括对应的节点值和节点层级,不同的节点层级对应的权重值也不同,节点层级越高,对应的权重值越大;节点层级越低,对应的权重值越小。
可以将所述节点对应的节点值乘以该节点的节点层级对应的节点权重,得到该节点对应的病症词的风险值。将所述多个病症词的风险值相加,得到所述目标用户对应的患病风险值。
在一个可选的实施方式中,根据所述多个病症词遍历预先构建的病症风险树之前,所述方法还包括:
获取目标疾病对应的多个患者病例,并基于所述多个患者病例确定多个病症特征;
根据所述多个病症特征,确定多个第一病症词组,每个所述第一病症词组有且仅有一个病症特征;
从所述多个病症特征中任意选取两个病症特征,组成多个第二病症词组,每个所述第二病症词组中包括两个病症特征;
分别计算每个所述第一病症词组和每个所述第二病症词组的基尼指数,并基于所述基尼指数在所述第一病症词组和所述第二病症词组中,确定目标词组;
基于所述目标词组,构建所述目标疾病对应的病症风险树。
获取被确诊某一疾病的多个患者的患者病例,所述患者病例中包括每个患者对应的多个病症特征。病症特征用于表示患者的状况,如咳嗽、气粗、咽痛和口渴等。
根据所述多个病症特征,确定多个第一病症词组。例如,根据咳嗽、气粗、咽痛和口渴四个病症特征,确定四个第一病症词组,第一病症词组:咳嗽,第一病症词组:气粗,第一病症词组:咽痛和第一病症词组:口渴。
从所述多个病症特征中任意选取两个病症特征,组成多个第二病症词组,每个所述第二病症词组中包括两个病症特征。例如,根据咳嗽、气粗、咽痛和口渴四个病症特征,确定六个第二病症词组,第二病症词组:咳嗽、气粗;第二病症词组:咳嗽、咽痛;第二病症词组:咳嗽、口渴;第二病症词组:气粗、咽痛;第二病症词组:气粗、口渴;第二病症词组:咽痛、口渴。
计算每个第一病症词组和每个第二病症词组的基尼指数。并基于所述基尼指数的大小,对所述第一病症词组和所述第二病症词组按照从小到大进行排序,选取两个基尼指数最小的词组作为目标词组。基尼指数表示在样本集合中一个随机选中的样本被分错的概率,基尼指数越小表示集合中被选中的样本被参错的概率越小,也就是说集合的纯度越高。基于基尼指数构建病症风险树,可以提高病症风险树的准确率。
在一个可选的实施方式中,所述基于所述目标词组,构建所述目标疾病对应的病症风险树,包括:
确定所述病症为病症风险树的根节点,将所述目标词组对应的病症特征作为第一父节点,对所述根节点进行二分叉处理;
在所述多个患者病例对应的多个病症特征中,确定所述目标词组对应的多个病症特征;
基于所述目标词组对应的多个病症特征,确定多个病症词组,并计算每个所述病症词组的基尼指数;
基于所述基尼指数,对所述第一父节点进行二分叉处理,得到构建完成的病症风险树。
示例性的,可以基于CART回归树建立算法,建立所述病症对应的病症风险树。基于目标词组对应的病症特征作为第一父节点,继续二分,从而得到病症对应的病症风险树。例如,确定包含目标词组中病症特征的患者病例,并确定所述患者病例对应的多个病症特征,将所述多个病症特征中除目标词组包括的病症特征外的其他病症特征,确定为所述目标词组对应的多个病症特征。
S16,将所述轨迹风险值和所述患病风险值输入预先训练完成的半监督学习模型,得到所述目标用户对应的风险标签。
半监督学习模型是基于半监督学习算法的一种模型,模型的输入为目标用户的轨迹风险值和患病风险值,输出为所述目标用户得该病症的风险标签。所述风险标签可以根据实际情况进行设置,在此不做任何限定,如,高风险、中风险、低风险等。其中,半监督算法可以包括自训练算法、基于图的半监督算法和半监督支持向量机等。
在一个可选的实施方式中,所述方法还包括:获取多个用户的用户病例,所述用户病例包括轨迹风险值和病例风险值;在所述多个用户中确定多个标签用户,对所述多个标签用户的用户病例进行标签,得到多个风险标签;将所述多个用户的轨迹风险值、病例风险值和多个风险标签输入预构建的半监督学习模型进行模型训练,得到训练完成的半监督学习模型。具体的,半监督学习模型可以参照标签传播算法的相关描述,在此不做过多的叙述。
本申请所述的基于人工智能的疫情排查方法,通过对包含目标用户的视频流数据进行流分析处理,提取所述目标用户对应的人脸特征数据,根据流分析处理可以提高提取人脸特征数据的效率和准确率;并根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹;然后基于所述用户行为轨迹,确定多个目标轨迹点;按照预设的检索任务分别对所述多个目标轨迹点进行检索,确定每个所述目标轨迹点对应的目标值;并基于所述多个目标轨迹点分别对应的目标值,确定所述目标用户对应的轨迹风险值,基于用户行为轨迹中多个目标轨迹点来确定目标用户的轨迹风险值,可以使确定的轨迹风险值包含更多的信息,提高轨迹风险值的准确率;接着确定所述目标用户对应的用户病症,并基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值;基于病症风险树可以加快计算目标用户的患病风险值的速率和准确率,从而提高风险判断的数据;最后将所述轨迹风险值和所述患病风险值输入预先训练完成的半监督学习模型,得到所述目标用户对应的风险标签,可以准确的判断出目标用户患病的风险值,提高了用户风险判断的准确率,提高了传染病排查的效率。
实施例二
图2是本申请实施例二提供的基于人工智能的疫情排查装置的结构图。
在一些实施例中,所述基于人工智能的疫情排查装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的疫情排查装置20中的各个程序段的计算机程序可以存储于电子设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)基于人工智能的疫情排查方法的功能。
本实施例中,所述基于人工智能的疫情排查装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:特征提取模块201、人脸识别模块202、目标确定模块203、风险计算模块204、疾病匹配模块205及标签生成模块206。本申请所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
特征提取模块201,用于对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据。
包含目标用户的视频流数据可以是通过具有图像采集能力的拍摄设备实时采集的数据。例如,拍摄设备可以是药店门口的监控摄像头,此时视频流数据可以是药店门口的监控摄像头拍摄的视频数据,拍摄设备也可以是药店门口的人脸验证设备,此时视频流数据可以是药店门口的人脸验证设备拍摄的视频数据。当然,拍摄设备还可以是其他能够进行图像采集的物联网(The Internet of Things,IOT)设备,视频流数据可以是该拍摄设备采集的视频数据,本申请实施例对此不做特殊限定。
人脸特征数据用于实现人脸识别,可以是实时采集到的视频流数据中包含的目标用户的脸部图像特征的数据。
在一个可选的实施方式中,特征提取模块201对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据包括:
对对包含目标用户的视频流数据进行序列化处理,得到视频帧数据;
将所述视频帧数据缓存于可容错数据队列;
对所述可容错数据队列中的所述视频帧数据进行消费处理,得到所述目标用户对应的人脸特征数据。
其中,视频帧数据可以是指将视频流数据进行序列化处理后得到的视频帧,通过将视频流数据序列化,能够有效降低需要处理的数据量,提升数据处理的效率。可容错数据队列可以是具有容错机制的消息队列,可以有效提高实时视频流数据的处理效率。
本申请实施例中的流分析技术的实现可以基于OpenCV、Apache KafKa、ApacheSpark等开源流处理框架。例如,可以通过视频流采集单元OpenCV接收拍摄设备传送的视频流数据,将视频流数据序列化为视频帧数据,并将视频帧数据缓存在视频数据缓冲单元Apache KafKa中,视频数据缓冲单元Apache KafKa用于实现视频流数据的可容错数据队列,然后视频流处理单元Apache Spark消费Apache KafKa缓冲的视频帧数据并进行分析处理,检测出目标用户对应的人脸特征数据。采用消费者-生产者模型,通过生产者线程(OpenCV)读取拍摄设备传送的视频流数据,将视频流数据序列化得到视频帧数据,将得到的视频帧数据存入queue队列(可容错数据队列),最后通过消费者线程(视频流处理单元Apache Spark)对存入可容错数据队列中的视频帧数据进行消费处理,可以避免解码发生错误,导致视频流读取卡死的情况发生。
当然,此处仅是示意性举例说明,流分析服务还可以是以其他方式实现的,本申请实施例对此不做特殊限定。
人脸识别模块202,用于根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹。
可以基于预先训练的人脸识别模型对所述人脸特征数据进行识别,从而确定目标用户对应的用户身份。基于所述目标用户对应的用户身份,确定所述目标用户对应的用户行为轨迹,其中所述用户行为轨迹为预设时间间隔内的行为轨迹,例如,为14天内的行为轨迹、一个月内的行为轨迹等,在此不做任何限定。获取到的用户行为轨迹可以存储至区块链中。
在一个可选的实施方式中,人脸识别模块202根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹包括:
获取预构建的人脸识别模型,并确定所述预构建的人脸识别模型对应的识别范围;
采集所述识别范围内的用户对应的历史人脸特征数据;
基于采集到的所述历史人脸特征数据,对所述预构建的人脸识别模型进行模型训练,得到训练完成的人脸识别模型;
将所述人脸特征数据输入所述训练完成的人脸识别模型,得到所述目标用户对应的用户身份;
基于所述用户身份,确定所述目标用户对应的用户行为轨迹。
可以基于预构建的人脸识别模型对应的应用场景,确定所述预构建的人脸识别模型对应的识别范围。例如,一构建的人脸识别模型对应的应用场景是对进入药店A的用户进行识别,可以基于药店A的地理坐标,确定该人脸识别模型对应的识别范围。可以预先设置半径值,以药店A为圆点,按照半径值画圈,圈中的范围为该人脸识别模型对应的识别范围。
选择药店(诊所)时,用户通常是就近选择,因此前往药店(诊所)的用户通常是居住在附近或者工作在附近的用户。可以基于预设的规则,确定人脸识别模型对应的识别范围,识别范围为可能前往药店(诊所)的用户居住的范围。根据人脸识别模型的应用场景确定,可以减少模型训练的样本,减少人脸识别模型的训练量,从而加快人脸识别模型的训练数据。同时,由于模型训练的样本减少,可以减小人脸识别模型的模型体积,方便安装。
示例性的,可以选用Google Tensorflow开源机器学习框架训练人脸识别模型。举例而言,可以选用深度神经网络模型,并编写训练模型代码,将预先采集的历史人脸特征数据,如可以是存储在区块链网络中所述识别范围内用户对应的历史人脸特征数据导入深度神经网络模型中,通过编写的训练模型代码对该深度神经网络模型进行训练,得到初步训练完成的人脸识别模型;然后将采集的历史人脸特征数据导入初步训练完成的人脸识别模型中进行人脸识别,验证模型的识别准确率。在识别准确率较低时,调整初步训练完成的人脸识别模型的模型参数,重新进行模型训练,得到识别准确率更高的人脸识别模型,不断重复该训练验证过程,直到得到识别准确率满足要求的人脸识别模型,并将其作为最终的人脸识别模型,即训练完成的人脸识别模型。
示例性的,若将所述人脸特征数据输入所述训练完成的人脸识别模型,不能得到所述目标用户对应的用户身份,所述方法还包括:确定所述训练完成的人脸识别模型对应的区域层级;将所述人脸特征数据输入区域层级大于所述训练完成的人脸识别模型对应的区域层级的人脸识别模型,得到所述目标用户对应的用户信息。不同的人脸识别模型可以为不同的区域层级,区域层级高的人脸识别模型可以包括更多的训练样本,可能识别出更多的人脸特征数据,对应的模型体积也越大。
目标确定模块203,用于基于所述用户行为轨迹,确定多个目标轨迹点。
根据目标用户的用户行为轨迹,确定目标用户经过的地点,可以将经过的地点确定为多个目标轨迹点。
在一个可选的实施方式中,目标确定模块203基于所述用户行为轨迹,确定多个目标轨迹点包括:
根据所述用户行为轨迹,确定所述用户行为轨迹对应的轨迹路线;
基于地理坐标系统,确定所述轨迹路线中的多个轨迹点,并计算每个所述轨迹点在预设时间间隔内对应的人流量;
若有一轨迹点在预设时间间隔内对应的人流量大于或等于预设人流量阈值,则将该轨迹点确定为目标轨迹点。
所述地理坐标系统可以包括高德坐标系和百度坐标系等。根据所述地理坐标系统中对地点的标注,在轨迹路线中确定多个轨迹点。例如,将轨迹路线中包括地理坐标系统标注的点确定为轨迹点。即若轨迹路线中的一个点在地理坐标系统中存在标注,确定该点为轨迹路线对应的轨迹点。
风险计算模块204,用于按照预设的检索任务对所述多个目标轨迹点进行检索,确定每个所述目标轨迹点对应的目标值;并基于每个所述目标轨迹点对应的目标值,确定所述目标用户对应的轨迹风险值。
检索任务可以按照实际情况进行预设,例如可以包括确定在预设时间间隔内,以目标轨迹点为中心的预设范围内中是否存在预设用户,所述预设用户可以为患有某种疾病的用户,即确定目标用户的用户轨迹与预设用户的用户轨迹是否存在交集。根据在预设时间间隔内,以目标轨迹点为中心的预设范围内是否存在预设用户,来确定每个目标轨迹点对应的目标值。
在一个可选的实施方式中,可以将每个所述目标轨迹点对应的目标值相加,得到所述目标用户对应的轨迹风险值;也可以将每个所述目标轨迹点对应的目标值相乘,得到所述目标用户对应的轨迹风险值。
示例性的,若在预设时间间隔内,以一目标轨迹点为中心的预设范围内不存在预设用户,可以将该目标轨迹点对应的目标值确定为0。若在预设时间间隔内,以一目标轨迹点为中心的预设范围内存在预设用户,可以根据预设用户出现的位置与目标轨迹点的距离和/或预设用户出现的时间,确定该目标轨迹点对应的目标值。例如,预设用户出现的位置与目标轨迹点的距离越近,该目标轨迹点对应的目标值越大,预设用户出现的位置与目标轨迹点的距离越远,该目标轨迹点对应的目标值越小;预设用户出现的时间与目标用户出现在该目标轨迹点的时间相隔越短,该目标轨迹点对应的目标值越大,预设用户出现的时间与目标用户出现在该目标轨迹点的时间相隔越长,该目标轨迹点对应的目标值越小。
疾病匹配模块205,用于确定所述目标用户对应的用户病症,并基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值。
可以基于目标用户的自述病情,确定目标用户对应的用户病症;或者可以基于客户的输入确定目标用户对应的用户病症。通过将目标用户对应的用户病症遍历预先构建的目标疾病对应的病症风险树,确定目标用户患有目标疾病的可能性,即确定患病风险值。其中,目标疾病为需要进行排查的疾病,如传染病等。
在一个可选的实施方式中,疾病匹配模块205基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值包括:
使用预设的医学词库对所述用户病症进行处理,得到多个病症词;
根据所述多个病症词遍历预先构建的病症风险树,确定每个所述病症词对应的节点;
确定每个所述节点对应的节点值及对应的节点层级;
基于所述节点层级和所述节点值,确定所述目标用户对应的患病风险值。
可以基于预设的医学词库对用户病症中的口语化症状进行相应的处理,替换为符合要求的病症词。例如,将用户病症中的口语化症状“喉咙有些疼痛”替换为病症词“咽喉痛”,将用户病症中的口语化症状“拉肚子”替换为病症词“腹泻”。
预先构建的病症风险树包括多个节点,每个节点包括对应的节点值和节点层级,不同的节点层级对应的权重值也不同,节点层级越高,对应的权重值越大;节点层级越低,对应的权重值越小。
可以将所述节点对应的节点值乘以该节点的节点层级对应的节点权重,得到该节点对应的病症词的风险值。将所述多个病症词的风险值相加,得到所述目标用户对应的患病风险值。
在一个可选的实施方式中,疾病匹配模块205根据所述多个病症词遍历预先构建的病症风险树之前,疾病匹配模块205还用于:
获取目标疾病对应的多个患者病例,并基于所述多个患者病例确定多个病症特征;
根据所述多个病症特征,确定多个第一病症词组,每个所述第一病症词组有且仅有一个病症特征;
从所述多个病症特征中任意选取两个病症特征,组成多个第二病症词组,每个所述第二病症词组中包括两个病症特征;
分别计算每个所述第一病症词组和每个所述第二病症词组的基尼指数,并基于所述基尼指数在所述第一病症词组和所述第二病症词组中,确定目标词组;
基于所述目标词组,构建所述目标疾病对应的病症风险树。
获取被确诊某一疾病的多个患者的患者病例,所述患者病例中包括每个患者对应的多个病症特征。病症特征用于表示患者的状况,如咳嗽、气粗、咽痛和口渴等。
根据所述多个病症特征,确定多个第一病症词组。例如,根据咳嗽、气粗、咽痛和口渴四个病症特征,确定四个第一病症词组,第一病症词组:咳嗽,第一病症词组:气粗,第一病症词组:咽痛和第一病症词组:口渴。
从所述多个病症特征中任意选取两个病症特征,组成多个第二病症词组,每个所述第二病症词组中包括两个病症特征。例如,根据咳嗽、气粗、咽痛和口渴四个病症特征,确定六个第二病症词组,第二病症词组:咳嗽、气粗;第二病症词组:咳嗽、咽痛;第二病症词组:咳嗽、口渴;第二病症词组:气粗、咽痛;第二病症词组:气粗、口渴;第二病症词组:咽痛、口渴。
计算每个第一病症词组和每个第二病症词组的基尼指数。并基于所述基尼指数的大小,对所述第一病症词组和所述第二病症词组按照从小到大进行排序,选取两个基尼指数最小的词组作为目标词组。基尼指数表示在样本集合中一个随机选中的样本被分错的概率,基尼指数越小表示集合中被选中的样本被参错的概率越小,也就是说集合的纯度越高。基于基尼指数构建病症风险树,可以提高病症风险树的准确率。
在一个可选的实施方式中,疾病匹配模块205基于所述目标词组,构建所述目标疾病对应的病症风险树,包括:
确定所述病症为病症风险树的根节点,将所述目标词组对应的病症特征作为第一父节点,对所述根节点进行二分叉处理;
在所述多个患者病例对应的多个病症特征中,确定所述目标词组对应的多个病症特征;
基于所述目标词组对应的多个病症特征,确定多个病症词组,并计算每个所述病症词组的基尼指数;
基于所述基尼指数,对所述第一父节点进行二分叉处理,得到构建完成的病症风险树。
示例性的,可以基于CART回归树建立算法,建立所述病症对应的病症风险树。基于目标词组对应的病症特征作为第一父节点,继续二分,从而得到病症对应的病症风险树。例如,确定包含目标词组中病症特征的患者病例,并确定所述患者病例对应的多个病症特征,将所述多个病症特征中除目标词组包括的病症特征外的其他病症特征,确定为所述目标词组对应的多个病症特征。
标签生成模块206,用于将所述轨迹风险值和所述患病风险值输入预先训练完成的半监督学习模型,得到所述目标用户对应的风险标签。
半监督学习模型是基于半监督学习算法的一种模型,模型的输入为目标用户的轨迹风险值和患病风险值,输出为所述目标用户得该病症的风险标签。所述风险标签可以根据实际情况进行设置,在此不做任何限定,如,高风险、中风险、低风险等。其中,半监督算法可以包括自训练算法、基于图的半监督算法和半监督支持向量机等。
在一个可选的实施方式中,所述方法还包括:获取多个用户的用户病例,所述用户病例包括轨迹风险值和病例风险值;在所述多个用户中确定多个标签用户,对所述多个标签用户的用户病例进行标签,得到多个风险标签;将所述多个用户的轨迹风险值、病例风险值和多个风险标签输入预构建的半监督学习模型进行模型训练,得到训练完成的半监督学习模型。具体的,半监督学习模型可以参照标签传播算法的相关描述,在此不做过多的叙述。
本申请所述的基于人工智能的疫情排查装置,通过对包含目标用户的视频流数据进行流分析处理,提取所述目标用户对应的人脸特征数据,根据流分析处理可以提高提取人脸特征数据的效率和准确率;并根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹;然后基于所述用户行为轨迹,确定多个目标轨迹点;按照预设的检索任务分别对所述多个目标轨迹点进行检索,确定每个所述目标轨迹点对应的目标值;并基于所述多个目标轨迹点分别对应的目标值,确定所述目标用户对应的轨迹风险值,基于用户行为轨迹中多个目标轨迹点来确定目标用户的轨迹风险值,可以使确定的轨迹风险值包含更多的信息,提高轨迹风险值的准确率;接着确定所述目标用户对应的用户病症,并基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值;基于病症风险树可以加快计算目标用户的患病风险值的速率和准确率,从而提高风险判断的数据;最后将所述轨迹风险值和所述患病风险值输入预先训练完成的半监督学习模型,得到所述目标用户对应的风险标签,可以准确的判断出目标用户患病的风险值,提高了用户风险判断的准确率,提高了传染病排查的效率。
实施例三
本实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述基于人工智能的疫情排查方法实施例中的步骤,例如图1所示的S11-S16:
S11,对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据;
S12,根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹;
S13,基于所述用户行为轨迹,确定多个目标轨迹点;
S14,按照预设的检索任务对所述多个目标轨迹点进行检索,确定每个所述目标轨迹点对应的目标值;并基于每个所述目标轨迹点对应的目标值,确定所述目标用户对应的轨迹风险值;
S15,确定所述目标用户对应的用户病症,并基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值;
S16,将所述轨迹风险值和所述患病风险值输入预先训练完成的半监督学习模型,得到所述目标用户对应的风险标签。
或者,该计算机程序被处理器执行时实现上述装置实施例中各模块/单元的功能,例如图2中的模块201-206:
特征提取模块201,用于对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据;
人脸识别模块202,用于根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹;
目标确定模块203,用于基于所述用户行为轨迹,确定多个目标轨迹点;
风险计算模块204,用于按照预设的检索任务对所述多个目标轨迹点进行检索,确定每个所述目标轨迹点对应的目标值;并基于每个所述目标轨迹点对应的目标值,确定所述目标用户对应的轨迹风险值;
疾病匹配模块205,用于确定所述目标用户对应的用户病症,并基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值;
标签生成模块206,用于将所述轨迹风险值和所述患病风险值输入预先训练完成的半监督学习模型,得到所述目标用户对应的风险标签。
实施例四
参阅图3所示,为本申请实施例三提供的电子设备的结构示意图。在本申请较佳实施例中,所述电子设备3包括存储器31、至少一个处理器32、收发器33及至少一条通信总线34。
本领域技术人员应该了解,图3示出的电子设备的结构并不构成本申请实施例的限定,既可以是总线型结构,也可以是星形结构,所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述电子设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述电子设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本申请,也应包含在本申请的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的疫情排查方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述至少一个处理器32是所述电子设备3的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行电子设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本申请实施例中所述的基于人工智能的疫情排查方法的全部或者部分步骤;或者实现基于人工智能的疫情排查装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线34被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述电子设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。说明书中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。
Claims (10)
1.一种基于人工智能的疫情排查方法,其特征在于,所述方法包括:
对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据;
根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹;
基于所述用户行为轨迹,确定多个目标轨迹点;
按照预设的检索任务对所述多个目标轨迹点进行检索,确定每个所述目标轨迹点对应的目标值;并基于每个所述目标轨迹点对应的目标值,确定所述目标用户对应的轨迹风险值;
确定所述目标用户对应的用户病症,并基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值;
将所述轨迹风险值和所述患病风险值输入预先训练完成的半监督学习模型,得到所述目标用户对应的风险标签。
2.如权利要求1所述的基于人工智能的疫情排查方法,其特征在于,所述对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据包括:
对包含目标用户的视频流数据进行序列化处理,得到视频帧数据;
将所述视频帧数据缓存于可容错数据队列;
对所述可容错数据队列中的所述视频帧数据进行消费处理,得到所述目标用户对应的人脸特征数据。
3.如权利要求1所述的基于人工智能的疫情排查方法,其特征在于,所述根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹包括:
获取预构建的人脸识别模型,并确定所述预构建的人脸识别模型对应的识别范围;
采集所述识别范围内的用户对应的历史人脸特征数据;
基于采集到的所述历史人脸特征数据,对所述预构建的人脸识别模型进行模型训练,得到训练完成的人脸识别模型;
将所述人脸特征数据输入所述训练完成的人脸识别模型,得到所述目标用户对应的用户身份;
基于所述用户身份,确定所述目标用户对应的用户行为轨迹。
4.如权利要求1所述的基于人工智能的疫情排查方法,其特征在于,所述基于所述用户行为轨迹,确定多个目标轨迹点包括:
根据所述用户行为轨迹,确定所述用户行为轨迹对应的轨迹路线;
基于地理坐标系统,确定所述轨迹路线中的多个轨迹点,并计算每个所述轨迹点在预设时间间隔内对应的人流量;
若有一轨迹点在预设时间间隔内对应的人流量大于或等于预设人流量阈值,则将该轨迹点确定为目标轨迹点。
5.如权利要求1所述的基于人工智能的疫情排查方法,其特征在于,所述基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值包括:
使用预设的医学词库对所述用户病症进行处理,得到多个病症词;
根据所述多个病症词遍历预先构建的病症风险树,确定每个所述病症词对应的节点;
确定每个所述节点对应的节点值及对应的节点层级;
基于所述节点层级和所述节点值,确定所述目标用户对应的患病风险值。
6.如权利要求5所述的基于人工智能的疫情排查方法,其特征在于,所述根据所述多个病症词遍历预先构建的病症风险树之前,所述方法还包括:
获取目标疾病对应的多个患者病例,并基于所述多个患者病例确定多个病症特征;
根据所述多个病症特征,确定多个第一病症词组,每个所述第一病症词组有且仅有一个病症特征;
从所述多个病症特征中任意选取两个病症特征,组成多个第二病症词组,每个所述第二病症词组中包括两个病症特征;
分别计算每个所述第一病症词组和每个所述第二病症词组的基尼指数,并基于所述基尼指数在所述第一病症词组和所述第二病症词组中,确定目标词组;
基于所述目标词组,构建所述目标疾病对应的病症风险树。
7.如权利要求6所述的基于人工智能的疫情排查方法,其特征在于,所述基于所述目标词组,构建所述目标疾病对应的病症风险树包括:
确定所述病症为病症风险树的根节点,将所述目标词组对应的病症特征作为第一父节点,对所述根节点进行二分叉处理;
在所述多个患者病例对应的多个病症特征中,确定所述目标词组对应的多个病症特征;
基于所述目标词组对应的多个病症特征,确定多个病症词组,并计算每个所述病症词组的基尼指数;
基于所述基尼指数,对所述第一父节点进行二分叉处理,得到构建完成的病症风险树。
8.一种基于人工智能的疫情排查装置,其特征在于,所述装置包括:
特征提取模块,用于对包含目标用户的视频流数据进行流分析处理,得到所述目标用户对应的人脸特征数据;
人脸识别模块,用于根据所述人脸特征数据进行人脸识别,确定所述目标用户对应的用户行为轨迹;
目标确定模块,用于基于所述用户行为轨迹,确定多个目标轨迹点;
风险计算模块,用于按照预设的检索任务对所述多个目标轨迹点进行检索,确定每个所述目标轨迹点对应的目标值;并基于每个所述目标轨迹点对应的目标值,确定所述目标用户对应的轨迹风险值;
疾病匹配模块,用于确定所述目标用户对应的用户病症,并基于预先构建的病症风险树和所述用户病症,确定所述目标用户对应的患病风险值;
标签生成模块,用于将所述轨迹风险值和所述患病风险值输入预先训练完成的半监督学习模型,得到所述目标用户对应的风险标签。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述基于人工智能的疫情排查方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述基于人工智能的疫情排查方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111257942.4A CN113963413A (zh) | 2021-10-27 | 2021-10-27 | 基于人工智能的疫情排查方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111257942.4A CN113963413A (zh) | 2021-10-27 | 2021-10-27 | 基于人工智能的疫情排查方法、装置、电子设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113963413A true CN113963413A (zh) | 2022-01-21 |
Family
ID=79467744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111257942.4A Pending CN113963413A (zh) | 2021-10-27 | 2021-10-27 | 基于人工智能的疫情排查方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113963413A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116186549A (zh) * | 2023-05-04 | 2023-05-30 | 深圳前海中电慧安科技有限公司 | 模型的训练方法、装置、设备和介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111524613A (zh) * | 2020-04-27 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 基于区块链的用户行为轨迹信息采集方法、装置和设备 |
CN111798988A (zh) * | 2020-07-07 | 2020-10-20 | 医渡云(北京)技术有限公司 | 风险区域预测方法、装置、电子设备及计算机可读介质 |
CN113380420A (zh) * | 2020-10-13 | 2021-09-10 | 深圳云天励飞技术股份有限公司 | 一种疫情预测方法、装置、电子设备及存储介质 |
CN113436725A (zh) * | 2021-06-24 | 2021-09-24 | 平安国际智慧城市科技股份有限公司 | 数据处理方法、系统、计算机设备及计算机可读存储介质 |
US20210327562A1 (en) * | 2020-04-20 | 2021-10-21 | PredictMedix Inc. | Artificial intelligence driven rapid testing system for infectious diseases |
-
2021
- 2021-10-27 CN CN202111257942.4A patent/CN113963413A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210327562A1 (en) * | 2020-04-20 | 2021-10-21 | PredictMedix Inc. | Artificial intelligence driven rapid testing system for infectious diseases |
CN111524613A (zh) * | 2020-04-27 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 基于区块链的用户行为轨迹信息采集方法、装置和设备 |
CN111798988A (zh) * | 2020-07-07 | 2020-10-20 | 医渡云(北京)技术有限公司 | 风险区域预测方法、装置、电子设备及计算机可读介质 |
CN113380420A (zh) * | 2020-10-13 | 2021-09-10 | 深圳云天励飞技术股份有限公司 | 一种疫情预测方法、装置、电子设备及存储介质 |
CN113436725A (zh) * | 2021-06-24 | 2021-09-24 | 平安国际智慧城市科技股份有限公司 | 数据处理方法、系统、计算机设备及计算机可读存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116186549A (zh) * | 2023-05-04 | 2023-05-30 | 深圳前海中电慧安科技有限公司 | 模型的训练方法、装置、设备和介质 |
CN116186549B (zh) * | 2023-05-04 | 2023-08-08 | 深圳前海中电慧安科技有限公司 | 模型的训练方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI766618B (zh) | 關鍵點檢測方法、電子設備及電腦可讀儲存介質 | |
CN111723786A (zh) | 一种基于单模型预测的安全帽佩戴检测方法及装置 | |
CN111949708B (zh) | 基于时序特征提取的多任务预测方法、装置、设备及介质 | |
WO2020224433A1 (zh) | 基于机器学习的目标对象属性预测方法及相关设备 | |
CN112614578B (zh) | 医生智能推荐方法、装置、电子设备及存储介质 | |
CN113782125B (zh) | 基于人工智能的诊所评分方法、装置、电子设备及介质 | |
CN112216361A (zh) | 基于人工智能的随访计划单生成方法、装置、终端及介质 | |
CN113903469A (zh) | 基于人工智能的心理测评方法、装置、电子设备及介质 | |
CN112634889B (zh) | 基于人工智能的电子病例录入方法、装置、终端及介质 | |
CN111666415A (zh) | 话题聚类方法、装置、电子设备及存储介质 | |
CN111770317A (zh) | 用于智慧社区的视频监控方法、装置、设备及介质 | |
CN113723513A (zh) | 多标签图像分类方法、装置及相关设备 | |
CN113870974A (zh) | 基于人工智能的风险预测方法、装置、电子设备及介质 | |
CN113704410A (zh) | 情绪波动检测方法、装置、电子设备及存储介质 | |
CN113674858A (zh) | 在线医疗处方用药智能检查方法、装置、设备及存储介质 | |
CN114334175A (zh) | 医院疫情监测方法、装置、计算机设备及存储介质 | |
CN114862140A (zh) | 基于行为分析的潜力评估方法、装置、设备及存储介质 | |
CN114220541A (zh) | 疾病预测方法、装置、电子设备及存储介质 | |
CN112651782B (zh) | 基于缩放点积注意力的行为预测方法、装置、设备及介质 | |
CN113963413A (zh) | 基于人工智能的疫情排查方法、装置、电子设备及介质 | |
CN114220536A (zh) | 基于机器学习的疾病分析方法、装置、设备及存储介质 | |
CN112837466B (zh) | 票据识别方法、装置、设备以及存储介质 | |
CN114201328A (zh) | 基于人工智能的故障处理方法、装置、电子设备及介质 | |
CN111950707B (zh) | 基于行为共现网络的行为预测方法、装置、设备及介质 | |
CN113744845A (zh) | 基于人工智能的医学影像处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220921 Address after: Room 2601 (Unit 07), Qianhai Free Trade Building, No. 3048, Xinghai Avenue, Nanshan Street, Qianhai Shenzhen-Hong Kong Cooperation Zone, Shenzhen, Guangdong 518000 Applicant after: Shenzhen Ping An Smart Healthcare Technology Co.,Ltd. Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000 Applicant before: Ping An International Smart City Technology Co.,Ltd. |