CN111639173B - 疫情数据处理方法、装置、设备和存储介质 - Google Patents

疫情数据处理方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111639173B
CN111639173B CN202010442076.5A CN202010442076A CN111639173B CN 111639173 B CN111639173 B CN 111639173B CN 202010442076 A CN202010442076 A CN 202010442076A CN 111639173 B CN111639173 B CN 111639173B
Authority
CN
China
Prior art keywords
news data
data
target area
epidemic
medical resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010442076.5A
Other languages
English (en)
Other versions
CN111639173A (zh
Inventor
程鹏
张人杰
唐叶秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202010442076.5A priority Critical patent/CN111639173B/zh
Publication of CN111639173A publication Critical patent/CN111639173A/zh
Application granted granted Critical
Publication of CN111639173B publication Critical patent/CN111639173B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例公开了一种疫情数据处理方法、装置、设备和存储介质。该疫情数据处理方法包括:获取新闻数据,所述新闻数据包括历史新闻数据和实时新闻数据;对所述新闻数据进行语义识别,并根据识别结果从所述新闻数据中提取目标区域的疫情新闻数据;其中,所述疫情新闻数据至少包括医疗资源分布信息;根据所述目标区域的医疗资源分布信息,生成目标区域的疫情地图。提高了普通群众对感兴趣区域的医疗资源分布信息确定的准确性以及实时性。

Description

疫情数据处理方法、装置、设备和存储介质
技术领域
本发明实施例涉及数据分析技术领域,尤其涉及一种疫情数据处理方法、装置、设备和存储介质。
背景技术
近期,受新型冠状病毒感染肺炎(Corona Virus Disease 2019,COVID-19)疫情影响,人们的生命受到威胁。
目前,对于疫情相关信息需要从公开的各种新闻数据中获取正确消息,尤其对于实时公开的疫情数据,官方平台尚未进行认证时,人们很难从众多真真假假的消息中得到准确的实时疫情数据。
发明内容
本发明实施例提供一种疫情数据处理方法、装置、设备和存储介质,以提高普通群众对感兴趣区域的医疗资源分布信息确定的准确性以及实时性。
第一方面,本发明实施例提供了一种疫情数据处理方法,包括:
获取新闻数据,所述新闻数据包括历史新闻数据和实时新闻数据;
对所述新闻数据进行语义识别,并根据识别结果从所述新闻数据中提取目标区域的疫情新闻数据;其中,所述疫情新闻数据至少包括医疗资源分布信息;
根据所述目标区域的医疗资源分布信息,生成目标区域的疫情地图。
第二方面,本发明实施例还提供了一种疫情数据处理装置,包括:
新闻数据获取模块,用于获取新闻数据,所述新闻数据包括历史新闻数据和实时新闻数据;
疫情新闻数据提取模块,用于对所述新闻数据进行语义识别,并根据识别结果从所述新闻数据中提取目标区域的疫情新闻数据;其中,所述疫情新闻数据至少包括医疗资源分布信息;
疫情地图生成模块,用于根据所述目标区域的医疗资源分布信息,生成目标区域的疫情地图。
第三方面,本发明实施例还提供了一种设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的疫情数据处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任一实施例所述的疫情数据处理方法。
本发明实施例根据对获取到的历史新闻数据和实时新闻数据进行语义识别,从中提取准确的目标区域的疫情新闻数据,并将疫情新闻数据直观地显示在可视化的地图中,以生成疫情地图。由于疫情新闻数据中至少包括医疗资源分布信息,则群众可从疫情地图中查看目标区域中的医疗资源分布信息,为群众选择合适的就诊医院提供帮助,保证了群众获取信息的直观性、准确性以及实时性。
附图说明
图1是本发明实施例一中的疫情数据处理方法的流程图;
图2是本发明实施例二中的疫情数据处理方法的流程图;
图3是本发明实施例三中的疫情数据处理装置的结构示意图;
图4是本发明实施例四中的设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一中的疫情数据处理方法的流程图,本实施例可适用于为普通群众提供综合准确可视化的医疗资源分布实时信息的情况。该方法可以由疫情数据处理装置来执行,该装置可以采用软件和/或硬件的方式实现,并可配置在设备中,例如设备可以是后台服务器等具有通信和计算能力的设备。
如图1所示,该方法具体包括:
步骤101、获取新闻数据,新闻数据包括历史新闻数据和实时新闻数据。
其中,新闻数据是指各大媒体公布的包含海量资讯的事件信息。例如政府官网以及国家卫健委官网等。实时新闻数据是指媒体实时公布的事件信息,对实时新闻数据的获取保证了数据获取的及时性以及准确性。历史新闻数据是指非实时新闻数据的相关信息,保持对历史新闻数据的获取是为了避免信息的遗漏,保证信息获取的完整性。
示例性的,通过爬虫定向获取互联网上公布的新闻数据,新闻数据中包括时间戳信息,根据时间戳信息判断历史新闻数据和实时新闻数据。并且对于爬虫获取到的新闻数据中包括多方面的数据,数据来源复杂。
步骤102、对新闻数据进行语义识别,并根据识别结果从新闻数据中提取目标区域的疫情新闻数据;其中,疫情新闻数据至少包括医疗资源分布信息。
其中,语义识别是指对新闻数据所表达的含义进行判断,即对新闻数据的所属领域以及对新闻数据中关键信息进行提取。目标区域是指用户感兴趣的区域范围,可以根据用户的兴趣进行设置,例如目标区域可以是用户住处所在区域。疫情新闻数据是指与疫情有关的所有新闻数据,可以根据新闻数据中是否存在与疫情有关的关键词进行判断。医疗资源分布信息是指与治疗该疫情相关的医疗资源在目标区域中的分布信息,例如支持接收疫情感染病人的医院信息。
示例性的,通过NLP(Natural Language Processing,自然语言处理)技术对新闻数据进行语义识别,利用Bigram语言模型对预先提取的新闻数据训练集进行训练,通过模型提取特征值后对新闻数据进行分类,从分类结果中可以得到疫情新闻数据。对于新闻数据训练集是通过正则过滤后的新闻数据进行确定。可选的,对于分类得到的输出结果进行进一步的筛选核心内容,将筛选后的新闻数据作为疫情新闻数据,其中,核心内容可以根据疫情的具体情况进行设定。通过NLP技术基于新闻数据的文本特征对新闻数据的信息进行提取,可以提高对新闻数据特征提取的准确性,进而提高疫情新闻数据确定的准确性。
具体的,获取用户确定的目标区域信息,根据目标区域的区域特征以及疫情相关医疗资源特征从大量的新闻数据中确定目标区域的医疗资源分布信息。
步骤103、根据目标区域的医疗资源分布信息,生成目标区域的疫情地图。
其中,疫情地图是通过可视化的方式将目标区域中的疫情相关信息进行展示的结果。通过生成的疫情地图,用户可以更加直观的确定该区域中的疫情相关信息。
具体的,确定该目标区域中的医疗资源分布信息后,将分布的各医疗资源在该目标区域的地图上进行标记,得到疫情地图。即通过疫情地图用户可以对该目标区域中的医疗资源进行综合性的了解,并且医疗资源分布信息是随着实时新闻数据的获取进行实时更新的,因此疫情地图中所显示的医疗资源也在进行更新,便于用户获取准确的实时信息,对医疗资源的综合性把握有利于用户在面对选择医院时可以确定更加合适的医院。
可选的,根据目标区域的医疗资源分布信息,生成目标区域的疫情地图,包括:
根据目标区域的边界信息,绘制目标区域基础地图;
根据目标区域的医疗资源分布信息,在目标区域基础地图上添加医疗资源可视化元素,以得到目标区域的疫情地图。
目标区域的边界信息可以根据目标区域的地理位置进行确定,地理位置包括目标区域的边界经纬度信息,可以从官方途径进行获取,以保证边界信息确定的准确性。
基于目标区域的边界经纬度信息确定目标区域的边界,进而根据边界绘制目标区域基础地图,基础地图上添加医疗资源可视化元素,以对医疗资源分布信息进行更加直观的展示。例如在医疗资源所在的位置上添加特殊标记,并且可以根据医疗资源的具体情况对特殊标记进行分类,例如根据医院等级或者医院大小等信息。通过医疗资源可视化元素的添加,实现了医疗资源分布信息的直观可视化展示。
可选的,医疗资源分布信息包括各医疗资源的位置信息和配置信息,
相应的,根据目标区域的医疗资源分布信息,在目标区域基础地图上添加医疗资源可视化元素,以得到目标区域的疫情地图,包括:
根据医疗资源的位置信息,在目标区域基础地图中添加医疗资源定位元素,并在医疗资源定位元素处根据该医疗资源的配置信息,添加医疗资源文本元素。
对于医疗资源可以是支持接收疫情感染病人的发热门诊,医疗资源的位置信息是指发热门诊的坐标信息,医疗资源的配置信息是指该医疗资源中的医生护士数量、当前已接收疫情感染病人数量或者当前还可接收疫情感染病人数量。
示例性的,确定各医疗资源的位置信息,并在基础地图的相对应的位置上标记该医疗资源,标记可以通过添加医疗资源定位元素的方式,用户通过该定位元素可以实现导航或者确定详细位置信息等。并在各医疗资源定位元素所在位置标记该医疗资源的配置信息,标记可以通过添加医疗资源文本元素的方式,在该医疗资源处显示该资源的配置信息,或者按照配置信息的具体内容设置特殊的文本元素对该医疗资源进行展示,具体元素展示方式并不限制。
将位置信息和配置信息以不同的元素添加在地图上,以对医疗资源进行详细的描述,便于用户根据各医疗资源的配置信息进行针对性的选择,提高用户选择医院的准确性,避免出现用户到达一医院时发现该医院已不接受病人的现象,降低用户的就诊效率。
本发明实施例根据对获取到的历史新闻数据和实时新闻数据进行语义识别,从中提取准确的目标区域的疫情新闻数据,并将疫情新闻数据直观地显示在可视化的地图中,以生成疫情地图。由于疫情新闻数据中至少包括医疗资源分布信息,则群众可从疫情地图中查看目标区域中的医疗资源分布信息,为群众选择合适的就诊医院提供帮助,保证了群众获取信息的直观性、准确性以及实时性。
实施例二
图2是本发明实施例二中的疫情数据处理方法的流程图,本实施例二在实施例一的基础上进行进一步地优化。如图2所示,所述方法包括:
步骤201、获取新闻数据,新闻数据包括历史新闻数据和实时新闻数据。
步骤202、对新闻数据进行语义识别,并根据识别结果从新闻数据中提取目标区域的疫情新闻数据;其中,疫情新闻数据至少包括医疗资源分布信息和病情数据。
其中,病情数据对该疫情的发展情况进行描述的信息,病情数据包括如下至少一项:确认病人数据、疑似病人数据、死亡病人数据和治愈病人数据。通过对病情数据的确定可以实现对该区域的疫情发展情况进行确定,给用户出行提供参考。
具体的,获取用户确定的目标区域信息,根据对疫情新闻数据所包括的关键词的设置提取相关医疗资源分布信息和病情数据。具体疫情新闻数据的提取可以采用NLP技术。
可选的,对新闻数据进行语义识别,并根据识别结果从新闻数据中提取目标区域的疫情新闻数据,包括:
对新闻数据进行语义识别,得到语义相反的新闻数据对;
确定新闻数据对中各新闻数据的数据来源权重;
根据数据来源权重排除新闻数据对中语义错误的新闻数据。
通过对获取到的新闻数据进行语义识别,得到语义相反的新闻数据对。其中语义相反的新闻数据对是指获取到的新闻数据中包括的至少两个新闻数据,其中至少一个新闻数据和其他至少一个新闻数据所表示的含义是相反的,对此需要对新闻数据的一致性进行判断。出现语义相反的新闻数据对的原因可能是由于数据来源不同造成的,数据来源是指该新闻数据的初始发布方。确定语义相反的新闻数据对中两种相反语义各自的新闻数据来源,并根据数据来源权重确定两种语义各自的权重值,通过对语义权重的判断确定语义的正确性。数据来源权重可以根据其自身属性进行预先配置,例如国家级的权重高于省级的等。
示例性的,对新闻数据进行语义识别后,得到语义相反的新闻数据对,新闻数据对中包括新闻数据A、新闻数据B、新闻数据C以及新闻数据D,其中,新闻数据A和新闻数据B的语义相同;新闻数据C和新闻数据D的语义相同,而新闻数据A和新闻数据C的语义相反。则分别确定新闻数据A、新闻数据B、新闻数据C以及新闻数据D的数据来源权重,并将新闻数据A和新闻数据B的数据来源权重和作为该语义A的语义权重,同理,将新闻数据C和新闻数据D的数据来源权重和作为该语义C的语义权重,比较语义A的语义权重和语义C的语义权重,若语义A的语义权重大于语义C的语义权重,则说明语义A的信息更加有权威性,排除语义C所包括的所有新闻数据。
通过对语义权重进行判断,并根据数据来源权重确定新闻数据中语义错误的新闻数据并对其进行删除,保证了统计的疫情地图中信息的准确性,提高信息可信度,避免给用户错误的指导。
可选的,目标区域的疫情新闻数据存储在至少两个服务器中;其中在至少一个服务器上存储目标区域的疫情新闻数据,在至少一个其他服务器上配置目标区域的疫情新闻数据的镜像数据。
为了避免存储目标区域的疫情新闻数据的服务器发生异常,导致数据丢失,将目标区域的疫情新闻数据存储在至少两个服务器中,在其中至少一个服务器上存储,并在其余至少一个服务器上进行备份,配置镜像数据,以便在存储服务器异常时,镜像数据可以为目标区域的疫情地图生成提供数据。
示例性的,对不同区域的疫情新闻数据的存储使用docker分布式,并且不同区域的新闻数据支持镜像复制,高可靠性和复制性
步骤203、根据目标区域的医疗资源分布信息和病情数据,生成目标区域的疫情地图。
在上述实施例根据目标区域的医疗资源分布信息生成的目标区域的疫情地图的基础上,将病情数据也显示在疫情地图上。示例性的,根据病情数据中各病人的位置信息将目标区域划分为至少两个子区域,并在子区域中显示病情数据,例如根据病人数量将子区域设置为不同的背景颜色。
作为一种可行的实施例,在目标区域的疫情地图中,可以包括全国疫情数据显示部分;以及区域疫情数据显示部分。另外在疫情地图上可以将实时疫情新闻数据以文本元素的形式添加在疫情地图上,并根据实时疫情新闻数据更新疫情地图。示例性的,对于实时疫情新闻数据,可以根据新闻数据的出现频率确定显示数据的顺序。
可选的,对新闻数据进行语义识别,并根据识别结果从新闻数据中提取目标区域的疫情新闻数据之后,还包括:
根据目标区域的疫情新闻数据对目标区域的疫情发展情况进行预测,确定预测疫情数据;
相应的,根据目标区域的医疗资源分布信息,生成目标区域的疫情地图,包括:
根据目标区域的医疗资源分布信息和预测疫情数据,生成目标区域的疫情地图。
根据目标区域的疫情新闻数据对目标区域的疫情发展情况进行预测,包括根据病情数据的发展趋势以及该目标区域的医疗资源分布情况和疫情新闻数据中关于政府对疫情所采取措施的实时情况等,对该目标区域的疫情发展情况进行预测,预测结果至少包括疫情严重、疫情趋于平稳以及疫情减缓。并根据得到的预测疫情数据,将其添加在疫情地图中。
作为另外一种可行的实施例,疫情地图支持对感染人群进行定位,进而实现对感染人群进行追踪,可以更加准确的进行疫情发展预测。疫情地图可以对接医院医疗资源信息平台,根据区域的疫情新闻数据实现对医疗资源的提前配置和自动分配,例如合理分配口罩分发等。
通过疫情地图,用户可以对疫情发展情况进行综合性的了解,避免出现因疫情信息不及时以及不准确造成的谣言以及医疗资源分配不合理等现象。
本发明实施例根据对获取到的历史新闻数据和实时新闻数据进行语义识别,从中提取准确的目标区域的疫情新闻数据,并将疫情新闻数据直观地显示在可视化的地图中,以生成疫情地图。由于疫情新闻数据中至少包括医疗资源分布信息,则群众可从疫情地图中查看目标区域中的医疗资源分布信息,为群众选择合适的就诊医院提供帮助,保证了群众获取信息的直观性、准确性以及实时性。
实施例三
图3是本发明实施例三中的疫情数据处理装置的结构示意图,本实施例可适用于为普通群众提供综合准确可视化的医疗资源分布实时信息的情况。如图3所示,该装置包括:
新闻数据获取模块310,用于获取新闻数据,所述新闻数据包括历史新闻数据和实时新闻数据;
疫情新闻数据提取模块320,用于对所述新闻数据进行语义识别,并根据识别结果从所述新闻数据中提取目标区域的疫情新闻数据;其中,所述疫情新闻数据至少包括医疗资源分布信息;
疫情地图生成模块330,用于根据所述目标区域的医疗资源分布信息,生成目标区域的疫情地图。
本发明实施例根据对获取到的历史新闻数据和实时新闻数据进行语义识别,从中提取准确的目标区域的疫情新闻数据,并将疫情新闻数据直观地显示在可视化的地图中,以生成疫情地图。由于疫情新闻数据中至少包括医疗资源分布信息,则群众可从疫情地图中查看目标区域中的医疗资源分布信息,为群众选择合适的就诊医院提供帮助,保证了群众获取信息的直观性、准确性以及实时性。
可选的,疫情新闻数据提取模块,包括:
新闻数据对确定单元,用于对所述新闻数据进行语义识别,得到语义相反的新闻数据对;
权重确定单元,用于确定所述新闻数据对中各新闻数据的数据来源权重;
数据排除单元,用于根据数据来源权重排除所述新闻数据对中语义错误的新闻数据。
可选的,疫情地图生成模块,包括:
基础地图绘制单元,用于根据所述目标区域的边界信息,绘制目标区域基础地图;
元素添加单元,用于根据所述目标区域的医疗资源分布信息,在所述目标区域基础地图上添加医疗资源可视化元素,以得到所述目标区域的疫情地图。
可选的,所述医疗资源分布信息包括各医疗资源的位置信息和配置信息,
相应的,元素添加单元,具体用于:
根据所述医疗资源的位置信息,在所述目标区域基础地图中添加医疗资源定位元素,并在所述医疗资源定位元素处根据该医疗资源的配置信息,添加医疗资源文本元素。
可选的,所述疫情新闻数据还包括病情数据;
相应的,疫情地图生成模块,具体用于:
根据所述目标区域的医疗资源分布信息和所述病情数据,生成目标区域的疫情地图;
其中,所述病情数据包括如下至少一项:确认病人数据、疑似病人数据、死亡病人数据和治愈病人数据。
可选的,所述目标区域的疫情新闻数据存储在至少两个服务器中;其中在至少一个服务器上存储所述目标区域的疫情新闻数据,在至少一个其他服务器上配置所述目标区域的疫情新闻数据的镜像数据。
可选的,所述装置还包括:
预测疫情数据确定模块,用于根据所述目标区域的疫情新闻数据对所述目标区域的疫情发展情况进行预测,确定预测疫情数据;
相应的,疫情地图生成模块,具体用于:
根据所述目标区域的医疗资源分布信息和所述预测疫情数据,生成目标区域的疫情地图。
本发明实施例所提供的疫情数据处理装置可执行本发明任意实施例所提供的疫情数据处理方法,具备执行疫情数据处理方法相应的功能模块和有益效果。
实施例四
图4是本发明实施例四提供的一种设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性设备12的框图。图4显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储装置28,连接不同系统组件(包括系统存储装置28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储装置28可以包括易失性存储装置形式的计算机系统可读介质,例如随机存取存储装置(RAM)30和/或高速缓存存储装置32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储装置28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储装置28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图4中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储装置28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的疫情数据处理方法,包括:
获取新闻数据,所述新闻数据包括历史新闻数据和实时新闻数据;
对所述新闻数据进行语义识别,并根据识别结果从所述新闻数据中提取目标区域的疫情新闻数据;其中,所述疫情新闻数据至少包括医疗资源分布信息;
根据所述目标区域的医疗资源分布信息,生成目标区域的疫情地图。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的疫情数据处理方法,包括:
获取新闻数据,所述新闻数据包括历史新闻数据和实时新闻数据;
对所述新闻数据进行语义识别,并根据识别结果从所述新闻数据中提取目标区域的疫情新闻数据;其中,所述疫情新闻数据至少包括医疗资源分布信息;
根据所述目标区域的医疗资源分布信息,生成目标区域的疫情地图。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种疫情数据处理方法,其特征在于,包括:
获取新闻数据,所述新闻数据包括历史新闻数据和实时新闻数据;
对所述新闻数据进行语义识别,并根据识别结果从所述新闻数据中提取目标区域的疫情新闻数据;其中,所述疫情新闻数据至少包括医疗资源分布信息;
根据所述目标区域的医疗资源分布信息,生成目标区域的疫情地图;
所述对所述新闻数据进行语义识别,并根据识别结果从所述新闻数据中提取目标区域的疫情新闻数据,包括:
对所述新闻数据进行语义识别,得到语义相反的新闻数据对;
确定所述新闻数据对中各新闻数据的数据来源权重;
根据数据来源权重排除所述新闻数据对中语义错误的新闻数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标区域的医疗资源分布信息,生成目标区域的疫情地图,包括:
根据所述目标区域的边界信息,绘制目标区域基础地图;
根据所述目标区域的医疗资源分布信息,在所述目标区域基础地图上添加医疗资源可视化元素,以得到所述目标区域的疫情地图。
3.根据权利要求2所述的方法,其特征在于,所述医疗资源分布信息包括各医疗资源的位置信息和配置信息,
相应的,所述根据所述目标区域的医疗资源分布信息,在所述目标区域基础地图上添加医疗资源可视化元素,以得到所述目标区域的疫情地图,包括:
根据所述医疗资源的位置信息,在所述目标区域基础地图中添加医疗资源定位元素,并在所述医疗资源定位元素处根据该医疗资源的配置信息,添加医疗资源文本元素。
4.根据权利要求1所述的方法,其特征在于,所述疫情新闻数据还包括病情数据;
相应的,根据所述目标区域的医疗资源分布信息,生成目标区域的疫情地图,包括:
根据所述目标区域的医疗资源分布信息和所述病情数据,生成目标区域的疫情地图;
其中,所述病情数据包括如下至少一项:确认病人数据、疑似病人数据、死亡病人数据和治愈病人数据。
5.根据权利要求1所述的方法,其特征在于,所述目标区域的疫情新闻数据存储在至少两个服务器中;其中在至少一个服务器上存储所述目标区域的疫情新闻数据,在至少一个其他服务器上配置所述目标区域的疫情新闻数据的镜像数据。
6.根据权利要求1所述的方法,其特征在于,对所述新闻数据进行语义识别,并根据识别结果从所述新闻数据中提取目标区域的疫情新闻数据之后,还包括:
根据所述目标区域的疫情新闻数据对所述目标区域的疫情发展情况进行预测,确定预测疫情数据;
相应的,根据所述目标区域的医疗资源分布信息,生成目标区域的疫情地图,包括:
根据所述目标区域的医疗资源分布信息和所述预测疫情数据,生成目标区域的疫情地图。
7.一种疫情数据处理装置,其特征在于,包括:
新闻数据获取模块,用于获取新闻数据,所述新闻数据包括历史新闻数据和实时新闻数据;
疫情新闻数据提取模块,用于对所述新闻数据进行语义识别,并根据识别结果从所述新闻数据中提取目标区域的疫情新闻数据;其中,所述疫情新闻数据至少包括医疗资源分布信息;
疫情地图生成模块,用于根据所述目标区域的医疗资源分布信息,生成目标区域的疫情地图;
所述疫情新闻数据提取模块,包括:
新闻数据对确定单元,用于对所述新闻数据进行语义识别,得到语义相反的新闻数据对;
权重确定单元,用于确定所述新闻数据对中各新闻数据的数据来源权重;
数据排除单元,用于根据数据来源权重排除所述新闻数据对中语义错误的新闻数据。
8.一种设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的疫情数据处理方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的疫情数据处理方法。
CN202010442076.5A 2020-05-22 2020-05-22 疫情数据处理方法、装置、设备和存储介质 Active CN111639173B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010442076.5A CN111639173B (zh) 2020-05-22 2020-05-22 疫情数据处理方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010442076.5A CN111639173B (zh) 2020-05-22 2020-05-22 疫情数据处理方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111639173A CN111639173A (zh) 2020-09-08
CN111639173B true CN111639173B (zh) 2023-07-14

Family

ID=72331562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010442076.5A Active CN111639173B (zh) 2020-05-22 2020-05-22 疫情数据处理方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111639173B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231596A (zh) * 2020-10-14 2021-01-15 中国联合网络通信集团有限公司 疫情实时提醒方法、用户终端、防疫平台和计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102364473A (zh) * 2011-11-09 2012-02-29 中国科学院自动化研究所 融合地理信息与视觉信息的网络新闻检索系统及方法
CN103488716A (zh) * 2013-09-11 2014-01-01 天脉聚源(北京)传媒科技有限公司 一种存储、输出媒体资源的方法及装置
KR20140065568A (ko) * 2012-11-16 2014-05-30 목원대학교 산학협력단 능동적 데이터 수집을 이용한 범죄지도 서버 및 위험지역 알림 서비스 방법
CN110377847A (zh) * 2019-07-15 2019-10-25 中国人民解放军军事科学院军事医学研究院 一种面向传染病疫情分布的电子地图可视化方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160210357A1 (en) * 2011-02-08 2016-07-21 Sean Wohltman Aggregating news and social content with map presentations

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102364473A (zh) * 2011-11-09 2012-02-29 中国科学院自动化研究所 融合地理信息与视觉信息的网络新闻检索系统及方法
KR20140065568A (ko) * 2012-11-16 2014-05-30 목원대학교 산학협력단 능동적 데이터 수집을 이용한 범죄지도 서버 및 위험지역 알림 서비스 방법
CN103488716A (zh) * 2013-09-11 2014-01-01 天脉聚源(北京)传媒科技有限公司 一种存储、输出媒体资源的方法及装置
CN110377847A (zh) * 2019-07-15 2019-10-25 中国人民解放军军事科学院军事医学研究院 一种面向传染病疫情分布的电子地图可视化方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Jingnong Weng etc..Epidemic analysis and visualization based on Digital Earth spatio-temporal framework.《2012 IEEE International Geoscience and Remote Sensing Symposium》.2012,第7220-7223页. *
李亚品.传染病信息实时采集与应急处置系统研究.《中国博士学位论文全文数据库(医药卫生科技辑)》.2013,第E078-2页. *
甘小芳.突发公共卫生事件中垂直领域新媒体影响力探究——以丁香医生"新冠肺炎全球疫情地图上线"内容为例.《西部广播电视》.2020,第3-4页. *

Also Published As

Publication number Publication date
CN111639173A (zh) 2020-09-08

Similar Documents

Publication Publication Date Title
CN107193973B (zh) 语义解析信息的领域识别方法及装置、设备及可读介质
CN109408829B (zh) 文章可读性确定方法、装置、设备和介质
CN110765280B (zh) 地址识别方法和装置
CN112364637B (zh) 一种敏感词检测方法、装置,电子设备及存储介质
JP2023527100A (ja) イベント検出方法、装置、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラム
CN107368568A (zh) 一种笔记生成的方法、装置、设备和存储介质
KR20210132622A (ko) 데이터 처리 방법, 장치, 전자 설비 및 저장매체
CN111639173B (zh) 疫情数据处理方法、装置、设备和存储介质
CN113076358A (zh) 一种报表生成方法、装置、设备及存储介质
CN112965943A (zh) 一种数据处理方法、装置、电子设备以及存储介质
CN110287338B (zh) 行业热点确定方法、装置、设备和介质
CN115759040A (zh) 一种电子病历解析方法、装置、设备和存储介质
CN115391322A (zh) 数据检核方法、装置、设备、存储介质及程序产品
CN111859985B (zh) Ai客服模型测试方法、装置、电子设备及存储介质
CN111741046B (zh) 数据上报方法、获取方法、装置、设备及介质
CN110458743B (zh) 基于大数据分析的社区治理方法、装置、设备及存储介质
CN113792138A (zh) 报表生成方法、装置、电子设备及存储介质
CN113806556A (zh) 基于电网数据的知识图谱的构建方法、装置、设备及介质
CN113553826A (zh) 结合rpa和ai的信息录入方法、装置及电子设备
CN112364268A (zh) 资源获取方法、装置、电子设备及存储介质
CN112667614A (zh) 一种数据处理方法、装置及计算机设备
CN109086328B (zh) 一种上下位关系的确定方法、装置、服务器及存储介质
CN110750569A (zh) 数据提取方法、装置、设备及存储介质
CN111949767A (zh) 一种文本关键词的查找方法、装置、设备和存储介质
Salfinger et al. Pinpointing the Eye of the Hurricane—Creating A Gold-Standard Corpus for Situative Geo-Coding of Crisis Tweets Based on Linked Open Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant