CN109376357A - 一种数据处理方法和装置 - Google Patents
一种数据处理方法和装置 Download PDFInfo
- Publication number
- CN109376357A CN109376357A CN201811204499.2A CN201811204499A CN109376357A CN 109376357 A CN109376357 A CN 109376357A CN 201811204499 A CN201811204499 A CN 201811204499A CN 109376357 A CN109376357 A CN 109376357A
- Authority
- CN
- China
- Prior art keywords
- report
- text
- security report
- target
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 14
- 239000003814 drug Substances 0.000 claims abstract description 100
- 238000004458 analytical method Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 50
- 238000012545 processing Methods 0.000 claims abstract description 32
- 238000005516 engineering process Methods 0.000 claims abstract description 27
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 23
- 238000003058 natural language processing Methods 0.000 claims abstract description 13
- 238000013519 translation Methods 0.000 claims description 39
- 230000006870 function Effects 0.000 claims description 13
- 230000007246 mechanism Effects 0.000 claims description 10
- 238000001647 drug administration Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 8
- 229940079593 drug Drugs 0.000 abstract description 31
- 238000004519 manufacturing process Methods 0.000 abstract description 9
- 206010067484 Adverse reaction Diseases 0.000 description 8
- 230000006838 adverse reaction Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000008676 import Effects 0.000 description 7
- 238000012098 association analyses Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 206010012735 Diarrhoea Diseases 0.000 description 1
- 206010047700 Vomiting Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229940121657 clinical drug Drugs 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请实施例公开了一种数据处理方法和装置,该方法可以获取目标药品的初始安全性报告,然后,利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告,该目标安全性报告是满足E2B要求的合规安全性报告,从而实现自动生成合规安全性报告。接着,利用人工智能技术,对所述目标安全性报告进行分析得到分析结果,并根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警,从而实现自动从合规安全性报告中提取风险信号,进行药物警戒。可见,该方法无需依靠人工,可以自动进行药物警戒,节约大量人工和时间成本,避免处理中的疏漏、错误,提高药物警戒效率,对药企生产的药品进行有效地药物警戒。
Description
技术领域
本申请涉及人工智能领域,特别是涉及一种数据处理方法和装置。
背景技术
随着科技和社会的进步以及人们对生活质量要求的不断提高,全球对药品安全问题越来越关注,药企作为“药品安全第一责任人”,开展药物警戒工作责无旁贷。
目前药企进行药物警戒的主要方式是,药企人员采取人工的方式将收集到的安全性报告进行格式转换、翻译等一系列处理后,生成满足个例安全报告传输执行指导原则的合规安全性报告,其中,个例安全报告传输执行指导原则可以用代码E2B表示,并依靠人工从大量合规安全性报告中提取风险信息,进行药物警戒。
由于可能收集到大量的安全性报告,采用人工的方式处理大量的安全性报告,并提取风险信息进行药物警戒,效率和自动化程度低,耗费大量人工和时间成本,且处理中极易出现疏漏、错误,严重影响结果的科学、有效性,难以对药企生产的药品进行有效地药物警戒。
发明内容
为了解决上述技术问题,本申请提供了一种数据处理方法和装置,自动地对初始安全性报告进行处理,生成满足E2B要求的目标安全性报告,并自动对目标安全性报告进行分析、风险预警等,尤其在面对大量初始安全性报告的情况下,该方法可以节约大量人工和时间成本,避免处理中的疏漏、错误,提高药物警戒效率,对药企生产的药品进行有效地药物警戒。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种数据处理方法,所述方法包括:
获取目标药品的初始安全性报告;
利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告;
利用人工智能技术,对所述目标安全性报告进行分析得到分析结果;
根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警。
可选的,所述利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告,包括:
通过语义分析解析所述初始安全性报告,提取报告数据信息;
利用自动翻译功能,将所述报告数据信息对应的初始文本转换为目标文本,得到所述目标安全性报告。
可选的,若翻译记忆库包括历史文本和历史文本对应的翻译文本,所述利用自动翻译功能,将所述报告数据信息对应的初始文本转换为目标文本,得到所述目标安全性报告,包括:
将所述初始文本与所述历史文本进行匹配;
若所述历史文本中存在目标历史文本与所述初始文本的匹配程度满足预设条件,将所述翻译记忆库中目标历史文本对应的翻译文本作为所述初始文本的目标文本,得到所述目标安全性报告。
可选的,若所述历史文本中不存在所述目标历史文本与所述初始文本的匹配程度满足预设条件,所述方法还包括:
通过机器翻译,将所述初始文本转换为所述目标文本,得到所述目标安全性报告。
可选的,所述方法还包括:
根据所述目标文本的校验结果更新所述翻译记忆库。
可选的,所述根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警,包括:
从所述分析结果中提取风险信号;
对所述风险信号进行预警分析,根据预警分析结果对所述目标药品进行相应处理。
可选的,所述利用人工智能技术,对所述目标安全性报告进行分析得到分析结果,包括:
利用数理统计和分析原理,对所述目标安全性报告中的各数据元素进行统计、关联性分析,得到分析结果。
可选的,所述获取目标药品的初始安全性报告,包括:
访问目标地址,读取所述目标药品的初始安全性报告。
可选的,所述利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告之后,所述方法还包括:
通过报告导入接口,递交所述目标安全性报告至药品监管机构端口。
第二方面,本申请实施例提供了一种数据处理装置,所述装置包括报告获取模块、报告处理模块、报告分析模块和风险预警模块:
所述报告获取模块,用于获取目标药品的初始安全性报告;
所述报告处理模块,用于利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告;
所述报告分析模块,用于利用人工智能技术,对所述目标安全性报告进行分析得到分析结果;
所述风险预警模块,用于根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警。
可选的,所述报告处理模块,用于通过语义分析解析所述初始安全性报告,提取报告数据信息;利用自动翻译功能,将所述报告数据信息对应的初始文本转换为目标文本,得到所述目标安全性报告。
可选的,若翻译记忆库包括历史文本和历史文本对应的翻译文本,所述报告处理模块,用于将所述初始文本与所述历史文本进行匹配;若所述历史文本中存在目标历史文本与所述初始文本的匹配程度满足预设条件,将所述翻译记忆库中目标历史文本对应的翻译文本作为所述初始文本的目标文本,得到所述目标安全性报告。
可选的,若所述历史文本中不存在所述目标历史文本与所述初始文本的匹配程度满足预设条件,所述报告处理模块,还用于通过机器翻译,将所述初始文本转换为所述目标文本,得到所述目标安全性报告。
可选的,所述装置还包括更新模块:
所述更新模块,用于根据所述目标文本的校验结果更新所述翻译记忆库。
可选的,所述风险预警模块,用于从所述分析结果中提取风险信号;对所述风险信号进行预警分析,根据预警分析结果对所述目标药品进行相应处理。
可选的,所述报告分析模块,用于利用数理统计和分析原理,对所述目标安全性报告中的各数据元素进行统计、关联性分析,得到分析结果。
可选的,所述报告获取模块,用于访问目标地址,读取所述目标药品的初始安全性报告。
可选的,所述装置还包括报告递交模块:
所述报告递交模块,用于通过报告导入接口,递交所述目标安全性报告至药品监管机构端口。
由上述技术方案可以看出,本申请实施例具有以下优点:
药企进行药物警戒时,该方法可以获取目标药品的初始安全性报告,然后,利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告,该目标安全性报告是满足E2B要求的合规安全性报告,从而实现自动生成合规安全性报告。接着,利用人工智能技术,对所述目标安全性报告进行分析得到分析结果,并根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警,从而实现自动从合规安全性报告中提取风险信号,进行药物警戒。可见,与传统方式相比,该方法无需依靠人工,可以自动对初始安全性报告进行处理,生成满足E2B要求的目标安全性报告,并自动对目标安全性报告进行分析、风险预警等,尤其在面对大量初始安全性报告的情况下,该方法可以节约大量人工和时间成本,避免处理中的疏漏、错误,提高药物警戒效率,对药企生产的药品进行有效地药物警戒。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种数据处理方法的流程图;
图2为本申请实施例提供的一种PV系统结构示例图;
图3为本申请实施例提供的一种导入初始安全性报告的展示界面示例图;
图4为本申请实施例提供的一种存储初始安全性报告的展示界面示例图;
图5为本申请实施例提供的一种生成目标安全性报告方法的流程图;
图6为本申请实施例提供的一种将初始文本转换为目标文本的流程结构图;
图7为本申请实施例提供的一种数据处理装置的结构框图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
传统的药物警戒主要是由药企人员采取人工的方式将收集到的安全性报告进行格式转换、翻译等一系列处理后,生成满足E2B的合规安全性报告,并依靠人工从大量合规安全性报告中提取风险信息,进行药物警戒。
但是,由于可能收集到大量的安全性报告,采用人工的方式处理大量的安全性报告,并提取风险信息进行药物警戒,将会耗费大量人工和时间成本,且处理中极易出现疏漏、错误,严重影响药物警戒的效率,难以对药企生产的药品进行有效地药物警戒。
为此,本申请实施例提供了一种数据处理方法,该方法可以自动地对初始安全性报告进行处理,生成满足E2B要求的目标安全性报告,并自动对目标安全性报告进行分析、风险预警等,尤其在面对大量初始安全性报告的情况下,该方法可以节约大量人工和时间成本,避免处理中的疏漏、错误,提高药物警戒效率,对药企生产的药品进行有效地药物警戒。
下面结合附图,对本申请实施例提供的一种数据处理方法进行介绍。
参见图1,图1示出了一种数据处理方法的流程图,包括:
S101、获取目标药品的初始安全性报告。
在药品临床期间以及药品上市后患者使用该药品后,往往会对该药品的效果等信息进行记录,例如,针对该药品生成初始安全性报告,其中,该药品可以是药企生产的任意种药品,该药品可以作为目标药品。
初始安全性报告中记录的处理目标药品的效果外,还可以包括目标药品的质量、用法、用量、不良反应、使用人群类别等。
在一种实现方式中,本实施例提供的数据处理方法可以应用于药物警戒(Pharmacovigilance,简称PV)系统,其中,PV系统可以参见图2所示。PV系统可以获取目标药品的初始安全性报告,PV系统获取目标药品的初始安全性报告的方式可以是:人工录入初始安全性报告、初始安全性报告导入、PV系统自动访问读取初始安全性报告等。
其中,初始安全性报告导入的方式可以通过PV系统的客户端来实现,即药企人员可以通过药企对应的客户端导入初始安全性报告,导入初始安全性报告的展示界面可以如图3所示,该展示界面中提供了导入初始安全性报告入口301,通过该入口中可以选择导入不同版本的初始安全性报告,例如第一版本,第一版本可以用R2来表示,可以通过展示界面中“导入R2报告”功能键3011导入R2版本的初始安全性报告;或,第二版本,第二版本可以用R3来表示,可以通过展示界面中“导入R3报告”功能键3012导入R3版本的初始安全性报告,第二版本高于第一版本。
通过PV系统的客户端导入初始安全性后,客户端可以通过其记录功能,对导入的初始安全性报告进行存储,以便之后药企可以对所述初始安全性报告进行查看,例如图4所示,可以通过展示界面中“记录”功能键401对导入的初始安全性报告进行存储。
PV系统自动访问读取初始安全性报告的方式具体可以是,初始安全性报告被保存在特定位置,PV系统可以获取该特定位置的地址,该地址可以作为目标地址,这样,PV系统便可以访问该目标地址,进而在该特定位置读取到目标药品的初始安全性报告。
需要说明的是,S101这一步骤具体可以通过PV系统的报告获取模块来完成。
S102、利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告。
初始安全性报告可能来自于不同的地区、国家,可能具有不同的格式等,然而,根据国际人用药品注册技术协调会(International Conference on Harmonization,简称ICH)的指导原则,递交至药品监管机构以及需要进行分析的安全性报告应该具有特定要求,例如,可以是满足E2B要求的合规安全性报告。因此,在获取到初始安全性报告后,可以利用自然语言处理技术,对初始安全性报告进行处理得到目标安全性报告,目标安全性报告为合规安全性报告。
在一些情况下,若初始安全性报告的版本不符合要求,例如,PV系统要求的安全性报告的版本为第二版本(R3),而初始安全性报告的版本为第一版本(R2),那么,PV系统需要对初始安全性报告的版本进行转换,即将第一版本(R2)升级到第二版本(R3)。
在一些情况下,若初始安全性报告的语言不符合要求,例如,对于我国药物警戒来说,递交至药品监管机构以及需要进行分析的安全性报告一般要求为中文语言,而获取的初始安全性报告可能包括中文语言,也包括英文语言或其他外国语言,在这种情况下,PV系统还可以对初始安全性报告的语言进行转换。具体的,可以通过语义分析解析所述初始安全性报告,提取报告数据信息;利用自动翻译功能,将所述报告数据信息对应的初始文本转换为目标文本,得到所述目标安全性报告,其中,初始文本的语言为源语言,在该示例中,源语言为英文语言等其他外国语言,目标文本的语言为目标语言,在该示例中,目标语言为中文语言。
当然,对于其他国家药物警戒,语言转换可能还包括其他语言之间的转换,本申请实施例不仅限于英文语言等其他外国语言向中文语言的转换,即本实施例对源语言和目标语言不做限定。
在得到目标安全性报告之后,为了对市场上供应的药品进行检查,有利于保证药品的质量安全,以及监督药企是否尽到药物警戒的职责,使药品市场的管理更加严密、有序、实事求是,目标安全性报告还可以递交至药品监管机构。
目标安全性报告递交至药品监管机构的方式可以是通过报告导入接口,递交所述目标安全性报告至药品监管机构端口,从而实现目标安全性报告的批量递交。
需要说明的是,S102这一步骤具体可以通过PV系统的报告处理模块来完成。
需要说明的是,在目标安全性报告递交至药品监管机构之前,PV系统的报告处理模块可以将目标安全性报告转换成人类易读性报告,以便药企可以通过客户端对目标安全性报告进行校验,保证目标安全性报告的质量。
S103、利用人工智能技术,对所述目标安全性报告进行分析得到分析结果。
在得到目标安全性报告之后,可以利用人工智能技术,对所述目标安全性报告进行分析得到分析结果,具体的,可以利用数理统计和分析原理,对所述目标安全性报告中的各数据元素进行统计、关联性分析,得到分析结果。
其中,目标安全性报告中的各数据元素可以包括不良反应,例如,“腹泻”、“呕吐”、“头晕”等,还可以包括目标药品的成分、用量、用法等。通过统计可以统计出使用过目标药品的患者出现不良反应的种类、程度、以及数量,进而可以统计出不良反应的发生率等;通过关联性分析可以确定出患者出现不良反应的原因,例如,可以分析出患者出现不良反应是与药品质量相关,还是与药品的用量、用法相关,抑或是其他未知的不良反应等。
需要说明的是,S103这一步骤具体可以通过PV系统的报告分析模块来完成。
S104、根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警。
利用人工智能技术可以从分析结果中提取风险信号,所述风险信号为分析结果中与正常不良反映不同的信号,例如,分析结果中表明目标药品的质量不合格,或者目标药品出现了未知的、严重的不良反应。然后,对所述风险信号进行预警分析,根据预警分析结果对所述目标药品进行相应处理。
虽然提取到风险信号,但并不表示使用目标药品确实会存在安全问题,因此,可以对风险信号进行预警分析,以确定是否需要进行风险预警。当确定使用目标药品的患者可能会面对较大的风险,甚至威胁患者的健康与安全,此时,可以根据风险信号进行风险预警。具体可以是对所述目标药品进行相应处理,例如停止生产目标药品、下架已经流入市场的目标药品、召回使用者已经购买的目标药品、发布警示、修改目标药品的说明书等。
需要说明的是,S103这一步骤具体可以通过PV系统的报告分析模块来完成。
在本实施例中,药企进行药物警戒时,可以获取目标药品的初始安全性报告,然后,利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告,该目标安全性报告是满足E2B要求的合规安全性报告,从而实现自动生成合规安全性报告。接着,利用人工智能技术,对所述目标安全性报告进行分析得到分析结果,并根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警,从而实现自动从合规安全性报告中提取风险信号,进行药物警戒。可见,与传统方式相比,该方法无需依靠人工,可以自动对初始安全性报告进行处理,生成满足E2B要求的目标安全性报告,并自动对目标安全性报告进行分析、风险预警等,尤其在面对大量初始安全性报告的情况下,该方法可以节约大量人工和时间成本,避免处理中的疏漏、错误,提高药物警戒效率,对药企生产的药品进行有效地药物警戒。
上述实施例介绍了一种数据处理方法,接下来,将对S102中如何利用自动翻译功能,将所述报告数据信息对应的初始文本转换为目标文本,得到所述目标安全性报告进行介绍。
参见图5,图5示出了一种生成目标安全性报告方法的流程图,该方法包括:
S501、将所述初始文本与所述历史文本进行匹配。
需要说明的是,自动翻译功能一般可以通过机器翻译(Machine Translation,简称MT)和翻译记忆库(Translation Memory,简称TM)两种方式来实现,根据报告数据信息对应的初始文本的不同,可以采用不同方式实现初始文本向目标文本的转换,从而实现将初始安全性报告的源语言翻译成目标语言,得到目标安全性报告。
为此,可以根据初始文本选择采用MT还是TM实现初始文本向目标文本的转换,若TM中包括历史文本和历史文本对应的翻译文本,那么,首先可以将初始文本与历史文本进行匹配,从而确定TM中是否保存了该初始文本对应的翻译文本,进而确定是否可以利用TM将初始文本转换为目标文本。
S502、判断所述历史文本中是否存在目标历史文本与所述初始文本的匹配程度满足预设条件,若是,则执行S503,若否,则执行S504。
S503、将所述翻译记忆库中目标历史文本对应的翻译文本作为所述初始文本的目标文本,得到所述目标安全性报告。
S504、通过机器翻译,将所述初始文本转换为所述目标文本,得到所述目标安全性报告。
若所述历史文本中存在目标历史文本与所述初始文本的匹配程度满足预设条件,则说明TM中保存了该初始文本对应的翻译文本,此时,可以利用TM将初始文本转换为目标文本,即将所述翻译记忆库中目标历史文本对应的翻译文本作为所述初始文本的目标文本。
若所述历史文本中不存在所述目标历史文本与所述初始文本的匹配程度满足预设条件,则说明TM中未保存该初始文本对应的翻译文本,此时,无法直接利用TM中已保存的翻译文本将初始文本转换为目标文本,那么,则需要通过MT将初始文本对应的源语言翻译成目标语言,从而将初始文本转换为目标文本。
其中,预设条件可以是匹配程度达到预设阈值,该预设阈值可以是根据经验设定的,在本实施例中,预设阈值可以是85%。
需要说明的是,在通过TM或MT将初始文本转换为目标文本的情况下,为了保证初始文本转换为目标文本的准确性,还可以对得到的目标文本进行校验,在得到目标文本的校验结果后,可以根据所述目标文本的校验结果更新所述翻译记忆库。
例如,若采用TM将初始文本转换为目标文本,则得到目标文本的校验结果后,可以将所述目标历史文本对应的翻译文本更新为所述目标文本的校验结果,从而使得后续利用TM将初始文本转换为目标文本时,可以获取到更为准确的翻译文本。
又如,若采用MT将初始文本转换为目标文本,则得到目标文本的校验结果后,可以将所述初始文本以及该目标文本的校验结果保存至所述翻译记忆库中,更新所述翻译记忆库,从而使得后续可以直接利用TM准确地将初始文本转换为目标文本。
根据图5对应实施例的介绍,当预设条件是匹配程度达到预设阈值,且预设阈值取85%时,将初始文本转换为目标文本的流程结构图可以如图6所示。
需要说明的是,图5对应实施例中除了对得到的目标文本进行校验可以由人工执行外,其余可以通过PV系统的报告处理模块来完成。
通过上述方法,可以实现根据初始文本的不同,选择合适的转换方式,从而可以快速、准确地将初始文本转换为目标文本。
基于上述数据处理方法,本申请实施例还提供了一种数据处理装置,参见图7,所述装置包括报告获取模块701、报告处理模块702、报告分析模块703和风险预警模块704:
所述报告获取模块701,用于获取目标药品的初始安全性报告;
所述报告处理模块702,用于利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告;
所述报告分析模块703,用于利用人工智能技术,对所述目标安全性报告进行分析得到分析结果;
所述风险预警模块704,用于根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警。
可选的,所述报告处理模块,用于通过语义分析解析所述初始安全性报告,提取报告数据信息;利用自动翻译功能,将所述报告数据信息对应的初始文本转换为目标文本,得到所述目标安全性报告。
可选的,若翻译记忆库包括历史文本和历史文本对应的翻译文本,所述报告处理模块,用于将所述初始文本与所述历史文本进行匹配;若所述历史文本中存在目标历史文本与所述初始文本的匹配程度满足预设条件,将所述翻译记忆库中目标历史文本对应的翻译文本作为所述初始文本的目标文本,得到所述目标安全性报告。
可选的,若所述历史文本中不存在所述目标历史文本与所述初始文本的匹配程度满足预设条件,所述报告处理模块,还用于通过机器翻译,将所述初始文本转换为所述目标文本,得到所述目标安全性报告。
可选的,所述装置还包括更新模块:
所述更新模块,用于根据所述目标文本的校验结果更新所述翻译记忆库中目标文本对应的翻译文本。
可选的,所述风险预警模块,用于从所述分析结果中提取风险信号;对所述风险信号进行预警分析,根据预警分析结果对所述目标药品进行相应处理。
可选的,所述报告分析模块,用于利用数理统计和分析原理,对所述目标安全性报告中的各数据元素进行统计、关联性分析,得到分析结果。
可选的,所述报告获取模块,用于访问目标地址,读取所述目标药品的初始安全性报告。
可选的,所述装置还包括报告递交模块:
所述报告递交模块,用于通过报告导入接口,递交所述目标安全性报告之所述监管机构端口。
药企进行药物警戒时,该装置可以获取目标药品的初始安全性报告,然后,利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告,该目标安全性报告是满足E2B要求的合规安全性报告,从而实现自动生成合规安全性报告。接着,利用人工智能技术,对所述目标安全性报告进行分析得到分析结果,并根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警,从而实现自动从合规安全性报告中提取风险信号,进行药物警戒。可见,与传统方式相比,该装置无需依靠人工,可以自动对初始安全性报告进行处理,生成满足E2B要求的目标安全性报告,并自动对目标安全性报告进行分析、风险预警等,尤其在面对大量初始安全性报告的情况下,该方法可以节约大量人工和时间成本,避免处理中的疏漏、错误,提高药物警戒效率,对药企生产的药品进行有效地药物警戒。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:read-only memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种数据处理方法,其特征在于,所述方法包括:
获取目标药品的初始安全性报告;
利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告;
利用人工智能技术,对所述目标安全性报告进行分析得到分析结果;
根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警。
2.根据权利要求1所述的方法,其特征在于,所述利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告,包括:
通过语义分析解析所述初始安全性报告,提取报告数据信息;
利用自动翻译功能,将所述报告数据信息对应的初始文本转换为目标文本,得到所述目标安全性报告。
3.根据权利要求2所述的方法,其特征在于,若翻译记忆库包括历史文本和历史文本对应的翻译文本,所述利用自动翻译功能,将所述报告数据信息对应的初始文本转换为目标文本,得到所述目标安全性报告,包括:
将所述初始文本与所述历史文本进行匹配;
若所述历史文本中存在目标历史文本与所述初始文本的匹配程度满足预设条件,将所述翻译记忆库中目标历史文本对应的翻译文本作为所述初始文本的目标文本,得到所述目标安全性报告。
4.根据权利要求3所述的方法,其特征在于,若所述历史文本中不存在所述目标历史文本与所述初始文本的匹配程度满足预设条件,所述方法还包括:
通过机器翻译,将所述初始文本转换为所述目标文本,得到所述目标安全性报告。
5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
根据所述目标文本的校验结果更新所述翻译记忆库。
6.根据权利要求1所述的方法,其特征在于,所述根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警,包括:
从所述分析结果中提取风险信号;
对所述风险信号进行预警分析,根据预警分析结果对所述目标药品进行相应处理。
7.根据权利要求1所述的方法,其特征在于,所述利用人工智能技术,对所述目标安全性报告进行分析得到分析结果,包括:
利用数理统计和分析原理,对所述目标安全性报告中的各数据元素进行统计、关联性分析,得到分析结果。
8.根据权利要求1所述的方法,其特征在于,所述获取目标药品的初始安全性报告,包括:
访问目标地址,读取所述目标药品的初始安全性报告。
9.根据权利要求1所述的方法,其特征在于,所述利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告之后,所述方法还包括:
通过报告导入接口,递交所述目标安全性报告至药品监管机构端口。
10.一种数据处理装置,其特征在于,所述装置包括报告获取模块、报告处理模块、报告分析模块和风险预警模块:
所述报告获取模块,用于获取目标药品的初始安全性报告;
所述报告处理模块,用于利用自然语言处理技术,对所述初始安全性报告进行处理得到目标安全性报告;
所述报告分析模块,用于利用人工智能技术,对所述目标安全性报告进行分析得到分析结果;
所述风险预警模块,用于根据所述分析结果,利用人工智能技术对所述目标药品的安全性进行风险预警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811204499.2A CN109376357A (zh) | 2018-10-16 | 2018-10-16 | 一种数据处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811204499.2A CN109376357A (zh) | 2018-10-16 | 2018-10-16 | 一种数据处理方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109376357A true CN109376357A (zh) | 2019-02-22 |
Family
ID=65400072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811204499.2A Pending CN109376357A (zh) | 2018-10-16 | 2018-10-16 | 一种数据处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109376357A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114999673A (zh) * | 2022-05-27 | 2022-09-02 | 长沙砝码柯数据科技有限责任公司 | 一种中药大数据药物警戒方法、系统、设备及存储介质 |
CN115579096A (zh) * | 2021-07-06 | 2023-01-06 | 桂林谷科林科技有限公司 | 一种针对药物警戒e2b r3标准报告的自动生成与解析验证方法、系统及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103488890A (zh) * | 2013-09-18 | 2014-01-01 | 万达信息股份有限公司 | 一种基于朴素贝叶斯的患者药物不良反应预警方法和系统 |
CN104765947A (zh) * | 2015-03-02 | 2015-07-08 | 大连理工大学 | 一种面向大数据的潜在药物不良反应数据挖掘方法 |
CN104933072A (zh) * | 2014-03-19 | 2015-09-23 | 北京航天长峰科技工业集团有限公司 | 一种多语种互联网信息分析方法 |
CN105760698A (zh) * | 2016-03-18 | 2016-07-13 | 华中科技大学同济医学院附属协和医院 | 一种药品不良反应预警分析系统及方法 |
CN107145735A (zh) * | 2017-05-04 | 2017-09-08 | 中国药科大学 | 一种评估药物发生不良反应倾向的方法 |
-
2018
- 2018-10-16 CN CN201811204499.2A patent/CN109376357A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103488890A (zh) * | 2013-09-18 | 2014-01-01 | 万达信息股份有限公司 | 一种基于朴素贝叶斯的患者药物不良反应预警方法和系统 |
CN104933072A (zh) * | 2014-03-19 | 2015-09-23 | 北京航天长峰科技工业集团有限公司 | 一种多语种互联网信息分析方法 |
CN104765947A (zh) * | 2015-03-02 | 2015-07-08 | 大连理工大学 | 一种面向大数据的潜在药物不良反应数据挖掘方法 |
CN105760698A (zh) * | 2016-03-18 | 2016-07-13 | 华中科技大学同济医学院附属协和医院 | 一种药品不良反应预警分析系统及方法 |
CN107145735A (zh) * | 2017-05-04 | 2017-09-08 | 中国药科大学 | 一种评估药物发生不良反应倾向的方法 |
Non-Patent Citations (1)
Title |
---|
郝雪阳: "国内首个,太美医疗eSafety药物警戒系统通过FDA FAERS系统E2B递交测试", 《HTTPS://WWW.VBDATA.CN/37616》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115579096A (zh) * | 2021-07-06 | 2023-01-06 | 桂林谷科林科技有限公司 | 一种针对药物警戒e2b r3标准报告的自动生成与解析验证方法、系统及存储介质 |
CN114999673A (zh) * | 2022-05-27 | 2022-09-02 | 长沙砝码柯数据科技有限责任公司 | 一种中药大数据药物警戒方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lin et al. | Cross-project transfer representation learning for vulnerable function discovery | |
Ceron et al. | Fake news agenda in the era of COVID-19: Identifying trends through fact-checking content | |
Angeli et al. | Leveraging linguistic structure for open domain information extraction | |
Collier | Uncovering text mining: A survey of current work on web-based epidemic intelligence | |
CN110377900A (zh) | 网络内容发布的审核方法、装置、计算机设备及存储介质 | |
Liu et al. | Recent progress of using knowledge graph for cybersecurity | |
Hürriyetoğlu et al. | Cross-context news corpus for protest event-related knowledge base construction | |
Liaw et al. | Data quality and fitness for purpose of routinely collected data–a general practice case study from an electronic practice-based research network (ePBRN) | |
Berry et al. | Real-time analytics for legacy data streams in health: monitoring health data quality | |
US11775737B2 (en) | System and method for correction of acquired transaction text fields | |
Zhang et al. | EX‐Action: Automatically Extracting Threat Actions from Cyber Threat Intelligence Report Based on Multimodal Learning | |
CN109376357A (zh) | 一种数据处理方法和装置 | |
Vadapalli et al. | Twitterosint: automated cybersecurity threat intelligence collection and analysis using twitter data | |
O'Day et al. | Text message corpus: applying natural language processing to mobile device forensics | |
Derbas et al. | Eventfully safapp: hybrid approach to event detection for social media mining | |
Xiang et al. | An APT event extraction method based on BERT-BiGRU-CRF for APT attack detection | |
Zhang et al. | A survey on the development of network protocol fuzzing techniques | |
Zhao et al. | Mid-ontology learning from linked data | |
Ibrahim et al. | Integrated clinical environment security analysis using reinforcement learning | |
CN111046666B (zh) | 事件识别方法及装置、计算机可读存储介质、电子设备 | |
Eskildsen et al. | Implementation and comparison of two text mining methods with a standard pharmacovigilance method for signal detection of medication errors | |
CN111309827A (zh) | 知识图谱构建方法、装置、计算机系统及可读存储介质 | |
Kipper-Schuler et al. | System evaluation on a named entity corpus from clinical notes | |
Dumitrache et al. | False positive and cross-relation signals in distant supervision data | |
Pivovarova et al. | Adapting the PULS event extraction framework to analyze Russian text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190222 |