CN114595829A - 情报分析方法、装置、介质、电子设备 - Google Patents

情报分析方法、装置、介质、电子设备 Download PDF

Info

Publication number
CN114595829A
CN114595829A CN202210104400.1A CN202210104400A CN114595829A CN 114595829 A CN114595829 A CN 114595829A CN 202210104400 A CN202210104400 A CN 202210104400A CN 114595829 A CN114595829 A CN 114595829A
Authority
CN
China
Prior art keywords
question
learning
answer
information
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210104400.1A
Other languages
English (en)
Inventor
梁冬
王晓诗
史骁
赵晓芳
殷岩
谭文婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN202210104400.1A priority Critical patent/CN114595829A/zh
Publication of CN114595829A publication Critical patent/CN114595829A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种情报分析方法、装置、介质、电子设备,所述方法包括:获取所述情报源信息作为事件抽取数据集,构造问答训练样本,生成问答系统中用于问答模型训练的待学习课程;将当前所述问答模型的学习状态值输入至课程学习进度选择策略网络动态选择学习进度,输出待学习的目标问答训练样本;将所述待学习的目标问答训练样本输入至所述问答模型进行训练,并更新所述问答模型的学习状态值;训练好的所述问答模型用于从所述情报源信息中抽取出所述目标情报信息。该方法基于问答系统对情报源信息分析,使得在学习过程中根据自身学习状态在不同的学习阶段动态的选择不同的学习进度,提高了情报分析的准确度。

Description

情报分析方法、装置、介质、电子设备
技术领域
本发明涉及机器学习技术领域,尤其涉及一种情报分析方法、装置、介质、电子设备。
背景技术
情报分析工作主要是对获取的情报源信息通过智能或非智能算法的机器学习工具,对样本进行统计分析,通过甄别和判断,从大数据中寻找有价值的事件信息作为目标情报信息,并进一步转化为可操作的决策指挥能力。
基于问答系统的事件分析是近几年兴起的信息处理方法,适用于情报分析处理,其将事件转化为一系列的问题,每个事件角色均可预定义成一条问句,然后根据输入的文本进行回答,将事件相关角色的问句的回答结果整合一起,即可完成事件抽取任务。例如,MQAEE算法将事件抽取看作一个多轮问答过程,将事件抽取转化为三类问题,分别解决触发词的识别、触发词分类、事件元素提取,在编码上采用BERT结构,将句子作为第一个句子,原文本作为第二个句子输入,输出为提取的事件信息。EEasMRC算法先进行常规的事件触发词提取,然后根据事件类型,无监督的生成事件元素问题模板,在问答模型方面采用了BERT结构。但上述的问答系统大多倾向于如何生成事件模板关联的问题,在问答的模型框架上直接将问答系统先进模型架构或预训练好的模型直接迁移,并没有针对情报信息抽取独有的特征进行有效的训练模型,特别是在模型学习策略上的改进。
本发明考虑提供一种基于策略网络动态调整课程学习进度的问答学习方法,以适用于情报事件的分析。
发明内容
针对现有技术的不足,本发明提出一种情报分析方法、装置、介质、电子设备,通过本发明构造的问答系统,在学习过程中根据自身学习状态在不同的学习阶段动态的选择不同的学习进度,能够针对情报信息进行有效的训练,提高了情报分析的准确度。
为了实现上述目的,本发明一方面提供一种情报分析方法,
云集群端构造问答系统对感知端采集的情报源信息分析,得到目标情报信息;并将所述目标情报信息按照用户制定订阅/分发关系,自动推送给不同的授权用户端;
所述构造问答系统对感知端采集的情报源信息分析,得到目标情报信息,包括:
待学习课程生成步骤:获取所述情报源信息作为事件抽取数据集,构造问答训练样本,生成问答系统中用于问答模型训练的待学习课程;
课程学习步骤:将当前所述问答模型的学习状态值输入至课程学习进度选择策略网络动态选择学习进度,输出待学习的目标问答训练样本;
问答模型训练步骤:将所述待学习的目标问答训练样本输入至所述问答模型进行训练,并更新所述问答模型的学习状态值;
训练好的所述问答模型用于从所述情报源信息中抽取出所述目标情报信息。
可选的,所述待学习课程生成步骤,进一步包括:
将所述事件抽取数据集转化为预先定义的多个问题,每个所述问题对应一个所需抽取的事件参数角色;
按照提取一个参数到多个参数不同粒度的划分,并在每一次参数提取时将剩余参数信息补充在对应的问题上,构造每一个事件抽取样例,多个所述样例构成所述问答训练样本;
根据需要回答问题的个数以及所要抽取的所述事件参数角色出现的频度,确定每一个所述样例的复杂度;
根据每一个所述样例的复杂度将所述问答训练样本进行排序,生成所述待学习的课程。
可选的,按照每一个所述样例的复杂度从低到高将所述问答训练样本进行排序,生成所述待学习的课程。
可选的,使用训练过程中的多个特征来表征所述学习状态值,所述特征包括当前迭代步数、训练过程中损失函数值的滑动平均、当前样本的损失函数值,以及所述问答模型输出的分布margin值、验证集得分。
可选的,所述课程学习步骤,还进一步包括:
在问答模型的每个迭代步,获取当前所述问答模型的学习状态值作为所述策略网络当前的状态;
根据所述学习状态值,动态的选择不同的学习进度;
根据选定的所述学习进度对所述问答训练样本进行采样,得到待学习的所述目标问答训练样本。
可选的,所述根据所述学习状态值,动态的选择不同的学习进度,包括:
定义所述策略网络的每一个决策动作表示选择不同的学习进度;
根据所述学习状态值,使用所述策略网络采样一个决策动作,通过采样的所述决策动作确定选择的所述学习进度。
可选的,所述的方法还包括:
根据更新后的所述问答模型的学习状态值,更新所述策略网络。
可选的,所述根据更新后的所述问答模型的学习状态值,更新所述策略网络,包括:
实时获取所述问答模型的学习状态值,根据所述学习状态值产生所述决策动作,选择所述问答模型训练下一迭代步的所述学习进度;
获取所述问答模型返回的奖励值;
根据所述策略网络执行某一所述决策动作返回的所述奖励值,利用优化算法最大化所述奖励值,输出最优的所述策略网络。
可选的,所述获取所述问答模型返回的奖励值,包括:
每经过一次所述问答模型训练返回验证集得分后,将连续两次验证集得分的差值作为所述奖励值。
本发明另一方面提供一种情报分析装置,包括:
待学习课程生成模块:用于获取所述情报源信息作为事件抽取数据集,构造问答训练样本,生成问答系统中用于问答模型训练的待学习课程;
课程学习模块:用于将当前所述问答模型的学习状态值输入至课程学习进度选择策略网络动态选择学习进度,输出待学习的目标问答训练样本;
问答模型训练模块:将所述待学习的目标问答训练样本输入至所述问答模型进行训练,并更新所述问答模型的学习状态值;
训练好的所述问答模型用于从所述情报源信息中抽取出所述目标情报信息。
本发明另一方面提供一种存储介质,用于存储一种用于执行上述的情报分析方法的计算机程序。
本发明另一方面提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的情报分析方法。
由以上方案可知,本发明的优点在于:
本发明提供的方法,基于问答系统对感知端采集的情报源信息分析,得到目标情报信息,具体通过获取所述情报源信息作为事件抽取数据集,构造问答训练样本,生成问答系统中用于问答模型训练的待学习课程;然后,将当前所述问答模型的学习状态值输入至课程学习进度选择策略网络动态选择学习进度,输出待学习的目标问答训练样本;将所述待学习的目标问答训练样本输入至所述问答模型进行训练;训练好的所述问答模型用于从所述情报源信息中抽取出所述目标情报信息。该方法构造的问答系统,能够模拟人类从简单的问答过渡到复杂的问答的学习事件信息方式,使得在学习过程中根据自身学习状态在不同的学习阶段动态的选择不同的学习进度,能够针对情报信息进行有效的训练,提高模型的学习效率及情报事件抽取的质量,提高情报分析的准确度。
附图说明
图1为本发明的情报分析系统的框架图;
图2为本发明实施例一提供的情报分析方法流程示意图;
图3为步骤S1的具体流程图;
图4为步骤S2的具体流程图;
图5为本发明实施例二提供的情报分析方法流程示意图;
图6为步骤S4的具体流程图;
图7为本发明的情报分析装置的框架图;
图8为电子设备的结构示意图;
图9为电子设备的硬件结构示意图;
其中:
101-感知端;
102-图像情报分析服务端;
103-报文情报分析服务端;
104-开源情报分析服务端;
105-电磁情报分析服务端;
106-情报数据服务端;
107-分布式存储节点;
108-云集群端;
109-授权用户端;
400-情报分析装置;
401-待学习课程生成模块;
402-课程学习模块;
403-问答模型训练模块;
404-策略网络更新模块;
500-电子设备;
501-处理器;
502-存储器;
600-电子设备;
601-射频单元;
602-网络模块;
603-音频输出单元;
604-输入单元;
6041-图形处理器;
6042-麦克风;
605-传感器;
606-显示单元;
6061-显示面板;
607-用户输入单元;
6071-触控面板;
6072-其他输入设备;
608-接口单元;
609-存储器;
610-处理器。
具体实施方式
为让本发明的上述特征和效果能阐述的更明确易懂,下文特举实施例,并配合说明书附图作详细说明如下。
智能情报分析系统是一款面向智能情报分析的人机混合大数据深度分析应用平台,通过对多元异质大数据的关联融合,,实现人机协同的目标搜索、关联分析、时空分析、智能报告,可广泛应用于科技情报、行业情报等的智能分析与挖掘。图1是本申请实施例提供的情报分析系统的系统架构图。系统采用面向服务的分布式体系架构,主要由感知端101、图像情报分析服务端102、报文情报分析服务端103、开源情报分析服务端104、电磁情报分析服务端105、情报数据服务端106、分布式存储节点107、云集群端108、授权用户端109等部分组成,所述图像情报分析服务端102、报文情报分析服务端103、开源情报分析服务端104、电磁情报分析服务端105、情报数据服务端106同时与感知端101以及分布式存储节点107连接,分布式存储节点107与云集群端108连接,实现信息交互。
系统感知端101动态引接多种源头和多种类型的情报数据,包括预警雷达、侦察卫星、报文、图形图像、视频、电磁等多种载体类型的情报源,系统将感知端101采集的情报源按照情报类型及源头自动分配至图像情报分析服务端102、报文情报分析服务端103、开源情报分析服务端104、电磁情报分析服务端105、情报数据服务端106进行数据分析,并依托服务注册机制进行统一分类管理,形成软件服务资源目录,实现情报分析功能在系统内各节点之间的共享。同时,系统采用分布式运行管理技术,云集群端108通过分布式存储节点107对情报分析任务、计算能力、数据资源进行统一管控,依据情报保障需求实现协同调度,共同完成情报分析任务,得到目标情报产品;并将得到的目标情报产品按照用户制定订阅/分发关系,自动推送给不同的授权用户端109等。
本发明实施例基于上述的情报分析系统,提出了一种基于动态课程问答学习的情报分析方法,该方法能够模拟人类从简单的问答过渡到复杂的问答的学习事件信息方式,使得用于情报分析中问答模型在学习过程中根据其自身学习状态在不同的学习阶段动态的选择不同的学习进度,以更好的进行模型训练,提高模型的学习效率及事件抽取的质量,提高情报分析的准确度。
具体的,参考图2所示,图2示出了本发明实施例一提供的情报分析方法流程示意图。
一种情报分析方法,云集群端构造问答系统对感知端采集的情报源信息分析,得到目标情报信息;并将所述目标情报信息按照用户制定订阅/分发关系,自动推送给不同的授权用户端;
所述对感知端采集的情报源信息分析,得到目标情报信息,包括:
S1、获取感知端采集的情报源信息作为事件抽取数据集,构造问答训练样本,生成问答系统中用于问答模型训练的待学习课程。
在一些实施例中,如图3所示,图3示出了步骤S1的具体流程图,具体包括:
S11、将所述事件抽取数据集转化为预先定义的多个问题,每个所述问题对应一个所需抽取的事件参数角色。
在具体实现中,感知端采集的情报源信息一般为多种源头和多种类型的情报数据,例如报纸、网站等开源情报源的文本信息,可以将事件抽取数据集根据情报类型及源头等设定触发词、触发词类别、角色转化为预先定义好的问题,以构造问答模型。
S12、按照提取一个参数到多个参数不同粒度的划分,并在每一次参数提取时将剩余参数信息补充在对应的问题上,构造每一个事件抽取样例,多个所述样例构成所述问答训练样本。
在具体实现中,本实施例将事件抽取数据集按照先学习一个参数抽取,再学习多个参数抽取,最后学习完整参数抽取的方式构造数据集,考虑到事件参数之间的依赖关系,在构造每个事件抽取样例时将该样例中剩余的参数信息补充在问题上,为模型学习提供更丰富的信息。
S13、根据需要回答问题的个数以及所要抽取的所述事件参数角色出现的频度,确定每一个所述样例的复杂度。
具体的,在定义样本复杂度时,将一个样本分解为仅需提取一个事件参数到需要提取多个事件参数不同的样本,具体根据需要回答问题的个数以及所要提取事件参数角色出现的频度确认样例复杂度。问答问题个数越多样例越复杂,所要提取的参数角色出现频率越低样例越复杂。在分解完样本后,将每个样例中不需要提取的参数信息补充在问句中进行丰富问句,这样就可以实现从只提取一个事件参数到提取多个事件参数的逐步学习,最终学习如何提取所有的参数信息。
S14、根据每一个所述样例的复杂度将所述问答训练样本进行排序,生成所述待学习的课程。
在具体实现中,本实施例中按照每一个所述样例的复杂度从低到高将所述问答训练样本进行排序,生成所述待学习的课程,当然根据每一个样例的复杂度将问答训练样本进行排序的方式并不限于该方式,其他相关方式也在本申请的保护范围之内,本申请对此并不做具体限定。
本实施例中,在构建待学习的课程问题时考虑到事件参数信息之间相互依赖的特性补充了相关参数信息,同时根据补充参数信息量以及所要提取参数角色出现频率确定样本的复杂度,从而模仿人类学习过程构造了从简单到复杂的学习样例。
S2、将当前所述问答模型的学习状态值输入至课程学习进度选择策略网络动态选择学习进度,输出待学习的目标问答训练样本。
在具体实现中,使用训练过程中的多个特征来表征所述学习状态值,所述特征包括当前迭代步数、训练过程中损失函数值的滑动平均、当前样本的损失函数值,以及所述问答模型输出的分布margin值、验证集得分等。
在一些实施例中,如图4所示,图4示出了步骤S2的具体流程图,具体包括:
S21、在问答模型的每个迭代步,获取当前所述问答模型的学习状态值作为所述策略网络当前的状态;
S22、根据所述学习状态值,动态的选择不同的学习进度;
在具体实现中,所述根据所述学习状态值,动态的选择不同的学习进度,包括:
定义所述策略网络的每一个决策动作表示选择不同的学习进度;
根据所述学习状态值,使用所述策略网络采样一个决策动作,通过采样的所述决策动作确定选择的所述学习进度。
在具体实现中,在学习进度上可以选择进度向前、向后、保持不变的三种学习机制,分别模仿了人类在学习过程中跳跃式学习、进度回退、复习机制,动态选择学习进度,灵活的学习方式避免了常规比较死板的从头到尾低效的学习。
S23、根据选定的所述学习进度对所述问答训练样本进行采样,得到所述目标问答训练样本。
本实施例中,在课程学习过程中能够根据当前问答模型的学习状态动态的选择下一迭代步骤中要学习的一批数据,符合人类学习语言的进程,能够提高模型的学习效率及提高事件抽取的效果,提高情报分析的准确度。
S3、将所述待学习的目标问答训练样本输入至所述问答模型进行训练,并更新所述问答模型的学习状态值。
训练好的所述问答模型用于从所述情报源信息中抽取出所述目标情报信息。
问答模型训练是根据课程学习选择的目标问答训练样本进行迭代训练完成的,每个迭代周期输入课程进度选择策略网络选择的一批目标问答训练样本,进行模型参数更新,输出所述目标情报信息,并更新所述问答模型的学习状态值,包括损失函数值的变化、模型分布情况等,并定期在验证集上评估模型的效果。
在本实施例中,云集群端构造问答系统对感知端采集的情报源信息分析,得到目标情报信息;并将所述目标情报信息按照用户制定订阅/分发关系,自动推送给不同的授权用户端。具体通过获取情报源信息作为事件抽取数据集,构造问答训练样本,生成问答系统中用于问答模型训练的待学习课程。然后,将当前所述问答模型的学习状态值输入至课程学习进度选择策略网络动态选择学习进度,输出待学习的目标问答训练样本。将所述待学习的目标问答训练样本再次输入至所述问答模型进行训练,利用训练好的所述问答模型从所述情报源信息中抽取出所述目标情报信息以抽取出所述目标情报信息。该方法构造的问答系统,能够模拟人类从简单的问答过渡到复杂的问答的学习事件信息方式,使得在学习过程中根据自身学习状态在不同的学习阶段动态的选择不同的学习进度,能够针对情报信息进行有效的训练,提高模型的学习效率及情报事件抽取的质量,提高情报分析的准确度。
参考图5所示,图5示出了本发明实施例二提供的情报分析方法流程示意图。
一种情报分析方法,包括:
S1、获取情报源信息作为事件抽取数据集,构造问答训练样本,生成问答系统中用于问答模型训练的待学习课程。
在一些实施例中,如图3所示,图3示出了步骤S1的具体流程图,具体包括:
S11、将所述事件抽取数据集转化为预先定义的多个问题,每个所述问题对应一个所需抽取的事件参数角色。
在具体实现中,可以将事件抽取数据集通过设定的触发词、触发词类别、角色转化为预先定义好的问题。
S12、按照提取一个参数到多个参数不同粒度的划分,并在每一次参数提取时将剩余参数信息补充在对应的问题上,构造每一个事件抽取样例,多个所述样例构成所述问答训练样本。
在具体实现中,本实施例将事件抽取数据集按照先学习一个参数抽取,再学习多个参数抽取,最后学习完整参数抽取的方式构造数据集,考虑到事件参数之间的依赖关系,在构造每个事件抽取样例时将该样例中剩余的参数信息补充在问题上,为模型学习提供更丰富的信息。
S13、根据需要回答问题的个数以及所要抽取的所述事件参数角色出现的频度,确定每一个所述样例的复杂度。
本实施例中具体根据需要回答问题的个数以及所要提取事件参数角色出现的频度确认样例复杂度,问答问题个数越多样例越复杂,所要提取的参数角色出现频率越低样例越复杂。
S14、根据每一个所述样例的复杂度将所述问答训练样本进行排序,生成所述待学习的课程。
在具体实现中,本实施例中按照每一个所述样例的复杂度从低到高将所述问答训练样本进行排序,生成所述待学习的课程,当然根据每一个样例的复杂度将问答训练样本进行排序的方式并不限于该方式,其他相关方式也在本申请的保护范围之内,本申请对此并不做具体限定。
本实施例中,在构建待学习的课程问题时考虑到事件参数信息之间相互依赖的特性补充了相关参数信息,同时根据补充参数信息量以及所要提取参数角色出现频率确定样本的复杂度,从而模仿人类学习过程构造了从简单到复杂的学习样例。
S2、将当前所述问答模型的学习状态值输入至课程学习进度选择策略网络动态选择学习进度,输出待学习的目标问答训练样本。
在具体实现中,使用训练过程中的多个特征来表征所述学习状态值,所述特征包括当前迭代步数、训练过程中损失函数值的滑动平均、当前样本的损失函数值,以及所述问答模型输出的分布margin值、验证集得分。
在一些实施例中,如图4所示,图4示出了步骤S2的具体流程图,具体包括:
S21、在问答模型的每个迭代步,获取当前所述问答模型的学习状态值作为所述策略网络当前的状态;
S22、根据所述学习状态值,动态的选择不同的学习进度;
在具体实现中,所述根据所述学习状态值,动态的选择不同的学习进度,包括:
定义所述策略网络的每一个决策动作表示选择不同的学习进度;
根据所述学习状态值,使用所述策略网络采样一个决策动作,通过采样的所述决策动作确定选择的所述学习进度。
在具体实现中,在学习进度上可以选择进度向前、向后、保持不变的三种学习机制,分别模仿了人类在学习过程中跳跃式学习、进度回退、复习机制,动态选择学习进度,灵活的学习方式避免了常规比较死板的从头到尾低效的学习。
S23、根据选定的所述学习进度对所述问答训练样本进行采样,得到待学习的所述目标问答训练样本,用于问答模型下一迭代步的训练。
本实施例中,在课程学习过程中能够根据当前问答模型的学习状态动态的选择下一迭代步骤中要学习的一批数据,符合人类学习语言的进程,能够提高模型的学习效率及提高事件抽取的效果,提高情报分析的准确度。
S3、将所述待学习的目标问答训练样本输入至所述问答模型进行训练,并更新所述问答模型的学习状态值。
训练好的所述问答模型用于从所述情报源信息中抽取出所述目标情报信息。
在具体实现中,每个迭代步,问答模型训练是根据S2步骤的课程学习选择的目标问答训练样本进行迭代训练完成的,每个迭代周期输入课程进度选择策略网络选择的一批目标问答训练样本,进行模型参数更新,得到训练好的问答模型,以利用训练好的所述问答模型从所述情报源信息中抽取出所述目标情报信息。同时,返回当前的学习状态用于S2步骤的课程学习及S4步骤的策略网络更新。
S4、根据更新后的所述问答模型的学习状态值,更新所述策略网络。
在一些实施例中,如图6所示,图6示出了步骤S4的具体流程图,具体包括:
所述根据更新后的所述问答模型的学习状态值,更新所述策略网络,包括:
S41、实时获取所述问答模型的学习状态值,根据所述学习状态值产生所述决策动作,选择所述问答模型训练下一迭代步的所述学习进度;
S42、获取所述问答模型返回的奖励值;
在具体实现中,每经过一次所述问答模型训练返回验证集得分,可以将连续两次验证集得分的差值作为所述奖励值。
S43、根据所述策略网络执行某一所述决策动作返回的所述奖励值,利用优化算法最大化所述奖励值,输出最优的所述策略网络。
本实施例中具体可以基于强化学习的范式构建课程学习进度选择的策略网络,其环境状态为问答模型的学习状态,决策动作为学习进度向前、向后、保持不变,奖励值为问答模型两次相邻验证集得分的差距,策略网络学习的目标是最大化奖励值,并利用梯度下降等方式优化策略网络空间的参数,逐渐学习一个最优的课程进度选择网络。本实施例在上述实施例的基础上,根据问答生成模型返回的奖励值,迭代更新选择的策略网络,使得模型能够有效的选择待学习训练样本,加速模型训练速度。
综上所述,本发明提供的情报分析方法,基于问答系统对感知端采集的情报源信息分析,能够模拟人类从简单的问答过渡到复杂的问答的学习事件信息方式,使得在学习过程中根据自身学习状态在不同的学习阶段动态的选择不同的学习进度,能够针对情报信息进行有效的训练,提高模型的学习效率及情报事件抽取的质量,提高情报分析的准确度。
本发明上述实施例可以应用于事件抽取等信息分析功能的终端设备中,该终端设备可以包括个人终端、以及上位机终端等,本发明实施例对此不加以限制。该终端可以支持Windows、Android(安卓)、IOS、WindowsPhone等操作系统。
参照图7,图7示出了一种情报分析装置400,可应用于个人终端、以及上位机终端设备中,其可实现通过如图1-图5所示的情报分析方法,本申请实施例提供的设置装置能够实现上述情报分析方法实现的各个过程,至少包括待学习课程生成模块401、课程学习模块402、问答模型训练模块403、策略网络更新模块404,即具体为:
一种情报分析装置400,包括:
待学习课程生成模块401:用于获取情报源信息作为事件抽取数据集,构造问答训练样本,生成问答系统中用于问答模型训练的待学习课程;
课程学习模块402:用于将当前所述问答模型的学习状态值输入至课程学习进度选择策略网络动态选择学习进度,输出待学习的目标问答训练样本;
问答模型训练模块403:用于将所述待学习的目标问答训练样本输入至所述问答模型进行训练,更新所述问答模型的学习状态值;
训练好的所述问答模型用于从所述情报源信息中抽取出所述目标情报信息。
可选的,所述待学习课程生成模块401,进一步用于:
将所述事件抽取数据集转化为预先定义的多个问题,每个所述问题对应一个所需抽取的事件参数角色;
按照提取一个参数到多个参数不同粒度的划分,并在每一次参数提取时将剩余参数信息补充在对应的问题上,构造每一个事件抽取样例,多个所述样例构成所述问答训练样本;
根据需要回答问题的个数以及所要抽取的所述事件参数角色出现的频度,确定每一个所述样例的复杂度;
根据每一个所述样例的复杂度将所述问答训练样本进行排序,生成所述待学习的课程。
可选的,按照每一个所述样例的复杂度从低到高将所述问答训练样本进行排序,生成所述待学习的课程。
可选的,使用训练过程中的多个特征来表征所述学习状态值,所述特征包括当前迭代步数、训练过程中损失函数值的滑动平均、当前样本的损失函数值,以及所述问答模型输出的分布margin值、验证集得分。
可选的,所述课程学习模块402,进一步用于:
在问答模型的每个迭代步,获取当前所述问答模型的学习状态值作为所述策略网络当前的状态;
根据所述学习状态值,动态的选择不同的学习进度;
根据选定的所述学习进度对所述问答训练样本进行采样,得到待学习的所述目标问答训练样本。
可选的,所述根据所述学习状态值,动态的选择不同的学习进度,包括:
定义所述策略网络的每一个决策动作表示选择不同的学习进度;
根据所述学习状态值,使用所述策略网络采样一个决策动作,通过采样的所述决策动作确定选择的所述学习进度。
可选的,所述的装置还包括策略网络更新模块404,用于:
根据更新后的所述问答模型的学习状态值,更新所述策略网络。
可选的,所述策略网络更新模块404还用于:
实时获取所述问答模型的学习状态值,根据所述学习状态值产生所述决策动作,选择所述问答模型训练下一迭代步的所述学习进度;
获取所述问答模型返回的奖励值;
根据所述策略网络执行某一所述决策动作返回的所述奖励值,利用优化算法最大化所述奖励值,输出最优的所述策略网络。
可选的,所述获取所述问答模型返回的奖励值,包括:
每经过一次所述问答模型训练返回验证集得分后,将连续两次验证集得分的差值作为所述奖励值。
因此,根据本申请实施例的情报分析装置400,基于问答系统对感知端采集的情报源信息分析,能够模拟人类从简单的问答过渡到复杂的问答的学习事件信息方式,使得在学习过程中根据自身学习状态在不同的学习阶段动态的选择不同的学习进度,能够针对情报信息进行有效的训练,提高模型的学习效率及情报事件抽取的质量,提高情报分析的准确度。
应当理解,对情报分析方法的各描述同样适用于根据本申请实施例的情报分析装置400,为避免重复,不再详细描述。
此外,应当理解,在根据本申请实施例的情报分析装置300中,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即情报分析装置300可划分为与上述例示出的模块不同的功能模块,以完成以上描述的全部或者部分功能。
图8是本申请实施例提供的电子设备的结构示意图。
如图8中所示,本申请实施例还提供了一种电子设备500,包括处理器501,存储器502,存储在存储器502上并可在所述处理器501上运行的程序或指令,该程序或指令被处理器501执行时实现上述情报分析方法的步骤,且能达到相同的技术效果。
因此,根据本申请实施例的电子设备500,基于问答系统对感知端采集的情报源信息分析,能够模拟人类从简单的问答过渡到复杂的问答的学习事件信息方式,使得在学习过程中根据自身学习状态在不同的学习阶段动态的选择不同的学习进度,能够针对情报信息进行有效的训练,提高模型的学习效率及情报事件抽取的质量,提高情报分析的准确度。
对于根据本申请实施例的电子设备500的其他技术效果,为避免重复,这里不再详细描述。
需要注意的是,本申请实施例中的电子设备可包括移动电子设备和非移动电子设备。
图6是本申请实施例提供的电子设备的硬件具体结构示意图。
参照图6,电子设备600包括但不限于:射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元607、接口单元608、存储器609、以及处理器610等部件。
应理解的是,本申请实施例中,射频单元601可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器610处理;另外,将上行的数据发送给基站。通常,射频单元601包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元601还可以通过无线通信系统与网络和其他设备通信。
电子设备600通过网络模块602为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元603可以将射频单元601或网络模块602接收的或者在存储器609中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元603还可以提供与电子设备600执行的特定功能相关的音频输出(例如,呼叫信号接收声音、信息接收声音等等)。音频输出单元603包括扬声器、蜂鸣器以及受话器等。
输入单元604用于接收音频或视频信号。应理解的是,本申请实施例中,输入单元604可以包括图形处理器(Graphics Processing Unit,GPU)6041和麦克风6042,图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。
电子设备600还包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板6061的亮度,接近传感器可在电子设备600移动到耳边时,关闭显示面板6061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器605还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元606用于显示由用户输入的信息或提供给用户的信息。显示单元606可包括显示面板6061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板6061。
用户输入单元607可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元607包括触控面板6071以及其他输入设备6072。触控面板6071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板6071上或在触控面板6071附近的操作)。触控面板6071可包括触摸检测装置和触摸控制器两个部分。其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。接口单元608为外部装置与电子设备600连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元608可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备600内的一个或多个元件或者可以用于在电子设备600和外部装置之间传输数据。
存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器609可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器610是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器609内的软件程序和/或模块,以及调用存储在存储器609内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器610可包括一个或多个处理单元;优选的,处理器610可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器610中。本领域技术人员可以理解,电子设备600还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器610逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。在本申请实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备(例如手环、眼镜)、以及计步器等。
具体地,处理器610,至少用于获取感知端采集的情报源信息作为事件抽取数据集,构造问答训练样本,生成问答系统中用于问答模型训练的待学习课程;将当前所述问答模型的学习状态值输入至课程学习进度选择策略网络动态选择学习进度,输出待学习的目标问答训练样本;将所述待学习的目标问答训练样本输入至所述问答模型进行训练,并更新所述问答模型的学习状态值;训练好的所述问答模型用于从所述情报源信息中抽取出所述目标情报信息。
因此,根据本申请实施例的电子设备600,基于问答系统对感知端采集的情报源信息分析,能够模拟人类从简单的问答过渡到复杂的问答的学习事件信息方式,使得在学习过程中根据自身学习状态在不同的学习阶段动态的选择不同的学习进度,能够针对情报信息进行有效的训练,提高模型的学习效率及情报事件抽取的质量,提高情报分析的准确度。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述用于情报分析中情报分析方法的步骤,且能达到相同的技术效果。
因此,根据本申请实施例的可读存储介质,基于问答系统对感知端采集的情报源信息分析,能够模拟人类从简单的问答过渡到复杂的问答的学习事件信息方式,使得在学习过程中根据自身学习状态在不同的学习阶段动态的选择不同的学习进度,能够针对情报信息进行有效的训练,提高模型的学习效率及情报事件抽取的质量,提高情报分析的准确度。
对于根据本申请实施例的可读存储介质的其他技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例还提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述用于情报分析中情报分析方法的步骤,且能达到相同的技术效果。
因此,根据本申请实施例的芯片,基于问答系统对感知端采集的情报源信息分析,能够模拟人类从简单的问答过渡到复杂的问答的学习事件信息方式,使得在学习过程中根据自身学习状态在不同的学习阶段动态的选择不同的学习进度,能够针对情报信息进行有效的训练,提高模型的学习效率及情报事件抽取的质量,提高情报分析的准确度。
对于根据本申请实施例的芯片的其他技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以施加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (12)

1.一种情报分析方法,其特征在于,
云集群端构造问答系统对感知端采集的情报源信息分析,得到目标情报信息;并将所述目标情报信息按照用户制定订阅/分发关系,自动推送给不同的授权用户端;
所述构造问答系统对感知端采集的情报源信息分析,得到目标情报信息,包括:
待学习课程生成步骤:获取所述情报源信息作为事件抽取数据集,构造问答训练样本,生成问答系统中用于问答模型训练的待学习课程;
课程学习步骤:将当前所述问答模型的学习状态值输入至课程学习进度选择策略网络动态选择学习进度,输出待学习的目标问答训练样本;
问答模型训练步骤:将所述待学习的目标问答训练样本输入至所述问答模型进行训练,并更新所述问答模型的学习状态值;
训练好的所述问答模型用于从所述情报源信息中抽取出所述目标情报信息。
2.根据权利要求1所述的方法,其特征在于,所述待学习课程生成步骤,进一步包括:
将所述事件抽取数据集转化为预先定义的多个问题,每个所述问题对应一个所需抽取的事件参数角色;
按照提取一个参数到多个参数不同粒度的划分,并在每一次参数提取时将剩余参数信息补充在对应的问题上,构造每一个事件抽取样例,多个所述样例构成所述问答训练样本;
根据需要回答问题的个数以及所要抽取的所述事件参数角色出现的频度,确定每一个所述样例的复杂度;
根据每一个所述样例的复杂度将所述问答训练样本进行排序,生成所述待学习的课程。
3.根据权利要求2所述的方法,其特征在于,按照每一个所述样例的复杂度从低到高将所述问答训练样本进行排序,生成所述待学习的课程。
4.根据权利要求1所述的方法,其特征在于,使用训练过程中的多个特征来表征所述学习状态值,所述特征包括当前迭代步数、训练过程中损失函数值的滑动平均、当前样本的损失函数值,以及所述问答模型输出的分布margin值、验证集得分。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述课程学习步骤,还进一步包括:
在问答模型的每个迭代步,获取当前所述问答模型的学习状态值作为所述策略网络当前的状态;
根据所述学习状态值,动态的选择不同的学习进度;
根据选定的所述学习进度对所述问答训练样本进行采样,得到待学习的所述目标问答训练样本。
6.根据权利要求5所述的方法,其特征在于,所述根据所述学习状态值,动态的选择不同的学习进度,包括:
定义所述策略网络的每一个决策动作表示选择不同的学习进度;
根据所述学习状态值,使用所述策略网络采样一个决策动作,通过采样的所述决策动作确定选择的所述学习进度。
7.根据权利要求6所述的方法,其特征在于,还包括:
根据更新后的所述问答模型的学习状态值,更新所述策略网络。
8.根据权利要求7所述的方法,其特征在于,
所述根据更新后的所述问答模型的学习状态值,更新所述策略网络,包括:
实时获取所述问答模型的学习状态值,根据所述学习状态值产生所述决策动作,选择所述问答模型训练下一迭代步的所述学习进度;
获取所述问答模型返回的奖励值;
根据所述策略网络执行某一所述决策动作返回的所述奖励值,利用优化算法最大化所述奖励值,输出最优的所述策略网络。
9.根据权利要求8所述的方法,其特征在于,所述获取所述问答模型返回的奖励值,包括:
每经过一次所述问答模型训练返回验证集得分后,将连续两次验证集得分的差值作为所述奖励值。
10.一种情报分析装置,其特征在于,包括:
待学习课程生成模块:用于获取所述情报源信息作为事件抽取数据集,构造问答训练样本,生成问答系统中用于问答模型训练的待学习课程;
课程学习模块:用于将当前所述问答模型的学习状态值输入至课程学习进度选择策略网络动态选择学习进度,输出待学习的目标问答训练样本;
问答模型训练模块:将所述待学习的目标问答训练样本输入至所述问答模型进行训练,并更新所述问答模型的学习状态值;
训练好的所述问答模型用于从所述情报源信息中抽取出所述目标情报信息。
11.一种存储介质,其特征在于,用于存储一种用于执行权利要求1~9中任一项所述的情报分析方法的计算机程序。
12.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~9中任一项所述的情报分析方法。
CN202210104400.1A 2022-01-28 2022-01-28 情报分析方法、装置、介质、电子设备 Pending CN114595829A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210104400.1A CN114595829A (zh) 2022-01-28 2022-01-28 情报分析方法、装置、介质、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210104400.1A CN114595829A (zh) 2022-01-28 2022-01-28 情报分析方法、装置、介质、电子设备

Publications (1)

Publication Number Publication Date
CN114595829A true CN114595829A (zh) 2022-06-07

Family

ID=81806996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210104400.1A Pending CN114595829A (zh) 2022-01-28 2022-01-28 情报分析方法、装置、介质、电子设备

Country Status (1)

Country Link
CN (1) CN114595829A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117874261A (zh) * 2024-03-12 2024-04-12 北京邮电大学 基于课程学习的问答式事件抽取方法以及相关设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117874261A (zh) * 2024-03-12 2024-04-12 北京邮电大学 基于课程学习的问答式事件抽取方法以及相关设备
CN117874261B (zh) * 2024-03-12 2024-05-28 北京邮电大学 基于课程学习的问答式事件抽取方法以及相关设备

Similar Documents

Publication Publication Date Title
KR102270394B1 (ko) 이미지를 인식하기 위한 방법, 단말, 및 저장 매체
CN108090855B (zh) 一种学习计划推荐方法及移动终端
CN111816159B (zh) 一种语种识别方法以及相关装置
CN109918684A (zh) 模型训练方法、翻译方法、相关装置、设备及存储介质
WO2020147369A1 (zh) 自然语言处理方法、训练方法及数据处理设备
CN110852109A (zh) 语料生成方法、语料生成装置、和存储介质
CN110830362B (zh) 一种生成内容的方法、移动终端
CN110795538B (zh) 一种基于人工智能的文本评分方法和相关设备
CN109769213B (zh) 用户行为轨迹记录的方法、移动终端及计算机存储介质
CN111597804B (zh) 一种实体识别模型训练的方法以及相关装置
CN113821720A (zh) 一种行为预测方法、装置及相关产品
CN115022098B (zh) 人工智能安全靶场内容推荐方法、装置及存储介质
CN114595829A (zh) 情报分析方法、装置、介质、电子设备
CN112862021A (zh) 一种内容标注方法和相关装置
CN111816168A (zh) 一种模型训练的方法、语音播放的方法、装置及存储介质
CN109558853B (zh) 一种音频合成方法及终端设备
CN110781274A (zh) 一种问答对生成的方法与装置
CN111723783B (zh) 一种内容识别方法和相关装置
CN113569043A (zh) 一种文本类别确定方法和相关装置
CN113392686A (zh) 视频分析方法、装置及存储介质
CN113127740A (zh) 信息推荐方法、电子设备及存储介质
CN113822435A (zh) 一种用户转化率的预测方法及相关设备
CN111709789A (zh) 一种用户转化率的确定方法及相关设备
CN112541843A (zh) 一种基于人工智能的辅助教学方法及系统
CN112540668A (zh) 一种基于AI及IoT的智能教学辅助方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination