CN116628177B - 针对网络安全平台的交互数据处理方法及系统 - Google Patents
针对网络安全平台的交互数据处理方法及系统 Download PDFInfo
- Publication number
- CN116628177B CN116628177B CN202310579758.4A CN202310579758A CN116628177B CN 116628177 B CN116628177 B CN 116628177B CN 202310579758 A CN202310579758 A CN 202310579758A CN 116628177 B CN116628177 B CN 116628177B
- Authority
- CN
- China
- Prior art keywords
- interactive
- text
- data
- interaction
- basic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 794
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 211
- 239000013598 vector Substances 0.000 claims abstract description 173
- 230000002787 reinforcement Effects 0.000 claims abstract description 28
- 239000000284 extract Substances 0.000 claims abstract description 9
- 230000003993 interaction Effects 0.000 claims description 358
- 238000002372 labelling Methods 0.000 claims description 119
- 230000011218 segmentation Effects 0.000 claims description 88
- 238000013508 migration Methods 0.000 claims description 33
- 230000005012 migration Effects 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 21
- 230000036961 partial effect Effects 0.000 claims description 21
- 238000005457 optimization Methods 0.000 claims description 19
- 238000005728 strengthening Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 5
- 125000004122 cyclic group Chemical group 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 2
- 238000003860 storage Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 241000579895 Chlorostilbon Species 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 239000010977 jade Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- ZLIBICFPKPWGIZ-UHFFFAOYSA-N pyrimethanil Chemical compound CC1=CC(C)=NC(NC=2C=CC=CC=2)=N1 ZLIBICFPKPWGIZ-UHFFFAOYSA-N 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Machine Translation (AREA)
Abstract
本申请提供一种针对网络安全平台的交互数据处理方法及系统,通过使用目标互动意图预测网络对目标互动文本进行AI预测,由于通过对立强化训练使目标互动意图预测网络能够对加载互动文本数据提取不同监督型样本对应的共享描述向量,由此使得即便目标互动文本为不同监督型样本中的互动文本,目标互动意图预测网络也能保证互动预测预测的精准度,即目标互动意图预测网络提高了对目标互动文本进行互动预测预测的精准度,从而提高后续知识点内容推送的精准度。
Description
技术领域
本申请涉及人工智能技术领域,具体而言,涉及一种针对网络安全平台的交互数据处理方法及系统。
背景技术
人工智能(Artificial Intelligence,简称AI)是一种使计算机系统具有智能的技术和方法,其目标是使计算机系统能够像人类一样思考、理解、学习和解决问题。人工智能的研究领域涉及到机器学习、知识表示与推理、自然语言处理、计算机视觉、智能控制等多个方面。例如,对于网络安全平台而言,对于不同的用户可能有不同的需求,从而在出于其用户需求的知识点内容的意图会在网络安全平台中产生互动文本,通过对这些互动文本进行有效挖掘以分析出其互动意图数据可以更好地为用户提供符合其获取意图的知识点内容,然而相关技术的方案,在目标互动文本为不同监督型样本中的互动文本时,无法很好地保证互动预测预测的精准度,进而难以保证知识点内容推送的精准度。
发明内容
鉴于上述提及的问题,本申请实施例提供一种针对网络安全平台的交互数据处理方法,应用于云服务系统,所述方法包括:
获取所述网络安全平台的目标互动文本,将所述目标互动文本加载至目标互动意图预测网络中进行AI预测,生成所述目标互动文本对应的目标互动意图数据;所述目标互动意图预测网络是依据监督样本互动文本数据和弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练,生成第一待定互动意图预测网络,使用第一待定互动意图预测网络对弱监督样本互动文本数据进行互动意图预测,生成互动意图预测数据,基于互动意图预测数据和弱监督样本互动文本数据对所述第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,将所述第二待定互动意图预测网络作为基础互动意图预测网络进行循环遍历优化,依据网络收敛的第二待定互动意图预测网络得到的;
基于所述目标互动意图数据向所述目标互动文本关联的互动页面推送对应的知识点内容。
再一方面,本申请实施例还提供一种云服务系统,包括处理器、机器可读存储介质,所述机器可读存储介质和所述处理器连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以实现上述的方法。
依据以上方面,通过获取目标互动文本,将目标互动文本加载至目标互动意图预测网络中进行AI预测,目标互动意图预测网络是依据监督样本互动文本数据和弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练,生成第一待定互动意图预测网络,使用第一待定互动意图预测网络对弱监督样本互动文本数据进行互动意图预测,生成互动意图预测数据,基于互动意图预测数据和弱监督样本互动文本数据对第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,将第二待定互动意图预测网络作为基础互动意图预测网络进行循环遍历优化,依据网络收敛的第二待定互动意图预测网络得到的;目标互动意图预测网络输出目标互动文本对应的AI预测数据。通过使用目标互动意图预测网络对目标互动文本进行AI预测,由于通过对立强化训练使目标互动意图预测网络能够对加载互动文本数据提取不同监督型样本对应的共享描述向量,由此使得即便目标互动文本为不同监督型样本中的互动文本,目标互动意图预测网络也能保证互动预测预测的精准度,即目标互动意图预测网络提高了对目标互动文本进行互动预测预测的精准度,从而提高后续知识点内容推送的精准度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以基于这些附图获得其它相应的附图。
图1是本申请实施例提供的针对网络安全平台的交互数据处理方法的执行流程示意图。
图2是本申请实施例提供的云服务系统硬件架构示意图。
具体实施方式
以下描述是为了使本领域的普通技术人员能够实施和利用本申请,并且该描述是在特定的应用场景及其要求的环境下提供的。对于本领域的普通技术人员来讲,显然可以对所公开的实施例作出各种改变,并且在不偏离本申请的原则和范围的情况下,本申请中所定义的普遍原则可以适用于其它实施例和应用场景。因此,本申请并不限于所描述的实施例,而应该被给予与权利要求一致的最广泛的范围。
本申请中所使用的术语仅用于描述特定的示例性实施例,并不限制本申请的范围。如本申请使用的单数形式“一”、“一个”及“该”可以同样包括复数形式,除非上下文明确提示例外情形。还应当理解,如在本申请说明书中,术语“包括”、“包含”仅提示存在所述特征、整体、步骤、操作、组件和/或部件,但并不排除存在或添加一个或以上其它特征、整体、步骤、操作、组件、部件和/或其组合的情况。
根据以下对附图的描述,本申请的这些和其它的特征、特点以及相关结构元件的功能和操作方法,以及部件组合和制造经济性,可以变得更加显而易见,这些附图都构成本申请说明书的一部分。然而,应当理解的是,附图仅仅是为了说明和描述的目的,并不旨在限制本申请的范围。应当理解的是,附图并不是按比例绘制的。
本申请中使用了流程图用来说明根据本申请的一些实施例的系统所执行的操作。应当理解的是,流程图中的操作可以不按顺序执行。相反,可以按照倒序或同时处理各种步骤。此外,可以向流程图添加一个或以上其它操作。也可以从流程图中删除一个或以上操作。
下面结合说明书附图对本申请进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。
图1是本申请一种实施例提供的针对网络安全平台的交互数据处理方法的流程示意图,下面对该针对网络安全平台的交互数据处理方法进行详细介绍。
步骤100,获取所述网络安全平台的目标互动文本,将所述目标互动文本加载至目标互动意图预测网络中进行AI预测,生成所述目标互动文本对应的目标互动意图数据;所述目标互动意图预测网络是依据监督样本互动文本数据和弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练,生成第一待定互动意图预测网络,使用第一待定互动意图预测网络对弱监督样本互动文本数据进行互动意图预测,生成互动意图预测数据,基于互动意图预测数据和弱监督样本互动文本数据对所述第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,将所述第二待定互动意图预测网络作为基础互动意图预测网络进行循环遍历优化,依据网络收敛的第二待定互动意图预测网络得到的。
步骤S200,基于所述目标互动意图数据向所述目标互动文本关联的互动页面推送对应的知识点内容。
其中,目标互动文本是指需要进行AI预测的互动文本,该互动文本可以是不同域中的数据。
一种可能的实施方式中,可以预先依据监督样本互动文本数据和弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练,生成第一待定互动意图预测网络,使用第一待定互动意图预测网络对弱监督样本互动文本数据进行互动意图预测,生成互动意图预测数据,基于互动意图预测数据和弱监督样本互动文本数据对第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,将第二待定互动意图预测网络作为基础互动意图预测网络进行循环遍历优化,依据网络收敛的第二待定互动意图预测网络得到的目标互动意图预测网络,然后将目标互动意图预测网络部署使用。也即在具体实施时,获取到目标互动文本,将目标互动文本加载至目标互动意图预测网络中进行AI预测,目标互动意图预测网络通过提取的语义描述向量包括共享描述向量,对提取的语义描述向量进行AI预测,生成AI预测数据,然后将AI预测数据输出,生成目标互动文本对应的AI预测数据,并从中选择互动意图分类置信度大于设定置信度的目标互动意图数据,然后从知识点内容数据库中提取与所述目标互动意图数据关联的知识点内容向所述目标互动文本关联的互动页面进行推送。
一种可能的实施方式中,下面介绍上述目标互动意图预测网络的具体训练实施例,参见下述步骤。
步骤S102,获取监督样本互动文本数据,监督样本互动文本数据包括第一属性标签的样本互动文本,第一属性标签的样本互动文本的各个互动文本分句携带对应的互动意图标注数据。
其中,监督样本互动文本数据(也称之为源域互动文本数据)是指具有完整训练标签数据的样本互动文本数据,也即每个互动文本分句都有对应的互动意图标注数据。第一属性标签的样本互动文本是指监督样本互动文本数据中的互动文本,即第一属性标签的样本互动文本的各个互动文本分句携带对应的互动意图标注数据。各个互动文本分句携带对应的互动意图标注数据是指监督样本互动文本数据进行网络学习时使用的训练标签,例如可以是互动意图标注类型,或者可以是分词向量标注数据等等。
步骤S104,获取弱监督样本互动文本数据,弱监督样本互动文本数据包括第二属性标签的样本互动文本,第二属性标签的样本互动文本的部分互动文本分句携带对应的互动意图标注数据。
其中,弱监督样本互动文本数据(也称之为目标域互动文本数据)是指具有不完整训练标签数据的样本互动文本数据,第二属性标签的样本互动文本是指弱监督样本互动文本数据中的互动文本,即第二属性标签的样本互动文本的部分互动文本分句携带对应的互动意图标注数据,该部分互动文本分句可以是互动文本中特殊的互动文本分句。
其中,在本领域中,源域表示与样本不同的领域,但是有丰富的监督信息。目标域表示样本所在的领域,无标签或者只有少量标签。源域和目标域往往属于同一类任务,但是分布不同。在本实施例中,源域样本和目标域样本则可以理解为不同监督型样本,通过结合监督样本互动文本数据和弱监督样本互动文本数据的不同监督型样本训练训练,可以便于即便前述的目标互动文本为不同监督型样本中的互动文本,目标互动意图预测网络也能保证互动预测预测的精准度。
步骤S106,依据监督样本互动文本数据和弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练,以便于训练生成的第一待定互动意图预测网络对加载互动文本数据解析的描述向量包括不同监督型样本对应的当前共享描述向量。
其中,对立强化训练是指通过对监督样本互动文本数据和弱监督样本互动文本数据解析的描述向量的源内容进行对立识别(对抗训练),进而生成的第一待定互动意图预测网络对加载互动文本数据解析的描述向量包括不同监督型样本对应的当前共享描述向量。基础互动意图预测网络是指初始化权重参数的互动意图预测网络。第一待定互动意图预测网络是指经过一次对立强化训练后得到互动意图预测网络,即对基础互动意图预测网络中初始化权重参数进行一次优化后得到的互动意图预测网络。当前共享描述向量是指当前的第一待定互动意图预测网络提取加载互动文本数据时解析的存在共享性质的语义描述向量。
一种可能的实施方式中,可以将监督样本互动文本数据和弱监督样本互动文本数据加载至基础互动意图预测网络中进行对立强化训练,即对加载的监督样本互动文本数据和弱监督样本互动文本数据中的互动文本分别进行语义编码,并对语义编码数据进行对应的鉴别,同时将提取到的语义描述向量进行文本知识点鉴别和互动意图预测,生成文本知识点鉴别数据和互动意图预测数据,然后基于文本知识点鉴别数据和互动意图预测数据更新基础互动意图预测网络中的参数,当网络权重参数优化完成时,生成第一待定互动意图预测网络,该第一待定互动意图预测网络对加载互动文本数据解析的描述向量包括不同监督型样本对应的当前共享描述向量。
一种可能的实施方式中,可以依据监督样本互动文本数据和弱监督样本互动文本数据对基础互动意图预测网络不断进行对立强化训练,生成目标第一待定互动意图预测网络,将优化后的基础互动意图预测网络作为基础互动意图预测网络不断进行循环遍历优化,直到文本知识点鉴别数据和互动意图预测数据对应的训练代价值之和小于设定代价值时,生成目标第一待定互动意图预测网络。
步骤S108,依据第一待定互动意图预测网络对第二属性标签的样本互动文本进行AI预测,生成第二属性标签的样本互动文本中各个互动文本分句对应的AI预测数据,将各个互动文本分句对应的AI预测数据作为第二属性标签的样本互动文本中各个互动文本分句对应的估计互动意图数据。
其中,估计互动意图数据是指使用第一待定互动意图预测网络对第二属性标签的样本互动文本进行预测得到的互动意图数据。
一种可能的实施方式中,可以将弱监督样本互动文本数据中的第二属性标签的样本互动文本加载至第一待定互动意图预测网络进行AI预测,生成第二属性标签的样本互动文本中各个互动文本分句对应的AI预测数据,将各个互动文本分句对应的AI预测数据作为第二属性标签的样本互动文本中各个互动文本分句对应的估计互动意图数据。
步骤S110,依据第二属性标签的样本互动文本、部分互动文本分句对应的互动意图标注数据和估计互动意图数据对第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络。
其中,第二待定互动意图预测网络是指依据对第一待定互动意图预测网络使用弱监督样本互动文本数据中的第二属性标签的样本互动文本进行对立强化训练得到的互动意图预测网络。
一种可能的实施方式中,可以基于第二属性标签的样本互动文本的部分互动文本分句对应的互动意图标注数据和第二属性标签的样本互动文本中各个互动文本分句对应的估计互动意图数据将弱监督样本互动文本数据中的第二属性标签的样本互动文本进行划分,生成划分后的第一种互动文本和划分后的第二种互动文本,将第一种互动文本和对应的各个互动文本分句对应的估计互动意图数据以及第二种互动文本和对应的部分互动文本分句对应的互动意图标注数据对第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络。即将第一种互动文本和第二种互动文本加载至第一待定互动意图预测网络中进行语义编码,对解析的描述向量进行知识点鉴别,判断是第一种互动文本的特征还是第二种互动文本的特征,生成鉴别结果,同时使用解析的描述向量进行互动意图预测,生成互动意图预测数据。然后基于鉴别结果和AI预测数据对第一待定互动意图预测网络中参数进行更新,当网络权重参数优化完成时,即进行一次网络权重参数优化后就得到第二待定互动意图预测网络。
一种可能的实施方式中,可以使用第二属性标签的样本互动文本、部分互动文本分句对应的互动意图标注数据和估计互动意图数据对第一待定互动意图预测网络不断进行对立强化训练,生成目标第二待定互动意图预测网络。例如:将第二属性标签的样本互动文本加载至第一待定互动意图预测网络中进行语义编码,对解析的描述向量进行鉴别,生成鉴别结果,并对解析的描述向量进行AI预测,生成互动意图预测数据,然后基于鉴别结果、AI预测数据、部分互动文本分句对应的互动意图标注数据和估计互动意图数据计算训练代价值,基于训练代价值反向更新第一待定互动意图预测网络中的参数,生成优化后的第一待定互动意图预测网络,然后将优化后的第一待定互动意图预测网络作为第一待定互动意图预测网络不断进行循环遍历优化,直到训练代价值低于设定代价值时,生成目标第二待定互动意图预测网络,然后依据目标第二待定互动意图预测网络得到目标互动意图预测网络。
步骤S112,判断是否网络收敛,当网络收敛时执行步骤S114a,当网络未收敛时,执行步骤S114b并返回步骤S106迭代执行。
步骤S114a,依据网络收敛的第二待定互动意图预测网络得到目标互动意图预测网络,目标互动意图预测网络用于对各种属性标签的样本互动文本中的文本分句进行互动意图预测。
步骤S114b,将第二待定互动意图预测网络作为基础互动意图预测网络,并返回依据监督样本互动文本数据和弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练的步骤迭代执行。
当网络收敛时,依据网络收敛的第二待定互动意图预测网络得到目标互动意图预测网络,当网络未收敛时,将第二待定互动意图预测网络作为基础互动意图预测网络,并返回依据监督样本互动文本数据和弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练的步骤迭代执行,直到网络收敛。即通过将第一待定互动意图预测网络迁移到目标域,训练得到第二待定互动意图预测网络,然后将第二待定互动意图预测网络迁移到源域,以此不断进行循环迭代,直到网络收敛时,生成域适应迁移学习后得到的目标互动意图预测网络。该目标互动意图预测网络对各种属性标签的样本互动文本中的文本分句进行互动意图预测,即目标互动意图预测网络可以对不同域中的互动文本进行AI预测。
一种可能的实施方式中,弱监督样本互动文本数据中的第二属性标签的样本互动文本也可以未携带对应的互动意图标注数据,即可以进行无监督的训练,生成目标互动意图预测网络。
基于以上步骤,通过监督样本互动文本数据和弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练,以便于训练生成的第一待定互动意图预测网络对加载互动文本数据解析的描述向量包括不同监督型样本对应的当前共享描述向量,然后依据第二属性标签的样本互动文本、部分互动文本分句对应的互动意图标注数据和估计互动意图数据对第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,将第二待定互动意图预测网络作为基础互动意图预测网络不断循环迭代,生成目标互动意图预测网络,由于通过对立强化训练以便于训练生成的第一待定互动意图预测网络对加载互动文本数据解析的描述向量包括不同监督型样本对应的当前共享描述向量,然后在使用第一待定互动意图预测网络通过迁移学习得到第二待定互动意图预测网络,依据第二待定互动意图预测网络得到目标互动意图预测网络,从而使得目标互动意图预测网络也能对加载互动文本数据提取不同监督型样本对应的共享描述向量,从而使得目标互动意图预测网络提高了对不同域互动意图预测的精准度。
一种可能的实施方式中,步骤S106,即依据监督样本互动文本数据和弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练,以便于训练生成的第一待定互动意图预测网络对加载互动文本数据解析的描述向量包括不同监督型样本对应的当前共享描述向量,包括:
步骤S202,将第一属性标签的样本互动文本和第二属性标签的样本互动文本输入基础互动意图预测网络中,基础互动意图预测网络使用第一属性标签的样本互动文本和第二属性标签的样本互动文本分别提取语义描述向量,依据语义描述向量进行文本知识点鉴别和互动意图预测,生成文本知识点鉴别数据和互动意图预测数据。
其中,文本知识点鉴别数据表征互动文本是来自于监督样本互动文本数据中互动文本还是来自于弱监督样本互动文本数据中的互动文本,包括第一属性标签的样本互动文本对应的鉴别结果和第二属性标签的样本互动文本对应的鉴别结果。该互动意图预测数据包括第一属性标签的样本互动文本对应的AI预测数据和第二属性标签的样本互动文本对应的AI预测数据。
一种可能的实施方式中,可以分别将将第一属性标签的样本互动文本和第二属性标签的样本互动文本输入基础互动意图预测网络中,基础互动意图预测网络使用第一属性标签的样本互动文本和第二属性标签的样本互动文本分别提取语义描述向量,生成第一属性标签的样本互动文本对应的特征和第二属性标签的样本互动文本对应的特征,然后分别对第一属性标签的样本互动文本对应的特征和第二属性标签的样本互动文本对应的特征进行知识点鉴别和互动意图预测,生成第一属性标签的样本互动文本对应的AI预测数据和鉴别结果以及得到第二属性标签的样本互动文本对应的AI预测数据和鉴别结果。
步骤S204,依据文本知识点鉴别数据、互动意图预测数据、第一属性标签的样本互动文本的各个互动文本分句对应的互动意图标注数据和第二属性标签的样本互动文本的部分互动文本分句对应的互动意图标注数据对基础互动意图预测网络进行网络权重参数优化,生成优化后的基础互动意图预测网络,依据优化后的基础互动意图预测网络得到第一待定互动意图预测网络。
一种可能的实施方式中,可以基于第一属性标签的样本互动文本对应的AI预测数据和第一属性标签的样本互动文本的各个互动文本分句对应的互动意图标注数据来计算第一属性标签的样本互动文本对应的训练代价值,同时基于第二属性标签的样本互动文本对应的AI预测数据和第二属性标签的样本互动文本的部分互动文本分句对应的互动意图标注数据来计算第二属性标签的样本互动文本对应的训练代价值。然后基于第一属性标签的样本互动文本对应的鉴别结果和第一属性标签的样本互动文本为监督样本互动文本数据来计算第一属性标签的样本互动文本对应的鉴别结果训练代价值,同时基于第二属性标签的样本互动文本对应的鉴别结果和第二属性标签的样本互动文本为弱监督样本互动文本数据来计算第二属性标签的样本互动文本对应的鉴别结果训练代价值,然后使用第一属性标签的样本互动文本对应的训练代价值和鉴别结果训练代价值以及第二属性标签的样本互动文本对应的训练代价值和鉴别结果训练代价值来更新基础互动意图预测网络中的网络权重信息,当网络权重参数优化完成时,生成优化后的基础互动意图预测网络。然后可以将优化后的基础互动意图预测网络作为第一待定互动意图预测网络。
由此,通过将第一属性标签的样本互动文本和第二属性标签的样本互动文本输入基础互动意图预测网络中,生成输出的文本知识点鉴别数据和互动意图预测数据,然后基于文本知识点鉴别数据和互动意图预测数据来更新基础互动意图预测网络,从而得到第一待定互动意图预测网络,能够使通过对立强化训练到的第一待定互动意图预测网络能够提取出不同监督型样本的当前共享描述向量。
一种可能的实施方式中,基础互动意图预测网络包括基础语义编码单元、第一基础训练鉴别单元和基础预测单元;
步骤S202,即将第一属性标签的样本互动文本和第二属性标签的样本互动文本输入基础互动意图预测网络中,基础互动意图预测网络使用第一属性标签的样本互动文本和第二属性标签的样本互动文本分别提取语义描述向量,依据语义描述向量进行文本知识点鉴别和互动意图预测,生成文本知识点鉴别数据和互动意图预测数据,包括:
步骤S302,将第一属性标签的样本互动文本和第二属性标签的样本互动文本输入基础语义编码单元中进行语义编码,生成基础第一属性标签语义描述向量和基础第二属性标签语义描述向量。
其中,基础语义编码单元是指初始化权重参数的语义编码单元,该基础语义编码单元是对立强化训练中的生成网络,用于提取到加载互动文本数据的特征。网络收敛的语义编码单元能够解析的描述向量包括不同监督型样本的共享描述向量。基础第一属性标签语义描述向量是指基础语义编码单元提取到的第一属性标签的样本互动文本对应的特征。基础第二属性标签语义描述向量是指基础语义编码单元提取到的第二属性标签的样本互动文本对应的特征。
基础语义编码单元可以是依据残差网络得到的。可以将残差网络的初始化网络权重参数得到基础语义编码单元。然后分别将第一属性标签的样本互动文本和第二属性标签的样本互动文本输入基础语义编码单元中进行语义编码,生成基础第一属性标签语义描述向量和基础第二属性标签语义描述向量。
步骤S304,将基础第一属性标签语义描述向量和基础第二属性标签语义描述向量输入第一基础训练鉴别单元中进行文本知识点鉴别,生成基础第一属性标签鉴别信息和基础第二属性标签鉴别信息。
其中,第一基础训练鉴别单元是指初始化网络权重参数的训练鉴别单元,该基础训练鉴别单元是对立强化训练中的鉴别网络,用于判断输入特征的来自的域,即是监督样本互动文本数据还是弱监督样本互动文本数据。通过对基础语义编码单元和第一基础训练鉴别单元不断进行对立强化训练,即基础语义编码单元的训练目标是第一基础训练鉴别单元无法判断生成的特征是来自于监督样本互动文本数据或者弱监督样本互动文本数据,从而使得网络收敛的语义编码单元能够解析的描述向量包括不同监督型样本的共享描述向量。基础第一属性标签鉴别信息是指使用第一基础训练鉴别单元对基础第一属性标签语义描述向量进行鉴别的结果,基础第二属性标签鉴别信息是指使用第一基础训练鉴别单元对基础第二属性标签语义描述向量进行鉴别的结果。
第一基础训练鉴别单元可以是依据卷积网络得到。可以将三层卷积网络的初始化网络权重参数得到第一基础训练鉴别单元。然后将基础第一属性标签语义描述向量和基础第二属性标签语义描述向量输入第一基础训练鉴别单元中进行文本知识点鉴别,生成基础第一属性标签鉴别信息和基础第二属性标签鉴别信息。
步骤S306,将基础第一属性标签语义描述向量和基础第二属性标签语义描述向量输入基础预测单元中,生成基础第一属性标签的样本互动文本AI预测数据和基础第二属性标签的样本互动文本AI预测数据。
其中,基础预测单元是指初始化网络权重参数的互动意图预测网络。互动意图预测网络用于对互动文本中的分句进行AI预测。基础第一属性标签的样本互动文本AI预测数据是指使用基础预测单元对第一属性标签的样本互动文本进行AI预测的AI预测数据,基础第二属性标签鉴别信息是指使用基础预测单元对第二属性标签的样本互动文本进行AI预测的AI预测数据。
分别将基础第一属性标签语义描述向量和基础第二属性标签语义描述向量输入基础预测单元中,生成基础第一属性标签的样本互动文本AI预测数据和基础第二属性标签的样本互动文本AI预测数据。
步骤S204,即依据文本知识点鉴别数据、互动意图预测数据、第一属性标签的样本互动文本的各个互动文本分句对应的互动意图标注数据和第二属性标签的样本互动文本的部分互动文本分句对应的互动意图标注数据对基础互动意图预测网络进行网络权重参数优化,生成优化后的基础互动意图预测网络,依据优化后的基础互动意图预测网络得到第一待定互动意图预测网络,包括:
步骤S308,依据基础第一属性标签的样本互动文本AI预测数据和各个互动文本分句对应的互动意图标注数据计算基础第一属性标签训练代价值,依据基础第二属性标签的样本互动文本AI预测数据和部分互动文本分句对应的互动意图标注数据计算基础第二属性标签训练代价值。
其中,基础第一属性标签训练代价值是指使用基础互动意图预测网络进行有监督网络学习时得到的第一属性标签的样本互动文本对应的训练代价值。基础第二属性标签训练代价值是指使用基础互动意图预测网络进行弱监督网络学习时得到的第二属性标签的样本互动文本对应的训练代价值。
步骤S310,依据基础第一属性标签训练代价值和基础第二属性标签训练代价值反向更新基础语义编码单元和基础预测单元。
步骤S312,依据基础第一属性标签鉴别信息和监督样本互动文本数据对应的监督源计算第一监督源训练代价值,并依据基础第二属性标签鉴别信息和弱监督样本互动文本数据对应的弱监督源计算第二监督源训练代价值。
其中,监督源是指第一属性标签的样本互动文本是监督样本互动文本数据中的互动文本,弱监督源是指第二属性标签的样本互动文本是弱监督样本互动文本数据中的互动文本。第一监督源训练代价值是指第一属性标签的样本互动文本对应的鉴别数据代价,第二监督源训练代价值是指第二属性标签的样本互动文本对应的鉴别数据代价。
一种可能的实施方式中,可以使用基础第一属性标签鉴别信息和监督样本互动文本数据对应的监督源计算来源损失函数值,生成第一监督源训练代价值,并使用基础第二属性标签鉴别信息和弱监督样本互动文本数据对应的弱监督源计算来源损失函数值,生成第二监督源训练代价值。
步骤S314,使用第一监督源训练代价值和第二监督源训练代价值更新基础语义编码单元和第一基础训练鉴别单元,生成优化后的基础互动意图预测网络,依据优化后的基础互动意图预测网络得到第一待定互动意图预测网络,优化后的基础互动意图预测网络中优化后的基础语义编码单元对加载互动文本数据解析的描述向量包括不同监督型样本对应的当前共享描述向量。
一种可能的实施方式中,可以使用第一监督源训练代价值和第二监督源训练代价值使用梯度下降法反向更新基础语义编码单元和第一基础训练鉴别单元,生成优化后的基础语义编码单元、优化后的第一基础训练鉴别单元和优化后的基础预测单元,依据优化后的基础语义编码单元、优化后的第一基础训练鉴别单元和优化后的基础预测单元得到优化后的基础互动意图预测网络,然后将优化后的基础互动意图预测网络作为第一待定互动意图预测网络。一种可能的实施方式中,可以基于优化后的基础语义编码单元和优化后的基础预测单元得到第一待定互动意图预测网络,然后服务器可以依据该第一待定互动意图预测网络和第二基础训练鉴别单元来建立初始化的第二待定互动意图预测网络。
一种可能的实施方式中,基础预测单元包括基础分词单元和基础全连接输出单元;
步骤S306,将基础第一属性标签语义描述向量和基础第二属性标签语义描述向量输入基础预测单元中,生成基础第一属性标签的样本互动文本AI预测数据和基础第二属性标签的样本互动文本AI预测数据,包括:
步骤S402,将基础第一属性标签语义描述向量分别输入基础分词单元和基础全连接输出单元中,生成基础第一属性标签分词向量和基础第一属性标签预测数据。
其中,基础分词单元是指初始化网络权重参数的分词单元,分词单元用于对第一属性标签的样本互动文本中的分句进行分词。基础全连接输出单元是指初始化网络权重参数的全连接输出单元,全连接输出单元用于对第一属性标签的样本互动文本中的分句进行预测。基础第一属性标签分词向量是指通过基础分词单元对第一属性标签的样本互动文本中分句进行分词生成对应结果,基础第一属性标签预测数据是指通过基础全连接输出单元对第一属性标签的样本互动文本中分句进行预测生成的数据。
步骤S404,将基础第二属性标签语义描述向量分别输入基础分词单元和基础全连接输出单元中,生成基础第二属性标签分词向量和基础第二属性标签预测数据。
其中,基础第二属性标签分词向量是指通过基础分词单元对第二属性标签的样本互动文本中分句进行分词生成对应结果,基础第二属性标签预测数据是指通过基础全连接输出单元对第二属性标签的样本互动文本中分句进行预测生成的数据。
一种可能的实施方式中,可以同时将基础第二属性标签语义描述向量分别输入基础分词单元和基础全连接输出单元中,生成基础第二属性标签分词向量和基础第二属性标签预测数据。
步骤S306,依据基础第一属性标签的样本互动文本AI预测数据和各个互动文本分句对应的互动意图标注数据计算基础第一属性标签训练代价值,依据基础第二属性标签的样本互动文本AI预测数据和部分互动文本分句对应的互动意图标注数据计算基础第二属性标签训练代价值,包括:
步骤S406,依据基础第一属性标签分词向量和第一属性标签的样本互动文本各个互动文本分句的互动意图标注数据中的分词向量标注数据计算基础第一属性标签分词训练代价值,并依据基础第一属性标签预测数据和第一属性标签的样本互动文本各个互动文本分句的互动意图标注数据中的互动意图标注类型计算基础第一属性标签预测训练代价值,依据基础第一属性标签分词训练代价值和基础第一属性标签预测训练代价值得到基础第一属性标签训练代价值。
步骤S408,依据基础第二属性标签分词向量和第二属性标签的样本互动文本部分互动文本分句的互动意图标注数据中的分词向量标注数据计算基础第二属性标签分词训练代价值,并依据基础第二属性标签预测数据和第二属性标签的样本互动文本部分互动文本分句的互动意图标注数据中的互动意图标注类型计算基础第二属性标签预测训练代价值,依据基础第二属性标签分词训练代价值和基础第二属性标签预测训练代价值得到基础第二属性标签训练代价值。
其中,基础第二属性标签分词训练代价值表征基础第二属性标签分词向量与第二属性标签的样本互动文本的分词向量标注数据之间的损失函数值,即部分互动文本分句对应的分词向量信息和分词向量标注数据之间的损失函数值。基础第二属性标签预测训练代价值表征基础第二属性标签预测数据与第二属性标签的样本互动文本的互动意图标注数据之间的损失函数值,即部分互动文本分句对应的预测数据和互动意图标注数据之间的损失函数值。
一种可能的实施方式中,可以计算第二属性标签的样本互动文本对应的基础第二属性标签训练代价值,由于第二属性标签的样本互动文本中只有部分互动文本分句携带对应的互动意图标注数据。因此,在计算训练代价值时,使用存在的分词向量标注数据的互动文本分句的分词向量信息和对应的分词向量标注数据计算分词损失函数值,并使用存在的互动意图标注数据的互动文本分句的预测数据和对应的互动意图标注数据计算预测损失函数值,然后计算分词损失函数值和预测损失函数值的和,生成基础第二属性标签训练代价值。
一种可能的实施方式中,步骤S110,依据第二属性标签的样本互动文本、部分互动文本分句对应的互动意图标注数据和估计互动意图数据对第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,包括:
步骤S502,依据部分互动文本分句对应的互动意图标注数据和估计互动意图数据对弱监督样本互动文本数据中的第二属性标签的样本互动文本进行划分,生成第一类型互动文本和第二类型互动文本。
步骤S504,依据部分互动文本分句对应的互动意图标注数据对估计互动意图数据中相同互动文本分句对应的估计互动意图数据进行调整,生成相同互动文本分句对应的调整标注数据,依据估计互动意图数据和相同互动文本分句对应的调整标注数据得到第二属性标签的样本互动文本中各个互动文本分句对应的最新标注数据。
一种可能的实施方式中,可以使用第二属性标签的样本互动文本中部分互动文本分句对应的互动意图标注数据对第二属性标签的样本互动文本中相同互动文本分句的估计互动意图数据进行调整,生成部分互动文本分句对应的调整标注数据,然后基于部分互动文本分句对应的调整标注数据和其他未调整互动文本分句对应的估计互动意图数据得到第二属性标签的样本互动文本中各个互动文本分句对应的最新标注数据。即最新标注数据中一部分标签是估计互动意图数据,一部分标签是调整标注数据。
步骤S506,依据第一类型互动文本和对应的最新标注数据与第二类型互动文本和对应的部分互动文本分句的互动意图标注数据对第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络。
一种可能的实施方式中,可以将第一类型互动文本作为第一待定互动意图预测网络的输入,将第一类型互动文本对应的最新标注数据作为对应的输出标签,将第二类型互动文本作为第一待定互动意图预测网络的输入,将第二类型互动文本对应的部分互动文本分句的互动意图标注数据作为对应的输出标签进行对立强化训练,生成第二待定互动意图预测网络。
通过将第二属性标签的样本互动文本进行划分,生成第一类型互动文本和第二类型互动文本,然后使用第一类型互动文本和第二类型互动文本对第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,从而使得第二待定互动意图预测网络能够减少第一类型互动文本对应的特征与第二类型互动文本对应的特征之间的差异,即可以得到第一类型互动文本和第二类型互动文本之间的共享描述向量,进而使得到的目标互动意图预测网络能够提高对互动意图预测的精准度。
一种可能的实施方式中,依据第一类型互动文本和对应的最新标注数据与第二类型互动文本和对应的部分互动文本分句的互动意图标注数据对第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,包括:
步骤S602,将第一类型互动文本和第二类型互动文本输入第一待定互动意图预测网络中,第一待定互动意图预测网络对第一类型互动文本和第二类型互动文本进行语义编码,生成第一类型语义描述向量和第二类型语义描述向量,依据第一类型语义描述向量和第二类型互动文本进行迁移文本知识点鉴别和迁移互动意图预测,生成迁移文本知识点鉴别数据和迁移互动意图预测数据。
其中,第一类型语义描述向量是指提取到的第一类型第二属性标签的样本互动文本的特征。第二类型语义描述向量是指提取到第二类型第二属性标签的样本互动文本的特征。迁移文本知识点鉴别数据表征互动文本是第一类型互动文本还是第二类型互动文本,包括对第一类型互动文本的鉴别结果和对第二类型互动文本的鉴别结果。迁移互动意图预测数据是指对第二属性标签的样本互动文本中分句的AI预测数据,包括第二类型互动文本的AI预测数据和第一类型互动文本的AI预测数据。基于识别任务的不同,AI预测数据也会不同。比如,对第二属性标签的样本互动文本中分句的类型进行AI预测,AI预测数据为分句的类别,或者对第二属性标签的样本互动文本中分句进行分词识别,AI预测数据为分句的分词区域。
一种可能的实施方式中,可以将第一待定互动意图预测网络的模型参数共享到第二待定互动意图预测网络中,生成初始化的第二待定互动意图预测网络,即可以将第一待定互动意图预测网络作为初始化的第二待定互动意图预测网络,然后将第一类型互动文本和第二类型互动文本输入初始化的第二待定互动意图预测网络中,初始化的第二待定互动意图预测网络对第一类型互动文本和第二类型互动文本进行语义编码,生成第一类型语义描述向量和第二类型语义描述向量,依据第一类型语义描述向量和第二类型互动文本进行迁移文本知识点鉴别和迁移互动意图预测,生成迁移文本知识点鉴别数据和迁移互动意图预测数据。
步骤S604,依据迁移文本知识点鉴别数据、迁移互动意图预测数据、第一类型互动文本对应的最新标注数据和第二类型互动文本对应的部分互动文本分句的互动意图标注数据对第一待定互动意图预测网络进行网络权重参数优化,生成优化后的第一待定互动意图预测网络,依据优化后的第一待定互动意图预测网络得到第二待定互动意图预测网络,第二待定互动意图预测网络对加载互动文本数据解析的描述向量包括同类型差异互动文本对应的当前共享描述向量。
一种可能的实施方式中,可以基于迁移文本知识点鉴别数据、迁移互动意图预测数据、第一类型互动文本对应的最新标注数据和第二类型互动文本对应的部分互动文本分句的互动意图标注数据计算模型训练代价值,基于模型训练代价值使用梯度下降算法更新初始化的第二待定互动意图预测网络中的参数,生成第二待定互动意图预测网络。
由此,通过使用第一类型互动文本和第二类型互动文本对初始化的第二待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,从而能够使得到的第二待定互动意图预测网络能够对加载互动文本数据解析的描述向量包括同一类型中具有差异的互动文本对应的共享描述向量,然后使用该共享描述向量进行互动意图预测,减少了第二类型互动文本和第一类型互动文本之间的差异,进而提高互动意图预测网络识别的精准度。
一种可能的实施方式中,第一待定互动意图预测网络包括第一语义编码单元、第二基础训练鉴别单元和第一互动意图预测单元;
步骤S702,将第一类型互动文本和第二类型互动文本输入第一待定互动意图预测网络中,第一待定互动意图预测网络对第一类型互动文本和第二类型互动文本进行语义编码,生成第一类型语义描述向量和第二类型语义描述向量,依据第一类型语义描述向量和第二类型互动文本进行迁移文本知识点鉴别和迁移互动意图预测,生成迁移文本知识点鉴别数据和迁移互动意图预测数据,包括:
步骤S702,将第一类型互动文本和第二类型互动文本输入第一语义编码单元中进行语义编码,生成第一类型语义描述向量和第二类型语义描述向量。
其中,第一语义编码单元是指基础互动意图预测网络中网络权重参数优化的基础语义编码单元。即第一语义编码单元中的网络参数与更新的基础语义编码单元的架构和网络参数相同。第一类型语义描述向量是指使用第一语义编码单元提取到的第一类型互动文本对应的特征。第二类型语义描述向量是指使用第一语义编码单元提取到的第二类型互动文本对应的特征。
一种可能的实施方式中,可以使用第一待定互动意图预测网络建立初始化的第二待定互动意图预测网络,即将第一待定互动意图预测网络中的第一语义编码单元作为初始化的第二待定互动意图预测网络中的语义编码单元。然后对初始化的第二待定互动意图预测网络进行网络学习时,可以先将第一类型互动文本和第二类型互动文本输入第一语义编码单元中进行语义编码,生成第一类型语义描述向量和第二类型语义描述向量。
步骤S704,将第一类型语义描述向量和第二类型语义描述向量加载至第二基础训练鉴别单元中进行知识点鉴别,生成第一类型文本知识点鉴别数据和第二类型文本知识点鉴别数据。
第二基础训练鉴别单元是指初始化网络权重参数的训练鉴别单元,即初始化的第二待定互动意图预测网络中训练鉴别单元是初始化网络权重参数的训练鉴别单元,该第二基础训练鉴别单元的架构可以与第一基础训练鉴别单元的架构相同,但是不会共享更新的第一基础训练鉴别单元的网络参数。第一类型文本知识点鉴别数据是指使用第二基础训练鉴别单元对第一类型互动文本进行知识点鉴别生成的数据,第二类型文本知识点鉴别数据是指使用第二基础训练鉴别单元对第二类型互动文本进行知识点鉴别生成的数据。然后将第一类型语义描述向量和第二类型语义描述向量加载至初始化的第二待定互动意图预测网络中的第二基础训练鉴别单元中进行知识点鉴别,生成鉴别结果。
步骤S706,将第一类型语义描述向量和第二类型语义描述向量加载至第一互动意图预测单元中进行互动意图预测,生成第一类型互动意图预测数据和第二类型互动意图预测数据。
其中,第一互动意图预测单元是指基础互动意图预测网络中网络权重参数优化的互动意图预测单元。第一类型互动意图预测数据是指使用第一互动意图预测单元识别第一类型互动文本生成的数据,第二类型互动意图预测数据是指使用第一互动意图预测单元识别第二类型互动文本生成的数据。
一种可能的实施方式中,可以将第一互动意图预测单元作为建立的初始化的第二待定互动意图预测网络中互动意图预测单元。然后使用第一互动意图预测单元对第一类型语义描述向量和第二类型语义描述向量进行互动意图预测,生成第一类型互动意图预测数据和第二类型互动意图预测数据。
步骤S604,依据迁移文本知识点鉴别数据、迁移互动意图预测数据、第一类型互动文本对应的最新标注数据和第二类型互动文本对应的部分互动文本分句的互动意图标注数据对第一待定互动意图预测网络进行网络权重参数优化,生成优化后的第一待定互动意图预测网络,依据优化后的第一待定互动意图预测网络得到第二待定互动意图预测网络,包括:
步骤S708,依据第一类型互动意图预测数据和第一类型互动文本对应的最新标注数据计算第一类型互动文本训练代价值,并依据第二类型互动意图预测数据和第二类型互动文本对应的部分互动文本分句的互动意图标注数据计算第二类型互动文本训练代价值。
其中,第一类型互动文本训练代价值表征第一类型互动意图预测数据和第一类型互动文本对应的最新标注数据之间的损失函数值。第二类型互动文本训练代价值表征第二类型互动意图预测数据中部分互动文本分句对应的AI预测数据和和第二类型互动文本对应的部分互动文本分句的互动意图标注数据之前的损失函数值。
步骤S800,依据第一类型互动文本训练代价值和第二类型互动文本训练代价值更新第一语义编码单元和第一互动意图预测单元。
步骤S802,依据第一类型文本知识点鉴别数据和第一类型互动文本对应的第一类型来源计算第一类型监督源训练代价值,并依据第二类型文本知识点鉴别数据和第二类型互动文本对应的第二类型来源计算第二类型监督源训练代价值。
其中,第一类型来源是指互动文本是来自于弱监督样本互动文本数据中的第一类型互动文本。第一类型监督源训练代价值表征第一类型文本知识点鉴别数据和第一类型来源之间的损失函数值。第二类型来源是指互动文本是来自于弱监督样本互动文本数据中的第二类型互动文本。第二类型监督源训练代价值表征第二类型文本知识点鉴别数据和第二类型来源之间的损失函数值。
步骤S804,依据第一类型监督源训练代价值和第二类型监督源训练代价值更新第一语义编码单元和第二基础训练鉴别单元,生成优化后的第一待定互动意图预测网络,依据优化后的第一待定互动意图预测网络得到第二待定互动意图预测网络,优化后的第一待定互动意图预测网络中优化后的第一语义编码单元对加载互动文本数据解析的描述向量包括同类型差异互动文本对应的当前共享描述向量。
一种可能的实施方式中,可以使用第一类型监督源训练代价值和第二类型监督源训练代价值更新第一语义编码单元和第二基础训练鉴别单元中的网络参数,生成优化后的第一语义编码单元和优化后的第二基础训练鉴别单元,依据优化后的第一语义编码单元、优化后的第二基础训练鉴别单元和优化后的第一待定互动意图预测网络得到第二待定互动意图预测网络。一种可能的实施方式中,也可以基于优化后的第一语义编码单元和优化后的第一待定互动意图预测网络得到第二待定互动意图预测网络,然后服务器可以将该第二待定互动意图预测网络和优化后的第一基础训练鉴别单元作为基础互动意图预测网络继续进行循环遍历优化。
一种可能的实施方式中,第一互动意图预测单元包括第一分词单元和第一全连接输出单元;
步骤S706,将第一类型语义描述向量和第二类型语义描述向量加载至第一互动意图预测单元中进行互动意图预测,生成第一类型互动意图预测数据和第二类型互动意图预测数据,包括:
步骤S902,将第一类型语义描述向量分别输入第一分词单元和第一全连接输出单元中,生成第一类型互动文本分词向量信息和第一类型互动文本预测数据。
步骤S904,将第二类型语义描述向量分别输入第一分词单元和第一全连接输出单元中,生成第二类型互动文本分词向量信息和第二类型互动文本预测数据。
其中,第一分词单元是指第一互动意图预测单元中对互动文本中的分句进行分词的单元,第一全连接输出单元是指第一互动意图预测单元中对互动文本中的分句进行预测的单元络,第一分词单元是网络权重参数优化的基础分词单元,第二全连接输出单元是网络权重参数优化的基础全连接输出单元。第一类型互动文本分词向量信息是指对第一类型互动文本中的分句进行分词生成的数据,第一类型互动文本预测数据是指对第一类型互动文本中的分句进行预测生成的数据。第二类型互动文本分词向量信息是指对第二类型互动文本中的分句进行分词生成的数据,第二类型互动文本预测数据是指对第二类型互动文本中的分句进行预测生成的数据。
具体地,第一互动意图预测单元包括第一分词单元和第一全连接输出单元,使用第一分词单元和第一全连接输出单元对第一类型语义描述向量和第二类型语义描述向量进行处理,生成输出的第一类型互动文本对应的分词向量信息和预测数据以及第二类型互动文本对应的分词向量信息和预测数据。
步骤S708,依据第一类型互动意图预测数据和第一类型互动文本对应的最新标注数据计算第一类型互动文本训练代价值,并依据第二类型互动意图预测数据和第二类型互动文本对应的部分互动文本分句的互动意图标注数据计算第二类型互动文本训练代价值,包括:
步骤S906,依据第一类型互动文本分词向量信息和第一类型互动文本对应的最新标注数据中的分词向量标注数据计算第一类型分词训练代价值,并依据第一类型互动文本预测数据和第一类型互动文本对应的最新标注数据中的互动意图标注类型计算第一类型互动文本预测训练代价值,依据第一类型互动文本分词训练代价值和第一类型互动文本预测训练代价值得到第一类型互动文本训练代价值。
步骤S908,依据第二类型互动文本分词向量信息和第二类型互动文本对应的部分互动文本分句的互动意图标注数据中的分词向量标注数据计算第二类型互动文本分词训练代价值,并依据第二类型互动文本预测数据和第二类型互动文本对应的部分互动文本分句的互动意图标注数据中的互动意图标注类型计算第二类型互动文本预测训练代价值,依据第二类型互动文本分词训练代价值和第二类型互动文本预测训练代价值得到第二类型互动文本训练代价值。
通过对第二类型互动文本进行弱监督预测和分词训练,并对第一类型互动文本进行有监督预测和分词训练,能够提高互动意图预测网络的预测和分词的精准度。
一种可能的实施方式中,可以获取到目标第一待定互动意图预测网络,使用目标第一待定互动意图预测网络对第二属性标签的样本互动文本进行AI预测,生成第二属性标签的样本互动文本中的各个互动文本分句对应的AI预测数据,将各个互动文本分句对应的AI预测数据作为互动意图预测数据,然后使用第二属性标签的样本互动文本对应的互动意图标注数据调整互动意图预测数据,生成第二属性标签的样本互动文本对应的最新标注数据。然后将第二属性标签的样本互动文本划分为第一类型互动文本和第二类型互动文本。此时,基于目标第一待定互动意图预测网络中的目标第一语义编码单元、目标第一互动意图预测单元以及初始化网络权重参数的训练鉴别单元来建立初始化的第二待定互动意图预测网络。
图2示出了本申请实施例提供的用于实现上述的针对网络安全平台的交互数据处理方法的云服务系统100的硬件结构意图,如图2所示,云服务系统100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。
一种可能的设计中,云服务系统100可以是单个服务器,也可以是服务器组。所述服务器组可以是集中式的,也可以是分布式的(例如,云服务系统100可以是分布式的系统)。在一些实施例中,云服务系统100可以是本地的,也可以是远程的。例如,云服务系统100可以经由网络访问存储于机器可读存储介质120中的信息和/或数据。又例如,云服务系统100可以直接连接到机器可读存储介质120以访问存储的信息和/或数据。在一些实施例中,云服务系统100可以在云服务系统上实施。仅作为示例,该云服务系统可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。
机器可读存储介质120可以存储数据和/或指令。在一些实施例中,机器可读存储介质120可以存储从外部终端获取的数据。在一些实施例中,机器可读存储介质120可以存储云服务系统100用来执行或使用来完成本申请中描述的示例性方法的数据及/或指令。在一些实施例中,机器可读存储介质120可包括大容量存储器、可移动存储器、易失性读写存储器、只读存储器(ROM)等或其任意组合。示例性的大容量存储器可以包括磁盘、光盘、固态磁盘等。示例性可移动存储器可以包括闪存驱动器、软盘、光盘、存储卡、压缩盘、磁带等。示例性易失性读写存储器可以包括随机存取内存(RAM)。示例性RAM可包括主动随机存取存储器(DRAM)、双倍数据速率同步主动随机存取存储器(DDR SDRAM)、被动随机存取存储器(SRAM)、晶闸管随机存取存储器(T-RAM)和零电容随机存取存储器(Z-RAM)等。示例性只读存储器可以包括掩模型只读存储器(MROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(PEROM)、电可擦除可编程只读存储器(EEPROM)、光盘只读存储器(CD-ROM)和数字多功能磁盘只读存储器等。在一些实施例中,机器可读存储介质120可以在云服务系统上实现。仅作为示例,云服务系统可以包括私有云、公共云、混合云、社区云、分布云、内部云,多层云等,或其任意组合。
在具体实现过程中,至少一个处理器110执行机器可读存储介质120存储的计算机可执行指令,使得处理器110可以执行如上方法实施例的针对网络安全平台的交互数据处理方法,处理器110、机器可读存储介质120以及通信单元140通过总线130连接,处理器110可以用于控制通信单元140的收发动作。
处理器110的具体实现过程可参见上述云服务系统100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
此外,本申请实施例还提供一种可读存储介质,所述可读存储介质中预设有计算机可执行指令,当处理器执行所述计算机可执行指令时,实现如上针对网络安全平台的交互数据处理方法。
应当理解的是,以上描述仅出于说明的目的,并不旨在限制本申请的范围。对于本领域的普通技术人员来说,可以根据本申请的描述,做出多种修改和变化。然而,这些修改和变化不会背离本申请的范围。
上文已对基本概念做了描述,显然,对于阅读此申请后的本领域的普通技术人员来说,上述发明公开仅作为示例,并不构成对本申请的限制。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。例如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特性。因此,应当强调并注意的是,本说明书中在不同位置两次或以上提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定系指同一实施例。此外,本申请的一个或以上实施例中的某些特征、结构或特性可以进行适当的组合。
此外,本领域的普通技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的过程、机器、产品或物质的组合,或对其任何新的和有用的改良。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括韧体、常驻软件、微代码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“单元”、“模块”或“系统”。此外,本申请公开的各方面可以采取体现在一个或以上计算机可读介质中的计算机程序产品的形式,其中计算机可读程序代码包含在其中。
计算机可读信号介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。此类传播信号可以有多种形式,包括电磁形式、光形式等或任何合适的组合形式。计算机可读信号介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质等或其任意组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或以上程序语言编写,包括面向持续活动编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,主动编程语言如Python、Ruby和Groovy,或其它编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其它名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或以上发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或以上发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。
Claims (9)
1.一种针对网络安全平台的交互数据处理方法,应用于云服务系统,所述云服务系统与网络安全平台通信连接,其特征在于,所述方法包括:
获取所述网络安全平台的目标互动文本,将所述目标互动文本加载至目标互动意图预测网络中进行AI预测,生成所述目标互动文本对应的目标互动意图数据;所述目标互动意图预测网络是依据监督样本互动文本数据和弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练,生成第一待定互动意图预测网络,使用第一待定互动意图预测网络对弱监督样本互动文本数据进行互动意图预测,生成互动意图预测数据,基于互动意图预测数据和弱监督样本互动文本数据对所述第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,将所述第二待定互动意图预测网络作为基础互动意图预测网络进行循环遍历优化,依据网络收敛的第二待定互动意图预测网络得到的;
基于所述目标互动意图数据向所述目标互动文本关联的互动页面推送对应的知识点内容;
所述目标互动意图预测网络的训练步骤,包括:
获取监督样本互动文本数据,所述监督样本互动文本数据包括第一属性标签的样本互动文本,所述第一属性标签的样本互动文本的各个互动文本分句携带对应的互动意图标注数据;
获取弱监督样本互动文本数据,所述弱监督样本互动文本数据包括第二属性标签的样本互动文本,所述第二属性标签的样本互动文本的部分互动文本分句携带对应的互动意图标注数据;
依据所述监督样本互动文本数据和所述弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练,以便于训练生成的第一待定互动意图预测网络对加载互动文本数据解析的描述向量包括不同监督型样本对应的当前共享描述向量;
依据所述第一待定互动意图预测网络对所述第二属性标签的样本互动文本进行AI预测,生成所述第二属性标签的样本互动文本中各个互动文本分句对应的AI预测数据,将所述各个互动文本分句对应的AI预测数据作为所述第二属性标签的样本互动文本中各个互动文本分句对应的估计互动意图数据;
依据所述第二属性标签的样本互动文本、所述部分互动文本分句对应的互动意图标注数据和所述估计互动意图数据对所述第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络;
将所述第二待定互动意图预测网络作为基础互动意图预测网络,并返回所述依据所述监督样本互动文本数据和所述弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练的步骤迭代执行,直到网络收敛时,依据网络收敛的第二待定互动意图预测网络得到目标互动意图预测网络,所述目标互动意图预测网络用于对各种属性标签的样本互动文本中的文本分句进行互动意图预测。
2.根据权利要求1所述的针对网络安全平台的交互数据处理方法,其特征在于,所述依据所述监督样本互动文本数据和所述弱监督样本互动文本数据对基础互动意图预测网络进行对立强化训练,以便于训练生成的第一待定互动意图预测网络对加载互动文本数据解析的描述向量包括不同监督型样本对应的当前共享描述向量,包括:
将所述第一属性标签的样本互动文本和所述第二属性标签的样本互动文本输入基础互动意图预测网络中,所述基础互动意图预测网络基于所述第一属性标签的样本互动文本和所述第二属性标签的样本互动文本分别提取语义描述向量,依据所述语义描述向量进行文本知识点鉴别和互动意图预测,生成文本知识点鉴别数据和互动意图预测数据;
依据所述文本知识点鉴别数据、互动意图预测数据、所述第一属性标签的样本互动文本的各个互动文本分句对应的互动意图标注数据和所述第二属性标签的样本互动文本的部分互动文本分句对应的互动意图标注数据对所述基础互动意图预测网络进行网络权重参数优化,生成优化后的基础互动意图预测网络,依据优化后的基础互动意图预测网络得到第一待定互动意图预测网络。
3.根据权利要求2所述的针对网络安全平台的交互数据处理方法,其特征在于,所述基础互动意图预测网络包括基础语义编码单元、第一基础训练鉴别单元和基础预测单元;
所述将所述第一属性标签的样本互动文本和所述第二属性标签的样本互动文本输入基础互动意图预测网络中,所述基础互动意图预测网络基于所述第一属性标签的样本互动文本和所述第二属性标签的样本互动文本分别提取语义描述向量,依据所述语义描述向量进行文本知识点鉴别和互动意图预测,生成文本知识点鉴别数据和互动意图预测数据,包括:
将所述第一属性标签的样本互动文本和所述第二属性标签的样本互动文本加载到所述基础语义编码单元中进行语义编码,生成基础第一属性标签语义描述向量和基础第二属性标签语义描述向量;
将所述基础第一属性标签语义描述向量和所述基础第二属性标签语义描述向量加载到所述第一基础训练鉴别单元中进行文本知识点鉴别,生成基础第一属性标签鉴别信息和基础第二属性标签鉴别信息;
将所述基础第一属性标签语义描述向量和所述基础第二属性标签语义描述向量加载到所述基础预测单元中,生成所述基础第一属性标签的样本互动文本AI预测数据和所述基础第二属性标签的样本互动文本AI预测数据;
所述依据所述文本知识点鉴别数据、互动意图预测数据、所述第一属性标签的样本互动文本的各个互动文本分句对应的互动意图标注数据和所述第二属性标签的样本互动文本的部分互动文本分句对应的互动意图标注数据对所述基础互动意图预测网络进行网络权重参数优化,生成优化后的基础互动意图预测网络,依据优化后的基础互动意图预测网络得到第一待定互动意图预测网络,包括:
依据所述基础第一属性标签的样本互动文本AI预测数据和所述各个互动文本分句对应的互动意图标注数据计算基础第一属性标签训练代价值,依据所述基础第二属性标签的样本互动文本AI预测数据和所述部分互动文本分句对应的互动意图标注数据计算基础第二属性标签训练代价值;
依据所述基础第一属性标签训练代价值和所述基础第二属性标签训练代价值反向优化所述基础语义编码单元和所述基础预测单元;
依据所述基础第一属性标签鉴别信息和所述监督样本互动文本数据对应的监督源计算第一监督源训练代价值,并依据所述基础第二属性标签鉴别信息和所述弱监督样本互动文本数据对应的弱监督源计算第二监督源训练代价值;
基于所述第一监督源训练代价值和所述第二监督源训练代价值优化所述基础语义编码单元和所述第一基础训练鉴别单元,生成优化后的基础互动意图预测网络,依据优化后的基础互动意图预测网络得到第一待定互动意图预测网络,所述优化后的基础互动意图预测网络中优化后的基础语义编码单元对加载互动文本数据解析的描述向量包括不同监督型样本对应的当前共享描述向量。
4.根据权利要求3所述的针对网络安全平台的交互数据处理方法,其特征在于,所述基础预测单元包括基础分词单元和基础全连接输出单元;
所述将所述基础第一属性标签语义描述向量和所述基础第二属性标签语义描述向量加载到所述基础预测单元中,生成所述基础第一属性标签的样本互动文本AI预测数据和所述基础第二属性标签的样本互动文本AI预测数据,包括:
将所述基础第一属性标签语义描述向量分别加载到所述基础分词单元和所述基础全连接输出单元中,生成基础第一属性标签分词向量和基础第一属性标签预测数据;
将所述基础第二属性标签语义描述向量分别加载到所述基础分词单元和所述基础全连接输出单元中,生成基础第二属性标签分词向量和基础第二属性标签预测数据;
所述依据所述基础第一属性标签的样本互动文本AI预测数据和所述各个互动文本分句对应的互动意图标注数据计算基础第一属性标签训练代价值,依据所述基础第二属性标签的样本互动文本AI预测数据和所述部分互动文本分句对应的互动意图标注数据计算基础第二属性标签训练代价值,包括:
依据所述基础第一属性标签分词向量和所述第一属性标签的样本互动文本各个互动文本分句的互动意图标注数据中的分词向量标注数据计算基础第一属性标签分词训练代价值,并依据所述基础第一属性标签预测数据和所述第一属性标签的样本互动文本各个互动文本分句的互动意图标注数据中的互动意图标注类型计算基础第一属性标签预测训练代价值,依据所述基础第一属性标签分词训练代价值和所述基础第一属性标签预测训练代价值得到所述基础第一属性标签训练代价值;
依据所述基础第二属性标签分词向量和所述第二属性标签的样本互动文本部分互动文本分句的互动意图标注数据中的分词向量标注数据计算基础第二属性标签分词训练代价值,并依据所述基础第二属性标签预测数据和所述第二属性标签的样本互动文本部分互动文本分句的互动意图标注数据中的互动意图标注类型计算基础第二属性标签预测训练代价值,依据所述基础第二属性标签分词训练代价值和所述基础第二属性标签预测训练代价值得到所述基础第二属性标签训练代价值。
5.根据权利要求1所述的针对网络安全平台的交互数据处理方法,其特征在于,依据所述第二属性标签的样本互动文本、所述部分互动文本分句对应的互动意图标注数据和所述估计互动意图数据对所述第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,包括:
依据所述部分互动文本分句对应的互动意图标注数据和所述估计互动意图数据对所述弱监督样本互动文本数据中的第二属性标签的样本互动文本进行划分,生成第一类型互动文本和第二类型互动文本,其中,所述第一类型互动文本为易迁移互动文本,所述第二类型互动文本为难迁移互动文本;
依据所述部分互动文本分句对应的互动意图标注数据对所述估计互动意图数据中相同互动文本分句对应的估计互动意图数据进行调整,生成相同互动文本分句对应的调整标注数据,依据所述估计互动意图数据和所述相同互动文本分句对应的调整标注数据得到所述第二属性标签的样本互动文本中各个互动文本分句对应的最新标注数据;
依据所述第一类型互动文本和对应的最新标注数据与所述第二类型互动文本和对应的部分互动文本分句的互动意图标注数据对所述第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络。
6.根据权利要求5所述的针对网络安全平台的交互数据处理方法,其特征在于,所述依据所述第一类型互动文本和对应的最新标注数据与所述第二类型互动文本和对应的部分互动文本分句的互动意图标注数据对所述第一待定互动意图预测网络进行对立强化训练,生成第二待定互动意图预测网络,包括:
将所述第一类型互动文本和所述第二类型互动文本加载到所述第一待定互动意图预测网络中,所述第一待定互动意图预测网络对所述第一类型互动文本和所述第二类型互动文本进行语义编码,生成第一类型语义描述向量和第二类型语义描述向量,依据所述第一类型语义描述向量和所述第二类型互动文本进行迁移文本知识点鉴别和迁移互动意图预测,生成迁移文本知识点鉴别数据和迁移互动意图预测数据;
依据所述迁移文本知识点鉴别数据、所述迁移互动意图预测数据、所述第一类型互动文本对应的最新标注数据和所述第二类型互动文本对应的部分互动文本分句的互动意图标注数据对所述第一待定互动意图预测网络进行网络权重参数优化,生成优化后的第一待定互动意图预测网络,依据优化后的第一待定互动意图预测网络得到所述第二待定互动意图预测网络,所述第二待定互动意图预测网络对加载互动文本数据解析的描述向量包括同类型差异互动文本对应的当前共享描述向量。
7.根据权利要求6所述的针对网络安全平台的交互数据处理方法,其特征在于,所述第一待定互动意图预测网络包括第一语义编码单元、第二基础训练鉴别单元和第一互动意图预测单元;
所述将所述第一类型互动文本和所述第二类型互动文本加载到所述第一待定互动意图预测网络中,所述第一待定互动意图预测网络对所述第一类型互动文本和所述第二类型互动文本进行语义编码,生成第一类型语义描述向量和第二类型语义描述向量,依据所述第一类型语义描述向量和所述第二类型互动文本进行迁移文本知识点鉴别和迁移互动意图预测,生成迁移文本知识点鉴别数据和迁移互动意图预测数据,包括:
将所述第一类型互动文本和所述第二类型互动文本加载到所述第一语义编码单元中进行语义编码,生成第一类型语义描述向量和第二类型语义描述向量; 将所述第一类型语义描述向量和第二类型语义描述向量加载至所述第二基础训练鉴别单元中进行知识点鉴别,生成第一类型文本知识点鉴别数据和第二类型文本知识点鉴别数据; 将所述第一类型语义描述向量和第二类型语义描述向量加载至所述第一互动意图预测单元中进行互动意图预测,生成第一类型互动意图预测数据和第二类型互动意图预测数据;
所述依据所述迁移文本知识点鉴别数据、所述迁移互动意图预测数据、所述第一类型互动文本对应的最新标注数据和所述第二类型互动文本对应的部分互动文本分句的互动意图标注数据对所述第一待定互动意图预测网络进行网络权重参数优化,生成优化后的第一待定互动意图预测网络,依据优化后的第一待定互动意图预测网络得到所述第二待定互动意图预测网络,包括:
依据所述第一类型互动意图预测数据和所述第一类型互动文本对应的最新标注数据计算第一类型互动文本训练代价值,并依据所述第二类型互动意图预测数据和所述第二类型互动文本对应的部分互动文本分句的互动意图标注数据计算第二类型互动文本训练代价值; 依据所述第一类型互动文本训练代价值和所述第二类型互动文本训练代价值优化所述第一语义编码单元和所述第一互动意图预测单元; 依据所述第一类型文本知识点鉴别数据和所述第一类型互动文本对应的第一类型来源计算第一类型监督源训练代价值,并依据所述第二类型文本知识点鉴别数据和所述第二类型互动文本对应的第二类型来源计算第二类型监督源训练代价值;
依据所述第一类型监督源训练代价值和所述第二类型监督源训练代价值优化所述第一语义编码单元和所述第二基础训练鉴别单元,生成优化后的第一待定互动意图预测网络,依据优化后的第一待定互动意图预测网络得到所述第二待定互动意图预测网络,所述优化后的第一待定互动意图预测网络中优化后的第一语义编码单元对加载互动文本数据解析的描述向量包括同类型差异互动文本对应的当前共享描述向量。
8.根据权利要求7所述的针对网络安全平台的交互数据处理方法,其特征在于,所述第一互动意图预测单元包括第一分词单元和第一全连接输出单元;
所述将所述第一类型语义描述向量和第二类型语义描述向量加载至所述第一互动意图预测单元中进行互动意图预测,生成所述第一类型互动意图预测数据和所述第二类型互动意图预测数据,包括:
将所述第一类型语义描述向量分别加载到所述第一分词单元和所述第一全连接输出单元中,生成第一类型互动文本分词向量信息和第一类型互动文本预测数据;
将所述第二类型语义描述向量分别加载到所述第一分词单元和所述第一全连接输出单元中,生成第二类型互动文本分词向量信息和第二类型互动文本预测数据;
所述依据所述第一类型互动意图预测数据和所述第一类型互动文本对应的最新标注数据计算第一类型互动文本训练代价值,并依据所述第二类型互动意图预测数据和所述第二类型互动文本对应的部分互动文本分句的互动意图标注数据计算第二类型互动文本训练代价值,包括:
依据所述第一类型互动文本分词向量信息和所述第一类型互动文本对应的最新标注数据中的分词向量标注数据计算第一类型分词训练代价值,并依据所述第一类型互动文本预测数据和所述第一类型互动文本对应的最新标注数据中的互动意图标注类型计算第一类型互动文本预测训练代价值,依据所述第一类型互动文本分词训练代价值和所述第一类型互动文本预测训练代价值得到所述第一类型互动文本训练代价值;
依据所述第二类型互动文本分词向量信息和所述第二类型互动文本对应的部分互动文本分句的互动意图标注数据中的分词向量标注数据计算第二类型互动文本分词训练代价值,并依据所述第二类型互动文本预测数据和所述第二类型互动文本对应的部分互动文本分句的互动意图标注数据中的互动意图标注类型计算第二类型互动文本预测训练代价值,依据所述第二类型互动文本分词训练代价值和所述第二类型互动文本预测训练代价值得到所述第二类型互动文本训练代价值。
9.一种云服务系统,其特征在于,所述系统包括云服务系统以及与所述云服务系统通信连接的各个网络安全平台,所述云服务系统包括处理器和存储器,所述存储器和所述处理器连接,所述存储器用于存储程序、指令或代码,所述处理器用于执行所述存储器中的程序、指令或代码,以实现上述权利要求1-8任意一项所述的针对网络安全平台的交互数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310579758.4A CN116628177B (zh) | 2023-05-22 | 2023-05-22 | 针对网络安全平台的交互数据处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310579758.4A CN116628177B (zh) | 2023-05-22 | 2023-05-22 | 针对网络安全平台的交互数据处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116628177A CN116628177A (zh) | 2023-08-22 |
CN116628177B true CN116628177B (zh) | 2023-11-14 |
Family
ID=87635996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310579758.4A Active CN116628177B (zh) | 2023-05-22 | 2023-05-22 | 针对网络安全平台的交互数据处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116628177B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117575013A (zh) * | 2023-09-12 | 2024-02-20 | 大连瑞易付科技有限公司 | 应用于网络安全平台的交互挖掘方法及人工智能预测系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112069786A (zh) * | 2020-08-25 | 2020-12-11 | 北京字节跳动网络技术有限公司 | 文本信息处理方法、装置、电子设备及介质 |
CN113704429A (zh) * | 2021-08-31 | 2021-11-26 | 平安普惠企业管理有限公司 | 基于半监督学习的意图识别方法、装置、设备及介质 |
CN113886548A (zh) * | 2021-09-30 | 2022-01-04 | 平安普惠企业管理有限公司 | 意图识别模型训练方法、识别方法、装置、设备及介质 |
CN114626551A (zh) * | 2022-03-21 | 2022-06-14 | 北京字节跳动网络技术有限公司 | 文本识别模型的训练方法、文本识别方法及相关装置 |
CN114817501A (zh) * | 2022-04-27 | 2022-07-29 | 马上消费金融股份有限公司 | 一种数据处理方法、数据处理装置、电子设备及存储介质 |
CN115082752A (zh) * | 2022-05-30 | 2022-09-20 | 浙江大华技术股份有限公司 | 基于弱监督的目标检测模型训练方法、装置、设备及介质 |
CN115114407A (zh) * | 2022-07-12 | 2022-09-27 | 平安科技(深圳)有限公司 | 意图识别方法、装置、计算机设备及存储介质 |
CN115470798A (zh) * | 2022-10-24 | 2022-12-13 | 上海小度技术有限公司 | 意图识别模型的训练方法、意图识别方法、装置及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210009066A (ko) * | 2019-07-16 | 2021-01-26 | 삼성전자주식회사 | 사용자의 의도를 추정하는 방법 및 장치 |
-
2023
- 2023-05-22 CN CN202310579758.4A patent/CN116628177B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112069786A (zh) * | 2020-08-25 | 2020-12-11 | 北京字节跳动网络技术有限公司 | 文本信息处理方法、装置、电子设备及介质 |
CN113704429A (zh) * | 2021-08-31 | 2021-11-26 | 平安普惠企业管理有限公司 | 基于半监督学习的意图识别方法、装置、设备及介质 |
CN113886548A (zh) * | 2021-09-30 | 2022-01-04 | 平安普惠企业管理有限公司 | 意图识别模型训练方法、识别方法、装置、设备及介质 |
CN114626551A (zh) * | 2022-03-21 | 2022-06-14 | 北京字节跳动网络技术有限公司 | 文本识别模型的训练方法、文本识别方法及相关装置 |
CN114817501A (zh) * | 2022-04-27 | 2022-07-29 | 马上消费金融股份有限公司 | 一种数据处理方法、数据处理装置、电子设备及存储介质 |
CN115082752A (zh) * | 2022-05-30 | 2022-09-20 | 浙江大华技术股份有限公司 | 基于弱监督的目标检测模型训练方法、装置、设备及介质 |
CN115114407A (zh) * | 2022-07-12 | 2022-09-27 | 平安科技(深圳)有限公司 | 意图识别方法、装置、计算机设备及存储介质 |
CN115470798A (zh) * | 2022-10-24 | 2022-12-13 | 上海小度技术有限公司 | 意图识别模型的训练方法、意图识别方法、装置及设备 |
Non-Patent Citations (4)
Title |
---|
Customer Intent Prediction using Sentiment Analysis Techniques;Say Hong Lye et al.;《2021 11th IEEE International Conference on Intelligent Data Acquisition and Advanced Computing Systems》;185-190 * |
基于协同训练的意图分类优化方法;邱云飞 等;《现代情报》(第05期);59-65 * |
基于开放网络知识的信息检索与数据挖掘;王元卓 等;计算机研究与发展(第02期);198-216 * |
基于用户自然标注的微博文本的消费意图识别;付博 等;《中文信息学报》(第04期);213-220 * |
Also Published As
Publication number | Publication date |
---|---|
CN116628177A (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230100376A1 (en) | Text sentence processing method and apparatus, computer device, and storage medium | |
CN107168952B (zh) | 基于人工智能的信息生成方法和装置 | |
CN110069709B (zh) | 意图识别方法、装置、计算机可读介质及电子设备 | |
CN111428010B (zh) | 人机智能问答的方法和装置 | |
CN111553164A (zh) | 命名实体识别模型的训练方法、装置、计算机设备 | |
CN107590168B (zh) | 用于关系推断的系统和方法 | |
EP3620994A1 (en) | Methods, apparatuses, devices, and computer-readable storage media for determining category of entity | |
CN112100377B (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
CN116628177B (zh) | 针对网络安全平台的交互数据处理方法及系统 | |
CN117521675A (zh) | 基于大语言模型的信息处理方法、装置、设备及存储介质 | |
CN114492601A (zh) | 资源分类模型的训练方法、装置、电子设备及存储介质 | |
CN114510570A (zh) | 基于小样本语料的意图分类方法、装置及计算机设备 | |
CN114647713A (zh) | 基于虚拟对抗的知识图谱问答方法、设备及存储介质 | |
CN113947086A (zh) | 样本数据生成方法、训练方法、语料生成方法和装置 | |
US20230334241A1 (en) | Syntactic and semantic autocorrect learning | |
CN112214595A (zh) | 类别确定方法、装置、设备及介质 | |
CN112132269B (zh) | 模型处理方法、装置、设备及存储介质 | |
US20240028828A1 (en) | Machine learning model architecture and user interface to indicate impact of text ngrams | |
CN113468323A (zh) | 争议焦点类别及相似判断方法及系统及装置及推荐方法 | |
CN115858776B (zh) | 一种变体文本分类识别方法、系统、存储介质和电子设备 | |
CN115470790A (zh) | 一种识别文件中的命名实体的方法和装置 | |
US20210311985A1 (en) | Method and apparatus for image processing, electronic device, and computer readable storage medium | |
CN114676237A (zh) | 语句相似度确定方法、装置、计算机设备和存储介质 | |
CN114398482A (zh) | 一种词典构造方法、装置、电子设备及存储介质 | |
Oldenhof et al. | Self-labeling of fully mediating representations by graph alignment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |