CN116756298B - 面向云数据库的ai会话信息优化方法及大数据优化服务器 - Google Patents
面向云数据库的ai会话信息优化方法及大数据优化服务器 Download PDFInfo
- Publication number
- CN116756298B CN116756298B CN202311046583.7A CN202311046583A CN116756298B CN 116756298 B CN116756298 B CN 116756298B CN 202311046583 A CN202311046583 A CN 202311046583A CN 116756298 B CN116756298 B CN 116756298B
- Authority
- CN
- China
- Prior art keywords
- text
- frequent
- item
- session
- government affair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000003860 storage Methods 0.000 claims abstract description 77
- 238000009826 distribution Methods 0.000 claims abstract description 73
- 230000000007 visual effect Effects 0.000 claims abstract description 68
- 238000004458 analytical method Methods 0.000 claims abstract description 48
- 230000002452 interceptive effect Effects 0.000 claims abstract description 36
- 238000005728 strengthening Methods 0.000 claims abstract description 36
- 238000012545 processing Methods 0.000 claims abstract description 35
- 238000012512 characterization method Methods 0.000 claims abstract description 16
- 238000006243 chemical reaction Methods 0.000 claims description 62
- 238000013507 mapping Methods 0.000 claims description 28
- 230000003993 interaction Effects 0.000 claims description 20
- 238000005065 mining Methods 0.000 claims description 17
- 230000002787 reinforcement Effects 0.000 claims description 16
- 230000007246 mechanism Effects 0.000 claims description 14
- 230000005012 migration Effects 0.000 claims description 13
- 238000013508 migration Methods 0.000 claims description 13
- 230000009466 transformation Effects 0.000 claims description 10
- 238000013139 quantization Methods 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 6
- 238000003058 natural language processing Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 description 10
- 239000013598 vector Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
- G06F16/3323—Query formulation using system suggestions using document space presentation or visualization, e.g. category, hierarchy or range presentation and selection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供的面向云数据库的AI会话信息优化方法及大数据优化服务器,利用局部会话文本频繁描述项表征相应智慧云政务会话文本中的各可视化AI交互对话文本块及其在相应智慧云政务会话文本中的相对分布标签,综合考虑了各可视化AI交互对话文本块的相对分布标签特征,通过进行基于特征关注策略的强化操作和互相关频繁项匹配,使得局部会话文本频繁描述项的特征表征性能尽可能准确完整,借由智慧云政务会话文本的结构化特征共性分析时所引入的深层次的语义关联特征,能够提升针对云数据库的结构化特征共性分析观点的精度,以便利用针对云数据库的结构化特征共性分析观点对待优化智慧云政务会话文本进行准确高效的结构化存储优化处理。
Description
技术领域
本发明涉及大数据技术领域,具体而言,涉及面向云数据库的AI会话信息优化方法及大数据优化服务器。
背景技术
云数据库(Cloud DB)是指被优化或部署到一个虚拟计算环境中的数据库,可以实现按需付费、按需扩展、高可用性以及存储整合等优势。鉴于实例创建快速、支持只读实例、读写分离、故障自动切换、数据备份、Binlog备份、SQL审计、访问白名单、监控与消息通知等优势,云数据库的应用越来越广泛。例如,云数据库可以用于对智慧云政务数据进行存储。然而在实际应用时,如何实现智慧云政务数据的存储优化,是目前面临的一个难题。
发明内容
本发明至少提供面向云数据库的AI会话信息优化方法及大数据优化服务器。
本发明提供了一种面向云数据库的AI会话信息优化方法,应用于大数据优化服务器,所述方法包括:
获取待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应的局部会话文本频繁描述项,所述局部会话文本频繁描述项用于反映相应智慧云政务会话文本中的各可视化AI交互对话文本块以及各可视化AI交互对话文本块在相应智慧云政务会话文本中的相对分布标签;
对各所述局部会话文本频繁描述项分别进行基于特征关注策略的强化操作,得到各局部会话文本频繁描述项分别对应的局部会话文本频繁强化项;
通过互相关特征聚焦机制对各所述局部会话文本频繁强化项进行频繁项匹配,得到所述待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及所述参考智慧云政务会话文本对应的第二互相关文本匹配频繁项;
依据所述第一互相关文本匹配频繁项和所述第二互相关文本匹配频繁项,对所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本进行结构化特征共性分析,得到针对云数据库的结构化特征共性分析观点。
在一些可能的实施例中,所述获取待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应的局部会话文本频繁描述项,包括:
分别挖掘待优化智慧云政务会话文本和参考智慧云政务会话文本的原始文本块频繁描述项;
对于每一原始文本块频繁描述项,基于所针对的原始文本块频繁描述项所反映的各可视化AI交互对话文本块,确定各可视化AI交互对话文本块中的目标文本单元的相对分布标签所形成的相对分布标签数组;
将所述相对分布标签数组添加到所针对的原始文本块频繁描述项,分别得到所述待优化智慧云政务会话文本和所述参考智慧云政务会话文本分别对应的局部会话文本频繁描述项。
在一些可能的实施例中,所述基于所针对的原始文本块频繁描述项所反映的各可视化AI交互对话文本块,确定各可视化AI交互对话文本块中的目标文本单元的相对分布标签所形成的相对分布标签数组,包括:
依据所述原始文本块频繁描述项所反映的各可视化AI交互对话文本块,分别确定各可视化AI交互对话文本块中的目标文本单元在所属智慧云政务会话文本中的区域变量;
根据所述原始文本块频繁描述项的特征尺寸,对每一所述区域变量分别进行相对分布标签映射,得到与所述原始文本块频繁描述项具有相同特征尺寸的相对分布标签数组。
在一些可能的实施例中,所述对各所述局部会话文本频繁描述项分别进行基于特征关注策略的强化操作,得到各局部会话文本频繁描述项分别对应的局部会话文本频繁强化项,包括:
对于每一智慧云政务会话文本,获取与所针对智慧云政务会话文本的局部会话文本频繁描述项相匹配的关注决策特征;
将所述每一局部会话文本频繁描述项与匹配的关注决策特征进行设定运算,得到每一智慧云政务会话文本分别对应的局部会话文本频繁强化项。
在一些可能的实施例中,所述对于每一智慧云政务会话文本,获取与所针对智慧云政务会话文本的局部会话文本频繁描述项相匹配的关注决策特征,包括:
对于每一智慧云政务会话文本,根据所针对智慧云政务会话文本的局部会话文本频繁描述项的描述项尺度,对相应的局部会话文本频繁描述项按描述项尺度进行处理,得到目标频繁描述项;
对所述目标频繁描述项进行特征空间迁移和变换处理,得到关注决策特征。
在一些可能的实施例中,所述通过互相关特征聚焦机制对各所述局部会话文本频繁强化项进行频繁项匹配,得到所述待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及所述参考智慧云政务会话文本对应的第二互相关文本匹配频繁项,包括:
将所述待优化智慧云政务会话文本对应的局部会话文本频繁强化项与所述参考智慧云政务会话文本对应的局部会话文本频繁强化项进行拼接,得到已拼接文本联动频繁项;
基于频繁项聚焦算法,对所述已拼接文本联动频繁项进行频繁项匹配,得到已拼接文本匹配频繁项;
依据所述已拼接文本联动频繁项的拼接规则,对所述已拼接文本匹配频繁项进行频繁项拆解,得到所述待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及所述参考智慧云政务会话文本对应的第二互相关文本匹配频繁项。
在一些可能的实施例中,所述基于频繁项聚焦算法,对所述已拼接文本联动频繁项进行频繁项匹配,得到已拼接文本匹配频繁项,包括:
依据所述已拼接文本联动频繁项,确定第一频繁项聚焦算法的算法传入特征以及计算特征关注因子的特征关注描述数组;
将所述算法传入特征和所述特征关注描述数组加载至所述第一频繁项聚焦算法进行频繁项匹配;所述第一频繁项聚焦算法的生成结果为已拼接文本匹配频繁项。
在一些可能的实施例中,所述第一频繁项聚焦算法为并行频繁项聚焦算法;所述依据所述已拼接文本联动频繁项,确定第一频繁项聚焦算法的算法传入特征以及计算特征关注因子的特征关注描述数组,包括:
获取所述并行频繁项聚焦算法的下采样映射参考特征集和特征空间迁移变量集,其中,所述下采样映射参考特征集的第一特征规模值或第二特征规模值与所述并行频繁项聚焦算法中聚焦处理分支的个数呈设定量化关系,所述下采样映射参考特征集包括第一下采样映射参考特征集和第二下采样映射参考特征集;所述并行频繁项聚焦算法的算法传入特征为所述已拼接文本联动频繁项与所述特征空间迁移变量集的特征运算结果;所述并行频繁项聚焦算法的特征关注描述数组,包括所述已拼接文本联动频繁项与所述第一下采样映射参考特征集的特征运算结果以及所述已拼接文本联动频繁项与所述第二下采样映射参考特征集的特征运算结果。
在一些可能的实施例中,所述依据所述第一互相关文本匹配频繁项和所述第二互相关文本匹配频繁项,对所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本进行结构化特征共性分析,得到针对云数据库的结构化特征共性分析观点,包括:
分别对所述第一互相关文本匹配频繁项和所述第二互相关文本匹配频繁项进行局部接受域平均化,得到与所述第一互相关文本匹配频繁项对应的第一局部接受域平均频繁项以及与所述第二互相关文本匹配频繁项对应的第二局部接受域平均频繁项;
确定所述第一局部接受域平均频繁项和所述第二局部接受域平均频繁项的频繁项差异度,得到所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本之间的针对云数据库的结构化特征共性分析观点。
在一些可能的实施例中,在所述依据所述第一互相关文本匹配频繁项和所述第二互相关文本匹配频繁项,对所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本进行结构化特征共性分析,得到针对云数据库的结构化特征共性分析观点之后,所述方法还包括:
在所述结构化特征共性分析观点表征所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本具有相似性的前提下,获得所述参考智慧云政务会话文本对应的结构化存储转换策略;
至少基于所述结构化存储转换策略对所述待优化智慧云政务会话文本进行结构化存储转换,得到结构化会话文本;
将所述结构化会话文本存储至所述云数据库;
其中,所述至少基于所述结构化存储转换策略对所述待优化智慧云政务会话文本进行结构化存储转换,得到结构化会话文本,包括:
在接收到针对所述待优化智慧云政务会话文本的存储需求申请时,获取所述存储需求申请对应存储需求表征字段;
利用预设自然语言处理模型对所述结构化存储转换策略进行转换逻辑文本的特征提取,得到结构化存储转换策略对应的转换逻辑表征字段;
将所述存储需求表征字段和所述转换逻辑表征字段进行聚合,得到针对所述待优化智慧云政务会话文本的最终结构化转换执行字段;
利用所述预设自然语言处理模型对所述最终结构化转换执行字段进行特征译码,得到最终结构化存储转换策略;
通过所述最终结构化存储转换策略对所述待优化智慧云政务会话文本进行结构化存储转换,得到结构化会话文本。
本发明还提供了一种大数据优化服务器,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时实现上述的方法。
本发明的实施例提供的技术方案可以包括以下有益效果:通过获取待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应的局部会话文本频繁描述项,对各局部会话文本频繁描述项分别进行基于特征关注策略的强化操作,得到各局部会话文本频繁描述项分别对应的局部会话文本频繁强化项,通过互相关特征聚焦机制对各局部会话文本频繁强化项进行频繁项匹配,得到待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及参考智慧云政务会话文本对应的第二互相关文本匹配频繁项,基于第一互相关文本匹配频繁项和第二互相关文本匹配频繁项,对待优化智慧云政务会话文本与参考智慧云政务会话文本进行结构化特征共性分析,得到针对云数据库的结构化特征共性分析观点。可见,利用局部会话文本频繁描述项表征相应智慧云政务会话文本中的各可视化AI交互对话文本块以及各可视化AI交互对话文本块在相应智慧云政务会话文本中的相对分布标签,综合考虑了各可视化AI交互对话文本块的相对分布标签特征,通过进行基于特征关注策略的强化操作和互相关频繁项匹配,使得局部会话文本频繁描述项的特征表征性能尽可能准确完整,借由智慧云政务会话文本的结构化特征共性分析时所引入的深层次的语义关联特征,能够提升针对云数据库的结构化特征共性分析观点的精度,以便利用针对云数据库的结构化特征共性分析观点对待优化智慧云政务会话文本进行准确高效的结构化存储优化处理。
关于上述大数据优化服务器、计算机可读存储介质的效果描述参见上述方法的说明。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本发明的实施例,并与说明书一起用于说明本发明的技术方案。应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例示出的一种大数据优化服务器的方框图。
图2是本发明实施例示出的一种面向云数据库的AI会话信息优化方法的流程示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是本发明的一些方面相一致的装置和方法的例子。
图1为本发明实施例提供的大数据优化服务器10的结构示意图,包括处理器102、存储器104、和总线106。其中,存储器104用于存储执行指令,包括内存和外部存储器,内存也可以理解为内存储器,用于暂时存放处理器102中的运算数据,以及与硬盘等外部存储器交换的数据,处理器102通过内存与外部存储器进行数据交换,当大数据优化服务器10运行时,处理器102与存储器104之间通过总线106通信,使得处理器102执行本发明实施例的面向云数据库的AI会话信息优化方法。
请结合图2,图2是本发明实施例所提供的一种面向云数据库的AI会话信息优化方法的流程示意图,应用于大数据优化服务器,该方法示例性可以包括S102-S108。
S102,获取待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应的局部会话文本频繁描述项。
本发明实施例中,局部会话文本频繁描述项用于反映相应智慧云政务会话文本中的各可视化AI交互对话文本块以及各可视化AI交互对话文本块在相应智慧云政务会话文本中的相对分布标签。
进一步地,待优化智慧云政务会话文本和参考智慧云政务会话文本是用于进行智慧云政务会话文本的结构化特征共性分析的文本,待优化智慧云政务会话文本和参考智慧云政务会话文本用于表征不同的两个智慧云政务会话文本,示例性的,待优化智慧云政务会话文本和参考智慧云政务会话文本可以互换。
此外,局部会话文本频繁描述项用于反映相应智慧云政务会话文本中的各可视化AI交互对话文本块以及各可视化AI交互对话文本块在相应智慧云政务会话文本中的相对分布标签(相对位置),基于此,举例而言,局部会话文本频繁描述项可以理解为局部文本定位特征。可视化AI交互对话文本块可以是智慧云政务会话文本的一部分,比如一段对话文本。
示例性的,智慧云政务会话文本所涉及的应用场景包括但不限于智慧医疗、数字化企业办公、自动化工厂生产安全评估等一系列的在线服务场景。
示例性的,大数据优化服务器分别将待优化智慧云政务会话文本和参考智慧云政务会话文本加载到频繁描述项挖掘网络(可以理解为特征提取模型),基于频繁描述项挖掘网络分别对待优化智慧云政务会话文本和参考智慧云政务会话文本进行文本块频繁描述项挖掘(局部文本特征提取),将每个文本块表示为X维文本特征,即待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应尺寸为t*X的局部会话文本频繁描述项F1和局部会话文本频繁描述项F2,对于局部会话文本频繁描述项F1和局部会话文本频繁描述项F2的每个可视化AI交互对话文本块的文本块频繁描述项f,获取每个可视化AI交互对话文本块的相对分布标签信息,将相对分布标签信息对应的相对分布标签特征择选对应可视化AI交互对话文本块的文本块频繁描述项f,得到添加了相对分布标签信息的文本块频繁描述项f0,从而得到待优化智慧云政务会话文本对应的添加了相对分布标签信息的局部会话文本频繁描述项,以及参考智慧云政务会话文本对应的添加了相对分布标签信息的局部会话文本频繁描述项。
其中,频繁描述项挖掘网络可以是基于文本块定位的卷积神经网络,用于对智慧云政务会话文本中的每一个可视化AI交互对话文本块的捕捉以及文本块频繁描述项的挖掘。
S104,对各局部会话文本频繁描述项分别进行基于特征关注策略的强化操作,得到各局部会话文本频繁描述项分别对应的局部会话文本频繁强化项。
本发明实施例中,基于特征关注策略的强化操作可以是注意力特征强化处理,以实现相应AI机器学习模型聚焦部分特征,以改善系统运算开销过大的问题。基于特征关注策略的强化操作可以根据不同特征通道的重要性进行注意力权重的分配,使得相应AI机器学习模型根据分配的注意力权重进行特征强化处理,基于此,局部会话文本频繁描述项对应的局部会话文本频繁强化项可以理解为注意力特征强化之后的文本特征。
示例性的,注意力权重可以基于局部会话文本频繁描述项来确定,大数据优化服务器在获取到待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应的局部会话文本频繁描述项以后,对每一智慧云政务会话文本对应的局部会话文本频繁描述项分别进行基于特征关注策略的强化操作,得到待优化智慧云政务会话文本的局部会话文本频繁描述项对应的第一局部会话文本频繁强化项以及参考智慧云政务会话文本的局部会话文本频繁描述项对应的第二局部会话文本频繁强化项。
S106,通过互相关特征聚焦机制对各局部会话文本频繁强化项进行频繁项匹配,得到待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及参考智慧云政务会话文本对应的第二互相关文本匹配频繁项。
互相关特征聚焦机制是通过于对不同智慧云政务会话文本之间的牵涉依存情况进行分析,以生成互相关算法来灵活分析文本关联情况,以尽可能匹配不同智慧云政务会话文本的关键信息的注意力机制。示例性的,通过互相关特征聚焦算法,对待优化智慧云政务会话文本所对应的局部会话文本频繁强化项和参考智慧云政务会话文本所对应的局部会话文本频繁强化项来灵活分析文本关联情况,从而实现待优化智慧云政务会话文本与参考智慧云政务会话文本的特征匹配,得到完成匹配的与待优化智慧云政务会话文本相对应的第一互相关文本匹配频繁项以及参考智慧云政务会话文本相对应的第二互相关文本匹配频繁项。
示例性的,大数据优化服务器通过互相关特征聚焦机制对各局部会话文本频繁强化项进行频繁项匹配,可以得到拼接的互相关文本匹配频繁项,通过对拼接的互相关文本匹配频繁项进行频繁项拆解(可以理解为文本特征拆解),得到与待优化智慧云政务会话文本相对应的第一互相关文本匹配频繁项以及参考智慧云政务会话文本相对应的第二互相关文本匹配频繁项。其中,互相关文本匹配频繁项可以理解为局部文本匹配特征。
S108,基于第一互相关文本匹配频繁项和第二互相关文本匹配频繁项,对待优化智慧云政务会话文本与参考智慧云政务会话文本进行结构化特征共性分析,得到针对云数据库的结构化特征共性分析观点。
本发明实施例中,结构化特征共性用于反映待优化智慧云政务会话文本与参考智慧云政务会话文本之间的文本结构特征的相似度,参考智慧云政务会话文本是已经完成结构化存储的文本,基于此,如果针对云数据库的结构化特征共性分析观点表征待优化智慧云政务会话文本与参考智慧云政务会话文本是相似的,则可以基于参考智慧云政务会话文本的结构化转换策略快速准确地对待优化智慧云政务会话文本进行结构化存储处理。示例性的,针对云数据库(用于进行结构化存储的数据库)的结构化特征共性分析观点可以通过余弦相似度进行量化表达。
可见,应用S102-S108,通过获取待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应的局部会话文本频繁描述项,局部会话文本频繁描述项用于反映相应智慧云政务会话文本中的各可视化AI交互对话文本块以及各可视化AI交互对话文本块在相应智慧云政务会话文本中的相对分布标签,对各局部会话文本频繁描述项分别进行基于特征关注策略的强化操作,得到各局部会话文本频繁描述项分别对应的局部会话文本频繁强化项,通过互相关特征聚焦机制对各局部会话文本频繁强化项进行频繁项匹配,得到待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及参考智慧云政务会话文本对应的第二互相关文本匹配频繁项,基于第一互相关文本匹配频繁项和第二互相关文本匹配频繁项,对待优化智慧云政务会话文本与参考智慧云政务会话文本进行结构化特征共性分析,得到针对云数据库的结构化特征共性分析观点。可见,通过综合相对分布标签特征和注意力机制,进行基于特征关注策略的强化操作和互相关频繁项匹配,使得局部会话文本频繁描述项的特征表征性能尽可能准确完整,借由智慧云政务会话文本的结构化特征共性分析时所引入的深层次的语义关联特征,能够提升针对云数据库的结构化特征共性分析观点的精度,以便利用针对云数据库的结构化特征共性分析观点对待优化智慧云政务会话文本进行准确高效的结构化存储优化处理。
在一些可能的实施例中,获取待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应的局部会话文本频繁描述项,包括:分别挖掘待优化智慧云政务会话文本和参考智慧云政务会话文本的原始文本块频繁描述项;基于原始文本块频繁描述项所反映的各可视化AI交互对话文本块,确定各可视化AI交互对话文本块中的目标文本单元的相对分布标签所对应的相对分布标签数组;将相对分布标签数组嵌入相应目标文本单元的相对分布标签所属可视化AI交互对话文本块相对应的原始文本块频繁描述项,得到待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应的局部会话文本频繁描述项。
本发明实施例中,原始文本块频繁描述项是指直接从智慧云政务会话文本中挖掘出的文本块频繁描述项,与局部会话文本频繁描述项不同的是,局部会话文本频繁描述项是直接挖掘的文本块频繁描述项与相对分布标签特征的聚合特征描述项。原始文本块频繁描述项由多个可视化AI交互对话文本块的特征融合得到。各可视化AI交互对话文本块中的目标文本单元的相对分布标签示例性可以用可视化AI交互对话文本块中的指定区域变量值来表示。
示例性的,大数据优化服务器分别将待优化智慧云政务会话文本和参考智慧云政务会话文本输入频繁描述项挖掘网络,基于频繁描述项挖掘网络分别对待优化智慧云政务会话文本和参考智慧云政务会话文本进行文本块频繁描述项挖掘,将每一个可视化AI交互对话文本块表示为X维文本特征,即待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应尺寸为t*X的文本块频繁描述项局部会话文本频繁描述项F1和局部会话文本频繁描述项F2,对于局部会话文本频繁描述项F1和局部会话文本频繁描述项F2的每个可视化AI交互对话文本块的文本块频繁描述项f,获取每个可视化AI交互对话文本块的相对分布标签信息,将相对分布标签信息对应的相对分布标签特征择选对应可视化AI交互对话文本块的文本块频繁描述项f,得到添加了相对分布标签信息的文本块频繁描述项f0,从而得到待优化智慧云政务会话文本对应的添加了相对分布标签信息的局部会话文本频繁描述项F01,以及参考智慧云政务会话文本对应的添加了相对分布标签信息的局部会话文本频繁描述项F02。
其中,相对分布标签信息可以是与区域变量对应的相对分布标签数组,示例性可以是两个尺寸为1*X的相对分布标签数组vec1和vec2,其中,vec1表示在分布空间的水平轴上的相对分布标签的特征表达,vec2表示在分布空间的垂直轴上的相对分布标签的特征表达,vec1和vec2可以是通过对可视化AI交互对话文本块中目标文本单元的水平/垂直区域变量分别进行相对分布标签映射所得到的1*X的向量。
本发明实施例中,通过可视化AI交互对话文本块中的目标文本单元的相对分布标签所对应的相对分布标签数组作为择选/嵌入的相对分布标签特征,可以精准表征每一个可视化AI交互对话文本块在所属智慧云政务会话文本中的相对分布标签信息,提高细节丰富程度,使得局部会话文本频繁描述项的特征表征性能尽可能准确完整,能够提升针对云数据库的结构化特征共性分析观点的精度,以便利用针对云数据库的结构化特征共性分析观点对待优化智慧云政务会话文本进行准确高效的结构化存储优化处理。
在一些可能的实施例中,基于原始文本块频繁描述项所反映的各可视化AI交互对话文本块,分别确定各可视化AI交互对话文本块中的目标文本单元的相对分布标签所对应的相对分布标签数组,包括:基于原始文本块频繁描述项所反映的各可视化AI交互对话文本块,分别确定各可视化AI交互对话文本块中的目标文本单元在所属智慧云政务会话文本中的区域变量;根据原始文本块频繁描述项的特征尺寸,对每一区域变量分别进行相对分布标签映射,得到与原始文本块频繁描述项具有相同特征尺寸的相对分布标签数组。
其中,原始文本块频繁描述项是基于文本块频繁描述项挖掘算法从智慧云政务会话文本中直接挖掘的文本描述向量。原始文本块频繁描述项的维度与文本块频繁描述项挖掘算法相对应。比如,文本块频繁描述项挖掘算法所识别的可视化AI交互对话文本块的个数为t,t的取值为预设值,属于文本块频繁描述项挖掘算法的前置参数,基于文本块频繁描述项挖掘算法所提取的原始文本块频繁描述项尺寸为t*X,X为描述项尺度,原始文本块频繁描述项表示从智慧云政务会话文本中识别出的t个可视化AI交互对话文本块,并将每一个可视化AI交互对话文本块用X维的特征来表达。对于输入文本块频繁描述项挖掘算法的任意智慧云政务会话文本,采用同一文本块频繁描述项挖掘算法所输出的原始文本块频繁描述项的向量尺寸相同,如向量尺寸均为t*X。
可视化AI交互对话文本块中的目标文本单元可以是每一个可视化AI交互对话文本块中指定相对分布标签的文本单元(文本单元可以是字、词、短语的组合),通过目标文本单元可以表征可视化AI交互对话文本块自身在所属智慧云政务会话文本中的相对分布标签,也能够区别不同可视化AI交互对话文本块在所属智慧云政务会话文本中的相对分布关系。可视化AI交互对话文本块中的目标文本单元可以是可视化AI交互对话文本块的主题文本单元。通过目标文本单元在智慧云政务会话文本中的相对分布标签来表征可视化AI交互对话文本块在智慧云政务会话文本中的相对分布标签,可以提升相对分布标签信息的表达精简性,在注意力机制中,可以显著减少运算量,提高整体方案分析的时效性。大数据优化服务器基于主题文本单元的区域变量相对分布标签,得到相对分布标签数组,以便将相对分布标签信息选择性添加到各可视化AI交互对话文本块的文本块频繁描述项,从而使得局部会话文本频繁描述项能够表征各可视化AI交互对话文本块在相应智慧云政务会话文本中的相对分布标签。示例性的,大数据优化服务器根据原始文本块频繁描述项的特征尺寸,对每一区域变量分别进行相对分布标签映射,得到与原始文本块频繁描述项具有相同特征尺寸的相对分布标签数组,从而将可视化AI交互对话文本块的相对分布标签数组选择性添加到相应的文本块频繁描述项。示例性的,特征择选可以采用特征加和的思路实现,也可以采用特征拼接的思路实现。
本发明实施例中,通过可视化AI交互对话文本块中的目标文本单元的相对分布标签所对应的相对分布标签数组作为择选的相对分布标签特征,根据原始文本块频繁描述项的特征尺寸,对每一区域变量分别进行相对分布标签映射,实现相对分布标签数组的精准择选,从而准确表达每一个可视化AI交互对话文本块在所属智慧云政务会话文本中的相对分布标签信息,提高细节丰富程度,使得局部会话文本频繁描述项的特征表征性能尽可能准确完整,能够提升针对云数据库的结构化特征共性分析观点的精度,以便利用针对云数据库的结构化特征共性分析观点对待优化智慧云政务会话文本进行准确高效的结构化存储优化处理。
在一些可能的实施例中,对各局部会话文本频繁描述项分别进行基于特征关注策略的强化操作,得到各局部会话文本频繁描述项分别对应的局部会话文本频繁强化项,包括:对于每一智慧云政务会话文本,获取与所针对智慧云政务会话文本的局部会话文本频繁描述项相匹配的关注决策特征;将每一局部会话文本频繁描述项与匹配的关注决策特征进行设定运算(比如点积运算),得到每一智慧云政务会话文本分别对应的局部会话文本频繁强化项。
其中,关注决策特征是Attention Mechanism中用于反映局部关注权重的特征向量,关注决策特征与局部会话文本频繁描述项相匹配。示例性的,关注决策特征可以基于局部会话文本频繁描述项根据描述项尺度进行整合处理所得到的整合特征来获得。其中,对局部会话文本频繁描述项根据描述项尺度所进行的整合处理可以是通过均值运算来整合。整合特征是对局部会话文本频繁描述项进行下采样得到的结果,可以反映局部会话文本频繁描述项在每一个维度的细节。
示例性的,大数据优化服务器针对待优化智慧云政务会话文本和参考智慧云政务会话文本分别进行相同的处理,分别得到与待优化智慧云政务会话文本对应的第一局部会话文本频繁强化项以及与参考智慧云政务会话文本对应的第二局部会话文本频繁强化项,其中,对待优化智慧云政务会话文本的局部会话文本频繁描述项进行细节强化时与对参考智慧云政务会话文本的局部会话文本频繁描述项进行细节强化时处于解耦状态。以大数据优化服务器针对待优化智慧云政务会话文本的处理为例,大数据优化服务器基于待优化智慧云政务会话文本对应的待优化局部会话文本频繁描述项,得到与待优化局部会话文本频繁描述项相匹配的第一关注决策特征,将待优化局部会话文本频繁描述项与第一关注决策特征进行设定运算,得到待优化智慧云政务会话文本对应的第一局部会话文本频繁强化项。类似地,大数据优化服务器针对参考智慧云政务会话文本进行相同的处理,得到与参考智慧云政务会话文本对应的第二局部会话文本频繁强化项。
本发明实施例中,通过获取与局部会话文本频繁描述项相匹配的关注决策特征,能够对于每一个智慧云政务会话文本对应的局部会话文本频繁描述项进行相应的细节强化,实现对不同智慧云政务会话文本的匹配处理,通过局部会话文本频繁描述项与匹配的关注决策特征设定运算,能够准确地进行细节强化表征,得到更为精准的局部会话文本频繁强化项。
在一些可能的实施例中,对于每一智慧云政务会话文本,获取与所针对智慧云政务会话文本的局部会话文本频繁描述项相匹配的关注决策特征,包括:对于每一智慧云政务会话文本,根据所针对智慧云政务会话文本的局部会话文本频繁描述项的描述项尺度,对相应的局部会话文本频繁描述项按描述项尺度进行处理,得到目标频繁描述项;对目标频繁描述项的特征空间迁移和变换处理,得到关注决策特征。
其中,目标频繁描述项是对局部会话文本频繁描述项根据描述项尺度进行整合处理所得到的结果,基于对目标频繁描述项的特征空间迁移和变换处理,可以得到关注决策特征。特征空间迁移是指通过特征空间迁移变量集对目标频繁描述项进行线性映射,比如可以通过Sigmoid算子或者ReLU算子实现。
示例性的,以大数据优化服务器针对待优化智慧云政务会话文本的处理为例,大数据优化服务器根据待优化智慧云政务会话文本的局部会话文本频繁描述项的描述项尺度,对相应的局部会话文本频繁描述项按描述项尺度进行处理,得到待优化智慧云政务会话文本对应的第一目标频繁描述项,大数据优化服务器对第一目标频繁描述项的特征空间迁移和变换处理,得到与待优化智慧云政务会话文本对应的第一关注决策特征,同理,大数据优化服务器针对参考智慧云政务会话文本进行相同的处理,得到与参考智慧云政务会话文本对应的第二关注决策特征。
在一些可能的实施例中,通过互相关特征聚焦机制对各局部会话文本频繁强化项进行频繁项匹配,得到待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及参考智慧云政务会话文本对应的第二互相关文本匹配频繁项,包括:将待优化智慧云政务会话文本对应的局部会话文本频繁强化项与参考智慧云政务会话文本对应的局部会话文本频繁强化项进行拼接,得到已拼接文本联动频繁项;基于频繁项聚焦算法,对已拼接文本联动频繁项进行频繁项匹配,得到已拼接文本匹配频繁项;基于已拼接文本联动频繁项的拼接规则,对已拼接文本匹配频繁项进行频繁项拆解,得到待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及参考智慧云政务会话文本对应的第二互相关文本匹配频繁项。
本发明实施例中,待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项为t*X的文本特征关系网,参考智慧云政务会话文本对应的第二互相关文本匹配频繁项也为t*X的文本特征关系网,则通过文本特征关系网的拼接,可以得到一个尺寸为2t*X的已拼接文本联动频繁项集。特征拼接与频繁项拆解是一个互逆的过程,已拼接文本匹配频繁项是对已拼接文本联动频繁项集进行重构匹配的结果,重构匹配是对特征的强化,并不会影响到文本特征关系网的大小,因此已拼接文本联动频繁项集和已拼接文本匹配频繁项集均为2t*X的文本特征关系网。基于已拼接文本联动频繁项的拼接规则,对已拼接文本匹配频繁项进行频繁项拆解,示例性可以是将2t*X的已拼接文本匹配频繁项集拆解为两个t*X的对齐文本特征关系网,以使得拆解后的文本特征关系网的大小与拼接前的局部会话文本频繁强化项的大小相等,并且分别与待优化智慧云政务会话文本和参考智慧云政务会话文本相对应。
本发明实施例中,通过进行文本特征拼接和拆解以及针对已拼接文本联动频繁项进行频繁项匹配,能够实现待优化智慧云政务会话文本的局部会话文本频繁强化项与参考智慧云政务会话文本的局部会话文本频繁强化项之间的充分重构匹配,提升了待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及参考智慧云政务会话文本对应的第二互相关文本匹配频繁项的细节全面性,从而能够得到准确的针对云数据库的结构化特征共性分析观点。
在一些可能的实施例中,基于频繁项聚焦算法,对已拼接文本联动频繁项进行频繁项匹配,得到已拼接文本匹配频繁项,包括:基于已拼接文本联动频繁项,确定第一频繁项聚焦算法的算法传入特征以及计算特征关注因子的特征关注描述数组;将算法传入特征和特征关注描述数组输入第一频繁项聚焦算法进行频繁项匹配;第一频繁项聚焦算法的生成结果为已拼接文本匹配频繁项。
本发明实施例中,频繁项聚焦算法可以理解为注意力模型,第一频繁项聚焦算法可以是单头的点乘注意力模型,也可以是并行频繁项聚焦算法(多头的点乘注意力模型)。示例性的,重构匹配可以通过键值对和查询向量的思路实现。
本发明实施例中,大数据优化服务器通过第一频繁项聚焦算法进行频繁项匹配,基于第一频繁项聚焦算法的算法架构,通过已拼接文本联动频繁项来得到算法传入特征以及确定特征关注因子的特征关注描述数组,将算法传入特征和特征关注描述数组输入第一频繁项聚焦算法进行频繁项匹配,基于第一频繁项聚焦算法所输出的已拼接文本匹配频繁项,能够确保重构匹配得到的文本特征的细节全面性,从而得到准确的针对云数据库的结构化特征共性分析观点。
在一些可能的实施例中,第一频繁项聚焦算法为并行频繁项聚焦算法;基于已拼接文本联动频繁项,确定第一频繁项聚焦算法的算法传入特征以及计算特征关注因子(注意力权重)的特征关注描述数组,包括:获取并行频繁项聚焦算法的下采样映射参考特征集和特征空间迁移变量集,其中,下采样映射参考特征集的第一特征规模值或第二特征规模值与并行频繁项聚焦算法中聚焦处理分支的个数呈设定量化关系,下采样映射参考特征集包括第一下采样映射参考特征集和第二下采样映射参考特征集;并行频繁项聚焦算法的算法传入特征(输入特征)为已拼接文本联动频繁项与特征空间迁移变量集的特征运算结果(乘积);并行频繁项聚焦算法的特征关注描述数组,包括已拼接文本联动频繁项与第一下采样映射参考特征集的特征运算结果以及已拼接文本联动频繁项与第二下采样映射参考特征集的特征运算结果。示例性的,并行频繁项聚焦算法与第一频繁项聚焦算法存在差异。
在一个示例性的应用中,大数据优化服务器将待优化智慧云政务会话文本对应的局部会话文本频繁强化项和参考智慧云政务会话文本对应的局部会话文本频繁强化项进行拼接,得到一个尺寸为2t*X的文本频繁项特征。大数据优化服务器将文本频繁项特征经过并行频繁项聚焦算法进行特征匹配,就得到相同尺寸的衍生文本特征。
本发明实施例中,大数据优化服务器基于并行频繁项聚焦算法对已拼接文本联动频繁项进行重构频繁项匹配,能够通过多轮处理掌握更多的特征细节,能够确保重构匹配得到的文本特征的细节全面性,从而得到准确的针对云数据库的结构化特征共性分析观点。
在一些可能的实施例中,基于第一互相关文本匹配频繁项和第二互相关文本匹配频繁项,对待优化智慧云政务会话文本与参考智慧云政务会话文本进行结构化特征共性分析,得到针对云数据库的结构化特征共性分析观点,包括:分别对第一互相关文本匹配频繁项和第二互相关文本匹配频繁项进行局部接受域平均化(可以理解为均值池化处理),得到与第一互相关文本匹配频繁项对应的第一局部接受域平均频繁项以及与第二互相关文本匹配频繁项对应的第二局部接受域平均频繁项;计算第一局部接受域平均频繁项和第二局部接受域平均频繁项的频繁项差异度,得到待优化智慧云政务会话文本与参考智慧云政务会话文本之间的针对云数据库的结构化特征共性分析观点。示例性的,局部接受域平均化是指对选中的特征进行均值计算。
本发明实施例中,先通过对第一互相关文本匹配频繁项和第二互相关文本匹配频繁项分别根据描述项尺度进行局部接受域平均化,然后对局部接受域平均化得到的局部接受域平均频繁项进行频繁项差异度确定,能够在确保细节全面性的基础上,避免结构化特征共性分析过于复杂,进而提升结构化特征共性分析的时效性。
在一些可独立的实施例中,在所述依据所述第一互相关文本匹配频繁项和所述第二互相关文本匹配频繁项,对所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本进行结构化特征共性分析,得到针对云数据库的结构化特征共性分析观点之后,所述方法还包括S202-S206。
S202,在所述结构化特征共性分析观点表征所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本具有相似性的前提下,获得所述参考智慧云政务会话文本对应的结构化存储转换策略。
S204,至少基于所述结构化存储转换策略对所述待优化智慧云政务会话文本进行结构化存储转换,得到结构化会话文本。
S206,将所述结构化会话文本存储至所述云数据库。
在本发明实施例中,如果待优化智慧云政务会话文本与参考智慧云政务会话文本具有相似性,则可以依据参考智慧云政务会话文本对应的结构化存储转换策略,对待优化智慧云政务会话文本进行结构化存储转换,从而得到结构化会话文本,该结构化会话文本是通过树状结构和/或网状结构进行数据信息记录的文本,结构化会话文本能够直观地反映文本内容之间的关联,且结构化会话文本所占用的存储空间较少,因而将结构化会话文本存储至云数据库中,能够减少不必要的存储空间占用,且能够提高前期存储和后期访问的效率。
在一些可独立的实施例中,S204中的所述至少基于所述结构化存储转换策略对所述待优化智慧云政务会话文本进行结构化存储转换,得到结构化会话文本,包括S2040-S2048。
S2040,在接收到针对所述待优化智慧云政务会话文本的存储需求申请时,获取所述存储需求申请对应存储需求表征字段。
其中,存储需求表征字段用于反映需要对待优化智慧云政务会话文本中的哪些内容进行结构化存储。
S2042,利用预设自然语言处理模型对所述结构化存储转换策略进行转换逻辑文本的特征提取,得到结构化存储转换策略对应的转换逻辑表征字段。
其中,转换逻辑表征字段用于表征在采用结构化存储转换策略进行结构化处理时的语法、句法逻辑关系等。
S2044,将所述存储需求表征字段和所述转换逻辑表征字段进行聚合,得到针对所述待优化智慧云政务会话文本的最终结构化转换执行字段。
其中,通过实现存储需求表征字段和转换逻辑表征字段的聚合,能够得到待优化智慧云政务会话文本的最终结构化转换执行字段,该最终结构化转换执行字段能够反映待优化智慧云政务会话文本的最终结构化存储转换策略的执行特征。
S2046,利用所述预设自然语言处理模型对所述最终结构化转换执行字段进行特征译码,得到最终结构化存储转换策略。
在获得最终结构化转换执行字段之后,通过对其进行特征译码,能够得到最终结构化存储转换策略。
S2048,通过所述最终结构化存储转换策略对所述待优化智慧云政务会话文本进行结构化存储转换,得到结构化会话文本。
进一步地,在获得最终结构化存储转换策略之后,可以依据最终结构化存储转换策略对待优化智慧云政务会话文本中的至少部分内容进行结构化存储转换,从而得到对应的结构化会话文本。
可以理解,应用S2040-S2048,能够结合存储需求表征字段,以及结构化存储转换策略对应的转换逻辑表征字段确定最终结构化存储转换策略,一方面能够引入针对待优化智慧云政务会话文本的存储需求进行分析,另一方面能够对结构化存储转换策略对应的转换逻辑表征字段进行参考,这样不仅可以提高待优化智慧云政务会话文本的结构化存储转换的针对性,还可以提高待优化智慧云政务会话文本的结构化存储转换的效率。
在一些可独立的实施例中,在S206所描述的将所述结构化会话文本存储至所述云数据库之后,所述方法还包括S208。
S208,响应于业务数据端针对所述结构化会话文本的访问请求,对所述业务数据端进行核身处理;在所述业务数据端通过所述核身处理的条件下,向所述业务数据端开放用于访问所述结构化会话文本的访问接口。
可以理解,在对待优化智慧云政务会话文本进行结构化存储转换(信息优化)并进行存储之后,能够在接收到访问请求时通过核身处理确保业务数据端的安全性,从而在保障业务数据端访问所存储的结构化会话文本时,结构化会话文本乃至整个云数据库的数据信息安全性。
在一些可独立的实施例中,S208中的所述对所述业务数据端进行核身处理,包括S2082-S2088。
S2082,获取业务信息端的生物检测量化知识和操作事件量化知识,所述生物检测量化知识反映所述业务信息端中的生物检测信息,所述操作事件量化知识反映所述业务信息端中的操作事件信息。
S2084,对所述生物检测量化知识,基于所述操作事件量化知识中与所述生物检测量化知识关联的目标量化知识,获取第一联动量化知识,所述第一联动量化知识反映融合了操作事件量化知识的生物检测量化知识。
S2086,对所述操作事件量化知识,基于所述生物检测量化知识中与所述操作事件量化知识关联的目标量化知识,获取第二联动量化知识,所述第二联动量化知识反映融合了生物检测量化知识的操作事件量化知识。
S2088,将所述第一联动量化知识与所述第二联动量化知识拼接,得到核身决策量化知识;基于所述核身决策量化知识,确定所述业务信息端的核身结果。
示例性的,可以通过二分类模型来确定业务信息端的核身结果:将核身决策量化知识输入预设的二分类模型,得到二分类模型输出的核身标签,该核身标签包括两类标签,第一类核身标签表征业务信息端通过核身处理(业务信息端不存在安全风险),第二类核身标签表征业务信息端未通过核身处理(业务信息端存在安全风险)。
本发明实施例中,生物检测量化知识和操作事件量化知识能够从用户层面以及操作层面反映业务信息端的核身验证特征,并且将生物检测量化知识和操作事件量化知识进行联动处理和拼接,能够得到验证维度更为丰富的核身决策量化知识,这样基于核身决策量化知识能够准确可靠地确定业务信息端的核身结果。
进一步地,还提供了一种可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述示例性描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其他的形式。
Claims (9)
1.一种面向云数据库的AI会话信息优化方法,其特征在于,应用于大数据优化服务器,所述方法包括:
获取待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应的局部会话文本频繁描述项,所述局部会话文本频繁描述项用于反映相应智慧云政务会话文本中的各可视化AI交互对话文本块以及各可视化AI交互对话文本块在相应智慧云政务会话文本中的相对分布标签;
对各所述局部会话文本频繁描述项分别进行基于特征关注策略的强化操作,得到各局部会话文本频繁描述项分别对应的局部会话文本频繁强化项;
通过互相关特征聚焦机制对各所述局部会话文本频繁强化项进行频繁项匹配,得到所述待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及所述参考智慧云政务会话文本对应的第二互相关文本匹配频繁项;
依据所述第一互相关文本匹配频繁项和所述第二互相关文本匹配频繁项,对所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本进行结构化特征共性分析,得到针对云数据库的结构化特征共性分析观点;
所述通过互相关特征聚焦机制对各所述局部会话文本频繁强化项进行频繁项匹配,得到所述待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及所述参考智慧云政务会话文本对应的第二互相关文本匹配频繁项,包括:
将所述待优化智慧云政务会话文本对应的局部会话文本频繁强化项与所述参考智慧云政务会话文本对应的局部会话文本频繁强化项进行拼接,得到已拼接文本联动频繁项;
基于频繁项聚焦算法,对所述已拼接文本联动频繁项进行频繁项匹配,得到已拼接文本匹配频繁项;
依据所述已拼接文本联动频繁项的拼接规则,对所述已拼接文本匹配频繁项进行频繁项拆解,得到所述待优化智慧云政务会话文本对应的第一互相关文本匹配频繁项以及所述参考智慧云政务会话文本对应的第二互相关文本匹配频繁项;
其中,所述基于频繁项聚焦算法,对所述已拼接文本联动频繁项进行频繁项匹配,得到已拼接文本匹配频繁项,包括:依据所述已拼接文本联动频繁项,确定第一频繁项聚焦算法的算法传入特征以及计算特征关注因子的特征关注描述数组;将所述算法传入特征和所述特征关注描述数组加载至所述第一频繁项聚焦算法进行频繁项匹配;所述第一频繁项聚焦算法的生成结果为已拼接文本匹配频繁项;
其中,所述第一频繁项聚焦算法为并行频繁项聚焦算法;所述依据所述已拼接文本联动频繁项,确定第一频繁项聚焦算法的算法传入特征以及计算特征关注因子的特征关注描述数组,包括:获取所述并行频繁项聚焦算法的下采样映射参考特征集和特征空间迁移变量集,其中,所述下采样映射参考特征集的第一特征规模值或第二特征规模值与所述并行频繁项聚焦算法中聚焦处理分支的个数呈设定量化关系,所述下采样映射参考特征集包括第一下采样映射参考特征集和第二下采样映射参考特征集;所述并行频繁项聚焦算法的算法传入特征为所述已拼接文本联动频繁项与所述特征空间迁移变量集的特征运算结果;所述并行频繁项聚焦算法的特征关注描述数组,包括所述已拼接文本联动频繁项与所述第一下采样映射参考特征集的特征运算结果以及所述已拼接文本联动频繁项与所述第二下采样映射参考特征集的特征运算结果。
2.根据权利要求1所述的方法,其特征在于,所述获取待优化智慧云政务会话文本和参考智慧云政务会话文本分别对应的局部会话文本频繁描述项,包括:
分别挖掘待优化智慧云政务会话文本和参考智慧云政务会话文本的原始文本块频繁描述项;
对于每一原始文本块频繁描述项,基于所针对的原始文本块频繁描述项所反映的各可视化AI交互对话文本块,确定各可视化AI交互对话文本块中的目标文本单元的相对分布标签所形成的相对分布标签数组;
将所述相对分布标签数组添加到所针对的原始文本块频繁描述项,分别得到所述待优化智慧云政务会话文本和所述参考智慧云政务会话文本分别对应的局部会话文本频繁描述项。
3.根据权利要求2所述的方法,其特征在于,所述基于所针对的原始文本块频繁描述项所反映的各可视化AI交互对话文本块,确定各可视化AI交互对话文本块中的目标文本单元的相对分布标签所形成的相对分布标签数组,包括:
依据所述原始文本块频繁描述项所反映的各可视化AI交互对话文本块,分别确定各可视化AI交互对话文本块中的目标文本单元在所属智慧云政务会话文本中的区域变量;
根据所述原始文本块频繁描述项的特征尺寸,对每一所述区域变量分别进行相对分布标签映射,得到与所述原始文本块频繁描述项具有相同特征尺寸的相对分布标签数组。
4.根据权利要求1所述的方法,其特征在于,所述对各所述局部会话文本频繁描述项分别进行基于特征关注策略的强化操作,得到各局部会话文本频繁描述项分别对应的局部会话文本频繁强化项,包括:
对于每一智慧云政务会话文本,获取与所针对智慧云政务会话文本的局部会话文本频繁描述项相匹配的关注决策特征;
将每一局部会话文本频繁描述项与匹配的关注决策特征进行设定运算,得到每一智慧云政务会话文本分别对应的局部会话文本频繁强化项。
5.根据权利要求4所述的方法,其特征在于,所述对于每一智慧云政务会话文本,获取与所针对智慧云政务会话文本的局部会话文本频繁描述项相匹配的关注决策特征,包括:
对于每一智慧云政务会话文本,根据所针对智慧云政务会话文本的局部会话文本频繁描述项的描述项尺度,对相应的局部会话文本频繁描述项按描述项尺度进行处理,得到目标频繁描述项;
对所述目标频繁描述项进行特征空间迁移和变换处理,得到关注决策特征。
6.根据权利要求1所述的方法,其特征在于,所述依据所述第一互相关文本匹配频繁项和所述第二互相关文本匹配频繁项,对所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本进行结构化特征共性分析,得到针对云数据库的结构化特征共性分析观点,包括:
分别对所述第一互相关文本匹配频繁项和所述第二互相关文本匹配频繁项进行局部接受域平均化,得到与所述第一互相关文本匹配频繁项对应的第一局部接受域平均频繁项以及与所述第二互相关文本匹配频繁项对应的第二局部接受域平均频繁项;
确定所述第一局部接受域平均频繁项和所述第二局部接受域平均频繁项的频繁项差异度,得到所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本之间的针对云数据库的结构化特征共性分析观点。
7.根据权利要求1所述的方法,其特征在于,在所述依据所述第一互相关文本匹配频繁项和所述第二互相关文本匹配频繁项,对所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本进行结构化特征共性分析,得到针对云数据库的结构化特征共性分析观点之后,所述方法还包括:
在所述结构化特征共性分析观点表征所述待优化智慧云政务会话文本与所述参考智慧云政务会话文本具有相似性的前提下,获得所述参考智慧云政务会话文本对应的结构化存储转换策略;
至少基于所述结构化存储转换策略对所述待优化智慧云政务会话文本进行结构化存储转换,得到结构化会话文本;
将所述结构化会话文本存储至所述云数据库;
其中,所述至少基于所述结构化存储转换策略对所述待优化智慧云政务会话文本进行结构化存储转换,得到结构化会话文本,包括:
在接收到针对所述待优化智慧云政务会话文本的存储需求申请时,获取所述存储需求申请对应存储需求表征字段;
利用预设自然语言处理模型对所述结构化存储转换策略进行转换逻辑文本的特征提取,得到结构化存储转换策略对应的转换逻辑表征字段;
将所述存储需求表征字段和所述转换逻辑表征字段进行聚合,得到针对所述待优化智慧云政务会话文本的最终结构化转换执行字段;
利用所述预设自然语言处理模型对所述最终结构化转换执行字段进行特征译码,得到最终结构化存储转换策略;
通过所述最终结构化存储转换策略对所述待优化智慧云政务会话文本进行结构化存储转换,得到结构化会话文本。
8.一种大数据优化服务器,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述权利要求1-7任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在运行时实现上述权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311046583.7A CN116756298B (zh) | 2023-08-18 | 2023-08-18 | 面向云数据库的ai会话信息优化方法及大数据优化服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311046583.7A CN116756298B (zh) | 2023-08-18 | 2023-08-18 | 面向云数据库的ai会话信息优化方法及大数据优化服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116756298A CN116756298A (zh) | 2023-09-15 |
CN116756298B true CN116756298B (zh) | 2023-10-20 |
Family
ID=87955616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311046583.7A Active CN116756298B (zh) | 2023-08-18 | 2023-08-18 | 面向云数据库的ai会话信息优化方法及大数据优化服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116756298B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109739849A (zh) * | 2019-01-02 | 2019-05-10 | 山东省科学院情报研究所 | 一种数据驱动的网络敏感信息挖掘与预警平台 |
CN109902290A (zh) * | 2019-01-23 | 2019-06-18 | 广州杰赛科技股份有限公司 | 一种基于文本信息的术语提取方法、系统和设备 |
CN116450671A (zh) * | 2023-06-12 | 2023-07-18 | 大白熊大数据科技(常熟)有限公司 | 智能交互会话大数据分析方法及大数据服务器 |
CN116522403A (zh) * | 2023-07-04 | 2023-08-01 | 大白熊大数据科技(常熟)有限公司 | 聚焦大数据隐私安全的互动信息脱敏方法及服务器 |
CN116595224A (zh) * | 2023-04-07 | 2023-08-15 | 西安伟雄电子科技有限公司 | 针对在线业务会话的大数据存储优化方法及服务器 |
-
2023
- 2023-08-18 CN CN202311046583.7A patent/CN116756298B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109739849A (zh) * | 2019-01-02 | 2019-05-10 | 山东省科学院情报研究所 | 一种数据驱动的网络敏感信息挖掘与预警平台 |
CN109902290A (zh) * | 2019-01-23 | 2019-06-18 | 广州杰赛科技股份有限公司 | 一种基于文本信息的术语提取方法、系统和设备 |
CN116595224A (zh) * | 2023-04-07 | 2023-08-15 | 西安伟雄电子科技有限公司 | 针对在线业务会话的大数据存储优化方法及服务器 |
CN116450671A (zh) * | 2023-06-12 | 2023-07-18 | 大白熊大数据科技(常熟)有限公司 | 智能交互会话大数据分析方法及大数据服务器 |
CN116522403A (zh) * | 2023-07-04 | 2023-08-01 | 大白熊大数据科技(常熟)有限公司 | 聚焦大数据隐私安全的互动信息脱敏方法及服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN116756298A (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111859960B (zh) | 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质 | |
US20230289828A1 (en) | Data processing method, computer device, and readable storage medium | |
CN112633419A (zh) | 小样本学习方法、装置、电子设备和存储介质 | |
CN114218568B (zh) | 一种应用于云服务的大数据攻击处理方法及系统 | |
CN114564726B (zh) | 一种基于大数据办公的软件漏洞分析方法及系统 | |
CN109409504A (zh) | 一种数据处理方法、装置、计算机及存储介质 | |
CN111815432A (zh) | 金融服务风险预测方法及装置 | |
CN111625342B (zh) | 一种数据溯源方法、装置及服务器 | |
CN108460068A (zh) | 报表导入导出的方法、装置、存储介质及终端 | |
CN113486983A (zh) | 一种用于反欺诈处理的大数据办公信息分析方法及系统 | |
CN114328277A (zh) | 一种软件缺陷预测和质量分析方法、装置、设备及介质 | |
CN112069269B (zh) | 基于大数据和多维特征的数据溯源方法及大数据云服务器 | |
CN116756298B (zh) | 面向云数据库的ai会话信息优化方法及大数据优化服务器 | |
CN116226681B (zh) | 一种文本相似性判定方法、装置、计算机设备和存储介质 | |
CN117149996A (zh) | 面向人工智能应用的人机界面数字会话挖掘方法及ai系统 | |
CN113434627A (zh) | 工单的处理方法、装置和计算机可读存储介质 | |
CN116484368A (zh) | 基于数字视觉智能的云业务操作风险识别方法及软件产品 | |
CN112711678A (zh) | 数据解析方法、装置、设备及存储介质 | |
CN115282606A (zh) | 基于智能可视化的云游戏大数据挖掘方法及系统 | |
US11715037B2 (en) | Validation of AI models using holdout sets | |
CN110210518B (zh) | 提取降维特征的方法和装置 | |
CN111611981A (zh) | 信息识别方法和装置及信息识别神经网络训练方法和装置 | |
CN111241826A (zh) | 实体名称识别方法、装置、设备及存储介质 | |
CN116303375B (zh) | 基于大数据的数据库维护分析方法、服务器及介质 | |
CN116383883B (zh) | 一种基于大数据的数据管理权限处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |