CN114638234A - 应用于线上业务办理的大数据挖掘方法及系统 - Google Patents
应用于线上业务办理的大数据挖掘方法及系统 Download PDFInfo
- Publication number
- CN114638234A CN114638234A CN202210338748.7A CN202210338748A CN114638234A CN 114638234 A CN114638234 A CN 114638234A CN 202210338748 A CN202210338748 A CN 202210338748A CN 114638234 A CN114638234 A CN 114638234A
- Authority
- CN
- China
- Prior art keywords
- behavior habit
- description
- mining
- determining
- behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例公开了应用于线上业务办理的大数据挖掘方法及系统,可以在对线上业务办理记录进行尽可能细致的挖掘的前提下,提高针对非热门描述空间语义的业务交互数据的聚焦度,这样可以保障获取到的行为习惯挖掘信息能够蕴含尽可能丰富完整的价值内容,鉴于价值内容的特征区分度较高且细节信息较为丰富,因而可以通过这些价值内容进行更加完整的用户需求挖掘,从而指导线上业务进行针对性的服务优化和相关业务办理指示功能的升级。
Description
技术领域
本公开涉及大数据挖掘技术领域,尤其涉及一种应用于线上业务办理的大数据挖掘方法及系统。
背景技术
大数据挖掘是指从海量数据中找到用户未知的、可能有用的、隐藏的规则,可以通过关联分析、聚类分析、时序分析等各种算法发现一些无法通过观察图表得出的深层次原因。现目前,大数据挖掘几乎遍布各行各业,不仅方便用户进行信息检索,也方便商家进行业务推荐。随着线上业务规模的不断扩大,线上业务场景下的用户大数据挖掘也显得至关重要,然而实际应用时发明人发现,相关技术在针对线上业务进行用户大数据挖掘时,其挖掘结果的完整性和丰富性难以得到保障。
发明内容
本公开的一个目的是提供一种应用于线上业务办理的大数据挖掘方法及系统。
本公开的技术方案是通过如下至少部分实施例实现的。
一种应用于线上业务办理的大数据挖掘方法,所述方法的由线上业务办理系统实施,所述方法至少包括:对所收集的线上业务办理记录进行用户行为习惯偏好挖掘,获得第一行为习惯描述分布;对所述第一行为习惯描述分布进行多样化行为习惯偏好挖掘,获得第一行为习惯描述内容,所述多样化行为习惯偏好挖掘包括注意力行为习惯偏好挖掘;结合所述第一行为习惯描述内容中的热门行为习惯描述,对所述第一行为习惯描述分布进行筛选;挖掘筛选信息中的第二行为习惯描述内容;整理所述第一行为习惯描述内容和所述第二行为习惯描述内容,获得所述线上业务办理记录的行为习惯挖掘信息。
如此设计,可以在对线上业务办理记录进行尽可能细致的挖掘的前提下,提高针对非热门描述空间语义的业务交互数据的聚焦度,这样可以保障获取到的行为习惯挖掘信息能够蕴含尽可能丰富完整的价值内容,鉴于价值内容的特征区分度较高且细节信息较为丰富,因而可以通过这些价值内容进行更加完整的用户需求挖掘,从而指导线上业务进行针对性的服务优化和相关业务办理指示功能的升级。
在一些独立的实施例中,所述挖掘筛选信息中的第二行为习惯描述内容,包括:边缘化所述筛选信息中的热门行为习惯描述,获得第二行为习惯描述分布;所述边缘化所述筛选信息中的热门行为习惯描述,获得第二行为习惯描述分布,包括:对所述筛选信息进行行为习惯偏好挖掘获得待处理行为习惯向量,对所述待处理行为习惯向量进行多样化行为习惯偏好挖掘获得第一目标行为习惯描述内容,以及结合所述第一目标行为习惯描述内容中的热门行为习惯描述,对所述待处理行为习惯向量进行筛选,获得所述第二行为习惯描述分布;在未满足指定的终止要求时,利用所述第二行为习惯描述分布调整所述筛选信息,反复实施所述边缘化所述筛选信息中的热门行为习惯描述,获得第二行为习惯描述分布的过程;在满足所述终止要求时,将所收集的各所述第一目标行为习惯描述内容皆视为所述第二行为习惯描述内容。
如此设计,可以基于迭代挖掘处理,能够全面地挖掘到非热门描述空间语义的信息,进而能够提高第二行为习惯描述内容的多样化以及可信度。
在一些独立的实施例中,所述挖掘筛选信息中的第二行为习惯描述内容,还包括:确定目标第二行为习惯描述分布,所述目标第二行为习惯描述分布为满足所述终止要求时所收集的第二行为习惯描述分布;对所述目标第二行为习惯描述分布进行多样化行为习惯偏好挖掘,获得第二目标行为习惯描述内容;将所述第二目标行为习惯描述内容确定为所述第二行为习惯描述内容。
如此设计,能够有助于提高第二行为习惯描述内容的多样化以及可信度。
在一些独立的实施例中,所述结合所述第一行为习惯描述内容中的热门行为习惯描述,对所述第一行为习惯描述分布进行筛选,包括:结合所述第一行为习惯描述内容中的热门行为习惯描述,确定热门描述空间语义;对所述第一行为习惯描述分布中匹配于所述热门描述空间语义的待定行为习惯描述集进行筛选。
如此设计,通过确定出的热门描述空间语义进行行为习惯描述筛选,以方便之后进行描述内容挖掘,同时能够完整地挖掘出潜在的描述内容,进而最后提高获得的行为习惯挖掘信息精准反映线上业务办理记录的性能。
在一些独立的实施例中,所述结合所述第一行为习惯描述内容中的热门行为习惯描述,确定热门描述空间语义,包括:对所述第一行为习惯描述内容进行结合空间语义的拆解,获得拆解结果;确定所述拆解结果中每个描述成员对应空间关联成员集的热门评价指数,获得热门评价指数列表;利用所述热门评价指数列表,确定所述热门描述空间语义。
如此设计,能够精准地确定热门描述空间语义,进而方便之后通过边缘化热门描述空间语义的待定行为习惯描述集,将非热门描述空间语义对应的行为习惯偏好挖掘出来,以提高行为习惯挖掘信息的完整性和丰富程度。
在一些独立的实施例中,所述对所述第一行为习惯描述分布中匹配于所述热门描述空间语义的待定行为习惯描述集进行筛选,包括:利用所述热门描述空间语义确定差异化处理窗口,所述差异化处理窗口用于清洗所述热门描述空间语义对应的行为习惯描述;整理所述差异化处理窗口与所述第一行为习惯描述分布。
如此设计,可以结合差异化处理窗口及时获得第一行为习惯描述分布,以提高第一行为习惯描述分布的确定效率。
在一些独立的实施例中,所述对所述第一行为习惯描述分布进行多样化行为习惯偏好挖掘,获得第一行为习惯描述内容,包括:对所述第一行为习惯描述分布进行用户行为习惯偏好挖掘,获得第一挖掘清单;对所述第一行为习惯描述分布进行注意力描述挖掘,获得第二挖掘清单;整理所述第一挖掘清单和所述第二挖掘清单,获得所述第一行为习惯描述内容。
如此设计,能够使得获得的第一行为习惯描述内容不仅可以记录表层行为习惯描述内容,还可以记录深层的跨注意力描述,进而包含尽可能全面的且具有潜在分析价值的内容。
在一些独立的实施例中,所述方法由AI学习模型实现,所述AI学习模型的调试步骤包括:将配置有先验知识的已认证线上业务办理记录加载到所述AI学习模型的K个行为习惯偏好挖掘子网,获得已认证第一行为习惯描述内容和已认证第二行为习惯描述内容;结合所述已认证第一行为习惯描述内容、所述已认证第二行为习惯描述内容和所述先验知识,确定所述AI学习模型对应的模型调试质量指标;结合所述模型调试质量指标改进所述AI学习模型;其中,所述模型调试质量指标结合如下的其中部分确定:各所述行为习惯偏好挖掘子网对应的独立注意力质量指标、各所述行为习惯偏好挖掘子网之间的联合注意力质量指标、结合对所述行为习惯偏好挖掘子网的生成结果的热门描述空间语义估计对应的估计质量指标、结合对各所述行为习惯偏好挖掘子网的生成结果的整理对应的整理质量指标。
如此设计,可以结合模型调试质量指标改进AI学习模型,使得调试获得的AI学习模型可以对线上业务办理记录进行准确且全面地描述内容挖掘,进而能够获得精度及可信度较高的行为习惯描述。
在一些独立的实施例中,所述方法还包括确定所述独立注意力质量指标,所述确定所述独立注意力质量指标,包括:利用所述已认证第一行为习惯描述内容和所述先验知识,确定第一独立注意力质量指标;利用所述已认证第二行为习惯描述内容和所述先验知识,确定第二独立注意力质量指标;利用所述第一独立注意力质量指标和所述第二独立注意力质量指标,确定所述独立注意力质量指标。
如此设计,通过确定各个行为习惯偏好挖掘子网对应的独立注意力质量指标,能够方便对独立行为习惯偏好挖掘子网的行为习惯偏好挖掘性能进行提高,最后提高AI学习模型的行为习惯偏好挖掘性能。
在一些独立的实施例中,所述方法还包括确定所述联合注意力质量指标,所述确定所述联合注意力质量指标,包括:对所述已认证第一行为习惯描述内容和所述已认证第二行为习惯描述内容进行去量纲精简处理,获得若干个已认证去量纲精简型描述;确定所述若干个已认证去量纲精简型描述之间的联合注意力质量指标,所述联合注意力质量指标涵盖如下一项或多项:所述若干个已认证去量纲精简描述之间的目标联合注意力质量指标、所述若干个已认证去量纲精简描述之间的线上业务办理记录联合注意力质量指标。
如此设计,通过获得已认证去量纲精简型描述,使得不同对应于不同特征注意力层面的数据信息能够统一到相同特征注意力层面,并且计算已认证去量纲精简型描述对应的目标联合注意力质量指标和线上业务办理记录联合注意力质量指标。基于限制每个行为习惯偏好挖掘子网各自聚焦不同的角度,进而能够提高其用户行为习惯偏好挖掘性能。
在一些独立的实施例中,所述先验知识绑定有所述已认证线上业务办理记录中的办理指示需求事件,所述方法还包括确定所述目标联合注意力质量指标,所述确定所述目标联合注意力质量指标,包括:对所述若干个已认证去量纲精简描述进行结合办理指示需求事件的特征分析,获得目标特征分析结果,所述目标特征分析结果的同一簇中的已认证去量纲精简型描述匹配于同一办理指示需求事件;利用所述目标特征分析结果确定第一簇共性值和第二簇共性值;利用所述第一簇共性值和所述第二簇共性值的比较结果,获得所述目标联合注意力质量指标。
如此设计,基于确定以上目标联合注意力质量指标从办理指示需求事件的层面限制已认证去量纲精简描述之间的关联指数,进而提高模型调试质量指标确定的精度。
在一些独立的实施例中,所述先验知识绑定有所述已认证线上业务办理记录中的办理指示需求事件,所述方法还包括确定所述线上业务办理记录联合注意力质量指标,所述确定所述线上业务办理记录联合注意力质量指标,包括:确定其中两个第一关联习惯描述之间的第一量化差异,所述两个第一关联习惯描述为匹配于不同已认证线上业务办理记录中同一办理指示需求事件两个已认证去量纲精简型描述;确定其中两个第二关联习惯描述之间的第二量化差异;所述两个第二关联习惯描述为匹配于相同已认证线上业务办理记录中同一办理指示需求事件两个已认证去量纲精简型描述;确定所述第一量化差异中的满足第一约束的第一量化差异;确定所述第二量化差异中的满足第二约束的第二量化差异;利用所述满足第一约束的第一量化差异和所述满足第二约束的第二量化差异的比较结果,获得所述线上业务办理记录联合注意力质量指标。
如此设计,通过确定线上业务办理记录联合注意力质量指标可以使得在调试时不同行为习惯偏好挖掘子网的挖掘清单之间的量化差异比较大,达到了各个行为习惯偏好挖掘子网聚焦不同角度的效果。
在一些独立的实施例中,所述方法还包括确定所述估计质量指标,所述确定所述估计质量指标,包括:利用所述已认证第一行为习惯描述内容和所述已认证第二行为习惯描述内容,确定每一热门描述集解析子网的原料;确定所述每一热门描述集解析子网生成的热门评价指数列表,所述热门评价指数列表反映所述原料对应的热门描述空间语义;对所述原料进行结合空间语义的热门状态识别,获得热门评价指数模板列表;利用所述热门评价指数模板列表和所述热门评价指数列表,确定所述估计质量指标。
如此设计,能够提高对估计质量指标的确定的精度,结合该估计质量指标可以改进AI学习模型,以提高热门描述空间语义的分析精度。
在一些独立的实施例中,所述对所述原料进行结合空间语义的热门状态识别,获得热门评价指数模板列表,包括:对所述原料进行结合描述集的边缘化,根据边缘化清单确定第一量化视觉记录;对所述原料逐一进行结合注意力的下采样处理和结合相对关系的下采样处理,获得第二量化视觉记录;利用所述第一量化视觉记录和所述第二量化视觉记录,确定所述热门评价指数模板列表。
如此设计,通过从办理指示需求事件分析偏差的层面确定第一量化视觉记录,从原料本身解析的层面确定第二量化视觉记录,并将根据第一量化视觉记录和第二量化视觉记录获得的热门评价指数模板列表确定为示例性信息确定热门描述集解析子网对应的估计质量指标,能够提高对估计质量指标的确定的精度。
在一些独立的实施例中,所述方法还包括确定整理质量指标,所述确定整理质量指标,包括:确定各行为习惯偏好挖掘子网对应的调试命中率;确定所述各行为习惯偏好挖掘子网对应的估计可信权重;利用所述调试命中率和所述估计可信权重,确定所述整理质量指标。
如此设计,通过在模型调试质量指标中包含上述整理质量指标,可以使得随着调试的进行,各个行为习惯偏好挖掘子网的调试命中率能够进一步提高,进而提高AI学习模型的行为习惯偏好挖掘性能,获得更加完整的用户行为习惯偏好。
一种线上业务办理系统,包括:用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现上述方法的处理器。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述方法。
附图说明
图1是示出可以实现本公开的实施例的线上业务办理系统的示意图。
图2是示出可以实现本公开的实施例的应用于线上业务办理的大数据挖掘方法的流程示意图。
图3是示出可以实现本公开的实施例的应用于线上业务办理的大数据挖掘方法的应用环境的架构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。为了使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开作进一步地详细描述,所描述的实施例不应视为对本公开的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。除非另有定义,本文所使用的所有的技术和科学术语与属于本公开的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本公开实施例的目的,不是旨在限制本公开。
图1是示出可以实现本公开的实施例的线上业务办理系统100的一种通信配置的框图,线上业务办理系统100包括用于存储可执行计算机程序的存储器101,用于执行所述存储器101中存储的可执行计算机程序时实现本公开实施例中应用于线上业务办理的大数据挖掘方法的处理器102。
图2是示出可以实现本公开的实施例的应用于线上业务办理的大数据挖掘方法的流程示意图,应用于线上业务办理的大数据挖掘方法可以通过图1所示的线上业务办理系统100实现,进一步可以包括以下相关步骤所描述的技术方案。
step10、对所收集的线上业务办理记录进行用户行为习惯偏好挖掘,获得第一行为习惯描述分布。
对于本公开实施例而言,可以通过线上业务办理系统确定线上业务办理记录。或者,线上业务办理系统可以从其它平台系统处确定线上业务办理记录。在一些可能的实施例中,线上业务办理记录可以是线上业务办理项目中的一组线上业务办理记录信息。此外,线上业务办理记录还可以理解为线上业务办理系统与业务办理终端进行业务交互时所生成的交互记录。比如,线上办公业务办理记录、线上政企业务办理记录、线上医疗业务办理记录、线上教育业务办理记录等。而用户行为习惯偏好挖掘比如用户办理时段偏好、用户交互习惯偏好等。进一步的,行为习惯描述分布可以通过文本或者特征图的形式进行记录,用于反映用户在业务交互过程中的操作习惯信息。
可以理解的是,本公开实施例对于用户行为习惯偏好挖掘方式不限定,比如,可以对线上业务办理记录进行一层或者多层的滑动平均操作(卷积处理),获得第一行为习惯描述分布。在进行滑动平均操作时,可以获得若干个不同维度(不同规模)的用户行为习惯偏好挖掘清单,可以整理K个不同维度的用户行为习惯偏好挖掘清单获得第一行为习惯描述分布,其中,K为大于1的整数。
step20、对第一行为习惯描述分布进行多样化行为习惯偏好挖掘,获得第一行为习惯描述内容,多样化行为习惯偏好挖掘包括注意力行为习惯偏好挖掘。
对于本公开实施例而言,对第一行为习惯描述分布进行多样化行为习惯偏好挖掘,获得第一行为习惯描述内容可以包括:对第一行为习惯描述分布进行用户行为习惯偏好挖掘,获得第一挖掘清单。对第一行为习惯描述分布进行注意力描述挖掘,获得第二挖掘清单。整理第一挖掘清单和第二挖掘清单,获得第一行为习惯描述内容。本公开实施例对第一行为习惯描述分布进行用户行为习惯偏好挖掘的思路不作限定,示例性的,其可以对上述第一行为习惯描述分布进行一层或者多层滑动平均操作,获得上述第一挖掘清单。对于对第一行为习惯描述分布进行注意力描述挖掘可以理解为对第一行为习惯描述分布进行不同角度的挖掘。
对于本公开实施例而言,注意力描述挖掘可以重视第一行为习惯描述分布中的每个注意力描述之间的联系的挖掘。比如,其可以结合对多注意力描述的描述内容进行整理实现。比如,可以根据注意力描述注释进行注意力描述分类,对对应于相同类别的注意力描述的描述内容进行整理。比如,可以对注意力描述d1~d10的描述内容进行第一整理,对注意力描述d11~d20的描述内容进行第二整理,第一整理和第二整理可以通过同一整理方式或相异的整理方式,本公开实施例在注意力描述挖掘时使用的整理方式的类别和数目不限定。
对于本公开实施例而言,多样化行为习惯偏好挖掘可以通过整理第一挖掘清单和第二挖掘清单,不仅记录第一行为习惯描述分布自身的表层信息,还可以能够全面地挖掘到深层的跨注意力描述,进而能够提高挖掘出的第一行为习惯描述内容的多样化和细节贡献。在实施多样化行为习惯偏好挖掘时,可能用到不低于一种整理方式,本公开实施例对整理方式不作限定。
step30、结合第一行为习惯描述内容中的热门行为习惯描述,对第一行为习惯描述分布进行筛选。
对于本公开实施例而言,第一行为习惯描述内容中的热门行为习惯描述可以理解为第一行为习惯描述内容中的关注度较高的行为习惯描述,还可以理解为第一行为习惯描述内容中的显著行为习惯描述。
对于本公开实施例而言,可以根据第一行为习惯描述内容确定第一行为习惯描述分布中相对突出的内容集和不突出的内容集,并将相对突出的内容集中的数据筛选掉(比如将相对突出的内容集中的数据进行过滤),获得筛选信息。
对于一种可独立实施的实施例而言,结合第一行为习惯描述内容中的热门行为习惯描述,对述第一行为习惯描述分布进行筛选,示例性的可以包括step31和step32所记录的内容。
step31、结合第一行为习惯描述内容中的热门行为习惯描述,确定热门描述空间语义。
对于本公开实施例而言,热门描述空间语义可以理解为关键/显著特征对应的位置信息,对于确定热门描述空间语义的示例性方法不作限定。
对于一种可独立实施的实施例而言,step31所记录的结合第一行为习惯描述内容中的热门行为习惯描述,确定热门描述空间语义,示例性的可以包括step311-step313所记录的内容。
step311、对第一行为习惯描述内容进行结合空间语义的拆解,获得拆解结果。
对于本公开实施例而言,可以对于第一行为习惯描述内容进行结合空间语义(比如:位置信息)的拆解(比如:分割),将其拆解为U*U的分布列表,本公开实施例并不限定U的大小,U可以是不大于设定判定值的正整数,比如,U可以为4,可以理解为获得4*4的拆解结果,可以理解,拆解结果的每个描述成员(拆解结果中的最小组成单元)可以投射至第一行为习惯描述内容中的一组特征向量。
step312、确定拆解结果中每个描述成员对应空间关联成员集的热门评价指数,获得热门评价指数列表。
对于本公开实施例而言,本公开实施例并不限定热门评价指数的确定思路,比如,可以结合完成调试的热门描述集解析子网导出该热门评价指数列表。而该热门评价指数列表可以理解为特征识别度矩阵。
在一些可能的示例中,对于其中一个描述成员对应空间关联成员集,可以将第一行为习惯描述内容中匹配于该空间关联成员集的行为习惯描述内容边缘化(比如进行主动性的冷门处理或者热度削减处理)后获得边缘化清单,通过边缘化清单对于线上业务办理记录中的办理指示需求事件的质量贡献,确定被边缘化的空间关联成员集的重要性指数,根据确定结果确定获得热门评价指数。如果结合边缘化清单识别出的办理指示需求事件的精度较高,则可以认为被边缘化的空间关联成员集的特征识别度较小,否则,特征识别度较大。在另一些可能的示例中,还可以对第一行为习惯描述内容进行结合注意力的下采样处理和结合相对关系的下采样处理(基于相对空间分布的精简处理),获得热门评价指数(比如关注度评分或者特征识别度评分)。
step313、根据热门评价指数列表,确定热门描述空间语义。
在一些可能的示例中,可以依次访问热门评价指数列表,将热门评价指数超出设定评价指数的空间关联成员集确定为热门描述空间语义。在另一些可能的示例中,可以依次访问热门评价指数列表,将热门评价指数进行从高到低整理(比如:降序排列),将整理出的空间语义超出设定序列的空间关联成员集确定为热门描述空间语义,本公开实施例对设定评价指数和设定序列的实际取值可以基于具体要求进行设置,对此不进行限定。
step32、对第一行为习惯描述分布中匹配于热门描述空间语义的待定行为习惯描述集进行筛选。
在一些可能的示例中,可以根据热门描述空间语义确定差异化处理窗口,差异化处理窗口用于清洗热门描述空间语义对应的行为习惯描述。整理差异化处理窗口与第一行为习惯描述分布便能够实现筛选。可以理解,该差异化处理窗口可以与拆解结果的尺寸相同,结合上述相关内容,该差异化处理窗口也可以被反映为一个U*U的分布列表,将热门描述空间语义对应的空间关联成员集在差异化处理窗口中所对应的描述成员配置为“0”,将剩余空间关联成员集对应的描述成员配置为“1”,从而确定差异化处理窗口。将差异化处理窗口调整到与第一行为习惯描述分布相同尺寸后立刻与第一行为习惯描述分布进行一对一描述成员的加权处理,这样可以获得对应的筛选信息。
对于本公开实施例而言,通过运算每个空间关联成员集对应的热门评价指数能够精准地确定出热门描述空间语义。通过获得的热门描述空间语义可以筛选第一行为习惯描述分布中的关联习惯描述,获得精度较高的筛选信息,进而方便之后处理时对于该筛选信息进行准确的挖掘,这样能够挖掘出不突出的信息,最后提高线上业务办理记录的行为习惯挖掘信息准确反映该线上业务办理记录的性能。
step40、挖掘筛选信息中的第二行为习惯描述内容。
对于本公开实施例而言,本公开实施例并不限定挖掘筛选信息的示例性方法,可以理解,其可以结合一层或者多层多样化行为习惯偏好挖掘实现。
对于一种可独立实施的实施例而言,step40记录的挖掘筛选信息中的第二行为习惯描述内容,示例性的可以包括如此内容。
step41、边缘化筛选信息中的热门行为习惯描述,获得第二行为习惯描述分布;边缘化筛选信息中的热门行为习惯描述,获得第二行为习惯描述分布,包括:对筛选信息进行行为习惯偏好挖掘获得待处理行为习惯向量,对待处理行为习惯向量进行多样化行为习惯偏好挖掘获得第一目标行为习惯描述内容,以及结合第一目标行为习惯描述内容中的热门行为习惯描述,对待处理行为习惯向量进行筛选,获得上述第二行为习惯描述分布。
对于本公开实施例而言,可以参阅step10中的应用于线上业务办理的大数据挖掘方法对筛选信息进行行为习惯偏好挖掘获得待处理行为习惯向量,参阅step20中的多样化行为习惯偏好挖掘方法对待处理行为习惯向量进行多样化行为习惯偏好挖掘获得第一目标行为习惯描述内容。参阅step30中的筛选方法结合第一目标行为习惯描述内容中的热门行为习惯描述,对待处理行为习惯向量进行筛选,获得上述第二行为习惯描述分布。
step42、在未满足指定的终止要求时,根据第二行为习惯描述分布调整筛选信息,反复实施边缘化筛选信息中的热门行为习惯描述,获得第二行为习惯描述分布的过程。
step43、在满足终止要求时,将所收集的每一第一目标行为习惯描述内容皆视为第二行为习惯描述内容。
对于本公开实施例而言,AI学习模型可以包括若干个架构类似的行为习惯偏好挖掘子网(比如子网partnet_10~子网partnet_30),以子网partnet_20为例,如果以筛选信息为原料信息,其中的功能层G1可用作对筛选信息进行用户行为习惯偏好挖掘,获得待处理行为习惯向量;功能层G2可用作对待处理行为习惯向量进行多样化行为习惯偏好挖掘,获得第一目标行为习惯描述内容。功能层G2可以包括一个注意力行为习惯偏好挖掘节点node22,在一些实施例中,功能层G2还包括设置在注意力行为习惯偏好挖掘节点node22之前的至少一个用户行为习惯偏好挖掘节点node21。功能层G10可用作获得第一行为习惯描述内容,子网partnet_20和子网partnet_30可用作获得第二行为习惯描述内容,对于本公开实施例而言可以将用于获得第二行为习惯描述内容的行为习惯偏好挖掘子网形成的AI模型作为第二行为习惯描述内容挖掘模型。
在一些可能的实施例中,可以通过将筛选信息导入行为习惯偏好挖掘子网partnet_100。行为习惯偏好挖掘子网partnet_100可以对筛选信息进行行为习惯偏好挖掘获得待处理行为习惯向量,对待处理行为习惯向量进行多样化行为习惯偏好挖掘获得第一目标行为习惯描述内容。进而可以结合第一目标行为习惯描述内容中的热门行为习惯描述,对待处理行为习惯向量进行筛选,获得第二行为习惯描述分布。
对于一种可独立实施的实施例而言,第二行为习惯描述内容中还可以包括结合第二行为习惯描述内容挖掘模型的末尾一个子网获得的行为习惯描述内容,基于此,挖掘筛选信息中的第二行为习惯描述内容,还可以包括如下内容。
step44、确定目标第二行为习惯描述分布,目标第二行为习惯描述分布为满足终止要求时所收集的第二行为习惯描述分布。
step45、对目标第二行为习惯描述分布进行多样化行为习惯偏好挖掘,获得第二目标行为习惯描述内容。
对于本公开实施例而言,结合行为习惯偏好挖掘子网partnet_200获得的第二行为习惯描述分布可以理解为目标第二行为习惯描述分布。对于本公开实施例而言,可以将目标第二行为习惯描述分布导入行为习惯偏好挖掘子网partnet_300进行多样化行为习惯偏好挖掘,获得第二目标行为习惯描述内容。
step46、将第二目标行为习惯描述内容确定为第二行为习惯描述内容。
对于本公开实施例而言,将该第二目标行为习惯描述内容也确定为第二行为习惯描述内容,换言之,第二行为习惯描述内容可以包括第二行为习惯描述内容挖掘模型中除末尾一个子网之外的子网所生成的第一目标行为习惯描述内容,也包括末尾子网生成的第二目标行为习惯描述内容。以上第二行为习惯描述内容挖掘模型中包括的行为习惯偏好挖掘子网的数目没有特殊限制,并且各行为习惯偏好挖掘子网的功能也没有特殊限制。
如此设计,可以结合相关网络架构有序地筛选热门行为习惯描述,并结合筛选信息进行包括注意力描述挖掘的多样化行为习惯偏好挖掘,获得包括若干个目标行为习惯描述内容的第二行为习惯描述内容,通过有序地进行价值数据挖掘,能够提高第二行为习惯描述内容的质量。
step50、整理第一行为习惯描述内容和第二行为习惯描述内容,获得线上业务办理记录的行为习惯挖掘信息。
对于一种可独立实施的实施例而言,整理(融合)第一行为习惯描述内容和第二行为习惯描述内容,获得线上业务办理记录的行为习惯挖掘信息,示例性的可以包括如下内容。
step51、确定至少一种整理方式。
step52、对于每种整理方式,使用整理方式对第一行为习惯描述内容和第二行为习惯描述内容进行整理,获得对应的整理结果。
对于本公开实施例而言,对于其中一种整理方式,整理结果为结合该整理方式整理第一行为习惯描述内容和第二行为习惯描述内容后获得的线上业务办理记录的行为习惯挖掘信息。
step53:结合整理目标,确定对应的整理方式的精度,精度反映整理方式对线上业务办理记录中的描述内容进行输出的性能。
step54、将精度较高的整理方式确定为目标整理方式。
step55、使用目标整理方式对第一行为习惯描述内容和第二行为习惯描述内容进行整理,获得上述线上业务办理记录的行为习惯挖掘信息。
对于本公开实施例而言可以在不同情况下分析各种可能的整理方式在应用中的质量以确定目标整理方式,进而结合目标整理方式获得线上业务办理记录的行为习惯挖掘信息,针对性地确定目标整理方式,进而保障线上业务办理记录的行为习惯挖掘信息质量。
对于本公开实施例而言提供了一种应用于线上业务办理的大数据挖掘方法,可以在对线上业务办理记录进行行为习惯描述内容挖掘的前提下,通过边缘化热门行为习惯描述提升对于非热门行为习惯描述的重视,从非热门行为习惯描述中进一步挖掘价值数据,能够从多个角度挖掘价值数据,从而使得获得的线上业务办理记录的行为习惯挖掘信息具有较强的数据丰富度。
对于一种可独立实施的实施例而言,本公开实施例示出的AI学习模型的调试过程可以包括如下内容。
step101、将配置有先验知识的已认证线上业务办理记录加载到AI学习模型的K个行为习惯偏好挖掘子网,获得已认证第一行为习惯描述内容和已认证第二行为习惯描述内容,K为大于1的整数。
对于本公开实施例而言,已认证线上业务办理记录可以以已认证线上业务办理记录队列的形成组织,可以理解,以已认证线上业务办理记录作为原料信息进行调试。对于本公开实施例而言,已认证线上业务办理记录队列中包括具备同一办理指示需求事件不同线上业务办理记录,也包括具有不同办理指示需求事件的不同线上业务办理记录。已认证线上业务办理记录的先验知识可以绑定有已认证线上业务办理记录中的办理指示需求事件所对应的类别。以可视化指导事件解析为例,一个已认证线上业务办理记录队列可以包括A*B个线上业务办理记录,即已认证线上业务办理记录队列中包括B个不同的可视化指导事件,每个可视化指导事件对应有A个线上业务办理信息,该A个线上业务办理信息中皆包括该可视化指导事件。一个可视化指导事件为一个语义类别,可以以可视化指导事件编号鉴别不同的可视化指导事件。
本公开实施例可以通过已认证线上业务办理记录队列的方式记录已认证线上业务办理记录,AI学习模型对已认证线上业务办理记录进行处理,获得已认证第一行为习惯描述内容和已认证第二行为习惯描述内容的示例性思路,可以参阅以上step10-step40,本公开实施例在此不作过多描述。
step102、结合已认证第一行为习惯描述内容、已认证第二行为习惯描述内容和先验知识,确定AI学习模型对应的模型调试质量指标。
对于本公开实施例而言,模型调试质量指标结合如下的其中部分确定:每一行为习惯偏好挖掘子网对应的独立注意力质量指标、每一行为习惯偏好挖掘子网之间的联合注意力质量指标、结合对行为习惯偏好挖掘子网的生成结果的热门描述空间语义估计对应的估计质量指标、结合对每一行为习惯偏好挖掘子网的生成结果的整理对应的整理质量指标。模型调试质量指标可以结合任一部分获得,也可以结合至少两部分的综合分析结果确定。
step103、结合上述模型调试质量指标改进AI学习模型。
本申请实施例中并不限定具体的改进方法,可以理解是,可以通过最优算法(比如:梯度下降法)对AI学习模型的配置变量进行优化。在模型调试质量指标小于设定质量指标时,可以确定改进满足要求,这种判断分支下的AI学习模型可以直接使用。在该模型调试质量指标大于或者等于设定质量指标时,可以反向优化AI学习模型的配置变量,直到获得的模型调试质量指标小于设定质量指标。其中设定质量指标可以为基于实际情况进行设置。
如此设计,可以结合模型调试质量指标改进AI学习模型,使得调试获得的AI学习模型可以对线上业务办理记录进行准确且全面地描述内容挖掘,获得精度及可信度较高的行为习惯描述。
对于一种可独立实施的实施例而言,确定独立注意力质量指标可以通过如下step201-step203实现。
step201、利用已认证第一行为习惯描述内容和先验知识,确定第一独立注意力质量指标。
step202、利用已认证第二行为习惯描述内容和先验知识,确定第二独立注意力质量指标。
对于本公开实施例而言,每个行为习惯偏好挖掘子网都会产生独立注意力质量指标,比如可以包括三个行为习惯偏好挖掘子网,其中,功能层G10输出已认证第一行为习惯描述内容,因此功能层G10对应的独立注意力质量指标可以为第一独立注意力质量指标,子网partnet_20生成的已认证第一目标行为习惯描述内容和子网partnet_30生成的已认证第二目标行为习惯描述内容形成已认证第二行为习惯描述内容,因此第二独立注意力质量指标包括子网partnet_20对应的独立注意力质量指标和子网partnet_30对应的独立注意力质量指标。对于本公开实施例而言,任一独立注意力质量指标都可以包括办理指示需求事件分析偏差(事件识别损失)和事件差异化处理偏差(事件分类损失)。
可以理解的是,其中一个行为习惯偏好挖掘子网对应的独立注意力质量指标结合同一思路获得,以功能层G10对应的独立注意力质量指标为例,可以结合已认证第一行为习惯描述内容进行办理指示需求事件估计,获得办理指示需求事件估计结果,基于办理指示需求事件估计结果与先验知识的偏差确定办理指示需求事件分析偏差。对于本公开实施例而言,并不限定办理指示需求事件估计示例性方法,其可以结合完成调试的估计网络执行。可以理解,已认证线上业务办理记录reportA中的实际事件为第一可视化指导事件编号对应的可视化指导事件,其对应的先验知识反映上述已认证线上业务办理记录reportA中的可视化指导事件对应于第一可视化指导事件编号的可能性为“1”,对应于其它可视化指导事件编号的可能性为“0”;而上述办理指示需求事件估计结果中包括已认证线上业务办理记录reportA中的可视化指导事件逐一属于第p可视化指导事件编号的可能性(p小于等于B),根据上述绑定先验知识与上述办理指示需求事件估计结果的比较结果可以获得上述办理指示需求事件分析偏差,对于本公开实施例而言对上办理指示需求事件分析偏差的实际算法不限。
在本公开实施例中,对于功能层G10,可以根据已认证线上业务办理记录队列的办理指示需求事件估计结果和已认证线上业务办理记录队列中已认证线上业务办理记录具有的办理指示需求事件,确定第一簇共性值(簇内共性)和第二簇共性值(簇间共性)。通过以上第一簇共性值和以上第二簇共性值的比较结果,确定获得上述事件差异化处理偏差。在实际实施时,根据已认证线上业务办理记录队列中已认证线上业务办理记录具有的办理指示需求事件可以确定已认证线上业务办理记录的类别,已认证线上业务办理记录队列的办理指示需求事件估计结果中涵盖每个已认证线上业务办理记录对应的办理指示需求事件估计结果,确定对应于相同类别的随机两个已认证线上业务办理记录对应的办理指示需求事件估计结果之间的量化差异,将数值最大的量化差异确定为该簇对应的簇内共性,将各个簇内共性的MAX确定为第一簇共性值。将属于不同簇的随机两个已认证线上业务办理记录对应的办理指示需求事件估计结果之间的量化差异的MAX确定为上述第二簇共性值。
step203、利用第一独立注意力质量指标和第二独立注意力质量指标,确定独立注意力质量指标。
对于本公开实施例而言,通过确定各个行为习惯偏好挖掘子网对应的独立注意力质量指标,可以方便提高独立行为习惯偏好挖掘子网的行为习惯偏好挖掘性能,最后提高AI学习模型的行为习惯偏好挖掘性能。
对于一种可独立实施的实施例而言,不同的行为习惯偏好挖掘子网生成的结果对应于不同的特征注意力层面,因此产生联合注意力质量指标。进一步的,确定联合注意力质量指标的思路示例性的可以包括如下step301和step302所记录的内容。
step301、对已认证第一行为习惯描述内容和已认证第二行为习惯描述内容进行去量纲精简处理,获得若干个已认证去量纲精简型描述。
在一些可能的示例中,已认证第一行为习惯描述内容和已认证第二行为习惯描述内容在进行去量纲精简处理之前,还可以进行整体化下采样操作,削弱获得的已认证去量纲精简型描述的维度。
step302、确定若干个已认证去量纲精简型描述之间的联合注意力质量指标,联合注意力质量指标涵盖如下一项或多项:若干个已认证去量纲精简描述之间的目标联合注意力质量指标、若干个已认证去量纲精简描述之间的线上业务办理记录联合注意力质量指标。
对于本公开实施例而言,通过一起进行去量纲精简处理后获得的若干个已认证去量纲精简描述可以被视为对应于同一特征注意力层面。虽然已认证去量纲精简描述都对应于同一特征注意力层面,但是其源于不同的行为习惯偏好挖掘子网,因此,若干个已认证去量纲精简描述之间生成目标联合注意力质量指标和线上业务办理记录联合注意力质量指标,其中,联合注意力质量指标可以理解为跨注意力的损失。
在另外的一些实施例中,通过去量纲精简之后各行为习惯描述内容被变更为已认证去量纲精简描述,本公开实施例认为以办理指示需求事件作为基准,换言之,匹配于同一办理指示需求事件已认证去量纲精简描述彼此间的量化差异,应该小于匹配于不同办理指示需求事件的已认证去量纲精简描述之间的量化差异,从这一层面对于已认证去量纲精简描述进行限制便产生了目标联合注意力质量指标。
对于本公开实施例而言step302计算获得的联合注意力质量指标可以为目标联合注意力质量指标和线上业务办理记录联合注意力质量指标的统计值,或全局汇总值。对于本公开实施例而言,通过获得已认证去量纲精简型描述,使得不同对应于不同特征注意力层面的数据信息能够统一到相同特征注意力层面,并且计算已认证去量纲精简型描述对应的目标联合注意力质量指标和线上业务办理记录联合注意力质量指标。基于限制每个行为习惯偏好挖掘子网各自聚焦不同的角度,进而能够提高其用户行为习惯偏好挖掘性能。
在一些可能的示例中,目标联合注意力质量指标的计算思路可以包括:对若干个已认证去量纲精简描述进行结合办理指示需求事件的特征分析,获得目标特征分析结果,目标特征分析结果的同一簇中的已认证去量纲精简型描述匹配于同一办理指示需求事件;根据目标特征分析结果确定第一簇共性值和第二簇共性值;根据第一簇共性值和上述第二簇共性值的比较结果,获得目标联合注意力质量指标。其中,第一簇共性值和第二簇共性值的计算思路可以结合上述内容,本公开实施例在此不作过多描述。
可以理解的是,基于确定以上目标联合注意力质量指标,从办理指示需求事件的层面限制已认证去量纲精简描述之间的关系,提升了模型调试质量指标确定的精度和可信度。
对于一种可独立实施的实施例而言,确定线上业务办理记录联合注意力质量指标,示例性的可以包括如下内容。
step401、确定其中两个第一关联习惯描述之间的第一量化差异,两个第一关联习惯描述为匹配于不同已认证线上业务办理记录中同一办理指示需求事件两个已认证去量纲精简型描述。
step402、确定其中两个第二关联习惯描述之间的第二量化差异;两个第二关联习惯描述为匹配于相同已认证线上业务办理记录中同一办理指示需求事件两个已认证去量纲精简型描述。
step403、确定上述第一量化差异中的满足第一约束的第一量化差异。
例如,满足第一约束的第一量化差异为最小第一量化差异。
step404、确定上述第二量化差异中的满足第二约束的第二量化差异。
例如,满足第二约束的第二量化差异为最大第二量化差异。
step405、根据上述满足第一约束的第一量化差异和上述满足第二约束的第二量化差异的比较结果,获得上述线上业务办理记录联合注意力质量指标。
对于本公开实施例而言,AI学习模型除去末尾一个行为习惯偏好挖掘子网之外,每个行为习惯偏好挖掘子网对应的行为习惯描述内容都可以被加载至对应的热门描述集解析子网,每个热门描述集解析子网也可以对应产生偏差,该偏差可被视为是结合对上述行为习惯偏好挖掘子网的生成结果的热门描述空间语义估计对应的估计质量指标。
对于一些独立性实施例而言,还公开一种确定估计质量指标的思路,可以包括如下内容。
step501、利用已认证第一行为习惯描述内容和已认证第二行为习惯描述内容,确定每一热门描述集解析子网的原料。
示例性的,功能层G10对应的热门描述集解析子网pop10的原料可以理解为已认证第一行为习惯描述内容,子网partnet_20对应的热门描述集解析子网pop20的原料可以理解为上述已认证第二行为习惯描述内容中的已认证第一目标行为习惯描述内容。
step502、确定每一热门描述集解析子网生成的热门评价指数列表,热门评价指数列表反映原料对应的热门描述空间语义。
step503、对原料进行结合空间语义的热门状态识别,获得热门评价指数模板列表。
基于以上内容,可以将原料进行结合空间语义的拆解,获得若干个空间关联成员集,进行基于成员集顺序的行为习惯描述内容边缘化后获得边缘化清单,通过边缘化清单可以反映已认证线上业务办理记录中的办理指示需求事件的质量贡献,确定热门评价指数模板列表。还可以对原料进行结合注意力的下采样处理和结合相对关系的下采样处理,获得上述热门评价指数模板列表。
对于一种可独立实施的实施例而言,确定热门评价指数模板列表,示例性的可以包括如下内容。
step5031、对原料进行结合描述集的边缘化,根据边缘化清单确定第一量化视觉记录。
对于本公开实施例而言,将原料进行结合空间语义的拆解,可以获得拆解结果,对拆解结果中每个描述成员对应的空间关联成员集进行边缘化,获得对应的空间关联成员集边缘化清单,将其记录在空间关联成员集边缘化清单的数据库中。比如,热门评价指数列表可以为4*4分布列表,拆解结果相应的也可以是4*4分布列表,由此,每个空间关联成员集边缘化清单中也包括4*4个空间关联成员集。可以将每个描述成员对应的空间关联成员集相关信息删除,获得对应的空间关联成员集边缘化清单。对每个空间关联成员集边缘化清单,结合空间关联成员集边缘化清单进行事件挖掘可以确定其对应的办理指示需求事件分析偏差,从而获得各个空间关联成员集对应的事件挖掘结果损失,进而可以对应确定4*4的事件挖掘结果代价分布,对事件挖掘结果代价分布进行去量纲精简,便能够获得第一量化视觉记录。对于本公开实施例而言办理指示需求事件分析偏差的计算思路可以参阅以上所记录的内容,本公开实施例在此不作过多描述。
step5032、对原料逐一进行结合注意力的下采样处理和结合相对关系的下采样处理,获得第二量化视觉记录。
对于本公开实施例而言,将原料立刻进行结合注意力的下采样处理,可以获得第一下采样结果。通过将第一下采样结果进行结合相对关系的下采样处理,可以获得第二下采样结果,即通过对第一下采样结果进一步进行下采样处理,使得获得的第二下采样结果对应的分布列表与第一量化视觉记录的规模相同。
step5033、根据第一量化视觉记录和第二量化视觉记录,确定热门评价指数模板列表。
在一些可能的示例中,可以对第一量化视觉记录和第二量化视觉记录进行整理,获得热门评价指数模板列表。可以理解,可以将第一量化视觉记录和第二量化视觉记录的基于描述成员顺序的整理结果确定为热门评价指数模板列表。示例性的,可以将第一量化视觉记录和第二量化视觉记录进行一对一匹配处理,从而确定出热门评价指数模板列表。
step504、利用热门评价指数模板列表和热门评价指数列表,确定估计质量指标。
对于本公开实施例而言,对于每个热门描述集解析子网,都可以确定其生成的热门评价指数列表和对应的热门评价指数模板列表,根据该热门评价指数列表和对应的热门评价指数模板列表的比较结果可以确定该热门描述集解析子网对应的质量指标。
对于本公开实施例而言,通过从办理指示需求事件分析偏差的层面确定第一量化视觉记录,从原料本身解析的层面确定第二量化视觉记录,并将根据第一量化视觉记录和第二量化视觉记录获得的热门评价指数模板列表确定为示例性信息确定热门描述集解析子网对应的估计质量指标,能够提高对估计质量指标的确定的精度,结合该估计质量指标可以改进热门描述集解析子网,提升热门描述空间语义的分析精度。
进一步的,为了规避立刻对各行为习惯偏好挖掘子网生成的行为习惯描述内容进行整理而可能对应的噪声,确定整理质量指标的思路,可以包括如下内容:确定各行为习惯偏好挖掘子网对应的调试命中率;确定各行为习惯偏好挖掘子网对应的估计可信权重;根据调试命中率和估计可信权重,计算整理质量指标。
对于本公开实施例而言,调试命中率可以理解为行为习惯偏好挖掘子网对应的调试精度或者调试准确度,估计可信权重可以理解为预测置信度分值。
在一些可能的示例中,可以通过相关算法确定整理质量指标。比如,可通过结合指数算法(比如幂指数算法)获得的整理质量指标,这样能够扩大不同子网的质量区分度,有助于提升整理质量指标的识别质量。对于本公开实施例而言通过在模型调试质量指标中包含整理质量指标,可以在调试进行过程中保障各个行为习惯偏好挖掘子网的调试命中率的进一步提高,从而提升AI学习模型的行为习惯偏好挖掘质量,获得更加完整的用户行为习惯偏好。
在本公开实施例中,所述线上业务办理记录的行为习惯挖掘信息能够反映不同用户在进行线上业务办理时候的操作习惯或者行为偏好,由于用户的操作具有“千人千面”的特点,因而线上业务办理系统可以根据该行为习惯挖掘信息进行进一步地用户交互优化,从而主动性地匹配用户的业务办理需求。基于此,在上述内容的基础上,对于一些可独立实施的设计思路而言,在获得所述线上业务办理记录的行为习惯挖掘信息,该方法还可以包括如下内容:基于所述行为习惯挖掘信息,确定目标用户行为导向特征;基于所述目标用户行为导向特征,对目标业务功能进行升级处理。
举例而言,目标用户行为导向特征可以反映用户的业务办理需求,比如目标用户行为导向特征可以是“先放大界面再点击”,则表明用户需求是“希望可视化交互按键更大一点”,基于此,可以对“可视化交互案件”的业务功能模块进行升级处理,从而在后续用户进行业务处理时直接显示更大的可视化交互按键。
在另外的一些独立性实施例中,基于所述行为习惯挖掘信息,确定目标用户行为导向特征,可以包括如下内容:基于所述所述行为习惯挖掘信息确定涵盖目标业务用户标签的目标行为习惯描述集,对所述目标行为习惯描述集进行交互环节分解处理,得到所述目标行为习惯描述集对应的环节型行为习惯描述组;确定所述目标行为习惯描述集对应的目标行为预测网络,通过所述目标行为预测网络从所述环节型行为习惯描述组中提取第一语义预测结果和第二语义预测结果,将所述第一语义预测结果和所述第二语义预测结果进行预测结果融合,得到与所述目标行为习惯描述集相关联的行为习惯描述组融合预测结果;根据所述行为习惯描述组融合预测结果、所述目标行为预测网络,对所述环节型行为习惯描述组进行行为导向分析,得到所述环节型行为习惯描述组对应的行为导向分析结果,根据所述行为导向分析结果确定目标用户行为导向特征。
如此设计,可以结合不同类型语义的行为预测结果进行准确可靠的行为导向分析,这样能够完整地确定出行为导向分析结果,从而保障行为导向分析结果不会出现缺失,提高后续业务功能升级处理的质量。
图3是示出可以实现本公开的实施例的应用于线上业务办理的大数据挖掘方法的应用环境的架构示意图,应用于线上业务办理的大数据挖掘方法的应用环境中可以包括互相通信的线上业务办理系统100和线上业务操作终端200。基于此,线上业务办理系统100和线上业务操作终端200在运行时实现或者部分实现本公开实施例的应用于线上业务办理的大数据挖掘方法。
以上已经结合附图描述了本公开的实施例,至少具有如下有益效果:可以在对线上业务办理记录进行尽可能细致的挖掘的前提下,提高针对非热门描述空间语义的业务交互数据的聚焦度,这样可以保障获取到的行为习惯挖掘信息能够蕴含尽可能丰富完整的价值内容,鉴于价值内容的特征区分度较高且细节信息较为丰富,因而可以通过这些价值内容进行更加完整的用户需求挖掘,从而指导线上业务进行针对性的服务优化和相关业务办理指示功能的升级。
以上所述,仅为本公开的较佳实施例而已,并非用于限定本公开的保护范围。
Claims (10)
1.一种应用于线上业务办理的大数据挖掘方法,其中,所述方法的由线上业务办理系统实施,所述方法至少包括:
对所收集的线上业务办理记录进行用户行为习惯偏好挖掘,获得第一行为习惯描述分布;对所述第一行为习惯描述分布进行多样化行为习惯偏好挖掘,获得第一行为习惯描述内容,所述多样化行为习惯偏好挖掘包括注意力行为习惯偏好挖掘;
结合所述第一行为习惯描述内容中的热门行为习惯描述,对所述第一行为习惯描述分布进行筛选;挖掘筛选信息中的第二行为习惯描述内容;整理所述第一行为习惯描述内容和所述第二行为习惯描述内容,获得所述线上业务办理记录的行为习惯挖掘信息。
2.根据权利要求1所述的方法,其中,所述挖掘筛选信息中的第二行为习惯描述内容,包括:边缘化所述筛选信息中的热门行为习惯描述,获得第二行为习惯描述分布;
所述边缘化所述筛选信息中的热门行为习惯描述,获得第二行为习惯描述分布,包括:对所述筛选信息进行行为习惯偏好挖掘获得待处理行为习惯向量,对所述待处理行为习惯向量进行多样化行为习惯偏好挖掘获得第一目标行为习惯描述内容,以及结合所述第一目标行为习惯描述内容中的热门行为习惯描述,对所述待处理行为习惯向量进行筛选,获得所述第二行为习惯描述分布;在未满足指定的终止要求时,利用所述第二行为习惯描述分布调整所述筛选信息,反复实施所述边缘化所述筛选信息中的热门行为习惯描述,获得第二行为习惯描述分布的过程;在满足所述终止要求时,将所收集的各所述第一目标行为习惯描述内容皆视为所述第二行为习惯描述内容。
3.根据权利要求2所述的方法,其中,所述挖掘筛选信息中的第二行为习惯描述内容,还包括:
确定目标第二行为习惯描述分布,所述目标第二行为习惯描述分布为满足所述终止要求时所收集的第二行为习惯描述分布;
对所述目标第二行为习惯描述分布进行多样化行为习惯偏好挖掘,获得第二目标行为习惯描述内容;
将所述第二目标行为习惯描述内容确定为所述第二行为习惯描述内容。
4.根据权利要求1所述的方法,其中,所述结合所述第一行为习惯描述内容中的热门行为习惯描述,对所述第一行为习惯描述分布进行筛选,包括:
结合所述第一行为习惯描述内容中的热门行为习惯描述,确定热门描述空间语义;
对所述第一行为习惯描述分布中匹配于所述热门描述空间语义的待定行为习惯描述集进行筛选;
其中,所述结合所述第一行为习惯描述内容中的热门行为习惯描述,确定热门描述空间语义,包括:对所述第一行为习惯描述内容进行结合空间语义的拆解,获得拆解结果;确定所述拆解结果中每个描述成员对应空间关联成员集的热门评价指数,获得热门评价指数列表;利用所述热门评价指数列表,确定所述热门描述空间语义;
其中,所述对所述第一行为习惯描述分布中匹配于所述热门描述空间语义的待定行为习惯描述集进行筛选,包括:
利用所述热门描述空间语义确定差异化处理窗口,所述差异化处理窗口用于清洗所述热门描述空间语义对应的行为习惯描述;
整理所述差异化处理窗口与所述第一行为习惯描述分布。
5.根据权利要求1所述的方法,其中,所述对所述第一行为习惯描述分布进行多样化行为习惯偏好挖掘,获得第一行为习惯描述内容,包括:
对所述第一行为习惯描述分布进行用户行为习惯偏好挖掘,获得第一挖掘清单;
对所述第一行为习惯描述分布进行注意力描述挖掘,获得第二挖掘清单;
整理所述第一挖掘清单和所述第二挖掘清单,获得所述第一行为习惯描述内容。
6.根据权利要求1所述的方法,其中,所述方法由AI学习模型实现,所述AI学习模型的调试步骤包括:
将配置有先验知识的已认证线上业务办理记录加载到所述AI学习模型的K个行为习惯偏好挖掘子网,获得已认证第一行为习惯描述内容和已认证第二行为习惯描述内容,K为大于1的整数;
结合所述已认证第一行为习惯描述内容、所述已认证第二行为习惯描述内容和所述先验知识,确定所述AI学习模型对应的模型调试质量指标;
结合所述模型调试质量指标改进所述AI学习模型;
其中,所述模型调试质量指标结合如下的其中部分确定:各所述行为习惯偏好挖掘子网对应的独立注意力质量指标、各所述行为习惯偏好挖掘子网之间的联合注意力质量指标、结合对所述行为习惯偏好挖掘子网的生成结果的热门描述空间语义估计对应的估计质量指标、结合对各所述行为习惯偏好挖掘子网的生成结果的整理对应的整理质量指标;
其中,所述方法还包括确定整理质量指标,所述确定整理质量指标,包括:确定各行为习惯偏好挖掘子网对应的调试命中率;确定所述各行为习惯偏好挖掘子网对应的估计可信权重;利用所述调试命中率和所述估计可信权重,确定所述整理质量指标。
7.根据权利要求6所述的方法,其中,所述方法还包括确定所述独立注意力质量指标,所述确定所述独立注意力质量指标,包括:
利用所述已认证第一行为习惯描述内容和所述先验知识,确定第一独立注意力质量指标;
利用所述已认证第二行为习惯描述内容和所述先验知识,确定第二独立注意力质量指标;
利用所述第一独立注意力质量指标和所述第二独立注意力质量指标,确定所述独立注意力质量指标;
其中,所述方法还包括确定所述联合注意力质量指标,所述确定所述联合注意力质量指标,包括:
对所述已认证第一行为习惯描述内容和所述已认证第二行为习惯描述内容进行去量纲精简处理,获得若干个已认证去量纲精简型描述;
确定所述若干个已认证去量纲精简型描述之间的联合注意力质量指标,所述联合注意力质量指标涵盖如下一项或多项:所述若干个已认证去量纲精简描述之间的目标联合注意力质量指标、所述若干个已认证去量纲精简描述之间的线上业务办理记录联合注意力质量指标。
8.根据权利要求7所述的方法,其中,所述先验知识绑定有所述已认证线上业务办理记录中的办理指示需求事件,所述方法还包括确定所述目标联合注意力质量指标,所述确定所述目标联合注意力质量指标,包括:
对所述若干个已认证去量纲精简描述进行结合办理指示需求事件的特征分析,获得目标特征分析结果,所述目标特征分析结果的同一簇中的已认证去量纲精简型描述匹配于同一办理指示需求事件;
利用所述目标特征分析结果确定第一簇共性值和第二簇共性值;
利用所述第一簇共性值和所述第二簇共性值的比较结果,获得所述目标联合注意力质量指标;
其中,所述先验知识绑定有所述已认证线上业务办理记录中的办理指示需求事件,所述方法还包括确定所述线上业务办理记录联合注意力质量指标,所述确定所述线上业务办理记录联合注意力质量指标,包括:
确定其中两个第一关联习惯描述之间的第一量化差异,所述两个第一关联习惯描述为匹配于不同已认证线上业务办理记录中同一办理指示需求事件两个已认证去量纲精简型描述;
确定其中两个第二关联习惯描述之间的第二量化差异;所述两个第二关联习惯描述为匹配于相同已认证线上业务办理记录中同一办理指示需求事件两个已认证去量纲精简型描述;
确定所述第一量化差异中的满足第一约束的第一量化差异;以及确定所述第二量化差异中的满足第二约束的第二量化差异;
利用所述满足第一约束的第一量化差异和所述满足第二约束的第二量化差异的比较结果,获得所述线上业务办理记录联合注意力质量指标。
9.根据权利要求6所述的方法,其中,所述方法还包括确定所述估计质量指标,所述确定所述估计质量指标,包括:
利用所述已认证第一行为习惯描述内容和所述已认证第二行为习惯描述内容,确定每一热门描述集解析子网的原料;
确定所述每一热门描述集解析子网生成的热门评价指数列表,所述热门评价指数列表反映所述原料对应的热门描述空间语义;
对所述原料进行结合空间语义的热门状态识别,获得热门评价指数模板列表;
利用所述热门评价指数模板列表和所述热门评价指数列表,确定所述估计质量指标;
其中,所述对所述原料进行结合空间语义的热门状态识别,获得热门评价指数模板列表,包括:对所述原料进行结合描述集的边缘化,根据边缘化清单确定第一量化视觉记录;对所述原料逐一进行结合注意力的下采样处理和结合相对关系的下采样处理,获得第二量化视觉记录;利用所述第一量化视觉记录和所述第二量化视觉记录,确定所述热门评价指数模板列表。
10.一种线上业务办理系统,其中,包括:
用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现权利要求1-9任一项所述的方法的处理器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210338748.7A CN114638234B (zh) | 2022-03-31 | 2022-03-31 | 应用于线上业务办理的大数据挖掘方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210338748.7A CN114638234B (zh) | 2022-03-31 | 2022-03-31 | 应用于线上业务办理的大数据挖掘方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114638234A true CN114638234A (zh) | 2022-06-17 |
CN114638234B CN114638234B (zh) | 2022-11-15 |
Family
ID=81951362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210338748.7A Active CN114638234B (zh) | 2022-03-31 | 2022-03-31 | 应用于线上业务办理的大数据挖掘方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114638234B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115080963A (zh) * | 2022-07-07 | 2022-09-20 | 济南开耀网络技术有限公司 | 一种基于云计算的智慧金融数据防护方法及服务器 |
CN115455451A (zh) * | 2022-09-23 | 2022-12-09 | 蔡玉娟 | 一种加密数据分级解密方法及ai系统 |
CN115658675A (zh) * | 2022-12-06 | 2023-01-31 | 遵义钟钟网络科技有限公司 | 应用于数据处理的噪声优化方法及ai系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718471A (zh) * | 2014-12-03 | 2016-06-29 | 中国科学院声学研究所 | 用户偏好建模方法、系统及用户偏好评估方法、系统 |
CN107094166A (zh) * | 2016-12-12 | 2017-08-25 | 口碑控股有限公司 | 一种业务信息发送方法及装置 |
CN111950708A (zh) * | 2020-08-11 | 2020-11-17 | 华中师范大学 | 一种发现大学生日常生活习惯的神经网络结构与方法 |
CN113469663A (zh) * | 2021-08-02 | 2021-10-01 | 东莞市爱学爱玩教育科技有限公司 | 一种结合人工智能的智慧业务信息分析方法及系统 |
US20210345001A1 (en) * | 2020-04-30 | 2021-11-04 | At&T Intellectual Property I, L.P. | Content recommendation techniques with reduced habit bias effects |
CN113971136A (zh) * | 2021-12-03 | 2022-01-25 | 杭银消费金融股份有限公司 | 基于图像识别的页面测试方法及系统 |
-
2022
- 2022-03-31 CN CN202210338748.7A patent/CN114638234B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718471A (zh) * | 2014-12-03 | 2016-06-29 | 中国科学院声学研究所 | 用户偏好建模方法、系统及用户偏好评估方法、系统 |
CN107094166A (zh) * | 2016-12-12 | 2017-08-25 | 口碑控股有限公司 | 一种业务信息发送方法及装置 |
US20210345001A1 (en) * | 2020-04-30 | 2021-11-04 | At&T Intellectual Property I, L.P. | Content recommendation techniques with reduced habit bias effects |
CN111950708A (zh) * | 2020-08-11 | 2020-11-17 | 华中师范大学 | 一种发现大学生日常生活习惯的神经网络结构与方法 |
CN113469663A (zh) * | 2021-08-02 | 2021-10-01 | 东莞市爱学爱玩教育科技有限公司 | 一种结合人工智能的智慧业务信息分析方法及系统 |
CN113971136A (zh) * | 2021-12-03 | 2022-01-25 | 杭银消费金融股份有限公司 | 基于图像识别的页面测试方法及系统 |
Non-Patent Citations (1)
Title |
---|
巩建光: "基于数据挖掘方法的电信行业增值业务精确营销研究", 《制造业自动化》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115080963A (zh) * | 2022-07-07 | 2022-09-20 | 济南开耀网络技术有限公司 | 一种基于云计算的智慧金融数据防护方法及服务器 |
CN115080963B (zh) * | 2022-07-07 | 2023-04-04 | 上海量化森林科技有限公司 | 一种基于云计算的智慧金融数据防护方法及服务器 |
CN115455451A (zh) * | 2022-09-23 | 2022-12-09 | 蔡玉娟 | 一种加密数据分级解密方法及ai系统 |
CN115455451B (zh) * | 2022-09-23 | 2023-10-24 | 北京国联视讯信息技术股份有限公司 | 一种加密数据分级解密方法及ai系统 |
CN115658675A (zh) * | 2022-12-06 | 2023-01-31 | 遵义钟钟网络科技有限公司 | 应用于数据处理的噪声优化方法及ai系统 |
CN115658675B (zh) * | 2022-12-06 | 2023-11-14 | 湖南风云通达信息科技有限公司 | 应用于数据处理的噪声优化方法及ai系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114638234B (zh) | 2022-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114638234B (zh) | 应用于线上业务办理的大数据挖掘方法及系统 | |
US8775338B2 (en) | Computer-implemented systems and methods for constructing a reduced input space utilizing the rejected variable space | |
CN112329816A (zh) | 数据分类方法、装置、电子设备和可读存储介质 | |
EP3726441A1 (en) | Company bankruptcy prediction system and operating method therefor | |
CN113190670A (zh) | 一种基于大数据平台的信息展示方法及系统 | |
EP1240566B1 (en) | Determining whether a variable is numeric or non-numeric | |
CN111897528B (zh) | 一种面向企业在线教育的低代码平台 | |
CN113449011A (zh) | 基于大数据预测的信息推送更新方法及大数据预测系统 | |
CN113449012A (zh) | 基于大数据预测的互联网服务挖掘方法及大数据预测系统 | |
CN107203772B (zh) | 一种用户类型识别方法及装置 | |
CN112287014A (zh) | 产品信息可视化处理方法、装置、计算机设备 | |
CN110598126B (zh) | 基于行为习惯的跨社交网络用户身份识别方法 | |
CN114913021A (zh) | 针对数字金融大数据的交互服务分析方法及系统 | |
CN113159213A (zh) | 一种业务分配方法、装置及设备 | |
CN113032676A (zh) | 基于微反馈的推荐方法和系统 | |
CN116151815A (zh) | 一种基于特征因子的支付方式推荐方法及系统 | |
CN114268625B (zh) | 特征选择方法、装置、设备及存储介质 | |
US20220171985A1 (en) | Item recommendation with application to automated artificial intelligence | |
CN114661998A (zh) | 基于互联网热点话题的大数据处理方法及系统 | |
Zheng et al. | Modeling stochastic service time for complex on-demand food delivery | |
CN111752985A (zh) | 一种主体画像生成的方法、装置和存储介质 | |
CN116610783B (zh) | 基于人工智能决策的服务优化方法及数字化在线页面系统 | |
CN117217392B (zh) | 一种通用装备保障需求的确定方法及装置 | |
CN117076962B (zh) | 应用于人工智能领域的数据分析方法、装置及设备 | |
CN115344880B (zh) | 应用于数字云的信息安全分析方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20221028 Address after: Room 908, Building 2, No. 968 Jinzhong Road, Changning District, Shanghai, 200000 (the actual floor is 8 floors) Applicant after: CUMMY TECHNOLOGY (SHANGHAI) Co.,Ltd. Address before: Room 1503, building 2, Zhengda cubic building, Jingyue Development Zone, Changchun, Jilin 130117 Applicant before: Fang Hongwei |
|
GR01 | Patent grant | ||
GR01 | Patent grant |