CN114139552A - 基于大数据的可视化智能数据挖掘方法及系统 - Google Patents

基于大数据的可视化智能数据挖掘方法及系统 Download PDF

Info

Publication number
CN114139552A
CN114139552A CN202111281433.5A CN202111281433A CN114139552A CN 114139552 A CN114139552 A CN 114139552A CN 202111281433 A CN202111281433 A CN 202111281433A CN 114139552 A CN114139552 A CN 114139552A
Authority
CN
China
Prior art keywords
session
mined
intelligent information
visual intelligent
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111281433.5A
Other languages
English (en)
Inventor
徐涛
张保友
张军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yiwei Technology Co ltd
Original Assignee
Shanghai Yiwei Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yiwei Technology Co ltd filed Critical Shanghai Yiwei Technology Co ltd
Priority to CN202111281433.5A priority Critical patent/CN114139552A/zh
Publication of CN114139552A publication Critical patent/CN114139552A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供的基于大数据的可视化智能数据挖掘方法及系统,对于获取的若干待挖掘业务会话项目的第一可视化智能信息簇,首先,通过在诸多第一可视化智能信息簇中,定位出多维度约束条件符合指定多维度约束条件的可视化智能信息,即不少于一组第二可视化智能信息;然后,在不少于一组第二可视化智能信息中,分析每一个待挖掘业务会话项目的全局性描述。如此,通过指定多维度约束条件内收集到的可视化智能信息,进行业务会话项目全局性描述的分析,能够有效确定出尽可能多的第二可视化智能信息中待挖掘业务会话项目的全局性描述,从而提高对尽可能多的可视化智能信息进行会话兴趣挖掘的质量和可信度。

Description

基于大数据的可视化智能数据挖掘方法及系统
技术领域
本申请涉及可视化数据挖掘技术领域,具体而言,涉及基于大数据的可视化智能数据挖掘方法及系统。
背景技术
随着近来计算机技术和互联网的发展,大数据这个名词越来越多地进入到我们的视野中,大数据的快速发展也无时刻影响着我们的生活。现如今,大数据挖掘技术的应用领域越来越广泛,从最初的文本数据已经拓展到可视化数据。然而在实际应用过程中发明人发现,如何确保针对可视化智能信息的高效可信挖掘是现目前需要攻克的一个技术难题。
发明内容
鉴于此,本申请提供了基于大数据的可视化智能数据挖掘方法及系统。
第一方面,提供一种基于大数据的可视化智能数据挖掘方法,应用于智能数据挖掘系统,所述方法包括:
确定存在差异的多维度约束条件内的若干待挖掘业务会话项目的第一可视化智能信息簇;在所述第一可视化智能信息簇中,确定多维度约束条件符合指定多维度约束条件的不少于一组第二可视化智能信息;
确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果。
在一种独立实施的实施例中,所述确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果,包括:
借助指定语义特征集,确定所述若干待挖掘业务会话项目的语义关键词和衍生会话描述;
在所述不少于一组第二可视化智能信息中,确定每一语义关键词的待挖掘业务会话项目的第一量化统计结果和每一衍生会话描述的待挖掘业务会话项目的第二量化统计结果。
在一种独立实施的实施例中,所述在所述不少于一组第二可视化智能信息中,确定每一语义关键词的待挖掘业务会话项目的第一量化统计结果,包括:
通过所述若干待挖掘业务会话项目的语义关键词,对所述不少于一组第二可视化智能信息进行差异化分析,得到多组语义可视化智能信息;
确定每一组语义可视化智能信息中包括的待挖掘业务会话项目的量化统计结果,为所述第一量化统计结果。
在一种独立实施的实施例中,在所述不少于一组第二可视化智能信息中,每一衍生会话描述的待挖掘业务会话项目的第二量化统计结果,包括:
通过所述若干待挖掘业务会话项目的衍生会话描述,对所述不少于一组第二可视化智能信息进行差异化分析,得到多组衍生可视化智能信息;
确定每一组衍生可视化智能信息中包括的待挖掘业务会话项目的量化统计结果,为所述第二量化统计结果。
在一种独立实施的实施例中,所述确定存在差异的多维度约束条件内的若干待挖掘业务会话项目的第一可视化智能信息簇,包括:
获取所述若干待挖掘业务会话项目在所述存在差异的多维度约束条件内的会话互动操作内容;
通过所述若干待挖掘业务会话项目的会话互动操作内容,确定涵盖每一待挖掘业务会话项目在所述存在差异的多维度约束条件内的会话描述关系网的第一可视化智能信息簇。
在一种独立实施的实施例中,所述通过所述若干待挖掘业务会话项目的会话互动操作内容,确定涵盖每一待挖掘业务会话项目在所述存在差异的多维度约束条件内的会话描述关系网的第一可视化智能信息簇,包括:
将指向同一待挖掘业务会话项目的会话互动操作内容进行会话描述关系网翻译,得到多条会话描述关系网;其中,每一个会话描述关系网中的会话描述关系网单元对应于同一待挖掘业务会话项目;
借助每一所述待挖掘业务会话项目的语义标签和语义关键词,对每一所述待挖掘业务会话项目对应的会话描述关系网进行挖掘,得到每一所述待挖掘业务会话项目的已挖掘会话描述关系网;
通过所述若干待挖掘业务会话项目的已挖掘会话描述关系网,确定所述第一可视化智能信息簇。
在一种独立实施的实施例中,所述将指向同一待挖掘业务会话项目的会话互动操作内容进行会话描述关系网翻译,得到多条会话描述关系网,包括:
将指向同一待挖掘业务会话项目的会话互动操作内容进行特征分析,得到多种会话互动操作内容;其中,每一种会话互动操作内容对应于同一待挖掘业务会话项目;
将任一种会话互动操作内容中的每一组会话互动操作内容作为会话描述关系网单元,构成所述任一种会话互动操作内容所属待挖掘业务会话项目的会话描述关系网,以得到所述多条会话描述关系网。
在一种独立实施的实施例中,所述多维度约束条件包括:时序约束和分布约束,所述在所述第一可视化智能信息簇中,确定多维度约束条件符合指定多维度约束条件的不少于一组第二可视化智能信息,包括:
在所述第一可视化智能信息簇中,确定收集时段处于指定时序约束内不少于一组第三可视化智能信息;
在所述不少于一组第三可视化智能信息中,确定可视化智能信息的信息收集线程的分布约束处于指定约束条件集的所述不少于一组第二可视化智能信息。
在一种独立实施的实施例中,在所述会话兴趣挖掘结果包括每一语义关键词的待挖掘业务会话项目的第一量化统计结果和每一衍生会话描述的待挖掘业务会话项目的第二量化统计结果的情况下,所述确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果之后,所述方法还包括:
在若干语义关键词对应的第一量化统计结果和若干衍生会话描述对应的第二量化统计结果中,分别确定量化统计结果在前X个的目标第一量化统计结果和目标第二量化统计结果;其中,X为不小于1的整数;
确定所述目标第一量化统计结果以及所述目标第一量化统计结果对应的语义关键词,和所述目标第二量化统计结果以及所述目标第二量化统计结果对应的衍生会话描述。
第二方面,提供一种基于大数据的可视化智能数据挖掘系统,其特征在于,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
本申请实施例所提供的基于大数据的可视化智能数据挖掘方法及系统,对于获取的若干待挖掘业务会话项目的第一可视化智能信息簇,首先,通过在诸多第一可视化智能信息簇中,定位出多维度约束条件符合指定多维度约束条件的可视化智能信息,即不少于一组第二可视化智能信息;然后,在不少于一组第二可视化智能信息中,分析每一个待挖掘业务会话项目的全局性描述。如此,通过指定多维度约束条件内收集到的可视化智能信息,进行业务会话项目全局性描述的分析,能够有效确定出尽可能多的第二可视化智能信息中待挖掘业务会话项目的全局性描述,从而提高对尽可能多的可视化智能信息进行会话兴趣挖掘的质量和可信度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种基于大数据的可视化智能数据挖掘方法的流程图。
图2为本申请实施例所提供的一种基于大数据的可视化智能数据挖掘装置的框图。
图3为本申请实施例所提供的一种基于大数据的可视化智能数据挖掘系统的架构图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
请参阅图1,示出了一种基于大数据的可视化智能数据挖掘方法,该方法可以包括以下步骤100和步骤200所描述的技术方案。
步骤100,确定存在差异的多维度约束条件内的若干待挖掘业务会话项目的第一可视化智能信息簇;在所述第一可视化智能信息簇中,确定多维度约束条件符合指定多维度约束条件的不少于一组第二可视化智能信息。
步骤200,确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果。
可以理解,在执行上述步骤100和步骤200所描述的内容时,对于获取的若干待挖掘业务会话项目的第一可视化智能信息簇,首先,通过在诸多第一可视化智能信息簇中,定位出多维度约束条件符合指定多维度约束条件的可视化智能信息,即不少于一组第二可视化智能信息;然后,在不少于一组第二可视化智能信息中,分析每一个待挖掘业务会话项目的全局性描述。如此,通过指定多维度约束条件内收集到的可视化智能信息,进行业务会话项目全局性描述的分析,能够有效确定出尽可能多的第二可视化智能信息中待挖掘业务会话项目的全局性描述,从而提高对尽可能多的可视化智能信息进行会话兴趣挖掘的质量和可信度。
在实际实施该技术方案时,发明人经过长期分析发现,确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果时,存在语义特征集不可靠的问题,从而难以可靠地确定会话兴趣挖掘结果,为了改善上述技术问题,步骤200所描述的确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果的步骤,具体可以包括以下步骤210和步骤220所描述的内容。
步骤210,借助指定语义特征集,确定所述若干待挖掘业务会话项目的语义关键词和衍生会话描述。
步骤220,在所述不少于一组第二可视化智能信息中,确定每一语义关键词的待挖掘业务会话项目的第一量化统计结果和每一衍生会话描述的待挖掘业务会话项目的第二量化统计结果。
可以理解,在执行上述步骤210和步骤220所描述的内容时,确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果时,改善语义特征集不可靠的问题,从而能够可靠地确定会话兴趣挖掘结果。
在此情形下,本实施例中,在所述不少于一组第二可视化智能信息中时,存在语义关键词不准确的问题,从而难以准确地确定每一语义关键词的待挖掘业务会话项目的第一量化统计结果,为了改善上述技术问题,步骤220所描述的在所述不少于一组第二可视化智能信息中,确定每一语义关键词的待挖掘业务会话项目的第一量化统计结果的步骤,具体可以包括以下步骤221和步骤222所描述的内容。
步骤221,通过所述若干待挖掘业务会话项目的语义关键词,对所述不少于一组第二可视化智能信息进行差异化分析,得到多组语义可视化智能信息。
步骤222,确定每一组语义可视化智能信息中包括的待挖掘业务会话项目的量化统计结果,为所述第一量化统计结果。
可以理解,在执行上述步骤221和步骤222所描述的内容时,在所述不少于一组第二可视化智能信息中时,改善语义关键词不准确的问题,从而能够准确地确定每一语义关键词的待挖掘业务会话项目的第一量化统计结果。
在此情形下,本实施例中,在所述不少于一组第二可视化智能信息中时,存在差异化分析不准确的问题,从而难以准确地确定每一衍生会话描述的待挖掘业务会话项目的第二量化统计结果,为了改善上述技术问题,步骤221所描述的在所述不少于一组第二可视化智能信息中,每一衍生会话描述的待挖掘业务会话项目的第二量化统计结果的步骤,具体可以以下步骤221a和步骤221b所描述的内容。
步骤221a,通过所述若干待挖掘业务会话项目的衍生会话描述,对所述不少于一组第二可视化智能信息进行差异化分析,得到多组衍生可视化智能信息。
步骤221b,确定每一组衍生可视化智能信息中包括的待挖掘业务会话项目的量化统计结果,为所述第二量化统计结果。
可以理解,在执行上述步骤221a和步骤221b所描述的内容时,在所述不少于一组第二可视化智能信息中时,改善差异化分析不准确的问题,从而能够准确地确定每一衍生会话描述的待挖掘业务会话项目的第二量化统计结果。
在实际实施该技术方案时,发明人经过长期分析发现,在确定存在差异的多维度约束条件内的若干待挖掘业务会话项目的第一可视化智能信息簇时,存在多维度约束条件不准确的问题,从而难以准确地确定第一可视化智能信息簇,为了改善上述技术问题,步骤100所描述的确定存在差异的多维度约束条件内的若干待挖掘业务会话项目的第一可视化智能信息簇的步骤,具体可以包括以下步骤110和步骤120所描述的内容。
步骤110,获取所述若干待挖掘业务会话项目在所述存在差异的多维度约束条件内的会话互动操作内容。
步骤120,通过所述若干待挖掘业务会话项目的会话互动操作内容,确定涵盖每一待挖掘业务会话项目在所述存在差异的多维度约束条件内的会话描述关系网的第一可视化智能信息簇。
可以理解,在执行上述步骤110和步骤120所描述的内容时,,在确定存在差异的多维度约束条件内的若干待挖掘业务会话项目的第一可视化智能信息簇时,改善多维度约束条件不准确的问题,从而能够准确地确定第一可视化智能信息簇。
在实际实施该技术方案时,发明人经过长期分析发现,通过所述若干待挖掘业务会话项目的会话互动操作内容时,存在多条会话描述关系网不准确的问题,从而难以准确地确定涵盖每一待挖掘业务会话项目在所述存在差异的多维度约束条件内的会话描述关系网的第一可视化智能信息簇,为了改善上述技术问题,步骤120所描述的通过所述若干待挖掘业务会话项目的会话互动操作内容,确定涵盖每一待挖掘业务会话项目在所述存在差异的多维度约束条件内的会话描述关系网的第一可视化智能信息簇的步骤,具体可以包括以下步骤121-步骤123所描述的内容。
步骤121,将指向同一待挖掘业务会话项目的会话互动操作内容进行会话描述关系网翻译,得到多条会话描述关系网;其中,每一个会话描述关系网中的会话描述关系网单元对应于同一待挖掘业务会话项目。
步骤122,借助每一所述待挖掘业务会话项目的语义标签和语义关键词,对每一所述待挖掘业务会话项目对应的会话描述关系网进行挖掘,得到每一所述待挖掘业务会话项目的已挖掘会话描述关系网。
步骤123,通过所述若干待挖掘业务会话项目的已挖掘会话描述关系网,确定所述第一可视化智能信息簇。
可以理解,在执行上述步骤121-步骤123所描述的内容时,通过所述若干待挖掘业务会话项目的会话互动操作内容时,改善多条会话描述关系网不准确的问题,从而能够准确地确定涵盖每一待挖掘业务会话项目在所述存在差异的多维度约束条件内的会话描述关系网的第一可视化智能信息簇。
在实际实施该技术方案时,发明人经过长期分析发现,将指向同一待挖掘业务会话项目的会话互动操作内容进行会话描述关系网翻译时,存在特征分析不准确的问题,从而难以准确地得到多条会话描述关系网,为了改善上述技术问题,步骤121所描述的将指向同一待挖掘业务会话项目的会话互动操作内容进行会话描述关系网翻译,得到多条会话描述关系网的步骤,具体可以包括以下步骤121a和步骤121b所描述的内容。
步骤121a,将指向同一待挖掘业务会话项目的会话互动操作内容进行特征分析,得到多种会话互动操作内容;其中,每一种会话互动操作内容对应于同一待挖掘业务会话项目。
步骤121b,将任一种会话互动操作内容中的每一组会话互动操作内容作为会话描述关系网单元,构成所述任一种会话互动操作内容所属待挖掘业务会话项目的会话描述关系网,以得到所述多条会话描述关系网。
可以理解,在执行上述步骤121a和步骤121b所描述的内容时,将指向同一待挖掘业务会话项目的会话互动操作内容进行会话描述关系网翻译时,改善特征分析不准确的问题,从而能够准确地得到多条会话描述关系网。
在实际实施该技术方案时,发明人经过长期分析发现,在所述第一可视化智能信息簇中时,存在第三可视化智能信息不准确的问题,从而难以准确地确定多维度约束条件符合指定多维度约束条件的不少于一组第二可视化智能信息,为了改善上述技术问题,步骤100所描述的时序约束和分布约束,所述在所述第一可视化智能信息簇中,确定多维度约束条件符合指定多维度约束条件的不少于一组第二可视化智能信息的步骤,具体可以包括以下步骤a1和步骤a2所描述的内容。
步骤a1,在所述第一可视化智能信息簇中,确定收集时段处于指定时序约束内不少于一组第三可视化智能信息。
步骤a2,在所述不少于一组第三可视化智能信息中,确定可视化智能信息的信息收集线程的分布约束处于指定约束条件集的所述不少于一组第二可视化智能信息。
可以理解,在执行上述步骤a1和步骤a2所描述的内容时,在所述第一可视化智能信息簇中时,改善第三可视化智能信息不准确的问题,从而能够准确地确定多维度约束条件符合指定多维度约束条件的不少于一组第二可视化智能信息。
基于上述基础,在所述会话兴趣挖掘结果包括每一语义关键词的待挖掘业务会话项目的第一量化统计结果和每一衍生会话描述的待挖掘业务会话项目的第二量化统计结果的情况下,所述确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果之后,还可包括以下步骤s1和步骤s2所描述的内容。
步骤s1,在若干语义关键词对应的第一量化统计结果和若干衍生会话描述对应的第二量化统计结果中,分别确定量化统计结果在前X个的目标第一量化统计结果和目标第二量化统计结果;其中,X为不小于1的整数。
步骤s2,确定所述目标第一量化统计结果以及所述目标第一量化统计结果对应的语义关键词,和所述目标第二量化统计结果以及所述目标第二量化统计结果对应的衍生会话描述。
可以理解,在执行上述步骤步骤s1和步骤s2所描述的内容时,通过多个语义关键词进行统计,从而提高衍生会话描述的准确性。
在上述基础上,请结合参阅图2,提供了一种基于大数据的可视化智能数据挖掘装置200,应用于基于大数据的可视化智能数据挖掘系统,所述装置包括:
信息确定模块210,用于确定存在差异的多维度约束条件内的若干待挖掘业务会话项目的第一可视化智能信息簇;在所述第一可视化智能信息簇中,确定多维度约束条件符合指定多维度约束条件的不少于一组第二可视化智能信息;
结果挖掘模块220,用于确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果。
在上述基础上,请结合参阅图3,示出了一种基于大数据的可视化智能数据挖掘系统300,包括互相之间通信的处理器310和存储器320,所述处理器310用于从所述存储器320中读取计算机程序并执行,以实现上述的方法。
在上述基础上,还提供了一种计算机可读存储介质,其上存储的计算机程序在运行时实现上述的方法。
综上,基于上述方案,对于获取的若干待挖掘业务会话项目的第一可视化智能信息簇,首先,通过在诸多第一可视化智能信息簇中,定位出多维度约束条件符合指定多维度约束条件的可视化智能信息,即不少于一组第二可视化智能信息;然后,在不少于一组第二可视化智能信息中,分析每一个待挖掘业务会话项目的全局性描述。如此,通过指定多维度约束条件内收集到的可视化智能信息,进行业务会话项目全局性描述的分析,能够有效确定出尽可能多的第二可视化智能信息中待挖掘业务会话项目的全局性描述,从而提高对尽可能多的可视化智能信息进行会话兴趣挖掘的质量和可信度。
应当理解,上述所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有适应性的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种基于大数据的可视化智能数据挖掘方法,其特征在于,应用于智能数据挖掘系统,所述方法包括:
确定存在差异的多维度约束条件内的若干待挖掘业务会话项目的第一可视化智能信息簇;在所述第一可视化智能信息簇中,确定多维度约束条件符合指定多维度约束条件的不少于一组第二可视化智能信息;
确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果。
2.如权利要求1所述的方法,其特征在于,所述确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果,包括:
借助指定语义特征集,确定所述若干待挖掘业务会话项目的语义关键词和衍生会话描述;
在所述不少于一组第二可视化智能信息中,确定每一语义关键词的待挖掘业务会话项目的第一量化统计结果和每一衍生会话描述的待挖掘业务会话项目的第二量化统计结果。
3.如权利要求2所述的方法,其特征在于,所述在所述不少于一组第二可视化智能信息中,确定每一语义关键词的待挖掘业务会话项目的第一量化统计结果,包括:
通过所述若干待挖掘业务会话项目的语义关键词,对所述不少于一组第二可视化智能信息进行差异化分析,得到多组语义可视化智能信息;
确定每一组语义可视化智能信息中包括的待挖掘业务会话项目的量化统计结果,为所述第一量化统计结果。
4.如权利要求3所述的方法,其特征在于,在所述不少于一组第二可视化智能信息中,每一衍生会话描述的待挖掘业务会话项目的第二量化统计结果,包括:
通过所述若干待挖掘业务会话项目的衍生会话描述,对所述不少于一组第二可视化智能信息进行差异化分析,得到多组衍生可视化智能信息;
确定每一组衍生可视化智能信息中包括的待挖掘业务会话项目的量化统计结果,为所述第二量化统计结果。
5.如权利要求1所述的方法,其特征在于,所述确定存在差异的多维度约束条件内的若干待挖掘业务会话项目的第一可视化智能信息簇,包括:
获取所述若干待挖掘业务会话项目在所述存在差异的多维度约束条件内的会话互动操作内容;
通过所述若干待挖掘业务会话项目的会话互动操作内容,确定涵盖每一待挖掘业务会话项目在所述存在差异的多维度约束条件内的会话描述关系网的第一可视化智能信息簇。
6.如权利要求5所述的方法,其特征在于,所述通过所述若干待挖掘业务会话项目的会话互动操作内容,确定涵盖每一待挖掘业务会话项目在所述存在差异的多维度约束条件内的会话描述关系网的第一可视化智能信息簇,包括:
将指向同一待挖掘业务会话项目的会话互动操作内容进行会话描述关系网翻译,得到多条会话描述关系网;其中,每一个会话描述关系网中的会话描述关系网单元对应于同一待挖掘业务会话项目;
借助每一所述待挖掘业务会话项目的语义标签和语义关键词,对每一所述待挖掘业务会话项目对应的会话描述关系网进行挖掘,得到每一所述待挖掘业务会话项目的已挖掘会话描述关系网;
通过所述若干待挖掘业务会话项目的已挖掘会话描述关系网,确定所述第一可视化智能信息簇。
7.如权利要求6所述的方法,其特征在于,所述将指向同一待挖掘业务会话项目的会话互动操作内容进行会话描述关系网翻译,得到多条会话描述关系网,包括:
将指向同一待挖掘业务会话项目的会话互动操作内容进行特征分析,得到多种会话互动操作内容;其中,每一种会话互动操作内容对应于同一待挖掘业务会话项目;
将任一种会话互动操作内容中的每一组会话互动操作内容作为会话描述关系网单元,构成所述任一种会话互动操作内容所属待挖掘业务会话项目的会话描述关系网,以得到所述多条会话描述关系网。
8.如权利要求1所述的方法,其特征在于,所述多维度约束条件包括:时序约束和分布约束,所述在所述第一可视化智能信息簇中,确定多维度约束条件符合指定多维度约束条件的不少于一组第二可视化智能信息,包括:
在所述第一可视化智能信息簇中,确定收集时段处于指定时序约束内不少于一组第三可视化智能信息;
在所述不少于一组第三可视化智能信息中,确定可视化智能信息的信息收集线程的分布约束处于指定约束条件集的所述不少于一组第二可视化智能信息。
9.如权利要求1所述的方法,其特征在于,在所述会话兴趣挖掘结果包括每一语义关键词的待挖掘业务会话项目的第一量化统计结果和每一衍生会话描述的待挖掘业务会话项目的第二量化统计结果的情况下,所述确定所述不少于一组第二可视化智能信息中的待挖掘业务会话项目的会话兴趣挖掘结果之后,所述方法还包括:
在若干语义关键词对应的第一量化统计结果和若干衍生会话描述对应的第二量化统计结果中,分别确定量化统计结果在前X个的目标第一量化统计结果和目标第二量化统计结果;其中,X为不小于1的整数;
确定所述目标第一量化统计结果以及所述目标第一量化统计结果对应的语义关键词,和所述目标第二量化统计结果以及所述目标第二量化统计结果对应的衍生会话描述。
10.一种基于大数据的可视化智能数据挖掘系统,其特征在于,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-9任一项所述的方法。
CN202111281433.5A 2021-11-01 2021-11-01 基于大数据的可视化智能数据挖掘方法及系统 Pending CN114139552A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111281433.5A CN114139552A (zh) 2021-11-01 2021-11-01 基于大数据的可视化智能数据挖掘方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111281433.5A CN114139552A (zh) 2021-11-01 2021-11-01 基于大数据的可视化智能数据挖掘方法及系统

Publications (1)

Publication Number Publication Date
CN114139552A true CN114139552A (zh) 2022-03-04

Family

ID=80392016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111281433.5A Pending CN114139552A (zh) 2021-11-01 2021-11-01 基于大数据的可视化智能数据挖掘方法及系统

Country Status (1)

Country Link
CN (1) CN114139552A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9965526B1 (en) * 2015-06-12 2018-05-08 Amazon Technologies, Inc. Data mining for multiple item comparisons
CN112765462A (zh) * 2021-01-12 2021-05-07 陈漩 针对大数据业务以及人工智能的数据处理方法及云服务器
CN113469663A (zh) * 2021-08-02 2021-10-01 东莞市爱学爱玩教育科技有限公司 一种结合人工智能的智慧业务信息分析方法及系统
CN113570439A (zh) * 2021-07-31 2021-10-29 王亮 基于人工智能的电子商务大数据挖掘方法及电子商务系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9965526B1 (en) * 2015-06-12 2018-05-08 Amazon Technologies, Inc. Data mining for multiple item comparisons
CN112765462A (zh) * 2021-01-12 2021-05-07 陈漩 针对大数据业务以及人工智能的数据处理方法及云服务器
CN113570439A (zh) * 2021-07-31 2021-10-29 王亮 基于人工智能的电子商务大数据挖掘方法及电子商务系统
CN113469663A (zh) * 2021-08-02 2021-10-01 东莞市爱学爱玩教育科技有限公司 一种结合人工智能的智慧业务信息分析方法及系统

Similar Documents

Publication Publication Date Title
US11651272B2 (en) Machine-learning-facilitated conversion of database systems
CN114168747A (zh) 基于云服务的知识库构建方法及系统
CN110019116A (zh) 数据追溯方法、装置、数据处理设备及计算机存储介质
CN113378554A (zh) 一种医疗信息智能交互的方法及系统
CN114329116B (zh) 基于人工智能的智慧园区资源匹配度分析方法及系统
CN115481197B (zh) 一种分布式数据处理方法、系统及云平台
CN113947709A (zh) 基于人工智能的图像处理方法及系统
CN114139552A (zh) 基于大数据的可视化智能数据挖掘方法及系统
CN114238365B (zh) 一种基于智慧教育的服务数据管理方法及系统
CN113380363B (zh) 基于人工智能的医疗数据质量评价方法及系统
CN115687618A (zh) 基于人工智能的用户意图分析方法及系统
CN114417076A (zh) 基于人工智能的生产线智能预警方法及系统
CN113485203A (zh) 一种智能控制网络资源共享的方法及系统
CN113626688A (zh) 基于软件定义的智能化医疗数据采集方法及系统
CN113626538A (zh) 基于大数据的医疗信息智能分类的方法及系统
WO2021011117A1 (en) Detecting misconfiguration and/or bug(s) in large service(s) using correlated change analysis
CN115455070A (zh) 一种电流信号的数据管控方法及系统
CN114139870A (zh) 基于人工智能的智能建筑管理方法及系统
CN114970507A (zh) 基于元宇宙的特征识别方法及系统
CN115759698B (zh) 基于数字工厂的瓦楞原纸生产进度数据监控方法及系统
CN113596849B (zh) 一种智能家居的无线通信信道动态分配方法及系统
CN115345226A (zh) 结合云计算的能耗统计方法及系统
CN115455803A (zh) 一种室内能耗信息分析方法及系统
CN115455406A (zh) 一种网络信息的风险检测方法及系统
CN115564048A (zh) 一种医疗大数据共享分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination