CN114579634A - 结合人工智能和大数据的信息挖掘方法及系统 - Google Patents

结合人工智能和大数据的信息挖掘方法及系统 Download PDF

Info

Publication number
CN114579634A
CN114579634A CN202210200735.3A CN202210200735A CN114579634A CN 114579634 A CN114579634 A CN 114579634A CN 202210200735 A CN202210200735 A CN 202210200735A CN 114579634 A CN114579634 A CN 114579634A
Authority
CN
China
Prior art keywords
item
potential
description
log
portrait
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210200735.3A
Other languages
English (en)
Inventor
张立峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202210200735.3A priority Critical patent/CN114579634A/zh
Publication of CN114579634A publication Critical patent/CN114579634A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了结合人工智能和大数据的信息挖掘方法及系统,通过确定多个日志记录事项中每个日志记录事项对应的日志记录事项描述集;日志记录事项描述集包括日志记录事项在多种互动状态层面下的描述;多种互动状态层面至少包括承载内容层面和潜在画像层面;基于每个日志记录事项对应的日志记录事项描述集,生成每个日志记录事项对应的潜在画像事项描述;潜在画像事项描述用于表达日志记录事项对应的潜在画像信息;根据每个日志记录事项对应的潜在画像事项描述,确定待挖掘业务项目日志中的潜在画像项目日志和潜在画像项目日志的潜在画像种类。可以提高潜在画像挖掘过程中的潜在画像项目日志及潜在画像种类获取的准确度和可信度。

Description

结合人工智能和大数据的信息挖掘方法及系统
技术领域
本申请涉及人工智能和大数据技术领域,尤其涉及一种结合人工智能和大数据的信息挖掘方法及系统。
背景技术
现目前,大数据(big Data)和人工智能(Artificial Intelligence,AI)密不可分。大数据为人工智能提供了关键的数据基础和大数据计算环境,是人工智能的驱动力。相应的,人工智能反过来为大数据提供了算法分析基础,可以理解为大数据技术的“大脑”。近年来,大数据和人工智能的不断成熟,“大数据智能”在不同业务领域的应用越来越广泛。
在实际的业务应用中,通常需要借助大数据和人工智能进行用户画像识别、挖掘和分析以服务于业务应用,然而相关的用户画像挖掘技术存在效率低下的问题。
发明内容
本申请实施例提供了一种结合人工智能和大数据的信息挖掘方法及系统,能够提高潜在画像挖掘过程中的潜在画像项目日志及潜在画像种类获取的准确度和可信度。
有鉴于此,本申请一方面提供一种结合人工智能和大数据的信息挖掘方法,应用于信息挖掘系统,所述方法包括:
获取待挖掘业务项目日志的多个日志记录事项;
确定所述多个日志记录事项中每个所述日志记录事项对应的日志记录事项描述集;所述日志记录事项描述集包括所述日志记录事项在多种互动状态层面下的描述;所述多种互动状态层面至少包括承载内容层面和潜在画像层面;
基于每个所述日志记录事项对应的日志记录事项描述集,生成每个所述日志记录事项对应的潜在画像事项描述;所述潜在画像事项描述用于表达所述日志记录事项对应的潜在画像信息;
根据每个所述日志记录事项对应的潜在画像事项描述,确定所述待挖掘业务项目日志中的潜在画像项目日志和所述潜在画像项目日志的潜在画像种类。
本申请另一方面提供一种信息挖掘系统,包括:存储器,用于存储可执行的指令;处理器,用于根据所述可执行的指令的控制,运行所述信息挖掘系统执行如第一方面任一项所述的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:通过确定多个日志记录事项中每个日志记录事项对应的日志记录事项描述集;日志记录事项描述集包括日志记录事项在多种互动状态层面下的描述;多种互动状态层面至少包括承载内容层面和潜在画像层面;基于每个日志记录事项对应的日志记录事项描述集,生成每个日志记录事项对应的潜在画像事项描述;潜在画像事项描述用于表达日志记录事项对应的潜在画像信息;根据每个日志记录事项对应的潜在画像事项描述,确定待挖掘业务项目日志中的潜在画像项目日志和潜在画像项目日志的潜在画像种类。可以提高潜在画像挖掘过程中的潜在画像项目日志及潜在画像种类获取的准确度和可信度。
附图说明
图1是示出可以实现本申请的实施例的信息挖掘系统的一种硬件配置的框图。
图2是示出可以实现本申请的实施例的信息挖掘系统的另一种硬件配置的框图。
图3是示出可以实现本申请的实施例的结合人工智能和大数据的信息挖掘方法的流程图。
图4是示出可以实现本申请的实施例的结合人工智能和大数据的信息挖掘方法的应用场景的架构示意图。
具体实施方式
<硬件配置>
图1是示出可以实现本申请的实施例的信息挖掘系统100的一种硬件配置的框图,信息挖掘系统100可以包括处理器110和存储器120,存储器120用于存储可执行的指令,处理器110用于根据可执行的指令的控制,运行信息挖掘系统100执行本申请中的结合人工智能和大数据的信息挖掘方法。
图2是示出可以实现本申请的实施例的信息挖掘系统100的另一种硬件配置的框图,信息挖掘系统100可以包括处理器110、存储器120和结合人工智能和大数据的信息挖掘装置400,结合人工智能和大数据的信息挖掘装置400包括至少一个可以软件或固件(firmware)的形式储存于所述存储器120中的软件功能模块,所述处理器110通过运行存储在存储器120内的软件程序以及模块,例如本申请实施例中的结合人工智能和大数据的信息挖掘装置400,从而执行各种功能应用以及数据处理,即实现本申请实施例中的结合人工智能和大数据的信息挖掘方法。
<方法实施例>
图3是示出可以实现本申请的实施例的结合人工智能和大数据的信息挖掘方法的流程图,结合人工智能和大数据的信息挖掘方法可以通过图1或图2所示的信息挖掘系统100实现,进一步可以包括以下步骤所描述的技术方案。
在步骤301中,获取待挖掘业务项目日志的多个日志记录事项。
以一些示例性的角度来看待,其中,待挖掘业务项目日志是指待挖掘的业务项目日志信息。比如,话题业务项目日志、支付业务项目日志、办公业务项目日志,等等。该待挖掘业务项目日志中可以多个按照次序排列的日志记录事项。该日志记录事项包括但不限于是各类消息中的文本、符号等等。其中,还可以按照业务环境类别的差异,将该待挖掘业务项目日志分为支付环境、会话环境、在线教育环境和企业服务环境等多个业务环境的业务项目日志数据。该待挖掘业务项目日志还可以是用户较为关注的内容业务项目日志,例如,用户关注、转发、评论或点赞的内容业务项目日志。
以一些示例性的角度来看待,获取上述待挖掘业务项目日志的方式可以有多种。比如,可以直接获取业务用户在业务互动设备上传入的待挖掘业务项目日志,也可以通过网络从云数据库或者关系型数据库中获取待挖掘业务项目日志,还可以由其他智能设备转换获得,等等。比如,可以获取目标业务用户的不同种类的业务互动数据,并将这些业务互动数据转换为业务项目日志种类的待挖掘业务项目日志。
例如,可以获得目标业务用户的语音业务咨询申请,并对该语音业务咨询申请进行声纹识别处理,得到该语音业务咨询申请对应的待挖掘业务项目日志。还可以获得目标业务用户的可视化业务互动信息,并采用可视化信息转换的方式提取该可视化业务互动信息中的重要内容,从而根据该重要内容得到对应的待挖掘业务项目日志。
以一些可独立实施的设计思路角度来看,待挖掘业务项目日志的获取可以依据相关业务场景下的主题型互动事件确定,比如通过主题型互动事件定位待挖掘业务项目日志的项目类别,然后结合上述方式确定对应的待挖掘业务项目日志。
对于一些可独立实施的技术方案而言,主题型互动事件可以通过以下内容获取:从多样化互动事件集的第一智慧业务互动事件提取第一显著性事件描述信息,并从所述多样化互动事件集的第二智慧业务互动事件提取第二显著性事件描述信息;将所述第一显著性事件描述信息拆解为多个第一层次化关键描述信息,并将所述第二显著性事件描述信息拆解为多个第二层次化关键描述信息;基于所述多个第一层次化关键描述信息和所述多个第二层次化关键描述信息,确定所述第一智慧业务互动事件和所述第二智慧业务互动事件之间的量化共性评价;根据所述第一智慧业务互动事件和所述第二智慧业务互动事件之间的量化共性评价,确定所述多样化互动事件集中的主题型互动事件。
进一步地,对于上述获取主题型互动事件的方式,可以通过以下内容进行阐述。
在Step101中,从多样化互动事件集的第一智慧业务互动事件提取第一显著性事件描述信息,并从多样化互动事件集的第二智慧业务互动事件提取第二显著性事件描述信息。
在一些可能的实施例中,在Step101之前还可以对多样化互动事件集进行事件集拆分处理,以获得多个智慧业务互动事件,在多个智慧业务互动事件中挑选第一智慧业务互动事件和第二智慧业务互动事件。
以示例性角度来看待,第一智慧业务互动事件和第二智慧业务互动事件不是两个特定的、专有的智慧业务互动事件,第一智慧业务互动事件和第二智慧业务互动事件是相对而言的,仅仅用于区分不同的智慧业务互动事件。第一智慧业务互动事件和第二智慧业务互动事件可以是多样化互动事件集中的随机选择的两个智慧业务互动事件,例如,第一智慧业务互动事件和第二智慧业务互动事件可以是多样化互动事件集中连续的随机选择的两个智慧业务互动事件,也可以是多样化互动事件集中每相隔设定互动时长的随机选择的两个智慧业务互动事件,还可以是多样化互动事件集中连续的随机选择的两个业务场景中的主要互动事件,还可以是每相隔设定数目的随机选择的两个业务场景中的主要互动事件。
对于一些可能的示例而言,当多样化互动事件集的事件密度是10件/min、且多样化互动事件集的持续统计时间是3min时,将多样化互动事件集可以事件集拆分处理为智慧业务互动事件event1、智慧业务互动事件event2、智慧业务互动事件event3、智慧业务互动事件event4、......、智慧业务互动事件event30。第一智慧业务互动事件和第二智慧业务互动事件可以是多样化互动事件集中连续的随机选择的两个智慧业务互动事件,例如,智慧业务互动事件event1是第一智慧业务互动事件,智慧业务互动事件event2是第二智慧业务互动事件。第一智慧业务互动事件和第二智慧业务互动事件也可以是多样化互动事件集中间隔设定互动时长的随机选择的两个智慧业务互动事件,以第一智慧业务互动事件和第二智慧业务互动事件间隔5个智慧业务互动事件为例,智慧业务互动事件event1是第一智慧业务互动事件,智慧业务互动事件event6是第二智慧业务互动事件。
对于一些可能的示例而言,当多样化互动事件集包括4个业务场景(业务场景scene1、业务场景scene2、业务场景scene3和业务场景scene4)时,第一智慧业务互动事件和第二智慧业务互动事件可以是多样化互动事件集中连续的随机选择的两个业务场景中的主要互动事件,例如,业务场景scene1的主要互动事件是第一智慧业务互动事件,业务场景scene2的主要互动事件是第二智慧业务互动事件。第一智慧业务互动事件和第二智慧业务互动事件也可以是间隔设定数目的随机选择的两个业务场景中的主要互动事件,例如,业务场景scene1的主要互动事件是第一智慧业务互动事件,业务场景scene3的主要互动事件是第二智慧业务互动事件。
在一些可独立实施的实施例中,图3所示的Step101可以包括Step1011至Step1014。
在Step1011中,从第一智慧业务互动事件提取第一视觉型关键内容,并从第二智慧业务互动事件提取第二视觉型关键内容。
以示例性角度来看待,视觉型关键内容可以理解为智慧业务互动事件的可视化特征,比如可以是特征向量或者特征图。
在一些可能的实施例中,将第一智慧业务互动事件拆解为多个第一视觉型子事件,并针对每个第一视觉型子事件进行关键内容提取处理,得到与多个第一视觉型子事件一一对应的多个第一视觉型局部关键内容;将多个第一视觉型局部关键内容进行合并,得到第一视觉型关键内容。
以示例性角度来看待,可以通过第一滑动平均网络(卷积神经网络)将第一智慧业务互动事件拆解为多个第一视觉型子事件(可视化的局部事件、事件片段或者事件块),并针对每个第一视觉型子事件进行关键内容提取处理,得到与多个第一视觉型子事件一一对应的多个第一视觉型局部关键内容;将多个第一视觉型局部关键内容进行合并,得到第一视觉型关键内容。如此设计,能够尽可能对关键内容进行精细化处理和挖掘,从而确保视觉型关键内容的完整性。
对于一些可能的示例而言,将多个第一视觉型局部关键内容进行合并的方式可以是确定多个第一视觉型局部关键内容对应的重要程度(该重要程度可以理解为权重值),根据多个第一视觉型局部关键内容对应的重要程度,对多个第一视觉型局部关键内容进行内容整合处理,得到第一视觉型关键内容。
在一些可能的实施例中,将第二智慧业务互动事件拆解为多个第二视觉型子事件,并针对每个第二视觉型子事件进行关键内容提取处理,得到与多个第二视觉型子事件一一对应的多个第二视觉型局部关键内容;将多个第二视觉型局部关键内容进行合并,得到第二视觉型关键内容。
以示例性角度来看待,可以通过第二滑动平均网络将第二智慧业务互动事件拆解为多个第二视觉型子事件,并针对每个第二视觉型子事件进行关键内容提取处理,得到与多个第二视觉型子事件一一对应的多个第二视觉型局部关键内容;将多个第二视觉型局部关键内容进行合并,得到第二视觉型关键内容。
对于一些可能的示例而言,将多个第二视觉型局部关键内容进行合并的方式可以是确定多个第二视觉型局部关键内容对应的重要程度,根据多个第二视觉型局部关键内容对应的重要程度,对多个第二视觉型局部关键内容进行内容整合处理(一种可能的示例可以是加权求和或者加权融合),得到第二视觉型关键内容。
以示例性角度来看待,第一滑动平均网络和第二滑动平均网络可以是具备相同模型参量的神经网络模型,也可以是具备不同模型参量的神经网络模型。神经网络模型可以包括各种类型,例如,卷积神经网络模型(Convolutional Neural Networks,CNN)、循环神经网络模型(Recurrent Neural Network,RNN)、以及多层前馈神经网络模型等,本申请实施例在此不作限制。
本申请实施例在提取智慧业务互动事件的视觉型关键内容的过程中,将智慧业务互动事件拆解为多个视觉型子事件分别进行关键内容提取,相较于直接针对智慧业务互动事件中的每条事件消息进行关键内容提取来说,能够在一定程度上明显降低运算难度,从而减少系统资源的运算开销,提高视觉型关键内容的挖掘识别和提取效率。
以示例性角度来看待,智慧业务互动事件涉及的领域包括但不限于在线支付、区块链金融、远程办公、在线教育、智慧医疗和智慧城市等。
在Step1012中,从第一视觉型关键内容提取第一事项影响型关键内容,并从第二视觉型关键内容提取第二事项影响型关键内容。
在一些可能的实施例中,对第一视觉型关键内容进行特征扩展处理,得到第一扩展视觉型关键内容;确定第一扩展视觉型关键内容中每个特征状态所对应的局部聚焦重要程度;根据第一扩展视觉型关键内容中每个特征状态所对应的局部聚焦重要程度,对第一扩展视觉型关键内容中每个特征状态中的内容进行内容整合处理,得到第一事项影响型关键内容。
以示例性角度来看待,特征扩展处理可以理解为维度增加处理或者升维处理,进一步地,局部聚焦重要程度可以理解为注意力权重。
在一些示例性的实施例中,第一非事项内容分布区域抽取模型中包括状态局部聚焦子模型,进一步地,通过第一非事项内容分布区域抽取模型对第一视觉型关键内容进行特征扩展处理,得到第一扩展视觉型关键内容;通过状态局部聚焦子模型确定第一扩展视觉型关键内容中每个特征状态所对应的局部聚焦重要程度;根据第一扩展视觉型关键内容中每个特征状态所对应的局部聚焦重要程度,对第一扩展视觉型关键内容中每个特征状态中的内容进行内容整合处理,得到第一事项影响型关键内容。
对于一些可能的示例而言,第一事项影响型关键内容中包括多个局部遮挡关键内容,每个局部遮挡关键内容对应一个视觉型子事件,每个局部遮挡关键内容包括一个第一字符或者第二字符的遮挡标识,上述的遮挡标识可以表示对应的这个视觉型子事件里面是否包含非事项内容,例如,第一字符“0”表示对应的这个视觉型子事件中不存在非事项内容,第二字符“1”表示对应的这个视觉型子事件中存在非事项内容。
本申请实施例通过局部聚焦策略(可以理解为注意力机制)对第一扩展视觉型关键内容进行加权,能够使得第一事项影响型关键内容的二次调整准确度更高,且更具备辨识性,进而能够提高后续确定第一智慧业务互动事件是否包含非事项内容、以及第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价的准确性。
以示例性角度来看待,对第一视觉型关键内容进行特征扩展处理,得到第一扩展视觉型关键内容可以包括:对第一视觉型关键内容进行滑动平均处理,得到第一滑动平均关键内容,并将第一滑动平均关键内容进行转置滑动平均处理,得到第一转置滑动平均关键内容;将第一视觉型关键内容和第一转置滑动平均关键内容进行拼接处理,得到第一拼接关键内容;将第一拼接关键内容和第一转置滑动平均关键内容进行拼接处理,得到第一扩展视觉型关键内容。
以示例性角度来看待,滑动平均处理为卷积处理,则转置滑动平均处理为反卷积处理,本申请实施例中的反卷积,也可以理解为转置卷积,它并不是正向卷积的完全逆过程,它可以用来实现关键内容的二次调整和优化。
本申请实施例通过转置滑动平均处理和多次拼接处理,能够实现更精准的关键内容二次调整优化(比如可以理解为关键内容重构),使得第一扩展视觉型关键内容与第一智慧业务互动事件之间的适配度更高,从而提高后续从多样化互动事件集中提取主题型互动事件的准确性。
在一些可能的实施例中,对第二视觉型关键内容进行特征扩展处理,得到第二扩展视觉型关键内容;确定第二扩展视觉型关键内容中每个特征状态所对应的局部聚焦重要程度;根据第二扩展视觉型关键内容中每个特征状态所对应的局部聚焦重要程度,对第二扩展视觉型关键内容中每个特征状态中的内容进行内容整合处理,得到第二事项影响型关键内容。
以示例性角度来看待,第二非事项内容分布区域抽取模型中包括状态局部聚焦子模型,进一步地,通过第二非事项内容分布区域抽取模型对第二视觉型关键内容进行特征扩展处理,得到第二扩展视觉型关键内容;通过状态局部聚焦子模型确定第二扩展视觉型关键内容中每个特征状态所对应的局部聚焦重要程度;根据第二扩展视觉型关键内容中每个特征状态所对应的局部聚焦重要程度,对第二扩展视觉型关键内容中每个特征状态中的内容进行内容整合处理,得到第二事项影响型关键内容。
对于一些可能的示例而言,第二事项影响型关键内容中包括多个局部遮挡关键内容,每个局部遮挡关键内容对应一个视觉型子事件,每个局部遮挡关键内容包括一个第一字符或者第二字符的遮挡标识,上述的遮挡标识可以表示对应的这个视觉型子事件里面是否包含非事项内容,例如,第一字符“0”表示对应的这个视觉型子事件中不存在非事项内容,第二字符“1”表示对应的这个视觉型子事件中存在非事项内容。
本申请实施例通过局部聚焦策略对第二扩展视觉型关键内容进行加权,能够使得第二事项影响型关键内容的二次调整准确度更高,且更具备辨识性,进而能够提高后续确定第二智慧业务互动事件是否包含非事项内容、以及第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价的准确性。
对于一些可能的示例而言,第一非事项内容分布区域抽取模型和第二非事项内容分布区域抽取模型可以是具备相同模型参量的神经网络模型,也可以是具备不同模型参量的神经网络模型。神经网络模型可以包括各种类型,例如,卷积神经网络模型、循环神经网络模型、长短期记忆神经网络模型、以及多层前馈神经网络模型等。
以示例性角度来看待,对第二视觉型关键内容进行特征扩展处理,得到第二扩展视觉型关键内容可以包括:对第二视觉型关键内容进行滑动平均处理,得到第二滑动平均关键内容,并将第二滑动平均关键内容进行转置滑动平均处理,得到第二转置滑动平均关键内容;将第二视觉型关键内容和第二转置滑动平均关键内容进行拼接处理,得到第二拼接关键内容;将第二拼接关键内容和第二转置滑动平均关键内容进行拼接处理,得到第二扩展视觉型关键内容。
本申请实施例通过转置滑动平均处理和多次拼接处理,能够实现更精准的关键内容二次调整优化,使得第二扩展视觉型关键内容与第二智慧业务互动事件之间的适配度更高,从而提高后续从多样化互动事件集中提取主题型互动事件的准确性。
在Step1013中,将第一事项影响型关键内容和第一视觉型关键内容进行拼接处理,得到第一显著性事件描述信息。
在一些可能的实施例中,确定第一事项影响型关键内容和第一视觉型关键内容分别对应的重要程度;基于第一事项影响型关键内容和第一视觉型关键内容分别对应的重要程度,对第一事项影响型关键内容和第一视觉型关键内容进行内容整合处理,得到第一显著性事件描述信息。
以示例性角度来看待,可以通过第一非事项内容分布区域抽取模型确定第一事项影响型关键内容和第一视觉型关键内容分别对应的重要程度;基于第一事项影响型关键内容和第一视觉型关键内容分别对应的重要程度,对第一事项影响型关键内容和第一视觉型关键内容进行内容整合处理,得到第一显著性事件描述信息。
本申请实施例将表征第一智慧业务互动事件的日志文本型内容的第一事项影响型关键内容和表征第一智慧业务互动事件的视觉型内容的第一视觉型关键内容进行拼接,以便于后续根据智慧业务互动事件的日志文本型内容和视觉型内容提取主题型互动事件,能够解决相关技术中当多样化互动事件集中各智慧业务互动事件之间的场景差异较大而非事项内容信息较为固定时,所提取的主题型互动事件中存在因主题型互动事件中非事项内容信息相同而导致的主题型互动事件的重复度高的技术问题,从而进而可以提高从多样化互动事件集中提取主题型互动事件的准确性。
在Step1014中,将第二事项影响型关键内容和第二视觉型关键内容进行拼接处理,得到第二显著性事件描述信息。
在一些可能的实施例中,确定第二事项影响型关键内容和第二视觉型关键内容分别对应的重要程度;基于第二事项影响型关键内容和第二视觉型关键内容分别对应的重要程度,对第二事项影响型关键内容和第二视觉型关键内容进行内容整合处理,得到第二显著性事件描述信息。
以示例性角度来看待,通过第二非事项内容分布区域抽取模型确定第二事项影响型关键内容和第二视觉型关键内容分别对应的重要程度;基于第二事项影响型关键内容和第二视觉型关键内容分别对应的重要程度,对第二事项影响型关键内容和第二视觉型关键内容进行内容整合处理,得到第二显著性事件描述信息。
本申请实施例将表征第二智慧业务互动事件的日志文本型内容的第二事项影响型关键内容和表征第二智慧业务互动事件的视觉型内容的第二视觉型关键内容进行拼接,以便于后续根据智慧业务互动事件的日志文本型内容和视觉型内容提取主题型互动事件,能够解决相关技术中当多样化互动事件集中各智慧业务互动事件之间的场景差异较大而非事项内容信息较为固定时,所提取的主题型互动事件中存在因主题型互动事件中非事项内容信息相同而导致的主题型互动事件的重复度高的技术问题,从而进而可以提高从多样化互动事件集中提取主题型互动事件的准确性。
在本申请实施例中,显著性事件描述信息可以从多个维度表达相关智慧业务互动事件的特性和意义,因此显著性事件描述信息也可以理解为智慧业务互动事件的整体性特征描述。
在Step102中,将第一显著性事件描述信息拆解为多个第一层次化关键描述信息,并将第二显著性事件描述信息拆解为多个第二层次化关键描述信息。
在一些可能的实施例中,将第一显著性事件描述信息对应每个特征状态的内容进行特征压缩处理,得到第一压缩关键内容;将第一压缩关键内容进行设定方式的下采样处理(例如池化/降维处理),得到第一下采样关键内容,并将第一下采样关键内容按照设定方式(比如按照下采样关键内容的内容特征排布方向)拆解为多个第一层次化关键描述信息。
以示例性角度来看待,通过相似模型(例如孪生模型)将第一显著性事件描述信息对应每个特征状态的内容进行特征压缩处理,得到第一压缩关键内容;将第一压缩关键内容进行设定方式的下采样处理,得到第一下采样关键内容,并将第一下采样关键内容按照设定方式拆解为多个第一层次化关键描述信息。
在一些可能的实施例中,将第二显著性事件描述信息对应每个特征状态的内容进行特征压缩处理,得到第二压缩关键内容;将第二压缩关键内容进行设定方式的下采样处理(例如池化/降维处理),得到第二下采样关键内容,并将第二下采样关键内容按照设定方式拆解为多个第二层次化关键描述信息。
以示例性角度来看待,通过相似模型将第一显著性事件描述信息对应每个特征状态的内容进行特征压缩处理,得到第一压缩关键内容;将第一压缩关键内容进行设定方式的下采样处理,得到第一下采样关键内容,并将第一下采样关键内容按照设定方式拆解为多个第一层次化关键描述信息。
在本申请实施例中,层次化关键描述信息可以理解为显著性事件描述信息的局部信息或者阶段性信息,用于对显著性事件描述信息进行更为精细化的拆分表达。
对于一些可能的示例而言,将第一显著性事件描述信息对应每个特征状态的内容进行特征压缩处理、以及将第二显著性事件描述信息对应每个特征状态的内容进行特征压缩处理可以是将第一显著性事件描述信息和第二显著性事件描述信息中对应每个特征状态的内容同时去除一个相同的设定变量,这样可以不改变第一显著性事件描述信息和第二显著性事件描述信息之间的共性(相似性)关系,并且能够减少后续确定量化共性评价(相似度值)的复杂程度,提高量化共性评价的运算效率和精度。
在Step103中,基于多个第一层次化关键描述信息和多个第二层次化关键描述信息,确定第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价。
在一些可能的实施例中,针对每个第一层次化关键描述信息实施如下步骤:在多个第二层次化关键描述信息中,挑选与第一层次化关键描述信息对应多样化互动事件集的相同分布区域的第二层次化关键描述信息,并确定第一层次化关键描述信息与挑选的第二层次化关键描述信息之间的量化共性评价;在多个第一层次化关键描述信息对应的量化共性评价中,挑选最小的量化共性评价作为第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价。
以示例性角度来看待,通过相似模型针对每个第一层次化关键描述信息实施如下步骤:在多个第二层次化关键描述信息中,挑选与第一层次化关键描述信息对应多样化互动事件集的相同分布区域的第二层次化关键描述信息,并确定第一层次化关键描述信息与挑选的第二层次化关键描述信息之间的量化共性评价;在多个第一层次化关键描述信息对应的量化共性评价中,挑选最小的量化共性评价作为第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价。
以示例性角度来看待,确定第一层次化关键描述信息与挑选的第二层次化关键描述信息之间的量化共性评价可以包括:将第一层次化关键描述信息和挑选的第二层次化关键描述信息进行量化描述值比对处理,得到智慧业务互动事件的量化差异描述;将智慧业务互动事件的量化差异描述转换为对应多个待选择量化共性评价的几率;将最大几率所对应的待选择量化共性评价确定为对应第一层次化关键描述信息的量化共性评价。
对于一些可能的示例而言,将第一层次化关键描述信息和第二层次化关键描述信息进行量化描述值比对处理可以是将第一层次化关键描述信息和第二层次化关键描述信息中对应每个特征状态的内容进行比对(比如可以是进行相减处理),并对比对后的结果取量化描述值(比如可以是取绝对值),得到智慧业务互动事件的量化差异描述,其中,智慧业务互动事件的量化差异描述的特征状态数目和第一层次化关键描述信息/第二层次化关键描述信息的特征状态数目相同。
本申请实施例将多个第一层次化关键描述信息对应的量化共性评价中最小的量化共性评价作为第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价,能够减小后续确定的主题型互动事件的重复度。并且基于拆解后的局部性的第一层次化关键描述信息和第二层次化关键描述信息确定第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价,相较于基于整体性的第一显著性事件描述信息和第二显著性事件描述信息确定量化共性评价来说,确定的量化共性评价的准确性更高,使得后续能够准确提取到拥有不同局部性内容和阶段性内容的主题型互动事件,从而减少提取到的主题型互动事件的重复度,提高从多样化互动事件集中提取主题型互动事件的准确性。
在Step104中,根据第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价,确定多样化互动事件集中的主题型互动事件。
在一些可能的实施例中,当第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价大于量化共性评价阈值时,将第一智慧业务互动事件或第二智慧业务互动事件作为多样化互动事件集中的主题型互动事件;当第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价不大于量化共性评价阈值时,将第一智慧业务互动事件和第二智慧业务互动事件作为多样化互动事件集中的主题型互动事件。
以示例性角度来看待,量化共性评价阈值可以是在人工智能网络的训练过程中所获得的参量,也可以是用户、客户端或服务器设定的值,本申请实施例在此不作限制。
第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价表征第一智慧业务互动事件和第二智慧业务互动事件类似的几率,量化共性评价越大表征第一智慧业务互动事件和第二智慧业务互动事件类似的几率越小,量化共性评价越小表征第一智慧业务互动事件和第二智慧业务互动事件类似的几率越大。如此,在量化共性评价大于量化共性评价阈值的智慧业务互动事件对(包括第一智慧业务互动事件和第二智慧业务互动事件)中挑选任一个智慧业务互动事件作为主题型互动事件,能够减少提取到的主题型互动事件的重复度,从而提高从多样化互动事件集中提取主题型互动事件的准确性。
在一些可独立实施的实施例中,在Step104之前还可以包括:对第一智慧业务互动事件进行全连接处理(比如分类处理),以获得第一智慧业务互动事件是否涵盖非事项内容的全连接处理结果(相应理解为分类结果);对第二智慧业务互动事件进行全连接处理,以获得第二智慧业务互动事件是否涵盖非事项内容的全连接处理结果。如此,Step104可以是根据全连接处理结果、以及第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价,确定多样化互动事件集中的主题型互动事件(或视为非事项内容主题型互动事件)。
以示例性角度来看待,对第一智慧业务互动事件进行全连接处理,以获得第一智慧业务互动事件是否涵盖非事项内容的全连接处理结果可以包括:从第一智慧业务互动事件提取第一视觉型关键内容,从第一视觉型关键内容提取第一事项影响型关键内容,对第一事项影响型关键内容进行全连接处理,得到第一智慧业务互动事件是否涵盖非事项内容的全连接处理结果。
以示例性角度来看待,可以通过第一全连接网络对第一事项影响型关键内容进行全连接处理,以获得第一智慧业务互动事件是否涵盖非事项内容的全连接处理结果。
对于一些可能的示例而言,当第一事项影响型关键内容中的遮挡标识包括类别为“1”的遮挡标识时,确定第一智慧业务互动事件包含非事项内容;当第一事项影响型关键内容中的遮挡标识不包括类别为“1”的遮挡标识时,确定第一智慧业务互动事件不包含非事项内容。
以示例性角度来看待,对第二智慧业务互动事件进行全连接处理,以获得第二智慧业务互动事件是否涵盖非事项内容的全连接处理结果可以包括:从第二智慧业务互动事件提取第二视觉型关键内容,从第二视觉型关键内容提取第二事项影响型关键内容,对第二事项影响型关键内容进行全连接处理,得到第二智慧业务互动事件是否涵盖非事项内容的全连接处理结果。
以示例性角度来看待,可以通过第二全连接网络对第二事项影响型关键内容进行全连接处理,以获得第二智慧业务互动事件是否涵盖非事项内容的全连接处理结果。
对于一些可能的示例而言,当第二事项影响型关键内容中的遮挡标识包括类别为“1”的遮挡标识时,确定第二智慧业务互动事件包含非事项内容;当第二事项影响型关键内容中的遮挡标识不包括类别为“1”的遮挡标识时,确定第二智慧业务互动事件不包含非事项内容。
其中,全连接网络可以理解为分类网络或者分类器。
以示例性角度来看待,根据全连接处理结果、以及第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价,确定多样化互动事件集中的主题型互动事件可以包括:当全连接处理结果是第一智慧业务互动事件涵盖非事项内容、第二智慧业务互动事件涵盖非事项内容、且第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价不大于量化共性评价阈值时,将第一智慧业务互动事件和第二智慧业务互动事件作为多样化互动事件集中的主题型互动事件;当全连接处理结果是第一智慧业务互动事件涵盖非事项内容、第二智慧业务互动事件涵盖非事项内容、且第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价大于量化共性评价阈值时,将第一智慧业务互动事件或第二智慧业务互动事件作为多样化互动事件集中的主题型互动事件;当全连接处理结果是第一智慧业务互动事件涵盖非事项内容、且第二智慧业务互动事件不涵盖非事项内容时,将第一智慧业务互动事件作为多样化互动事件集中的主题型互动事件;当全连接处理结果是第二智慧业务互动事件涵盖非事项内容、且第一智慧业务互动事件不涵盖非事项内容时,将第二智慧业务互动事件作为多样化互动事件集中的主题型互动事件。
对于一些可能的示例而言,在确定多样化互动事件集中的主题型互动事件后,还可以对主题型互动事件进行事件日志文本解析处理,以获得得到事件日志文本解析结果;根据事件日志文本解析结果,对多样化互动事件集进行全连接(进行分类)。
本申请实施例在量化共性评价大于量化共性评价阈值的智慧业务互动事件对(包括第一智慧业务互动事件和第二智慧业务互动事件)中挑选涵盖非事项内容的智慧业务互动事件作为非事项内容主题型互动事件,不仅能够减少提取到的非事项内容主题型互动事件的重复度,而且能够保证提取到的非事项内容主题型互动事件涵盖非事项内容信息,能够便于后续针对非事项内容主题型互动事件进行处理,例如对多样化互动事件集进行全连接处理等。
可以理解的是,基于拆解后第一层次化关键描述信息和第二层次化关键描述信息确定第一智慧业务互动事件和第二智慧业务互动事件之间的量化共性评价,由于拆解后的关键内容可以表征智慧业务互动事件中的局部性内容和阶段性内容,从而使得基于量化共性评价识别出的主题型互动事件能够从局部性内容和阶段性内容的角度进行精准、有效地判别,进而可以提高识别出的主题型互动事件的准确率和特征识别度,尽量保证主题型互动事件能够反映出多样化互动事件集中较为显著的内容信息,为多样化互动事件集的主题确定提供准确可靠的决策依据
在步骤302中,确定所述多个日志记录事项中每个所述日志记录事项对应的日志记录事项描述集;所述日志记录事项描述集包括所述日志记录事项在多种互动状态层面下的描述。
以一些示例性的角度来看待,针对该待挖掘业务项目日志中的每个日志记录事项,可以获取多种互动状态层面下每个日志记录事项对应的描述(特征),以得到每个日志记录事项对应的日志记录事项描述集。换言之,对于一个日志记录事项,可以获取该日志记录事项在多种互动状态层面(互动状态维度)下的描述,以得到该日志记录事项对应的日志记录事项描述集。相应地,该日志记录事项描述集包括该日志记录事项在多种互动状态层面下的描述。
以一些示例性的角度来看待,日志记录事项对应的日志记录事项描述集包括多个描述,所述多个描述可以与多种互动状态层面相对应。其中,该日志记录事项描述集对应的多种互动状态层面可以包括以下至少之一:日志记录事项自身的互动状态信息、日志记录事项的整体性互动状态信息、日志记录事项的事项内容分布互动状态信息、日志记录事项在承载内容层面中的互动状态信息和日志记录事项在潜在画像层面中的互动状态信息。
进一步地,事项内容分布互动状态信息用于表征事项内容的位置状态,承载内容用于表征文字内容或者文本内容,潜在画像用于表征具有特定意义和价值的画像信息。
以一些示例性的角度来看待,日志记录事项描述集中的多个描述中,不同的描述对应不同的互动状态层面,即若日志记录事项描述集中存在x个描述,该x个描述可以对应x种不同的互动状态层面;在本申请的另一些实施例中,可以存在多个描述对应一种互动状态层面,即若日志记录事项描述集中存在x个描述,该x个描述可以对应x种或少于x种不同的互动状态层面。可以理解的是,一个描述仅能对应一种互动状态层面,而一种互动状态层面可以对应多个描述。
在步骤303中,基于每个所述日志记录事项对应的日志记录事项描述集,生成每个所述日志记录事项对应的潜在画像事项描述;所述潜在画像事项描述用于表达所述日志记录事项对应的潜在画像信息。
其中,每个日志记录事项对应的日志记录事项潜在画像描述合并了该日志记录事项描述集中的多个描述。该潜在画像事项描述由于已经合并了该日志记录事项在多个互动状态层面下的特征,因此,该潜在画像事项描述包含了所述日志记录事项对应的潜在画像信息,潜在画像信息可以用于表示该日志记录事项是否属于潜在画像项目日志中的日志记录事项;在该日志记录事项属于潜在画像项目日志中的日志记录事项的情形下,该潜在画像信息还可以用于表示该日志记录事项在潜在画像项目日志中的事项内容分布,和该日志记录事项所在的潜在画像项目日志的潜在画像种类。
可以理解的是,潜在画像事项描述可以用于进行用户业务需求的挖掘分析,从而实现精准高效的业务服务推送,由于潜在画像事项描述对应更深层次的用户画像,因而能够确保业务服务推送的针对性和前瞻性。
以一些示例性的角度来看待,可以通过以下方式实现上述步骤303:对于每个日志记录事项,可以基于该日志记录事项对应的日志记录事项描述集,将该日志记录事项描述集中的至少一个描述进行全局化处理(比如加权求和),以确定该日志记录事项对应的潜在画像事项描述。在本申请实施例中,所谓描述可以理解为特征向量或者特征图。
以一些示例性的角度来看待,还可以通过以下方式实现上述步骤303:通过事先完成训练的神经网络模型对每个日志记录事项对应的日志记录事项描述集进行分析,并输出每个日志记录事项对应的潜在画像事项描述。其中,该神经网络模型可以为卷积神经网络模型、前馈神经网络模型、对抗神经网络模型、循环神经网络模型或者长短期记忆神经网络模型中的任意一种,本申请对此不作限定。
在步骤304中,根据每个所述日志记录事项对应的潜在画像事项描述,确定所述待挖掘业务项目日志中的潜在画像项目日志和所述潜在画像项目日志的潜在画像种类。
通过本申请实施例对于上述示例性实施可知,本申请实施例通过确定多个日志记录事项中每个日志记录事项对应的日志记录事项描述集;日志记录事项描述集包括日志记录事项在多种互动状态层面下的描述;基于每个日志记录事项对应的日志记录事项描述集,生成每个日志记录事项对应的潜在画像事项描述;潜在画像事项描述用于表达日志记录事项对应的潜在画像信息;根据每个日志记录事项对应的潜在画像事项描述,确定待挖掘业务项目日志中的潜在画像项目日志和潜在画像项目日志的潜在画像种类。可以提高潜在画像挖掘过程中的潜在画像项目日志及潜在画像种类获取的准确度和可信度。
对于一些可独立实施的设计思路而言,以下是本申请实施例提供的结合人工智能和大数据的信息挖掘方法的一个可选的方案,基于图3,图3中的步骤302还可以包括步骤401和步骤402。
在步骤401中,将所述待挖掘业务项目日志传入预先设置的第一神经网络模型中,通过所述第一神经网络模型获取所述每个所述日志记录事项对应的事项主题描述;所述事项主题描述包括所述日志记录事项对应的日志记录事项描述、事项内容分布描述和局部化信息描述。
以一些示例性的角度来看待,该第一神经网络模型可以为长短期记忆神经网络模型(Long Short-Term Memory,LSTM),将每个日志记录事项传入至该LSTM网络模型中,可以得到LSTM网络模型对每个日志记录事项在日志记录事项自身的互动状态信息、日志记录事项的整体性互动状态信息、日志记录事项的事项内容分布互动状态信息等互动状态层面上的描述表示。换言之,在将每个日志记录事项传入至该LSTM网络模型后,可以得到该LSTM网络模型输出的每个日志记录事项对应的日志记录事项描述、事项内容分布描述和局部化信息描述。
其中,日志记录事项描述是将待挖掘业务项目日志中的日志记录事项转化为描述向量进行表示,用于表达日志记录事项自身的互动状态信息;局部化信息描述可以是用于侧面表达业务项目日志的整体性互动状态信息,并与业务项目日志中字的互动状态信息相合并,即用于表达日志记录事项的整体性互动状态信息;事项内容分布描述则是为了区分在业务项目日志中不同事项内容分布出现的日志记录事项所对应的不同互动状态信息(比如:“A向B支付”和“B向A支付”)而附加的描述,即用于表达日志记录事项的事项内容分布互动状态信息。
在步骤402中,提取待挖掘业务项目日志中的至少一个待挖掘场景的场景约束信息;基于至少一个待挖掘场景的场景约束信息,生成每个日志记录事项对应的事项场景描述。
其中,场景约束信息可以理解为场景限制信息或者场景边界信息,用于对不同场景进行区分和限定。以一些示例性的角度来看待,为了获取待挖掘业务项目日志中潜在画像项目日志及潜在画像种类的准确度和可信度,需要获取日志记录事项在“场景”的互动状态层面上的关键特征,换言之,根据每个日志记录事项相对于该日志记录事项对应的待挖掘场景的关键特征。其中,上述关键特征可以包括潜在画像层面上的关键特征和承载内容层面上的关键特征。可以通过以下方式实现每个日志记录事项对应的事项场景描述的获取:
获取该待挖掘业务项目日志中的至少一个待挖掘场景及每个待挖掘场景对应的场景约束信息。其中,可以通过该获取至少一个待挖掘场景的场景约束信息,以确定该待挖掘业务项目日志中的至少一个待挖掘场景。例如,对于待挖掘业务项目日志为“对象C创建服务平台cloud”,该待挖掘业务项目日志中的各日志记录事项可以简称为“日志记录事项caseN”,其中,“日志记录事项case1”为“对象”,“日志记录事项case4”为“建”,依次类推。获取该待挖掘业务项目日志中的待挖掘场景为“对象C”、“创建”、“服务平台”、“cloud”;对于“cloud”,该待挖掘场景的约束信息可以包括“对象”为开始日志记录事项、“cloud”为末阶日志记录事项、“C”为第二日志记录事项或过渡日志记录事项、“平台”为第三日志记录事项或过渡日志记录事项。
确定日志记录事项对应的待挖掘场景,根据该待挖掘场景的场景约束信息确定该日志记录事项的对应的事项场景描述。例如,对于日志记录事项case1,可以确定该日志记录事项case1对应的待挖掘场景为“对象C”,根据“对象C”的场景约束信息“对象”为开始日志记录事项、“C”为第二日志记录事项或末阶日志记录事项。因此,可以将日志记录事项case1对应的事项场景描述设置为用于表达开始日志记录事项的描述。
以一些示例性的角度来看待,所述事项场景描述包括以下至少之一:承载内容约束描述和潜在画像约束描述。其中,在该事项场景描述包括承载内容约束描述和潜在画像约束描述的情形下,一个日志记录事项可以对应承载内容约束描述和潜在画像约束描述两种事项场景描述。可以理解的是,承载内容约束描述和潜在画像约束描述分别表征承载内容的限制条件和潜在画像的限制条件。
通过本申请实施例对于上述示例性实施可知,本申请实施例通过获取每个日志记录事项的事项主题描述和事项场景描述,可以得到每个日志记录事项在“事项主题”层面上的关键特征的同时,得到每个日志记录事项在“场景”层面上的关键特征,进一步提升了潜在画像识别时的准确度和可信度。
在一些可独立实施的设计思路下,以下是本申请实施例提供的结合人工智能和大数据的信息挖掘方法的一个可选的技术方案,上述步骤402还可以包括步骤501和步骤502。
在步骤501中,对待挖掘业务项目日志进行场景划分,得到待挖掘业务项目日志中的至少一个待挖掘承载内容的承载内容约束信息;基于至少一个待挖掘承载内容的承载内容约束信息,生成每个日志记录事项对应的承载内容约束描述;承载内容约束描述用于表达日志记录事项在与日志记录事项对应的待挖掘承载内容中的事项内容分布。
以一些示例性的角度来看待,在该事项场景描述包括承载内容约束描述的情形下,可以利用该待挖掘业务项目日志中包含的待挖掘承载内容确定每个日志记录事项对应的承载内容约束描述。该承载内容约束描述用于表达该待挖掘承载内容中各日志记录事项的事项内容分布特征(位置分布特征)。
其中,可以采用预先设置的场景划分线程对该待挖掘业务项目日志进行拆分/场景划分,得到多个待挖掘承载内容,基于已经得到的待挖掘承载内容,可以得到该待挖掘承载内容的承载内容约束信息。可以理解的是,所述多个待挖掘承载内容可以按照排序先后重新组合得到该待挖掘业务项目日志。
例如,在上述示例的基础上,在待挖掘业务项目日志为“对象C创建服务平台cloud”的情形下,若采用上述的场景划分线程进行拆分,可以得到“对象C”、“创建”、“服务平台”、“cloud”4个待挖掘承载内容。对于“cloud”,该待挖掘承载内容的承载内容约束信息可以包括:“对象”为承载内容的起始日志记录事项、“cloud”为承载内容的末阶日志记录事项、“C”为承载内容的第二日志记录事项或承载内容的过渡日志记录事项、“平台”为承载内容的第三日志记录事项或承载内容的过渡日志记录事项。
以一些示例性的角度来看待,基于至少一个待挖掘承载内容的承载内容约束信息,生成每个日志记录事项对应的承载内容约束描述。其中,可以预先设置的承载内容约束信息与承载内容约束描述的调整策略,根据该调整策略得到每个日志记录事项对应的承载内容约束描述。
例如,可以对承载内容约束信息中日志记录事项的不同事项内容分布设置不同的承载内容约束描述的对应关系,对每个日志记录事项进行精简化的描述表示,其中1对应承载内容的起始,2对应承载内容的过渡,3对应承载内容的终止,4对应日志记录事项单独成场景。在上述示例的基础上,对于“对象C创建服务平台cloud”,“对象”为“对象C”的承载内容的起始日志记录事项,承载内容约束描述可以简化为31;“C”为“对象C”的承载内容的末阶日志记录事项,承载内容约束描述可以简化为33;“服务平台”单独为一个承载内容,承载内容约束描述可以简化为34;“平台”为“cloud”的承载内容的过渡日志记录事项,承载内容约束描述可以简化为32。
在步骤502中,根据预先设置的潜在画像数据库,获取待挖掘业务项目日志中的至少一个待挖掘潜在画像的潜在画像拆分信息;基于至少一个待挖掘承载内容的潜在画像拆分信息,生成每个日志记录事项对应的潜在画像约束描述;潜在画像约束描述用于表达日志记录事项在与日志记录事项对应的待挖掘承载内容中的事项内容分布。
以一些示例性的角度来看待,在该事项场景描述包括潜在画像约束描述的情形下,可以利用该待挖掘业务项目日志中包含的待挖掘潜在画像确定每个日志记录事项对应的潜在画像约束描述。该潜在画像约束描述用于表达该待挖掘潜在画像中各日志记录事项的事项内容分布特征。
以一些示例性的角度来看待,可以通过预先设置的潜在画像数据库获取该待挖掘业务项目日志中的至少一个待挖掘潜在画像,及每个待挖掘潜在画像的潜在画像拆分信息。例如,可以利用匹配策略依次提取该待挖掘业务项目日志中的部分日志记录事项在所述潜在画像数据库中进行配对,以得到对应的待挖掘潜在画像。其中,该匹配策略可以包括前置匹配策略和后置匹配策略。可以理解的是,在待挖掘业务项目日志中,可能存在不属于潜在画像的日志记录事项,因此,所述多个待挖掘潜在画像有可能不能按照排序先后重新组合得到该待挖掘业务项目日志。
例如,在上述示例的基础上,在待挖掘业务项目日志为“对象C创建服务平台cloud”的情形下,若采用上述的匹配策略进行提取,可以得到“对象C”、“cloud”2个待挖掘潜在画像。对于“cloud”,该待挖掘潜在画像的潜在画像拆分信息可以包括:“对象”为潜在画像初阶日志记录事项、“cloud”为潜在画像末阶日志记录事项、“C”为潜在画像第二日志记录事项或潜在画像过渡日志记录事项、“平台”为潜在画像第三日志记录事项或潜在画像过渡日志记录事项。
以一些示例性的角度来看待,基于至少一个待挖掘潜在画像的潜在画像拆分信息,生成每个日志记录事项对应的潜在画像约束描述。其中,可以预先设置的潜在画像约束信息与潜在画像约束描述的调整策略,根据该调整策略得到每个日志记录事项对应的潜在画像约束描述。
例如,可以对潜在画像约束信息中日志记录事项的不同事项内容分布设置不同的潜在画像约束描述的对应关系,对每个日志记录事项进行精简化part的描述表示,其中1对应潜在画像的起始,2对应潜在画像的过渡,3对应潜在画像的终止,4对应日志记录事项单独成一个潜在画像;part对应当前日志记录事项不是潜在画像的一部分。在上述示例的基础上,对于“对象C创建服务平台cloud”,“对象”为“对象C”的潜在画像初阶日志记录事项,潜在画像约束描述可以简化为31;“C”为“对象C”的潜在画像末阶日志记录事项,潜在画像约束描述可以简化为33;“服务平台”不是一个潜在画像,潜在画像约束描述可以简化为3part;“平台”为“cloud”的潜在画像过渡日志记录事项,潜在画像约束描述可以简化为32。
可以理解的是,本申请可以同时将日志记录事项的承载内容约束描述和潜在画像约束描述作为该日志记录事项的事项场景描述;也可以仅仅将承载内容约束描述作为该日志记录事项的事项场景描述;还可以仅仅将潜在画像约束描述作为该日志记录事项的事项场景描述。
通过本申请实施例对于上述示例性实施可知,本申请实施例通过获取每个日志记录事项的潜在画像约束描述和承载内容约束描述,可以得到每个日志记录事项在“潜在画像”层面上的关键特征的同时,得到每个日志记录事项在“承载内容”层面上的关键特征,在进行潜在画像提取时可以关注到日志记录事项对应的承载内容历史信息和潜在画像历史信息,进而提升了潜在画像识别时的准确度和可信度。
对于一些可独立实施的技术方案而言,以下为本申请实施例提供的结合人工智能和大数据的信息挖掘方法的一个可选实施例,基于图3,图3中的步骤303更新为步骤601。
在步骤601中,将每个日志记录事项对应的日志记录事项描述集传入至预先设置的第二神经网络模型中,得到第二神经网络模型输出的每个日志记录事项对应的潜在画像事项描述。
以一些示例性的角度来看待,该第二神经网络模型为图3对应实施例中的事先完成训练的神经网络模型。可以理解的是,该第二神经网络模型可以与上述第一神经网络模型相同,均为LSTM网络模型;也可以与上述第一神经网络模型不同,本申请对此不作限定。
以一些示例性的角度来看待,在将每个日志记录事项对应的日志记录事项描述集传入至该预先设置的第二神经网络模型之前,可以先将每个日志记录事项对应的日志记录事项描述合并为每个日志记录事项对应的待输入日志记录事项描述。通过该实施例,可以在保留多互动状态关键信息维度的情形下,降低第二神经网络模型的运算资源开销。
举例而言,可以通过以下方式实现上述步骤601。
在步骤6011中,获取日志记录事项描述集对应的重要程度信息;重要程度信息包括日志记录事项描述集中每个层面对应的重要程度。
以一些示例性的角度来看待,该重要程度信息包括该日志记录事项描述集中每个互动状态层面对应的重要程度(权重)。例如,在该日志记录事项描述集包括事项场景描述和事项主题描述两种层面下的描述时,该日志记录事项描述集对应的重要程度信息至少包括事项场景描述对应的重要程度和事项主题描述对应的重要程度。
以一些示例性的角度来看待,本申请可以根据该日志记录事项描述集中包括的各描述的层面类别(维度种类),确定该日志记录事项描述集对应的目标重要程度信息。其中,本申请预先针对不同层面的组合设置不同的候选重要程度信息,在选取重要程度信息时,会根据该日志记录事项描述集包含的层面在候选重要程度信息中选择日志记录事项描述集对应的重要程度信息。
例如,若该日志记录事项描述集包括事项场景描述和事项主题描述两种层面下的描述,则会将“事项场景描述+事项主题描述”的组合对应的候选重要程度信息确定为该日志记录事项描述集对应的重要程度信息,若该日志记录事项描述集包括日志记录事项描述、事项内容分布描述、局部化信息描述和承载内容约束描述四种层面下的描述,会将“日志记录事项描述+事项内容分布描述+局部化信息描述+承载内容约束描述”的组合对应的候选重要程度信息确定为该日志记录事项描述集对应的重要程度信息。
在步骤6012中,根据每个层面对应的重要程度,对日志记录事项在不同层面下的日志记录事项描述进行合并,得到待输入日志记录事项描述。
在步骤6013中,将每个日志记录事项对应的待输入日志记录事项描述传入至预先设置的第二神经网络模型中,得到第二神经网络模型输出的每个日志记录事项对应的潜在画像事项描述。
通过本申请实施例对于上述示例性实施可知,本申请实施例针对不同层面组合的日志记录事项描述集设置不同的候选重要程度信息,可以提升潜在画像识别的准确性。
在一些可独立实施的设计思路下,以下是本申请实施例提供的结合人工智能和大数据的信息挖掘方法的一个可选的技术方案,基于图3,图3中的步骤304更新为步骤701至步骤703。
在步骤701中,根据每个日志记录事项对应的潜在画像事项描述构建每个日志记录事项对应的记录事项视觉描述。
以一些示例性的角度来看待,可以仅仅将该每个日志记录事项对应的潜在画像事项描述确定为每个日志记录事项对应的记录事项视觉描述(特征图或者特征向量)。
以一些示例性的角度来看待,还可以根据每个日志记录事项对应的潜在画像事项描述和每个日志记录事项对应的待合并描述集,生成每个日志记录事项对应的记录事项视觉描述。其中,该待合并描述集用于表达日志记录事项在场景集层面下的描述。由于在每个日志记录事项对应的潜在画像事项描述的基础上,合并了每个日志记录事项在场景集层面下的描述,可以使得对日志记录事项进行潜在画像分类的过程中,可以进一步考虑到日志记录事项在场景集层面上的关键特征,进而提升了潜在画像项目日志提取的准确性,也提升了潜在画像种类识别的准确性。
在步骤702中,将每个日志记录事项对应的记录事项视觉描述传入至预先设置的第三神经网络模型中,得到每个日志记录事项对应的潜在画像项目日志拆分结果;潜在画像项目日志拆分结果包括潜在画像约束信息和潜在画像种类信息。
以一些示例性的角度来看待,该第三神经网络模型包括初阶约束单元和末阶约束单元,其中,该初阶约束单元用于确定日志记录事项是否为潜在画像项目日志的起始日志记录事项,及该日志记录事项对应的潜在画像项目日志的潜在画像种类;该末阶约束单元用于确定日志记录事项是否为潜在画像项目日志的末阶日志记录事项,及该日志记录事项对应的潜在画像项目日志的潜在画像种类。其中,该初阶约束单元和末阶约束单元可以为相应的全连接网络,基于此,约束单元也可以理解为边界层或者边界网络,其网络参数的调整可以根据实际情况而定,本申请实施例不作限制。
以一些示例性的角度来看待,可以通过以下方式实现步骤702。
在步骤7021中,将每个日志记录事项对应的记录事项视觉描述传入至初阶约束单元,得到初阶约束单元输出的每个日志记录事项对应的初阶约束描述。
在步骤7022中,将每个日志记录事项对应的初阶约束描述和记录事项视觉描述传入至末阶约束单元,得到末阶约束单元输出的每个日志记录事项对应的末阶约束描述。
可以理解的是,该第三神经网络模型中包括的初阶约束单元(起始网络层)和末阶约束单元(结束网络层)的输入信息均包括步骤702得到的每个日志记录事项对应的记录事项视觉描述,其中,相比于该初阶约束单元的输入信息,末阶约束单元的输入信息不仅包括了日志记录事项对应的记录事项视觉描述,还包括了该日志记录事项在传入至初阶约束单元之后得到的初阶约束描述。
在步骤7023中,根据每个日志记录事项对应的初阶约束描述确定每个日志记录事项的潜在画像初阶拆分结果;潜在画像初阶拆分结果用于表达日志记录事项是否为潜在画像初阶日志记录事项和潜在画像种类。
在步骤7024中,根据每个日志记录事项对应的末阶约束描述确定每个日志记录事项的潜在画像末阶拆分结果;潜在画像末阶拆分结果用于表达日志记录事项是否为潜在画像末阶日志记录事项和潜在画像种类。
在步骤7025中,根据每个日志记录事项对应的潜在画像初阶拆分结果和潜在画像末阶拆分结果,确定每个日志记录事项对应的潜在画像项目日志拆分结果。
在步骤703中,根据每个日志记录事项对应的潜在画像约束信息和潜在画像种类信息,获取待挖掘业务项目日志中的潜在画像项目日志和潜在画像项目日志的潜在画像种类。
以一些示例性的角度来看待,基于每个日志记录事项对应的潜在画像约束信息和潜在画像种类信息,可以确定每个日志记录事项是否为潜在画像中的日志记录事项,在该日志记录事项为潜在画像日志记录事项的情形下,可以得到该日志记录事项对应的潜在画像种类,还可以得到该日志记录事项为对应潜在画像项目日志的潜在画像初阶日志记录事项或潜在画像末阶日志记录事项。进一步的,通过各潜在画像种类的潜在画像初阶日志记录事项和潜在画像末阶日志记录事项,可以得到各潜在画像种类的潜在画像项目日志。
通过本申请实施例对于上述示例性实施可知,本申请实施例通过设置不同网络层来对日志记录事项进行潜在画像初阶日志记录事项或潜在画像末阶日志记录事项的判断,使得第三神经网络模型中的初阶约束单元对潜在画像初阶日志记录事项的识别准确度更高,也使得第三神经网络模型中末阶约束单元对潜在画像末阶日志记录事项的识别准确度更高;由于在每个日志记录事项对应的潜在画像事项描述的基础上,合并了每个日志记录事项在场景集层面下的描述,可以使得对日志记录事项进行潜在画像分类的过程中,可以进一步考虑到日志记录事项在场景集层面上的关键特征,进而提升了潜在画像项目日志提取的准确性,也提升了潜在画像种类识别的准确性。
对于一些可独立实施的技术方案而言,以下是本申请实施例提供的结合人工智能和大数据的信息挖掘方法的一个可选的实施例,上述步骤701还可以包括步骤801至步骤802。
在步骤801中,基于所述待挖掘业务项目日志,确定每个所述日志记录事项对应的待合并描述集;所述待合并描述集包括所述日志记录事项在不同场景集层面下的描述。
以一些示例性的角度来看待,由于第二神经网络模型比较关注待挖掘业务项目日志中单个日志记录事项在各个互动状态层面下的特征,因此,在进行潜在画像项目日志及潜在画像种类的获取过程中,为了提升潜在画像项目日志及潜在画像种类的识别准确性,本申请还对每个日志记录事项对应的潜在画像事项描述设置用于体现日志记录事项在不同场景集层面下的描述,即,确定每个日志记录事项对应的待合并描述集;所述待合并描述集包括所述日志记录事项在不同场景集层面下的描述。
以一些示例性的角度来看待,待合并描述集包括以下至少之一:待合并承载内容描述和待合并潜在画像描述。其中,该待合并承载内容描述为日志记录事项在承载内容层面下的描述;该待合并潜在画像描述为日志记录事项在潜在画像层面下的描述。
在步骤802中,基于每个所述日志记录事项对应的待合并描述集,对每个所述日志记录事项对应的潜在画像事项描述进行合并操作,得到每个所述日志记录事项对应的记录事项视觉描述。
以一些示例性的角度来看待,获取该待合并描述集中每个描述对应的削弱型重要程度(降权权重),并通过以下方式完成对每个所述日志记录事项对应的潜在画像事项描述进行合并操作:确定该待合并描述集中每个描述与对应的削弱型重要程度的量化融合结果(比如乘积)作为过渡描述,将该过渡描述与该潜在画像事项描述的整合结果(比如该过渡描述与该潜在画像事项描述的和)确定为所述记录事项视觉描述。
以一些示例性的角度来看待,可以根据该待合并描述集中包含的描述种类,确定合并操作中该待合并描述集中各个描述的削弱型重要程度。
例如,待合并描述集包括以下至少之一:待合并承载内容描述和待合并潜在画像描述,在待合并描述集仅包括待合并承载内容描述的情形下,该待合并承载内容描述对应的削弱型重要程度为weight-A1;在待合并描述集仅包括待合并潜在画像描述的情形下,该待合并潜在画像描述对应的削弱型重要程度为weight-B1;在待合并描述集包括待合并承载内容描述和待合并潜在画像描述的情形下,该待合并承载内容描述对应的削弱型重要程度为weight-A2、该待合并潜在画像描述对应的削弱型重要程度为weight-B2。其中,weight-A1和weight-A2可以相同也可以不相同,weight-B1和weight-B2可以相同也可以不相同。
以一些示例性的角度来看待,在待合并描述集包括待合并承载内容描述的情形下,上述基于待挖掘业务项目日志,确定每个日志记录事项对应的待合并描述集,包括:根据待挖掘业务项目日志中的至少一个待挖掘承载内容的承载内容约束信息,和每个日志记录事项对应的潜在画像事项描述,获取每个日志记录事项对应的待合并承载内容描述;待合并承载内容描述用于表达日志记录事项在承载内容层面下的互动状态关键信息。上述基于每个日志记录事项对应的待合并描述集,对每个日志记录事项对应的潜在画像事项描述进行合并操作,得到每个日志记录事项对应的记录事项视觉描述,包括:基于每个日志记录事项对应的待合并承载内容描述,对每个日志记录事项对应的潜在画像事项描述进行合并操作,得到每个日志记录事项对应的记录事项视觉描述。
示例性的,可以通过注意力截止获取日志记录事项对应的待合并承载内容描述。之后,还可以通过归一化算法对每个所述日志记录事项对应的潜在画像事项描述进行合并操作。
以一些示例性的角度来看待,在待合并描述集包括待合并承载内容描述和待合并潜在画像描述的情形下,上述基于待挖掘业务项目日志,确定每个日志记录事项对应的待合并描述集包括:获取每个日志记录事项对应的待定潜在画像集;待定潜在画像集包括多个包含日志记录事项的待定潜在画像和每个待定潜在画像的历史描述;根据每个待定潜在画像的历史描述,确定每个日志记录事项对应的待合并潜在画像描述;上述基于每个日志记录事项对应的待合并描述集,对每个日志记录事项对应的潜在画像事项描述进行合并操作,得到每个日志记录事项对应的记录事项视觉描述,包括:基于每个日志记录事项对应的待合并承载内容描述和每个日志记录事项对应的待合并潜在画像描述,对每个日志记录事项对应的潜在画像事项描述进行合并操作,得到每个日志记录事项对应的记录事项视觉描述。
以一些示例性的角度来看待,在待合并描述集包括待合并潜在画像描述的情形下,上述基于待挖掘业务项目日志,确定每个日志记录事项对应的待合并描述集包括:获取每个日志记录事项对应的待定潜在画像集;待定潜在画像集包括多个包含日志记录事项的待定潜在画像和每个待定潜在画像的历史描述;根据每个待定潜在画像的历史描述,确定每个日志记录事项对应的待合并潜在画像描述;上述基于每个日志记录事项对应的待合并描述集,对每个日志记录事项对应的潜在画像事项描述进行合并操作,得到每个日志记录事项对应的记录事项视觉描述,包括:基于每个日志记录事项对应的待合并潜在画像描述,对每个日志记录事项对应的潜在画像事项描述进行合并操作,得到每个日志记录事项对应的记录事项视觉描述。
以一些示例性的角度来看待,可以通过以下方式实现上述根据每个待定潜在画像的历史描述,确定每个日志记录事项对应的待合并潜在画像描述:获取日志记录事项对应的至少一个待定集;待定集包括多个待定潜在画像和每个待定潜在画像的历史描述;基于每个待定集,获取每个待定集对应的待定描述;根据每个待定集对应的待定描述,确定日志记录事项对应的待合并潜在画像描述。
以一些示例性的角度来看待,可以通过以下方式实现上述基于每个待定集,获取每个待定集对应的待定描述:获取待定集中每个待定描述的场景频信息;根据每个待定描述的场景频信息对待定集中的每个待定描述进行基于权重层面的平均化处理,得到待定集对应的待定描述。
其中,在待定潜在画像集包括第一待定集、第二待定集和第三待定集的情形下,可以通过以下方法实现上述获取日志记录事项对应的至少一个待定集:获取日志记录事项对应的第一待定集、第二待定集和第三待定集;第一待定集包括多个第一待定潜在画像和每个第一待定潜在画像的第一历史描述,第一待定潜在画像为潜在画像初阶日志记录事项为日志记录事项的待定潜在画像;第二待定集包括多个第二待定潜在画像和每个第二待定潜在画像的第二历史描述,第二待定潜在画像为潜在画像过渡日志记录事项为日志记录事项的待定潜在画像;第三待定集包括多个第三待定潜在画像和每个第三待定潜在画像的第三历史描述,第三待定潜在画像为潜在画像末阶日志记录事项为日志记录事项的待定潜在画像。
以一些示例性的角度来看待,可以通过以下方法实现上述基于每个待定集,获取每个待定集对应的待定描述:基于第一待定集中的多个第一历史描述确定第一待定描述;基于第二待定集中的多个第二历史描述确定第二待定描述;基于第三待定集中的多个第三历史描述确定第三待定描述。
以一些示例性的角度来看待,可以通过以下方法实现上述根据每个待定集对应的待定描述,确定日志记录事项对应的待合并潜在画像描述:根据第一待定描述、第二待定描述和第三待定描述,确定日志记录事项对应的待合并潜在画像描述。
通过本申请实施例对于上述示例性实施可知,本申请实施例通过对原始的待挖掘业务项目日志进行场景划分,可以获取到每个日志记录事项对应的承载内容历史信息;通过对原始的待挖掘业务项目日志进行潜在画像索引,可以获取到每个日志记录事项对应的潜在画像历史信息,因而可以得到更加准确的挖掘结果。
<应用场景实施例>
在上述的方法实施例的基础上,本申请实施例还提出了一种应用场景实施例,也即结合人工智能和大数据的信息挖掘方法的应用场景,请结合参阅图4,结合人工智能和大数据的信息挖掘方法的应用场景30可以包括互相通信的信息挖掘系统100和业务互动设备200。进一步地,结合人工智能和大数据的信息挖掘方法的应用场景30的功能性描述如下。
信息挖掘系统100通过业务互动设备200获取待挖掘业务项目日志的多个日志记录事项;确定所述多个日志记录事项中每个所述日志记录事项对应的日志记录事项描述集;所述日志记录事项描述集包括所述日志记录事项在多种互动状态层面下的描述;所述多种互动状态层面至少包括承载内容层面和潜在画像层面;基于每个所述日志记录事项对应的日志记录事项描述集,生成每个所述日志记录事项对应的潜在画像事项描述;所述潜在画像事项描述用于表达所述日志记录事项对应的潜在画像信息;根据每个所述日志记录事项对应的潜在画像事项描述,确定所述待挖掘业务项目日志中的潜在画像项目日志和所述潜在画像项目日志的潜在画像种类
以上已经结合附图描述了本申请的实施例,根据本实施例,通过确定多个日志记录事项中每个日志记录事项对应的日志记录事项描述集;日志记录事项描述集包括日志记录事项在多种互动状态层面下的描述;多种互动状态层面至少包括承载内容层面和潜在画像层面;基于每个日志记录事项对应的日志记录事项描述集,生成每个日志记录事项对应的潜在画像事项描述;潜在画像事项描述用于表达日志记录事项对应的潜在画像信息;根据每个日志记录事项对应的潜在画像事项描述,确定待挖掘业务项目日志中的潜在画像项目日志和潜在画像项目日志的潜在画像种类。可以提高潜在画像挖掘过程中的潜在画像项目日志及潜在画像种类获取的准确度和可信度。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种结合人工智能和大数据的信息挖掘方法,其特征在于,应用于信息挖掘系统,所述方法包括:
获取待挖掘业务项目日志的多个日志记录事项;
确定所述多个日志记录事项中每个所述日志记录事项对应的日志记录事项描述集;所述日志记录事项描述集包括所述日志记录事项在多种互动状态层面下的描述;所述多种互动状态层面至少包括承载内容层面和潜在画像层面;
基于每个所述日志记录事项对应的日志记录事项描述集,生成每个所述日志记录事项对应的潜在画像事项描述;所述潜在画像事项描述用于表达所述日志记录事项对应的潜在画像信息;
根据每个所述日志记录事项对应的潜在画像事项描述,确定所述待挖掘业务项目日志中的潜在画像项目日志和所述潜在画像项目日志的潜在画像种类。
2.根据权利要求1所述的方法,其特征在于,所述日志记录事项描述集包括所述日志记录事项对应的事项主题描述;所述获取所述多个日志记录事项中每个所述日志记录事项对应的日志记录事项描述集,包括:
将所述待挖掘业务项目日志传入预先设置的第一神经网络模型中,通过所述第一神经网络模型获取所述每个所述日志记录事项对应的事项主题描述;所述事项主题描述包括所述日志记录事项对应的日志记录事项描述、事项内容分布描述和局部化信息描述。
3.根据权利要求2所述的方法,其特征在于,所述日志记录事项描述集还包括所述日志记录事项对应的事项场景描述;所述获取所述多个日志记录事项中每个所述日志记录事项对应的日志记录事项描述集,还包括:
提取所述待挖掘业务项目日志中的至少一个待挖掘场景的场景约束信息;
基于所述至少一个待挖掘场景的场景约束信息,生成每个所述日志记录事项对应的事项场景描述。
4.根据权利要求3所述的方法,其特征在于,所述事项场景描述包括所述承载内容约束描述;所述提取所述待挖掘业务项目日志中的至少一个待挖掘场景的场景约束信息,包括:对所述待挖掘业务项目日志进行场景划分,得到所述待挖掘业务项目日志中的至少一个待挖掘承载内容的承载内容约束信息;
所述基于所述至少一个待挖掘场景的场景约束信息,生成每个所述日志记录事项对应的事项场景描述,包括:基于所述至少一个待挖掘承载内容的承载内容约束信息,生成每个所述日志记录事项对应的承载内容约束描述;所述承载内容约束描述用于表达所述日志记录事项在与所述日志记录事项对应的待挖掘承载内容中的事项内容分布。
5.根据权利要求4所述的方法,其特征在于,所述事项场景描述还包括所述潜在画像约束描述;所述提取所述待挖掘业务项目日志中的至少一个待挖掘场景的场景约束信息,还包括:根据预先设置的潜在画像数据库,获取所述待挖掘业务项目日志中的至少一个待挖掘潜在画像的潜在画像拆分信息;
所述基于所述至少一个待挖掘场景的场景约束信息,生成每个所述日志记录事项对应的事项场景描述,还包括:基于所述至少一个待挖掘承载内容的潜在画像拆分信息,生成每个所述日志记录事项对应的潜在画像约束描述;所述潜在画像约束描述用于表达所述日志记录事项在与所述日志记录事项对应的待挖掘承载内容中的事项内容分布;
相应的,所述基于每个所述日志记录事项对应的日志记录事项描述集,生成每个所述日志记录事项对应的潜在画像事项描述,包括:
将每个所述日志记录事项对应的日志记录事项描述集传入至预先设置的第二神经网络模型中,得到所述第二神经网络模型输出的每个所述日志记录事项对应的潜在画像事项描述。
6.根据权利要求5所述的方法,其特征在于,所述将每个所述日志记录事项对应的日志记录事项描述集传入至预先设置的第二神经网络模型中,得到所述第二神经网络模型输出的每个所述日志记录事项对应的潜在画像事项描述,包括:
获取所述日志记录事项描述集对应的重要程度信息;所述重要程度信息包括所述日志记录事项描述集中每个所述层面对应的重要程度;
根据每个所述层面对应的重要程度,对所述日志记录事项在不同层面下的日志记录事项描述进行合并,得到待输入日志记录事项描述;
将每个所述日志记录事项对应的待输入日志记录事项描述传入至预先设置的第二神经网络模型中,得到所述第二神经网络模型输出的每个所述日志记录事项对应的潜在画像事项描述。
7.根据权利要求5所述的方法,其特征在于,所述根据每个所述日志记录事项对应的潜在画像事项描述,从所述待挖掘业务项目日志中提取潜在画像项目日志,包括:
根据每个所述日志记录事项对应的潜在画像事项描述构建每个所述日志记录事项对应的记录事项视觉描述;
将每个所述日志记录事项对应的记录事项视觉描述传入至预先设置的第三神经网络模型中,得到每个所述日志记录事项对应的潜在画像项目日志拆分结果;所述潜在画像项目日志拆分结果包括潜在画像约束信息和潜在画像种类信息;
根据每个所述日志记录事项对应的潜在画像约束信息和潜在画像种类信息,获取所述待挖掘业务项目日志中的潜在画像项目日志和所述潜在画像项目日志的潜在画像种类。
8.根据权利要求7所述的方法,其特征在于,所述第三神经网络模型包括初阶约束单元和末阶约束单元;所述将每个所述日志记录事项对应的记录事项视觉描述传入至预先设置的第三神经网络模型中,得到每个所述日志记录事项对应的潜在画像项目日志拆分结果,包括:
将每个所述日志记录事项对应的记录事项视觉描述传入至所述初阶约束单元,得到所述初阶约束单元输出的每个所述日志记录事项对应的初阶约束描述;
将每个所述日志记录事项对应的初阶约束描述和记录事项视觉描述传入至所述末阶约束单元,得到所述末阶约束单元输出的每个所述日志记录事项对应的末阶约束描述;
根据每个所述日志记录事项对应的初阶约束描述确定每个所述日志记录事项的潜在画像初阶拆分结果;所述潜在画像初阶拆分结果用于表达所述日志记录事项是否为潜在画像初阶日志记录事项和潜在画像种类;
根据每个所述日志记录事项对应的末阶约束描述确定每个所述日志记录事项的潜在画像末阶拆分结果;所述潜在画像末阶拆分结果用于表达所述日志记录事项是否为潜在画像末阶日志记录事项和潜在画像种类;
根据每个所述日志记录事项对应的潜在画像初阶拆分结果和潜在画像末阶拆分结果,确定每个所述日志记录事项对应的潜在画像项目日志拆分结果。
9.根据权利要求7所述的方法,其特征在于,所述根据每个所述日志记录事项对应的潜在画像事项描述构建每个所述日志记录事项对应的记录事项视觉描述,包括:
基于所述待挖掘业务项目日志,确定每个所述日志记录事项对应的待合并描述集;所述待合并描述集包括所述日志记录事项在不同场景集层面下的描述;
基于每个所述日志记录事项对应的待合并描述集,对每个所述日志记录事项对应的潜在画像事项描述进行合并操作,得到每个所述日志记录事项对应的记录事项视觉描述;
相应的,所述待合并描述集包括待合并承载内容描述;所述基于所述待挖掘业务项目日志,确定每个所述日志记录事项对应的待合并描述集,包括:根据所述待挖掘业务项目日志中的至少一个待挖掘承载内容的承载内容约束信息,和每个所述日志记录事项对应的潜在画像事项描述,获取每个所述日志记录事项对应的待合并承载内容描述;所述待合并承载内容描述用于表达所述日志记录事项在承载内容层面下的互动状态关键信息;
所述基于每个所述日志记录事项对应的待合并描述集,对每个所述日志记录事项对应的潜在画像事项描述进行合并操作,得到每个所述日志记录事项对应的记录事项视觉描述,包括:基于每个所述日志记录事项对应的待合并承载内容描述,对每个所述日志记录事项对应的潜在画像事项描述进行合并操作,得到每个所述日志记录事项对应的记录事项视觉描述;
相应的,所述待合并描述集还包括待合并潜在画像描述;所述基于所述待挖掘业务项目日志,确定每个所述日志记录事项对应的待合并描述集包括:获取每个所述日志记录事项对应的待定潜在画像集;所述待定潜在画像集包括多个包含所述日志记录事项的待定潜在画像和每个所述待定潜在画像的历史描述;根据每个所述待定潜在画像的历史描述,确定每个所述日志记录事项对应的待合并潜在画像描述;所述待合并承载内容描述用于表达所述日志记录事项在潜在画像层面下的互动状态关键信息;
所述基于每个所述日志记录事项对应的待合并描述集,对每个所述日志记录事项对应的潜在画像事项描述进行合并操作,得到每个所述日志记录事项对应的记录事项视觉描述,包括:基于每个所述日志记录事项对应的待合并承载内容描述和每个所述日志记录事项对应的待合并潜在画像描述,对每个所述日志记录事项对应的潜在画像事项描述进行合并操作,得到每个所述日志记录事项对应的记录事项视觉描述。
10.一种信息挖掘系统,其特征在于,包括:
存储器,用于存储可执行的指令;
处理器,用于根据所述可执行的指令的控制,运行所述信息挖掘系统执行如权利要求1-9任一项所述的方法。
CN202210200735.3A 2022-03-02 2022-03-02 结合人工智能和大数据的信息挖掘方法及系统 Withdrawn CN114579634A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210200735.3A CN114579634A (zh) 2022-03-02 2022-03-02 结合人工智能和大数据的信息挖掘方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210200735.3A CN114579634A (zh) 2022-03-02 2022-03-02 结合人工智能和大数据的信息挖掘方法及系统

Publications (1)

Publication Number Publication Date
CN114579634A true CN114579634A (zh) 2022-06-03

Family

ID=81775462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210200735.3A Withdrawn CN114579634A (zh) 2022-03-02 2022-03-02 结合人工智能和大数据的信息挖掘方法及系统

Country Status (1)

Country Link
CN (1) CN114579634A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116386045A (zh) * 2023-06-01 2023-07-04 创域智能(常熟)网联科技有限公司 基于人工智能的传感器信息分析方法及人工智能平台系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116386045A (zh) * 2023-06-01 2023-07-04 创域智能(常熟)网联科技有限公司 基于人工智能的传感器信息分析方法及人工智能平台系统
CN116386045B (zh) * 2023-06-01 2023-08-08 创域智能(常熟)网联科技有限公司 基于人工智能的传感器信息分析方法及人工智能平台系统

Similar Documents

Publication Publication Date Title
CN109344884B (zh) 媒体信息分类方法、训练图片分类模型的方法及装置
CN109760041B (zh) 基于聊天机器人的云管理系统及其操作方法
CN111489095B (zh) 一种风险用户管理方法、装置、计算机设备和存储介质
CN113011889B (zh) 账号异常识别方法、系统、装置、设备及介质
CN111401063B (zh) 一种基于多池化网络的文本处理方法、装置和相关设备
CN111666400B (zh) 消息获取方法、装置、计算机设备及存储介质
CN107992937B (zh) 基于深度学习的非结构化数据判决方法和装置
CN111241850B (zh) 提供业务模型的方法及装置
CN111414842A (zh) 一种视频对比方法、装置、计算机设备和存储介质
CN116362261A (zh) 应对数字化服务项目的用户会话信息解析方法及软件产品
CN113362852A (zh) 一种用户属性识别方法和装置
CN116994176A (zh) 一种基于多维语义信息的视频关键数据提取方法
JP2024511103A (ja) 近似値に基づいて画像又はビデオの品質を評価する方法及び装置、第1のモデルの訓練方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
CN114596062A (zh) 应用于大数据的数字化智慧业务处理方法及系统
CN116977457A (zh) 一种数据处理方法、设备以及计算机可读存储介质
CN114579634A (zh) 结合人工智能和大数据的信息挖掘方法及系统
CN113569824B (zh) 模型处理方法、相关设备、存储介质及计算机程序产品
CN117151727B (zh) 基于用户行为分析的客服智能切换方法
CN117149996B (zh) 面向人工智能应用的人机界面数字会话挖掘方法及ai系统
Manousaki et al. Vlmah: Visual-linguistic modeling of action history for effective action anticipation
CN117197722B (zh) 基于移动互联网视频的用户感知与分析系统
CN113395584A (zh) 一种视频数据处理方法、装置、设备以及介质
CN116522131A (zh) 对象表示方法、装置、电子设备及计算机可读存储介质
CN114595277A (zh) 结合云计算和动态化分析的数据挖掘方法及系统
Lee et al. REINDEAR: REINforcement learning agent for Dynamic system control in Edge-Assisted Augmented Reality service

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20220603