CN112783881A - 基于人工智能和大数据的数据解析方法、系统及服务平台 - Google Patents

基于人工智能和大数据的数据解析方法、系统及服务平台 Download PDF

Info

Publication number
CN112783881A
CN112783881A CN202110058270.8A CN202110058270A CN112783881A CN 112783881 A CN112783881 A CN 112783881A CN 202110058270 A CN202110058270 A CN 202110058270A CN 112783881 A CN112783881 A CN 112783881A
Authority
CN
China
Prior art keywords
interactive
redundant
information
data
interaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110058270.8A
Other languages
English (en)
Inventor
薛杨杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110058270.8A priority Critical patent/CN112783881A/zh
Publication of CN112783881A publication Critical patent/CN112783881A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2423Interactive query statement specification based on a database schema
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种基于人工智能和大数据的数据解析方法、系统及服务平台,通过获取智能互动终端基于互动内容返回对应的冗余修正数据,以获得由多个冗余修正数据构成的冗余修正大数据,然后根据冗余修正大数据获取至少一个冗余服务源对象,接着基于冗余服务源对象中所属冗余标签下各编码向量表示和预设的人工智能模型,对互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到互动知识点的冗余内容特征向量和对应的冗余参数,从而能够对下发的互动内容的冗余数据以特征识别的形式进行更新,而非简单的内容屏蔽,进而提高用户对于所获取信息的体验,减少冗余数据的引入给互动内容的准确性和匹配度产生的影响。

Description

基于人工智能和大数据的数据解析方法、系统及服务平台
技术领域
本申请涉及移动互联网技术领域,具体而言,涉及一种基于人工智能和大数据的数据解析方法、系统及服务平台。
背景技术
伴随着移动互联网技术,通过服务平台与用户之间进行信息互动,可以更好地向用户进行相关互联网服务的解决方案,从而减少用户线下的频繁咨询活动。
然而,传统方案中,服务平台下发的互动内容中往往会包含诸多冗余数据,导致用户对于所获取信息的体验不佳。
发明内容
有鉴于此,本申请的目的在于提供一种基于人工智能和大数据的数据解析方法、系统及服务平台,能够对下发的互动内容的冗余数据以特征识别的形式进行更新,而非简单的内容屏蔽,进而提高用户对于所获取信息的体验,减少冗余数据的引入给互动内容的准确性和匹配度产生的影响。
根据本申请的第一方面,提供一种基于人工智能和大数据的数据解析方法,应用于与智能互动终端通信连接的区块链服务平台,所述方法包括:
获取所述智能互动终端发送的待互动信息,并根据所述待互动信息向所述智能互动终端发送互动内容,以使得所述智能互动终端基于所述互动内容返回对应的冗余修正数据,以获得由多个冗余修正数据构成的冗余修正大数据,其中,所述冗余修正数据用于指示所述互动内容中存在的与所述待互动信息对应的原始问题的冗余数据区域;
根据所述冗余修正大数据获取至少一个冗余服务源对象,每个所述冗余服务源对象中各对象特征向量属于同一冗余标签,并且,每个所述对象特征向量包含所属冗余标签下的编码向量表示;
基于所属冗余标签下各编码向量表示和预设的人工智能模型,对所述互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到所述互动知识点的冗余内容特征向量和对应的冗余参数;
根据所述互动知识点的冗余内容特征向量和对应的冗余参数对所述互动知识点的匹配内容数据进行更新,并将更新后的所述互动知识点的匹配内容数据上传到对应的区块链中。
在第一方面的一种可能的实现方式中,所述根据所述冗余修正大数据获取至少一个冗余服务源对象的步骤,包括:
根据所述冗余修正大数据构建对应不同冗余标签的编码向量数据库,所述编码向量数据库包括预设数量的编码向量表示;
获取包含所述编码向量数据库中任一编码向量表示的对象特征向量,并根据各所述对象特征向量的标签识别信息,将获取的所述对象特征向量进行划分,得到至少一个冗余服务源对象。
在第一方面的一种可能的实现方式中,所述基于所属冗余标签下各编码向量表示和预设的人工智能模型,对所述互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到所述互动知识点的冗余内容特征向量和对应的冗余参数的步骤,包括:
对每个冗余服务源对象,遍历所述冗余服务源对象中的对象特征向量,从所述对象特征向量中提取包含该冗余服务源对象所属冗余标签下各编码向量表示的编码向量分段,根据提取的编码向量分段从所述互动内容所对应的互动知识点的匹配内容数据中确定与所述冗余服务源对象对应的冗余反馈信息;
根据预设的人工智能模型,在所述冗余反馈信息中提取出满足预设冗余参数要求的各冗余反馈节点的冗余内容特征向量,获得所述互动知识点的冗余内容特征向量和对应的冗余参数。
在第一方面的一种可能的实现方式中,所述根据预设的人工智能模型,在所述冗余反馈信息中提取出满足预设冗余参数要求的各冗余反馈节点的冗余内容特征向量,获得所述互动知识点的冗余内容特征向量和对应的冗余参数的步骤,包括:
根据预设的人工智能模型,从所述冗余反馈信息中识别出冗余解析项目的元对象解析数据,所述元对象解析数据包括至少两种源元素对应的解析数据;
基于每种解释型源元素所对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系,分别构建每种解释型源元素与正文源元素之间的编排关系模型,其中,每种解释型源元素对应的编排关系模型用于表征每种解释型源元素与所述正文源元素之间的关联关系,编排关系模型中的元素用于表征每种解释型源元素对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系,其中,所述正文源元素为指定的所述至少两种源元素中的一种源元素,所述解释型源元素为所述至少两种源元素中除所述正文源元素之外的源元素;
基于所述正文源元素的数据,通过第一决策树模型,得到第一冗余决策结果,所述第一冗余决策结果中包括所述正文源元素对应的冗余计算前的冗余表示;
基于每种解释型源元素的数据,以及每种解释型源元素与所述正文源元素的关联关系,通过第二决策树模型,得到第二冗余决策结果;
基于所述第一冗余决策结果和所述第二冗余决策结果,得到最终冗余决策结果;
从所述最终冗余决策结果的每个冗余决策分类标签下的数据中提取获得所述互动知识点的冗余内容特征向量和对应的冗余参数,所述冗余参数为所述冗余决策分类标签对应的冗余参数。
在第一方面的一种可能的实现方式中,所述基于每种解释型源元素的数据,以及每种解释型源元素与所述正文源元素的关联关系,通过第二决策树模型,得到第二冗余决策结果的步骤,包括:
基于每种解释型源元素的数据,以及每种解释型源元素与所述正文源元素的关联关系,通过所述第二决策树模型,得到每种解释型源元素对应的子冗余决策结果;
基于每种解释型源元素对应的所述子冗余决策结果,以及每种解释型源元素对应的权重,得到所述第二冗余决策结果。
在第一方面的一种可能的实现方式中,所述基于所述正文源元素的数据,通过第一决策树模型,得到第一冗余决策结果的步骤,包括:
基于所述正文源元素的数据,计算所述正文源元素对应的冗余参与度,其中,所述正文源元素对应的冗余参与度与所述正文源元素的数据中被所述人工智能模型预先标记内容数量相关;
基于所述正文源元素对应的冗余参与度,通过所述第一决策树模型,得到所述第一冗余决策结果;
所述基于每种解释型源元素的数据,以及每种解释型源元素与所述正文源元素的关联关系,通过所述第二决策树模型,得到每种解释型源元素对应的子冗余决策结果,包括:
基于每种解释型源元素的数据,计算每种解释型源元素对应的冗余参与度,其中,所述解释型源元素对应的冗余参与度与所述解释型源元素的数据中被所述人工智能模型预先标记内容数量相关;
基于每种解释型源元素对应的冗余参与度和每种解释型源元素对应的编排关系模型,通过所述第二决策树模型,得到每种解释型源元素对应的子冗余决策结果;
其中,每种解释型源元素对应的编排关系模型用于表征每种解释型源元素与所述正文源元素之间的关联关系,每种解释型源元素对应的编排关系模型是基于每种解释型源元素所对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系构建的模型,编排关系模型中的元素用于表征每种解释型源元素对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系。
在第一方面的一种可能的实现方式中,所述根据所述互动知识点的冗余内容特征向量和对应的冗余参数对所述互动知识点的匹配内容数据进行更新的步骤,包括:
根据所述互动知识点的冗余内容特征向量从所述互动知识点的匹配内容数据中匹配出待更新的目标内容数据区域以及所述目标内容数据区域对应的服务标签;
根据所述目标内容数据区域对应的服务标签从所述对应的冗余参数中解析出对应的目标冗余参数,并根据所述目标冗余参数所对应的冗余语义特征对所述待更新的目标内容数据区域中相关的数据信息进行更新,其中,更新的方式包括删除方式和替换方式。
在第一方面的一种可能的实现方式中,所述获取所述智能互动终端发送的待互动信息,并根据所述待互动信息向所述智能互动终端发送互动内容的步骤,包括:
获取所述智能互动终端发送的待互动信息,并根据所述待互动信息确定当前互动衔接位置内的未互动信息,确定所述未互动信息的互动语义向量与大数据互动信息的互动语义向量之间的第一关联关系,其中,所述大数据互动信息基于历史时间段内的互动信息列表确定;
基于深度学习模型从所述大数据互动信息中提取满足所述未互动信息条件决策的决策互动语义节点,得到第一决策互动语义节点序列,并基于所述第一关联关系从所述第一决策互动语义节点序列中确定第一目标语义节点,根据所述第一目标语义节点对所述未互动信息的语义节点信息进行补充更新,得到目标语义综合特征信息;
确定所述目标语义综合特征信息的互动语义向量与所述未互动信息的互动语义向量之间的第二关联关系;
根据所述第二关联关系和所述未互动信息中语义节点的语义分量,对所述未互动信息进行特征标记处理,得到特征标记互动信息,并根据所述特征标记互动信息向所述智能互动终端发送互动内容后,将所述互动内容存储到对应的区块链中。
在第一方面的一种可能的实现方式中,所述基于深度学习模型从所述大数据互动信息中提取满足所述未互动信息条件决策的决策互动语义节点,得到第一决策互动语义节点序列的步骤,包括:
基于所述深度学习模型从所述未互动信息中识别出于当前业务场景匹配的多个条件决策互动段;
将所述多个条件决策互动段中每一个条件决策互动段作为当前条件决策互动段,执行以下步骤,直到遍历所述多个条件决策互动段:
在所述当前条件决策互动段检测到所述大数据互动信息所包含的互动业务的业务决策分段的情况下,获取所述业务决策分段的分段特征向量;
按照预设转换表中的特征向量数值与业务参数的转换关系,将所述业务决策分段转换为第一业务参数,并将所述第一业务参数确定为所述大数据互动信息与所述当前条件决策互动段的目标业务参数,其中,每个所述目标业务参数为所述大数据互动信息到所述条件决策互动段的业务参数;
将所述未互动信息对应的互动数据单元划分为多个互动数据子单元,并将每一个所述互动数据子单元确定为当前互动数据子单元,执行以下步骤,直到遍历每一个所述互动数据子单元:
将每一个所述条件决策互动段确定为当前条件决策互动段,执行以下步骤,直到遍历所述条件决策互动段:
在所述当前互动数据子单元与所述当前条件决策互动段的业务参数为与所述当前条件决策互动段对应的目标业务参数的情况下,确定所述当前互动数据子单元与所述当前条件决策互动段的匹配度为第一数值;
在所述当前互动数据子单元与所述当前条件决策互动段的业务参数大于或者小于所述当前条件决策互动段对应的目标业务参数的情况下,确定所述匹配度为零,其中,所述匹配度根据所述当前互动数据子单元的位置与所述条件决策互动段的位置和一组目标业务参数确定;
根据所述当前互动数据子单元的所有所述匹配度的乘积确定出所述大数据互动信息匹配所述当前互动数据子单元的目标匹配度;
获取所述目标匹配度中的最大匹配度对应的所述互动数据子单元的业务定位,并将所述业务定位确定为所述大数据互动信息在第一决策互动节点的目标业务定位;
在确定出多个决策互动节点所述大数据互动信息分别所在的目标业务定位的情况下,利用多个所述目标业务定位的位置信息生成所述大数据互动信息在所述互动数据单元内的互动偏移更新信息,其中,所述多个决策互动节点包括所述第一决策互动节点及所述第一决策互动节点之后的决策互动节点,在获取到目标时间段内在所述互动数据单元中生成的多个互动偏移更新信息的情况下,将每一个所述互动偏移更新信息确定为一个互动偏移更新信息团;
执行以下步骤,直到每两个所述互动偏移更新信息团的关联度大于或等于预定阈值:
将两个所述互动偏移更新信息团中的一个互动偏移更新信息团确定为当前互动偏移更新信息团,另一个互动偏移更新信息团确定为目标互动偏移更新信息团,将所述当前互动偏移更新信息团中的每一个所述互动偏移更新信息确定为当前互动偏移更新信息,执行以下步骤,直到遍历所述当前互动偏移更新信息团:
确定所述当前互动偏移更新信息与所述目标互动偏移更新信息团中每一个所述互动偏移更新信息的第一关联度;
在完成上述遍历后,将多个所述第一关联度的平均值确定为所述关联度;
将所述关联度最小的两个所述互动偏移更新信息团合并为一个新的互动信息团;
在执行完上述步骤后,得到多个第一互动偏移更新信息团,并将每一个所述第一互动偏移更新信息团确定为一类所述互动偏移更新信息;
在获取到一类所述互动偏移更新信息后,将一类所述互动偏移更新信息中的一条所述互动偏移更新信息确定为当前互动偏移更新信息,另一条所述互动偏移更新信息确定为第一互动偏移更新信息,执行以下步骤,直到遍历一类所述互动偏移更新信息中的所有互动偏移更新信息:
获取所述当前互动偏移更新信息与所述第一互动偏移更新信息中每两个对应业务类型的共同标签,将所述共同标签的标签迁移关系确定为新的所述当前互动偏移更新信息,将一类所述互动偏移更新信息中剩余的所述互动偏移更新信息中的一条所述互动偏移更新信息确定为所述第一互动偏移更新信息;
在完成上述遍历后,将最后确定出的一条所述当前互动偏移更新信息确定为一类所述互动偏移更新信息的热点互动信息,从一类所述互动偏移更新信息中确定出两条第二互动偏移更新信息,在两条所述第二互动偏移更新信息上的对应业务类型的业务关联度小于第二阈值的情况下,获取两个所述对应业务类型的共同标签;
在获取到多个所述共同标签之后,将所述共同标签的标签迁移关系确定为一类所述互动信息的最优公共子互动信息,以得到决策互动语义节点,从而汇总得到第一决策互动语义节点序列。
根据本申请的第二方面,提供一种基于人工智能和大数据的数据解析装置,应用于与智能互动终端通信连接的区块链服务平台,所述装置包括:
第一获取模块,用于获取所述智能互动终端发送的待互动信息,并根据所述待互动信息向所述智能互动终端发送互动内容,以使得所述智能互动终端基于所述互动内容返回对应的冗余修正数据,以获得由多个冗余修正数据构成的冗余修正大数据,其中,所述冗余修正数据用于指示所述互动内容中存在的与所述待互动信息对应的原始问题的冗余数据区域;
第二获取模块,用于根据所述冗余修正大数据获取至少一个冗余服务源对象,每个所述冗余服务源对象中各对象特征向量属于同一冗余标签,并且,每个所述对象特征向量包含所属冗余标签下的编码向量表示;
数据分析模块,用于基于所属冗余标签下各编码向量表示和预设的人工智能模型,对所述互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到所述互动知识点的冗余内容特征向量和对应的冗余参数;
更新模块,用于根据所述互动知识点的冗余内容特征向量和对应的冗余参数对所述互动知识点的匹配内容数据进行更新,并将更新后的所述互动知识点的匹配内容数据上传到对应的区块链中。
根据本申请的第三方面,提供一种基于人工智能和大数据的数据解析系统,所述基于人工智能和大数据的数据解析系统包括区块链服务平台以及与所述区块链服务平台通信连接的智能互动终端;
所述区块链服务平台用于获取所述智能互动终端发送的待互动信息,并根据所述待互动信息向所述智能互动终端发送互动内容,;
所述智能互动终端用于基于所述互动内容向所述区块链服务平台返回对应的冗余修正数据,以获得由多个冗余修正数据构成的冗余修正大数据,其中,所述冗余修正数据用于指示所述互动内容中存在的与所述待互动信息对应的原始问题的冗余数据区域;
所述区块链服务平台用于根据所述冗余修正大数据获取至少一个冗余服务源对象,每个所述冗余服务源对象中各对象特征向量属于同一冗余标签,并且,每个所述对象特征向量包含所属冗余标签下的编码向量表示;
所述区块链服务平台用于基于所属冗余标签下各编码向量表示和预设的人工智能模型,对所述互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到所述互动知识点的冗余内容特征向量和对应的冗余参数;
所述区块链服务平台用于根据所述互动知识点的冗余内容特征向量和对应的冗余参数对所述互动知识点的匹配内容数据进行更新,并将更新后的所述互动知识点的匹配内容数据上传到对应的区块链中。
第四方面,本发明实施例还提供一种区块链服务平台,所述区块链服务平台包括处理器、机器可读存储介质和网络接口,所述机器可读存储介质、所述网络接口以及所述处理器之间通过总线系统相连,所述网络接口用于与至少一个智能互动终端通信连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以执行第一方面或者第一方面中任意一个可能的实现方式中的基于人工智能和大数据的数据解析方法。
第五方面,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其被执行时,使得计算机执行上述第一方面或者第一方面中任意一个可能的实现方式中的基于人工智能和大数据的数据解析方法。
基于上述任一方面,本申请通过获取智能互动终端基于互动内容返回对应的冗余修正数据,以获得由多个冗余修正数据构成的冗余修正大数据,然后根据冗余修正大数据获取至少一个冗余服务源对象,接着基于冗余服务源对象中所属冗余标签下各编码向量表示和预设的人工智能模型,对互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到互动知识点的冗余内容特征向量和对应的冗余参数,从而能够对下发的互动内容的冗余数据以特征识别的形式进行更新,而非简单的内容屏蔽,进而提高用户对于所获取信息的体验,减少冗余数据的引入给互动内容的准确性和匹配度产生的影响。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的基于人工智能和大数据的数据解析系统的应用场景示意图;
图2示出了本申请实施例所提供的基于人工智能和大数据的数据解析方法的流程示意图;
图3示出了本申请实施例所提供的基于人工智能和大数据的数据解析系统的功能模块示意图;
图4示出了本申请实施例所提供的用于执行上述的基于人工智能和大数据的数据解析方法的区块链服务平台的组件结构示意图。
具体实施方式
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本说明书中所使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
图1是本发明一种实施例提供的基于人工智能和大数据的数据解析系统10的交互示意图。基于人工智能和大数据的数据解析系统10可以包括区块链服务平台100以及与所述区块链服务平台100通信连接的智能互动终端200。图1所示的基于人工智能和大数据的数据解析系统10仅为一种可行的示例,在其它可行的实施例中,该基于人工智能和大数据的数据解析系统10也可以仅包括图1所示组成部分的其中一部分或者还可以包括其它的组成部分。
本实施例中,基于人工智能和大数据的数据解析系统10中的区块链服务平台100和智能互动终端200可以通过配合执行以下方法实施例所描述的基于人工智能和大数据的数据解析方法,具体区块链服务平台100和智能互动终端200的执行步骤部分可以参照以下方法实施例的详细描述。
为了解决前述背景技术中的技术问题,图2为本发明实施例提供的基于人工智能和大数据的数据解析方法的流程示意图,本实施例提供的基于人工智能和大数据的数据解析方法可以由图1中所示的区块链服务平台100执行,下面对该基于人工智能和大数据的数据解析方法进行详细介绍。
步骤S110,获取智能互动终端200发送的待互动信息,并根据待互动信息向智能互动终端200发送互动内容,以使得智能互动终端200基于互动内容返回对应的冗余修正数据,以获得由多个冗余修正数据构成的冗余修正大数据。
步骤S120,根据冗余修正大数据获取至少一个冗余服务源对象。
步骤S130,基于所属冗余标签下各编码向量表示和预设的人工智能模型,对互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到互动知识点的冗余内容特征向量和对应的冗余参数。
步骤S140,根据互动知识点的冗余内容特征向量和对应的冗余参数对互动知识点的匹配内容数据进行更新,并将更新后的互动知识点的匹配内容数据上传到对应的区块链中。
本实施例中,冗余修正数据可用于指示互动内容中存在的与待互动信息对应的原始问题的冗余数据区域,具体可以由该智能互动终端200的用户针对互动内容进行标记后上传,在此不作具体限定。
本实施例中,每个冗余服务源对象中各对象特征向量属于同一冗余标签,并且,每个对象特征向量包含所属冗余标签下的编码向量表示。
基于上述设计,本实施例通过获取智能互动终端基于互动内容返回对应的冗余修正数据,以获得由多个冗余修正数据构成的冗余修正大数据,然后根据冗余修正大数据获取至少一个冗余服务源对象,接着基于冗余服务源对象中所属冗余标签下各编码向量表示和预设的人工智能模型,对互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到互动知识点的冗余内容特征向量和对应的冗余参数,从而能够对下发的互动内容的冗余数据以特征识别的形式进行更新,而非简单的内容屏蔽,进而提高用户对于所获取信息的体验,减少冗余数据的引入给互动内容的准确性和匹配度产生的影响。
在一种可能的实现方式中,对于步骤S120而言,在根据冗余修正大数据获取至少一个冗余服务源对象的过程中,具体可以通过以下示例性的子步骤来实现,详细描述如下。
子步骤S121,根据冗余修正大数据构建对应不同冗余标签的编码向量数据库,编码向量数据库包括预设数量的编码向量表示。
子步骤S122,获取包含编码向量数据库中任一编码向量表示的对象特征向量,并根据各对象特征向量的标签识别信息,将获取的对象特征向量进行划分,得到至少一个冗余服务源对象。
在一种可能的实现方式中,对于步骤S130而言,在基于所属冗余标签下各编码向量表示和预设的人工智能模型,对互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到互动知识点的冗余内容特征向量和对应的冗余参数的过程中,为了进行准确的特征识别,具体可以通过以下示例性的子步骤来实现,详细描述如下。
子步骤S131,对每个冗余服务源对象,遍历冗余服务源对象中的对象特征向量,从对象特征向量中提取包含该冗余服务源对象所属冗余标签下各编码向量表示的编码向量分段,根据提取的编码向量分段从互动内容所对应的互动知识点的匹配内容数据中确定与冗余服务源对象对应的冗余反馈信息。
子步骤S132,根据预设的人工智能模型,在冗余反馈信息中提取出满足预设冗余参数要求的各冗余反馈节点的冗余内容特征向量,获得互动知识点的冗余内容特征向量和对应的冗余参数。
示例性地,对于子步骤S132而言,可以进一步通过以下示例性的子步骤来实现,描述如下。
子步骤S1321,根据预设的人工智能模型,从冗余反馈信息中识别出冗余解析项目的元对象解析数据。
本实施例中,元对象解析数据包括至少两种源元素对应的解析数据。
子步骤S1322,基于每种解释型源元素所对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系,分别构建每种解释型源元素与正文源元素之间的编排关系模型。
本实施例中,每种解释型源元素对应的编排关系模型用于表征每种解释型源元素与正文源元素之间的关联关系,编排关系模型中的元素用于表征每种解释型源元素对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系,其中,正文源元素为指定的至少两种源元素中的一种源元素,解释型源元素为至少两种源元素中除正文源元素之外的源元素。
子步骤S1323,基于正文源元素的数据,通过第一决策树模型,得到第一冗余决策结果,第一冗余决策结果中包括正文源元素对应的冗余计算前的冗余表示。
子步骤S1324,基于每种解释型源元素的数据,以及每种解释型源元素与正文源元素的关联关系,通过第二决策树模型,得到第二冗余决策结果。
例如,可以基于每种解释型源元素的数据,以及每种解释型源元素与正文源元素的关联关系,通过第二决策树模型,得到每种解释型源元素对应的子冗余决策结果,然后基于每种解释型源元素对应的子冗余决策结果,以及每种解释型源元素对应的权重,得到第二冗余决策结果。
子步骤S1325,基于第一冗余决策结果和第二冗余决策结果,得到最终冗余决策结果。
子步骤S1326,从最终冗余决策结果的每个冗余决策分类标签下的数据中提取获得互动知识点的冗余内容特征向量和对应的冗余参数,冗余参数为冗余决策分类标签对应的冗余参数。
可选地,在子步骤S1323中,可以基于正文源元素的数据,计算正文源元素对应的冗余参与度,其中,正文源元素对应的冗余参与度与正文源元素的数据中被人工智能模型预先标记内容数量相关。然后,基于正文源元素对应的冗余参与度,通过第一决策树模型,得到第一冗余决策结果。
由此,在基于每种解释型源元素的数据,以及每种解释型源元素与正文源元素的关联关系,通过第二决策树模型,得到每种解释型源元素对应的子冗余决策结果的过程中,可以基于每种解释型源元素的数据,计算每种解释型源元素对应的冗余参与度,其中,解释型源元素对应的冗余参与度与解释型源元素的数据中被人工智能模型预先标记内容数量相关。然后,基于每种解释型源元素对应的冗余参与度和每种解释型源元素对应的编排关系模型,通过第二决策树模型,得到每种解释型源元素对应的子冗余决策结果。
其中,值得说明的是,每种解释型源元素对应的编排关系模型用于表征每种解释型源元素与正文源元素之间的关联关系,每种解释型源元素对应的编排关系模型是基于每种解释型源元素所对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系构建的模型,编排关系模型中的元素用于表征每种解释型源元素对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系。
在一种可能的实现方式中,对于步骤S140而言,具体可以通过以下示例性的子步骤来实现,详细描述如下。
子步骤S141,根据互动知识点的冗余内容特征向量从互动知识点的匹配内容数据中匹配出待更新的目标内容数据区域以及目标内容数据区域对应的服务标签。
子步骤S142,根据目标内容数据区域对应的服务标签从对应的冗余参数中解析出对应的目标冗余参数,并根据目标冗余参数所对应的冗余语义特征对待更新的目标内容数据区域中相关的数据信息进行更新,其中,更新的方式包括删除方式和替换方式。
如此,通过根据目标冗余参数所对应的冗余语义特征对待更新的目标内容数据区域中相关的数据信息进行更新,考虑到了目标内容数据区域对应的服务标签,进而使得在对待更新的目标内容数据区域中相关的数据信息进行更新时,可以避免剔除非必要的冗余数据,避免用户的主观映像导致过多的错误更新。
在一种可能的实现方式中,对于步骤S110而言,具体可以通过以下示例性的子步骤来实现,详细描述如下。
步骤S111,获取智能互动终端200发送的待互动信息,并根据待互动信息确定当前互动衔接位置内的未互动信息,确定未互动信息的互动语义向量与大数据互动信息的互动语义向量之间的第一关联关系。
步骤S112,基于深度学习模型从大数据互动信息中提取满足未互动信息条件决策的决策互动语义节点,得到第一决策互动语义节点序列,并基于第一关联关系从第一决策互动语义节点序列中确定第一目标语义节点,根据第一目标语义节点对未互动信息的语义节点信息进行补充更新,得到目标语义综合特征信息。
步骤S112,确定目标语义综合特征信息的互动语义向量与未互动信息的互动语义向量之间的第二关联关系。
步骤S113,根据第二关联关系和未互动信息中语义节点的语义分量,对未互动信息进行特征标记处理,得到特征标记互动信息,并根据特征标记互动信息向智能互动终端200发送互动内容后,将互动内容存储到对应的区块链中。
本实施例中,大数据互动信息可以基于历史时间段内的互动信息列表确定,具体会在后续的描述中进行详细阐述。
本实施例中,待互动信息可以是指智能互动终端200的用户在发起本次互动对话时所勾选或者所输入的互动内容,例如可以是基于某个感兴趣的服务项目输入的互动内容,具体不作详细限制。
本实施例中,互动语义向量可以是以字符编码特征存在的一些的编码向量,具体的字符编码方式可以采用现有技术中任意可信的编码方案获得,在此不作具体限定。
本实施例中,语义节点可以是指具体存在语义关联的单位,例如某个服务对话中的一个语句分段,或者一个时刻等。
基于上述设计,本实施例根据未互动信息的互动语义向量与大数据互动信息的互动语义向量之间的第一关联关系,将大数据互动信息和未互动信息进行综合考虑,然后根据获得目标语义综合特征信息的互动语义向量与未互动信息的互动语义向量之间的第二关联关系及未互动信息中语义节点的语义分量,对未互动信息进行特征标记处理,通过对用户互动信息的深度学习,实现对相类似的互动信息进行互动信息的特征标记,从而提高互动信息中语义节点信息的语义关联性;另外,结合互动信息中语义节点特征之间的关联性,提升了互动信息特征标记信息的准确性,进而提高后续互动内容的匹配度。
在一种可能的实现方式,针对步骤S112而言,在基于深度学习模型从大数据互动信息中提取满足未互动信息条件决策的决策互动语义节点,得到第一决策互动语义节点序列的过程中,可以进一步通过以下示例性的子步骤来实现,详细描述如下。
子步骤S1121,基于深度学习模型从未互动信息中识别出于当前业务场景匹配的多个条件决策互动段,将多个条件决策互动段中每一个条件决策互动段作为当前条件决策互动段,执行以下步骤,直到遍历多个条件决策互动段:
(1)基于深度学习模型在当前条件决策互动段检测到大数据互动信息所包含的互动业务的业务决策分段的情况下,获取业务决策分段的分段特征向量。
本实施例中,深度学习模型可以预先进行训练,例如可以收集大量的互动信息以及每个互动信息的业务决策分段标签进行网络训练得到,具体的训练方式为现有技术,在此不作具体介绍。
(2)按照预设转换表中的特征向量数值与业务参数的转换关系,将业务决策分段转换为第一业务参数,并将第一业务参数确定为大数据互动信息与当前条件决策互动段的目标业务参数。
其中,每个目标业务参数为大数据互动信息到条件决策互动段的业务参数。
(3)将未互动信息对应的互动数据单元划分为多个互动数据子单元,并将每一个互动数据子单元确定为当前互动数据子单元,执行以下步骤,直到遍历每一个互动数据子单元:
(4)将每一个条件决策互动段确定为当前条件决策互动段,执行以下步骤,直到遍历条件决策互动段:
(5)在当前互动数据子单元与当前条件决策互动段的业务参数为与当前条件决策互动段对应的目标业务参数的情况下,确定当前互动数据子单元与当前条件决策互动段的匹配度为第一数值。
(6)在当前互动数据子单元与当前条件决策互动段的业务参数大于或者小于当前条件决策互动段对应的目标业务参数的情况下,确定匹配度为零,其中,匹配度根据当前互动数据子单元的位置与条件决策互动段的位置和一组目标业务参数确定。
子步骤S1122,根据当前互动数据子单元的所有匹配度的乘积确定出大数据互动信息匹配当前互动数据子单元的目标匹配度,获取目标匹配度中的最大匹配度对应的互动数据子单元的业务定位,并将业务定位确定为大数据互动信息在第一决策互动节点的目标业务定位,在确定出多个决策互动节点大数据互动信息分别所在的目标业务定位的情况下,利用多个目标业务定位的位置信息生成大数据互动信息在互动数据单元内的互动偏移更新信息,其中,多个决策互动节点包括第一决策互动节点及第一决策互动节点之后的决策互动节点,在获取到目标时间段内在互动数据单元中生成的多个互动偏移更新信息的情况下,将每一个互动偏移更新信息确定为一个互动偏移更新信息团。
子步骤S1123,执行以下步骤,直到每两个互动偏移更新信息团的关联度大于或等于预定阈值:
(1)将两个互动偏移更新信息团中的一个互动偏移更新信息团确定为当前互动偏移更新信息团,另一个互动偏移更新信息团确定为目标互动偏移更新信息团,将当前互动偏移更新信息团中的每一个互动偏移更新信息确定为当前互动偏移更新信息,执行以下步骤,直到遍历当前互动偏移更新信息团:
(2)确定当前互动偏移更新信息与目标互动偏移更新信息团中每一个互动偏移更新信息的第一关联度。
(3)在完成上述遍历后,将多个第一关联度的平均值确定为关联度。
(4)将关联度最小的两个互动偏移更新信息团合并为一个新的互动信息团。
子步骤S1124,在执行完上述步骤后,得到多个第一互动偏移更新信息团,并将每一个第一互动偏移更新信息团确定为一类互动偏移更新信息,在获取到一类互动偏移更新信息后,将一类互动偏移更新信息中的一条互动偏移更新信息确定为当前互动偏移更新信息,另一条互动偏移更新信息确定为第一互动偏移更新信息,执行以下步骤,直到遍历一类互动偏移更新信息中的所有互动偏移更新信息:
子步骤S1125,获取当前互动偏移更新信息与第一互动偏移更新信息中每两个对应业务类型的共同标签,将共同标签的标签迁移关系确定为新的当前互动偏移更新信息,将一类互动偏移更新信息中剩余的互动偏移更新信息中的一条互动偏移更新信息确定为第一互动偏移更新信息。
子步骤S1126,在完成上述遍历后,将最后确定出的一条当前互动偏移更新信息确定为一类互动偏移更新信息的热点互动信息,从一类互动偏移更新信息中确定出两条第二互动偏移更新信息,在两条第二互动偏移更新信息上的对应业务类型的业务关联度小于第二阈值的情况下,获取两个对应业务类型的共同标签。在获取到多个共同标签之后,将共同标签的标签迁移关系确定为一类互动信息的最优公共子互动信息,以得到决策互动语义节点,从而汇总得到第一决策互动语义节点序列。
基于上述设计,在确定所述大数据互动信息的互动信息的过程中,可以通过多个条件决策互动段探测到所述大数据互动信息业务参数条件决策互动段的业务参数,从而可以确定出所述大数据互动信息所在的位置,确定的所述大数据互动信息的位置准确性高。进一步根据位置确定出所述大数据互动信息的互动信息,并根据所述大数据互动信息的互动信息确定热点互动信息,从而实现了提高热点互动信息确定准确度的效果。
在一种可能的实现方式中,在根据所述特征标记互动信息向所述智能互动终端200发送互动内容的过程中,具体可以从所述特征标记互动信息中获取每个特征标记互动节点对应的目标知识点,然后获取每个目标知识点所对应的互动知识内容,从而将每个目标知识点所对应的互动知识内容发送给所述智能互动终端200。
基于同一发明构思,请参阅图3,示出了本申请实施例提供的基于人工智能和大数据的数据解析装置300的功能模块示意图,本实施例可以根据上述方法实施例对基于人工智能和大数据的数据解析装置300进行功能模块的划分。例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。比如,在采用对应各个功能划分各个功能模块的情况下,图3示出的基于人工智能和大数据的数据解析装置300只是一种装置示意图。其中,基于人工智能和大数据的数据解析装置300可以包括第一获取模块310、第二获取模块320、数据分析模块330以及更新模块340,下面分别对该基于人工智能和大数据的数据解析装置300的各个功能模块的功能进行详细阐述。
第一获取模块310,用于获取智能互动终端200发送的待互动信息,并根据待互动信息向智能互动终端200发送互动内容,以使得智能互动终端200基于互动内容返回对应的冗余修正数据,以获得由多个冗余修正数据构成的冗余修正大数据,其中,冗余修正数据用于指示互动内容中存在的与待互动信息对应的原始问题的冗余数据区域。可以理解,该第一获取模块310可以用于执行上述步骤S110,关于该第一获取模块310的详细实现方式可以参照上述对步骤S110有关的内容。
第二获取模块320,用于根据冗余修正大数据获取至少一个冗余服务源对象,每个冗余服务源对象中各对象特征向量属于同一冗余标签,并且,每个对象特征向量包含所属冗余标签下的编码向量表示。可以理解,该第二获取模块320可以用于执行上述步骤S120,关于该第二获取模块320的详细实现方式可以参照上述对步骤S120有关的内容。
数据分析模块330,用于基于所属冗余标签下各编码向量表示和预设的人工智能模型,对互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到互动知识点的冗余内容特征向量和对应的冗余参数。可以理解,该数据分析模块330可以用于执行上述步骤S130,关于该数据分析模块330的详细实现方式可以参照上述对步骤S130有关的内容。
更新模块340,用于根据互动知识点的冗余内容特征向量和对应的冗余参数对互动知识点的匹配内容数据进行更新,并将更新后的互动知识点的匹配内容数据上传到对应的区块链中。可以理解,该更新模块340可以用于执行上述步骤S140,关于该更新模块340的详细实现方式可以参照上述对步骤S140有关的内容。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,第一获取模块310可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上第一获取模块310的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所描述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(application specific integrated circuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(centralprocessing unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
图4示出了本发明实施例提供的用于实现上述的基于人工智能和大数据的数据解析方法的区块链服务平台100的硬件结构示意图,如图4所示,区块链服务平台100可包括处理器110、机器可读存储介质120、总线130以及收发器140。
在具体实现过程中,至少一个处理器110执行所述机器可读存储介质120存储的计算机执行指令(例如图3中所示的基于人工智能和大数据的数据解析装置300包括的第一获取模块310、第二获取模块320、数据分析模块330以及更新模块340),使得处理器110可以执行如上方法实施例的基于人工智能和大数据的数据解析方法,其中,处理器110、机器可读存储介质120以及收发器140通过总线130连接,处理器110可以用于控制收发器140的收发动作,从而可以与前述的智能互动终端200进行数据收发。
处理器110的具体实现过程可参见上述区块链服务平台100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图4所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,DSP)、专用集成电路(英文:ApplicationSpecificIntegrated Circuit,ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
机器可读存储介质120可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线130可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线130可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
此外,本发明实施例还提供一种可读存储介质,所述可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上基于人工智能和大数据的数据解析方法。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一种可能的实现方式”、“一种可能的示例”、和/或“示例性地”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一种可能的实现方式”、“一种可能的示例”、和/或“示例性地”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或区块链服务平台上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过互动业务实现,但是也可以只通过软件的解决方案得以实现,如在现有的区块链服务平台或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims (10)

1.一种基于人工智能和大数据的数据解析方法,其特征在于,应用于与智能互动终端通信连接的区块链服务平台,所述方法包括:
获取所述智能互动终端发送的待互动信息,并根据所述待互动信息向所述智能互动终端发送互动内容,以使得所述智能互动终端基于所述互动内容返回对应的冗余修正数据,以获得由多个冗余修正数据构成的冗余修正大数据,其中,所述冗余修正数据用于指示所述互动内容中存在的与所述待互动信息对应的原始问题的冗余数据区域;
根据所述冗余修正大数据获取至少一个冗余服务源对象,每个所述冗余服务源对象中各对象特征向量属于同一冗余标签,并且,每个所述对象特征向量包含所属冗余标签下的编码向量表示;
基于所属冗余标签下各编码向量表示和预设的人工智能模型,对所述互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到所述互动知识点的冗余内容特征向量和对应的冗余参数;
根据所述互动知识点的冗余内容特征向量和对应的冗余参数对所述互动知识点的匹配内容数据进行更新,并将更新后的所述互动知识点的匹配内容数据上传到对应的区块链中;
所述获取所述智能互动终端发送的待互动信息,并根据所述待互动信息向所述智能互动终端发送互动内容的步骤,包括:
获取所述智能互动终端发送的待互动信息,并根据所述待互动信息确定当前互动衔接位置内的未互动信息,确定所述未互动信息的互动语义向量与大数据互动信息的互动语义向量之间的第一关联关系,其中,所述大数据互动信息基于历史时间段内的互动信息列表确定;
基于深度学习模型从所述大数据互动信息中提取满足所述未互动信息条件决策的决策互动语义节点,得到第一决策互动语义节点序列,并基于所述第一关联关系从所述第一决策互动语义节点序列中确定第一目标语义节点,根据所述第一目标语义节点对所述未互动信息的语义节点信息进行补充更新,得到目标语义综合特征信息;
确定所述目标语义综合特征信息的互动语义向量与所述未互动信息的互动语义向量之间的第二关联关系;
根据所述第二关联关系和所述未互动信息中语义节点的语义分量,对所述未互动信息进行特征标记处理,得到特征标记互动信息,并根据所述特征标记互动信息向所述智能互动终端发送互动内容后,将所述互动内容存储到对应的区块链中;
所述待互动信息是指智能互动终端的用户在发起本次互动对话时所勾选或者所输入的互动内容;
所述互动语义向量是以字符编码特征存在的编码向量;
所述语义节点是指具体存在语义关联的单位,所述存在语义关联的单位包括服务对话中的一个语句分段,或者一个时刻。
2.根据权利要求1所述的基于人工智能和大数据的数据解析方法,其特征在于,所述根据所述冗余修正大数据获取至少一个冗余服务源对象的步骤,包括:
根据所述冗余修正大数据构建对应不同冗余标签的编码向量数据库,所述编码向量数据库包括预设数量的编码向量表示;
获取包含所述编码向量数据库中任一编码向量表示的对象特征向量,并根据各所述对象特征向量的标签识别信息,将获取的所述对象特征向量进行划分,得到至少一个冗余服务源对象。
3.根据权利要求1所述的基于人工智能和大数据的数据解析方法,其特征在于,所述基于所属冗余标签下各编码向量表示和预设的人工智能模型,对所述互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到所述互动知识点的冗余内容特征向量和对应的冗余参数的步骤,包括:
对每个冗余服务源对象,遍历所述冗余服务源对象中的对象特征向量,从所述对象特征向量中提取包含该冗余服务源对象所属冗余标签下各编码向量表示的编码向量分段,根据提取的编码向量分段从所述互动内容所对应的互动知识点的匹配内容数据中确定与所述冗余服务源对象对应的冗余反馈信息;
根据预设的人工智能模型,在所述冗余反馈信息中提取出满足预设冗余参数要求的各冗余反馈节点的冗余内容特征向量,获得所述互动知识点的冗余内容特征向量和对应的冗余参数。
4.根据权利要求3所述的基于人工智能和大数据的数据解析方法,其特征在于,所述根据预设的人工智能模型,在所述冗余反馈信息中提取出满足预设冗余参数要求的各冗余反馈节点的冗余内容特征向量,获得所述互动知识点的冗余内容特征向量和对应的冗余参数的步骤,包括:
根据预设的人工智能模型,从所述冗余反馈信息中识别出冗余解析项目的元对象解析数据,所述元对象解析数据包括至少两种源元素对应的解析数据;
基于每种解释型源元素所对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系,分别构建每种解释型源元素与正文源元素之间的编排关系模型,其中,每种解释型源元素对应的编排关系模型用于表征每种解释型源元素与所述正文源元素之间的关联关系,编排关系模型中的元素用于表征每种解释型源元素对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系,其中,所述正文源元素为指定的所述至少两种源元素中的一种源元素,所述解释型源元素为所述至少两种源元素中除所述正文源元素之外的源元素;
基于所述正文源元素的数据,通过第一决策树模型,得到第一冗余决策结果,所述第一冗余决策结果中包括所述正文源元素对应的冗余计算前的冗余表示;
基于每种解释型源元素的数据,以及每种解释型源元素与所述正文源元素的关联关系,通过第二决策树模型,得到第二冗余决策结果;
基于所述第一冗余决策结果和所述第二冗余决策结果,得到最终冗余决策结果;
从所述最终冗余决策结果的每个冗余决策分类标签下的数据中提取获得所述互动知识点的冗余内容特征向量和对应的冗余参数,所述冗余参数为所述冗余决策分类标签对应的冗余参数。
5.根据权利要求4所述的基于人工智能和大数据的数据解析方法,其特征在于,所述基于每种解释型源元素的数据,以及每种解释型源元素与所述正文源元素的关联关系,通过第二决策树模型,得到第二冗余决策结果的步骤,包括:
基于每种解释型源元素的数据,以及每种解释型源元素与所述正文源元素的关联关系,通过所述第二决策树模型,得到每种解释型源元素对应的子冗余决策结果;
基于每种解释型源元素对应的所述子冗余决策结果,以及每种解释型源元素对应的权重,得到所述第二冗余决策结果。
6.根据权利要求5所述的基于人工智能和大数据的数据解析方法,其特征在于,所述基于所述正文源元素的数据,通过第一决策树模型,得到第一冗余决策结果的步骤,包括:
基于所述正文源元素的数据,计算所述正文源元素对应的冗余参与度,其中,所述正文源元素对应的冗余参与度与所述正文源元素的数据中被所述人工智能模型预先标记内容数量相关;
基于所述正文源元素对应的冗余参与度,通过所述第一决策树模型,得到所述第一冗余决策结果;
所述基于每种解释型源元素的数据,以及每种解释型源元素与所述正文源元素的关联关系,通过所述第二决策树模型,得到每种解释型源元素对应的子冗余决策结果,包括:
基于每种解释型源元素的数据,计算每种解释型源元素对应的冗余参与度,其中,所述解释型源元素对应的冗余参与度与所述解释型源元素的数据中被所述人工智能模型预先标记内容数量相关;
基于每种解释型源元素对应的冗余参与度和每种解释型源元素对应的编排关系模型,通过所述第二决策树模型,得到每种解释型源元素对应的子冗余决策结果;
其中,每种解释型源元素对应的编排关系模型用于表征每种解释型源元素与所述正文源元素之间的关联关系,每种解释型源元素对应的编排关系模型是基于每种解释型源元素所对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系构建的模型,编排关系模型中的元素用于表征每种解释型源元素对应的冗余解析项目和正文源元素对应的冗余解析项目之间的元素关联关系。
7.根据权利要求1-6中任意一项所述的基于人工智能和大数据的数据解析方法,其特征在于,所述根据所述互动知识点的冗余内容特征向量和对应的冗余参数对所述互动知识点的匹配内容数据进行更新的步骤,包括:
根据所述互动知识点的冗余内容特征向量从所述互动知识点的匹配内容数据中匹配出待更新的目标内容数据区域以及所述目标内容数据区域对应的服务标签;
根据所述目标内容数据区域对应的服务标签从所述对应的冗余参数中解析出对应的目标冗余参数,并根据所述目标冗余参数所对应的冗余语义特征对所述待更新的目标内容数据区域中相关的数据信息进行更新,其中,更新的方式包括删除方式和替换方式。
8.根据权利要求1所述的基于人工智能和大数据的数据解析方法,其特征在于,所述基于深度学习模型从所述大数据互动信息中提取满足所述未互动信息条件决策的决策互动语义节点,得到第一决策互动语义节点序列的步骤,包括:
基于所述深度学习模型从所述未互动信息中识别出于当前业务场景匹配的多个条件决策互动段;
将所述多个条件决策互动段中每一个条件决策互动段作为当前条件决策互动段,执行以下步骤,直到遍历所述多个条件决策互动段:
在所述当前条件决策互动段检测到所述大数据互动信息所包含的互动业务的业务决策分段的情况下,获取所述业务决策分段的分段特征向量;
按照预设转换表中的特征向量数值与业务参数的转换关系,将所述业务决策分段转换为第一业务参数,并将所述第一业务参数确定为所述大数据互动信息与所述当前条件决策互动段的目标业务参数,其中,每个所述目标业务参数为所述大数据互动信息到所述条件决策互动段的业务参数;
将所述未互动信息对应的互动数据单元划分为多个互动数据子单元,并将每一个所述互动数据子单元确定为当前互动数据子单元,执行以下步骤,直到遍历每一个所述互动数据子单元:
将每一个所述条件决策互动段确定为当前条件决策互动段,执行以下步骤,直到遍历所述条件决策互动段:
在所述当前互动数据子单元与所述当前条件决策互动段的业务参数为与所述当前条件决策互动段对应的目标业务参数的情况下,确定所述当前互动数据子单元与所述当前条件决策互动段的匹配度为第一数值;
在所述当前互动数据子单元与所述当前条件决策互动段的业务参数大于或者小于所述当前条件决策互动段对应的目标业务参数的情况下,确定所述匹配度为零,其中,所述匹配度根据所述当前互动数据子单元的位置与所述条件决策互动段的位置和一组目标业务参数确定;
根据所述当前互动数据子单元的所有所述匹配度的乘积确定出所述大数据互动信息匹配所述当前互动数据子单元的目标匹配度;
获取所述目标匹配度中的最大匹配度对应的所述互动数据子单元的业务定位,并将所述业务定位确定为所述大数据互动信息在第一决策互动节点的目标业务定位;
在确定出多个决策互动节点所述大数据互动信息分别所在的目标业务定位的情况下,利用多个所述目标业务定位的位置信息生成所述大数据互动信息在所述互动数据单元内的互动偏移更新信息,其中,所述多个决策互动节点包括所述第一决策互动节点及所述第一决策互动节点之后的决策互动节点,在获取到目标时间段内在所述互动数据单元中生成的多个互动偏移更新信息的情况下,将每一个所述互动偏移更新信息确定为一个互动偏移更新信息团;
执行以下步骤,直到每两个所述互动偏移更新信息团的关联度大于或等于预定阈值:
将两个所述互动偏移更新信息团中的一个互动偏移更新信息团确定为当前互动偏移更新信息团,另一个互动偏移更新信息团确定为目标互动偏移更新信息团,将所述当前互动偏移更新信息团中的每一个所述互动偏移更新信息确定为当前互动偏移更新信息,执行以下步骤,直到遍历所述当前互动偏移更新信息团:
确定所述当前互动偏移更新信息与所述目标互动偏移更新信息团中每一个所述互动偏移更新信息的第一关联度;
在完成上述遍历后,将多个所述第一关联度的平均值确定为所述关联度;
将所述关联度最小的两个所述互动偏移更新信息团合并为一个新的互动信息团;
在执行完上述步骤后,得到多个第一互动偏移更新信息团,并将每一个所述第一互动偏移更新信息团确定为一类所述互动偏移更新信息;
在获取到一类所述互动偏移更新信息后,将一类所述互动偏移更新信息中的一条所述互动偏移更新信息确定为当前互动偏移更新信息,另一条所述互动偏移更新信息确定为第一互动偏移更新信息,执行以下步骤,直到遍历一类所述互动偏移更新信息中的所有互动偏移更新信息:
获取所述当前互动偏移更新信息与所述第一互动偏移更新信息中每两个对应业务类型的共同标签,将所述共同标签的标签迁移关系确定为新的所述当前互动偏移更新信息,将一类所述互动偏移更新信息中剩余的所述互动偏移更新信息中的一条所述互动偏移更新信息确定为所述第一互动偏移更新信息;
在完成上述遍历后,将最后确定出的一条所述当前互动偏移更新信息确定为一类所述互动偏移更新信息的热点互动信息,从一类所述互动偏移更新信息中确定出两条第二互动偏移更新信息,在两条所述第二互动偏移更新信息上的对应业务类型的业务关联度小于第二阈值的情况下,获取两个所述对应业务类型的共同标签;
在获取到多个所述共同标签之后,将所述共同标签的标签迁移关系确定为一类所述互动信息的最优公共子互动信息,以得到决策互动语义节点,从而汇总得到第一决策互动语义节点序列。
9.一种基于人工智能和大数据的数据解析系统,所述基于人工智能和大数据的数据解析系统包括区块链服务平台以及与所述区块链服务平台通信连接的智能互动终端;
所述区块链服务平台用于获取所述智能互动终端发送的待互动信息,并根据所述待互动信息向所述智能互动终端发送互动内容,;
所述智能互动终端用于基于所述互动内容向所述区块链服务平台返回对应的冗余修正数据,以获得由多个冗余修正数据构成的冗余修正大数据,其中,所述冗余修正数据用于指示所述互动内容中存在的与所述待互动信息对应的原始问题的冗余数据区域;
所述区块链服务平台用于根据所述冗余修正大数据获取至少一个冗余服务源对象,每个所述冗余服务源对象中各对象特征向量属于同一冗余标签,并且,每个所述对象特征向量包含所属冗余标签下的编码向量表示;
所述区块链服务平台用于基于所属冗余标签下各编码向量表示和预设的人工智能模型,对所述互动内容所对应的互动知识点的匹配内容数据进行数据分析,得到所述互动知识点的冗余内容特征向量和对应的冗余参数;
所述区块链服务平台用于根据所述互动知识点的冗余内容特征向量和对应的冗余参数对所述互动知识点的匹配内容数据进行更新,并将更新后的所述互动知识点的匹配内容数据上传到对应的区块链中;
所述待互动信息是指智能互动终端的用户在发起本次互动对话时所勾选或者所输入的互动内容;
所述互动语义向量是以字符编码特征存在的编码向量;
所述语义节点是指具体存在语义关联的单位,所述存在语义关联的单位包括服务对话中的一个语句分段,或者一个时刻。
10.一种区块链服务平台,其特征在于,所述区块链服务平台包括处理器、机器可读存储介质和网络接口,所述机器可读存储介质、所述网络接口以及所述处理器之间通过总线系统相连,所述网络接口用于与至少一个区块链节点通信连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以执行权利要求1-9中任意一项的基于人工智能和大数据的数据解析方法方法。
CN202110058270.8A 2020-07-28 2020-07-28 基于人工智能和大数据的数据解析方法、系统及服务平台 Withdrawn CN112783881A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110058270.8A CN112783881A (zh) 2020-07-28 2020-07-28 基于人工智能和大数据的数据解析方法、系统及服务平台

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110058270.8A CN112783881A (zh) 2020-07-28 2020-07-28 基于人工智能和大数据的数据解析方法、系统及服务平台
CN202010734968.2A CN111930730B (zh) 2020-07-28 2020-07-28 基于人工智能和大数据的数据解析方法及区块链服务平台

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202010734968.2A Division CN111930730B (zh) 2020-07-28 2020-07-28 基于人工智能和大数据的数据解析方法及区块链服务平台

Publications (1)

Publication Number Publication Date
CN112783881A true CN112783881A (zh) 2021-05-11

Family

ID=73314617

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202010734968.2A Expired - Fee Related CN111930730B (zh) 2020-07-28 2020-07-28 基于人工智能和大数据的数据解析方法及区块链服务平台
CN202110058270.8A Withdrawn CN112783881A (zh) 2020-07-28 2020-07-28 基于人工智能和大数据的数据解析方法、系统及服务平台
CN202110058263.8A Withdrawn CN112783880A (zh) 2020-07-28 2020-07-28 基于人工智能和大数据的数据解析方法及区块链服务平台

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202010734968.2A Expired - Fee Related CN111930730B (zh) 2020-07-28 2020-07-28 基于人工智能和大数据的数据解析方法及区块链服务平台

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202110058263.8A Withdrawn CN112783880A (zh) 2020-07-28 2020-07-28 基于人工智能和大数据的数据解析方法及区块链服务平台

Country Status (1)

Country Link
CN (3) CN111930730B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114611478A (zh) * 2022-03-22 2022-06-10 孙向军 一种基于人工智能的信息处理方法、系统及云平台
CN118154243A (zh) * 2024-05-09 2024-06-07 江苏云机汇软件科技有限公司 一种信息化的品牌营销数据预警系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8201001B2 (en) * 2009-08-04 2012-06-12 Lsi Corporation Method for optimizing performance and power usage in an archival storage system by utilizing massive array of independent disks (MAID) techniques and controlled replication under scalable hashing (CRUSH)
CN102223659A (zh) * 2011-06-16 2011-10-19 中兴通讯股份有限公司 一种屏蔽冗余历史告警方法和装置
CN107147708A (zh) * 2017-04-27 2017-09-08 北京众享比特科技有限公司 一种对等网络冗余数据平衡方法和系统
CN107734039A (zh) * 2017-10-20 2018-02-23 谢碧青 一种避免冗余发送的系统
CN109194646B (zh) * 2018-08-30 2021-05-25 东北大学 一种基于区块链的安全认证数据存取方法
CN110147722A (zh) * 2019-04-11 2019-08-20 平安科技(深圳)有限公司 一种视频处理方法、视频处理装置及终端设备
CN110704630A (zh) * 2019-04-15 2020-01-17 中国石油大学(华东) 一种标识化关联图谱自优化机制
CN111258968B (zh) * 2019-12-30 2020-09-11 广州博士信息技术研究院有限公司 企业冗余数据清理方法、装置及大数据平台

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114611478A (zh) * 2022-03-22 2022-06-10 孙向军 一种基于人工智能的信息处理方法、系统及云平台
CN118154243A (zh) * 2024-05-09 2024-06-07 江苏云机汇软件科技有限公司 一种信息化的品牌营销数据预警系统

Also Published As

Publication number Publication date
CN111930730B (zh) 2021-03-26
CN111930730A (zh) 2020-11-13
CN112783880A (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
US11501210B1 (en) Adjusting confidence thresholds based on review and ML outputs
CN111198948B (zh) 文本分类校正方法、装置、设备及计算机可读存储介质
CN110580308B (zh) 信息审核方法及装置、电子设备、存储介质
CN111930730B (zh) 基于人工智能和大数据的数据解析方法及区块链服务平台
CN111221936B (zh) 一种信息匹配方法、装置、电子设备及存储介质
CN114818708B (zh) 关键信息抽取方法、模型训练方法、相关装置及电子设备
CN113420122B (zh) 分析文本的方法、装置、设备及存储介质
CN115357699A (zh) 文本抽取方法、装置、设备及存储介质
CN111931514B (zh) 基于深度学习和大数据的信息处理方法及区块链服务平台
CN107783958B (zh) 一种目标语句识别方法及装置
CN110851597A (zh) 一种基于同类实体替换的语句标注的方法及装置
CN110705211A (zh) 文本重点内容标记方法、装置、计算机设备及存储介质
CN112579777B (zh) 一种未标注文本的半监督分类方法
CN110232328A (zh) 一种征信报告解析方法、装置及计算机可读存储介质
CN114266252A (zh) 命名实体识别方法、装置、设备及存储介质
CN111753546B (zh) 文书信息抽取方法、装置、计算机设备及存储介质
US11861512B1 (en) Determining content to present for human review
CN112307749A (zh) 文本检错方法、装置、计算机设备和存储介质
CN114548325B (zh) 基于对偶对比学习的零样本关系抽取方法和系统
CN116702765A (zh) 一种事件抽取方法、装置及电子设备
CN114091463B (zh) 地区工单乱点分析方法、装置、电子设备及可读存储介质
CN115952854A (zh) 文本脱敏模型的训练方法、文本脱敏方法及应用
CN115455143A (zh) 一种文献处理方法及装置
CN114036297A (zh) 一种语句分类方法、装置、终端设备和存储介质
CN112836498A (zh) 数据处理方法、识别方法、装置及计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210511

WW01 Invention patent application withdrawn after publication