CN114969074A - 一种基于互联网ai外呼的数据库更新方法、系统及装置 - Google Patents

一种基于互联网ai外呼的数据库更新方法、系统及装置 Download PDF

Info

Publication number
CN114969074A
CN114969074A CN202210635854.1A CN202210635854A CN114969074A CN 114969074 A CN114969074 A CN 114969074A CN 202210635854 A CN202210635854 A CN 202210635854A CN 114969074 A CN114969074 A CN 114969074A
Authority
CN
China
Prior art keywords
data
database
updating
internet
update
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210635854.1A
Other languages
English (en)
Inventor
李春树
苌龙
张鑫
王福星
王志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Huawei Jin'an Enterprise Management Co ltd
Original Assignee
Hunan Huawei Jin'an Enterprise Management Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Huawei Jin'an Enterprise Management Co ltd filed Critical Hunan Huawei Jin'an Enterprise Management Co ltd
Priority to CN202210635854.1A priority Critical patent/CN114969074A/zh
Publication of CN114969074A publication Critical patent/CN114969074A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于互联网AI外呼的数据库更新方法、系统及装置,该方法包括:获取互联网AI外呼平台的数据库中所需的第一更新数据,并对第一更新数据进行符合数据库数据格式要求的处理后,获得第二更新数据;将第二更新数据加入互联网AI外呼平台的数据库,并在互联网AI外呼平台运行过程中,验证第二更新数据是否满足更新验证的要求,若满足更新验证的要求,则确定将第二更新数据加入互联网AI外呼平台的数据库;本发明与现有技术相比,在不影响互联网AI外呼平台的正常使用的情况下,优化了数据库的数据结构,提高了数据库更新的准确性和实用性,同时,降低了数据库的运行负荷,提高了数据库检索的响应速度。

Description

一种基于互联网AI外呼的数据库更新方法、系统及装置
技术领域
本发明属于人工智能及数据库更新领域,特别涉及一种基于互联网AI外呼的数据库更新方法、系统及装置。
背景技术
随着现代科技,尤其是互联网技术和人工智能的快速发展,各行各业均发生了很大的技术更迭,以往需要大量人力的工作,逐渐被智能化的机器所取代,在智能算法、语音识别、图像识别、模拟等技术都有了新突破的背景下,在客服外呼工作的技术领域,也出现了基于人工智能,帮助企业筛选意向客户、代替人工客服等工作的AI外呼平台,且利用互联网大数据的优势,基于互联网的AI外呼平台也在服务行业、电商行业、金融行业、房地产行业、汽车行业、教育培训等领域逐渐得到广泛的应用。
虽然基于互联网的AI外呼平台应用广泛,但是仍然存在着在数据库更新时,加入数据库的更新数据,有较多的无效、重复、错误等异常数据,使得数据库结构冗余,工作负荷大,响应速度慢,且并未经过实际使用的验证就直接加入数据库中使用,无法保证更新数据的准确性和实用性,更进一步增加了数据库的运行负担,降低了数据库的工作效率。
发明内容
鉴于以上问题,本申请提供一种基于互联网AI外呼的数据库更新方法、系统及装置,以解决上述技术问题。
本发明提供了以下技术方案:
第一方面,本发明提供了一种基于互联网AI外呼的数据库更新方法,所述方法包括:
获取互联网AI外呼平台的数据库中所需的第一更新数据,并对第一更新数据进行符合数据库数据格式要求的处理后,获得第二更新数据;
将第二更新数据加入互联网AI外呼平台的数据库,并在互联网AI外呼平台运行过程中,验证第二更新数据是否满足更新验证的要求,若满足更新验证的要求,则确定将第二更新数据加入互联网AI外呼平台的数据库;
所述第一更新数据,为互联网AI外呼平台的现数据库中没有的数据,或者为现有数据库中虽然已有的数据,但是需要进行更新的数据;
具体来说,第一更新数据仅作为加入数据库之前的待验证数据,在处理成符合要求的第二更新数据后,仍需经过后续互联网AI外呼平台使用过程中的更新验证,并满足更新验证的要求后,作为确定的更新数据加入数据库中;
所述验证第二更新数据是否满足更新验证的要求,为确定将第二更新数据加入互联网AI外呼平台的数据库之前,通过在互联网AI外呼平台的运行过程中,经过多次的检索,验证其是否达到进入数据库的最低要求;
所述更新验证的要求,为第二更新数据通过更新验证,确定其进入数据库的最低要求;
本发明的基于互联网AI外呼的数据库更新方法,在获取更新数据之后,可立即加入数据库进行使用,但并未直接确定加入现有的数据库,而是在经过后续互联网AI外呼平台使用过程中的验证后才确认加入数据库,在数据库确定更新数据之前,增加进一步的验证环节,且验证的手段是以后续实际的使用效果为标准进行确定,这样就使得更新的数据不仅可以立即在互联网AI外呼平台直接使用,而且在能够使用过程中进一步验证其准确性,这样不仅兼顾了数据库更新的效率,而且进一步提高了数据库更新数据的准确性。
进一步的,所述获取互联网AI外呼平台的数据库中所需的第一更新数据,并对第一更新数据进行符合数据库数据格式要求的处理后,获得第二更新数据,包括:
获取互联网AI外呼平台的数据库中所需的第一更新数据;
所述数据库存储数据的结构为图数据结构,即所述数据库为图数据库,或者与图数据结构类似的其他数据库。
将第一更新数据进行数据清洗后,获得第三更新数据;
所述数据清洗,为发现并纠正数据文件中可识别的错误的过程,包括检查数据一致性,处理无效值和缺失值,对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性;
将第三更新数据进行关键信息提取后,获得第四更新数据;
所述关键信息提取,为将第三更新数据中包含的关键信息提取出来,并转换为符合图数据结构的数据,作为第四更新数据;
将第四更新数据进行特征标注后,获得第二更新数据;
所述特征标注,为检查第四更新数据的更新类型,并根据具体的更新类型,进行不同的处理如下:
(a)若第四更新数据的更新类型为新增节点型,则根据已有的数据层级分级信息,对第四更新数据添加对应的层级值,并对第四更新数据所更新的数据内容作待验证标注,获得第二更新数据;
(b)若第四更新数据的更新类型为修改数据型,则对第四更新数据所更新的数据内容作待验证标注,获得第二更新数据;
所述第四更新数据的更新类型为新增节点型,是指:执行更新数据的操作时,需要在现有数据库中新增一个节点,且需要新增至少一个连接此新增节点和其他节点的边;
所述已有的数据层级分级信息,为具体领域的现有的分级信息;
所述层级值,表示第四更新数据在本领域的数据结构内处于第几层级,层级值的数字越大,表示在数据结构中的层级越低,即类别越小,分类越细;所述第四更新数据的层级值,即为获得的第二更新数据的层级值;
所述第四更新数据的更新类型为修改数据型,是指:执行更新数据的操作时,无需在现有数据库中新增节点,只需在现有数据库中增加或者修改数据;
本发明将获取互联网AI外呼平台的数据库中所需的第一更新数据,经过数据清洗,去除其中的错误或异常数据,获得第三更新数据,再进行关键信息提取,筛查出核心信息,获得第四更新数据,然后,判断第四更新数据的具体更新类型,根据其更新类型的不同,采用不同的处理方式,若为修改数据型,则作待验证标注即可,若为新增节点型,则除了需要作待验证标注外,还需添加对应的层级值;这种方式,不仅可以将获取的更新数据层层筛选直到符合数据库的要求,而且在未经过后续验证之前,提前标注待验证的标识信息,为后续验证过程做好准备,是后续验证过程更加高效便捷。
进一步的,所述将第二更新数据加入互联网AI外呼平台的数据库,并在互联网AI外呼平台运行过程中,验证第二更新数据是否满足更新验证的要求,若满足更新验证的要求,则确定将第二更新数据加入互联网AI外呼平台的数据库,包括:
将已作待验证标注的第二更新数据加入互联网AI外呼平台的数据库,供互联网AI外呼平台的后续使用;
在互联网AI外呼平台运行过程中,获取数据库中与第二更新数据相关的检索数据;
通过获取的所述数据库中与第二更新数据相关的检索数据,验证第二更新数据是否达到确定进入数据库的更新验证的要求;
若达到所述确定进入数据库的更新验证的要求,则将第二更新数据的待验证标注修改为已验证标注;
若未达到所述确定进入数据库的更新验证的要求,则维持第二更新数据的待验证标注;
所述将第二更新数据的待验证标注修改为已验证标注,表示该更新数据确定加入互联网AI外呼平台的数据库;
本发明虽然在获取第二更新数据后,就将其加入数据库直接使用,但是对并未确定第二更新数据最终加入数据库,而是在确定第二更新数据加入数据库之前,对第二更新数据进行了待验证标注的操作,使第二更新数据在达到确定进入数据库的更新验证的要求之前的状态可以被明显识别,同时在互联网AI外呼平台的后续运行过程中,被标注的第二更新数据经过不断的验证,在达到所述确定进入数据库的更新验证的要求之后,再将第二更新数据的待验证标注修改为已验证标注;这样使得数据库在更新过程中,不仅能够有效降低更新数据操作对互联网AI外呼平台使用中的实际影响,而且能够使更新数据经过实际使用的合理验证,提高更新数据的准确性、实用性,同时对更新数据状态的及时标注和修改,也使得数据库更新过程可追溯,为后续数据库的其他操作提供了便利。
进一步的,所述在互联网AI外呼平台运行过程中,获取数据库中与第二更新数据相关的检索数据,包括:
在互联网AI外呼平台运行过程中,获取互联网AI外呼平台在加入第二更新数据后的数据库中,对第二更新数据所属领域数据进行检索操作的总次数,同时获取该检索操作时,检索到该第二更新数据的次数,以及检索到该第二更新数据,并且通过验证的次数;
进一步的,所述通过获取的所述数据库中与第二更新数据相关的检索数据,验证第二更新数据是否达到确定进入数据库的更新验证的要求,包括:
所述确定进入数据库的更新验证的要求的方法,为第二更新数据的更新验证率满足预设的阈值,所述第二更新数据的更新验证率的具体模型如下:
Figure BDA0003681997470000031
其中,μ为第二更新数据的更新验证率;
s0为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,对第二更新数据所属领域数据进行检索操作的总次数;
s1为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,进行检索操作时,检索到该第二更新数据的次数;
s2为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,进行检索操作时,检索到该第二更新数据,并且通过验证的次数;
β1为第一验证权重系数;
β2为第二验证权重系数,且满足β12=1的关系;
k0为该第二更新数据的层级值;
m为第二更新数据的所属领域中的总层级数,即根据该所属领域已有的层级分级信息,获得总共有多少个层级;
本发明将获取的第二更新数据,加入互联网AI外呼平台的数据库后,在平台的后续实际使用中对其准确性、实用性进行验证,通过对第二更新数据所属领域数据进行检索操作的相关信息进行收集,再利用第二更新数据的更新验证率的模型对第二更新数据的验证指标进行量化,合理判断第二更新数据是否确定进入互联网AI外呼平台的数据库;这样不仅在更新数据的使用上无任何影响,而且通过实际使用更新数据来验证其准确性、实用性,更加科学合理,进一步减少了数据库更新后的无效数据、重复数据、错误数据等各种异常数据,降低了数据库的运行负荷,优化了数据库的数据结构,提高了数据库检索的响应速度,以及检索的准确性和数据的实用性。
进一步的,所述确定将第二更新数据加入互联网AI外呼平台的数据库之后,还包括:
对确定加入互联网AI外呼平台的数据库的第二更新数据,进行数据异常监测,若监测出现异常情况,则发布预警;
进一步的,所述对确定加入互联网AI外呼平台的数据库的第二更新数据,进行数据异常监测,若监测出现异常情况,则发布预警,包括:
获取数据库中与第二更新数据相关的信息,包括第二更新数据的层级值、与第一节点直接相连的节点总数、与第一节点直接相连的各节点的层级值;
根据所述获取的数据库中与第二更新数据相关的信息,确定数据库中第二数据的数据异常度;
若所述数据异常度大于等于预设的异常度预警值,则发布预警;
所述第一节点,为第二更新数据中作为k0取值的节点;
进一步的,所述根据所述获取的数据库中与第二更新数据相关的信息,确定数据库中第二数据的数据异常度,包括:
所述确定数据库中第二数据的数据异常度的方法,为利用数据库中第二数据的数据异常度的模型进行计算,具体模型如下:
Figure BDA0003681997470000041
其中,θ为数据库中第二更新数据的数据异常度;
k0为该第二更新数据的层级值;
i为与第一节点直接相连的第i个节点;
所述第一节点,为该第二更新数据中作为k0取值的节点;
n为与第一节点直接相连的节点总数;
ki为与第一节点直接相连的第i个节点的层级值;
δ为层级偏离基准值;
kmax为与第一节点直接相连的所有节点的层级值中的最高值;
kmin为与第一节点直接相连的所有节点的层级值中的最低值;
本发明在对第二更新数据进行验证之后,还从第二更新数据在数据库中与其直接相连的其他数据之间的关系方面,进行了数据异常度的监测,并及时发布预警,这样不仅使更新数据的准确性和实用性得到了保证,同时对更新数据在数据库中的结构性是否合理也做出了技术分析和判断,在更新数据的基础上,进一步保证了数据库结构的稳定性。
第二方面,本发明提供了一种基于互联网AI外呼的数据库更新系统,包括:
数据采集模块,用于获取互联网AI外呼平台的数据库中所需的第一更新数据,并对第一更新数据进行符合数据库数据格式要求的处理后,获得第二更新数据;
数据验证模块,用于将第二更新数据加入互联网AI外呼平台的数据库,并在互联网AI外呼平台运行过程中,验证第二更新数据是否满足更新验证的要求,若满足更新验证的要求,则确定将第二更新数据加入互联网AI外呼平台的数据库;
数据监测模块,用于对确定加入互联网AI外呼平台的数据库的第二更新数据,进行数据异常监测,若监测出现异常情况,则发布预警;
所述第一更新数据,为互联网AI外呼平台的现数据库中没有的数据,或者为现有数据库中虽然已有的数据,但是需要进行更新的数据;
具体来说,第一更新数据仅作为加入数据库之前的待验证数据,在处理成符合要求的第二更新数据后,仍需经过后续互联网AI外呼平台使用过程中的更新验证,并满足更新验证的要求后,作为确定的更新数据加入数据库中;
所述验证第二更新数据是否满足更新验证的要求,为确定将第二更新数据加入互联网AI外呼平台的数据库之前,通过在互联网AI外呼平台的运行过程中,经过多次的检索,验证其是否达到进入数据库的最低要求;
所述更新验证的要求,为第二更新数据通过更新验证,确定其进入数据库的最低要求。
第三方面,本发明提供了一种计算机装置,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序时,实现如第一方面所述的方法。
第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面所述的方法。
本发明与现有技术相比,在不影响互联网AI外呼平台的正常使用的情况下,优化了数据库的数据结构,提高了数据库更新的准确性和实用性,同时,降低了数据库的运行负荷,提高了数据库检索的响应速度。
附图说明
为了易于说明,本发明由下述的具体实施及附图作以详细描述。
图1为本发明的方法流程示意图之一;
图2为本发明的方法流程示意图之二;
图3为本发明的方法流程示意图之三;
图4为本发明的方法流程示意图之四;
图5为本发明的系统结构示意图。
具体实施方式
下面将结合本发明实施例中的图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中技术方案的总体思路如下:
在互联网AI外呼平台的运行过程中,当其需要进行数据更新操作时,获取互联网AI外呼平台的数据库中所需更新数据,并对更新数据进行处理后,加入互联网AI外呼平台的数据库直接使用,同时在互联网AI外呼平台的后续使用中,验证更新数据是否满足要求,若满足要求,则确定将第二更新数据加入互联网AI外呼平台的数据库;因此,在不影响互联网AI外呼平台的正常使用的情况下,优化了数据库更新数据的过程,提高了数据库更新的准确性和实用性,同时,降低了数据库的运行负荷,提高了数据库检索的响应速度,解决了数据库结构冗余,工作负荷大,响应速度慢,无法保证更新数据的准确性和实用性等问题。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体实施方式对上述技术方案进行详细的说明。
实施例1
如图1所示,本发明提供了一种基于互联网AI外呼的数据库更新方法,所述方法包括:
获取互联网AI外呼平台的数据库中所需的第一更新数据,并对第一更新数据进行符合数据库数据格式要求的处理后,获得第二更新数据;
将第二更新数据加入互联网AI外呼平台的数据库,并在互联网AI外呼平台运行过程中,验证第二更新数据是否满足更新验证的要求,若满足更新验证的要求,则确定将第二更新数据加入互联网AI外呼平台的数据库;
所述第一更新数据,为互联网AI外呼平台的现数据库中没有的数据,或者为现有数据库中虽然已有的数据,但是需要进行更新的数据;
具体来说,第一更新数据仅作为加入数据库之前的待验证数据,在处理成符合要求的第二更新数据后,仍需经过后续互联网AI外呼平台使用过程中的更新验证,并满足更新验证的要求后,作为确定的更新数据加入数据库中;
所述验证第二更新数据是否满足更新验证的要求,为确定将第二更新数据加入互联网AI外呼平台的数据库之前,通过在互联网AI外呼平台的运行过程中,经过多次的检索,验证其是否达到进入数据库的最低要求;
所述更新验证的要求,为第二更新数据通过更新验证,确定其进入数据库的最低要求;
本发明的基于互联网AI外呼的数据库更新方法,在获取更新数据之后,可立即加入数据库进行使用,但并未直接确定加入现有的数据库,而是在经过后续互联网AI外呼平台使用过程中的验证后才确认加入数据库,在数据库确定更新数据之前,增加进一步的验证环节,且验证的手段是以后续实际的使用效果为标准进行确定,这样就使得更新的数据不仅可以立即在互联网AI外呼平台直接使用,而且在能够使用过程中进一步验证其准确性,这样不仅兼顾了数据库更新的效率,而且进一步提高了数据库更新数据的准确性。
进一步的,如图2所示,所述获取互联网AI外呼平台的数据库中所需的第一更新数据,并对第一更新数据进行符合数据库数据格式要求的处理后,获得第二更新数据,包括:
获取互联网AI外呼平台的数据库中所需的第一更新数据;
具体来说,所述第一更新数据的获取途径,包括但不限于如下情况:
(1)互联网AI外呼平台进行外呼对话过程中,在平台现有的数据库中进行第一次数据检索后,未发现能够匹配的数据,则利用互联网大数据进行第二次检索,将此次检索匹配的数据作为第一更新数据;
(2)在互联网AI外呼平台的历史外呼对话数据中检索到的匹配数据,作为第一更新数据;
(3)人工添加的更新数据,作为第一更新数据;
所述数据库存储数据的结构为图数据结构,即所述数据库为图数据库,或者与图数据结构类似的其他数据库。
图数据库(比如Neo4j)与传统的关系型数据库(比如SQL)相比,其主要区别在于在存储结构上与传统关系型数据库有明显不同,图数据库并非把具体数据设置于各种各样的表中,再通过外键进行关联,而是直接把节点及其关联节点通过边(即关系)连接在一起;这样,当需要查询或检索一个节点的关联节点时,直接从该节点循着链接一步步去检索即可,而不需要像以往传统关系型数据库那样,需要检索所有的节点,在检索时间和响应速度上,均明显优于传统的关系型数据库。比如,对于互联网AI外呼平台的数据库中某一领域的具体数据,图数据库会将数据中的实体视为节点,而节点之间通过不同的边(即各种关系)进行连接;
所以,图数据库在互联网AI外呼的应用上的优势在于,在应用图数据库进行检索操作时,检索时的工作量只需包含与被检索节点及其相关节点(即一个局部的图),而无需检索全部的节点,这样当整个数据库中的节点数变多或者图结构扩大之后,对于某一次检索操作而言,其检索工作量并无太大的变化。另外,在图数据库中即使检索的层级变深,也仅仅比之前增加了一个层级的局部图,增加了一个层级的节点数量,相比于传统关系型数据库,不仅不会增加数据库的复杂度和数据检索的工作量,而且检索的逻辑是比较清晰的,这也是图数据库在互联网AI外呼的应用上,比传统关系型数据库更适合的原因所在。
具体来说,所述数据库,为互联网AI外呼平台运行过程中,用于检索数据、调用数据的数据库,可为互联网AI外呼平台服务器中的本地数据库,也可为云端数据库,或者为两种数据库的结合;数据库存储方式可采用集中式或分布式,比如集中式的本地数据库,或者分布式的云端数据库;
将第一更新数据进行数据清洗后,获得第三更新数据;
所述数据清洗,为发现并纠正数据文件中可识别的错误的过程,包括检查数据一致性,处理无效值和缺失值,对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性;
将第三更新数据进行关键信息提取后,获得第四更新数据;
所述关键信息提取,为将第三更新数据中包含的关键信息提取出来,并转换为符合图数据结构的数据,作为第四更新数据;
将第四更新数据进行特征标注后,获得第二更新数据;
所述特征标注,为检查第四更新数据的更新类型,并根据具体的更新类型,进行不同的处理如下:
(a)若第四更新数据的更新类型为新增节点型,则根据已有的数据层级分级信息,对第四更新数据添加对应的层级值,并对第四更新数据所更新的数据内容作待验证标注,获得第二更新数据;
(b)若第四更新数据的更新类型为修改数据型,则对第四更新数据所更新的数据内容作待验证标注,获得第二更新数据;
所述第四更新数据的更新类型为新增节点型,是指:执行更新数据的操作时,需要在现有数据库中新增一个节点,且需要新增至少一个连接此新增节点和其他节点的边;
具体来说,更新类型为新增节点型的第四更新数据所更新的数据内容,具体为新增节点(即实体)所包含的数据(比如节点类别或节点标签、节点属性等),以及连接新增节点与数据库中其他节点的边(即关系)包含的数据(比如关系的方向、关系的属性等);
所述已有的数据层级分级信息,为具体领域的现有的分级信息;
具体来说,即先确定第四更新数据中所包含的信息(即节点类别或节点标签),属于哪一个领域,再根据该领域的现有的分级信息,与第四更新数据进行比对之后添加具体的层级值;
所述层级值,表示第四更新数据在本领域的数据结构内处于第几层级,层级值的数字越大,表示在数据结构中的层级越低,即类别越小,分类越细;所述第四更新数据的层级值,即为获得的第二更新数据的层级值;
具体来说,所述节点类别或节点标签,是在将第三更新数据进行关键信息提取后,获得第四更新数据的过程中完成的,即在此过程中,提取关键信息的同时将节点类别或节点标签提取出来;
所述第四更新数据的更新类型为修改数据型,是指:执行更新数据的操作时,无需在现有数据库中新增节点,只需在现有数据库中增加或者修改数据;
具体来说,更新类型为修改数据型的第四更新数据所包含的更新数据内容,包括但不限于如下几种情况:
(1)对现有数据库中节点的相关数据进行修改;比如修改节点类别或节点标签、修改节点属性等操作;
(2)对现有数据库中边的相关数据进行修改;比如修改边的关系方向、修改边的关系属性等;
(3)对现有数据库中节点进行增加数据;比如增加节点的新类别或新标签、增加节点的新属性等操作;
(4)对现有数据库中边进行增加数据;比如增加边的新关系、增加边的新关系属性等;
所述待验证标注,仅表示具有待验证标注的数据状态为等待进一步验证的状态,不参与实际的数据交互;
具体来说,每一个第四更新数据,只能是新增节点型或者修改数据型中的任意一种类型,且仅包含一个具体的更新数据,比如修改数据型的更新操作需要修改一个现有节点的类别,还需要修改该现有节点的属性,那么,该更新操作就包括两个第四更新数据,分别为修改该现有节点的类别的第四更新数据A、修改该现有节点属性的第四更新数据B,以此类推;同理,新增节点型的更新操作需要新增多个节点,那么该更新操作就需要多个对应的第四更新数据。
本发明将获取互联网AI外呼平台的数据库中所需的第一更新数据,经过数据清洗,去除其中的错误或异常数据,获得第三更新数据,再进行关键信息提取,筛查出核心信息,获得第四更新数据,然后,判断第四更新数据的具体更新类型,根据其更新类型的不同,采用不同的处理方式,若为修改数据型,则作待验证标注即可,若为新增节点型,则除了需要作待验证标注外,还需添加对应的层级值;这种方式,不仅可以将获取的更新数据层层筛选直到符合数据库的要求,而且在未经过后续验证之前,提前标注待验证的标识信息,为后续验证过程做好准备,是后续验证过程更加高效便捷。
进一步的,如图3所示,所述将第二更新数据加入互联网AI外呼平台的数据库,并在互联网AI外呼平台运行过程中,验证第二更新数据是否满足更新验证的要求,若满足更新验证的要求,则确定将第二更新数据加入互联网AI外呼平台的数据库,包括:
将已作待验证标注的第二更新数据加入互联网AI外呼平台的数据库,供互联网AI外呼平台的后续使用;
在互联网AI外呼平台运行过程中,获取数据库中与第二更新数据相关的检索数据;
通过获取的所述数据库中与第二更新数据相关的检索数据,验证第二更新数据是否达到确定进入数据库的更新验证的要求;
若达到所述确定进入数据库的更新验证的要求,则将第二更新数据的待验证标注修改为已验证标注;
若未达到所述确定进入数据库的更新验证的要求,则维持第二更新数据的待验证标注;
所述将第二更新数据的待验证标注修改为已验证标注,表示该更新数据确定加入互联网AI外呼平台的数据库;
本发明虽然在获取第二更新数据后,就将其加入数据库直接使用,但是对并未确定第二更新数据最终加入数据库,而是在确定第二更新数据加入数据库之前,对第二更新数据进行了待验证标注的操作,使第二更新数据在达到确定进入数据库的更新验证的要求之前的状态可以被明显识别,同时在互联网AI外呼平台的后续运行过程中,被标注的第二更新数据经过不断的验证,在达到所述确定进入数据库的更新验证的要求之后,再将第二更新数据的待验证标注修改为已验证标注;这样使得数据库在更新过程中,不仅能够有效降低更新数据操作对互联网AI外呼平台使用中的实际影响,而且能够使更新数据经过实际使用的合理验证,提高更新数据的准确性、实用性,同时对更新数据状态的及时标注和修改,也使得数据库更新过程可追溯,为后续数据库的其他操作提供了便利。
进一步的,所述在互联网AI外呼平台运行过程中,获取数据库中与第二更新数据相关的检索数据,包括:
在互联网AI外呼平台运行过程中,获取互联网AI外呼平台在加入第二更新数据后的数据库中,对第二更新数据所属领域数据进行检索操作的总次数,同时获取该检索操作时,检索到该第二更新数据的次数,以及检索到该第二更新数据,并且通过验证的次数;
具体来说,所述检索到该第二更新数据,为互联网AI外呼平台在验证第二更新数据的过程中,直接或者间接检索到该第二更新数据;所述直接检索,是指检索的关键词与该第二更新数据之间满足检索匹配要求而被直接检索到,所述间接检索,是指检索的关键词虽然与该第二更新数据之间未满足检索匹配要求,但是检索到与该第二更新数据有直接关联的其他数据;
所述检索到该第二更新数据,并且通过验证,为在检索到该第二更新数据的基础上,同时在互联网AI外呼平台经过外呼对话过程的验证,验证结果为检索到的数据正确时,即为通过验证;
进一步的,所述通过获取的所述数据库中与第二更新数据相关的检索数据,验证第二更新数据是否达到确定进入数据库的更新验证的要求,包括:
所述确定进入数据库的更新验证的要求的方法,为第二更新数据的更新验证率满足预设的阈值,所述第二更新数据的更新验证率的具体模型如下:
Figure BDA0003681997470000101
其中,μ为第二更新数据的更新验证率;
具体来说,所述第二更新数据的更新验证率,用于表征第二更新数据在确定进入数据库之前,通过在互联网AI外呼平台的运行过程中,经过多次检索,验证其是否达到确定进入数据库的最低要求的量化指标;也就是说,当μ大于等于预设的更新验证率的阈值时,即为达到确定进入数据库的更新验证的要求;
s0为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,对第二更新数据所属领域数据进行检索操作的总次数;
s1为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,进行检索操作时,检索到该第二更新数据的次数;
s2为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,进行检索操作时,检索到该第二更新数据,并且通过验证的次数;
具体来说,所述检索到该第二更新数据,为互联网AI外呼平台在验证第二更新数据的过程中,直接或者间接检索到该第二更新数据;所述直接检索,是指检索的关键词与该第二更新数据之间满足检索匹配要求而被直接检索到,所述间接检索,是指检索的关键词虽然与该第二更新数据之间未满足检索匹配要求,但是检索到与该第二更新数据有直接关联的其他数据;
所述检索到该第二更新数据,并且通过验证,为在检索到该第二更新数据的基础上,同时在互联网AI外呼平台经过外呼对话过程的验证,验证结果为检索到的数据正确时,即为通过验证;
β1为第一验证权重系数;
β2为第二验证权重系数,且满足β12=1的关系;
具体来说,所述第一验证权重系数β1,表征检索到该第二更新数据的情况,对第二更新数据的更新验证率μ的影响权重,即β1越大,表示这种情况对第二更新数据的更新验证率影响越大,μ也越大;
所述第二验证权重系数β2,表征检索到该第二更新数据,并且通过验证的情况,对第二更新数据的更新验证率μ的影响权重,即β2越大,表示这种情况对第二更新数据的更新验证率影响越大,μ也越大;
k0为该第二更新数据的层级值;
具体来说,k0的取值有两种情况,具体如下:
(1)若第二更新数据的更新类型为新增节点型,则k0为该第二更新数据添加的层级值;
(2)若第二更新数据的更新类型为修改数据型,则需要根据其更新的具体内容对k0分别取值;
①当更新的具体内容仅涉及单个节点(即实体),比如节点类别或标签、节点属性,则k0为该节点的层级值;
②当更新的具体内容仅涉及单个边(即关系),比如边的方向、属性,则k0为该边直接连接的两个节点中相比较小的层级值;
m为第二更新数据的所属领域中的总层级数,即根据该所属领域已有的层级分级信息,获得总共有多少个层级;
本发明将获取的第二更新数据,加入互联网AI外呼平台的数据库后,在平台的后续实际使用中对其准确性、实用性进行验证,通过对第二更新数据所属领域数据进行检索操作的相关信息进行收集,再利用第二更新数据的更新验证率的模型对第二更新数据的验证指标进行量化,合理判断第二更新数据是否确定进入互联网AI外呼平台的数据库;这样不仅在更新数据的使用上无任何影响,而且通过实际使用更新数据来验证其准确性、实用性,更加科学合理,进一步减少了数据库更新后的无效数据、重复数据、错误数据等各种异常数据,降低了数据库的运行负荷,优化了数据库的数据结构,提高了数据库检索的响应速度,以及检索的准确性和数据的实用性。
进一步的,如图4所示,所述确定将第二更新数据加入互联网AI外呼平台的数据库之后,还包括:
对确定加入互联网AI外呼平台的数据库的第二更新数据,进行数据异常监测,若监测出现异常情况,则发布预警;
进一步的,所述对确定加入互联网AI外呼平台的数据库的第二更新数据,进行数据异常监测,若监测出现异常情况,则发布预警,包括:
获取数据库中与第二更新数据相关的信息,包括第二更新数据的层级值、与第一节点直接相连的节点总数、与第一节点直接相连的各节点的层级值;
根据所述获取的数据库中与第二更新数据相关的信息,确定数据库中第二数据的数据异常度;
若所述数据异常度大于等于预设的异常度预警值,则发布预警;
所述第一节点,为第二更新数据中作为k0取值的节点;
具体来说,所述第二数据的数据异常度监测,是在现有数据库的基础上进行的,目的在于对已确定的更新数据在数据库中分配的层级位置,是否处于合适的范围内,进行判断;所述发布预警是在互联网AI外呼平台的内部发布具体的预警信息,同时预警信息中除了包括异常更新数据的内容外,还可包括异常更新数据的位置,及其直接相连的其他节点的信息和位置,方便后台维护时查看和修改数据。
进一步的,所述根据所述获取的数据库中与第二更新数据相关的信息,确定数据库中第二数据的数据异常度,包括:
所述确定数据库中第二数据的数据异常度的方法,为利用数据库中第二数据的数据异常度的模型进行计算,具体模型如下:
Figure BDA0003681997470000111
其中,θ为数据库中第二更新数据的数据异常度;
k0为该第二更新数据的层级值;
i为与第一节点直接相连的第i个节点;
所述第一节点,为该第二更新数据中作为k0取值的节点;
n为与第一节点直接相连的节点总数;
ki为与第一节点直接相连的第i个节点的层级值;
δ为层级偏离基准值;
kmax为与第一节点直接相连的所有节点的层级值中的最高值;
kmin为与第一节点直接相连的所有节点的层级值中的最低值;
本发明在对第二更新数据进行验证之后,还从第二更新数据在数据库中与其直接相连的其他数据之间的关系方面,进行了数据异常度的监测,并及时发布预警,这样不仅使更新数据的准确性和实用性得到了保证,同时对更新数据在数据库中的结构性是否合理也做出了技术分析和判断,在更新数据的基础上,进一步保证了数据库结构的稳定性。
实施例2
如图5所示,本发明提供一种基于互联网AI外呼的数据库更新系统,所述系统包括:
数据采集模块,用于获取互联网AI外呼平台的数据库中所需的第一更新数据,并对第一更新数据进行符合数据库数据格式要求的处理后,获得第二更新数据;
数据验证模块,用于将第二更新数据加入互联网AI外呼平台的数据库,并在互联网AI外呼平台运行过程中,验证第二更新数据是否满足更新验证的要求,若满足更新验证的要求,则确定将第二更新数据加入互联网AI外呼平台的数据库;
数据监测模块,用于对确定加入互联网AI外呼平台的数据库的第二更新数据,进行数据异常监测,若监测出现异常情况,则发布预警;
所述第一更新数据,为互联网AI外呼平台的现数据库中没有的数据,或者为现有数据库中虽然已有的数据,但是需要进行更新的数据;
具体来说,第一更新数据仅作为加入数据库之前的待验证数据,在处理成符合要求的第二更新数据后,仍需经过后续互联网AI外呼平台使用过程中的更新验证,并满足更新验证的要求后,作为确定的更新数据加入数据库中;
所述验证第二更新数据是否满足更新验证的要求,为确定将第二更新数据加入互联网AI外呼平台的数据库之前,通过在互联网AI外呼平台的运行过程中,经过多次的检索,验证其是否达到进入数据库的最低要求;
所述更新验证的要求,为第二更新数据通过更新验证,确定其进入数据库的最低要求;
进一步的,如图2所示,所述获取互联网AI外呼平台的数据库中所需的第一更新数据,并对第一更新数据进行符合数据库数据格式要求的处理后,获得第二更新数据,包括:
获取互联网AI外呼平台的数据库中所需的第一更新数据;
具体来说,所述第一更新数据的获取途径,包括但不限于如下情况:
(1)互联网AI外呼平台进行外呼对话过程中,在平台现有的数据库中进行第一次数据检索后,未发现能够匹配的数据,则利用互联网大数据进行第二次检索,将此次检索匹配的数据作为第一更新数据;
(2)在互联网AI外呼平台的历史外呼对话数据中检索到的匹配数据,作为第一更新数据;
(3)人工添加的更新数据,作为第一更新数据;
所述数据库存储数据的结构为图数据结构,即所述数据库为图数据库,或者与图数据结构类似的其他数据库。
具体来说,所述数据库,为互联网AI外呼平台运行过程中,用于检索数据、调用数据的数据库,可为互联网AI外呼平台服务器中的本地数据库,也可为云端数据库,或者为两种数据库的结合;数据库存储方式可采用集中式或分布式,比如集中式的本地数据库,或者分布式的云端数据库;
将第一更新数据进行数据清洗后,获得第三更新数据;
所述数据清洗,为发现并纠正数据文件中可识别的错误的过程,包括检查数据一致性,处理无效值和缺失值,对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性;
将第三更新数据进行关键信息提取后,获得第四更新数据;
所述关键信息提取,为将第三更新数据中包含的关键信息提取出来,并转换为符合图数据结构的数据,作为第四更新数据;
将第四更新数据进行特征标注后,获得第二更新数据;
所述特征标注,为检查第四更新数据的更新类型,并根据具体的更新类型,进行不同的处理如下:
(a)若第四更新数据的更新类型为新增节点型,则根据已有的数据层级分级信息,对第四更新数据添加对应的层级值,并对第四更新数据所更新的数据内容作待验证标注,获得第二更新数据;
(b)若第四更新数据的更新类型为修改数据型,则对第四更新数据所更新的数据内容作待验证标注,获得第二更新数据;
所述第四更新数据的更新类型为新增节点型,是指:执行更新数据的操作时,需要在现有数据库中新增一个节点,且需要新增至少一个连接此新增节点和其他节点的边;
具体来说,更新类型为新增节点型的第四更新数据所更新的数据内容,具体为新增节点(即实体)所包含的数据(比如节点类别或节点标签、节点属性等),以及连接新增节点与数据库中其他节点的边(即关系)包含的数据(比如关系的方向、关系的属性等);
所述已有的数据层级分级信息,为具体领域的现有的分级信息;
具体来说,即先确定第四更新数据中所包含的信息(即节点类别或节点标签),属于哪一个领域,再根据该领域的现有的分级信息,与第四更新数据进行比对之后添加具体的层级值;
所述层级值,表示第四更新数据在本领域的数据结构内处于第几层级,层级值的数字越大,表示在数据结构中的层级越低,即类别越小,分类越细;所述第四更新数据的层级值,即为获得的第二更新数据的层级值;
具体来说,所述节点类别或节点标签,是在将第三更新数据进行关键信息提取后,获得第四更新数据的过程中完成的,即在此过程中,提取关键信息的同时将节点类别或节点标签提取出来;
所述第四更新数据的更新类型为修改数据型,是指:执行更新数据的操作时,无需在现有数据库中新增节点,只需在现有数据库中增加或者修改数据;
具体来说,更新类型为修改数据型的第四更新数据所包含的更新数据内容,包括但不限于如下几种情况:
(1)对现有数据库中节点的相关数据进行修改;比如修改节点类别或节点标签、修改节点属性等操作;
(2)对现有数据库中边的相关数据进行修改;比如修改边的关系方向、修改边的关系属性等;
(3)对现有数据库中节点进行增加数据;比如增加节点的新类别或新标签、增加节点的新属性等操作;
(4)对现有数据库中边进行增加数据;比如增加边的新关系、增加边的新关系属性等;
所述待验证标注,仅表示具有待验证标注的数据状态为等待进一步验证的状态,不参与实际的数据交互;
具体来说,每一个第四更新数据,只能是新增节点型或者修改数据型中的任意一种类型,且仅包含一个具体的更新数据,比如修改数据型的更新操作需要修改一个现有节点的类别,还需要修改该现有节点的属性,那么,该更新操作就包括两个第四更新数据,分别为修改该现有节点的类别的第四更新数据A、修改该现有节点属性的第四更新数据B,以此类推;同理,新增节点型的更新操作需要新增多个节点,那么该更新操作就需要多个对应的第四更新数据。
进一步的,如图3所示,所述将第二更新数据加入互联网AI外呼平台的数据库,并在互联网AI外呼平台运行过程中,验证第二更新数据是否满足更新验证的要求,若满足更新验证的要求,则确定将第二更新数据加入互联网AI外呼平台的数据库,包括:
将已作待验证标注的第二更新数据加入互联网AI外呼平台的数据库,供互联网AI外呼平台的后续使用;
在互联网AI外呼平台运行过程中,获取数据库中与第二更新数据相关的检索数据;
通过获取的所述数据库中与第二更新数据相关的检索数据,验证第二更新数据是否达到确定进入数据库的更新验证的要求;
若达到所述确定进入数据库的更新验证的要求,则将第二更新数据的待验证标注修改为已验证标注;
若未达到所述确定进入数据库的更新验证的要求,则维持第二更新数据的待验证标注;
所述将第二更新数据的待验证标注修改为已验证标注,表示该更新数据确定加入互联网AI外呼平台的数据库;
进一步的,所述在互联网AI外呼平台运行过程中,获取数据库中与第二更新数据相关的检索数据,包括:
在互联网AI外呼平台运行过程中,获取互联网AI外呼平台在加入第二更新数据后的数据库中,对第二更新数据所属领域数据进行检索操作的总次数,同时获取该检索操作时,检索到该第二更新数据的次数,以及检索到该第二更新数据,并且通过验证的次数;
具体来说,所述检索到该第二更新数据,为互联网AI外呼平台在验证第二更新数据的过程中,直接或者间接检索到该第二更新数据;所述直接检索,是指检索的关键词与该第二更新数据之间满足检索匹配要求而被直接检索到,所述间接检索,是指检索的关键词虽然与该第二更新数据之间未满足检索匹配要求,但是检索到与该第二更新数据有直接关联的其他数据;
所述检索到该第二更新数据,并且通过验证,为在检索到该第二更新数据的基础上,同时在互联网AI外呼平台经过外呼对话过程的验证,验证结果为检索到的数据正确时,即为通过验证;
进一步的,所述通过获取的所述数据库中与第二更新数据相关的检索数据,验证第二更新数据是否达到确定进入数据库的更新验证的要求,包括:
所述确定进入数据库的更新验证的要求的方法,为第二更新数据的更新验证率满足预设的阈值,所述第二更新数据的更新验证率的具体模型如下:
Figure BDA0003681997470000151
其中,μ为第二更新数据的更新验证率;
具体来说,所述第二更新数据的更新验证率,用于表征第二更新数据在确定进入数据库之前,通过在互联网AI外呼平台的运行过程中,经过多次检索,验证其是否达到确定进入数据库的最低要求的量化指标;也就是说,当μ大于等于预设的更新验证率的阈值时,即为达到确定进入数据库的更新验证的要求;
s0为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,对第二更新数据所属领域数据进行检索操作的总次数;
s1为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,进行检索操作时,检索到该第二更新数据的次数;
s2为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,进行检索操作时,检索到该第二更新数据,并且通过验证的次数;
具体来说,所述检索到该第二更新数据,为互联网AI外呼平台在验证第二更新数据的过程中,直接或者间接检索到该第二更新数据;所述直接检索,是指检索的关键词与该第二更新数据之间满足检索匹配要求而被直接检索到,所述间接检索,是指检索的关键词虽然与该第二更新数据之间未满足检索匹配要求,但是检索到与该第二更新数据有直接关联的其他数据;
所述检索到该第二更新数据,并且通过验证,为在检索到该第二更新数据的基础上,同时在互联网AI外呼平台经过外呼对话过程的验证,验证结果为检索到的数据正确时,即为通过验证;
β1为第一验证权重系数;
β2为第二验证权重系数,且满足β12=1的关系;
具体来说,所述第一验证权重系数β1,表征检索到该第二更新数据的情况,对第二更新数据的更新验证率μ的影响权重,即β1越大,表示这种情况对第二更新数据的更新验证率影响越大,μ也越大;
所述第二验证权重系数β2,表征检索到该第二更新数据,并且通过验证的情况,对第二更新数据的更新验证率μ的影响权重,即β2越大,表示这种情况对第二更新数据的更新验证率影响越大,μ也越大;
k0为该第二更新数据的层级值;
具体来说,k0的取值有两种情况,具体如下:
(1)若第二更新数据的更新类型为新增节点型,则k0为该第二更新数据添加的层级值;
(2)若第二更新数据的更新类型为修改数据型,则需要根据其更新的具体内容对k0分别取值;
①当更新的具体内容仅涉及单个节点(即实体),比如节点类别或标签、节点属性,则k0为该节点的层级值;
②当更新的具体内容仅涉及单个边(即关系),比如边的方向、属性,则k0为该边直接连接的两个节点中相比较小的层级值;
m为第二更新数据的所属领域中的总层级数,即根据该所属领域已有的层级分级信息,获得总共有多少个层级;
进一步的,如图4所示,所述确定将第二更新数据加入互联网AI外呼平台的数据库之后,还包括:
对确定加入互联网AI外呼平台的数据库的第二更新数据,进行数据异常监测,若监测出现异常情况,则发布预警;
进一步的,所述对确定加入互联网AI外呼平台的数据库的第二更新数据,进行数据异常监测,若监测出现异常情况,则发布预警,包括:
获取数据库中与第二更新数据相关的信息,包括第二更新数据的层级值、与第一节点直接相连的节点总数、与第一节点直接相连的各节点的层级值;
根据所述获取的数据库中与第二更新数据相关的信息,确定数据库中第二数据的数据异常度;
若所述数据异常度大于等于预设的异常度预警值,则发布预警;
所述第一节点,为第二更新数据中作为k0取值的节点;
具体来说,所述第二数据的数据异常度监测,是在现有数据库的基础上进行的,目的在于对已确定的更新数据在数据库中分配的层级位置,是否处于合适的范围内,进行判断;所述发布预警是在互联网AI外呼平台的内部发布具体的预警信息,同时预警信息中除了包括异常更新数据的内容外,还可包括异常更新数据的位置,及其直接相连的其他节点的信息和位置,方便后台维护时查看和修改数据。
进一步的,所述根据所述获取的数据库中与第二更新数据相关的信息,确定数据库中第二数据的数据异常度,包括:
所述确定数据库中第二数据的数据异常度的方法,为利用数据库中第二数据的数据异常度的模型进行计算,具体模型如下:
Figure BDA0003681997470000161
其中,θ为数据库中第二更新数据的数据异常度;
k0为该第二更新数据的层级值;
i为与第一节点直接相连的第i个节点;
所述第一节点,为该第二更新数据中作为k0取值的节点;
n为与第一节点直接相连的节点总数;
ki为与第一节点直接相连的第i个节点的层级值;
δ为层级偏离基准值;
kmax为与第一节点直接相连的所有节点的层级值中的最高值;
kmin为与第一节点直接相连的所有节点的层级值中的最低值;
实施例3
本发明提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上述实施例1所述的方法。
实施例4
本发明提供一种计算机装置,其特征在于,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序时,实现如上述实施例1所述的方法。
本发明与现有技术相比,在不影响互联网AI外呼平台的正常使用的情况下,优化了数据库的数据结构,提高了数据库更新的准确性和实用性,同时,降低了数据库的运行负荷,提高了数据库检索的响应速度。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、介质、装置、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。另外,在本申请各个实施例中的各功能模块或单元可以集成在一个处理模块或单元中,也可以是各个模块或单元单独物理存在,也可以两个或两个以上模块或单元集成在一个模块或单元中。上述集成的模块或单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的系统、模块、单元等,如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种基于互联网AI外呼的数据库更新方法,其特征在于,所述方法包括:
获取互联网AI外呼平台的数据库中所需的第一更新数据,并对第一更新数据进行符合数据库数据格式要求的处理后,获得第二更新数据;
将第二更新数据加入互联网AI外呼平台的数据库,并在互联网AI外呼平台运行过程中,验证第二更新数据是否满足更新验证的要求,若满足更新验证的要求,则确定将第二更新数据加入互联网AI外呼平台的数据库;
所述第一更新数据,为互联网AI外呼平台的现数据库中没有的数据,或者为现有数据库中虽然已有的数据,但是需要进行更新的数据;
所述验证第二更新数据是否满足更新验证的要求,为确定将第二更新数据加入互联网AI外呼平台的数据库之前,通过在互联网AI外呼平台的运行过程中,经过多次的检索,验证其是否达到进入数据库的最低要求;
所述更新验证的要求,为第二更新数据通过更新验证,确定其进入数据库的最低要求。
2.根据权利要求1所述的基于互联网AI外呼的数据库更新方法,其特征在于,所述获取互联网AI外呼平台的数据库中所需的第一更新数据,并对第一更新数据进行符合数据库数据格式要求的处理后,获得第二更新数据,包括:
获取互联网AI外呼平台的数据库中所需的第一更新数据;
所述数据库存储数据的结构为图数据结构;
将第一更新数据进行数据清洗后,获得第三更新数据;
所述数据清洗,为发现并纠正数据文件中可识别的错误的过程,包括检查数据一致性,处理无效值和缺失值,对数据进行重新审查和校验;
将第三更新数据进行关键信息提取后,获得第四更新数据;
所述关键信息提取,为将第三更新数据中包含的关键信息提取出来,并转换为符合图数据结构的数据,作为第四更新数据;
将第四更新数据进行特征标注后,获得第二更新数据;
所述特征标注,为检查第四更新数据的更新类型,并根据具体的更新类型,进行如下的不同的处理:
(a)若第四更新数据的更新类型为新增节点型,则根据已有的数据层级分级信息,对第四更新数据添加对应的层级值,并对第四更新数据所更新的数据内容作待验证标注,获得第二更新数据;
(b)若第四更新数据的更新类型为修改数据型,则对第四更新数据所更新的数据内容作待验证标注,获得第二更新数据;
所述第四更新数据的更新类型为新增节点型,是指:执行更新数据的操作时,需要在现有数据库中新增一个节点,且需要新增至少一个连接此新增节点和其他节点的边;
所述层级值,表示第四更新数据在数据结构内处于第几层级,层级值的数字越大,表示在数据结构中的层级越低;所述第四更新数据的层级值,做为获得的第二更新数据的层级值;
所述第四更新数据的更新类型为修改数据型,是指:执行更新数据的操作时,无需在现有数据库中新增节点,只需在现有数据库中增加或者修改数据。
3.根据权利要求2所述的基于互联网AI外呼的数据库更新方法,其特征在于,所述将第二更新数据加入互联网AI外呼平台的数据库,并在互联网AI外呼平台运行过程中,验证第二更新数据是否满足更新验证的要求,若满足更新验证的要求,则确定将第二更新数据加入互联网AI外呼平台的数据库,包括:
将已作待验证标注的第二更新数据加入互联网AI外呼平台的数据库,供互联网AI外呼平台的后续使用;
在互联网AI外呼平台运行过程中,获取数据库中与第二更新数据相关的检索数据;
通过获取的所述数据库中与第二更新数据相关的检索数据,验证第二更新数据是否达到确定进入数据库的更新验证的要求;
若达到所述确定进入数据库的更新验证的要求,则将第二更新数据的待验证标注修改为已验证标注;
若未达到所述确定进入数据库的更新验证的要求,则维持第二更新数据的待验证标注;
所述将第二更新数据的待验证标注修改为已验证标注,表示该更新数据确定加入互联网AI外呼平台的数据库。
4.根据权利要求3所述的基于互联网AI外呼的数据库更新方法,其特征在于,所述在互联网AI外呼平台运行过程中,获取数据库中与第二更新数据相关的检索数据,包括:
在互联网AI外呼平台运行过程中,获取互联网AI外呼平台在加入第二更新数据后的数据库中,对第二更新数据所属领域数据进行检索操作的总次数,同时获取该检索操作时,检索到该第二更新数据的次数,以及检索到该第二更新数据,并且通过验证的次数。
5.根据权利要求4所述的基于互联网AI外呼的数据库更新方法,其特征在于,所述通过获取的所述数据库中与第二更新数据相关的检索数据,验证第二更新数据是否达到确定进入数据库的更新验证的要求,包括:
所述确定进入数据库的更新验证的要求的方法,为第二更新数据的更新验证率满足预设的阈值,所述第二更新数据的更新验证率的具体模型如下:
Figure FDA0003681997460000021
其中,μ为第二更新数据的更新验证率;
s0为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,对第二更新数据所属领域数据进行检索操作的总次数;
s1为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,进行检索操作时,检索到该第二更新数据的次数;
s2为在验证第二更新数据的过程中,互联网AI外呼平台在加入第二更新数据后的数据库中,进行检索操作时,检索到该第二更新数据,并且通过验证的次数;
β1为第一验证权重系数;
β2为第二验证权重系数,且满足β12=1;
k0为该第二更新数据的层级值;
m为第二更新数据的所属领域中的总层级数。
6.根据权利要求5所述的基于互联网AI外呼的数据库更新方法,其特征在于,所述确定将第二更新数据加入互联网AI外呼平台的数据库之后,还包括:
对确定加入互联网AI外呼平台的数据库的第二更新数据,进行数据异常监测,若监测出现异常情况,则发布预警。
7.根据权利要求6所述的基于互联网AI外呼的数据库更新方法,其特征在于,所述对确定加入互联网AI外呼平台的数据库的第二更新数据,进行数据异常监测,若监测出现异常情况,则发布预警,包括:
获取数据库中与第二更新数据相关的信息,包括第二更新数据的层级值、与第一节点直接相连的节点总数、与第一节点直接相连的各节点的层级值;
根据所述获取的数据库中与第二更新数据相关的信息,确定数据库中第二数据的数据异常度;
若所述数据异常度大于等于预设的异常度预警值,则发布预警;
所述第一节点,为第二更新数据中作为k0取值的节点。
8.根据权利要求7所述的基于互联网AI外呼的数据库更新方法,其特征在于,所述根据所述获取的数据库中与第二更新数据相关的信息,确定数据库中第二数据的数据异常度,包括:
所述确定数据库中第二数据的数据异常度的方法,为利用数据库中第二数据的数据异常度的模型进行计算,具体模型如下:
Figure FDA0003681997460000031
其中,θ为数据库中第二更新数据的数据异常度;
k0为该第二更新数据的层级值;
i为与第一节点直接相连的第i个节点;
所述第一节点,为该第二更新数据中作为k0取值的节点;
n为与第一节点直接相连的节点总数;
ki为与第一节点直接相连的第i个节点的层级值;
δ为层级偏离基准值;
kmax为与第一节点直接相连的所有节点的层级值中的最高值;
kmin为与第一节点直接相连的所有节点的层级值中的最低值。
9.一种基于互联网AI外呼的数据库更新系统,其特征在于,所述系统包括:
数据采集模块,用于获取互联网AI外呼平台的数据库中所需的第一更新数据,并对第一更新数据进行符合数据库数据格式要求的处理后,获得第二更新数据;
数据验证模块,用于将第二更新数据加入互联网AI外呼平台的数据库,并在互联网AI外呼平台运行过程中,验证第二更新数据是否满足更新验证的要求,若满足更新验证的要求,则确定将第二更新数据加入互联网AI外呼平台的数据库;
数据监测模块,用于对确定加入互联网AI外呼平台的数据库的第二更新数据,进行数据异常监测,若监测出现异常情况,则发布预警;
所述第一更新数据,为互联网AI外呼平台的现数据库中没有的数据,或者为现有数据库中虽然已有但是需要进行更新的数据;
所述验证第二更新数据是否满足更新验证的要求,为确定将第二更新数据加入互联网AI外呼平台的数据库之前,通过在互联网AI外呼平台的运行过程中,经过多次的检索,验证其是否达到进入数据库的最低要求;
所述更新验证的要求,为第二更新数据通过更新验证,确定其进入数据库的最低要求。
10.一种计算机装置,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序时,实现如权利要求1-8任一项所述的基于互联网AI外呼的数据库更新方法。
CN202210635854.1A 2022-06-07 2022-06-07 一种基于互联网ai外呼的数据库更新方法、系统及装置 Pending CN114969074A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210635854.1A CN114969074A (zh) 2022-06-07 2022-06-07 一种基于互联网ai外呼的数据库更新方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210635854.1A CN114969074A (zh) 2022-06-07 2022-06-07 一种基于互联网ai外呼的数据库更新方法、系统及装置

Publications (1)

Publication Number Publication Date
CN114969074A true CN114969074A (zh) 2022-08-30

Family

ID=82958780

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210635854.1A Pending CN114969074A (zh) 2022-06-07 2022-06-07 一种基于互联网ai外呼的数据库更新方法、系统及装置

Country Status (1)

Country Link
CN (1) CN114969074A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117786179A (zh) * 2023-11-07 2024-03-29 河南省科技创新促进中心 基于高层次人才关键属性的科研成果检索方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117786179A (zh) * 2023-11-07 2024-03-29 河南省科技创新促进中心 基于高层次人才关键属性的科研成果检索方法

Similar Documents

Publication Publication Date Title
CN108256074B (zh) 校验处理的方法、装置、电子设备和存储介质
WO2021016978A1 (zh) 电信网络告警预测方法及系统
CN113946461A (zh) 一种故障根因分析的方法及装置
CN113591485B (zh) 一种基于数据科学的智能化数据质量稽核系统及方法
CN113468317B (zh) 一种简历筛选方法、系统、设备和存储介质
CN114968727B (zh) 基于人工智能运维的数据库贯穿基础设施的故障定位方法
CN113657461A (zh) 基于文本分类的日志异常检测方法、系统、设备及介质
CN113626400A (zh) 基于日志树和解析树的日志事件提取方法及系统
CN115794798A (zh) 一种市场监管信息化标准管理与动态维护系统及方法
CN114880312B (zh) 一种可柔性设置的应用系统业务数据稽核方法
JP3633959B2 (ja) 品質分析方法
CN114969074A (zh) 一种基于互联网ai外呼的数据库更新方法、系统及装置
CN115170027A (zh) 数据分析方法、装置、设备及存储介质
CN115719283A (zh) 一种智能化会计管理系统
CN113485878B (zh) 一种多数据中心故障检测方法
CN117544482A (zh) 基于ai的运维故障确定方法、装置、设备和存储介质
CN117834202A (zh) 一种基于XGBoost模型的SDWAN异常流量识别方法
CN117411780A (zh) 一种基于多源数据特征的网络日志异常检测方法
CN117291575A (zh) 设备检修方法、装置、计算机设备和存储介质
CN111585809A (zh) 一种利用大数据统计分析进行网络设备配置稽核的方法
CN109426576B (zh) 容错处理方法以及容错组件
CN116432099A (zh) 日志分类方法、装置、电子设备及存储介质
CN110348005A (zh) 配网设备状态数据处理方法、装置、计算机设备及介质
CN115879046A (zh) 基于改进特征选择和分层模型的物联网异常数据检测方法
CN112380042B (zh) 数据库软件的故障定位与分析方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination