CN117459640A - 一种基于语音外呼的机器人对话智能预警系统 - Google Patents

一种基于语音外呼的机器人对话智能预警系统 Download PDF

Info

Publication number
CN117459640A
CN117459640A CN202310686126.8A CN202310686126A CN117459640A CN 117459640 A CN117459640 A CN 117459640A CN 202310686126 A CN202310686126 A CN 202310686126A CN 117459640 A CN117459640 A CN 117459640A
Authority
CN
China
Prior art keywords
data
module
early warning
warning system
operated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310686126.8A
Other languages
English (en)
Inventor
周坤坤
丁卓
鲁宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Longyuan Information Technology Co ltd
Original Assignee
Nanjing Longyuan Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Longyuan Information Technology Co ltd filed Critical Nanjing Longyuan Information Technology Co ltd
Priority to CN202310686126.8A priority Critical patent/CN117459640A/zh
Publication of CN117459640A publication Critical patent/CN117459640A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/527Centralised call answering arrangements not requiring operator intervention
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Biomedical Technology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供的一种基于语音外呼的机器人对话智能预警系统,涉及智能预警系统技术领域,包括:数据接入模块、数据融合模块、NLP神经网络构建模块、NLP神经网络分析模块和数据展现模块;数据接入模块,操作于连接多种数据源,接受多种数据源的数据并进行预处理;数据融合模块,操作于对多种数据源数据进行融合处理和质量评估。本发明,能够通过智能外呼系统进行外呼,减轻办事人员工作量,释放人工坐席,处理重要信息,提升工作质效。并将AI技术融于反电诈,及时高效全覆盖的外呼,对市民进行提醒、劝阻、宣传,减少市民损失,提升市民满意度;为易受骗人群提供便捷、自然的语音交互服务,为一线办事人员提供高效的预警劝阻工作辅助。

Description

一种基于语音外呼的机器人对话智能预警系统
技术领域
本发明涉及智能预警系统技术领域,尤其涉及一种基于语音外呼的机器人对话智能预警系统。
背景技术
近年来,电信网络新型犯罪来势凶猛。
基于此,我们设计一种基于语音外呼的机器人对话智能预警系统,以来辅助相关部门进行反诈事务的有效推进。
发明内容
本发明的目的在于提供一种基于语音外呼的机器人对话智能预警系统,能够通过智能外呼系统进行外呼,减轻工作人员工作量,释放人工坐席,处理重要信息,提升工作质效;并同时将AI技术融于反电诈,及时高效全覆盖的外呼,对市民进行提醒、劝阻、宣传,减少市民损失,提升市民满意度;为易受骗人群提供便捷、自然的语音交互服务,为一线工作人员提供高效的预警劝阻工作辅助,提升社会公众形象,进而推进反诈中心信息化、智能化建设,实现反诈应用创新,保障反电诈预警效果,可以解决上述背景技术中提出的问题。
本发明提供一种基于语音外呼的机器人对话智能预警系统,该机器人对话智能预警系统包括:数据接入模块、数据融合模块、NLP神经网络构建模块、NLP神经网络分析模块和数据展现模块;
数据接入模块,操作于连接多种数据源,接受多种数据源的数据并进行预处理;
数据融合模块,操作于对多种数据源数据进行融合处理和质量评估;
NLP神经网络构建模块,操作于使用LSTM记忆网络顺序读取融合处理后的数据,同时使用ransformer模型并行处理文本;
NLP神经网络分析模块,操作于对ransformer模型处理后的文本进行分析处理;
数据展现模块,操作于以多种维度统计低中高危用户的数据并进行展示。
可选地,所述机器人对话智能预警系统还包括话术生成模块,操作于机器人自动生成语音外呼话术。
可选地,所述数据接入模块包含数据源连接单元、数据抽取和转换单元、数据同步和增量更新单元、数据质量管理单元以及数据安全和隐私管理单元;
数据源连接单元,操作于与多种数据源进行连接;
数据抽取和转换单元,包括数据抽取子单元和数据转换子单元;数据抽取子单元,操作于从数据源中获取需要的数据,并将其存储在一个中间存储区域中;而数据转换子单元,操作于对抽取的数据进行清洗、变换、合并、去重、格式化操作,以便让数据适用于分析和决策;
数据同步和增量更新单元,包括数据同步子单元和数据增量更新子单元;数据同步子单元,操作于将数据源中的所有数据复制到数据仓库或数据湖中;而数据增量更新子单元,操作于将新添加或更新的数据导入到数据仓库或数据湖中;
数据质量管理单元,操作于至少通过数据清洗、验证、修复方式实现数据质量进行管理和控制;
数据安全和隐私管理单元,操作于在数据接入过程中,保护数据的安全和隐私,至少包含数据加密、身份验证、访问控制和审计方面。
可选地,所述数据融合模块包含数据融合单元和数据质量评估单元;
数据融合单元,操作于通过数据融合方法来融合不同来源的数据,以将不同类型的数据转化为统一的格式;
其中,数据融合方法至少包含基于规则的方法、基于模型的方法、基于贝叶斯网络的方法和基于概率图模型的方法;
数据质量评估单元,操作于在进行数据融合时,对数据质量进行评估。
可选地,所述数据源至少包括关系型数据库、非关系型数据库、文件系统、WebAPI、传感器和I oT设备。
可选地,所述数据包括结构化数据、半结构化数据和非结构化数据。
可选地,所述NLP神经网络分析模块的对ransformer模型处理后的文本进行分析处理,包含文本情感分析、垃圾邮件以及非垃圾邮件的分类、语音文字双向转换、文本翻译、文字内容总结摘要和文本生成。
可选地,所述数据接入模块连接不同类型的数据源需要使用不同的连接器和协议。
有益效果
本发明的一种基于语音外呼的机器人对话智能预警系统,能够通过智能外呼系统进行外呼,减轻工作人员工作量,释放人工坐席,处理重要信息,提升工作质效;并同时将AI技术融于反电诈,及时高效全覆盖的外呼,对市民进行提醒、劝阻、宣传,减少市民损失,提升市民满意度;为易受骗人群提供便捷、自然的语音交互服务,为一线工作人员提供高效的预警劝阻工作辅助,提升社会公众形象,进而推进反诈中心信息化、智能化建设,实现反诈应用创新,保障反电诈预警效果。
附图说明
图1是本发明的一种基于语音外呼的机器人对话智能预警系统的模块组成示意图;
图2是本发明的一种基于语音外呼的机器人对话智能预警系统的智能预警方法工作流程图;
图3是本发明的一种移动终端的硬件结构示意图;
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
本发明的发明构思为:
本发明的机器人对话智能预警系统,通过数据接入模块能够将接入的不同数据源的数据进行数据抽取和转换操作,以获得适用于分析和决策的数据;而后通过数据融合模块,以对多种数据源的适用于分析和决策的数据进行融合处理和质量评估;接着通过构建NLP神经网络,使用LSTM记忆网络顺序读取融合处理后的数据,同时使用ransformer模型并行处理文本;最后,通过NLP神经网络分析模块,以对ransformer模型处理后的文本进行分析处理,为各种应用程序提供了支持,以实现机器人对话智能预警。
参见图1,是本发明实施例提供的一种基于语音外呼的机器人对话智能预警系统的模块组成示意图,图1所示方法的执行主体可以是软件和/或硬件装置。本申请的执行主体可以包括但不限于以下中的至少一个:用户设备、网络设备等。其中,用户设备可以包括但不限于计算机、智能手机、个人数字助理(Personal Digital Assistant,简称:PDA)及上述提及的电子设备等。网络设备可以包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机组成的一个超级虚拟计算机。本实施例对此不做限制。
本发明实施例提供一种基于语音外呼的机器人对话智能预警系统,该机器人对话智能预警系统包括:数据接入模块、数据融合模块、NLP神经网络构建模块、NLP神经网络分析模块和数据展现模块;
数据接入模块,操作于连接多种数据源,接受多种数据源的数据并进行预处理;
数据融合模块,操作于对多种数据源数据进行融合处理和质量评估;
NLP神经网络构建模块,操作于使用LSTM记忆网络顺序读取融合处理后的数据,同时使用ransformer模型并行处理文本;
NLP神经网络分析模块,操作于对ransformer模型处理后的文本进行分析处理;
数据展现模块,操作于以多种维度统计低中高危用户的数据并进行展示。
本实施例中,所述机器人对话智能预警系统还包括话术生成模块,操作于机器人自动生成语音外呼话术。
参阅图2,为该种基于语音外呼的机器人对话智能预警系统的智能预警方法工作流程图,包括步骤S01至步骤S05,具体如下:
S01、数据接入:通过数据接入模块连接多种数据源,接受多种数据源的数据并进行预处理;
其中,数据源可以是关系型数据库、非关系型数据库、文件系统、Web API、传感器、IoT设备等。连接不同类型的数据源需要使用不同的连接器和协议,如JDBC、ODBC、RESTfulAPI等;
具体在数据接入过程中,执行如下操作:
数据抽取和转换:在将数据源中的数据导入到数据仓库或数据湖中之前,需要进行一系列的数据抽取和转换操作。
其中,数据抽取是指从数据源中获取需要的数据,并将其存储在一个中间存储区域中。数据转换是指对抽取的数据进行清洗、变换、合并、去重、格式化等操作,以便让数据适用于分析和决策。
数据同步和增量更新:数据源中的数据可能会随着时间而变化,因此需要在数据仓库或数据湖中定期更新数据。
其中,数据同步是指将数据源中的所有数据复制到数据仓库或数据湖中,而增量更新是指仅将新添加或更新的数据导入到数据仓库或数据湖中。增量更新可以减少数据传输和存储成本,并加速数据更新过程。通过专网接入相关部门等相关数据,数据接入的协议支持https和sftp两种接口方式。数据包括居住地、常住地等。
数据质量管理:在数据接入过程中,需要对数据质量进行管理和控制。数据质量包括数据准确性、完整性、一致性、规范性、可靠性等方面。其中,数据质量管理可以通过数据清洗、验证、修复等方式实现。
数据安全和隐私:在数据接入过程中,需要保护数据的安全和隐私。这包括数据加密、身份验证、访问控制、审计等方面。其中,数据安全和隐私的管理需要符合相关法律法规和数据保护标准。
S02,数据接入:通过数据融合模块将多种数据源数据进行融合处理和质量评估:
需要说明的是,数据源包括传感器、网络、社交媒体、卫星图像等;这些数据可能包括结构化、半结构化和非结构化数据;数据融合技术可以将这些不同类型的数据转化为统一的格式,并进行适当的预处理。
同时,本发明所采用的数据融合方法为:使用不同的融合方法来融合不同来源的数据,包括基于规则的方法、基于模型的方法、基于贝叶斯网络的方法、基于概率图模型的方法等。
其中,基于规则的方法是最简单的方法,它使用手动制定的规则将数据源融合在一起;而基于模型的方法用于构建统计模型来执行数据融合;而贝叶斯网络和概率图模型可以描述不同数据源之间的关系,可以提高数据融合效率。
而数据质量评估具体为:在进行数据融合时,需要对数据质量进行评估,包括准确性、完整性、一致性等;同时,数据融合技术需要考虑数据质量问题,并进行适当的数据清洗、数据补全等操作,以提高数据质量。
S03,NLP神经网络构建:使用LSTM记忆网络顺序读取融合处理后的数据,同时使用ransformer模型并行处理文本;
在实际处理过程中,使用LSTM记忆网络,可以将数据在一个方向以顺序方式读取;而双向LSTM通过向前和向后读取数据解决问题。Transformer模型发挥作用的地方--并行处理文本。Transformer模型依靠注意力机制并行处理整个文本文档。在注意力机制中,并行处理文本,这允许注意力系统以并行方式为文本的重要部分分配权重。
具体地,NLP神经网络构建得原理过程示例如下:
!pip install transformers标记(tokenize)文本,从transformers模块中导入BertTokenizer类,如下所示:
Script 1:
快速的方法:为分词器加载预训练的词嵌入。以下脚本创建一个带有预训练嵌入的BERT分词器对象。接下来定义一个示例句子并将最大句子长度设置为25,如下所示:
Script 2:
要对句子进行分词,使用BERT分词器的tokenize()方法,如下所示。此外,对于BERT,每个句子都以“[CLS]”标签为前缀,并以“[SEP]”标签结尾,如下所示:
Script 3:
以下输出显示了一个标记化的句子;
Output:
接下来,将文本标记转换为整数格式。为此,使用BERT标记器的convert_tokens_to_ids()方法,如下所示:
Script 4:
示例输入句子中单词的id如下:
Output:
同时,需要对输入的句子应用填充,以便所有的句子都具有相同的长度。以下脚本计算示例句子的填充长度。由于最大句子长度设置为25,输入句子包含16个token,pad长度为9,如下所示:
Script 5:
Output:
以下脚本在输入ids令牌ids的末尾添加9个0:
Script 6:
Output:
其中,掩码是一个由0和1组成的列表,其中1被添加到包含原始对象的位置,而0被添加到填充(paddings)索引,如下所示:
Script 7:
Output:
如果输入中有两个句子,则token类型ID用于将输入句子与输出句子分开。第一个句子的索引加零,而另一个句子的索引加1。由于只有一个句子,因此只会为令牌类型id创建一个全0的列表,如下所示:
Script 8:
最后,为了为BERT模型创建一个完整的输入,创建了一个包含令牌ID、token类型ID和注意力掩码的字典,如下所示:
Script 9:
Output:
简单地使用BertTokenizer对象的encode_plus函数,如下所示:
Script 10:
以下输出手动准备BERT输入数据时实现的输出,如下所示:
Output:
S04、NLP神经网络分析:从Microsoft的Cortona到Apple的Siri,NLP为;本发明实施例简要介绍了NLP的一些最常见的应用程序:
情感分析
NLP通常被用于执行文本情感分析。文字形式的大众意见,情感分析是指从这些文字中识别情感。自动检测有关话术的公众情绪可以帮助相关人员决定如何改进其话术以及保留或丢弃哪种话术。
垃圾邮件以及非垃圾邮件的分类
Gmail和其他电子邮件服务器使用NLP技术来精确地区分非垃圾和垃圾邮件。这是文本分类的一个经典应用,其中文本文档被划分为预定义类别之一,即非垃圾邮件或垃圾邮件。
语音到文字的转换
NLP技术被广泛的使用到系统的语音与文字的自动双向转换中。
文字翻译
自动文本翻译是NLP最强大的应用程序之一。使用文本翻译技术,单击几下鼠标,可以将文档从一种语言翻译成另一种语言。
文字摘要
为了减除相关人员花费大量时间来阅读冗长的话术对话内容,内容摘要是需要时间和人力的。使用NLP技术,文字文档被自动地总结摘要,节省了时间与人力也节约了成本。
文本生成
基于深度学习的高级NLP技术被用于文本生成。文本生成技术目前还处于初始阶段。
S05、数据展现:多种维度统计低中高危用户的数据并进行展示。
具体地,系统根据时间段、涉诈人群、年龄段、性别、工种等维度统计低中高危用户的数量,支持饼图、趋势图各种图形进行展示,也可以根据时间段、涉诈人群、年龄段、性别、工种地等维度查询高危用户明细数据,不同的用户用不同的颜色来进行展示。同时提供用户-设备-用户子图聚合度查询等功能。
参见图3,是本发明实施例提供的一种移动终端的硬件结构示意图,该移动终端能够基于语音外呼的机器人对话智能预警,包括:处理器、存储器和计算机程序;其中,
存储器,用于存储所述计算机程序,该存储器还可以是闪存(flash)。所述计算机程序例如是实现上述方法的应用程序、功能模块等。
处理器,用于执行所述存储器存储的计算机程序,以实现上述方法中设备执行的各个步骤。具体可以参见前面方法实施例中的相关描述。
可选地,存储器既可以是独立的,也可以跟处理器集成在一起。
当所述存储器是独立于处理器之外的器件时,所述设备还可以包括:
总线,用于连接所述存储器和处理器。
本发明还提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现上述的各种实施方式提供的方法。
其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(ApplicationSpecific Integrated Circuits,简称:ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。
在上述移动终端的实施例中,应理解,处理器可以是中央处理单元(英文:CentralProcessing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:DigitalSignal Processor,简称:DSP)、专用集成电路(英文:Application Specific IntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (8)

1.一种基于语音外呼的机器人对话智能预警系统,其特征在于,该机器人对话智能预警系统包括:数据接入模块、数据融合模块、NLP神经网络构建模块、NLP神经网络分析模块和数据展现模块;
数据接入模块,操作于连接多种数据源,接受多种数据源的数据并进行预处理;
数据融合模块,操作于对多种数据源数据进行融合处理和质量评估;
NLP神经网络构建模块,操作于使用LSTM记忆网络顺序读取融合处理后的数据,同时使用ransformer模型并行处理文本;
NLP神经网络分析模块,操作于对ransformer模型处理后的文本进行分析处理;
数据展现模块,操作于以多种维度统计低中高危用户的数据并进行展示。
2.根据权利要求1所述的一种基于语音外呼的机器人对话智能预警系统,其特征在于,所述机器人对话智能预警系统还包括话术生成模块,操作于机器人自动生成语音外呼话术。
3.根据权利要求1所述的一种基于语音外呼的机器人对话智能预警系统,其特征在于,所述数据接入模块包含数据源连接单元、数据抽取和转换单元、数据同步和增量更新单元、数据质量管理单元以及数据安全和隐私管理单元;
数据源连接单元,操作于与多种数据源进行连接;
数据抽取和转换单元,包括数据抽取子单元和数据转换子单元;数据抽取子单元,操作于从数据源中获取需要的数据,并将其存储在一个中间存储区域中;而数据转换子单元,操作于对抽取的数据进行清洗、变换、合并、去重、格式化操作,以便让数据适用于分析和决策;
数据同步和增量更新单元,包括数据同步子单元和数据增量更新子单元;数据同步子单元,操作于将数据源中的所有数据复制到数据仓库或数据湖中;而数据增量更新子单元,操作于将新添加或更新的数据导入到数据仓库或数据湖中;
数据质量管理单元,操作于至少通过数据清洗、验证、修复方式实现数据质量进行管理和控制;
数据安全和隐私管理单元,操作于在数据接入过程中,保护数据的安全和隐私,至少包含数据加密、身份验证、访问控制和审计方面。
4.根据权利要求1所述的一种基于语音外呼的机器人对话智能预警系统,其特征在于,所述数据融合模块包含数据融合单元和数据质量评估单元;
数据融合单元,操作于通过数据融合方法来融合不同来源的数据,以将不同类型的数据转化为统一的格式;
其中,数据融合方法至少包含基于规则的方法、基于模型的方法、基于贝叶斯网络的方法和基于概率图模型的方法;
数据质量评估单元,操作于在进行数据融合时,对数据质量进行评估。
5.根据权利要求1所述的一种基于语音外呼的机器人对话智能预警系统,其特征在于,所述数据源至少包括关系型数据库、非关系型数据库、文件系统、Web API、传感器和IoT设备。
6.根据权利要求1所述的一种基于语音外呼的机器人对话智能预警系统,其特征在于,所述数据包括结构化数据、半结构化数据和非结构化数据。
7.根据权利要求1所述的一种基于语音外呼的机器人对话智能预警系统,其特征在于,所述NLP神经网络分析模块的对ransformer模型处理后的文本进行分析处理,包含文本情感分析、垃圾邮件以及非垃圾邮件的分类、语音文字双向转换、文本翻译、文字内容总结摘要和文本生成。
8.根据权利要求1所述的一种基于语音外呼的机器人对话智能预警系统,其特征在于,所述数据接入模块连接不同类型的数据源需要使用不同的连接器和协议。
CN202310686126.8A 2023-06-09 2023-06-09 一种基于语音外呼的机器人对话智能预警系统 Pending CN117459640A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310686126.8A CN117459640A (zh) 2023-06-09 2023-06-09 一种基于语音外呼的机器人对话智能预警系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310686126.8A CN117459640A (zh) 2023-06-09 2023-06-09 一种基于语音外呼的机器人对话智能预警系统

Publications (1)

Publication Number Publication Date
CN117459640A true CN117459640A (zh) 2024-01-26

Family

ID=89589796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310686126.8A Pending CN117459640A (zh) 2023-06-09 2023-06-09 一种基于语音外呼的机器人对话智能预警系统

Country Status (1)

Country Link
CN (1) CN117459640A (zh)

Similar Documents

Publication Publication Date Title
KR102478657B1 (ko) 통신 및 콘텐츠로부터 확약 및 요청의 자동 추출
WO2022095378A1 (zh) 基于人工智能的培训方法、装置、计算机设备及存储介质
CN111797210A (zh) 基于用户画像的信息推荐方法、装置、设备及存储介质
CN111222305A (zh) 一种信息结构化方法和装置
CN111325022B (zh) 识别层级地址的方法和装置
CA3048356A1 (en) Unstructured data parsing for structured information
CN113407677B (zh) 评估咨询对话质量的方法、装置、设备和存储介质
CN113986864A (zh) 日志数据处理方法、装置、电子设备及存储介质
CN111753082A (zh) 基于评论数据的文本分类方法及装置、设备和介质
CN114372475A (zh) 一种基于RoBERTa模型的网络舆情情感分析方法及系统
CN113268560A (zh) 用于文本匹配的方法和装置
CN107766498B (zh) 用于生成信息的方法和装置
CN111651552A (zh) 结构化信息确定方法、装置和电子设备
CN111680161A (zh) 一种文本处理方法、设备以及计算机可读存储介质
CN110852057A (zh) 一种计算文本相似度的方法和装置
CN112906368A (zh) 行业文本增量方法、相关装置及计算机程序产品
CN112884009A (zh) 一种分类模型训练方法及系统
CN116955561A (zh) 问答方法、装置、电子设备以及存储介质
US11681966B2 (en) Systems and methods for enhanced risk identification based on textual analysis
CN116340516A (zh) 实体关系的聚类提取方法、装置、设备及存储介质
CN114266255B (zh) 基于聚类模型的语料分类方法、装置、设备及存储介质
CN117459640A (zh) 一种基于语音外呼的机器人对话智能预警系统
CN114579876A (zh) 虚假信息检测方法、装置、设备及介质
CN113486146A (zh) 一种文本处理方法、装置、电子设备及计算机可读介质
CN112445955A (zh) 商机信息管理方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination