CN112988985A - 一种ai智能语音交互-话术一键添加和使用 - Google Patents

一种ai智能语音交互-话术一键添加和使用 Download PDF

Info

Publication number
CN112988985A
CN112988985A CN201911209848.4A CN201911209848A CN112988985A CN 112988985 A CN112988985 A CN 112988985A CN 201911209848 A CN201911209848 A CN 201911209848A CN 112988985 A CN112988985 A CN 112988985A
Authority
CN
China
Prior art keywords
dialogue
semantic
module
language
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911209848.4A
Other languages
English (en)
Inventor
谢伟平
仇家春
刘慧�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Sikaozhe Technology Co ltd
Original Assignee
Zhejiang Sikaozhe Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Sikaozhe Technology Co ltd filed Critical Zhejiang Sikaozhe Technology Co ltd
Priority to CN201911209848.4A priority Critical patent/CN112988985A/zh
Publication of CN112988985A publication Critical patent/CN112988985A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

本发明公开了一种AI智能语音交互‑话术一键添加和使用,该交互页面界面设计时尚大胆,采用卡片式话术模板,让用户眼前一亮,在“话术添加”、“话术删除”、“话术详情”等方面更是做了精简,事先提供“下载模板”入口,为用户提供示例模板,按照要求和实际需求场景可自行增删改查,见本系统中,在控制台‑话术管理‑添加模板模块。导入相应的主流程和问答语句,再选择此文件模板,一键上传添加话术模板,省时省力,即可灵活操作使用各种业务场景话术,实时切换更改过。

Description

一种AI智能语音交互-话术一键添加和使用
技术领域
本发明涉及AI智能技术领域,特别涉及一种AI智能语音交互-话术一键添加和使用。
背景技术
现如今AI时代到来,现有技术往往局限在单一增删改上,界面结构普遍一致化,尤其在语音呼叫话术板块缺乏创新设计思维,且操作繁琐效率低下耗时耗力,业务庞大或数据巨大情境下结构臃肿不规范,加剧后期维护成本。
发明内容
本发明的目的在于提供一种AI智能语音交互-话术一键添加和使用,以解决背景技术提出的问题。
为实现上述目的,本发明提供如下技术方案:一种AI智能语音交互-话术一键添加和使用,包括以下具体设置流程:
步骤一、快速定制对话能力:
首先提供融合组合语义推导、语义匹配的对话理解技术,预置涵盖生活娱乐、设备控制等领域的可干预对话能力及50+场景的词典,助开发者高效定制对话能力;
步骤二、持续提升对话效果:
首先开源的对话管理、对话中控模块与云端复杂对话逻辑定制功能,帮助开发者深度的定制对话系统;支持多种接入方式,全方位满足各种应用场景中的需求;
步骤三、深度定制与灵活接入:
首先开源的对话管理、对话中控模块与云端复杂对话逻辑定制功能,帮助开发者深度的定制对话系统;支持多种接入方式,全方位满足各种应用场景中的需求;
步骤四、完善的服务生态:
首先开放对话系统架构师与训练师培训认证体系,支持平台能力共建,协同生态合作伙伴,共同提供对话系统自研、合作研发、托管研发等全方位的服务。
步骤五、具体流程还包括人工智能语音电话系统,在语音电话交流中自动理解客户意向,并做出最恰当的回应,智能代替人工的基本原理如下:即在呼入/呼出过程中,利用ASR+NLP技术引导用户说出需求,通过真人录制的声音模仿与客户进行多轮对话,将语音转化为文字,根据识别的文字准确判定客户意图并保存在平台数据库中,达到初步筛选意向客户的目的,同时通过录音等手段实现语音质检、用户信息大数据挖掘和分析的需求,人工智能语音交互系统是一位任劳任怨的话务员,全年无休每天可以拨打1000通以上电话的智能电话机器人,AI平台让企业管理者节省60%以上的成本,也让电销从业者提高150%以上的效;
步骤六、对话能力中主要由语音识别、自然语言处理和语音合成三个主要部分组成,主要是语音识别模块实现用户输入语音到文字的识别转换,识别结果一般以得分最高的前n(n≥1)个句子形式输出,语言解析模块对语音识别结果进行分析理解,获得给定输入的内部表示,即把用户说的转成机器理解的语言,问题求解模块依据语言解析器的分析结果进行问题的推理或查询,求解用户问题的答案,即解决用户问题的模块,比如调用的百度搜索,对话管理模块是系统的核心,一个理想的对话管理器应该能够基于对话历史调度人机交互机制,辅助语言解析器对语音识别结果进行正确的理解,为问题求解提供帮助,并指导语言的生成过程。
步骤七、语音识别的对话管理机制是人机对话系统的中心枢纽,能够记录历史对话数据,通过训练能够给到用户更好的回答,语言生成模块根据解析模块得到的内部表示,在对话管理机制的作用下生成自然语言句子,把回答的机器语言再转换成口语语言语音合成模块将生成模块生成的句子转换成语音输出,把口语语言再转化成语音,其中包括以下几个组成部分。
步骤八、根据语义组块具体的意义,对语义组块进行了语义分类首先是统计解析过程,手工标注一定数量的语料,对于语料中的每一个句子,首先对它进行语义组块分析,得到该句子对应的组块序列,然后给出该句子的IF语义表示,最后把IF语义表示线性化并且和语义组块序列对齐。用这些语料来对模型的参数进行训练,就得到一个统计解析模型。
步骤九、语音处理还包括组块解释方法,在语义组块分析时,通过规则方法获得语义组块的同时,也可以得到语义组块内部的层次结构,但这种层次结构并不是我们所需要的IF表示,因此,我们设计了语义组块解释模块,用来把这种层次结构转换为IF表示,语义组块解释模块是与组块分析模块配合工作的,组块分析过程中用到的每一条规则都对应一个规则的解释方法,利用这些解释方法可以把规则所涉及的词汇解释为相应的IF表示,循环调用生成语义组块的每一条规则所对应的解释子程序,就可以得到该语义组块对应的IF层次表示。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
1、一种AI智能语音交互-话术一键添加和使用,包括以下具体设置流程,
快速定制对话能力:
首先提供融合组合语义推导、语义匹配的对话理解技术,预置涵盖生活娱乐、设备控制等领域的可干预对话能力及50+场景的词典,助开发者高效定制对话能力。
进一步的,持续提升对话效果:
首先开源的对话管理、对话中控模块与云端复杂对话逻辑定制功能,帮助开发者深度的定制对话系统;支持多种接入方式,全方位满足各种应用场景中的需求。
进一步的,深度定制与灵活接入:
首先开源的对话管理、对话中控模块与云端复杂对话逻辑定制功能,帮助开发者深度的定制对话系统;支持多种接入方式,全方位满足各种应用场景中的需求。
进一步的,完善的服务生态:
首先开放对话系统架构师与训练师培训认证体系,支持平台能力共建,协同生态合作伙伴,共同提供对话系统自研、合作研发、托管研发等全方位的服务。
进一步的,具体流程还包括人工智能语音电话系统,在语音电话交流中自动理解客户意向,并做出最恰当的回应,智能代替人工的基本原理如下:即在呼入/呼出过程中,利用ASR+NLP技术引导用户说出需求,通过真人录制的声音模仿与客户进行多轮对话,将语音转化为文字,根据识别的文字准确判定客户意图并保存在平台数据库中,达到初步筛选意向客户的目的,同时通过录音等手段实现语音质检、用户信息大数据挖掘和分析的需求,人工智能语音交互系统是一位任劳任怨的话务员,全年无休每天可以拨打1000通以上电话的智能电话机器人,AI平台让企业管理者节省60%以上的成本,也让电销从业者提高150%以上的效。
进一步的,对话能力中主要由语音识别、自然语言处理和语音合成三个主要部分组成,主要是语音识别模块实现用户输入语音到文字的识别转换,识别结果一般以得分最高的前n(n≥1)个句子形式输出,语言解析模块对语音识别结果进行分析理解,获得给定输入的内部表示,即把用户说的转成机器理解的语言,问题求解模块依据语言解析器的分析结果进行问题的推理或查询,求解用户问题的答案,即解决用户问题的模块,比如调用的百度搜索,对话管理模块是系统的核心,一个理想的对话管理器应该能够基于对话历史调度人机交互机制,辅助语言解析器对语音识别结果进行正确的理解,为问题求解提供帮助,并指导语言的生成过程。
进一步的,语音识别的对话管理机制是人机对话系统的中心枢纽,能够记录历史对话数据,通过训练能够给到用户更好的回答,语言生成模块根据解析模块得到的内部表示,在对话管理机制的作用下生成自然语言句子,把回答的机器语言再转换成口语语言语音合成模块将生成模块生成的句子转换成语音输出,把口语语言再转化成语音,其中包括以下几个组成部分。
进一步的,根据语义组块具体的意义,对语义组块进行了语义分类首先是统计解析过程,手工标注一定数量的语料,对于语料中的每一个句子,首先对它进行语义组块分析,得到该句子对应的组块序列,然后给出该句子的IF语义表示,最后把IF语义表示线性化并且和语义组块序列对齐。用这些语料来对模型的参数进行训练,就得到一个统计解析模型。
进一步的,语音处理还包括组块解释方法,在语义组块分析时,通过规则方法获得语义组块的同时,也可以得到语义组块内部的层次结构,但这种层次结构并不是我们所需要的IF表示,因此,我们设计了语义组块解释模块,用来把这种层次结构转换为IF表示,语义组块解释模块是与组块分析模块配合工作的,组块分析过程中用到的每一条规则都对应一个规则的解释方法,利用这些解释方法可以把规则所涉及的词汇解释为相应的IF表示,循环调用生成语义组块的每一条规则所对应的解释子程序,就可以得到该语义组块对应的IF层次表示。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种AI智能语音交互-话术一键添加和使用,其特征在于,包括以下具体设置流程:
步骤一、快速定制对话能力:
首先提供融合组合语义推导、语义匹配的对话理解技术,预置涵盖生活娱乐、设备控制等领域的可干预对话能力及50+场景的词典,助开发者高效定制对话能力;
步骤二、持续提升对话效果:
首先开源的对话管理、对话中控模块与云端复杂对话逻辑定制功能,帮助开发者深度的定制对话系统;支持多种接入方式,全方位满足各种应用场景中的需求;
步骤三、深度定制与灵活接入:
首先开源的对话管理、对话中控模块与云端复杂对话逻辑定制功能,帮助开发者深度的定制对话系统;支持多种接入方式,全方位满足各种应用场景中的需求;
步骤四、完善的服务生态:
首先开放对话系统架构师与训练师培训认证体系,支持平台能力共建,协同生态合作伙伴,共同提供对话系统自研、合作研发、托管研发等全方位的服务。
2.根据权利要求1所述的一种AI智能语音交互-话术一键添加和使用,其特征在于:具体流程还包括人工智能语音电话系统,在语音电话交流中自动理解客户意向,并做出最恰当的回应,智能代替人工的基本原理如下:即在呼入/呼出过程中,利用ASR+NLP技术引导用户说出需求,通过真人录制的声音模仿与客户进行多轮对话,将语音转化为文字,根据识别的文字准确判定客户意图并保存在平台数据库中,达到初步筛选意向客户的目的,同时通过录音等手段实现语音质检、用户信息大数据挖掘和分析的需求,人工智能语音交互系统是一位任劳任怨的话务员,全年无休每天可以拨打1000通以上电话的智能电话机器人,AI平台让企业管理者节省60%以上的成本,也让电销从业者提高150%以上的效。
3.根据权利要求1所述的一种AI智能语音交互-话术一键添加和使用,其特征在于:对话能力主要由语音识别、自然语言处理和语音合成三个主要部分组成,主要是语音识别模块实现用户输入语音到文字的识别转换,识别结果一般以得分最高的前n(n≥1)个句子形式输出,语言解析模块对语音识别结果进行分析理解,获得给定输入的内部表示,即把用户说的转成机器理解的语言,问题求解模块依据语言解析器的分析结果进行问题的推理或查询,求解用户问题的答案,即解决用户问题的模块,比如调用的百度搜索,对话管理模块是系统的核心,一个理想的对话管理器应该能够基于对话历史调度人机交互机制,辅助语言解析器对语音识别结果进行正确的理解,为问题求解提供帮助,并指导语言的生成过程。
4.根据权利要求3所述的一种AI智能语音交互-话术一键添加和使用,其特征在于:语音识别的对话管理机制是人机对话系统的中心枢纽,能够记录历史对话数据,通过训练能够给到用户更好的回答,语言生成模块根据解析模块得到的内部表示,在对话管理机制的作用下生成自然语言句子,把回答的机器语言再转换成口语语言语音合成模块将生成模块生成的句子转换成语音输出,把口语语言再转化成语音,其中包括以下几个组成部分。
5.根据权利要求1所述的一种AI智能语音交互-话术一键添加和使用,其特征在于:根据语义组块具体的意义,对语义组块进行了语义分类首先是统计解析过程,手工标注一定数量的语料,对于语料中的每一个句子,首先对它进行语义组块分析,得到该句子对应的组块序列,然后给出该句子的IF语义表示,最后把IF语义表示线性化并且和语义组块序列对齐。用这些语料来对模型的参数进行训练,就得到一个统计解析模型。
6.根据权利要求3所述的一种AI智能语音交互-话术一键添加和使用,其特征在于:语音处理还包括组块解释方法,在语义组块分析时,通过规则方法获得语义组块的同时,也可以得到语义组块内部的层次结构,但这种层次结构并不是我们所需要的IF表示,因此,我们设计了语义组块解释模块,用来把这种层次结构转换为IF表示,语义组块解释模块是与组块分析模块配合工作的,组块分析过程中用到的每一条规则都对应一个规则的解释方法,利用这些解释方法可以把规则所涉及的词汇解释为相应的IF表示,循环调用生成语义组块的每一条规则所对应的解释子程序,就可以得到该语义组块对应的IF层次表示。
CN201911209848.4A 2019-12-02 2019-12-02 一种ai智能语音交互-话术一键添加和使用 Pending CN112988985A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911209848.4A CN112988985A (zh) 2019-12-02 2019-12-02 一种ai智能语音交互-话术一键添加和使用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911209848.4A CN112988985A (zh) 2019-12-02 2019-12-02 一种ai智能语音交互-话术一键添加和使用

Publications (1)

Publication Number Publication Date
CN112988985A true CN112988985A (zh) 2021-06-18

Family

ID=76330923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911209848.4A Pending CN112988985A (zh) 2019-12-02 2019-12-02 一种ai智能语音交互-话术一键添加和使用

Country Status (1)

Country Link
CN (1) CN112988985A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113794808A (zh) * 2021-09-01 2021-12-14 北京亿心宜行汽车技术开发服务有限公司 代驾电话下单方法及系统
CN114722839A (zh) * 2022-06-01 2022-07-08 阿里巴巴达摩院(杭州)科技有限公司 人机协同对话交互系统及方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113794808A (zh) * 2021-09-01 2021-12-14 北京亿心宜行汽车技术开发服务有限公司 代驾电话下单方法及系统
CN113794808B (zh) * 2021-09-01 2024-01-30 北京亿心宜行汽车技术开发服务有限公司 代驾电话下单方法及系统
CN114722839A (zh) * 2022-06-01 2022-07-08 阿里巴巴达摩院(杭州)科技有限公司 人机协同对话交互系统及方法

Similar Documents

Publication Publication Date Title
CA2929018C (en) Natural expression processing method, processing and response method, device and system
CN111128126B (zh) 多语种智能语音对话的方法及系统
CN111489748A (zh) 一种调度智能语音辅助系统
CN111477216A (zh) 一种用于对话机器人的音意理解模型的训练方法及系统
CN103000052A (zh) 人机互动的口语对话系统及其实现方法
CN110991179A (zh) 基于电力专业术语的语义分析方法
CN109460459A (zh) 一种基于日志学习的对话系统自动优化方法
CN111429915A (zh) 一种基于语音识别的调度系统及调度方法
CN112988985A (zh) 一种ai智能语音交互-话术一键添加和使用
CN110321415A (zh) 一种电话套接式电话机器人系统
CN1714390B (zh) 语音识别设备和方法
CN117149977A (zh) 一种基于机器人流程自动化的智能催收机器人
CN115310429B (zh) 一种多轮倾听对话模型中的数据压缩与高性能计算方法
CN117056481A (zh) 基于大模型技术的云服务行业对话帮助系统及实现方法
CN111611407A (zh) 客服服务交互方法、装置、存储介质及设备
CN112506405B (zh) 一种基于互联网监管领域的人工智能语音大屏指挥方法
TWI722715B (zh) 智能語音助理之模組化系統及其運作方法
CN109147418A (zh) 一种分步引导式中文智慧学习方法、装置以及系统
CN116127946A (zh) 一种基于智能语音识别的电力调度安全监督方法及系统
CN115394290A (zh) 一种基于语音识别的日志生成方法
CN109582965B (zh) 语义分析引擎的分布式平台构架方法、系统
CN117690415B (zh) 音频描述信息生成方法、装置、电子设备及存储介质
CN117458708A (zh) 一种基于人机语音交互的电网智慧调度方法和系统
CN113889112A (zh) 一种基于kaldi的在线语音识别的方法
Chen et al. Power Speech Feature Output Model Based on Convolution Algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination