CN110473522B - 一种精确分析短语音片段的方法 - Google Patents

一种精确分析短语音片段的方法 Download PDF

Info

Publication number
CN110473522B
CN110473522B CN201910782768.1A CN201910782768A CN110473522B CN 110473522 B CN110473522 B CN 110473522B CN 201910782768 A CN201910782768 A CN 201910782768A CN 110473522 B CN110473522 B CN 110473522B
Authority
CN
China
Prior art keywords
voice
real
speech
segment
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910782768.1A
Other languages
English (en)
Other versions
CN110473522A (zh
Inventor
周继敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baikelu Beijing Technology Co ltd
Original Assignee
Baikelu Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baikelu Beijing Technology Co ltd filed Critical Baikelu Beijing Technology Co ltd
Priority to CN201910782768.1A priority Critical patent/CN110473522B/zh
Publication of CN110473522A publication Critical patent/CN110473522A/zh
Application granted granted Critical
Publication of CN110473522B publication Critical patent/CN110473522B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Abstract

本发明涉及一种精确分析短语音片段的方法。该方法包括:语音识别系统在通话过程中实时捕捉语音,并且自动记录通话信息;确定可预计的特别简短的回答的语音片段;在不影响实时通话的情况下,利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音,得到正确的文字;记录通过二次分析确定的正确语音文字,以便提高实时语音识别的准确性。本发明解决了如何实时语音识别语音片段中的单词的问题,使得用户能够准确地记录所需的语音信息,而不会中断电话交谈的流程。

Description

一种精确分析短语音片段的方法
技术领域
本发明涉及机器学习领域。更具体地说,本发明涉及一种精确分析短语音片段的方法。
背景技术
目前,语音识别是目前与人工智能相关的主要任务之一,特别是在用于电话通信的人工智能中,因为这种通信是纯语音的。语音识别技术在相当长的声音片段中能有效识别文字,准确率也较高;但由于缺乏上下文,在短的声音片段中很难进行识别和分析。在包括汉语和英语在内的许多语言中,同音异义词或发音相似的词的存在,进一步复杂化了对这些短片段中的单词的实时语音识别。
通过预先给这些简短的语音片段进行分类建模,并通过离线识别系统进行响应,这种方法使企业能够准确地记录所需的语音信息,而不会中断电话交谈的流程。
发明内容
本发明所要解决的技术问题是提供一种精确分析短语音片段的方法,解决了如何实时语音识别语音片段中的单词的问题,使得用户能够准确地记录所需的语音信息,而不会中断电话交谈的流程。
通过本发明可以实现的技术目的不限于上文已经特别描述的内容,并且本领域技术人员将从下面的详细描述中更加清楚地理解本文中未描述的其他技术目的。
本发明解决上述技术问题的技术方案如下:
根据本公开的一方面,本发明提供一种精确分析短语音片段的方法,所述方法包括语音识别系统在通话过程中实时捕捉语音,并且自动记录通话信息;确定可预计的特别简短的回答的语音片段;在不影响实时通话的情况下,利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音,得到正确的文字;记录通过二次分析确定的正确语音文字,以便提高实时语音识别的准确性。
可选地,在如上所述的方法中,所述可预计的特别简短的回答的语音片段包括客户服务的评分、客户是否满意、客户希望合约维持多久。
可选地,在如上所述的方法中,在自动呼叫中,根据会话语言规范,预测被呼方会对某些特定的片段作出简短的响应,确定所述片段,并且自动记录接收者的反应和持续的对话。
可选地,在如上所述的方法中,所述片段是通过机器学习模型处理的,所述机器学习模型通过Python分类程序进行训练,所述程序测试音频相似性,所记录的语音被分类有正确的标签,在不中断电话的情况下自动更正在电话中记录的最终数据。
上述技术方案仅为本发明实施例的一些部分,本领域技术人员从以下本发明的详细描述中可以导出和理解包含了本发明的技术特征的各种实施例。
本领域技术人员将会理解,通过本发明可以实现的效果不限于上文已经具体描述的内容,并且从以下详细说明中将更清楚地理解本发明的其他优点。
附图说明
被包括以提供对本发明的进一步理解的附图示出本发明的实施例,并且与说明书一起用于解释本发明的原理。
图1为本发明实施例提供的精确分析短语音片段的方法的流程图。
图2为本发明实施例提供的精确分析短语音片段的方法的示意图。
具体实施方式
现在将详细参考本发明的示例性实施例,其示例在附图中示出。下面将参考附图给出的详细描述旨在解释本发明的示例性实施例,而不是示出可以根据本发明实现的唯一实施例。以下详细描述包括具体细节以便提供对本发明的透彻理解。然而,对于本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下实践本发明。
在一些情况下,已知的结构和设备被省略或以框图形式示出,集中于结构和设备的重要特征,以免模糊本发明的概念。在整个说明书中将使用相同的附图标记来表示相同或相似的部分。
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
在本发明的描述中,需要理解的是,术语“上”、“下”、“中心”、“内”、“外”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
图1示出了本发明实施例提供的精确分析短语音片段的方法的流程图。如图1所示,本发明提供了一种精确分析短语音片段的方法,所述方法包括语音识别系统在通话过程中实时捕捉语音,并且自动记录通话信息;确定可预计的特别简短的回答的语音片段;在不影响实时通话的情况下,利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音,得到正确的文字;记录通过二次分析确定的正确语音文字,以便提高实时语音识别的准确性。可选地,在如上所述的方法中,所述可预计的特别简短的回答的语音片段包括客户服务的评分、客户是否满意、客户希望合约维持多久。可选地,在如上所述的方法中,在自动呼叫中,根据会话语言规范,预测被呼方会对某些特定的片段作出简短的响应,确定所述片段,并且自动记录接收者的反应和持续的对话。例如,当问了一个问题,例如“请对我们的服务进行打分,满分10分?”实时识别系统可能将“四分”误译为“十分”。然而,谈话没有中断。可选地,在如上所述的方法中,所述片段是通过机器学习模型处理的,所述机器学习模型通过Python分类程序进行训练,所述程序测试音频相似性,所记录的语音被分类有正确的标签,在不中断电话的情况下自动更正在电话中记录的最终数据。例如,将客户对问题的响应从“十分”更改为“四分”。
图2示出了本发明实施例提供的精确分析短语音片段的方法的示意图。如图2所示,精确分析短语音片段的方法如下:1.0在电话的整个通话过程中实时语音识别系统正在进行实时语音识别;2.0预先识别的短的片段被记录下来;3.0利用离线辅助识别系统对记录的短的片段进行分析;4.0准确的数据被记录下来;5.0这些数据有助于改进实时语音识别系统。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本申请可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
如上所述,已经给出了本发明的优选实施例的详细描述,以使本领域技术人员能够实施和实践本发明。虽然已经参照示例性实施例描述了本发明,但是本领域技术人员将会理解,在不脱离所附权利要求书中描述的本发明的精神或范围的情况下,可以在本发明中进行各种修改和改变。因此,本发明不应限于在此描述的特定实施例,而应被赋予与本文公开的原理和新颖特征一致的最宽范围。

Claims (4)

1.一种精确分析短语音片段的方法,其特征在于,所述方法包括:
语音识别系统在通话过程中实时捕捉语音,并且自动记录通话信息;
确定可预计的特别简短的回答的语音片段,对所述语音片段进行实时识别得到识别结果;
在不影响实时通话的情况下,利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音,得到正确的文字;
记录通过二次分析确定的正确语音文字,更正所述识别结果,以便提高实时语音识别的准确性。
2.根据权利要求1所述的方法,
其特征在于,所述可预计的特别简短的回答的语音片段包括客户服务的评分、客户是否满意、客户希望合约维持多久。
3.根据权利要求1所述的方法,
其特征在于,在自动呼叫中,根据会话语言规范,预测被呼方会对某些特定的片段作出简短的响应,确定所述回答的语音片段,并且自动记录接收者的反应和持续的对话。
4.根据权利要求3所述的方法,
其特征在于,所述片段是通过机器学习模型处理的,所述机器学习模型通过Python分类程序进行训练,所述程序测试音频相似性,所记录的语音被分类有正确的标签,在不中断电话的情况下自动更正在电话中记录的最终数据。
CN201910782768.1A 2019-08-23 2019-08-23 一种精确分析短语音片段的方法 Active CN110473522B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910782768.1A CN110473522B (zh) 2019-08-23 2019-08-23 一种精确分析短语音片段的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910782768.1A CN110473522B (zh) 2019-08-23 2019-08-23 一种精确分析短语音片段的方法

Publications (2)

Publication Number Publication Date
CN110473522A CN110473522A (zh) 2019-11-19
CN110473522B true CN110473522B (zh) 2021-11-09

Family

ID=68512132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910782768.1A Active CN110473522B (zh) 2019-08-23 2019-08-23 一种精确分析短语音片段的方法

Country Status (1)

Country Link
CN (1) CN110473522B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5677991A (en) * 1995-06-30 1997-10-14 Kurzweil Applied Intelligence, Inc. Speech recognition system using arbitration between continuous speech and isolated word modules
CN101573750A (zh) * 2006-12-22 2009-11-04 吉尼塞斯电信实验室公司 使用人类语音检测分析选择交互式语音响应模式的方法
CN103971676A (zh) * 2014-04-23 2014-08-06 上海师范大学 一种快速语音孤立词识别算法及其用途、语音识别系统
CN104899002A (zh) * 2015-05-29 2015-09-09 深圳市锐曼智能装备有限公司 机器人基于对话预测的在线与离线的识别切换方法及系统
CN106486119A (zh) * 2016-10-20 2017-03-08 海信集团有限公司 一种识别语音信息的方法和装置
CN108417211A (zh) * 2018-01-30 2018-08-17 东华大学 一种多功能语音识别控制器

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6122613A (en) * 1997-01-30 2000-09-19 Dragon Systems, Inc. Speech recognition using multiple recognizers (selectively) applied to the same input sample
CN101304457A (zh) * 2007-05-10 2008-11-12 许罗迈 一种基于语音电话实现自动口语训练的方法与装置
JP2018054790A (ja) * 2016-09-28 2018-04-05 トヨタ自動車株式会社 音声対話システムおよび音声対話方法
CN106448675B (zh) * 2016-10-21 2020-05-01 科大讯飞股份有限公司 识别文本修正方法及系统
US11011155B2 (en) * 2017-08-01 2021-05-18 Texas Instruments Incorporated Multi-phrase difference confidence scoring
CN107995360B (zh) * 2017-11-27 2020-08-25 Oppo广东移动通信有限公司 通话处理方法及相关产品

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5677991A (en) * 1995-06-30 1997-10-14 Kurzweil Applied Intelligence, Inc. Speech recognition system using arbitration between continuous speech and isolated word modules
CN101573750A (zh) * 2006-12-22 2009-11-04 吉尼塞斯电信实验室公司 使用人类语音检测分析选择交互式语音响应模式的方法
CN103971676A (zh) * 2014-04-23 2014-08-06 上海师范大学 一种快速语音孤立词识别算法及其用途、语音识别系统
CN104899002A (zh) * 2015-05-29 2015-09-09 深圳市锐曼智能装备有限公司 机器人基于对话预测的在线与离线的识别切换方法及系统
CN106486119A (zh) * 2016-10-20 2017-03-08 海信集团有限公司 一种识别语音信息的方法和装置
CN108417211A (zh) * 2018-01-30 2018-08-17 东华大学 一种多功能语音识别控制器

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Bangla Short Speech Commands Recognition Using Convolutional Neural Networks";Shakil Ahmed Sumon 等;《2018 International Conference on Bangla Speech and Language Processing 》;20181203;全文 *
"Word recognition from continuous articulatory movement time-series data using symbolic representations";Jun Wang;《4th Speech and Language Processing for Assistive Technologies》;20131230;全文 *
"基于声韵母建模基元凭借和整词识别的非特定人孤立词语音词语音识别系统的研究";李峰 等;《第七届全国人机语音通讯学术会议论文集》;20131130;全文 *

Also Published As

Publication number Publication date
CN110473522A (zh) 2019-11-19

Similar Documents

Publication Publication Date Title
CN112804400B (zh) 客服呼叫语音质检方法、装置、电子设备及存储介质
CN112492111B (zh) 一种智能语音外呼方法、装置、计算机设备和存储介质
EP2596492B1 (en) Efficiently reducing transcription error using hybrid voice transcription
US7907705B1 (en) Speech to text for assisted form completion
CN111026843A (zh) 一种人工智能语音外呼方法、系统及存储介质
CN110472224B (zh) 服务质量的检测方法、装置、计算机设备和存储介质
CN103458056A (zh) 自动外呼系统基于自动分类技术的语音意图判定方法
US20100246799A1 (en) Methods and apparatus for deep interaction analysis
US10972609B2 (en) Caller deflection and response system and method
US8005676B2 (en) Speech analysis using statistical learning
US20180113854A1 (en) System for automatic extraction of structure from spoken conversation using lexical and acoustic features
CN110381221B (zh) 呼叫处理方法、装置、系统、设备和计算机存储介质
CN111739519A (zh) 基于语音识别的对话管理处理方法、装置、设备及介质
CN112185358A (zh) 意图识别方法、模型的训练方法及其装置、设备、介质
CN109697243A (zh) 回铃音聚类分析方法、装置、介质和计算设备
US11706340B2 (en) Caller deflection and response system and method
CN111179936B (zh) 通话录音监控方法
CN110473522B (zh) 一种精确分析短语音片段的方法
CN113111157B (zh) 问答处理方法、装置、计算机设备和存储介质
US20230011434A1 (en) Customer care topic coverage determination and coaching
CN108717851A (zh) 一种语音识别方法及装置
CN114155845A (zh) 服务确定方法、装置、电子设备及存储介质
US20190141185A1 (en) Microphone monitoring and analytics
CN112148864B (zh) 语音交互方法、装置、计算机设备和存储介质
US11947872B1 (en) Natural language processing platform for automated event analysis, translation, and transcription verification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant