CN110473522A - 一种精确分析短语音片段的方法 - Google Patents

一种精确分析短语音片段的方法 Download PDF

Info

Publication number
CN110473522A
CN110473522A CN201910782768.1A CN201910782768A CN110473522A CN 110473522 A CN110473522 A CN 110473522A CN 201910782768 A CN201910782768 A CN 201910782768A CN 110473522 A CN110473522 A CN 110473522A
Authority
CN
China
Prior art keywords
sound bite
speech recognition
real
voice
present
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910782768.1A
Other languages
English (en)
Other versions
CN110473522B (zh
Inventor
周继敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baikelu (beijing) Technology Co Ltd
Original Assignee
Baikelu (beijing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baikelu (beijing) Technology Co Ltd filed Critical Baikelu (beijing) Technology Co Ltd
Priority to CN201910782768.1A priority Critical patent/CN110473522B/zh
Publication of CN110473522A publication Critical patent/CN110473522A/zh
Application granted granted Critical
Publication of CN110473522B publication Critical patent/CN110473522B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及一种精确分析短语音片段的方法。该方法包括:语音识别系统在通话过程中实时捕捉语音,并且自动记录通话信息;确定可预计的特别简短的回答的语音片段;在不影响实时通话的情况下,利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音,得到正确的文字;记录通过二次分析确定的正确语音文字,以便提高实时语音识别的准确性。本发明解决了如何实时语音识别语音片段中的单词的问题,使得用户能够准确地记录所需的语音信息,而不会中断电话交谈的流程。

Description

一种精确分析短语音片段的方法
技术领域
本发明涉及机器学习领域。更具体地说,本发明涉及一种精确分析短语音片段的方法。
背景技术
目前,语音识别是目前与人工智能相关的主要任务之一,特别是在用于电话通信的人工智能中,因为这种通信是纯语音的。语音识别技术在相当长的声音片段中能有效识别文字,准确率也较高;但由于缺乏上下文,在短的声音片段中很难进行识别和分析。在包括汉语和英语在内的许多语言中,同音异义词或发音相似的词的存在,进一步复杂化了对这些短片段中的单词的实时语音识别。
通过预先给这些简短的语音片段进行分类建模,并通过离线识别系统进行响应,这种方法使企业能够准确地记录所需的语音信息,而不会中断电话交谈的流程。
发明内容
本发明所要解决的技术问题是提供一种精确分析短语音片段的方法,解决了如何实时语音识别语音片段中的单词的问题,使得用户能够准确地记录所需的语音信息,而不会中断电话交谈的流程。
通过本发明可以实现的技术目的不限于上文已经特别描述的内容,并且本领域技术人员将从下面的详细描述中更加清楚地理解本文中未描述的其他技术目的。
本发明解决上述技术问题的技术方案如下:
根据本公开的一方面,本发明提供一种精确分析短语音片段的方法,所述方法包括语音识别系统在通话过程中实时捕捉语音,并且自动记录通话信息;确定可预计的特别简短的回答的语音片段;在不影响实时通话的情况下,利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音,得到正确的文字;记录通过二次分析确定的正确语音文字,以便提高实时语音识别的准确性。
可选地,在如上所述的方法中,所述可预计的特别简短的回答的语音片段包括客户服务的评分、客户是否满意、客户希望合约维持多久。
可选地,在如上所述的方法中,在自动呼叫中,根据会话语言规范,预测被呼方会对某些特定的片段作出简短的响应,确定所述片段,并且自动记录接收者的反应和持续的对话。
可选地,在如上所述的方法中,所述片段是通过机器学习模型处理的,所述机器学习模型通过Python分类程序进行训练,所述程序测试音频相似性,所记录的语音被分类有正确的标签,在不中断电话的情况下自动更正在电话中记录的最终数据。
上述技术方案仅为本发明实施例的一些部分,本领域技术人员从以下本发明的详细描述中可以导出和理解包含了本发明的技术特征的各种实施例。
本领域技术人员将会理解,通过本发明可以实现的效果不限于上文已经具体描述的内容,并且从以下详细说明中将更清楚地理解本发明的其他优点。
附图说明
被包括以提供对本发明的进一步理解的附图示出本发明的实施例,并且与说明书一起用于解释本发明的原理。
图1为本发明实施例提供的精确分析短语音片段的方法的流程图。
图2为本发明实施例提供的精确分析短语音片段的方法的示意图。
具体实施方式
现在将详细参考本发明的示例性实施例,其示例在附图中示出。下面将参考附图给出的详细描述旨在解释本发明的示例性实施例,而不是示出可以根据本发明实现的唯一实施例。以下详细描述包括具体细节以便提供对本发明的透彻理解。然而,对于本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下实践本发明。
在一些情况下,已知的结构和设备被省略或以框图形式示出,集中于结构和设备的重要特征,以免模糊本发明的概念。在整个说明书中将使用相同的附图标记来表示相同或相似的部分。
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
在本发明的描述中,需要理解的是,术语“上”、“下”、“中心”、“内”、“外”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
图1示出了本发明实施例提供的精确分析短语音片段的方法的流程图。如图1所示,本发明提供了一种精确分析短语音片段的方法,所述方法包括语音识别系统在通话过程中实时捕捉语音,并且自动记录通话信息;确定可预计的特别简短的回答的语音片段;在不影响实时通话的情况下,利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音,得到正确的文字;记录通过二次分析确定的正确语音文字,以便提高实时语音识别的准确性。可选地,在如上所述的方法中,所述可预计的特别简短的回答的语音片段包括客户服务的评分、客户是否满意、客户希望合约维持多久。可选地,在如上所述的方法中,在自动呼叫中,根据会话语言规范,预测被呼方会对某些特定的片段作出简短的响应,确定所述片段,并且自动记录接收者的反应和持续的对话。例如,当问了一个问题,例如“请对我们的服务进行打分,满分10分?”实时识别系统可能将“四分”误译为“十分”。然而,谈话没有中断。可选地,在如上所述的方法中,所述片段是通过机器学习模型处理的,所述机器学习模型通过Python分类程序进行训练,所述程序测试音频相似性,所记录的语音被分类有正确的标签,在不中断电话的情况下自动更正在电话中记录的最终数据。例如,将客户对问题的响应从“十分”更改为“四分”。
图2示出了本发明实施例提供的精确分析短语音片段的方法的示意图。如图2所示,精确分析短语音片段的方法如下:1.0在电话的整个通话过程中实时语音识别系统正在进行实时语音识别;2.0预先识别的短的片段被记录下来;3.0利用离线辅助识别系统对记录的短的片段进行分析;4.0准确的数据被记录下来;5.0这些数据有助于改进实时语音识别系统。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本申请可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
如上所述,已经给出了本发明的优选实施例的详细描述,以使本领域技术人员能够实施和实践本发明。虽然已经参照示例性实施例描述了本发明,但是本领域技术人员将会理解,在不脱离所附权利要求书中描述的本发明的精神或范围的情况下,可以在本发明中进行各种修改和改变。因此,本发明不应限于在此描述的特定实施例,而应被赋予与本文公开的原理和新颖特征一致的最宽范围。

Claims (4)

1.一种精确分析短语音片段的方法,其特征在于,所述方法包括:
语音识别系统在通话过程中实时捕捉语音,并且自动记录通话信息;
确定可预计的特别简短的回答的语音片段;
在不影响实时通话的情况下,利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音,得到正确的文字;
记录通过二次分析确定的正确语音文字,以便提高实时语音识别的准确性。
2.根据权利要求1所述的方法,
其特征在于,所述可预计的特别简短的回答的语音片段包括客户服务的评分、客户是否满意、客户希望合约维持多久。
3.根据权利要求1所述的方法,
其特征在于,在自动呼叫中,根据会话语言规范,预测被呼方会对某些特定的片段作出简短的响应,确定所述片段,并且自动记录接收者的反应和持续的对话。
4.根据权利要求3所述的方法,
其特征在于,所述片段是通过机器学习模型处理的,所述机器学习模型通过Python分类程序进行训练,所述程序测试音频相似性,所记录的语音被分类有正确的标签,在不中断电话的情况下自动更正在电话中记录的最终数据。
CN201910782768.1A 2019-08-23 2019-08-23 一种精确分析短语音片段的方法 Active CN110473522B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910782768.1A CN110473522B (zh) 2019-08-23 2019-08-23 一种精确分析短语音片段的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910782768.1A CN110473522B (zh) 2019-08-23 2019-08-23 一种精确分析短语音片段的方法

Publications (2)

Publication Number Publication Date
CN110473522A true CN110473522A (zh) 2019-11-19
CN110473522B CN110473522B (zh) 2021-11-09

Family

ID=68512132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910782768.1A Active CN110473522B (zh) 2019-08-23 2019-08-23 一种精确分析短语音片段的方法

Country Status (1)

Country Link
CN (1) CN110473522B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5677991A (en) * 1995-06-30 1997-10-14 Kurzweil Applied Intelligence, Inc. Speech recognition system using arbitration between continuous speech and isolated word modules
US6122613A (en) * 1997-01-30 2000-09-19 Dragon Systems, Inc. Speech recognition using multiple recognizers (selectively) applied to the same input sample
CN101304457A (zh) * 2007-05-10 2008-11-12 许罗迈 一种基于语音电话实现自动口语训练的方法与装置
CN101573750A (zh) * 2006-12-22 2009-11-04 吉尼塞斯电信实验室公司 使用人类语音检测分析选择交互式语音响应模式的方法
CN103971676A (zh) * 2014-04-23 2014-08-06 上海师范大学 一种快速语音孤立词识别算法及其用途、语音识别系统
CN104899002A (zh) * 2015-05-29 2015-09-09 深圳市锐曼智能装备有限公司 机器人基于对话预测的在线与离线的识别切换方法及系统
CN106448675A (zh) * 2016-10-21 2017-02-22 科大讯飞股份有限公司 识别文本修正方法及系统
CN106486119A (zh) * 2016-10-20 2017-03-08 海信集团有限公司 一种识别语音信息的方法和装置
CN107871502A (zh) * 2016-09-28 2018-04-03 丰田自动车株式会社 语音对话系统以及语音对话方法
CN107995360A (zh) * 2017-11-27 2018-05-04 广东欧珀移动通信有限公司 通话处理方法及相关产品
CN108417211A (zh) * 2018-01-30 2018-08-17 东华大学 一种多功能语音识别控制器
US20190043478A1 (en) * 2017-08-01 2019-02-07 Texas Instruments Incorporated Multi-phrase difference confidence scoring

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5677991A (en) * 1995-06-30 1997-10-14 Kurzweil Applied Intelligence, Inc. Speech recognition system using arbitration between continuous speech and isolated word modules
US6122613A (en) * 1997-01-30 2000-09-19 Dragon Systems, Inc. Speech recognition using multiple recognizers (selectively) applied to the same input sample
CN101573750A (zh) * 2006-12-22 2009-11-04 吉尼塞斯电信实验室公司 使用人类语音检测分析选择交互式语音响应模式的方法
CN101304457A (zh) * 2007-05-10 2008-11-12 许罗迈 一种基于语音电话实现自动口语训练的方法与装置
CN103971676A (zh) * 2014-04-23 2014-08-06 上海师范大学 一种快速语音孤立词识别算法及其用途、语音识别系统
CN104899002A (zh) * 2015-05-29 2015-09-09 深圳市锐曼智能装备有限公司 机器人基于对话预测的在线与离线的识别切换方法及系统
CN107871502A (zh) * 2016-09-28 2018-04-03 丰田自动车株式会社 语音对话系统以及语音对话方法
CN106486119A (zh) * 2016-10-20 2017-03-08 海信集团有限公司 一种识别语音信息的方法和装置
CN106448675A (zh) * 2016-10-21 2017-02-22 科大讯飞股份有限公司 识别文本修正方法及系统
US20190043478A1 (en) * 2017-08-01 2019-02-07 Texas Instruments Incorporated Multi-phrase difference confidence scoring
CN107995360A (zh) * 2017-11-27 2018-05-04 广东欧珀移动通信有限公司 通话处理方法及相关产品
CN108417211A (zh) * 2018-01-30 2018-08-17 东华大学 一种多功能语音识别控制器

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JUN WANG: ""Word recognition from continuous articulatory movement time-series data using symbolic representations"", 《4TH SPEECH AND LANGUAGE PROCESSING FOR ASSISTIVE TECHNOLOGIES》 *
SHAKIL AHMED SUMON 等: ""Bangla Short Speech Commands Recognition Using Convolutional Neural Networks"", 《2018 INTERNATIONAL CONFERENCE ON BANGLA SPEECH AND LANGUAGE PROCESSING 》 *
李峰 等: ""基于声韵母建模基元凭借和整词识别的非特定人孤立词语音词语音识别系统的研究"", 《第七届全国人机语音通讯学术会议论文集》 *

Also Published As

Publication number Publication date
CN110473522B (zh) 2021-11-09

Similar Documents

Publication Publication Date Title
US11706339B2 (en) System and method for communication analysis for use with agent assist within a cloud-based contact center
US10592611B2 (en) System for automatic extraction of structure from spoken conversation using lexical and acoustic features
KR102431754B1 (ko) 인공지능기반 상담지원장치
US20150262574A1 (en) Expression classification device, expression classification method, dissatisfaction detection device, dissatisfaction detection method, and medium
KR20190011570A (ko) 휴먼 에이전트에 의하여 보조 되는 무인 대화 서비스 제공 방법
CN111739519A (zh) 基于语音识别的对话管理处理方法、装置、设备及介质
KR102241532B1 (ko) 지능형 콜봇 서버 및 이를 이용한 무인 상담 방법
US20210136195A1 (en) Methods and systems for virtual agent to understand and detect spammers, fraud calls, and auto dialers
US20210136208A1 (en) Methods and systems for virtual agent to understand and detect spammers, fraud calls, and auto dialers
US10068567B1 (en) System, method, and computer program for automatic management of intent classification
CN112150694A (zh) 一种智能语音电费催缴系统及方法
CN110473522A (zh) 一种精确分析短语音片段的方法
WO2023090380A1 (ja) プログラム、情報処理システム及び情報処理方法
CN114328867A (zh) 一种人机对话中智能打断的方法及装置
KR20190085399A (ko) 전화 신고의 진위 여부를 판단하기 위한 발화 특징 분석 방법 및 장치
WO2023090379A1 (ja) プログラム、情報処理システム及び情報処理方法
Pandharipande et al. A language independent approach to identify problematic conversations in call centers
CN111866258A (zh) 电话号码标记方法、装置、终端及存储介质
CN117057813A (zh) 一种客服辅助方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant