CN109036429A - 一种基于云服务的语音匹配评分查询方法及系统 - Google Patents

一种基于云服务的语音匹配评分查询方法及系统 Download PDF

Info

Publication number
CN109036429A
CN109036429A CN201810827171.XA CN201810827171A CN109036429A CN 109036429 A CN109036429 A CN 109036429A CN 201810827171 A CN201810827171 A CN 201810827171A CN 109036429 A CN109036429 A CN 109036429A
Authority
CN
China
Prior art keywords
voice
cloud service
layer
data
checked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810827171.XA
Other languages
English (en)
Inventor
潘景基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Langchao Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Langchao Electronic Information Industry Co Ltd filed Critical Langchao Electronic Information Industry Co Ltd
Priority to CN201810827171.XA priority Critical patent/CN109036429A/zh
Publication of CN109036429A publication Critical patent/CN109036429A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开提供了一种基于云服务的语音匹配评分查询方法及系统,包括以下步骤:采集语音,将语音传送给云服务层;在云服务层分析各语音的声学特征参数并存储形成数据库;将待查询的语音在应用层输入;在云服务层分析待查询的语音的声学特征参数,并与数据库中的声学特征参数对比;根据预设的打分原则形成匹配打分表;将匹配打分表传送至应用层显示。本发明采用基于云服务的匹配打分制,结合线性预测倒谱系数LPCC打分,有效率大大增加,对输入的有效语音识别率高,抗干扰性好。

Description

一种基于云服务的语音匹配评分查询方法及系统
技术领域
本发明涉及云服务技术领域,更具体的说是涉及一种基于云服务的语音匹配评分查询方法及系统。
背景技术
云服务是基于互联网的相关服务的增加、使用和交互模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。云服务指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT和软件、互联网相关,也可是其他服务。它意味着计算能力也可作为一种商品通过互联网进行流通。
缺乏足够计算功率(computingpower)处理复杂任务是许多消费电子装置所面临的问题,其中,消费电子装置可例如智能电视(smart television)、平板计算机(tabletcomputer)及智能手机等。幸运地是,云计算(cloudcomputation)的概念已逐步地减轻了此固有限制。具体地,云计算概念允许消费电子装置作为客户端(client)进行工作并将复杂任务分配给云端的远程服务器(remoteserver)。例如语音识别(speechrecognition)便是这种可分配任务。
语音识别技术从应用角度上通常分为两类:一类是特定人语音识别,一类是非特定人语音识别。特定人语音识别技术是针对一个特定的人的识别技术,简单说就是只识别一个人的声音,不适用于更广泛的群体;而非特定人识别技术恰恰相反,可以满足不同人的语音识别要求,适合广泛人群应用。目前的语音识别抗干扰性差,容易出现语音识别系统反应迟钝、识别率低的问题,适用性不强。
发明内容
针对以上问题,本发明的目的在于提供一种基于云服务的语音匹配评分查询方法及系统,该方法及其系统对输入的有效语音识别率高,抗干扰性好,适用性强。
本发明为实现上述目的,通过以下技术方案实现:一种基于云服务的语音匹配评分查询方法,包括如下步骤:
步骤1:采集语音,将语音传送给云服务层;
步骤2:在云服务层分析各语音的声学特征参数并存储形成数据库;
步骤3:将待查询的语音在应用层输入;
步骤4:在云服务层分析待查询的语音的声学特征参数,并与数据库中的声学特征参数对比;
步骤5:根据预设的打分原则形成匹配打分表;
步骤6:将匹配打分表传送至应用层显示。
进一步,所述的声学特征参数包括信噪比和线性预测倒谱系数LPCC。
进一步,所述预设的打分原则包括:将待查询的语音的信噪比和线性预测倒谱系数带入LPCC模型,根据模式匹配率计算相似性度量。
另外,基于上述方法,本发明还提供了一种基于云服务的语音匹配评分查询系统,包括:语音数据搜集层、云服务层和应用层;
所述语音数据搜集层用于采集语音数据发送给所述云服务层;
所述云服务层用于接收到所采集的语音数据后,基于要提取的语音声学特征参数分析各语音数据并存储分析结果形成数据库;
所述应用层,用于输入待查询的语音信息并从所述云服务层获取匹配打分表。
进一步,所述云服务层还用于接收到应用层的查询语音数据后,分析语音数据对应的语音声学特征参数并与数据库中的相应数据对比,按照设定的打分原则形成匹配打分表。
进一步,所述的语音数据搜集层包括:
录音模块,用于采集语音,并将所采集的语音生成语音信息;
第一通信模块,用于将语音信息传输给云服务层。
进一步,所述云服务层包括:
语音识别模块,用于提取各语音信息的声学特征参数;
数据处理模块,用于对比语音数据搜集层的语音信息与待查询语音信息的声学特征参数;
数据存储模块,用于存储语音识别模块、数据处理模块的数据;
匹配打分表生成模块,用于将数据对比的结果基于预设的打分原则形成匹配打分表;
第二通信模块,用于将待查询的语音信息和查询结果传输给所述应用层。
进一步,所述应用层包括:
查询输入模块,用于输入待查询的语音信息;
呈现模块,用于显示匹配打分表。
对比现有技术,本发明有益效果在于:本发明提出的一种基于云服务的语音匹配评分查询方法,通过云服务层分析各语音的声学特征参数并存储形成数据库,充分利用了云服务存储规模大、计算能力强、可靠性高的优点,采用基于云服务的匹配打分制,具有通用性强的优点;通过信噪比结合线性预测倒谱系数LPCC打分,有效率大大增加,结果真实可靠;对输入的有效语音识别率高,抗干扰性好。此外,本发明还提供了基于云服务的语音匹配评分查询系统,有益效果如上所述。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
附图1是本发明的方法流程图。
附图2是本发明的系统结构图。
具体实施方式
下面结合附图对本发明的具体实施方式做出说明。
如图1所示的一种基于云服务的语音匹配评分查询方法,包括如下步骤:
步骤1:采集语音,将语音传送给云服务层;
步骤2:在云服务层分析各语音的声学特征参数并存储形成数据库;
步骤3:将待查询的语音在应用层输入;
步骤4:在云服务层分析待查询的语音的声学特征参数,并与数据库中的声学特征参数对比;
步骤5:根据预设的打分原则形成匹配打分表;
步骤6:将匹配打分表传送至应用层显示。
另外,所述的声学特征参数包括信噪比和线性预测倒谱系数LPCC。所述预设的打分原则包括:将待查询的语音的信噪比和线性预测倒谱系数带入LPCC模型,根据模式匹配率计算相似性度量。
图2为本发明提供的一种基于云服务的语音匹配评分查询系统的结构示意图。本发明提供的基于云服务的语音匹配评分查询系统,包括:语音数据搜集层、云服务层和应用层。
在上述基础上,所述的语音数据搜集层包括:
录音模块,用于采集语音,并将所采集的语音生成语音信息;
第一通信模块,用于将语音信息传输给云服务层。
所述云服务层包括:
语音识别模块,用于提取各语音信息的声学特征参数;
数据处理模块,用于对比语音数据搜集层的语音信息与待查询语音信息的声学特征参数;
数据存储模块,用于存储语音识别模块、数据处理模块的数据;
匹配打分表生成模块,用于将数据对比的结果基于预设的打分原则形成匹配打分表;
第二通信模块,用于将待查询的语音信息和查询结果传输给所述应用层。
所述应用层包括:
查询输入模块,用于输入待查询的语音信息;
呈现模块,用于显示匹配打分表。
按照上述实施方式应用本发明后,对提取的LPCC特征参数不同信噪比(SNR)下的识别率见表1。
SNR(dB) 15 20 25 30
LPCC 26.5% 54% 75.0% 72.9%
表1
由此可见,本发明提供的基于云服务的语音匹配评分查询方法和系统,采用基于云服务的匹配打分制,结合线性预测倒谱系数LPCC打分,有效率大大增加,对输入的有效语音识别率高,抗干扰性好。
结合附图和具体实施例,对本发明作进一步说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所限定的范围。

Claims (8)

1.一种基于云服务的语音匹配评分查询方法,其特征在于,包括如下步骤:
步骤1:采集语音,将语音传送给云服务层;
步骤2:在云服务层分析各语音的声学特征参数并存储形成数据库;
步骤3:将待查询的语音在应用层输入;
步骤4:在云服务层分析待查询的语音的声学特征参数,并与数据库中的声学特征参数对比;
步骤5:根据预设的打分原则形成匹配打分表;
步骤6:将匹配打分表传送至应用层显示。
2.根据权利要求1所述的基于云服务的语音匹配评分查询方法,其特征在于:
所述的声学特征参数包括信噪比和线性预测倒谱系数LPCC。
3.根据权利要求2所述的基于云服务的语音匹配评分查询方法,其特征在于,所述预设的打分原则包括:将待查询的语音的信噪比和线性预测倒谱系数带入LPCC模型,根据模式匹配率计算相似性度量。
4.一种基于云服务的语音匹配评分查询系统,其特征在于,包括:语音数据搜集层、云服务层和应用层;
所述语音数据搜集层用于采集语音数据发送给所述云服务层;
所述云服务层用于接收到所采集的语音数据后,基于要提取的语音声学特征参数分析各语音数据并存储分析结果形成数据库;
所述应用层,用于输入待查询的语音信息并从所述云服务层获取匹配打分表。
5.根据权利要求4所述的基于云服务的语音匹配评分查询系统,其特征在于:所述云服务层还用于接收到应用层的查询语音数据后,分析语音数据对应的语音声学特征参数并与数据库中的相应数据对比,按照设定的打分原则形成匹配打分表。
6.根据权利要求5所述的基于云服务的语音匹配评分查询系统,其特征在于,所述的语音数据搜集层包括:
录音模块,用于采集语音,并将所采集的语音生成语音信息;
第一通信模块,用于将语音信息传输给云服务层。
7.根据权利要求5所述的基于云服务的语音匹配评分查询系统,其特征在于,所述云服务层包括:
语音识别模块,用于提取各语音信息的声学特征参数;
数据处理模块,用于对比语音数据搜集层的语音信息与待查询语音信息的声学特征参数;
数据存储模块,用于存储语音识别模块、数据处理模块的数据;
匹配打分表生成模块,用于将数据对比的结果基于预设的打分原则形成匹配打分表;
第二通信模块,用于将待查询的语音信息和查询结果传输给所述应用层。
8.根据权利要求5所述的基于云服务的语音匹配评分查询系统,其特征在于,所述应用层包括:
查询输入模块,用于输入待查询的语音信息;
呈现模块,用于显示匹配打分表。
CN201810827171.XA 2018-07-25 2018-07-25 一种基于云服务的语音匹配评分查询方法及系统 Pending CN109036429A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810827171.XA CN109036429A (zh) 2018-07-25 2018-07-25 一种基于云服务的语音匹配评分查询方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810827171.XA CN109036429A (zh) 2018-07-25 2018-07-25 一种基于云服务的语音匹配评分查询方法及系统

Publications (1)

Publication Number Publication Date
CN109036429A true CN109036429A (zh) 2018-12-18

Family

ID=64646069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810827171.XA Pending CN109036429A (zh) 2018-07-25 2018-07-25 一种基于云服务的语音匹配评分查询方法及系统

Country Status (1)

Country Link
CN (1) CN109036429A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102354495A (zh) * 2011-08-31 2012-02-15 中国科学院自动化研究所 半开放式口语试题的测试方法及系统
CN102436815A (zh) * 2011-09-13 2012-05-02 东南大学 一种应用于英语口语网络机考系统的语音识别装置
CN103137129A (zh) * 2011-12-02 2013-06-05 联发科技股份有限公司 语音识别方法及电子装置
CN103413550A (zh) * 2013-08-30 2013-11-27 苏州跨界软件科技有限公司 一种人机交互式语言学习系统和方法
CN103761975A (zh) * 2014-01-07 2014-04-30 苏州思必驰信息科技有限公司 一种口语评测方法及装置
CN103928023A (zh) * 2014-04-29 2014-07-16 广东外语外贸大学 一种语音评分方法及系统
CN107067834A (zh) * 2017-03-17 2017-08-18 麦片科技(深圳)有限公司 具有口语评测功能的点读系统
CN107862021A (zh) * 2017-10-31 2018-03-30 广东小天才科技有限公司 一种基于智能麦克风设备的学习方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102354495A (zh) * 2011-08-31 2012-02-15 中国科学院自动化研究所 半开放式口语试题的测试方法及系统
CN102436815A (zh) * 2011-09-13 2012-05-02 东南大学 一种应用于英语口语网络机考系统的语音识别装置
CN103137129A (zh) * 2011-12-02 2013-06-05 联发科技股份有限公司 语音识别方法及电子装置
CN103413550A (zh) * 2013-08-30 2013-11-27 苏州跨界软件科技有限公司 一种人机交互式语言学习系统和方法
CN103761975A (zh) * 2014-01-07 2014-04-30 苏州思必驰信息科技有限公司 一种口语评测方法及装置
CN103928023A (zh) * 2014-04-29 2014-07-16 广东外语外贸大学 一种语音评分方法及系统
CN107067834A (zh) * 2017-03-17 2017-08-18 麦片科技(深圳)有限公司 具有口语评测功能的点读系统
CN107862021A (zh) * 2017-10-31 2018-03-30 广东小天才科技有限公司 一种基于智能麦克风设备的学习方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
于明 等: "一种基于MFCC和LPCC的文本相关说话人识别方法", 《计算机应用》 *
余建潮 等: "基于MFCC和LPCC的说话人识别", 《计算机工程与设计》 *
李泽 等: "MFCC和LPCC特征参数在说话人识别中的研究", 《河南工程学院学报(自然科学版)》 *

Similar Documents

Publication Publication Date Title
CN107492379B (zh) 一种声纹创建与注册方法及装置
CN103137129B (zh) 语音识别方法及电子装置
WO2020211354A1 (zh) 基于说话内容的说话者身份识别方法、装置及存储介质
CN107886949A (zh) 一种内容推荐方法及装置
KR20180104595A (ko) 성문 식별 방법, 장치, 저장 매체 및 백스테이지 서버
CN105244031A (zh) 说话人识别方法和装置
WO2021159902A1 (zh) 年龄识别方法、装置、设备及计算机可读存储介质
CN103458056A (zh) 自动外呼系统基于自动分类技术的语音意图判定方法
CN110489527A (zh) 基于语音交互的银行业务智能咨询以及办理方法和系统
CN101662549A (zh) 一种基于语音的客户评价系统及客户评价方法
WO2018000271A1 (zh) 一种基于用户画像的意图场景识别方法及系统
CN109063624A (zh) 信息处理方法、系统、电子设备和计算机可读存储介质
Savchenko Itakura–Saito divergence as an element of the information theory of speech perception
CN104347071B (zh) 生成口语考试参考答案的方法及系统
CN115643341A (zh) 人工智能客服应答系统
WO2024060951A1 (zh) 一种业务服务方法及装置
CN107196979A (zh) 基于语音识别的叫号预提醒系统
CN112183417B (zh) 一种置业顾问服务能力评价系统及方法
CN112131365A (zh) 一种数据处理方法、装置、设备及介质
CN109036429A (zh) 一种基于云服务的语音匹配评分查询方法及系统
CN108962281B (zh) 一种语言表达的评价和辅助方法及装置
CN113573029B (zh) 一种基于iot的多方音视频交互方法及系统
CN112992155B (zh) 一种基于残差神经网络的远场语音说话人识别方法及装置
CN114974255A (zh) 基于酒店场景的声纹识别方法、系统、设备及存储介质
CN112381989A (zh) 排序方法、装置、系统和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218

RJ01 Rejection of invention patent application after publication