CN106328125A - 一种河南方言语音识别系统 - Google Patents

一种河南方言语音识别系统 Download PDF

Info

Publication number
CN106328125A
CN106328125A CN201610968693.2A CN201610968693A CN106328125A CN 106328125 A CN106328125 A CN 106328125A CN 201610968693 A CN201610968693 A CN 201610968693A CN 106328125 A CN106328125 A CN 106328125A
Authority
CN
China
Prior art keywords
voice
dialect
unit
speech
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610968693.2A
Other languages
English (en)
Other versions
CN106328125B (zh
Inventor
范雪莉
于海龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xuchang University
Original Assignee
Xuchang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xuchang University filed Critical Xuchang University
Priority to CN201610968693.2A priority Critical patent/CN106328125B/zh
Publication of CN106328125A publication Critical patent/CN106328125A/zh
Application granted granted Critical
Publication of CN106328125B publication Critical patent/CN106328125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Telephonic Communication Services (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种河南方言语音识别系统,包括语音获取设备、语音识别设备及语音判定设备,语音获取设备接收用户输入河南方言的语音指令;语音识别设备包括语音提取单元和特征压缩单元,语音提取单元根据收到的语音指令提取河南方言的短时音频特征,特征压缩单元根据提取的过零率、基频和美尔倒谱系数特征从语音指令中找出相互间相似度满足预设条件的音频帧特征,语音判定设备包括语音判定部分和语音输出部分,语音判定部分利用隐马尔科夫模型从音频帧特征中选择一个或多个最优候选识别特征,并输至语音输出部分,采用上述方案,本发明提出的河南方言语音识别系统提高了运行效率和识别效果,具有很好的市场应用价值。

Description

一种河南方言语音识别系统
技术领域
本发明涉及语音识别领域,尤其涉及的是,一种河南方言语音识别系统。
背景技术
语音是人人交互中最常见的方式,也是最直接和最有效的方式之一。在现代社会,计算机的出现与普及使得人类的生活状态发生改变,人们越来越习惯借助计算机完成各种日常事务。我们希望和机器交流时就像和人类交流一样的便捷,计算机不仅能够“听见”人类的语音,并且能够“听懂”语音的意思。让计算机听懂语音的人机交互方式就是语音识别。
我国幅员辽阔,人口众多,各个地区都有自己的方言。方言与普通话之间、方言与方言之间声调、发音等方式差异很大。要求每个地区的人都说一口流利的普通话是不现实的,而且,国家在推广普通话的同时也在加大保护方言的力度。无论是现在还是未来,方言的交流都是必不可少的。因此针对方言的语音识别系统的研究是非常有必要,而且有较高的实用价值。目前国内的语音识别产品基本上都是识别普通话,但是河南方言与普通话差异很大。因此,现有技术存在缺陷,需要改进。
发明内容
本发明所要解决的技术问题是提供一种新型的河南方言语音识别系统。
为实现上述目的,本发明所采用了下述的技术方案:一种河南方言语音识别系统,包括语音获取设备、语音识别设备及语音判定设备,所述语音获取设备接收用户输入河南方言的语音指令,并将收到的语音指令传输至所述语音识别设备;
所述语音识别设备包括语音提取单元和特征压缩单元,所述语音提取单元根据收到的语音指令提取河南方言的短时音频特征,从短时音频特征提取过零率、基频和美尔倒谱系数特征;所述特征压缩单元根据提取的过零率、基频和美尔倒谱系数特征从语音指令中找出相互间相似度满足预设条件的音频帧特征,并将找出的音频帧特征传输至所述语音判定设备;
所述语音判定设备包括语音判定部分和语音输出部分,所述语音判定部分利用隐马尔科夫模型从音频帧特征中选择一个或多个最优候选识别特征,并将一个或多个最优候选识别特征传输至语音输出部分,由语音输出部分将一个或多个最优候选识别特征输出;
所述语音获取设备包括语音获取单元和噪声过滤单元,所述语音获取单元采集环境数据,接收用户输入的河南方言的语音指令;由噪声过滤单元将语音获取单元采集的语音指令消除噪声后,将无噪音频信号发送至语音识别设备。
优选的,所述的河南方言语音识别系统中,所述语音判定设备的语音判定部分包括语音判定单元、模型训练单元和对比单元,所述模型训练单元预先训练语音判定单元,所述模型训练单元预先对语音信号的特征参数进行提取,通过隐马尔科夫模型对所提取的语音信号特征参数进行模型训练,建立语音信号的数据库;
所述语音判定单元将经过隐马尔科夫训练的音频帧特征参数与数据库匹配,由对比单元进行比较,最终得到一个或多个最优候选识别特征。
优选的,所述的河南方言语音识别系统中,所述语音识别设备还包括方言语种识别部分,所述方言语种识别部分包括方言语音提取单元、音素识别单元、对比单元和方言语种模型训练单元,通过方言语种模型训练单元对区域方言语音信号特征参数进行模型训练,建立区域方言语种数据库;
所述方言语音提取单元根据收到的语音指令提取河南方言的短时声学特征;所述音素识别单元从短时声学特征获得音素序列;所述对比单元根据获得的音素序列和区域方言语种数据库的参数信息对比,找出满足预设条件的方言种类。
优选的,所述的河南方言语音识别系统中,所述语音获取单元包括至少两个拾音头,至少两个拾音头对称设置于语音获取设备。
优选的,所述的河南方言语音识别系统中,所述音获取设备设有无线通讯单元,所述音获取设备通过无线通讯单元接入网络与语音识别设备连接。
优选的,所述的河南方言语音识别系统中,所述拾音头包括弹性体和接音盒,弹性体内设有空腔,空腔内放有由铝基板粘合成的壳体,弹性体与壳体之前还设有多根辅助弹性体树形的弹簧。
优选的,所述的河南方言语音识别系统中,所述壳体内放有麦克风组件,所述麦克风组件的正面上可拆卸设有多根导热柱和一个导声管,导声管与麦克风组件正面上的声道触点相通,上述多根导热柱和一个导声管均伸出弹性体外,所述接音盒设置在弹性体的外部且与麦克风组件之间电连接,所述导热柱上套有冷却圈,冷却圈内装有冷却液。
相对于现有技术的有益效果是,采用上述方案,本发明提出的河南方言语音识别系统提高了运行效率和识别效果,具有很好的市场应用价值。
附图说明
图1为本发明的一个实施例的框架图。
具体实施方式
为了便于理解本发明,下面结合附图和具体实施例,对本发明进行更详细的说明。附图中给出了本发明的较佳的实施例。但是,本发明可以以许多不同的形式来实现,并不限于本说明书所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本说明书所使用的术语“对称”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本说明书所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本说明书中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是用于限制本发明。
如图1所示,本发明的一个实施例是,该河南方言语音识别系统,包括语音获取设备11、语音识别设备10及语音判定设备9,所述语音获取设备11接收用户输入河南方言的语音指令,并将收到的语音指令传输至所述语音识别设备10;
所述语音识别设备10包括语音提取单元5和特征压缩单元6,所述语音提取单元5根据收到的语音指令提取河南方言的短时音频特征,从短时音频特征提取过零率、基频和美尔倒谱系数特征;所述特征压缩单元6根据提取的过零率、基频和美尔倒谱系数特征从语音指令中找出相互间相似度满足预设条件的音频帧特征,并将找出的音频帧特征传输至所述语音判定设备;
所述语音判定设备包括语音判定部分7和语音输出部分8,所述语音判定部分7利用隐马尔科夫模型从音频帧特征中选择一个或多个最优候选识别特征,并将一个或多个最优候选识别特征传输至语音输出部分,由语音输出部分8将一个或多个最优候选识别特征输出;
所述语音获取设备11包括语音获取单元1和噪声过滤单元2,所述语音获取单元1采集环境数据,接收用户输入的河南方言的语音指令;由噪声过滤单元2将语音获取单元采集的语音指令消除噪声后,将无噪音频信号发送至语音识别设备。优选的,语音获取设备为用户的智能手机。
优选的,所述语音判定设备的语音判定部分包括语音判定单元、模型训练单元和对比单元,所述模型训练单元预先训练语音判定单元,所述模型训练单元预先对语音信号的特征参数进行提取,通过隐马尔科夫模型对所提取的语音信号特征参数进行模型训练,建立语音信号的数据库;
所述语音判定单元将经过隐马尔科夫训练的音频帧特征参数与数据库匹配,由对比单元进行比较,最终得到一个或多个最优候选识别特征。
优选的,所述语音识别设备还包括方言语种识别部分4,所述方言语种识别部分4包括方言语音提取单元、音素识别单元、对比单元和方言语种模型训练单元,通过方言语种模型训练单元对区域方言语音信号特征参数进行模型训练,建立区域方言语种数据库;
所述方言语音提取单元根据收到的语音指令提取河南方言的短时声学特征;所述音素识别单元从短时声学特征获得音素序列;所述对比单元根据获得的音素序列和区域方言语种数据库的参数信息对比,找出满足预设条件的方言种类。
优选的,所述语音获取单元包括至少两个拾音头,至少两个拾音头对称设置于语音获取设备。优选的,所述音获取设备11设有无线通讯单元3,所述音获取设备通过无线通讯单元3接入网络与语音识别设备连接。优选的,所述拾音头包括弹性体和接音盒,弹性体内设有空腔,空腔内放有由铝基板粘合成的壳体,弹性体与壳体之前还设有多根辅助弹性体树形的弹簧。优选的,所述壳体内放有麦克风组件,所述麦克风组件的正面上可拆卸设有多根导热柱和一个导声管,导声管与麦克风组件正面上的声道触点相通,上述多根导热柱和一个导声管均伸出弹性体外,所述接音盒设置在弹性体的外部且与麦克风组件之间电连接,所述导热柱上套有冷却圈,冷却圈内装有冷却液。该设计新颖,可以根据不同手机壳体大小更改麦克风自身的容积,且能快速散去麦克风内部组件工作时产生的热量,具有广泛的市场前景。
本实施例中提出的河南方言为依照贺巍《中原官话分区》一书中所划分的区域内语言。本实施例中提出的河南方言语音识别系统,先通过语音获取设备的拾音头采集用户输入河南方言的语音指令,由噪声过滤单元将语音获取单元采集的语音指令消除噪声后,将无噪音频信号通过无线通讯单元接入网络传入语音识别设备;方言语音提取单元根据收到的语音指令提取河南方言的短时声学特征;音素识别单元从短时声学特征获得音素序列;对比单元根据获得的音素序列和区域方言语种数据库的参数信息对比,找出满足预设条件的方言种类;语音提取单元根据收到的语音指令结合满足预设条件的方言种类,提取河南方言的短时音频特征,并从短时音频特征提取过零率、基频和美尔倒谱系数特征;特征压缩单元根据提取的过零率、基频和美尔倒谱系数特征从语音指令中找出相互间相似度满足预设条件的音频帧特征,并将找出的音频帧特征传输至语音判定设备;由语音判定设备的语音判定部分利用隐马尔科夫模型从音频帧特征中选择一个或多个最优候选识别特征,并将一个或多个最优候选识别特征传输至语音输出部分,语音输出部分将一个或多个最优候选识别特征反馈至语音获取设备。
需要说明的是,上述各技术特征继续相互组合,形成未在上面列举的各种实施例,均视为本发明说明书记载的范围;并且,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (7)

1.一种河南方言语音识别系统,其特征在于,包括语音获取设备、语音识别设备及语音判定设备,所述语音获取设备接收用户输入河南方言的语音指令,并将收到的语音指令传输至所述语音识别设备;
所述语音识别设备包括语音提取单元和特征压缩单元,所述语音提取单元根据收到的语音指令提取河南方言的短时音频特征,从短时音频特征提取过零率、基频和美尔倒谱系数特征;所述特征压缩单元根据提取的过零率、基频和美尔倒谱系数特征从语音指令中找出相互间相似度满足预设条件的音频帧特征,并将找出的音频帧特征传输至所述语音判定设备;
所述语音判定设备包括语音判定部分和语音输出部分,所述语音判定部分利用隐马尔科夫模型从音频帧特征中选择一个或多个最优候选识别特征,并将一个或多个最优候选识别特征传输至语音输出部分,由语音输出部分将一个或多个最优候选识别特征输出;
所述语音获取设备包括语音获取单元和噪声过滤单元,所述语音获取单元采集环境数据,接收用户输入的河南方言的语音指令;由噪声过滤单元将语音获取单元采集的语音指令消除噪声后,将无噪音频信号发送至语音识别设备。
2.根据权利要求1所述的河南方言语音识别系统,其特征在于,所述语音判定设备的语音判定部分包括语音判定单元、模型训练单元和对比单元,所述模型训练单元预先训练语音判定单元,所述模型训练单元预先对语音信号的特征参数进行提取,通过隐马尔科夫模型对所提取的语音信号特征参数进行模型训练,建立语音信号的数据库;
所述语音判定单元将经过隐马尔科夫训练的音频帧特征参数与数据库匹配,由对比单元进行比较,最终得到一个或多个最优候选识别特征。
3.根据权利要求2所述的河南方言语音识别系统,其特征在于,所述语音识别设备还包括方言语种识别部分,所述方言语种识别部分包括方言语音提取单元、音素识别单元、对比单元和方言语种模型训练单元,通过方言语种模型训练单元对区域方言语音信号特征参数进行模型训练,建立区域方言语种数据库;
所述方言语音提取单元根据收到的语音指令提取河南方言的短时声学特征;所述音素识别单元从短时声学特征获得音素序列;所述对比单元根据获得的音素序列和区域方言语种数据库的参数信息对比,找出满足预设条件的方言种类。
4.根据权利要求2所述的河南方言语音识别系统,其特征在于,所述语音获取单元包括至少两个拾音头,至少两个拾音头对称设置于语音获取设备。
5.根据权利要求4所述的河南方言语音识别系统,其特征在于,所述音获取设备设有无线通讯单元,所述音获取设备通过无线通讯单元接入网络与语音识别设备连接。
6.根据权利要求4所述的河南方言语音识别系统,其特征在于,所述拾音头包括弹性体和接音盒,弹性体内设有空腔,空腔内放有由铝基板粘合成的壳体,弹性体与壳体之前还设有多根辅助弹性体树形的弹簧。
7.根据权利要求6所述的河南方言语音识别系统,其特征在于,所述壳体内放有麦克风组件,所述麦克风组件的正面上可拆卸设有多根导热柱和一个导声管,导声管与麦克风组件正面上的声道触点相通,上述多根导热柱和一个导声管均伸出弹性体外,所述接音盒设置在弹性体的外部且与麦克风组件之间电连接,所述导热柱上套有冷却圈,冷却圈内装有冷却液。
CN201610968693.2A 2016-10-28 2016-10-28 一种河南方言语音识别系统 Active CN106328125B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610968693.2A CN106328125B (zh) 2016-10-28 2016-10-28 一种河南方言语音识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610968693.2A CN106328125B (zh) 2016-10-28 2016-10-28 一种河南方言语音识别系统

Publications (2)

Publication Number Publication Date
CN106328125A true CN106328125A (zh) 2017-01-11
CN106328125B CN106328125B (zh) 2023-08-04

Family

ID=57816588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610968693.2A Active CN106328125B (zh) 2016-10-28 2016-10-28 一种河南方言语音识别系统

Country Status (1)

Country Link
CN (1) CN106328125B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107221322A (zh) * 2017-06-15 2017-09-29 重庆柚瓣科技有限公司 一种基于养老机器人的方言识别系统
CN107331388A (zh) * 2017-06-15 2017-11-07 重庆柚瓣科技有限公司 一种基于养老机器人的方言收集系统
CN107452379A (zh) * 2017-08-17 2017-12-08 广州腾猴科技有限公司 一种方言语言的识别技术及虚拟现实教学方法和系统
CN108711437A (zh) * 2018-03-06 2018-10-26 深圳市沃特沃德股份有限公司 语音处理方法和装置
CN109243460A (zh) * 2018-08-15 2019-01-18 浙江讯飞智能科技有限公司 一种自动生成基于地方方言的讯或询问笔录的方法
CN109243458A (zh) * 2018-11-22 2019-01-18 苏州米机器人有限公司 一种用于智能机器人的语音识别系统
CN109829058A (zh) * 2019-01-17 2019-05-31 西北大学 一种基于多任务学习提高方言识别准确率的分类识别方法
CN109949808A (zh) * 2019-03-15 2019-06-28 上海华镇电子科技有限公司 兼容普通话和方言的语音识别家电控制系统和方法
CN110660384A (zh) * 2019-10-14 2020-01-07 内蒙古工业大学 一种基于端到端的蒙古语异形同音词声学建模方法
CN110970018A (zh) * 2018-09-28 2020-04-07 珠海格力电器股份有限公司 语音识别方法和装置
CN114678009A (zh) * 2022-05-30 2022-06-28 深圳市房帮帮互联网科技有限公司 一种基于语音技术的盲人互联网系统
CN116682414A (zh) * 2023-06-06 2023-09-01 安徽迪科数金科技有限公司 一种基于大数据的方言语音识别系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5220639A (en) * 1989-12-01 1993-06-15 National Science Council Mandarin speech input method for Chinese computers and a mandarin speech recognition machine
US5865626A (en) * 1996-08-30 1999-02-02 Gte Internetworking Incorporated Multi-dialect speech recognition method and apparatus
CN102543073A (zh) * 2010-12-10 2012-07-04 上海上大海润信息系统有限公司 一种沪语语音识别信息处理方法
CN103035238A (zh) * 2012-11-27 2013-04-10 中国科学院自动化研究所 音频数据的编码方法及解码方法
CN104538026A (zh) * 2015-01-12 2015-04-22 北京理工大学 一种用于参数化语音合成的基频建模方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5220639A (en) * 1989-12-01 1993-06-15 National Science Council Mandarin speech input method for Chinese computers and a mandarin speech recognition machine
US5865626A (en) * 1996-08-30 1999-02-02 Gte Internetworking Incorporated Multi-dialect speech recognition method and apparatus
CN102543073A (zh) * 2010-12-10 2012-07-04 上海上大海润信息系统有限公司 一种沪语语音识别信息处理方法
CN103035238A (zh) * 2012-11-27 2013-04-10 中国科学院自动化研究所 音频数据的编码方法及解码方法
CN104538026A (zh) * 2015-01-12 2015-04-22 北京理工大学 一种用于参数化语音合成的基频建模方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
夏玉果;戴红霞;顾明亮;徐敏;: "多信息融合的汉语方言辨识" *
高宏涛;张德贤;: "语音识别技术研究及实现" *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107331388A (zh) * 2017-06-15 2017-11-07 重庆柚瓣科技有限公司 一种基于养老机器人的方言收集系统
CN107221322A (zh) * 2017-06-15 2017-09-29 重庆柚瓣科技有限公司 一种基于养老机器人的方言识别系统
CN107452379A (zh) * 2017-08-17 2017-12-08 广州腾猴科技有限公司 一种方言语言的识别技术及虚拟现实教学方法和系统
CN107452379B (zh) * 2017-08-17 2021-01-05 广州腾猴科技有限公司 一种方言语言的识别方法及虚拟现实教学方法和系统
CN108711437A (zh) * 2018-03-06 2018-10-26 深圳市沃特沃德股份有限公司 语音处理方法和装置
CN109243460A (zh) * 2018-08-15 2019-01-18 浙江讯飞智能科技有限公司 一种自动生成基于地方方言的讯或询问笔录的方法
CN110970018A (zh) * 2018-09-28 2020-04-07 珠海格力电器股份有限公司 语音识别方法和装置
CN109243458A (zh) * 2018-11-22 2019-01-18 苏州米机器人有限公司 一种用于智能机器人的语音识别系统
CN109829058B (zh) * 2019-01-17 2023-08-25 西北大学 一种基于多任务学习提高方言识别准确率的分类识别方法
CN109829058A (zh) * 2019-01-17 2019-05-31 西北大学 一种基于多任务学习提高方言识别准确率的分类识别方法
CN109949808A (zh) * 2019-03-15 2019-06-28 上海华镇电子科技有限公司 兼容普通话和方言的语音识别家电控制系统和方法
CN110660384A (zh) * 2019-10-14 2020-01-07 内蒙古工业大学 一种基于端到端的蒙古语异形同音词声学建模方法
CN110660384B (zh) * 2019-10-14 2022-03-22 内蒙古工业大学 一种基于端到端的蒙古语异形同音词声学建模方法
CN114678009A (zh) * 2022-05-30 2022-06-28 深圳市房帮帮互联网科技有限公司 一种基于语音技术的盲人互联网系统
CN116682414A (zh) * 2023-06-06 2023-09-01 安徽迪科数金科技有限公司 一种基于大数据的方言语音识别系统
CN116682414B (zh) * 2023-06-06 2024-01-30 安徽迪科数金科技有限公司 一种基于大数据的方言语音识别系统

Also Published As

Publication number Publication date
CN106328125B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN106328125A (zh) 一种河南方言语音识别系统
CN103095911B (zh) 一种通过语音唤醒寻找手机的方法及系统
JP5042799B2 (ja) 音声チャットシステム、情報処理装置およびプログラム
CN110049270A (zh) 多人会议语音转写方法、装置、系统、设备及存储介质
CN109074806A (zh) 控制分布式音频输出以实现语音输出
CN104078044A (zh) 移动终端及其录音搜索的方法和装置
CN201403118Y (zh) 具有翻译方言功能的装置和移动终端
CN102723078A (zh) 基于自然言语理解的语音情感识别方法
CN102254555A (zh) 改进依赖上下文的语音识别器对环境变化的鲁棒性
CN101542591A (zh) 用于提供语音识别的方法和系统
KR20130108173A (ko) 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법
CN110070863A (zh) 一种语音控制方法及装置
CN110570847A (zh) 一种多人场景的人机交互系统及方法
CN106356054A (zh) 一种基于语音识别的农产品信息采集方法和系统
KR20130086971A (ko) 음성인식 질의응답 시스템 및 그것의 운용방법
CN101656069A (zh) 一种中文语音信息通讯系统及其通讯方法
CN114187914A (zh) 一种语音识别方法及系统
CN104427125A (zh) 一种接听来电的方法及移动终端
WO2016027909A1 (ja) データ構造、音声対話装置及び電子機器
CN104575496A (zh) 一种自动发送多媒体文件的方法及装置、移动终端
CN111833907A (zh) 一种人机交互方法与终端、计算机可读存储介质
CN103067579A (zh) 辅助在线语音聊天方法和装置
KR102056329B1 (ko) 통역방법
CN103824560A (zh) 中文语音识别系统
KR20140123370A (ko) 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant