CN107274886B - 一种语音识别方法和装置 - Google Patents

一种语音识别方法和装置 Download PDF

Info

Publication number
CN107274886B
CN107274886B CN201610211607.3A CN201610211607A CN107274886B CN 107274886 B CN107274886 B CN 107274886B CN 201610211607 A CN201610211607 A CN 201610211607A CN 107274886 B CN107274886 B CN 107274886B
Authority
CN
China
Prior art keywords
voice
database
standard
person
corresponding relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610211607.3A
Other languages
English (en)
Other versions
CN107274886A (zh
Inventor
潘春岭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201610211607.3A priority Critical patent/CN107274886B/zh
Priority to PCT/CN2016/083516 priority patent/WO2017173721A1/zh
Publication of CN107274886A publication Critical patent/CN107274886A/zh
Application granted granted Critical
Publication of CN107274886B publication Critical patent/CN107274886B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • User Interface Of Digital Computer (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种语音识别方法和装置,包括:建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库,接收语音障碍者的语音,根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作,通过建立语音障碍者语音与标准语音的对应关系,能够准确识别语言障碍者的语音,为他们思想意图的真实表达提供了便利,更加有利于患者语言表达的恢复,树立他们对生活的信心。

Description

一种语音识别方法和装置
技术领域
本发明涉及语音识别技术领域,尤指一种语音识别方法和装置。
背景技术
目前,随着语音识别技术的不断发展,越来愈多的设备(比如手机、电视机、空调器等家用电器)都可以通过语音控制来执行相应的功能,例如:受控设备检测到语音控制指令时,可以根据检测到的控制指令来执行相应的操作,因此,语音交互给用户的日常生活带来了很多便利。
现有技术中,对于来自不同国家或者不同地区的人们,受控设备可以通过很多语音翻译系统对不同国家的语言或者不同地区的方言来进行翻译,根据翻译后的控制指令来执行相应的操作。
但是,采用现有的技术,对于由于后期疾病造成的语音障碍者,例如:中风等导致的语音障碍的患者,他们可以朗读简单的文字,有强烈的会话欲望,却无法准确识别他们的语音进行语音交互,使得不利于患者的病情恢复,丧失了生活的信心。
发明内容
为了解决上述技术问题,本发明提供了一种语音识别方法和装置,能够准确识别语言障碍者的语音,为他们思想意图的真实表达提供了便利,更加有利于患者语言表达的恢复,树立他们对生活的信心。
为了达到本发明目的,第一方面,本发明提供了一种语音识别方法,该方法包括:
建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库;
接收语音障碍者的语音,根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作。
与现有技术相比,本发明实施例提供的一种语音识别方法,包括:建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库,接收语音障碍者的语音,根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作,通过建立语音障碍者语音与标准语音的对应关系,能够准确识别语言障碍者的语音,为他们思想意图的真实表达提供了便利,更加有利于患者语言表达的恢复,树立他们对生活的信心。
在一个实施例中,建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库,包括:
提取所述语音障碍者的常用生活用语语音中出的词组或者文字的语音,与标准语音中的词组或者文字的语音建立一一对应关系的数据库。
通过语音智能处理模块将语音障碍者的常用生活用语语音中的词组或者文字进行提取、拆分,从而便于与标准语音的词组或者文字建立一一对应的关系,提高了数据库的精准性。
在一个实施例中,建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
存储建立后数据库,并上传到云服务器进行备份。
通过对建立后的数据库进行存储并上传到云服务器进行备份,可以方便用户使用,随时随地可以调用数据库。
在一个实施例中,建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
复核所述数据库中语音障碍者的语音与标准语音的对应关系,修正所述数据库中复核错误的对应关系。
通过对数据库的复核和修正,可以保证数据库中语音障碍者的语音与标准语音的对应关系,从而可以更准确地识别语音障碍者的真实意图。
在一个实施例中,建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
定期统计所述语音障碍者的语音与标准语音的对应关系的使用频率,根据使用频率更新所述数据库。
通过定期统计语音障碍者的语音与标准语音的对应关系的使用频率,根据使用频率更新所述数据库,可以更好地帮助语音障碍者进行的语音康复训练,便于实现语音障碍者语言的真实意图。
在一个实施例中,在建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之前,还包括:
录入语音障碍者朗读常用生活用语的语音。
通过提前录入语音障碍者常用的生活用语的语音,便于后续数据库的建立,更有利于快速识别语音障碍者发出的语音来表达他们真实的思想意图。
第二方面,本发明实施例提供的一种语音识别装置,该装置包括:语音智能处理模块和语音识别模块;
所述语音智能处理模块,设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库;
所述语音识别模块,设置为接收语音障碍者的语音,根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作。
与现有技术相比,本发明提供的语音识别装置,包括:语音智能处理模块和语音识别模块;所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库,所述语音识别模块,设置为接收语音障碍者的语音,根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作。通过建立语音障碍者语音与标准语音的对应关系,能够准确识别语言障碍者的语音,为他们思想意图的真实表达提供了便利,更加有利于患者语言表达的恢复,树立他们对生活的信心。
在一个实施例中,所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库,是指:
所述语音智能处理模块设置为提取所述语音障碍者的常用生活用语语音中出的词组或者文字的语音,与标准语音中的词组或者文字的语音建立一一对应关系的数据库。
通过语音智能处理模块将语音障碍者的常用生活用语语音中的词组或者文字进行提取、拆分,从而便于与标准语音的词组或者文字建立一一对应的关系,提高了数据库的精准性。
在一个实施例中,所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
所述语音智能处理模块设置为存储建立后数据库,并上传到云服务器进行备份。
通过对建立后的数据库进行存储并上传到云服务器进行备份,可以方便用户使用,随时随地可以调用数据库。
在一个实施例中,所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
所述语音智能处理模块设置为复核所述数据库中语音障碍者的语音与标准语音的对应关系,修正所述数据库中复核错误的对应关系。
通过对数据库的复核和修正,可以保证数据库中语音障碍者的语音与标准语音的对应关系,从而可以更准确地识别语音障碍者的真实意图。
在一个实施例中,所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
所述语音智能处理模块设置为定期统计所述语音障碍者的语音与标准语音的对应关系的使用频率,根据使用频率更新所述数据库。
通过定期统计语音障碍者的语音与标准语音的对应关系的使用频率,根据使用频率更新所述数据库,可以更好地帮助语音障碍者进行的语音康复训练,便于实现语音障碍者语言的真实意图。
在一个实施例中,该装置还包括:语音录入模块;
所述语音录入模块设置为录入语音障碍者朗读常用生活用语的语音。
通过提前录入语音障碍者常用的生活用语的语音,便于后续数据库的建立,更有利于快速识别语音障碍者发出的语音来表达他们真实的思想意图。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明提供的一种语音识别方法实施例一的流程示意图;
图2为本发明提供的一种语音识别装置实施例一的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明实施例涉及的方法可以应用于语音障碍者,该语音障碍者是由于后期疾病造成的语音障碍者,他们可以朗读简单的文字,有强烈的会话欲望,却无法准确识别他们的语音进行语音交互,例如:中风等导致的语音障碍的患者等,他们可以通过装有语音识别装置的智能设备,例如:手机、平板电脑、智能机器人等,能准备识别他们的语音所表达的真实意图,帮助他们执行相应的操作,但并不限于此。
本发明实施例涉及的方法,旨在解决现有技术中无法准确识别语音障碍者的语音,使得无法表达出真实的思想意图,不利于患者的病情恢复的技术问题。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明提供的一种语音识别方法实施例一的流程示意图。本实施例涉及的是实现准确识别语音障碍者的语音方法的具体过程。如图1所示,该方法包括:
S101、建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库。
具体的,通过语音智能处理模块对接收的语音障碍者的常用生活用语语音中的词组发音或单个文字的发音进行分离与提取,将语音障碍者的语音与标准语音建立一对一的对应关系,并形成数据库,但并不以此为限。
S102、接收语音障碍者的语音,根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作。
具体的,语音智能处理模块建立完数据库后,就可以通过语音识别模块接收语音障碍者的语音,通过对所接收的语音进行分离、甄别,与数据库的语音对比,识别出对应的标准语音,可以真实表达语音障碍者的思想意图,进行播放,从而方便和家人进行交流,也可以识别出语音障碍者所要进行的语音动作,完成受控设备的操作。。
本发明实施例提供的一种语音识别方法,包括:建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库,接收语音障碍者的语音,根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作,通过建立语音障碍者语音与标准语音的对应关系,能够准确识别语言障碍者的语音,为他们思想意图的真实表达提供了便利,更加有利于患者语言表达的恢复,树立他们对生活的信心。
进一步地,在上述实施例的基础上,在建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之前,还包括:
录入语音障碍者朗读常用生活用语的语音。
具体的,对于语音障碍者,该语音障碍者是由于后期疾病造成的语音障碍者,他们可以朗读简单的文字,有强烈的会话欲望,例如:中风等导致的语音障碍的患者等,录入语音障碍者的常用生活用语语音,该常用生活用语可以提前准备的5000字的文章或者短句或者词组等,这5000字的内容是通过筛选和语音障碍者的生活息息相关的生活常用语,同时还可以根据《现代汉语常用字表》中的常用字(2500字)和次常用字(1000字)两个部分来遴选文章,通过计算机抽样检测,这些常用字在语言中的覆盖率达到99.48%,通过筛选出常用字以便满足语音障碍者的沟通交流,但并不限于此。
通过提前录入语音障碍者常用的生活用语的语音,便于后续数据库的建立,更有利于快速识别语音障碍者发出的语音来表达他们真实的思想意图。
进一步地,在上述实施例的基础上,在上述S101步骤中建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库,包括:
提取所述语音障碍者的常用生活用语语音中出的词组或者文字的语音,与标准语音中的词组或者文字的语音建立一一对应关系的数据库。
具体的,语音智能处理模块要实现语音障碍者语音的语音分拆、断句、断词,提取出语音障碍者语音中的词组或者文字与标准语音中的词组或者文字的语音的一一对应关系,其中,对于断句、断词的分拆方法,可以加入人为的条件设置,如:词与词的间隔在几毫秒之间等,从而来保证分拆的准确性,将建立的一一对应关系形成数据库,但并不限于此。
通过语音智能处理模块将语音障碍者的常用生活用语语音中的词组或者文字进行提取、拆分,从而便于与标准语音的词组或者文字建立一一对应的关系,提高了数据库的精准性。
进一步地,在上述实施例的基础上,在上述S101步骤建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
存储建立后数据库,并上传到云服务器进行备份。
具体的,可以将建立后的数据库在设备内进行存储,并上传到云服务器进行备份,例如:可以将建立好的数据库存储在手机上,并通过手机上传到云服务器上,这样方便调用数据库,也可以避免更换设备后导致数据库的丢失。
通过对建立后的数据库进行存储并上传到云服务器进行备份,可以方便用户使用,随时随地可以调用数据库。
进一步地,在上述实施例的基础上,在上述S101步骤建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
复核所述数据库中语音障碍者的语音与标准语音的对应关系,修正所述数据库中复核错误的对应关系。
具体的,由于语音障碍者的语音发音是一个非正常发音的过程,但却有规律可循,发音并不是随意的,发音的方式基本也是固定的,其中,对于数据库的采集并不可能一次成功,需要有个修正和完善的过程,因此需要语音障碍者自己或是家人对于数据库进行复核,可以通过所述语音智能处理模块对语音障碍者语音进行分拆提取,同时找出对应的标准语音,然后进行合成,并通过语音输出模块予以播放进行复读监听,确定对应关系是否正确,复核语音障碍者的语音与标准语音的对应关系不正确,可以通过修正对应关系来确保数据库的正确性,其中,对于一直出现错误的对应关系,还可以通过强制建立某种词组语音的对应关系,完成数据库的建立。
通过对数据库的复核和修正,可以保证数据库中语音障碍者的语音与标准语音的对应关系,从而可以更准确地识别语音障碍者的真实意图。
进一步地,在上述实施例的基础上,在上述S101步骤建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
定期统计所述语音障碍者的语音与标准语音的对应关系的使用频率,根据使用频率更新所述数据库。
具体的,所述语音智能处理模块可以根据语音和的语音能力的恢复过程,定期统计所述语音障碍者的语音与标准语音的对应关系的使用频率,根据使用频率来更新所述数据库,这样便于语音障碍者对于自己习惯性的语音进行重新构建,有利于语音障碍者的语音康复,便于实现语音障碍者语言的真实意图。
通过定期统计语音障碍者的语音与标准语音的对应关系的使用频率,根据使用频率更新所述数据库,可以更好地帮助语音障碍者进行的语音康复训练,便于实现语音障碍者语言的真实意图。
图2为本发明提供的一种语音识别装置实施例一的结构示意图,如图2所示,一种语音识别装置,包括语音智能处理模块10和语音识别模块20;
所述语音智能处理模块10,设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库;
所述语音识别模块20,设置为接收语音障碍者的语音,根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作。
本发明实施例提供的一种语音识别装置,包括:语音智能处理模块和语音识别模块,语音智能处理模块建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库,接收语音障碍者的语音,语音识别模块根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作,通过建立语音障碍者语音与标准语音的对应关系,能够准确识别语言障碍者的语音,为他们思想意图的真实表达提供了便利,更加有利于患者语言表达的恢复,树立他们对生活的信心。
进一步地,在上述实施例的基础上,该装置还包括:语音录入模块30;
所述语音录入模块30设置为录入语音障碍者朗读常用生活用语的语音。
本发明实施例提供的装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
进一步地,在上述实施例的基础上,所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库,是指:
所述语音智能处理模块设置为提取所述语音障碍者的常用生活用语语音中出的词组或者文字的语音,与标准语音中的词组或者文字的语音建立一一对应关系的数据库。
本发明实施例提供的装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
进一步地,在上述实施例的基础上,所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
所述语音智能处理模块设置为存储建立后数据库,并上传到云服务器进行备份。
进一步地,在上述实施例的基础上,所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
所述语音智能处理模块设置为复核所述数据库中语音障碍者的语音与标准语音的对应关系,修正所述数据库中复核错误的对应关系。
本发明实施例提供的装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
进一步地,在上述实施例的基础上,所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
所述语音智能处理模块设置为定期统计所述语音障碍者的语音与标准语音的对应关系的使用频率,根据使用频率更新所述数据库。
本发明实施例提供的装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (8)

1.一种语音识别方法,其特征在于,包括:
建立语音障碍者的常用生活用语语音与标准语音的对应关系的数据库;
接收语音障碍者的语音,根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作;
其中,建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库,包括:
提取所述语音障碍者的常用生活用语语音中出的词组或者文字的语音,与标准语音中的词组或者文字的语音建立一一对应关系的数据库;
定期统计所述语音障碍者的语音与标准语音的对应关系的使用频率,根据使用频率更新所述数据库。
2.根据权利要求1所述的方法,其特征在于,建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
存储建立后数据库,并上传到云服务器进行备份。
3.根据权利要求1所述的方法,其特征在于,建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
复核所述数据库中语音障碍者的语音与标准语音的对应关系,修正所述数据库中复核错误的对应关系。
4.根据权利要求1所述的方法,其特征在于,在建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之前,还包括:
录入语音障碍者朗读常用生活用语的语音。
5.一种语音识别装置,其特征在于,包括语音智能处理模块和语音识别模块;
所述语音智能处理模块,设置为建立语音障碍者的常用生活用语语音与标准语音的对应关系的数据库;
所述语音识别模块,设置为接收语音障碍者的语音,根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作;
其中,所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库,是指:
所述语音智能处理模块设置为提取所述语音障碍者的常用生活用语语音中出的词组或者文字的语音,与标准语音中的词组或者文字的语音建立一一对应关系的数据库,以及,定期统计所述语音障碍者的语音与标准语音的对应关系的使用频率,根据使用频率更新所述数据库。
6.根据权利要求5所述的装置,其特征在于,所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
所述语音智能处理模块设置为存储建立后数据库,并上传到云服务器进行备份。
7.根据权利要求5所述的装置,其特征在于,所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后,还包括:
所述语音智能处理模块设置为复核所述数据库中语音障碍者的语音与标准语音的对应关系,修正所述数据库中复核错误的对应关系。
8.根据权利要求5所述的装置,其特征在于,该装置还包括:语音录入模块;
所述语音录入模块设置为录入语音障碍者朗读常用生活用语的语音。
CN201610211607.3A 2016-04-06 2016-04-06 一种语音识别方法和装置 Active CN107274886B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610211607.3A CN107274886B (zh) 2016-04-06 2016-04-06 一种语音识别方法和装置
PCT/CN2016/083516 WO2017173721A1 (zh) 2016-04-06 2016-05-26 一种语音识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610211607.3A CN107274886B (zh) 2016-04-06 2016-04-06 一种语音识别方法和装置

Publications (2)

Publication Number Publication Date
CN107274886A CN107274886A (zh) 2017-10-20
CN107274886B true CN107274886B (zh) 2021-10-15

Family

ID=60000784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610211607.3A Active CN107274886B (zh) 2016-04-06 2016-04-06 一种语音识别方法和装置

Country Status (2)

Country Link
CN (1) CN107274886B (zh)
WO (1) WO2017173721A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108174030B (zh) * 2017-12-26 2020-11-17 努比亚技术有限公司 定制化语音控制的实现方法、移动终端及可读存储介质
CN108089836A (zh) * 2017-12-29 2018-05-29 上海与德科技有限公司 一种基于机器人的辅助学习方法及机器人
CN108447473A (zh) * 2018-03-06 2018-08-24 深圳市沃特沃德股份有限公司 语音翻译方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1760976A (zh) * 2005-11-08 2006-04-19 高丹 手持语言障碍辅助设备
CN1901041A (zh) * 2005-07-22 2007-01-24 康佳集团股份有限公司 语音字典形成方法、语音识别系统及其方法
CN102918587A (zh) * 2010-03-30 2013-02-06 Nvoq股份有限公司 能够将听写代号短语转录成标准词组的分层快速注解
CN104992707A (zh) * 2015-05-19 2015-10-21 四川大学 一种腭裂语音喉塞音自动识别算法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101281745B (zh) * 2008-05-23 2011-08-10 深圳市北科瑞声科技有限公司 一种车载语音交互系统
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
CN101464729B (zh) * 2009-01-05 2010-08-04 清华大学 基于听觉认知神经信号的自主意愿表达方法
CN102074234B (zh) * 2009-11-19 2012-07-25 财团法人资讯工业策进会 语音变异模型建立装置、方法及语音辨识系统和方法
CN102036033A (zh) * 2010-12-31 2011-04-27 Tcl集团股份有限公司 一种语音遥控电视机的方法及语音遥控器
CN103236261B (zh) * 2013-04-02 2015-09-16 四川长虹电器股份有限公司 一种特定人语音识别的方法
US9443507B2 (en) * 2013-07-15 2016-09-13 GM Global Technology Operations LLC System and method for controlling a speech recognition system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1901041A (zh) * 2005-07-22 2007-01-24 康佳集团股份有限公司 语音字典形成方法、语音识别系统及其方法
CN1760976A (zh) * 2005-11-08 2006-04-19 高丹 手持语言障碍辅助设备
CN102918587A (zh) * 2010-03-30 2013-02-06 Nvoq股份有限公司 能够将听写代号短语转录成标准词组的分层快速注解
CN104992707A (zh) * 2015-05-19 2015-10-21 四川大学 一种腭裂语音喉塞音自动识别算法及装置

Also Published As

Publication number Publication date
CN107274886A (zh) 2017-10-20
WO2017173721A1 (zh) 2017-10-12

Similar Documents

Publication Publication Date Title
CN106331893B (zh) 实时字幕显示方法及系统
US9564127B2 (en) Speech recognition method and system based on user personalized information
EP3246915A1 (en) Voice recognition system and method of robot system
CN113327609B (zh) 用于语音识别的方法和装置
WO2016150001A1 (zh) 语音识别的方法、装置及计算机存储介质
CN107016993A (zh) 一种智能家居的语音交互系统及方法
CN103714815A (zh) 语音控制方法及其设备
CN105261356A (zh) 一种语音识别系统及方法
CN105006230A (zh) 一种面向非特定人的语音敏感信息检测和过滤方法
WO2019218467A1 (zh) 一种音视频通话方言识别方法、装置、终端设备及介质
CN107274886B (zh) 一种语音识别方法和装置
CN104538034A (zh) 一种语音识别方法及系统
CN108109443A (zh) 一种纠正英语口语发音的系统
WO2014173325A1 (zh) 喉音识别方法及装置
CN105788596A (zh) 一种语音识别电视控制方法及系统
CN111046148A (zh) 智能交互系统及智能客服机器人
CN104252287A (zh) 一种交互装置和基于交互装置的提高表达能力的方法
CN105869622B (zh) 中文热词检测方法和装置
CN104361787A (zh) 信号转换系统和信号转换方法
CN106708950B (zh) 用于智能机器人自学习系统的数据处理方法及装置
CN110931018A (zh) 智能语音交互的方法、装置及计算机可读存储介质
CN107886940B (zh) 语音翻译处理方法及装置
CN109961789A (zh) 一种基于视频及语音交互服务设备
CN106897275A (zh) 一种方言实时翻译系统
CN109192211A (zh) 一种语音信号识别的方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant