CN107170456A - 语音处理方法及装置 - Google Patents

语音处理方法及装置 Download PDF

Info

Publication number
CN107170456A
CN107170456A CN201710510381.1A CN201710510381A CN107170456A CN 107170456 A CN107170456 A CN 107170456A CN 201710510381 A CN201710510381 A CN 201710510381A CN 107170456 A CN107170456 A CN 107170456A
Authority
CN
China
Prior art keywords
age
voice
range
playout
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710510381.1A
Other languages
English (en)
Inventor
周海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yunzhisheng Information Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201710510381.1A priority Critical patent/CN107170456A/zh
Publication of CN107170456A publication Critical patent/CN107170456A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明是关于一种语音处理方法及装置,其中,方法包括:接收用户输入的语音信息;对所述语音信息进行声纹识别,并根据识别结果确定所述用户的年龄;判断所述用户的年龄所属的目标年龄范围;确定与所述目标年龄范围对应的目标语音播放速度;使用所述目标语音播放速度播放所述语音信息对应的应答信息。通过该技术方案,针对不同的年龄段设置不同的语音播放速度,对每个年龄段的应答信息进行有针对性的播放处理,提升用户的使用体验。

Description

语音处理方法及装置
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音处理方法及装置。
背景技术
语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
发明内容
本发明实施例提供一种语音处理方法及装置,用以实现根据用户年龄的不同智能的为其选择播放速度,从而提升用户的使用体验。
根据本发明实施例的第一方面,提供一种语音处理方法,包括:
接收用户输入的语音信息;
对所述语音信息进行声纹识别,并根据识别结果确定所述用户的年龄;
判断所述用户的年龄所属的目标年龄范围;
确定与所述目标年龄范围对应的目标语音播放速度;
使用所述目标语音播放速度播放所述语音信息对应的应答信息。
在该实施例中,根据用户输入的语音信息确定用户的年龄,进而根据用户的年龄确定对应的目标语音播放速度,从而使用目标语音播放速度播放应答信息,这样,针对不同的年龄段设置不同的语音播放速度,对每个年龄段的应答信息进行有针对性的播放处理,提升用户的使用体验。
在一个实施例中,所述确定与所述目标年龄范围对应的目标语音播放速度,包括:
根据预设的年龄范围和预设的语音播放速度的对应关系,确定与所述目标年龄范围对应的目标语音播放速度。
在该实施例中,可以设置多个不同的年龄范围,以及与每个范围对应的语音播放速度,从而实现采用目标语音播放速度播放用户需要的应答信息,提升用户的使用体验。
在一个实施例中,所述年龄范围包括第一年龄范围、第二年龄范围和第三年龄范围,其中,第一年龄范围中的年龄大于第二年龄范围中的年龄,第二年龄范围中的年龄大于所述第三年龄范围中的年龄,所述第一年龄范围对应的语音播放速度为第一语音播放速度,所述第二年龄范围对应的语音播放速度为第二语音播放速度,所述第三年龄范围对应的语音播放速度为第三语音播放速度。
在一个实施例中,所述第一语音播放速度小于所述第二语音播放速度,所述第二语音播放速度小于所述第三语音播放速度。
在该实施例中,针对不同的年龄段,可以设置不同的语音播放速度。以智能儿童设备为例,由于使用者年龄不同,对语音播报的速度使用要求也不同,如年龄较小的用户,耐心较少,语音播报速度加快,会提升使用者的体验。因此,可以设置多个年龄范围以及每个年龄范围对应的语音播报速度。例如,设置1-4岁,年龄较低,使用快速语音播报;4-6岁,年龄中等,使用较快语音播报;6-9岁,年龄较大,使用默认语音播报。其中,可以设置默认语音播报速度标准=1;较快语音播报速度标准=1*1.1;快速语音播报速度标准=1*1.2。这样,针对不同年龄的用户使用不同的语音播放速度,提升了用户的使用体验。
在一个实施例中,所述方法还包括:
接收输入的设置命令;
根据所述设置命令,设置不同的年龄范围,以及每个年龄范围对应的语音播放速度。
在该实施例中,用户或者厂商可以设置多个不同的年龄范围,以及每个年龄范围对应的语音播放速度,从而满足不同用户的不同需求。例如,对于智能儿童设备,设置1-4岁,年龄较低,使用快速语音播报;4-6岁,年龄中等,使用较快语音播报;6-9岁,年龄较大,使用默认语音播报。其中,可以设置默认语音播报速度标准=1;较快语音播报速度标准=1*1.1;快速语音播报速度标准=1*1.2。当然,用户或者厂商还可根据个人需求设置其他数值。
根据本发明实施例的第二方面,提供一种语音处理装置,包括:
第一接收模块,用于接收用户输入的语音信息;
第一确定模块,用于对所述语音信息进行声纹识别,并根据识别结果确定所述用户的年龄;
判断模块,用于判断所述用户的年龄所属的目标年龄范围;
第二确定模块,用于确定与所述目标年龄范围对应的目标语音播放速度;
播放模块,用于使用所述目标语音播放速度播放所述语音信息对应的应答信息。
在一个实施例中,所述第二确定模块用于:
根据预设的年龄范围和预设的语音播放速度的对应关系,确定与所述目标年龄范围对应的目标语音播放速度。
在一个实施例中,所述年龄范围包括第一年龄范围、第二年龄范围和第三年龄范围,其中,第一年龄范围中的年龄大于第二年龄范围中的年龄,第二年龄范围中的年龄大于所述第三年龄范围中的年龄,所述第一年龄范围对应的语音播放速度为第一语音播放速度,所述第二年龄范围对应的语音播放速度为第二语音播放速度,所述第三年龄范围对应的语音播放速度为第三语音播放速度。
在一个实施例中,所述第一语音播放速度小于所述第二语音播放速度,所述第二语音播放速度小于所述第三语音播放速度。
在一个实施例中,所述装置还包括:
第二接收模块,用于接收输入的设置命令;
设置模块,用于根据所述设置命令,设置不同的年龄范围,以及每个年龄范围对应的语音播放速度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语音处理方法的流程图。
图2是根据一示例性实施例示出的另一种语音处理方法的流程图。
图3是根据一示例性实施例示出的又一种语音处理方法的流程图。
图4是根据一示例性实施例示出的一种语音处理装置的框图。
图5是根据一示例性实施例示出的另一种语音处理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种语音处理方法的流程图。该语音处理方法应用于终端设备中,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有语音控制功能的设备。如图1所示,该方法包括步骤S101-S106:
在步骤S101中,接收用户输入的语音信息;
在步骤S102中,对所述语音信息进行声纹识别,并根据识别结果确定所述用户的年龄;
所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性,又有变异性,不是绝对的、一成不变的。这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关。尽管如此,由于每个人的发音器官都不尽相同,因此在一般情况下,仍能区别不同的人的声音或判断是否是同一人的声音。
而通过对语音信息进行声纹识别,可以识别出用户的具体特征,例如用户的年龄、性别等。
在步骤S103中,判断所述用户的年龄所属的目标年龄范围;
在步骤S104中,确定与所述目标年龄范围对应的目标语音播放速度;
在一个实施例中,所述年龄范围包括第一年龄范围、第二年龄范围和第三年龄范围,其中,第一年龄范围中的年龄大于第二年龄范围中的年龄,第二年龄范围中的年龄大于所述第三年龄范围中的年龄,所述第一年龄范围对应的语音播放速度为第一语音播放速度,所述第二年龄范围对应的语音播放速度为第二语音播放速度,所述第三年龄范围对应的语音播放速度为第三语音播放速度。
在一个实施例中,所述第一语音播放速度小于所述第二语音播放速度,所述第二语音播放速度小于所述第三语音播放速度。
在该实施例中,针对不同的年龄段,可以设置不同的语音播放速度。以智能儿童设备为例,由于使用者年龄不同,对语音播报的速度使用要求也不同,如年龄较小的用户,耐心较少,语音播报速度加快,会提升使用者的体验。因此,可以设置多个年龄范围以及每个年龄范围对应的语音播报速度。例如,设置1-4岁,年龄较低,使用快速语音播报;4-6岁,年龄中等,使用较快语音播报;6-9岁,年龄较大,使用默认语音播报。其中,可以设置默认语音播报速度标准=1;较快语音播报速度标准=1*1.1;快速语音播报速度标准=1*1.2。这样,针对不同年龄的用户使用不同的语音播放速度,提升了用户的使用体验。
在步骤S105中,使用所述目标语音播放速度播放所述语音信息对应的应答信息。
在该实施例中,根据用户输入的语音信息确定用户的年龄,进而根据用户的年龄确定对应的目标语音播放速度,从而使用目标语音播放速度播放应答信息,这样,针对不同的年龄段设置不同的语音播放速度,对每个年龄段的应答信息进行有针对性的播放处理,提升用户的使用体验。
图2是根据一示例性实施例示出的另一种语音处理方法的流程图。
如图2所示,在一个实施例中,上述步骤S104包括步骤S201:
在步骤S201中,根据预设的年龄范围和预设的语音播放速度的对应关系,确定与所述目标年龄范围对应的目标语音播放速度。
在该实施例中,可以设置多个不同的年龄范围,以及与每个范围对应的语音播放速度,从而实现采用目标语音播放速度播放用户需要的应答信息,提升用户的使用体验。
在一个实施例中,所述年龄范围包括第一年龄范围、第二年龄范围和第三年龄范围,其中,第一年龄范围中的年龄大于第二年龄范围中的年龄,第二年龄范围中的年龄大于所述第三年龄范围中的年龄,所述第一年龄范围对应的语音播放速度为第一语音播放速度,所述第二年龄范围对应的语音播放速度为第二语音播放速度,所述第三年龄范围对应的语音播放速度为第三语音播放速度。
在一个实施例中,所述第一语音播放速度小于所述第二语音播放速度,所述第二语音播放速度小于所述第三语音播放速度。
在该实施例中,针对不同的年龄段,可以设置不同的语音播放速度。以智能儿童设备为例,由于使用者年龄不同,对语音播报的速度使用要求也不同,如年龄较小的用户,耐心较少,语音播报速度加快,会提升使用者的体验。因此,可以设置多个年龄范围以及每个年龄范围对应的语音播报速度。例如,设置1-4岁,年龄较低,使用快速语音播报;4-6岁,年龄中等,使用较快语音播报;6-9岁,年龄较大,使用默认语音播报。其中,可以设置默认语音播报速度标准=1;较快语音播报速度标准=1*1.1;快速语音播报速度标准=1*1.2。这样,针对不同年龄的用户使用不同的语音播放速度,提升了用户的使用体验。
图3是根据一示例性实施例示出的又一种语音处理方法的流程图。
如图3所示,在一个实施例中,上述方法还包括步骤S301-S302:
在步骤S301中,接收输入的设置命令;
在步骤S302中,根据所述设置命令,设置不同的年龄范围,以及每个年龄范围对应的语音播放速度。
在该实施例中,用户或者厂商可以设置多个不同的年龄范围,以及每个年龄范围对应的语音播放速度,从而满足不同用户的不同需求。例如,对于智能儿童设备,设置1-4岁,年龄较低,使用快速语音播报;4-6岁,年龄中等,使用较快语音播报;6-9岁,年龄较大,使用默认语音播报。其中,可以设置默认语音播报速度标准=1;较快语音播报速度标准=1*1.1;快速语音播报速度标准=1*1.2。当然,用户或者厂商还可根据个人需求设置其他数值。
下述为本发明装置实施例,可以用于执行本发明方法实施例。
图4是根据一示例性实施例示出的一种语音处理装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图4所示,该语音处理装置包括:
第一接收模块41,用于接收用户输入的语音信息;
第一确定模块42,用于对所述语音信息进行声纹识别,并根据识别结果确定所述用户的年龄;
判断模块43,用于判断所述用户的年龄所属的目标年龄范围;
第二确定模块44,用于确定与所述目标年龄范围对应的目标语音播放速度;
播放模块45,用于使用所述目标语音播放速度播放所述语音信息对应的应答信息。
在该实施例中,根据用户输入的语音信息确定用户的年龄,进而根据用户的年龄确定对应的目标语音播放速度,从而使用目标语音播放速度播放应答信息,这样,针对不同的年龄段设置不同的语音播放速度,对每个年龄段的应答信息进行有针对性的播放处理,提升用户的使用体验。
在一个实施例中,所述第二确定模块44用于:
根据预设的年龄范围和预设的语音播放速度的对应关系,确定与所述目标年龄范围对应的目标语音播放速度。
在一个实施例中,所述年龄范围包括第一年龄范围、第二年龄范围和第三年龄范围,其中,第一年龄范围中的年龄大于第二年龄范围中的年龄,第二年龄范围中的年龄大于所述第三年龄范围中的年龄,所述第一年龄范围对应的语音播放速度为第一语音播放速度,所述第二年龄范围对应的语音播放速度为第二语音播放速度,所述第三年龄范围对应的语音播放速度为第三语音播放速度。
在该实施例中,可以设置多个不同的年龄范围,以及与每个范围对应的语音播放速度,从而实现采用目标语音播放速度播放用户需要的应答信息,提升用户的使用体验。
在一个实施例中,所述第一语音播放速度小于所述第二语音播放速度,所述第二语音播放速度小于所述第三语音播放速度。
在该实施例中,针对不同的年龄段,可以设置不同的语音播放速度。以智能儿童设备为例,由于使用者年龄不同,对语音播报的速度使用要求也不同,如年龄较小的用户,耐心较少,语音播报速度加快,会提升使用者的体验。因此,可以设置多个年龄范围以及每个年龄范围对应的语音播报速度。例如,设置1-4岁,年龄较低,使用快速语音播报;4-6岁,年龄中等,使用较快语音播报;6-9岁,年龄较大,使用默认语音播报。其中,可以设置默认语音播报速度标准=1;较快语音播报速度标准=1*1.1;快速语音播报速度标准=1*1.2。这样,针对不同年龄的用户使用不同的语音播放速度,提升了用户的使用体验。
图5是根据一示例性实施例示出的另一种语音处理装置的框图。
如图5所示,在一个实施例中,上述装置还包括:
第二接收模块51,用于接收输入的设置命令;
设置模块52,用于根据所述设置命令,设置不同的年龄范围,以及每个年龄范围对应的语音播放速度。
在该实施例中,用户或者厂商可以设置多个不同的年龄范围,以及每个年龄范围对应的语音播放速度,从而满足不同用户的不同需求。例如,对于智能儿童设备,设置1-4岁,年龄较低,使用快速语音播报;4-6岁,年龄中等,使用较快语音播报;6-9岁,年龄较大,使用默认语音播报。其中,可以设置默认语音播报速度标准=1;较快语音播报速度标准=1*1.1;快速语音播报速度标准=1*1.2。当然,用户或者厂商还可根据个人需求设置其他数值。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种语音处理方法,其特征在于,包括:
接收用户输入的语音信息;
对所述语音信息进行声纹识别,并根据识别结果确定所述用户的年龄;
判断所述用户的年龄所属的目标年龄范围;
确定与所述目标年龄范围对应的目标语音播放速度;
使用所述目标语音播放速度播放所述语音信息对应的应答信息。
2.根据权利要求1所述的方法,其特征在于,所述确定与所述目标年龄范围对应的目标语音播放速度,包括:
根据预设的年龄范围和预设的语音播放速度的对应关系,确定与所述目标年龄范围对应的目标语音播放速度。
3.根据权利要求1所述的方法,其特征在于,所述年龄范围包括第一年龄范围、第二年龄范围和第三年龄范围,其中,第一年龄范围中的年龄大于第二年龄范围中的年龄,第二年龄范围中的年龄大于所述第三年龄范围中的年龄,所述第一年龄范围对应的语音播放速度为第一语音播放速度,所述第二年龄范围对应的语音播放速度为第二语音播放速度,所述第三年龄范围对应的语音播放速度为第三语音播放速度。
4.根据权利要求3所述的方法,其特征在于,所述第一语音播放速度小于所述第二语音播放速度,所述第二语音播放速度小于所述第三语音播放速度。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
接收输入的设置命令;
根据所述设置命令,设置不同的年龄范围,以及每个年龄范围对应的语音播放速度。
6.一种语音处理装置,其特征在于,包括:
第一接收模块,用于接收用户输入的语音信息;
第一确定模块,用于对所述语音信息进行声纹识别,并根据识别结果确定所述用户的年龄;
判断模块,用于判断所述用户的年龄所属的目标年龄范围;
第二确定模块,用于确定与所述目标年龄范围对应的目标语音播放速度;
播放模块,用于使用所述目标语音播放速度播放所述语音信息对应的应答信息。
7.根据权利要求6所述的装置,其特征在于,所述第二确定模块用于:
根据预设的年龄范围和预设的语音播放速度的对应关系,确定与所述目标年龄范围对应的目标语音播放速度。
8.根据权利要求6所述的装置,其特征在于,所述年龄范围包括第一年龄范围、第二年龄范围和第三年龄范围,其中,第一年龄范围中的年龄大于第二年龄范围中的年龄,第二年龄范围中的年龄大于所述第三年龄范围中的年龄,所述第一年龄范围对应的语音播放速度为第一语音播放速度,所述第二年龄范围对应的语音播放速度为第二语音播放速度,所述第三年龄范围对应的语音播放速度为第三语音播放速度。
9.根据权利要求8所述的装置,其特征在于,所述第一语音播放速度小于所述第二语音播放速度,所述第二语音播放速度小于所述第三语音播放速度。
10.根据权利要求6至9中任一项所述的装置,其特征在于,所述装置还包括:
第二接收模块,用于接收输入的设置命令;
设置模块,用于根据所述设置命令,设置不同的年龄范围,以及每个年龄范围对应的语音播放速度。
CN201710510381.1A 2017-06-28 2017-06-28 语音处理方法及装置 Pending CN107170456A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710510381.1A CN107170456A (zh) 2017-06-28 2017-06-28 语音处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710510381.1A CN107170456A (zh) 2017-06-28 2017-06-28 语音处理方法及装置

Publications (1)

Publication Number Publication Date
CN107170456A true CN107170456A (zh) 2017-09-15

Family

ID=59826523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710510381.1A Pending CN107170456A (zh) 2017-06-28 2017-06-28 语音处理方法及装置

Country Status (1)

Country Link
CN (1) CN107170456A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108170452A (zh) * 2017-12-29 2018-06-15 上海与德科技有限公司 机器人的成长方法
JP2020034895A (ja) * 2018-08-30 2020-03-05 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 応答方法及び装置
CN111105791A (zh) * 2018-10-26 2020-05-05 杭州海康威视数字技术股份有限公司 一种声控方法、装置及系统
CN111683181A (zh) * 2020-04-27 2020-09-18 平安科技(深圳)有限公司 基于语音的用户性别年龄识别方法、装置及计算机设备
CN111785262A (zh) * 2020-06-23 2020-10-16 电子科技大学 一种基于残差网络及融合特征的说话人年龄性别分类方法
CN113242468A (zh) * 2021-05-11 2021-08-10 深圳市逸马科技有限公司 一种基于大数据云平台教育数据流的控制方法及系统
CN113539274A (zh) * 2021-06-15 2021-10-22 复旦大学附属肿瘤医院 语音处理方法及装置
CN113596551A (zh) * 2020-04-30 2021-11-02 聚好看科技股份有限公司 显示设备及播放速度调整方法
US11924513B2 (en) 2019-08-18 2024-03-05 Juhaokan Technology Co., Ltd. Display apparatus and method for display user interface

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175081A (ja) * 1997-12-11 1999-07-02 Toshiba Corp 発話装置及び発話方法
JP2001005487A (ja) * 1999-06-18 2001-01-12 Mitsubishi Electric Corp 音声認識装置
US20040215453A1 (en) * 2003-04-25 2004-10-28 Orbach Julian J. Method and apparatus for tailoring an interactive voice response experience based on speech characteristics
CN103024530A (zh) * 2012-12-18 2013-04-03 天津三星电子有限公司 智能电视语音应答系统及方法
CN103236259A (zh) * 2013-03-22 2013-08-07 乐金电子研发中心(上海)有限公司 语音识别处理及反馈系统、语音回复方法
CN103310788A (zh) * 2013-05-23 2013-09-18 北京云知声信息技术有限公司 一种语音信息识别方法及系统
CN105895105A (zh) * 2016-06-06 2016-08-24 北京云知声信息技术有限公司 语音处理方法及装置
CN106098057A (zh) * 2016-06-13 2016-11-09 北京云知声信息技术有限公司 播放语速管理方法及装置
CN106128467A (zh) * 2016-06-06 2016-11-16 北京云知声信息技术有限公司 语音处理方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175081A (ja) * 1997-12-11 1999-07-02 Toshiba Corp 発話装置及び発話方法
JP2001005487A (ja) * 1999-06-18 2001-01-12 Mitsubishi Electric Corp 音声認識装置
US20040215453A1 (en) * 2003-04-25 2004-10-28 Orbach Julian J. Method and apparatus for tailoring an interactive voice response experience based on speech characteristics
CN103024530A (zh) * 2012-12-18 2013-04-03 天津三星电子有限公司 智能电视语音应答系统及方法
CN103236259A (zh) * 2013-03-22 2013-08-07 乐金电子研发中心(上海)有限公司 语音识别处理及反馈系统、语音回复方法
CN103310788A (zh) * 2013-05-23 2013-09-18 北京云知声信息技术有限公司 一种语音信息识别方法及系统
CN105895105A (zh) * 2016-06-06 2016-08-24 北京云知声信息技术有限公司 语音处理方法及装置
CN106128467A (zh) * 2016-06-06 2016-11-16 北京云知声信息技术有限公司 语音处理方法及装置
CN106098057A (zh) * 2016-06-13 2016-11-09 北京云知声信息技术有限公司 播放语速管理方法及装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108170452A (zh) * 2017-12-29 2018-06-15 上海与德科技有限公司 机器人的成长方法
JP2020034895A (ja) * 2018-08-30 2020-03-05 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 応答方法及び装置
US11475897B2 (en) 2018-08-30 2022-10-18 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for response using voice matching user category
CN111105791A (zh) * 2018-10-26 2020-05-05 杭州海康威视数字技术股份有限公司 一种声控方法、装置及系统
US11924513B2 (en) 2019-08-18 2024-03-05 Juhaokan Technology Co., Ltd. Display apparatus and method for display user interface
CN111683181A (zh) * 2020-04-27 2020-09-18 平安科技(深圳)有限公司 基于语音的用户性别年龄识别方法、装置及计算机设备
CN111683181B (zh) * 2020-04-27 2022-04-12 平安科技(深圳)有限公司 基于语音的用户性别年龄识别方法、装置及计算机设备
CN113596551A (zh) * 2020-04-30 2021-11-02 聚好看科技股份有限公司 显示设备及播放速度调整方法
CN111785262A (zh) * 2020-06-23 2020-10-16 电子科技大学 一种基于残差网络及融合特征的说话人年龄性别分类方法
CN111785262B (zh) * 2020-06-23 2022-08-05 电子科技大学 一种基于残差网络及融合特征的说话人年龄性别分类方法
CN113242468A (zh) * 2021-05-11 2021-08-10 深圳市逸马科技有限公司 一种基于大数据云平台教育数据流的控制方法及系统
CN113539274A (zh) * 2021-06-15 2021-10-22 复旦大学附属肿瘤医院 语音处理方法及装置

Similar Documents

Publication Publication Date Title
CN107170456A (zh) 语音处理方法及装置
CN105895105B (zh) 语音处理方法及装置
CN106782536A (zh) 一种语音唤醒方法及装置
CN106128467A (zh) 语音处理方法及装置
CN107871506A (zh) 语音识别功能的唤醒方法及装置
CN109447234A (zh) 一种模型训练方法、合成说话表情的方法和相关装置
CN109817246A (zh) 情感识别模型的训练方法、情感识别方法、装置、设备及存储介质
CN109785820A (zh) 一种处理方法、装置及设备
CN111489424A (zh) 虚拟角色表情生成方法、控制方法、装置和终端设备
CN112099628A (zh) 基于人工智能的vr互动方法、装置、计算机设备及介质
CN112309365B (zh) 语音合成模型的训练方法、装置、存储介质以及电子设备
CN111653265B (zh) 语音合成方法、装置、存储介质和电子设备
CN106782529B (zh) 语音识别的唤醒词选择方法及装置
CN110600013B (zh) 非平行语料声音转换数据增强模型训练方法及装置
CN111414506B (zh) 基于人工智能情绪处理方法、装置、电子设备及存储介质
CN111261195A (zh) 音频测试方法、装置、存储介质及电子设备
CN107342085A (zh) 语音处理方法及装置
CN110602624A (zh) 音频测试方法、装置、存储介质及电子设备
CN114127849A (zh) 语音情感识别方法和装置
CN112750187A (zh) 一种动画生成方法、装置、设备及计算机可读存储介质
JP2016062077A (ja) 対話装置、対話システム、対話プログラム、サーバ、サーバの制御方法およびサーバ制御プログラム
Niebuhr et al. Virtual reality as a digital learning tool in entrepreneurship: How virtual environments help entrepreneurs give more charismatic investor pitches
CN106847273B (zh) 语音识别的唤醒词选择方法及装置
CN108854072A (zh) 一种声音提示方法及装置
CN106098057A (zh) 播放语速管理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170915