CN103700382A - 一种可以自由定制对话的语音点播装置 - Google Patents

一种可以自由定制对话的语音点播装置 Download PDF

Info

Publication number
CN103700382A
CN103700382A CN201310700658.9A CN201310700658A CN103700382A CN 103700382 A CN103700382 A CN 103700382A CN 201310700658 A CN201310700658 A CN 201310700658A CN 103700382 A CN103700382 A CN 103700382A
Authority
CN
China
Prior art keywords
main control
control module
audio
dialogue
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310700658.9A
Other languages
English (en)
Inventor
孙秀明
刘丛刚
谭雪辉
吴晓春
谢信珍
黄海兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201310700658.9A priority Critical patent/CN103700382A/zh
Publication of CN103700382A publication Critical patent/CN103700382A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明提供一种可以自由定制对话的语音点播装置,包括音频输入装置(1)、触发装置(2)、音频播放装置(3)、主控模块(4)和存储器(5),所述的主控模块(4),其信号输入端分别与音频输入装置(1)、触发装置(2)的信号输出端相连,其信号输出端与音频播放装置(3)的信号输入端相连,主控模块(4)与存储器(5)相连。本发明通过触发装置触发主控模块播放识别启动提示音,以提示使用者说出对话命令词;主控模块启动语音识别功能,通过音频输入装置采集用户的语音信号;主控模块对采集到的用户语音信号进行处理和识别,转换为音频文件的存储信息;主控模块根据存储信息读取存储器中相应的音频文件,并通过音频播放装置进行播放。

Description

一种可以自由定制对话的语音点播装置
技术领域
本发明涉及一种语音点播装置,尤其是一种可以自由定制对话的语音点播装置。
背景技术
基于目前的技术,可以实现人与机器之间的对话,增强了人机对话的趣味性。
但是,目前市面常用的人机对话装置,主要是以对话玩具和机器人为主,此类装置的对话命令词固定,必须是开发人员事先在装置中预置的命令词,无法让实际用户根据需要自由定制对话。这样大大降低了整个装置的可玩性和趣味性。
发明内容
本发明的目的在于提供一种利用语音识别技术,能够快速、精准地点播装置中所存储的对话文件并可以自由定制对话命令词和对话内容的语音点播装置。
为实现上述目的,本发明采用了以下技术方案:一种可以自由定制对话的语音点播装置,包括音频输入装置、触发装置、音频播放装置、主控模块和存储器,所述的主控模块,其信号输入端分别与音频输入装置、触发装置的信号输出端相连,其信号输出端与音频播放装置的信号输入端相连,主控模块与存储器相连。
所述的音频输入装置采用麦克风。
所述的触发装置采用按键或感应触控装置。
所述的音频播放装置采用音频放大器、扬声器和/或耳机。
所述的主控模块、音频输入装置、音频播放装置和存储器均位于实体的壳体内,该壳体上开设有与麦克风大小相吻合的通孔,该壳体上设有与扬声器大小相吻合的镂空面板,所述的触发装置固设在壳体内或者壳体上。
进一步的,存储器内可以存储音频文件,对话定制人员可以通过电脑等工具对存储器进行读入和擦写,对话定制人员需要将目标对话命令词作为音频名称,将装置的回答语作为音频内容。
进一步的,使用者通过触发装置触发主控模块播放识别启动提示语,以提示使用者说出对话命令词;主控模块启动语音识别功能(此功能为当前成熟的技术),通过音频输入装置采集用户的语音信号;主控模块对采集到的用户语音信号进行处理和识别,转换为音频文件的存储信息;主控模块根据存储信息读取存储器中相应的音频文件,并通过音频播放装置进行播放。
进一步的,当前音频文件播放完毕,不会继续播放下一个音频文件,而是直接触发主控模块播放识别启动提示语,提示使用者可以继续进行对话。
由上述技术方案可知,本发明通过触发装置触发主控模块播放识别启动提示音,以提示使用者说出对话命令词;主控模块启动语音识别功能,通过音频输入装置采集用户的语音信号;主控模块对采集到的用户语音信号进行处理和识别,转换为音频文件的存储信息;主控模块根据存储信息读取存储器中相应的音频文件,并通过音频播放装置进行播放。此音频文件的名称就是对话命令词,音频文件的播放内容就是装置的回答语。音频文件播放完毕,不会继续播放下一个音频文件,而是直接播放主控模块识别提示语,提示使用者可以继续进行对话。
本发明具体改进之处在于:
1、改变对话功能的实现方式,降低对话功能定制的门槛。目前市场既有的对话装置,对话功能是开发人员预置的,是固定在装置中的。一旦装置开发、生产完毕,普通用户无法修改、定制对话命令词和对话回答语。本发明通过语音点播音频文件的方式来实现对话功能,这样就给普通用户提供一种对话定制方法:将音频文件的名称作为对话命令词,将音频文件的播放内容作为对话回答语。只要借用电脑或者其他音频处理工具,完成对音频文件的录制和重命名,然后把音频文件存放于本发明所述装置的存储器中即可。
2、本发明的主控模块可以采用科大讯飞MicroSpeech2501芯片,可以同时对存储器中的3000个音频文件进行点播。通过此办法,极大的扩展了语音对话数量。目前市面常用的对话装置产品,只能进行30~50个命令词的识别。
3、普通使用者可以自己定制对话命令词和对话回答语,并且可以支持3000个命令词的点播。基于以上两个基础,普通使用者可以将一个音频文件命名为不同的文件名称,从而可以达到自由识别以及模糊识别的效果。例如:关于“你叫什么名字”,说法可以有“你叫什么名字”、“你的名字是什么”、“告诉我你的名字吧”、“我想知道你的名字”、“你能告诉我你的名字吗”……,如果采用传统的对话装置,由于命令词限制,可能只能固定识别一个命令词。如果采用本发明所涉及到的装置,普通使用者可以把“你叫什么名字.mp3”重命名为“你叫什么名字.mp3”、“你的名字是什么.mp3”、“告诉我你的名字吧.mp3”、“我想知道你的名字.mp3”、“你能告诉我你的名字吗.mp3”……,这些音频文件的播放内容都是相同的,例如都是“我叫聪明可爱的小小机器人”。按照此方法,使用者在对话时,只要说出上述说法中的一种,就可以得到“我叫聪明可爱的小小机器人”的回答。通过此种方法,装置可以在一定程度实现自由识别以及模糊识别。
此发明的创新之处在于:
1、巧妙借用语音点播音频文件的方式来实现对话功能,将音频文件的名称作为对话命令词,将音频文件的播放内容作为对话回答语。对话定制人员只要在存储介质中放置相应的音频文件,将装置的回答语事先录制到音频文件中,将音频文件的名称设置为目标命令词,就可以实现自由定制对话,非常方便快捷。
2、当前音频文件播放完毕,不会继续播放下一个音频文件,而是直接播放识别启动提示语,提示使用者可以继续对话,这样就可以持续不断的引导使用者进行对话。这是在用户体验上让使用者产生强烈的人机对话的体验效果,以区别于传统的语音点播音乐播放器。
附图说明
图1是本发明的结构示意图。
具体实施方式
下面结合附图以及具体实施例进一步说明本发明。
一种可以自由定制对话的语音点播装置,包括主控模块4,其信号输入端分别与音频输入装置1、触发装置2的信号输出端相连,其信号输出端与音频播放装置3的信号输入端相连,主控模块4与存储器5相连,存储器5内存储有音频文件。
如图1所示,所述的音频输入装置1采用麦克风,所述的触发装置2采用按键或感应触控装置,所述的音频播放装置3采用音频放大器、扬声器和/或耳机。
如图1所示,所述的主控模块4、音频输入装置1、音频播放装置3和存储器5均位于壳体内,该壳体上开设有与麦克风大小相吻合的通孔,该壳体上设有与扬声器大小相吻合的镂空面板,所述的触发装置2固设在壳体内或者壳体上。
存储器5内可以存储音频文件,对话定制人员可以通过电脑等工具对存储器5进行读入和擦写。对话定制人员需要将目标对话命令词作为音频名称,将装置的回答语作为音频内容。例如定制人员如果想让装置对“你从哪里来”命令词进行回答,则需要在存储器中新建一个名称为“你从哪里来.mp3”音频文件,然后将机器的回答语“我来自浩渺宇宙的另一端,我的星球叫做摩羯星座”录制到“你从哪里来.mp3”文件中。
在使用时,使用者通过触发装置2触发主控模块4播放识别启动提示语,以提示使用者说出对话命令词;主控模块4启动语音识别功能(此功能为当前成熟的技术),通过音频输入装置1采集用户的语音信号;主控模块4对采集到的用户语音信号进行处理和识别,转换为音频文件的存储信息;主控模块4根据存储信息读取存储器5中相应的音频文件,并通过音频播放装置3进行播放。音频文件播放完毕,不会继续播放下一个音频文件,而是直接触发主控模块4播放识别启动提示语,提示使用者可以继续进行对话。
例如:使用者触发装置2,则主控模块4播放识别启动提示语“主人,请吩咐!”,然后使用者说“你从哪里来”,则主控模块4经过相关处理和运算,对存储器5中的“你从哪里来.mp3”文件进行播放,播放内容是“我来自浩渺宇宙的另一端,我的星球叫做摩羯星座”。此文件播放完毕,主控模块4播放识别启动提示语“主人,请吩咐!”,开始新的对话过程。

Claims (8)

1.一种可以自由定制对话的语音点播装置,其特征在于:包括音频输入装置(1)、触发装置(2)、音频播放装置(3)、主控模块(4)和存储器(5),所述的主控模块(4),其信号输入端分别与音频输入装置(1)、触发装置(2)的信号输出端相连,其信号输出端与音频播放装置(3)的信号输入端相连,主控模块(4)与存储器(5)相连。
2.根据权利要求1所述的一种可以自由定制对话的语音点播装置,其特征在于:所述的音频输入装置(1)采用麦克风。
3.根据权利要求1所述的一种可以自由定制对话的语音点播装置,其特征在于:所述的触发装置(2)采用按键或感应触控装置。
4.根据权利要求1所述的一种可以自由定制对话的语音点播装置,其特征在于:所述的音频播放装置(3)采用音频放大器、扬声器和/或耳机。
5.根据权利要求1所述的一种可以自由定制对话的语音点播装置,其特征在于:所述的主控模块(4)、音频输入装置(1)、音频播放装置(3)和存储器(5)均位于实体的壳体内,该壳体上开设有与麦克风大小相吻合的通孔,该壳体上设有与扬声器大小相吻合的镂空面板,所述的触发装置(2)固设在壳体内或者壳体上。
6.根据权利要求1所述的一种可以自由定制对话的语音点播装置,其特征在于:存储器(5)内可以存储音频文件,对话定制人员可以通过电脑等工具对存储器(5)进行读入和擦写,对话定制人员需要将目标对话命令词作为音频名称,将装置的回答语作为音频内容。
7.根据权利要求1所述的一种可以自由定制对话的语音点播装置,其特征在于:使用者通过触发装置(2)触发主控模块(4)播放识别启动提示语,以提示使用者说出对话命令词;主控模块(4)启动语音识别功能,通过音频输入装置(1)采集用户的语音信号;主控模块(4)对采集到的用户语音信号进行处理和识别,转换为音频文件的存储信息;主控模块(4)根据存储信息读取存储器(5)中相应的音频文件,并通过音频播放装置(3)进行播放。
8.根据权利要求1所述的一种可以自由定制对话的语音点播装置,其特征在于:当前音频文件播放完毕,不会继续播放下一个音频文件,而是直接触发主控模块(4)播放识别启动提示语,提示使用者可以继续进行对话。
CN201310700658.9A 2013-12-18 2013-12-18 一种可以自由定制对话的语音点播装置 Pending CN103700382A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310700658.9A CN103700382A (zh) 2013-12-18 2013-12-18 一种可以自由定制对话的语音点播装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310700658.9A CN103700382A (zh) 2013-12-18 2013-12-18 一种可以自由定制对话的语音点播装置

Publications (1)

Publication Number Publication Date
CN103700382A true CN103700382A (zh) 2014-04-02

Family

ID=50361885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310700658.9A Pending CN103700382A (zh) 2013-12-18 2013-12-18 一种可以自由定制对话的语音点播装置

Country Status (1)

Country Link
CN (1) CN103700382A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103943105A (zh) * 2014-04-18 2014-07-23 安徽科大讯飞信息科技股份有限公司 一种语音交互方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040088062A1 (en) * 2002-10-09 2004-05-06 Kabushiki Kaisha Toshiba Audio device and optical disk device
CN202282158U (zh) * 2011-10-17 2012-06-20 安徽科大讯飞信息科技股份有限公司 一种用于儿童玩具的语音点播装置
CN202816170U (zh) * 2012-09-11 2013-03-20 安徽科大讯飞信息科技股份有限公司 一种基于语音交互的英语学习装置
CN203631122U (zh) * 2013-12-18 2014-06-04 安徽科大讯飞信息科技股份有限公司 一种可以自由定制对话的语音点播装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040088062A1 (en) * 2002-10-09 2004-05-06 Kabushiki Kaisha Toshiba Audio device and optical disk device
CN202282158U (zh) * 2011-10-17 2012-06-20 安徽科大讯飞信息科技股份有限公司 一种用于儿童玩具的语音点播装置
CN202816170U (zh) * 2012-09-11 2013-03-20 安徽科大讯飞信息科技股份有限公司 一种基于语音交互的英语学习装置
CN203631122U (zh) * 2013-12-18 2014-06-04 安徽科大讯飞信息科技股份有限公司 一种可以自由定制对话的语音点播装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103943105A (zh) * 2014-04-18 2014-07-23 安徽科大讯飞信息科技股份有限公司 一种语音交互方法及系统

Similar Documents

Publication Publication Date Title
CN102568478B (zh) 一种基于语音识别的视频播放控制方法和系统
US10186262B2 (en) System with multiple simultaneous speech recognizers
US10089974B2 (en) Speech recognition and text-to-speech learning system
CN110970014B (zh) 语音转换、文件生成、播音、语音处理方法、设备及介质
CN109378006B (zh) 一种跨设备声纹识别方法及系统
KR20140089863A (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
CN106971723A (zh) 语音处理方法和装置、用于语音处理的装置
CN108882101B (zh) 一种智能音箱的播放控制方法、装置、设备及存储介质
CN102385860A (zh) 信息处理设备、信息处理方法及程序
CN104123115A (zh) 一种音频信息处理方法及电子设备
CN104123938A (zh) 语音控制系统、电子装置及语音控制方法
CN204496731U (zh) 一种语音控制听写装置
US20190333514A1 (en) Method and apparatus for dialoguing based on a mood of a user
JP2020003774A (ja) 音声を処理する方法及び装置
CN111199732A (zh) 一种基于情感的语音交互方法、存储介质及终端设备
CN104123930A (zh) 喉音识别方法及装置
CN110223677A (zh) 空间音频信号滤波
CN107371075A (zh) 麦克风
CN105006179A (zh) 语音输入的内容跟读方法和装置
CN110706707A (zh) 用于语音交互的方法、装置、设备和计算机可读存储介质
CN108702568A (zh) 一种测试音频回路时延的方法及设备
CN201532764U (zh) 车载声控无线宽带网络音频播放器
CN113205569B (zh) 图像绘制方法及装置、计算机可读介质和电子设备
CN108492826B (zh) 音频处理方法、装置、智能设备及介质
CN202076003U (zh) 一种智能语音控制便携式音响

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140402