CN103700382A

CN103700382A - 一种可以自由定制对话的语音点播装置

Info

Publication number: CN103700382A
Application number: CN201310700658.9A
Authority: CN
Inventors: 孙秀明; 刘丛刚; 谭雪辉; 吴晓春; 谢信珍; 黄海兵
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2013-12-18
Filing date: 2013-12-18
Publication date: 2014-04-02

Abstract

本发明提供一种可以自由定制对话的语音点播装置，包括音频输入装置（1）、触发装置（2）、音频播放装置（3）、主控模块（4）和存储器（5），所述的主控模块（4），其信号输入端分别与音频输入装置（1）、触发装置（2）的信号输出端相连，其信号输出端与音频播放装置（3）的信号输入端相连，主控模块（4）与存储器（5）相连。本发明通过触发装置触发主控模块播放识别启动提示音，以提示使用者说出对话命令词；主控模块启动语音识别功能，通过音频输入装置采集用户的语音信号；主控模块对采集到的用户语音信号进行处理和识别，转换为音频文件的存储信息；主控模块根据存储信息读取存储器中相应的音频文件，并通过音频播放装置进行播放。

Description

一种可以自由定制对话的语音点播装置

技术领域

本发明涉及一种语音点播装置，尤其是一种可以自由定制对话的语音点播装置。

背景技术

基于目前的技术，可以实现人与机器之间的对话，增强了人机对话的趣味性。

但是，目前市面常用的人机对话装置，主要是以对话玩具和机器人为主，此类装置的对话命令词固定，必须是开发人员事先在装置中预置的命令词，无法让实际用户根据需要自由定制对话。这样大大降低了整个装置的可玩性和趣味性。

发明内容

本发明的目的在于提供一种利用语音识别技术，能够快速、精准地点播装置中所存储的对话文件并可以自由定制对话命令词和对话内容的语音点播装置。

为实现上述目的，本发明采用了以下技术方案：一种可以自由定制对话的语音点播装置，包括音频输入装置、触发装置、音频播放装置、主控模块和存储器，所述的主控模块，其信号输入端分别与音频输入装置、触发装置的信号输出端相连，其信号输出端与音频播放装置的信号输入端相连，主控模块与存储器相连。

所述的音频输入装置采用麦克风。

所述的触发装置采用按键或感应触控装置。

所述的音频播放装置采用音频放大器、扬声器和/或耳机。

所述的主控模块、音频输入装置、音频播放装置和存储器均位于实体的壳体内，该壳体上开设有与麦克风大小相吻合的通孔，该壳体上设有与扬声器大小相吻合的镂空面板，所述的触发装置固设在壳体内或者壳体上。

进一步的，存储器内可以存储音频文件，对话定制人员可以通过电脑等工具对存储器进行读入和擦写，对话定制人员需要将目标对话命令词作为音频名称，将装置的回答语作为音频内容。

进一步的，使用者通过触发装置触发主控模块播放识别启动提示语，以提示使用者说出对话命令词；主控模块启动语音识别功能（此功能为当前成熟的技术），通过音频输入装置采集用户的语音信号；主控模块对采集到的用户语音信号进行处理和识别，转换为音频文件的存储信息；主控模块根据存储信息读取存储器中相应的音频文件，并通过音频播放装置进行播放。

进一步的，当前音频文件播放完毕，不会继续播放下一个音频文件，而是直接触发主控模块播放识别启动提示语，提示使用者可以继续进行对话。

由上述技术方案可知，本发明通过触发装置触发主控模块播放识别启动提示音，以提示使用者说出对话命令词；主控模块启动语音识别功能，通过音频输入装置采集用户的语音信号；主控模块对采集到的用户语音信号进行处理和识别，转换为音频文件的存储信息；主控模块根据存储信息读取存储器中相应的音频文件，并通过音频播放装置进行播放。此音频文件的名称就是对话命令词，音频文件的播放内容就是装置的回答语。音频文件播放完毕，不会继续播放下一个音频文件，而是直接播放主控模块识别提示语，提示使用者可以继续进行对话。

本发明具体改进之处在于：

1、改变对话功能的实现方式，降低对话功能定制的门槛。目前市场既有的对话装置，对话功能是开发人员预置的，是固定在装置中的。一旦装置开发、生产完毕，普通用户无法修改、定制对话命令词和对话回答语。本发明通过语音点播音频文件的方式来实现对话功能，这样就给普通用户提供一种对话定制方法：将音频文件的名称作为对话命令词，将音频文件的播放内容作为对话回答语。只要借用电脑或者其他音频处理工具，完成对音频文件的录制和重命名，然后把音频文件存放于本发明所述装置的存储器中即可。

2、本发明的主控模块可以采用科大讯飞MicroSpeech2501芯片，可以同时对存储器中的3000个音频文件进行点播。通过此办法，极大的扩展了语音对话数量。目前市面常用的对话装置产品，只能进行30～50个命令词的识别。

3、普通使用者可以自己定制对话命令词和对话回答语，并且可以支持3000个命令词的点播。基于以上两个基础，普通使用者可以将一个音频文件命名为不同的文件名称，从而可以达到自由识别以及模糊识别的效果。例如：关于“你叫什么名字”，说法可以有“你叫什么名字”、“你的名字是什么”、“告诉我你的名字吧”、“我想知道你的名字”、“你能告诉我你的名字吗”……，如果采用传统的对话装置，由于命令词限制，可能只能固定识别一个命令词。如果采用本发明所涉及到的装置，普通使用者可以把“你叫什么名字.mp3”重命名为“你叫什么名字.mp3”、“你的名字是什么.mp3”、“告诉我你的名字吧.mp3”、“我想知道你的名字.mp3”、“你能告诉我你的名字吗.mp3”……，这些音频文件的播放内容都是相同的，例如都是“我叫聪明可爱的小小机器人”。按照此方法，使用者在对话时，只要说出上述说法中的一种，就可以得到“我叫聪明可爱的小小机器人”的回答。通过此种方法，装置可以在一定程度实现自由识别以及模糊识别。

此发明的创新之处在于：

1、巧妙借用语音点播音频文件的方式来实现对话功能，将音频文件的名称作为对话命令词，将音频文件的播放内容作为对话回答语。对话定制人员只要在存储介质中放置相应的音频文件，将装置的回答语事先录制到音频文件中，将音频文件的名称设置为目标命令词，就可以实现自由定制对话，非常方便快捷。

2、当前音频文件播放完毕，不会继续播放下一个音频文件，而是直接播放识别启动提示语，提示使用者可以继续对话，这样就可以持续不断的引导使用者进行对话。这是在用户体验上让使用者产生强烈的人机对话的体验效果，以区别于传统的语音点播音乐播放器。

附图说明

图1是本发明的结构示意图。

具体实施方式

下面结合附图以及具体实施例进一步说明本发明。

一种可以自由定制对话的语音点播装置，包括主控模块4，其信号输入端分别与音频输入装置1、触发装置2的信号输出端相连，其信号输出端与音频播放装置3的信号输入端相连，主控模块4与存储器5相连，存储器5内存储有音频文件。

如图1所示，所述的音频输入装置1采用麦克风，所述的触发装置2采用按键或感应触控装置，所述的音频播放装置3采用音频放大器、扬声器和/或耳机。

如图1所示，所述的主控模块4、音频输入装置1、音频播放装置3和存储器5均位于壳体内，该壳体上开设有与麦克风大小相吻合的通孔，该壳体上设有与扬声器大小相吻合的镂空面板，所述的触发装置2固设在壳体内或者壳体上。

存储器5内可以存储音频文件，对话定制人员可以通过电脑等工具对存储器5进行读入和擦写。对话定制人员需要将目标对话命令词作为音频名称，将装置的回答语作为音频内容。例如定制人员如果想让装置对“你从哪里来”命令词进行回答，则需要在存储器中新建一个名称为“你从哪里来.mp3”音频文件，然后将机器的回答语“我来自浩渺宇宙的另一端，我的星球叫做摩羯星座”录制到“你从哪里来.mp3”文件中。

在使用时，使用者通过触发装置2触发主控模块4播放识别启动提示语，以提示使用者说出对话命令词；主控模块4启动语音识别功能（此功能为当前成熟的技术），通过音频输入装置1采集用户的语音信号；主控模块4对采集到的用户语音信号进行处理和识别，转换为音频文件的存储信息；主控模块4根据存储信息读取存储器5中相应的音频文件，并通过音频播放装置3进行播放。音频文件播放完毕，不会继续播放下一个音频文件，而是直接触发主控模块4播放识别启动提示语，提示使用者可以继续进行对话。

例如：使用者触发装置2，则主控模块4播放识别启动提示语“主人，请吩咐！”，然后使用者说“你从哪里来”，则主控模块4经过相关处理和运算，对存储器5中的“你从哪里来.mp3”文件进行播放，播放内容是“我来自浩渺宇宙的另一端，我的星球叫做摩羯星座”。此文件播放完毕，主控模块4播放识别启动提示语“主人，请吩咐！”，开始新的对话过程。

Claims

1.一种可以自由定制对话的语音点播装置，其特征在于：包括音频输入装置（1）、触发装置（2）、音频播放装置（3）、主控模块（4）和存储器（5），所述的主控模块（4），其信号输入端分别与音频输入装置（1）、触发装置（2）的信号输出端相连，其信号输出端与音频播放装置（3）的信号输入端相连，主控模块（4）与存储器（5）相连。

2.根据权利要求1所述的一种可以自由定制对话的语音点播装置，其特征在于：所述的音频输入装置（1）采用麦克风。

3.根据权利要求1所述的一种可以自由定制对话的语音点播装置，其特征在于：所述的触发装置（2）采用按键或感应触控装置。

4.根据权利要求1所述的一种可以自由定制对话的语音点播装置，其特征在于：所述的音频播放装置（3）采用音频放大器、扬声器和/或耳机。

5.根据权利要求1所述的一种可以自由定制对话的语音点播装置，其特征在于：所述的主控模块（4）、音频输入装置（1）、音频播放装置（3）和存储器（5）均位于实体的壳体内，该壳体上开设有与麦克风大小相吻合的通孔，该壳体上设有与扬声器大小相吻合的镂空面板，所述的触发装置（2）固设在壳体内或者壳体上。

6.根据权利要求1所述的一种可以自由定制对话的语音点播装置，其特征在于：存储器（5）内可以存储音频文件，对话定制人员可以通过电脑等工具对存储器（5）进行读入和擦写，对话定制人员需要将目标对话命令词作为音频名称，将装置的回答语作为音频内容。

7.根据权利要求1所述的一种可以自由定制对话的语音点播装置，其特征在于：使用者通过触发装置（2）触发主控模块（4）播放识别启动提示语，以提示使用者说出对话命令词；主控模块（4）启动语音识别功能，通过音频输入装置（1）采集用户的语音信号；主控模块（4）对采集到的用户语音信号进行处理和识别，转换为音频文件的存储信息；主控模块（4）根据存储信息读取存储器（5）中相应的音频文件，并通过音频播放装置（3）进行播放。

8.根据权利要求1所述的一种可以自由定制对话的语音点播装置，其特征在于：当前音频文件播放完毕，不会继续播放下一个音频文件，而是直接触发主控模块（4）播放识别启动提示语，提示使用者可以继续进行对话。