CN202475713U - 基于纯语音操作的一体化麦克风 - Google Patents

基于纯语音操作的一体化麦克风 Download PDF

Info

Publication number
CN202475713U
CN202475713U CN2012200688817U CN201220068881U CN202475713U CN 202475713 U CN202475713 U CN 202475713U CN 2012200688817 U CN2012200688817 U CN 2012200688817U CN 201220068881 U CN201220068881 U CN 201220068881U CN 202475713 U CN202475713 U CN 202475713U
Authority
CN
China
Prior art keywords
chip
integrated microphone
integrated
interface
pure voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2012200688817U
Other languages
English (en)
Inventor
林裕旭
杨智
陈伟
刘迪搏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU LAITONG TECHNOLOGY Co Ltd
Original Assignee
HANGZHOU LAITONG TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU LAITONG TECHNOLOGY Co Ltd filed Critical HANGZHOU LAITONG TECHNOLOGY Co Ltd
Priority to CN2012200688817U priority Critical patent/CN202475713U/zh
Application granted granted Critical
Publication of CN202475713U publication Critical patent/CN202475713U/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本实用新型公开了一种基于纯语音操作的一体化麦克风,其特征在于,包括话筒,设置在话筒内的嵌入式处理器,通过AudioA/D芯片与嵌入式处理器相连的音头,与嵌入式处理器相连的存储器、视频编解码器和声音处理与识别系统,设置在话筒上与嵌入式处理器相连的键盘以及与各硬件模块连接的电源管理模块。本实用新型具有的有益效果:儿童可以通过说、唱方式进行相关操作;支持语音识别与评分技术,在识别儿童语音的同时,还能够对儿童发音与标准发音进行比较与评测;集成了嵌入式操作系统、应用软件并支持外置存储,除提供基本的语言与音乐教学功能外,还可以提供基于语音的交互游戏。

Description

基于纯语音操作的一体化麦克风
技术领域
本实用新型涉及一种智能一体化麦克风产品,尤其涉及一种集成纯语音操作控制功能的智能麦克风。
背景技术
在儿童语言与音乐教学领域,麦克风是最适合于儿童的产品形态。儿童在手握麦克风时,既能够满足儿童的表达欲望,大声的说出或是唱出教学内容,还能增强舞台感,提升儿童的表演水平和自信心。另一方面,语音交互作为最直接的交互方式,不仅能够满足还不识字的年龄较小儿童的交互,还非常适合于智能麦克风产品形态。
中国实用新型专利嵌入式卡拉OK机(专利号为:ZL200920119667.8)提供了一种嵌入式卡拉OK机,在麦克风内集成嵌入式处理器、声音处理系统、视频编解码器、存储器和键盘,使麦克风具有卡拉OK、播放DVD(VCD)等功能,集成度高,扩展性强,音质好,容量大,同时,体积小巧,份量适中,便携性好,成本低。但这种卡拉OK机不支持语音交互功能,在儿童语言与音乐教育领域有一定的局限性。
发明内容
本实用新型的目的在于提供一种基于纯语音操作的一体化麦克风,以满足不同阶段儿童在进行语言与音乐相关教育时的交互问题,实现在教学过程中完全利用语音进行交互,有效提高教学效率,提升教学过程趣味性。
本实用新型的上述技术目的主要通过以下技术方案来解决:
基于纯语音操作的一体化麦克风,包括话筒内的嵌入式处理器、音头与AD转换器、存储器、音视频编解码器、电源管理模块、声音处理与识别系统、话筒外部与嵌入式处理器连接的控制键盘。
作为对上述技术方案的进一步完善和补充,本实用新型采用如下技术措施:
所述的话筒内嵌入式处理器为DSP芯片。
所述的存储器包括与DSP芯片相配合的SDRAM芯片、FLASH芯片以及NAND FLASH芯片,并留有与外置存储相连的存储卡读卡接口、USB接口等。
所述的视频编码器为面向多媒体应用的视频Encoder芯片,其内设置有多通道D/A,可输出CVBS、S-Video、VGA等视频信号。
所述的声音处理与识别系统包括与DSP芯片相连的音频芯片和与音频芯片相连的混响芯片。所述音频芯片上的控制接口是I2C接口,音频数据流接口为I2S接口,其与DSP芯片上的SPORT接口相连接。识别系统采用基于HMM(隐马尔可夫模型)声学建模的评分方式。
所述的电源管理模块,包含与各硬件模块相连接的电路。所述电源电路中的电路板采用多层板,电源分类铺地以及内层分割。
所述的控制键盘通过I2C总线或GPIO接口与嵌入式处理器相连。
所述的存储电路、音频电路和视频电路分别集成在存储器芯片、音频芯片和视频Encoder芯片上。
本实用新型具有的有益效果:1.本实用新型采用纯语音操作方式,儿童可以通过说、唱等方式进行相关操作;2.本实用新型的无线话筒支持语音识别与评分技术,在识别儿童语音的同时,还能够对儿童发音与标准发音进行比较与评测;3.智能一体化麦克风集成了嵌入式操作系统、应用软件并支持海量的外置存储,为智能化的儿童教学功能提供了良好的资源和扩展性,除提供基本的语言与音乐教学功能外,还可以提供基于语音的交互游戏,如变声、配音等。
附图说明
图 1 是本实用新型实施例的结构示意图;
图中标号:1-音头、2-Audio A/D芯片、3-嵌入式处理器、4-存储器、5-SDRAM芯片、6-视频编解码器、7-键盘、8-话筒、9-电源管理模板、10-声音处理与识别系统、11-FLASH芯片、12-NANA FLASH芯片、13-外置接口、14-混响芯片、15-音频芯片。
具体实施方式
下面通过实施例,并结合附图,对本实用新型的技术方案作进一步具体的说明。
基于纯语音操作的一体化麦克风,如图1,它包括话筒8,设置在话筒内的嵌入式处理器3,通过Audio A/D芯片2与嵌入式处理器相连的音头1,与嵌入式处理器相连的存储器4、视频编解码器6和声音处理与识别系统10,设置在话筒上与嵌入式处理器相连的键盘7以及与各硬件模块连接的电源管理模块9。
嵌入式处理器为DSP芯片。本实用新型中采用的DSP芯片具有高性能、低功耗、动态电源管理以及微控制器指令集易用等特点,特别的在于,DSP芯片是一种尖端的信号处理芯片,能完成视频、图象、音频、语音和数据通信的数字信号处理,同时还提供综合的控制能力。该芯片能够很好的支持嵌入式Linux系统,驱动成熟,资源丰富。本实用新型采用的操作系统是嵌入式操作系统。嵌入式操作系统稳定、拥有良好的移植性、优秀的网络功能、对各种文件系统完备的支持和标准丰富的API。通过集成强劲的DSP芯片和成熟的嵌入式操作系统,本实用新型能够实现高性能的软硬件功能。
音头采集到的声音信号通过Audio A/D芯片的A/D转换后,通过I2S总线即可将数字音频信号传入到嵌入式处理器。嵌入式处理器对数字音频信号进行处理后交给声音处理与识别系统。
声音处理与识别系统有两部分功能,一是利用原始语音进行识别与评分操作,二是为原始语音加入混响效果。
声音处理与识别系统采用基于HMM(隐马尔可夫模型)声学建模的评分方式,基于识别基元,并通过足够大的数据进行训练,从而准确识别语音输入。系统所需的训练数据大小与模型复杂度有关,对于英语一般采用上下文相关的音素建模,而对于汉语一般采用音节建模。声音识别系统的性能受许多因素的影响,包括不同的说话人、说话方式、环境噪音、传输信道等等。本实用新型能够自动对系统内部参数进行调整,从而提高系统克服这些因素影响的能力,增强语音识别准确性。
声音处理与识别系统包括与DSP芯片相连的音频芯片15和与音频芯片14相连的混响芯片。音频芯片内设有24bit D/A、A/D转化电路,它的控制接口是I2C接口,音频数据流接口为I2S接口,其与DSP芯片上的SPORT接口相连接。DSP芯片读取存储器上的音频文件,经过软件解码后通过I2S接口将音频数据流传送至音频芯片,将收到的数据流实时转换成音频信号输出到混响芯片。混响芯片,集成了动圈或电容式音头的放大、滤波、混响延时、与背景音乐混音等功能,采用3线数字控制方式与DSP芯片连接,最后输出背景音乐和人声混响混合而成的音频信号到电视机或是外接音频输出设备。
存储器包括与DSP芯片相配合的SDRAM芯片5、FLASH芯片11、NAND FLASH芯片12以及外置接口13。可根据实际需要设置外置接口的类型。FLASH芯片用以存放系统的bootloader、内核、文件系统等,容量为4M Bytes。SDRAM芯片是系统的内存芯片,为16位总线,容量为32M或64M Bytes。NAND FLASH 是大容量的闪存芯片,特点是容量大,从128M到几十G都可支持,且接口兼容,用来存放一些大的应用软件、音视频教学资源文件等等,容量大小视用户需求可以调整。外置存储的接口包括常见的存储卡接口(如SD、MicroSD、MMC卡等)、USB接口等,其是系统与用户之间内容交互的接口,用来下载和存放音频、视频、图片等文件。
视频编解码器为面向多媒体应用的视频Encoder芯片,其内设置有多通道D/A。DSP芯片读取存储器上的视频或图片文件进行软件解码,并与OSD菜单叠加,视频D/A芯片最多可输出3路CVBS信号,通过通道组合,还可以单独输出1路VGA信号,或者1路S-VIDEO信号。输出的视频信号直接连接到电视机等设备上。
按键信号通过I2C总线或GPIO中断传输给嵌入式处理器,嵌入式处理器对按键信号进行处理。
电源管理模块与各硬件电路相连。
本实用新型通过在智能一体化麦克风上集成语音识别与评分系统,实现了在儿童语言与音乐教学领域中的纯语音操作方式。系统的设计上采用了以嵌入式操作系统和DSP为软硬件核心的嵌入式系统,具有识别准确率高、音质好、容量扩展性强等优点。
出于示出本实用新型的功能和结构原理的目的示出和描述了实施例,并且在不脱离这样的原理的情况下,可以对其进行修改。因此,本实用新型包括涵盖在所附权利要求的精神和范围内的所有修改。

Claims (9)

1. 基于纯语音操作的一体化麦克风,其特征在于,包括话筒,设置在话筒内的嵌入式处理器,通过Audio A/D芯片与嵌入式处理器相连的音头,与嵌入式处理器相连的存储器、视频编解码器、声音处理与识别系统,设置在话筒上与嵌入式处理器相连的键盘以及与各硬件模块连接的电源管理模块。
2. 如权利要求1所述的基于纯语音操作的一体化麦克风,其特征在于,所述的话筒内嵌入式处理器为DSP芯片。
3. 如权利要求2所述的基于纯语音操作的一体化麦克风,其特征在于,所述的存储器包括与DSP芯片相配合的SDRAM芯片、FLASH芯片以及NAND FLASH芯片,并设有外置接口。
4. 如权利要求1所述的基于纯语音操作的一体化麦克风,其特征在于,所述的视频编解码器为面向多媒体应用的视频Encoder芯片,其内设置有多通道D/A。
5. 如权利要求1所述的基于纯语音操作的一体化麦克风,其特征在于,所述的声音处理与识别系统包括与DSP芯片相连的音频芯片和与音频芯片相连的混响芯片。
6. 如权利要求5所述的基于纯语音操作的一体化麦克风,其特征在于,音频芯片内设有24bit D/A、A/D转化电路,它的控制接口是I2C接口,音频数据流接口为I2S接口,其与DSP芯片上的SPORT接口相连接。
7.如权利要求1所述的基于纯语音操作的一体化麦克风,其特征在于,所述的电源管理模块的电路板采用多层板,电源分类铺地以及内层分割。
8.如权利要求1所述的基于纯语音操作的一体化麦克风,其特征在于,所述的键盘通过I2C总线或GPIO接口与嵌入式处理器相连。
9.如权利要求7所述的基于纯语音操作的一体化麦克风,其特征在于,所述的存储电路、音频电路和视频电路分别集成在存储器芯片、音频芯片和视频Encoder芯片上。
CN2012200688817U 2012-02-29 2012-02-29 基于纯语音操作的一体化麦克风 Expired - Fee Related CN202475713U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012200688817U CN202475713U (zh) 2012-02-29 2012-02-29 基于纯语音操作的一体化麦克风

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012200688817U CN202475713U (zh) 2012-02-29 2012-02-29 基于纯语音操作的一体化麦克风

Publications (1)

Publication Number Publication Date
CN202475713U true CN202475713U (zh) 2012-10-03

Family

ID=46923834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012200688817U Expired - Fee Related CN202475713U (zh) 2012-02-29 2012-02-29 基于纯语音操作的一体化麦克风

Country Status (1)

Country Link
CN (1) CN202475713U (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018201688A1 (en) * 2017-05-05 2018-11-08 Boe Technology Group Co., Ltd. Microphone, vocal training apparatus comprising microphone and vocal analyzer, vocal training method, and non-transitory tangible computer-readable storage medium

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018201688A1 (en) * 2017-05-05 2018-11-08 Boe Technology Group Co., Ltd. Microphone, vocal training apparatus comprising microphone and vocal analyzer, vocal training method, and non-transitory tangible computer-readable storage medium
CN108806720A (zh) * 2017-05-05 2018-11-13 京东方科技集团股份有限公司 话筒、数据处理器、监测系统及监测方法
US20190124441A1 (en) * 2017-05-05 2019-04-25 Boe Technology Group Co., Ltd. Microphone, vocal training apparatus comprising microphone and vocal analyzer, vocal training method, and non-transitory tangible computer-readable storage medium
US10499149B2 (en) 2017-05-05 2019-12-03 Boe Technology Group Co., Ltd. Microphone, vocal training apparatus comprising microphone and vocal analyzer, vocal training method, and non-transitory tangible computer-readable storage medium
CN108806720B (zh) * 2017-05-05 2019-12-06 京东方科技集团股份有限公司 话筒、数据处理器、监测系统及监测方法

Similar Documents

Publication Publication Date Title
CN204496731U (zh) 一种语音控制听写装置
CN109949808A (zh) 兼容普通话和方言的语音识别家电控制系统和方法
CN201868093U (zh) 车载卡拉ok机
CN203289645U (zh) 一种基于无线技术的可对话音响系统
KR20190005103A (ko) 전자기기의 웨이크업 방법, 장치, 디바이스 및 컴퓨터 가독 기억매체
CN201532764U (zh) 车载声控无线宽带网络音频播放器
CN202535490U (zh) 一种智能语音控制的音箱装置
CN202475713U (zh) 基于纯语音操作的一体化麦克风
CN200962258Y (zh) 一种多功能数码学习笔
CN206181355U (zh) 一种语音降噪系统
CN207573602U (zh) 一种基于wifi的一体化智能音响娱乐终端
CN208805783U (zh) 一种集成声卡功能的键盘
CN204926573U (zh) 辅助练习普通话的智能机器人
CN208094741U (zh) 一种基于语音识别技术的智能麦克风
CN103531224B (zh) 应用于嵌入式系统平台的简易语音播放方法
CN108847067A (zh) 一种英语听力训练系统
CN110278501A (zh) 一种具有对外部声源采集和电子处理控制输出的耳机
CN2922042Y (zh) 具有音频处理系统的dvd播放机
CN203596113U (zh) 一种播放装置
CN207925131U (zh) 朗读设备
CN205754816U (zh) 云音效声卡
CN204857133U (zh) 一种基于单片机的导游机
CN2842652Y (zh) 声控点播mp3播放器
CN207897146U (zh) 一种移动拉杆音箱的dsp微型调音台
CN2776505Y (zh) 一种玩具声控装置

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121003

Termination date: 20150229

EXPY Termination of patent right or utility model