CN102339604A - 语音智能交互系统 - Google Patents

语音智能交互系统 Download PDF

Info

Publication number
CN102339604A
CN102339604A CN2010102298159A CN201010229815A CN102339604A CN 102339604 A CN102339604 A CN 102339604A CN 2010102298159 A CN2010102298159 A CN 2010102298159A CN 201010229815 A CN201010229815 A CN 201010229815A CN 102339604 A CN102339604 A CN 102339604A
Authority
CN
China
Prior art keywords
speech
play
module
processing chip
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102298159A
Other languages
English (en)
Inventor
张学政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Oubo Science Industry & Trade Co Ltd
Original Assignee
Xi'an Oubo Science Industry & Trade Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Oubo Science Industry & Trade Co Ltd filed Critical Xi'an Oubo Science Industry & Trade Co Ltd
Priority to CN2010102298159A priority Critical patent/CN102339604A/zh
Publication of CN102339604A publication Critical patent/CN102339604A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

语音智能交互系统,它涉及一种能够进行多级语音对话的人机对话的智能感触语音对话和定时播放学习系统。它包含内容存储播放模块(1)、语音麦克风采集器(2)、启动装置模块(3)、播放系统(4)、语音识别处理芯片(5),语音识别处理芯片(5)和语音麦克风采集器(2)与内容存储播放模块(1)连接,内容存储播放模块(1)与播放系统(4)连接,启动装置模块(3)与内容存储播放模块(1)相互连接。它能定时播放启动学习或娱乐内容,结构简单、识别率高、抗噪性能好、录/放音质量高、可自由下载升级。

Description

语音智能交互系统
技术领域:
本发明涉及一种能够进行多级语音对话的人机对话的智能感触语音对话和定时播放学习系统,具体涉及一种微型SD卡存储方案语音智能交互系统。
背景技术:
语音识别技术,也被称为自动语音识别Automatic SpeechRecognition(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
在电话与通信系统中,智能语音接口正在把电话机从一个单纯的服务工具变成为一个服务的“提供者”和生活“伙伴”;使用电话与通信网络,人们可以通过语音命令方便地从远端的数据库系统中查询与提取有关的信息;随着计算机的小型化,键盘已经成为移动平台的一个很大障碍,想象一下如果手机仅仅只有一个手表那么大,再用键盘进行拨号操作已经是不可能的。语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
随着应用领域的扩大,小词汇表、特定人、孤立词等这些对语音识别的约束条件需要放宽,与此同时也带来了许多新的问题:第一,词汇表的扩大使得模板的选取和建立发生困难;第二,连续语音中,各个音素、音节以及词之间没有明显的边界,各个发音单位存在受上下文强烈影响的协同发音(Co-articulation)现象;第三,非特定人识别时,不同的人说相同的话相应的声学特征有很大的差异,即使相同的人在不同的时间、生理、心理状态下,说同样内容的话也会有很大的差异;第四,识别的语音中有背景噪声或其他干扰。因此原有的模板匹配方法已不再适用。
发明内容:
本发明的目的是提供一种语音智能交互系统,它能定时播放启动学习或娱乐内容,广泛应用在工矿企业、事业单位、学校、家庭等,减少人力资源投入。语音内容具备随时更新的功能,同时使得一部机器通过SD卡内容的变换而使得产品应用变换,结构简单、计算能力强、识别率高、抗噪性能好、录/放音质量高、互动性强、可自由下载升级。
为了解决背景技术所存在的问题,本发明是采用以下技术方案:它包含内容存储播放模块1、语音麦克风采集器2、启动装置模块3、播放系统4、语音识别处理芯片5,语音识别处理芯片5和语音麦克风采集器2与内容存储播放模块1连接,内容存储播放模块1与播放系统4连接,启动装置模块3与内容存储播放模块1相互连接。
所述的内容存储播放模块1可以外接SD卡,并且连接有语音识别处理芯片5。内容存储播放模块1内有多达18种存储节目,如:学习内容(历史、文学等)、娱乐节目(相声、小品等)、对话节目(英语栏目等)。每种存储大类中科存放300个以上的节目,外部的SD卡最多可达3000个以上节目条,可以在玩中掌握学习知识,涵盖生活的方方面面。
所述的启动装置模块3包含感应器a、感应器b和感应器c。启动装置模块3可以安装在车座及脚垫下、家具、天花板等部位,达到车载、家具用的目的。
所述的播放系统4与汽车影音系统或家庭音响系统的语音识别处理芯片及处理器连接,它可以进行定时播放节目设置。本发明使用到车载音乐播放后,以语言控制节目播放,比现在的MP3更富趣味性,同时省去手动控制MP3的过程,有效降低驾驶事故发生。
本发明应用在车载、家居、娱乐、学习方面时的工作原理是:将音频信号转换为调频信号无线发射到车内音响系统,只需要将产品语音识别处理芯片(发射器)插入汽车点烟器座,(并将耳机插头插入播放器耳机输出插孔),然后打开汽车收音机并设定到播放机所发射的频点就能开始工作了;或通过连接线传送到家庭音响系统直接进行播放。
本发明应用在儿童早教或学习产品中时直接内置喇叭,能实现早晚定时播放启动学习或娱乐内容,同时也可广泛应用在工矿企业、事业单位、学校、家庭及旅游导游、酒店客房、公共场所等系统语音服务等,减少人力资源投入。语音内容具备随时更新应用领域的功能,同时使得一部机器通过SD卡内容的变换而使得产品本质变换,结构简单、趣味性互动性强、计算能力强、识别率高、抗噪性能好、录/放音质量高、互动性强、可自由下载升级。
附图说明:
图1为本发明的系统结构图。
具体实施方式:
参照图1,本具体实施方式采用以下技术方案:它包含内容存储播放模块1、语音麦克风采集器2、启动装置模块3、播放系统4、语音识别处理芯片5,语音识别处理芯片5和语音麦克风采集器2与内容存储播放模块1连接,内容存储播放模块1与播放系统4连接,启动装置模块3与内容存储播放模块1相互连接。
所述的内容存储播放模块1可以外接SD卡,并且连接有语音识别处理芯片5。内容存储播放模块1内有多达18种存储节目,如:学习内容(历史、文学等)、娱乐节目(相声、小品等)、对话节目(英语栏目等)。播放系统对内容存储模块的节目大类可设置早晚间定时播放,实现灌耳音式儿童教育。
所述的启动装置模块3包含感应器a、感应器b和感应器c,通过不同的感应器来选择不同的节目。启动装置模块3可以安装在车座及脚垫下、家具、天花板等部位,达到车载、家具用的目的。
所述的播放系统4与汽车影音系统或家庭音响系统的语音识别处理芯片及处理器连接,它可以进行定时播放节目设置,及语音识别启动节目。
本具体实施方式的工作原理是将音频信号转换为调频信号无线发射到车内音响系统,只需要将发射器插入汽车点烟器座,并将耳机插头插入播放器耳机输出插孔,然后打开汽车收音机并设定到播放机所发射的频点就能开始工作了;或通过连接线传送到家庭音响系统直接进行播放。
车载应用方案具体实施方式通过感应系统、智能语音系统启动的对话,系统启动后语音麦克风采集器2采集外界语音并输入内容存储播放模块1自动识别语音,根据识别的语音启动内容存储播放模块1外接的SD卡中所存储的多组类别的海量语音学习节目。所述语音麦克风采集器2采集外界语音输入给内容存储播放模块1中的主芯片并于存放在SD中的内容进行比对、识别确定,由播放系统4输出相应节目类别的音频信号,从而实现了触屏启动以及人机对话,还可以通过语音输入自动调取或连续播放SD卡种所存储节目,实现操作命令语音化、智能化,除语音启动外在播放途中也可通过上下选择键跳跃当前节目,也可手动通过按键选择相应的节目类别。同时也可通过播放系统4设置在每日定点时间自动启动指定节目大类中的若干节目或者通过汽车语音识别处理芯片开关自动同步启动制定节目,使汽车驾驶及乘座人员的旅途更加丰富愉悦,在驾驶的同时智能化学习存储设备中的内容。SD卡可连接电脑下载更多语音学习资讯也可直接通过车载网络系统下载更多语音节目。同时也可连接汽车电路系统,实现语音控制汽车其他开关,或者与家庭电器开关智能匹配,实现语音控制家庭电器。
如果本具体实施方式安装在家庭或酒店公寓,其启动装置模块3及播放系统4可安装在天花上或床头柜、衣柜侧面等地方实现。比如在厨房的中使用时,可实现对话给使用着讲美食、生活常识、笑话等;在书房中使用时,可对话启动为用户播放音乐及百科知识学习知识等;在儿童房使用时,可对话启动童话故事等儿童节目;在汽车上可以语音启动一些丰富旅途生活的娱乐资讯节目,也可定时播放设定的内容等等。本具体实施方式一套机芯可广泛运用到日常生活各个行业中去,为生活提供更加智能化服务。
本具体实施方式能通过定时播放启动、语音识别启动或感应启动的方式来启动学习或娱乐内容,广泛应用在工矿企业、事业单位、学校、家庭旅游导游、酒店客户语音服务等,减少人力资源投入。语音内容具备随时更新的功能,同时使得一部机器通过SD卡内容的变换而使得产品应用行业变换,结构简单、趣味性互动性强、计算能力强、识别率高、抗噪性能好、录/放音质量高、互动性强、可自由下载升级。

Claims (5)

1.语音智能交互系统,其特征在于它包含内容存储播放模块(1)、语音麦克风采集器(2)、启动装置模块(3)、播放系统(4)、语音识别处理芯片(5),语音识别处理芯片(5)和语音麦克风采集器(2)与内容存储播放模块(1)连接,内容存储播放模块(1)与播放系统(4)连接,启动装置模块(3)与内容存储播放模块(1)相互连接。
2.根据权利要求1所述的语音智能交互系统,其特征在于所述的内容存储播放模块(1)外接SD卡,并且连接有语音识别处理芯片(5)。
3.根据权利要求1所述的语音智能交互系统,其特征在于所述的启动装置模块(3)包含感应器a、感应器b和感应器c。
4.根据权利要求1所述的语音智能交互系统,其特征在于所述的播放系统(4)与汽车影音系统的语音识别处理芯片及处理器连接。
5.根据权利要求1所述的语音智能交互系统,其特征在于所述的播放系统(4)与家庭音响系统的语音识别处理芯片及处理器连接。
CN2010102298159A 2010-07-16 2010-07-16 语音智能交互系统 Pending CN102339604A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102298159A CN102339604A (zh) 2010-07-16 2010-07-16 语音智能交互系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102298159A CN102339604A (zh) 2010-07-16 2010-07-16 语音智能交互系统

Publications (1)

Publication Number Publication Date
CN102339604A true CN102339604A (zh) 2012-02-01

Family

ID=45515296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102298159A Pending CN102339604A (zh) 2010-07-16 2010-07-16 语音智能交互系统

Country Status (1)

Country Link
CN (1) CN102339604A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105511641A (zh) * 2016-01-09 2016-04-20 温州智之粹知识产权有限公司 一种声控键盘
CN108880951A (zh) * 2017-05-10 2018-11-23 杭州欧维客信息科技股份有限公司 语音智能管家综合应用一体化系统
CN110706702A (zh) * 2019-10-15 2020-01-17 芜湖盟博科技有限公司 一种语音识别无限级多轮对话方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2790844Y (zh) * 2005-04-28 2006-06-28 张军 一种车载播放器
CN101281745A (zh) * 2008-05-23 2008-10-08 深圳市北科瑞声科技有限公司 一种车载语音交互系统
CN201142704Y (zh) * 2007-11-26 2008-10-29 厉天福 一种车载多媒体免提音频装置
CN201174237Y (zh) * 2007-10-31 2008-12-31 陈修志 声控式汽车音响
CN201754335U (zh) * 2010-07-16 2011-03-02 西安欧博科工贸有限公司 一种语音智能交互装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2790844Y (zh) * 2005-04-28 2006-06-28 张军 一种车载播放器
CN201174237Y (zh) * 2007-10-31 2008-12-31 陈修志 声控式汽车音响
CN201142704Y (zh) * 2007-11-26 2008-10-29 厉天福 一种车载多媒体免提音频装置
CN101281745A (zh) * 2008-05-23 2008-10-08 深圳市北科瑞声科技有限公司 一种车载语音交互系统
CN201754335U (zh) * 2010-07-16 2011-03-02 西安欧博科工贸有限公司 一种语音智能交互装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105511641A (zh) * 2016-01-09 2016-04-20 温州智之粹知识产权有限公司 一种声控键盘
CN108880951A (zh) * 2017-05-10 2018-11-23 杭州欧维客信息科技股份有限公司 语音智能管家综合应用一体化系统
CN110706702A (zh) * 2019-10-15 2020-01-17 芜湖盟博科技有限公司 一种语音识别无限级多轮对话方法

Similar Documents

Publication Publication Date Title
US11195531B1 (en) Accessory for a voice-controlled device
US10540970B2 (en) Architectures and topologies for vehicle-based, voice-controlled devices
CN102855874B (zh) 基于互联网语音交互的家电控制方法及系统
US10789948B1 (en) Accessory for a voice controlled device for output of supplementary content
CN106537496A (zh) 终端装置、信息提供系统、信息呈现方法和信息提供方法
CN201892945U (zh) 智能电子服务员
JP6783339B2 (ja) 音声を処理する方法及び装置
CN102855872A (zh) 基于终端及互联网语音交互的家电控制方法及系统
CN106537497A (zh) 信息管理系统和信息管理方法
CN102847325B (zh) 基于移动通讯终端语音交互的玩具控制方法及系统
US10629199B1 (en) Architectures and topologies for vehicle-based, voice-controlled devices
CN103546790A (zh) 基于移动终端与互动电视语言交互的方法及系统
CN104873062A (zh) 一种具有语音控制功能的水杯
CN103208285A (zh) 基于移动通讯终端语音交互的家电控制方法及系统
CN102339604A (zh) 语音智能交互系统
CN113920993A (zh) 一种语音交互毛绒玩具的智能唤醒方法及装置
CN203399142U (zh) 工作学习应用机器人
CN104317404A (zh) 一种声纹控制音频播放设备、控制系统及方法
CN201754335U (zh) 一种语音智能交互装置
US11790913B2 (en) Information providing method, apparatus, and storage medium, that transmit related information to a remote terminal based on identification information received from the remote terminal
Zeng et al. Design and performance evaluation of voice activated wireless home devices
Fujita et al. A new digital TV interface employing speech recognition
JP7333371B2 (ja) 話者分離基盤の自動通訳方法、話者分離基盤の自動通訳サービスを提供するユーザ端末、及び、話者分離基盤の自動通訳サービス提供システム
CN201196877Y (zh) 声控式家庭音响
CN114817514A (zh) 回复音频的确定方法及装置、存储介质及电子装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120201