CN105489219A - 室内空间服务机器人分布式语音识别系统与产品 - Google Patents
室内空间服务机器人分布式语音识别系统与产品 Download PDFInfo
- Publication number
- CN105489219A CN105489219A CN201610003168.7A CN201610003168A CN105489219A CN 105489219 A CN105489219 A CN 105489219A CN 201610003168 A CN201610003168 A CN 201610003168A CN 105489219 A CN105489219 A CN 105489219A
- Authority
- CN
- China
- Prior art keywords
- speech recognition
- recognition system
- service robot
- distributed
- distributed speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 claims abstract description 18
- 238000003032 molecular docking Methods 0.000 claims abstract description 5
- 238000004891 communication Methods 0.000 claims description 6
- 239000004744 fabric Substances 0.000 claims description 6
- 238000009434 installation Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 abstract description 6
- 241000282414 Homo sapiens Species 0.000 abstract 1
- 238000012360 testing method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Manipulator (AREA)
Abstract
本发明涉及一种室内空间服务机器人分布式语音识别系统与产品,该系统包括硬件部分和软件部分,系统的硬件部分由服务机器人自带的麦克风、多个分布式麦克风矩阵单元设备、分布式语音识别系统主机三部分组成;软件部分包括在服务机器人上安装的分布式语音识别系统的应用软件、分布式语音识别系统主机的控制管理软件;本系统需与互联网进行连接,且与语音云进行系统对接,让本系统采集到的语音信息能够被可靠识别。本发明的有益效果是,提升服务机器人的语音识别能力,通过合理的设计与布局,能够实现室内空间3600无死角的语音识别,从而让服务机器人与人的交互更加顺畅。
Description
技术领域
本发明涉及一种室内空间服务机器人分布式语音识别系统与产品,该系统包括硬件部分和软件部分,系统的硬件部分由服务机器人自带的麦克风、多个分布式麦克风矩阵单元设备、分布式语音识别系统主机三部分组成;软件部分包括在服务机器人上安装的分布式语音识别系统的应用软件、分布式语音识别系统主机的控制管理软件;本系统需与互联网进行连接,且与语音云进行系统对接,让本系统采集到的语音信息能够被可靠识别。
背景技术
目前服务机器人,无论是桌面型的陪伴型机器人,还是可移动的迎宾机器人、送餐机器人,人机交互距离都遇到瓶颈,人们必须十分靠近服务机器人说话,语音才能被服务机器人有效识别,这一距离通常在1米左右,在加了麦克风矩阵的远场识别模块后,在安静的空间这一交互距离可扩展到5米左右,但即使这样,当人未正对服务机器人的麦克风、或者远离服务机器人5米之外、或者人和服务机器人在不同的房间时,服务机器人仍无法获得清晰的语音信息从而无法进行语音识别,导致人机交互失败。
发明内容
为了让服务机器人在室内空间能够连续、准确地捕捉人的语音信息,为语音识别系统提供稳定可靠的人机交互语音来源,本发明提供一种室内空间服务机器人分布式语音识别系统与产品,该系统自动分析评估室内空间的声场,给出分布式麦克风矩阵单元设备的安装位置,在安装完毕且与服务机器人自带的麦克风、分布式语音识别系统主机连接调试成功后,本系统就可以开始工作。在本系统启用的情况下,室内空间的人无论在何处与服务机器人说话,其语音都能够被识别,从而保障人机交互的顺利进行。
本系统包括硬件部分和软件部分。
硬件由服务机器人自带的麦克风、多个分布式麦克风矩阵单元设备、分布式语音识别系统主机三部分组成。
其中服务机器人自带的麦克风作为服务机器人不可分割一部分已经由机器人厂家安装完毕,本系统只需要对其进行连接即可。
多个分布式麦克风矩阵单元设备是本系统的关键部位,由多个可移动的独立的麦克风矩阵单元设备构成,该设备由通讯芯片模组、麦克风矩阵、电源适配器、信号显示器、外壳等五部分组成,该设备通过通讯芯片(WI-FI、蓝牙、Zigbee、2.4G等)与分布式语音识别系统主机相连。该设备有室内定位功能,让服务机器人可判断出分布式语音识别系统中距离发声人最近的分布式麦克风单元设备的位置,并且可以根据需要自动导航到该设备附件(此功能针对可在地面移动的服务机器人,对桌面型机器人不适用)。
分布式语音识别系统主机是一台根据功能特别定制的服务器,由服务器主机、通讯单元(WI-FI、蓝牙、Zigbee、2.4G等)组成,该主机可以和为机器人提供保障服务的机器人基地合并成为一个产品。
软件包括在服务机器人上安装的分布式语音识别系统的应用软件、分布式语音识别系统主机的控制管理软件;服务机器人上安装的分布式语音识别系统的应用软件是作为分布式语音识别系统主机的控制管理软件在服务机器人上安排的客户端软件在设计的,主要实现数据传输的功能。分布式语音识别系统主机的控制管理软件是本系统的核心管理软件,负责将所有单元设备采集到的语音信息进行汇总、比较分析并提供经过回声消除、背景降噪、增益控制后的语音信息给服务机器人的语音识别系统进行识别。
本系统需与互联网进行连接,且与语音云进行系统对接,让本系统采集到的语音信息能够被可靠识别。
本发明的有益效果是,提升服务机器人的语音识别能力,通过合理的设计与布局,能够实现室内空间3600无死角的语音识别,从而让服务机器人与人的交互更加顺畅。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明的实施例原理图。
图2是图1中编号10-13麦克风结构示意图。
图中,1.机器人;2.机器人自带麦克风;3.机器人导航模块;4.机器人独立驱动履带;5.分布式语音识别系统主机;6.服务器主机;7.主机通讯单元;8.多个分布式麦克风矩阵单元设备;9.麦克风矩阵;10-13.麦克风;14.麦克风信号显示灯;15.麦克风声音接收器;16.通讯芯片模组;17.麦克风外壳;18.电源适配器。
具体实施方式
首先分布式语音识别系统主机(5)根据室内空间布局给出分布式麦克风矩阵单元设备(8)的布置位置,然后分布式麦克风矩阵单元设备(8)布置到指定位置并与分布式语音识别系统主机(5)进行连接测试,然后让服务机器人加入到系统中进行一次连接测试,测试通过即完成所有配置。使用时,人站在室内空间的任意位置说话,临近的布式麦克风矩阵单元设备(8)均采集到此语音信息并传送到布式语音识别系统主机(5),由布式语音识别系统主机进行回声消除、背景降噪、增益控制处理后,将语音信息传送给服务机器人的语音识别系统(1)进行识别。
Claims (6)
1.本发明涉及一种室内空间服务机器人分布式语音识别系统与产品,该系统包括硬件部分和软件部分,系统的硬件部分由服务机器人自带的麦克风、多个分布式麦克风矩阵单元设备、分布式语音识别系统主机三部分组成;软件部分包括在服务机器人上安装的分布式语音识别系统的应用软件、分布式语音识别系统主机的控制管理软件;本系统需与互联网进行连接,且与语音云进行系统对接,让本系统采集到的语音信息能够被可靠识别。
2.根据权利要求1所述的室内空间服务机器人分布式语音识别系统与产品,其特征是:包括硬件部分和软件部分,系统的硬件部分由服务机器人自带的麦克风、多个分布式麦克风矩阵单元设备、分布式语音识别系统主机三部分组成;软件部分包括在服务机器人上安装的分布式语音识别系统的应用软件、分布式语音识别系统主机的控制管理软件。
3.根据权利要求1所述的室内空间服务机器人分布式语音识别系统与产品,其特征是:该系统自动分析评估室内空间的声场,给出分布式麦克风矩阵单元设备的安装位置。
4.根据权利要求1所述的室内空间服务机器人分布式语音识别系统与产品,其特征是:分布式麦克风矩阵单元设备通过通讯芯片(WI-FI、蓝牙、Zigbee、2.4G等)与分布式语音识别系统主机连接。
5.根据权利要求1所述的室内空间服务机器人分布式语音识别系统与产品,其特征是:系统与互联网进行连接,且与语音云进行系统对接,让本系统采集到的语音信息能够被可靠识别。
6.根据权利要求1所述的室内空间服务机器人分布式语音识别系统与产品,其特征是:人站在室内空间的任意位置说话,临近的布式麦克风矩阵单元设备均采集到此语音信息并传送到布式语音识别系统主机,由布式语音识别系统主机进行回声消除、背景降噪、增益控制处理后,将语音信息传送给服务机器人的语音识别系统进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610003168.7A CN105489219A (zh) | 2016-01-06 | 2016-01-06 | 室内空间服务机器人分布式语音识别系统与产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610003168.7A CN105489219A (zh) | 2016-01-06 | 2016-01-06 | 室内空间服务机器人分布式语音识别系统与产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105489219A true CN105489219A (zh) | 2016-04-13 |
Family
ID=55676166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610003168.7A Pending CN105489219A (zh) | 2016-01-06 | 2016-01-06 | 室内空间服务机器人分布式语音识别系统与产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105489219A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005202075A (ja) * | 2004-01-14 | 2005-07-28 | Sony Corp | 対話制御システム及びその方法並びにロボット装置 |
US20080298599A1 (en) * | 2007-05-28 | 2008-12-04 | Hyun-Soo Kim | System and method for evaluating performance of microphone for long-distance speech recognition in robot |
CN102402983A (zh) * | 2011-11-25 | 2012-04-04 | 浪潮电子信息产业股份有限公司 | 一种云数据中心语音识别方法 |
CN102571833A (zh) * | 2010-12-15 | 2012-07-11 | 盛乐信息技术(上海)有限公司 | 基于服务器集群的分布式语音识别系统及方法 |
CN102760431A (zh) * | 2012-07-12 | 2012-10-31 | 上海语联信息技术有限公司 | 智能化的语音识别系统 |
CN102915753A (zh) * | 2012-10-23 | 2013-02-06 | 华为终端有限公司 | 一种电子设备的智能控制音量的方法及实现装置 |
CN103439688A (zh) * | 2013-08-27 | 2013-12-11 | 大连理工大学 | 一种用于分布式麦克风阵列的声源定位系统及定位方法 |
CN103439689A (zh) * | 2013-08-21 | 2013-12-11 | 大连理工大学 | 一种分布式麦克风阵列中麦克风位置估计系统 |
CN104142492A (zh) * | 2014-07-29 | 2014-11-12 | 佛山科学技术学院 | 一种srp-phat多源空间定位方法 |
CN104919823A (zh) * | 2012-11-14 | 2015-09-16 | 高通股份有限公司 | 具有智能方向性会议的装置及系统 |
CN104936091A (zh) * | 2015-05-14 | 2015-09-23 | 科大讯飞股份有限公司 | 基于圆形麦克风阵列的智能交互方法及系统 |
-
2016
- 2016-01-06 CN CN201610003168.7A patent/CN105489219A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005202075A (ja) * | 2004-01-14 | 2005-07-28 | Sony Corp | 対話制御システム及びその方法並びにロボット装置 |
US20080298599A1 (en) * | 2007-05-28 | 2008-12-04 | Hyun-Soo Kim | System and method for evaluating performance of microphone for long-distance speech recognition in robot |
CN102571833A (zh) * | 2010-12-15 | 2012-07-11 | 盛乐信息技术(上海)有限公司 | 基于服务器集群的分布式语音识别系统及方法 |
CN102402983A (zh) * | 2011-11-25 | 2012-04-04 | 浪潮电子信息产业股份有限公司 | 一种云数据中心语音识别方法 |
CN102760431A (zh) * | 2012-07-12 | 2012-10-31 | 上海语联信息技术有限公司 | 智能化的语音识别系统 |
CN102915753A (zh) * | 2012-10-23 | 2013-02-06 | 华为终端有限公司 | 一种电子设备的智能控制音量的方法及实现装置 |
CN104919823A (zh) * | 2012-11-14 | 2015-09-16 | 高通股份有限公司 | 具有智能方向性会议的装置及系统 |
CN103439689A (zh) * | 2013-08-21 | 2013-12-11 | 大连理工大学 | 一种分布式麦克风阵列中麦克风位置估计系统 |
CN103439688A (zh) * | 2013-08-27 | 2013-12-11 | 大连理工大学 | 一种用于分布式麦克风阵列的声源定位系统及定位方法 |
CN104142492A (zh) * | 2014-07-29 | 2014-11-12 | 佛山科学技术学院 | 一种srp-phat多源空间定位方法 |
CN104936091A (zh) * | 2015-05-14 | 2015-09-23 | 科大讯飞股份有限公司 | 基于圆形麦克风阵列的智能交互方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105528841B (zh) | 一种电力电缆的防外力破坏预警系统 | |
CN107682240A (zh) | 一种用于智慧家居的分布式语音交互系统 | |
CN103455413B (zh) | 一种通讯终端交互场景测试数据处理方法、装置和系统 | |
CN204458220U (zh) | 一种风力发电机组状态监测系统 | |
US20220225033A1 (en) | Optical fiber sensing system, optical fiber sensing device, and sound output method | |
CN109471391A (zh) | 一种用于提高灾后救援效率的系统及其提示器和操作方法 | |
CN105489219A (zh) | 室内空间服务机器人分布式语音识别系统与产品 | |
CN109093618A (zh) | 一种基于机器人群组的寻人系统及方法 | |
CN112925280A (zh) | 一种轻便式现场协同作业与移动指挥智能化装备 | |
CN204089810U (zh) | 一种音频模块安装与调试工具 | |
CN107682783B (zh) | 一种基于人体动作及语音的智能音响 | |
CN213986734U (zh) | 一种智能消防栓产品主板的测试工装 | |
CN116032309A (zh) | 一种无线语音识别呼叫装置 | |
CN106056289B (zh) | 一种基于云平台的公交服务评价系统 | |
CN204887553U (zh) | 互联网航空障碍灯显示及控制系统 | |
CN205981129U (zh) | 一种轴孔类部件装配间隙监控系统 | |
CN103177522A (zh) | 一种火灾报警控制器 | |
CN206312142U (zh) | 一种远程航医系统 | |
CN205427602U (zh) | 工厂生产进度管理系统 | |
CN106920551A (zh) | 共用一套麦克风阵列的服务机器人双语音识别方法 | |
CN105976679A (zh) | 配电实训装置、配电实训远程控制系统及其对应的方法 | |
CN206517430U (zh) | 一种用于会议系统的接口自适应装置和会议系统 | |
CN205592075U (zh) | 一种基于无线通讯的风力发电机监测系统 | |
CN213294337U (zh) | 一种电梯远程检测系统 | |
CN205540991U (zh) | 一种基于gps定位的光缆巡检管理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160413 |
|
WD01 | Invention patent application deemed withdrawn after publication |