CN107042516A - 一种机器人实现察言观色系统 - Google Patents

一种机器人实现察言观色系统 Download PDF

Info

Publication number
CN107042516A
CN107042516A CN201710191191.8A CN201710191191A CN107042516A CN 107042516 A CN107042516 A CN 107042516A CN 201710191191 A CN201710191191 A CN 201710191191A CN 107042516 A CN107042516 A CN 107042516A
Authority
CN
China
Prior art keywords
robot
unit
thoughts
mood
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710191191.8A
Other languages
English (en)
Inventor
周海明
林绿德
庄永军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Sanbao innovation and intelligence Co., Ltd.
Original Assignee
QIHAN TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by QIHAN TECHNOLOGY Co Ltd filed Critical QIHAN TECHNOLOGY Co Ltd
Priority to CN201710191191.8A priority Critical patent/CN107042516A/zh
Publication of CN107042516A publication Critical patent/CN107042516A/zh
Pending legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Abstract

本发明公开了一种机器人实现察言观色系统,包括声源采集单元、语句处理单元、信息搜索单元、语音输出单元、投影单元、通信单元和行为控制单元。本发明不仅适用于用户在家中与他人产生对话时,同样适用于用户通过机器人浏览网站、听音乐和观看视频时,机器人有效地实现了人机交互,主动探测用户需求,并灵活筛选选取关键信息点匹配度最高的相关资料,便捷通过机器人自带投影功能进行投放。

Description

一种机器人实现察言观色系统
技术领域
本发明涉及一种机器人,具体是一种机器人实现察言观色系统。
背景技术
随着计算机技术和信号处理技术的发展,各种具有特殊功能的机器人逐渐应用到人们的日常生活中。听觉系统作为人类感觉中的重要部分,同时也是机器人的重要组成部分,现已成为机器人研究领域的重要研究对象。机器人可通过听觉系统采集及处理用户的语音信号,实现各种功能。现家庭机器人可通过采集用户声源信号判断用户位置,但无法智能分析用户对话,不能对用户对话内容进行分析处理,为用户提供更便捷的服务。
发明内容
本发明的目的在于提供一种机器人实现察言观色系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种机器人实现察言观色系统,包括:
声源采集单元,所述声源采集单元在系统开始工作时,FPGA完成初始化后将按照2KHz的采样率启动AD转换,待系统开始工作后,系统会采用20KHz频率通过型号EM6027麦克风进行语音信号采样,也就是启动AD转换,并将AD转换结果输出到缓冲器进行缓冲;
语句处理单元,用于对收集的声源进行语句分析处理,对语句关键词筛选获得关键信息点;
信息搜索单元,用于对获得的关键信息点在网络中进行搜索,并获取其相关资料,摘取匹配度最高的资料;
语音输出单元,用于在成功搜索并获得关键信息点的匹配度最高资料后,进行语音播报;
投影单元,利用安装在机器人头部的3D深度摄像机获取的深度数据,机器人开始自主的在用户周围寻找合适的投影区域,寻找到合适投影区域后,转头用投影单元开始投影关键信息点资料,以100英寸投影尺寸进行投影;
通信单元,通过无线网络进行信息搜索;
行为控制单元,通过PID算法驱动直流电机实现机器人的运动和转向。
作为本发明再进一步的方案:所述关键信息点为专用名词,能够为产品名或应用名。
与现有技术相比,本发明的有益效果是:本发明不仅适用于用户在家中与他人产生对话时,同样适用于用户通过机器人浏览网站、听音乐和观看视频时,机器人有效地实现了人机交互,主动探测用户需求,并灵活筛选选取关键信息点匹配度最高的相关资料,便捷通过机器人自带投影功能进行投放。
附图说明
图1为机器人实现察言观色系统的原理框图。
图2为机器人实现察言观色系统的工作流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1~2,本发明实施例中,一种机器人实现察言观色系统,包括:
声源采集单元,所述声源采集单元在系统开始工作时,FPGA完成初始化后将按照2KHz的采样率启动AD转换,待系统开始工作后,系统会采用20KHz频率通过型号EM6027麦克风进行语音信号采样,也就是启动AD转换,并将AD转换结果输出到缓冲器进行缓冲;
语句处理单元,用于对收集的声源进行语句分析处理,对语句关键词筛选获得关键信息点;
信息搜索单元,用于对获得的关键信息点在网络中进行搜索,并获取其相关资料,摘取匹配度最高的资料;
语音输出单元,用于在成功搜索并获得关键信息点的匹配度最高资料后,进行语音播报;
投影单元,利用安装在机器人头部的3D深度摄像机获取的深度数据,机器人开始自主的在用户周围寻找合适的投影区域,寻找到合适投影区域后,转头用投影单元开始投影关键信息点资料,以100英寸投影尺寸进行投影;即投影区域长度为2.2m,宽度为1.2m。
通信单元,通过无线网络进行信息搜索;
行为控制单元,通过PID算法驱动直流电机实现机器人的运动和转向。
所述关键信息点为专用名词,能够为产品名或应用名。
本发明的工作流程如下:
1.系统开始工作后,麦克风对周围环境进行语音信号采样。
2.当检测出采集的语音为完整语句时,对语句进行语句分析处理,筛选得到关键信息点。
3.在网络中进行搜索关键信息点的相关资料,并摘取匹配度最高的资料。
4.语音播报“已为你查得***(关键信息点)相关资料,现将资料进行投影”
5.机器人自主寻找合适的投影区域,并以100英寸投影尺寸进行投影。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (2)

1.一种机器人实现察言观色系统,其特征在于,包括:
声源采集单元,所述声源采集单元在系统开始工作时,FPGA完成初始化后将按照2KHz的采样率启动AD转换,待系统开始工作后,系统会采用20KHz频率通过型号EM6027麦克风进行语音信号采样,也就是启动AD转换,并将AD转换结果输出到缓冲器进行缓冲;
语句处理单元,用于对收集的声源进行语句分析处理,对语句关键词筛选获得关键信息点;
信息搜索单元,用于对获得的关键信息点在网络中进行搜索,并获取其相关资料,摘取匹配度最高的资料;
语音输出单元,用于在成功搜索并获得关键信息点的匹配度最高资料后,进行语音播报;
投影单元,利用安装在机器人头部的3D深度摄像机获取的深度数据,机器人开始自主的在用户周围寻找合适的投影区域,寻找到合适投影区域后,转头用投影单元开始投影关键信息点资料,以100英寸投影尺寸进行投影;
通信单元,通过无线网络进行信息搜索;
行为控制单元,通过PID算法驱动直流电机实现机器人的运动和转向。
2.根据权利要求1所述的机器人实现察言观色系统,其特征在于,所述关键信息点为专用名词,能够为产品名或应用名。
CN201710191191.8A 2017-03-28 2017-03-28 一种机器人实现察言观色系统 Pending CN107042516A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710191191.8A CN107042516A (zh) 2017-03-28 2017-03-28 一种机器人实现察言观色系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710191191.8A CN107042516A (zh) 2017-03-28 2017-03-28 一种机器人实现察言观色系统

Publications (1)

Publication Number Publication Date
CN107042516A true CN107042516A (zh) 2017-08-15

Family

ID=59544377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710191191.8A Pending CN107042516A (zh) 2017-03-28 2017-03-28 一种机器人实现察言观色系统

Country Status (1)

Country Link
CN (1) CN107042516A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080147239A1 (en) * 2006-12-14 2008-06-19 Industrial Technology Research Institute Apparatus with Surface Information Displaying and Interaction Capability
CN205085988U (zh) * 2015-11-04 2016-03-16 赵鹏 智能影像通讯机器人
CN105856257A (zh) * 2016-06-08 2016-08-17 以恒激光科技(北京)有限公司 适用于前台接待的智能机器人
CN106228982A (zh) * 2016-07-27 2016-12-14 华南理工大学 一种基于教育服务机器人的交互式学习系统与交互方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080147239A1 (en) * 2006-12-14 2008-06-19 Industrial Technology Research Institute Apparatus with Surface Information Displaying and Interaction Capability
CN205085988U (zh) * 2015-11-04 2016-03-16 赵鹏 智能影像通讯机器人
CN105856257A (zh) * 2016-06-08 2016-08-17 以恒激光科技(北京)有限公司 适用于前台接待的智能机器人
CN106228982A (zh) * 2016-07-27 2016-12-14 华南理工大学 一种基于教育服务机器人的交互式学习系统与交互方法

Similar Documents

Publication Publication Date Title
CN107042516A (zh) 一种机器人实现察言观色系统
Espy-Wilson Speech acoustics and mental health assessment
CN114363280B (zh) 基于多段语音汇总式传输的手机聊天辅助系统
Cook et al. Automatic classification and reduction of wind noise contamination in spectral data
Oh et al. The impact of temporally coherent visual and vibrotactile cues on speech perception in noise performance
Shafiro Catching a rabbit with a tetrahedron: A contextualist approach
Braasch et al. Modeling the advantage of head-movements in judging elevation
Dent et al. Complex sound perception by laboratory mice
Joshi et al. Modelling the effect of pulse-rate on coding of interaural time differences in listeners with cochlear implants
Francart et al. Neuro-steered noise suppression for auditory prostheses
Divenyi Beyond presbyacusis: Non‐hearing loss‐related temporal processing deficits in the elderly
Stecker et al. The role of onsets and envelope fluctuations in binaural cue use
Ellis et al. Exploring the relationship between sound localization and individual use of spectral and temporal cues among hearing-impaired listeners
Talmadge et al. David Kemp’s impact on cochlear modeling and otoacoustic emission measurement and modeling
Hafter A means for comparing normal and impaired listeners in spatial hearing
Nelson et al. Understanding speech in single‐talker interference: Normal‐hearing listeners and cochlear implant users
Sommers et al. Predictors of visual enhancement and lipreading ability in older and younger adults
CN114691056A (zh) 一种3d打印机的音频、图像智能交互方法
Reed et al. Research on the tadoma method of speech communication
Okuno et al. Active audition for humanoid robots that can listen to three simultaneous talkers
Forrest et al. Effects of altering vowel feedback on speech movements
Walther Auditory scene analysis with a multi-modal model
Hotehama et al. Sound source localization in the horizontal plane through the bilaterally applied bone-conducted ultrasonic hearing aids
Scibilia An investigation of speech production and intelligibility of a post‐lingually deaf sequential bilingual adult cochlear implant user, pre‐and post‐implantation for English and Twi.
Peppin et al. Controlling the shape of an acoustic spectrum automatically by the use of a bus-controlled spectrum shaper and a real-time analyzer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190617

Address after: 518000 Guangdong 28, Shenzhen, Futian District, Huafu street, No. 5001 Huanggang Road, Shenzhen Industrial upper city (two phase of the Southern District)

Applicant after: Shenzhen Sanbao innovation and intelligence Co., Ltd.

Address before: 518055 the 32-33 floor of block B, CNOOC building, Nanshan District Houhai road and Chuang Road Interchange, Shenzhen, Guangdong.

Applicant before: Qihan Technology Co., Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170815