CN106057205B - 一种智能机器人自动语音交互方法 - Google Patents

一种智能机器人自动语音交互方法 Download PDF

Info

Publication number
CN106057205B
CN106057205B CN201610298990.0A CN201610298990A CN106057205B CN 106057205 B CN106057205 B CN 106057205B CN 201610298990 A CN201610298990 A CN 201610298990A CN 106057205 B CN106057205 B CN 106057205B
Authority
CN
China
Prior art keywords
intelligent robot
server
semantic
communication object
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610298990.0A
Other languages
English (en)
Other versions
CN106057205A (zh
Inventor
张伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yunji Technology Co Ltd
Original Assignee
Beijing Yunji Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunji Technology Co Ltd filed Critical Beijing Yunji Technology Co Ltd
Priority to CN201610298990.0A priority Critical patent/CN106057205B/zh
Publication of CN106057205A publication Critical patent/CN106057205A/zh
Application granted granted Critical
Publication of CN106057205B publication Critical patent/CN106057205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Manipulator (AREA)

Abstract

本发明提出了一种智能机器人自动语音交互方法,包括以下步骤:智能机器人接收交流对象的语音;将语音转换成文字;将转换的文字上传至服务器;在服务器进行语义解析,根据解析的语义在数据库中查找文字对话内容;将找到的文字对话内容发送至智能机器人;智能机器人将文字对话内容转换成语音播放。智能机器人能够根据声音找到交流对象的位置,实现了智能机器人与交流对象明对面交流。而且还能够根据交流对象的面部特征,自动增加称呼,形成良好的沟通氛围。

Description

一种智能机器人自动语音交互方法
技术领域
本发明涉及人工智能技术领域,特别涉及一种智能机器人自动语音交互方法。
背景技术
随着智能化时代的到来,机器人已经越来越走进人们的生活,生活中的服务机器人应用领域越来越广,我们的社会即将进入智能机器人的时代。例如,常见的服务机器人有送餐机器人、聊天机器人、导购机器人等等。这些机器人都需要与人进行互动交流。自然语言作为人类表达自己思想最方便、最自然的方式,已逐渐成为智能服务领域最主流的人机交互方式。由于自然语言具有开放性、随意性,表达方式多样,对自然语言进行语义解析,从而识别其真实含义,对于智能服务提供而言显得尤为重要。
在机器人与人进行沟通的过程中,为了提高人机交互的体验性,需要机器人能够识别出交流对象表达的含义,并且迅速做出快速应答。现有的机器人通常是将一些常见的语段存储在机器人存储装置中,在收到交流对象的语音后,根据语义解析结果在存储装置中寻找应答语段进行播放。但是,现实生活中,交流对象提出的很多问题是无法预先预料的,经常会遇到找不到合适答复语段,因此无法顺畅地进行交流。而且,针对不同交流对象千篇一律的采用同一个对话模式,也不能形成良好的沟通氛围。因此,如何让机器人与交流对象之间充分友好地交流成为机器人领域一个亟待解决的问题。
发明内容
为了解决现有技术中存在的问题,本发明提供了一种智能机器人自动语音交互方法,包括以下步骤:智能机器人接收交流对象的语音;将语音转换成文字;将转换的文字上传至服务器;在服务器进行语义解析,根据解析的语义在数据库中查找文字对话内容;将找到的文字对话内容发送至智能机器人;智能机器人将文字对话内容转换成语音播放。
进一步地,所述服务器预先根据语义场景对文字对话内容进行分类存储。
进一步地,智能机器人在将转换的文字上传至服务器的同时,上传智能机器人的身份信息。
进一步地,服务器根据智能机器人的身份信息,获得智能机器人的语义场景,根据该语义场景进行语义解析。
进一步地,服务器在每种语义场景模式下,设置该语义场景的关键词。
进一步地,服务器根据语义场景进行语义解析,得到多个语义解析结果,并根据该语义场景的解析结果的历史选择频次进行排序。
进一步地,从所述排序中选择预设数量的语义解析结果作为最终语义解析结果,并针对所述最终语义解析结果作出响应。
进一步地,智能机器人通过多个传感器获取交流对象的声音,通过定位函数确定交流对象的位置;根据确定的交流对象的位置,调整智能机器人的正面方向,使得智能机器人的正面对准交流对象。
进一步地,智能机器人通过摄像头捕捉交流对象的头像,根据面部识别结果,在对话中增加称呼内容。
进一步地,智能机器人记录交流对象的完整对话,上传至服务器,由服务器分析判断交流对象真正想表达的含义。
本发明的方法通过在服务器端建立数据库,能够存储和管理庞大的数据,对于绝大部分的对话都能够给出合适的回答。通过在线传送文字对话内容数据包,能够有效提高传输速率,缩短机器人交流的反应时间。
此外,智能机器人能够根据声音找到交流对象的位置,实现了智能机器人与交流对象明对面交流。而且还能够根据交流对象的面部特征,自动增加称呼,形成良好的沟通氛围。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1为根据本发明实施例的智能机器人自动语音交互方法的流程图。
图2是根据本发明一种实施方式的智能机器人寻声定位的示意图。
图3是根据本发明一种实施方式的智能机器人寻声定位后转动的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
如图1所示,本发明提供一种智能机器人自动语音交互方法,包括以下步骤:
智能机器人接收交流对象的语音;
将语音转换成文字;
将转换的文字上传至服务器;
在服务器进行语义解析,根据解析的语义在数据库中查找文字对话内容;
将找到的文字对话内容发送至智能机器人;
智能机器人将文字对话内容转换成语音播放。
本发明的方法通过在服务器端建立数据库,能够存储和管理庞大的数据,对于绝大部分的对话都能够给出合适的回答。通过在线传送文字对话内容数据包,能够有效提高传输速率,缩短机器人交流的反应时间。语音与文字相互转换的技术为现有技术,在次不再赘述。
优选地,服务器预先根据语义场景对文字对话内容进行分类存储。服务器可以根据智能机器人的工作环境设置不同的语义场景。并且很据不同的语义场景中可能出现的对话内容分类进行存储。例如,在酒店提供送物品服务的智能机器人,可以根据其工作环境设置多个语义场景。例如,领取物品、搭乘电梯、遇到问路、到达客人房间等多个场景。根据这些场景中高频出现的对话内容,设置关键词,便于检索。
优选地,智能机器人在将转换的文字上传至服务器的同时,上传智能机器人的身份信息。每个智能机器人具有单独的身份标识符。服务器根据该身份标识符能够判断该智能机器人的服务场所,从而能够获得机器人的工作环境,快速调取针对该工作环境预设的语义场景,根据该语义场景进行语义解析,能够有效提高语义解析结果的正确率。此外,也能够根据语义场景实现快速准确的查找对话内容。
优选地,由于客人的发音不标准或者语音转换的准确性不够等因素,将可能导致服务器语义解析的准确性不高。为了解决该问题,服务器首先根据语义场景进行语义解析,而且将得到多个语义解析结果。针对获得多个解析结果,服务器将根据该语义场景中的类似解析结果的历史选择频次进行排序。通常,在某一语义场景中会出现大量重复的类似对话内容。服务器激动记录历史解析结果及选择结果。根据最终选择的频次对多个解析结果排序,从而提高了解析结果的准确率。
服务器从所述排序中选择预设数量的语义解析结果作为最终语义解析结果,并针对所述最终语义解析结果作出响应。服务器通常选择排序中的前几个解析结果做出响应,在数据库中查找对话内容,并且将对话内容按照排序发给智能机器人。智能机器人收到对话内容后,将其转换成语音播放。智能机器人根据交流对象的反应做出判断,如果交流对象没有反应,则智能机器人播放对话内容排序中的下一条内容。或者,智能机器人播放预设内容,例如“谢谢,请问还有什么问题么?”等。
优选地,智能机器人通过多个传感器获取交流对象的声音,通过定位函数确定交流对象的位置;根据确定的交流对象的位置,调整智能机器人的正面方向,使得智能机器人的正面对准交流对象。
例如,智能机器人通过三个以上的传感器(麦克风)接收交流对象的声音,通过测量声音到达不同传感器的时间差,利用定位函数确定交流对象的位置。
智能机器人预先设置正面的方向,例如垂直于某两个传感器连线中心的方向为正面方向。当确定了交流对象的位置后,将智能机器人的正面方向对准该交流对象,这样交流对象就会有面对面交流的感觉,提高了用户体验。
作为一个实施例,如图2所示,给出了根据本发明一种实施方式的智能机器人寻声定位的示意图。
在本实施例中,传感器阵列采用正方形,传感器1、2、3、4的位置坐标分别为(-L,-L)、(L,-L)、(L,L),(-L,L),其中2L为正方阵的边长。则声源位置(x,y)可由下式算出:
Figure BDA0000983566900000051
Figure BDA0000983566900000052
其中Δt1,Δt2,Δt3分别为传感器2、传感器3、传感器4相对于传感器1的时差,c是传播速度。
根据声源位置(x,y),可以知道声源在平面的哪个方向。从而能够计算出与智能机器人正面方向之间的矢量方向。在本实施例中,智能机器人的正面方向是预先设定的,例如穿过坐标系的原点。将第一传感器和第二传感器之间的中点以及第三传感器和第四传感器之间的中点连线的方向确定为智能机器人的正面方向,也就是坐标系的Y轴方向。智能机器人就朝声源位置(x,y)的方向转动。
本实施例给出了设置4个传感器组成正方形阵的情况,但是本发明的保护范围不限于此。也可以设置其他形状的传感器阵,基于上述原理推导出其他形状的计算方式,都在本发明的保护范围内。
下面参照图3描述本发明一种实施方式的智能机器人寻声定位后转动的示意图。
在本实施例中,设置4个传感器,传感器阵列采用正方形。传感器为拾音器,设置在机器人头部顶端,便于接收来自各个方向的声音。
传感器1、2、3、4的位置坐标分别为(-L,-L)、(L,-L)、(L,L),(-L,L),其中2L为正方阵的边长。
传感器与定位模块连接,定位模块可以测量声音到达每个传感器的时间,从而计算出到各个达传感器的时间差。本实施例中计算传感器2、传感器3、传感器4相对于传感器1的时差。声源位置(x,y)可由下式算出:
Figure BDA0000983566900000061
其中Δt1,Δt2,Δt3分别为传感器2、传感器3、传感器4相对于传感器1的时差,c是传播速度。
根据声源位置(x,y),可以知道声源在平面的哪个方向,从而能够计算出与智能机器人正面方向之间的矢量方向。
在本实施例中,智能机器人的正面方向是预先设定的,例如穿过坐标系的原点。将第一传感器和第二传感器之间的中点以及第三传感器和第四传感器之间的中点连线的方向确定为智能机器人的正面方向,也就是坐标系的Y轴方向。
定位模块与驱动装置连接,向驱动装置发出驱动信号转动智能机器人,智能机器人就朝声源位置(x,y)的方向转动,使得智能机器人正面方向指向交流对象。当智能机器人的正面方向指向声源位置(x,y)的方向时,定位模块控制驱动装置停止转动。
此外,交流对象可能处于运动状态,此时与智能机器人之间的相对位置是不断变化的。本发明可以设定时间重复执行寻声定位的方法,如果发现交流对象与智能机器人的正面方向存在偏差,则不断地调整智能机器人的正面方向,指向交流对象。
例如,可以设定间隔几秒钟重复执行一次寻声定位的方法,或者每接收到交流对象的声音,就判断一次交流对象的位置,从而进行实时调整。通过调整相对位置,始终给人面对面交流的感觉,提高了亲和度。
此外优选地,智能机器人通过摄像头捕捉交流对象的头像,根据面部识别结果,在对话中增加称呼内容。机器人可以预先存储或者在服务器中存储经常打交道人或者以往打过招呼的人的头像。当再次遇到该人时,通过摄像头进行头像捕捉,然后在图片库中进行比对,返回最像的结果。例如,酒店服务的机器人每天会见到大堂经理,当与大堂经理面对面时,通过获取头像和比对,确认该人为王经理,智能机器人就会主动打招呼“王经理好”等。或者,当有人问机器人“我是谁”,智能机器人打开摄像头进行头像捕捉,然后在图片库中进行比对,返回最像的结果,打招呼,如果没有匹配,则返回“对不起,我不认识你”等。或者对于第一次交流的陌生人,机器人通过获取客人头像,判断客人性别或者年龄,在对话中主动增加称呼,例如“先生好”、“女士好”等,从而提高了客人对机器人的好感。
优选地,智能机器人记录交流对象的完整对话,上传至服务器,由服务器分析判断交流对象真正想表达的含义。智能机器人记录下每次对话的录音和/或影像,在机器人空闲时间上传至服务器,作为语义解析训练资料。服务器会根据对话的顺畅成度以及客人对话的内容,挑选出一些疑似交流不畅的对话,提供给工程师分析。例如,对话中逻辑关系混乱、中间停顿较长或者客人反复重复提问等情况,可以判断为交流不畅。服务器会对这些对话做出标记,提供给工程师。工程师通过机器人上传的录音或影像资料,校对服务器的语义解析结果,并对解析结果排序中的选择频次做出调整,从而实现自学习功能。
本发明的方法通过在服务器端建立数据库,能够存储和管理庞大的数据,对于绝大部分的对话都能够给出合适的回答。通过在线传送文字对话内容数据包,能够有效提高传输速率,缩短机器人交流的反应时间。
此外,智能机器人能够根据声音找到交流对象的位置,实现了智能机器人与交流对象明对面交流。而且还能够根据交流对象的面部特征,自动增加称呼,形成良好的沟通氛围。
而且,通过不断修正语义解析结果,能够提高准确性。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (6)

1.一种智能机器人自动语音交互方法,其特征在于,包括以下步骤:
智能机器人接收交流对象的语音;
将语音转换成文字;
将转换的文字上传至服务器;
在服务器进行语义解析,根据解析的语义在数据库中查找文字对话内容;
将找到的文字对话内容发送至智能机器人;
智能机器人将文字对话内容转换成语音播放;
智能机器人在将转换的文字上传至服务器的同时,上传智能机器人的身份信息;
服务器根据智能机器人的身份信息,获得智能机器人的语义场景,根据该语义场景进行语义解析;
服务器根据语义场景进行语义解析,得到多个语义解析结果,并根据该语义场景的解析结果的历史选择频次进行排序;
智能机器人记录交流对象的完整对话,上传至服务器,由服务器分析判断交流对象真正想表达的含义;
所述服务器根据所述完整对话的顺畅程度以及客人对话的内容,对交流不畅的完整对话进行标记。
2.根据权利要求1所述的方法,其特征在于,所述服务器预先根据语义场景对文字对话内容进行分类存储。
3.根据权利要求2所述的方法,其特征在于,服务器在每种语义场景模式下,设置该语义场景的关键词。
4.根据权利要求1所述的方法,其特征在于,从所述排序中选择预设数量的语义解析结果作为最终语义解析结果,并针对所述最终语义解析结果作出响应。
5.根据权利要求1所述的方法,其特征在于,智能机器人通过多个传感器获取交流对象的声音,通过定位函数确定交流对象的位置;
根据确定的交流对象的位置,调整智能机器人的正面方向,使得智能机器人的正面对准交流对象。
6.根据权利要求1所述的方法,其特征在于,智能机器人通过摄像头捕捉交流对象的头像,根据面部识别结果,在对话中增加称呼内容。
CN201610298990.0A 2016-05-06 2016-05-06 一种智能机器人自动语音交互方法 Active CN106057205B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610298990.0A CN106057205B (zh) 2016-05-06 2016-05-06 一种智能机器人自动语音交互方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610298990.0A CN106057205B (zh) 2016-05-06 2016-05-06 一种智能机器人自动语音交互方法

Publications (2)

Publication Number Publication Date
CN106057205A CN106057205A (zh) 2016-10-26
CN106057205B true CN106057205B (zh) 2020-01-14

Family

ID=57177548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610298990.0A Active CN106057205B (zh) 2016-05-06 2016-05-06 一种智能机器人自动语音交互方法

Country Status (1)

Country Link
CN (1) CN106057205B (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106737658B (zh) * 2016-11-07 2019-04-30 北京云迹科技有限公司 用于智能机器人寻声定位和矫正站姿的系统及方法
CN106847272A (zh) * 2016-12-12 2017-06-13 北京光年无限科技有限公司 与运行应用关联的智能机器人的数据交互方法
CN107016070B (zh) * 2017-03-22 2020-06-02 北京光年无限科技有限公司 一种用于智能机器人的人机对话方法及装置
CN106934067A (zh) 2017-04-01 2017-07-07 联想(北京)有限公司 信息处理方法及电子设备
CN107657949A (zh) * 2017-04-14 2018-02-02 深圳市人马互动科技有限公司 游戏数据的获取方法及装置
CN107146622B (zh) * 2017-06-16 2021-02-19 合肥美的智能科技有限公司 冰箱、语音交互系统、方法、计算机设备、可读存储介质
CN107358451A (zh) * 2017-07-17 2017-11-17 竹间智能科技(上海)有限公司 一种交互式智能魔镜
CN107609017B (zh) * 2017-08-04 2021-02-02 陈剑辉 通过自定义热词实现医疗行业智能搜索咨询的方法及系统
JP6962105B2 (ja) * 2017-09-27 2021-11-05 カシオ計算機株式会社 対話装置、サーバ装置、対話方法及びプログラム
CN108197105B (zh) * 2017-12-28 2021-08-24 Oppo广东移动通信有限公司 自然语言处理方法、装置、存储介质及电子设备
CN110166497B (zh) * 2018-02-11 2022-07-12 深圳市玖胜云智联科技有限公司 一种信息推送方法、智能终端及机器人
CN108399912B (zh) * 2018-03-21 2020-11-03 江苏木盟智能科技有限公司 一种机器人的语音切换方法、服务器及系统
CN108335692B (zh) * 2018-03-21 2021-03-05 上海智蕙林医疗科技有限公司 一种语音切换方法、服务器及系统
CN108470563B (zh) * 2018-03-21 2020-11-03 江苏木盟智能科技有限公司 一种语音交互中的语音切换方法、服务器及系统
CN110741362B (zh) * 2018-05-03 2024-05-14 谷歌有限责任公司 音频查询的重叠处理的协调
CN109343706B (zh) * 2018-09-18 2022-03-11 周文 一种交互系统及其实现方法
CN109273001B (zh) * 2018-10-25 2021-06-18 珠海格力电器股份有限公司 一种语音播报方法、装置、计算装置和存储介质
CN111261150A (zh) * 2018-11-30 2020-06-09 阿里巴巴集团控股有限公司 一种人机对话的实现方法及装置
CN109948153A (zh) * 2019-03-07 2019-06-28 张博缘 一种涉及视频和音频多媒体信息处理的人机交流系统
JP2020154269A (ja) * 2019-03-22 2020-09-24 株式会社日立ビルシステム 複数人対話システムおよび複数人対話方法
CN110047479A (zh) * 2019-04-18 2019-07-23 深圳市三宝创新智能有限公司 一种用于智能机器人的语音交互装置
CN110328667B (zh) * 2019-04-30 2021-07-20 北京云迹科技有限公司 用于机器人的控制方法及装置
CN110171005A (zh) * 2019-06-10 2019-08-27 杭州任你说智能科技有限公司 一种基于智能音箱的旅游机器人系统
CN110211577B (zh) * 2019-07-19 2021-06-04 宁波方太厨具有限公司 终端设备及其语音交互方法
CN111128144A (zh) * 2019-10-16 2020-05-08 国网浙江省电力有限公司金华供电公司 一种语音电网调度系统及方法
CN112104962B (zh) * 2020-10-30 2021-03-23 北京声智科技有限公司 一种基于图像识别的跟随式机器人扩声方法及扩声系统
CN112420052B (zh) * 2020-11-18 2023-03-31 青岛海尔科技有限公司 设备控制方法、装置、存储介质及电子装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005003747A (ja) * 2003-06-09 2005-01-06 Cai Media Kyodo Kaihatsu:Kk 対話型ロボット及び対話システム
WO2006003542A1 (en) * 2004-06-29 2006-01-12 Philips Intellectual Property & Standards Gmbh Interactive dialogue system
CN1959628A (zh) * 2005-10-31 2007-05-09 西门子(中国)有限公司 一种人机交互导航系统
CN101178705A (zh) * 2007-12-13 2008-05-14 中国电信股份有限公司 一种自然语言理解方法和人机交互智能系统
CN104199810A (zh) * 2014-08-29 2014-12-10 科大讯飞股份有限公司 一种基于自然语言交互的智能服务方法及系统
CN105072143A (zh) * 2015-07-02 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的智能机器人与客户端的交互系统
CN105538311A (zh) * 2016-02-02 2016-05-04 北京云迹科技有限公司 一种智能机器人寻声定位的方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104360994A (zh) * 2014-12-04 2015-02-18 科大讯飞股份有限公司 自然语言理解方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005003747A (ja) * 2003-06-09 2005-01-06 Cai Media Kyodo Kaihatsu:Kk 対話型ロボット及び対話システム
WO2006003542A1 (en) * 2004-06-29 2006-01-12 Philips Intellectual Property & Standards Gmbh Interactive dialogue system
CN1959628A (zh) * 2005-10-31 2007-05-09 西门子(中国)有限公司 一种人机交互导航系统
CN101178705A (zh) * 2007-12-13 2008-05-14 中国电信股份有限公司 一种自然语言理解方法和人机交互智能系统
CN104199810A (zh) * 2014-08-29 2014-12-10 科大讯飞股份有限公司 一种基于自然语言交互的智能服务方法及系统
CN105072143A (zh) * 2015-07-02 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的智能机器人与客户端的交互系统
CN105538311A (zh) * 2016-02-02 2016-05-04 北京云迹科技有限公司 一种智能机器人寻声定位的方法和系统

Also Published As

Publication number Publication date
CN106057205A (zh) 2016-10-26

Similar Documents

Publication Publication Date Title
CN106057205B (zh) 一种智能机器人自动语音交互方法
CN112075075B (zh) 用于促进远程会议的方法和计算机化智能助理
CN106682090B (zh) 主动交互实现装置、方法及智能语音交互设备
CN110313152B (zh) 用于智能助理计算机的用户注册
CN112088315A (zh) 多模式语音定位
KR101872635B1 (ko) 메이크업 자동 평가 시스템 및 그의 동작 방법
CN108363706A (zh) 人机对话交互的方法和装置、用于人机对话交互的装置
Minotto et al. Multimodal multi-channel on-line speaker diarization using sensor fusion through SVM
CN109284081B (zh) 一种音频的输出方法、装置及音频设备
KR101887637B1 (ko) 로봇 시스템
KR102463806B1 (ko) 이동이 가능한 전자 장치 및 그 동작 방법
CN114981886A (zh) 使用多个数据源的语音转录
US10388325B1 (en) Non-disruptive NUI command
CN112204565A (zh) 用于基于视觉背景无关语法模型推断场景的系统和方法
CN111930336A (zh) 音频设备的音量调节方法、设备及存储介质
CN108318042A (zh) 导航模式切换方法、装置、终端及存储介质
CN113703585A (zh) 交互方法、装置、电子设备及存储介质
US11398221B2 (en) Information processing apparatus, information processing method, and program
CN112639964A (zh) 利用深度信息识别语音的方法、系统及计算机可读介质
CN107363862B (zh) 基于机器人的社交系统
CN107622300B (zh) 多模态虚拟机器人的认知决策方法和系统
CN111177329A (zh) 一种智能终端的用户交互方法、智能终端及存储介质
KR102433964B1 (ko) 관계 설정을 이용한 실감형 인공지능기반 음성 비서시스템
US20200410995A1 (en) Systems and methods for disambiguating a voice search query based on gestures
JP2017191531A (ja) コミュニケーションシステム、サーバ及びコミュニケーション方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room 702, 7th floor, NO.67, Beisihuan West Road, Haidian District, Beijing 100089

Patentee after: Beijing Yunji Technology Co.,Ltd.

Address before: No. 201, building 4, yard 8, Dongbeiwang West Road, Haidian District, Beijing 100094

Patentee before: BEIJING YUNJI TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address