CN101377924A - 可会话的类生物装置及其会话方法 - Google Patents

可会话的类生物装置及其会话方法 Download PDF

Info

Publication number
CN101377924A
CN101377924A CNA2007100767704A CN200710076770A CN101377924A CN 101377924 A CN101377924 A CN 101377924A CN A2007100767704 A CNA2007100767704 A CN A2007100767704A CN 200710076770 A CN200710076770 A CN 200710076770A CN 101377924 A CN101377924 A CN 101377924A
Authority
CN
China
Prior art keywords
voice
session
response
correspondence
biology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007100767704A
Other languages
English (en)
Inventor
蒋祖力
王传宏
洪国宝
谢冠宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aurora Technology Co Ltd
PENGZHI TECHNOLOGY (SHENZHEN) Co Ltd
Original Assignee
Aurora Technology Co Ltd
PENGZHI TECHNOLOGY (SHENZHEN) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aurora Technology Co Ltd, PENGZHI TECHNOLOGY (SHENZHEN) Co Ltd filed Critical Aurora Technology Co Ltd
Priority to CNA2007100767704A priority Critical patent/CN101377924A/zh
Priority to US12/191,276 priority patent/US20090063155A1/en
Publication of CN101377924A publication Critical patent/CN101377924A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • B25J13/003Controls for manipulators by means of an audio-responsive input
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Manipulator (AREA)
  • Machine Translation (AREA)

Abstract

本发明为一种可会话的类生物装置,属于电子宠物、电子玩具和机器人等领域。本发明还提供了一种类生物装置的会话方法。通过该会话方法,该类生物装置在接收到一用户的会话语音时,识别该会话语音,根据一以该会话语音对应的各回应语音的加权值为变量的随机函数输出一回应语音,其中,各回应语音的加权值由一以各回应语音的回应次数为变量的函数确定。所以该类生物装置可以输出不同且不固定随时变化的回应语音,给用户带来真实性的乐趣。

Description

可会话的类生物装置及其会话方法
技术领域
本发明涉及一种类生物装置,更具体地,涉及一种可会话的类生物装置及其会话方法。
背景技术
目前,市场上的类生物装置如电子玩具、电子宠物及机器人的品种琳琅满目,且很多类生物装置具有会话功能,即类生物装置可以根据用于产生的会话进行回应,然而这些类生物装置只能根据用户的一语音做出一固定的回答,实现方法都是生产商(制造商)事先将语音命令、语音输出及其它们的对应关系存入类生物装置中。
在这种传统类生物装置中,用户语音输入与类生物装置语音输出之间的关系是固定的,当用户输入一语音时,该类生物装置只能输出一特定语音。这样总做出单一的回答而容易使用户感到腻味。用户无法感受到当其输入一语音时产生多个变化语音输出的新鲜感,体验不到类生物装置真实性的乐趣。
发明内容
本发明的目的在于,提供一种可会话的类生物装置及其会话生成方法,该类生物装置可根据不同用户相同或相似的语音输入,产生不同的语音输出。
所述一种可会话的类生物装置,该类生物装置包括一麦克风、一模数转换器、一数模转换器、一扬声器及一存储单元,该麦克风用于采集会话语音的模拟信号,该模拟信号经所述模数转换器转换为数字信号,该存储单元存储有多个回应语音的音频数据及一语音输出表,该语音输出表定义了多个会话语音、每一会话语音对应的至少一个回应语音、及每一回应语音对应的回应次数及加权值,其中,每一回应语音对应的加权值由一会话语音对应的各回应语音的回应次数确定;该类生物装置还包括:一会话语音识别模块,用于识别所述会话语音;一回应语音确定模块,用于通过一随机函数选取所述会话语音其中一回应语音,该随机函数以该会话语音的各回应语音的加权值为变量;一回应语音输出模块,用于输出该回应语音确定模块确定的回应语音的音频数据,所述回应语音的音频数据传输至该数模转换器转换为模拟信号后由该扬声器输出;一计数模块,用于将所输出回应语音对应的回应次数加一;及一加权值更新模块,用于根据更新后的回应次数调用加权值函数重新计算并更新输出回应语音对应会话语音的各回应语音的加权值。
所述一种应用于类生物装置的会话生成方法,该类生物装置存储有多个回应语音的音频数据及一语音输出表,该语音输出表定义了多个会话语音、每一会话语音对应的至少一个回应语音、及每一回应语音对应的回应次数及加权值,其中,每一回应语音对应的加权值由一会话语音对应的各回应语音的回应次数确定,该方法包括步骤:(a)接收用户的会话语音;(b)识别该会话语音;(c)通过一随机函数确定该会话语音对应的一回应语音,该随机函数以该会话语音的各回应语音的加权值为变量;(d)输出该会话语音对应的回应语音;(e)对所输出回应语音的回应次数加一;及(f)根据加权值函数更新该会话语音的各回应语音的加权值。
本发明之可会话的类生物装置及其会话方法,通过对用户输入的会话语音设置多个回应语音,并根据每个回应语音的加权值确定输出的回应语音,如此,该类生物装置可根据不同用户相同或相似的语音做出多种不同的回答。
附图说明
图1是本发明一实施方式可会话的类生物装置的硬件架构图;及
图2是本发明一实施方式类生物装置的会话方法的流程图。
具体实施方式
如图1所示,为本发明一实施方式可会话的类生物装置1的硬件架构图。该类生物装置1包括一麦克风10、一模数转换器20、一处理单元30、一存储单元40、一会话控制单元50、一数模转换器60及一扬声器70。
该会话控制单元50,用于控制该类生物装置1处于一会话状态或非会话状态。当该类生物装置1处于会话状态时,处理单元30控制该麦克风10采集来自用户产生的会话语音的模拟信号,所采集到的会话语音的模拟信号经模数转换器20转换成数字信号后被传输至处理单元30,所述处理单元30识别该会话语音并对该会话语音进行回应。而当该类生物装置1处于非会话状态时,处理单元30控制该麦克风10不采集用户产生的会话语音或类生物装置1对用户的会话语音不产生回应。但在本发明另一实施方式中,该类生物装置1也可随时接收及识别用户的会话语音,并对其做出回应。为了方便描述,以下将该类生物装置1根据所接收到会话语音回应产生的语音称为回应语音。
该类生物装置1回应所接收到的会话语音时,可由该处理单元30将回应语音的音频数据传输至数模转换器60转换为模拟信号后由该扬声器70输出。
该存储单元40存储有多个回应语音的音频数据及一语音输出表401。如表1所示,该语音输出表401定义了该类生物装置1可识别的多个会话语音、每一条会话语音可能进行回复的至少一条回应语音,该语音输出表401还记录了每一条回应语音的回应次数和加权值。该语音输出表401包括一会话语音栏、一回应语音栏、一回应次数栏及一加权值栏。该会话语音栏记录了多个会话语音如A、B和一不确定的会话语音,该不确定的会话语音在表1中为空,该不确定的会话语音代表除表1中所定义的会话语音以外的会话语音,即该类生物装置1不能识别或没有特别定义其回应语音的会话语音。每一会话语音对应的回应语音栏记录了该会话语音对应的多个回应语音,如会话语音A对应的回应语音为A1、A2、A3等,该不确定的会话语音对应的回应语音为T1、T2、T3等。一会话语音对应的回应次数栏记录了每个回应语音的回应次数,如会话语音A的回应语音A1、A2、A3对应的回应次数分别为nA1、nA2、nA3,当某一回应语音被选定输出一次时,与该回应语音对应的回应次数增加一次。加权值栏记录了每个回应语音的加权值,每个加权值由一加权值函数根据该会话语音的各回应语音的回应次数为变量确定,例如,回应语音A1的加权值为VA1=f(nA1,nA2,nA3...)。当一回应语音的回应次数增加时,该回应语音的加权值随之改变。回应语音的回应次数越大,其加权值就越小,输出该回应语音的可能性就越小;回应语音的回应次数越小,其加权值就越大,该回应语音被选择回应的可能性就越大。
                           表1
Figure A200710076770D00071
该处理单元30包括一会话语音识别模块301、一回应语音确定模块302、一回应语音输出模块303、一计数模块304及一加权值更新模块305。
该会话语音识别模块301用于识别经模数转换器20转换后会话语音的数字信号。该回应语音确定模块302根据该语音输出表401获取识别得到的会话语音对应的回应语音,并根据一随机函数选定这些回应语音中的一回应语音,该被选定的回应语音即用于回应所接收到的会话语音。例如,会话语音识别模块301识别得到用户所产生的会话语音为A,则回应语音确定模块302根据该语音输出表401的定义确定会话语音A的回应语音包括有A1、A2、A3......,所述回应语音确定模块302通过一随机函数从A1、A2、A3......中选定一回应语音如A2,则A2即用于回应A。在本实施方式中该随机函数是为根据会话语音对应的每一回应语音的加权值来确定回应语音,例如,会话语音A对应的回应语音QA=F(VA1,VA2,VA3...),VA1、VA2、VA3...分别为会话语音A对应的各回应语音的加权值。在确定输出的回应语音后,该回应语音输出模块303从存储单元40中获取该回应语音的音频数据,并解码输出该回应语音的音频数据,该回应语音的音频数据经数模转换器60转换为模拟信号后通过该扬声器70输出。该计数模块304用于在该回应语音输出模块303输出一确定回应语音后,将语音输出表401中该回应语音对应的回应次数加1。该加权值更新模块305获取更新的回应次数,根据加权值函数计算公式重新计算各回应语音对应的加权值,并更新语音输出表401中加权值栏各回应语音对应的加权值。
图2是本发明一实施方式类生物装置1的会话方法的流程图。麦克风10接收到用户会话语音的模拟语音信号,并经模数转换器20转换成数字语音信号后传输至处理单元30处理(步骤S110);会话语音识别模块301对该会话语音的数字语音信号进行识别(步骤S120);该回应语音确定模块302根据该语音输出表401获取该会话语音对应的回应语音,并通过一随机函数以每一回应语音的加权值为变量确定其中一回应语音(步骤S130);该回应语音输出模块303从存储单元40中获取该回应语音的音频数据,并解码输出该音频数据,该回应语音的音频数据经数模转换器60转换为模拟信号后通过该扬声器70输出(步骤S140);该计数模块304对语音输出表401中该回应语音对应的回应次数加一(步骤S150);加权值更新模块305根据一由以该会话语音对应的各回应语音的回应次数为变量的加权值函数来更新语音输出表401中各回应语音对应的加权值(步骤S160),如此本次会话流程结束。

Claims (5)

1.一种可会话的类生物装置,该类生物装置包括一麦克风、一模数转换器、一数模转换器、一扬声器及一存储单元,该麦克风用于采集会话语音的模拟信号,该模拟信号经所述模数转换器转换为数字信号,其特征在于:
该存储单元存储有多个回应语音的音频数据及一语音输出表,该语音输出表定义了多个会话语音、每一会话语音对应的至少一个回应语音、及每一回应语音对应的回应次数及加权值,其中,每一回应语音对应的加权值由一会话语音对应的各回应语音的回应次数确定;该类生物装置还包括:
一会话语音识别模块,用于识别所述会话语音;
一回应语音确定模块,用于通过一随机函数选取所述会话语音其中一回应语音,该随机函数以该会话语音的各回应语音的加权值为变量;
一回应语音输出模块,用于输出该回应语音确定模块确定的回应语音的音频数据,所述回应语音的音频数据传输至该数模转换器转换为模拟信号后由该扬声器输出;
一计数模块,用于将所输出回应语音对应的回应次数加一;及
一加权值更新模块,用于根据更新后的回应次数调用加权值函数重新计算并更新输出回应语音对应会话语音的各回应语音的加权值。
2.如权利要求1所述可会话的类生物装置,其特征在于,所述语音输出表还定义有不确定的会话语音对应的多个回应语音。
3.如权利要求1所述可会话的类生物装置,其特征在于,该类生物装置还包括一会话控制单元,用于控制所述麦克风采集用户的会话语音,当该会话控制单元处于非工作状态时,所述麦克风不采集用户的会话语音。
4.一种类生物装置的会话方法,该类生物装置存储有多个回应语音的音频数据及一语音输出表,该语音输出表定义了多个会话语音、每一会话语音对应的至少一个回应语音、及每一回应语音对应的回应次数及加权值,其中,每一回应语音对应的加权值由一会话语音对应的各回应语音的回应次数确定,其特征在于,该方法包括步骤:
接收用户的会话语音;
识别该会话语音;
通过一随机函数确定该会话语音对应的一回应语音,该随机函数以该会话语音的各回应语音的加权值为变量;
输出该会话语音对应的回应语音;
对所输出回应语音的回应次数加一;及
根据加权值函数更新该会话语音的各回应语音的加权值。
5.如权利要求4所述类生物装置的会话方法,其特征在于,所述语音输出表还定义有不确定的会话语音对应的多个回应语音。
CNA2007100767704A 2007-08-31 2007-08-31 可会话的类生物装置及其会话方法 Pending CN101377924A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CNA2007100767704A CN101377924A (zh) 2007-08-31 2007-08-31 可会话的类生物装置及其会话方法
US12/191,276 US20090063155A1 (en) 2007-08-31 2008-08-13 Robot apparatus with vocal interactive function and method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007100767704A CN101377924A (zh) 2007-08-31 2007-08-31 可会话的类生物装置及其会话方法

Publications (1)

Publication Number Publication Date
CN101377924A true CN101377924A (zh) 2009-03-04

Family

ID=40408841

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007100767704A Pending CN101377924A (zh) 2007-08-31 2007-08-31 可会话的类生物装置及其会话方法

Country Status (2)

Country Link
US (1) US20090063155A1 (zh)
CN (1) CN101377924A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104981188A (zh) * 2013-05-14 2015-10-14 夏普株式会社 电子设备
CN109887505A (zh) * 2019-03-11 2019-06-14 百度在线网络技术(北京)有限公司 用于唤醒设备的方法和装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320420A (zh) * 2007-06-08 2008-12-10 鹏智科技(深圳)有限公司 类生物系统、类生物装置及其行为执行方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3254994B2 (ja) * 1995-03-01 2002-02-12 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
US6089942A (en) * 1998-04-09 2000-07-18 Thinking Technology, Inc. Interactive toys
JP3771812B2 (ja) * 2001-05-28 2006-04-26 インターナショナル・ビジネス・マシーンズ・コーポレーション ロボットおよびその制御方法
JP4040573B2 (ja) * 2003-12-12 2008-01-30 キヤノン株式会社 音声認識装置および方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104981188A (zh) * 2013-05-14 2015-10-14 夏普株式会社 电子设备
CN104981188B (zh) * 2013-05-14 2017-10-27 夏普株式会社 电子设备
CN109887505A (zh) * 2019-03-11 2019-06-14 百度在线网络技术(北京)有限公司 用于唤醒设备的方法和装置

Also Published As

Publication number Publication date
US20090063155A1 (en) 2009-03-05

Similar Documents

Publication Publication Date Title
CN101436404A (zh) 可会话的类生物装置及其会话方法
CN110442701B (zh) 语音对话处理方法及装置
US8172637B2 (en) Programmable interactive talking device
CN104123938A (zh) 语音控制系统、电子装置及语音控制方法
CN105141587A (zh) 一种虚拟玩偶互动方法及装置
CN205508398U (zh) 具有云端交互功能的智能机器人
CN106384591A (zh) 一种与语音助手应用交互的方法和装置
CN106560892A (zh) 智能机器人及其云端交互方法、云端交互系统
CN110223697A (zh) 人机对话方法及系统
CN111081280A (zh) 与文本无关的语音情感识别方法及装置、用于识别情感的算法模型的生成方法
CN110347366B (zh) 音量调节方法、终端设备、存储介质及电子设备
CN113823273B (zh) 音频信号处理方法、装置、电子设备及存储介质
CN113643714B (zh) 音频处理方法、装置、存储介质及计算机程序
CN109671429A (zh) 语音交互方法及设备
CN109686370A (zh) 基于语音控制进行斗地主游戏的方法及装置
CN101393738A (zh) 可会话的类生物装置及其会话方法
CN101377924A (zh) 可会话的类生物装置及其会话方法
CN108053826A (zh) 用于人机交互的方法、装置、电子设备及存储介质
CN111339881A (zh) 基于情绪识别的宝宝成长监护方法及系统
CN106326087B (zh) 基于机器人操作系统的网页体验方法及系统
CN111081238B (zh) 一种蓝牙音箱语音交互控制方法、装置及系统
CN208724111U (zh) 基于电视设备的远场语音控制系统
CN114201596A (zh) 虚拟数字人使用方法、电子设备和存储介质
CN110277093B (zh) 音频信号的检测方法及装置
CN113314121A (zh) 无声语音识别方法、装置、介质、耳机及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
DD01 Delivery of document by public notice

Addressee: Pengzhi Technology (Shenzhen) Co., Ltd.

Document name: Notification that Application Deemed to be Withdrawn

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20090304