CN107492381A - 一种聊天机器人的音色配置装置及其方法 - Google Patents

一种聊天机器人的音色配置装置及其方法 Download PDF

Info

Publication number
CN107492381A
CN107492381A CN201710757531.9A CN201710757531A CN107492381A CN 107492381 A CN107492381 A CN 107492381A CN 201710757531 A CN201710757531 A CN 201710757531A CN 107492381 A CN107492381 A CN 107492381A
Authority
CN
China
Prior art keywords
module
tone color
chatting object
age
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710757531.9A
Other languages
English (en)
Inventor
郑杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201710757531.9A priority Critical patent/CN107492381A/zh
Publication of CN107492381A publication Critical patent/CN107492381A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Image Analysis (AREA)

Abstract

一种聊天机器人的音色配置装置,包括数据采集模块、控制模块、数据分析模块和数据输出模块,所述数据采集模块、控制模块、数据分析模块和数据输出模块依次连接,所述数据采集模块包括图像采集模块、升高测量模块和音频采集模块,图像采集模块用于采集聊天对象的音容相貌,升高测量模块用于采集聊天对象的升高,音频采集模块用于采集聊天对象的音频;所述数据分析模块包括性别判断模块和年龄判断模块,根据图像采集模块、升高测量模块个音频采集模块传送的数据共同确定聊天对象的年龄。本发明的有益效果是可以根据聊天对象的性别和年龄来选择与之相适应的音色来进行聊天,增加了聊天的趣味性,有效提高了人们交流的兴趣。

Description

一种聊天机器人的音色配置装置及其方法
技术领域
本发明涉及聊天机器人技术领域,具体是一种聊天机器人的音色配置装置及其方法。
背景技术
世界上最早的聊天机器人诞生于20世纪80年代,名为“阿尔贝特”,用BASIC语言编写而成。今天的互联网上,已出现“比利”、“艾丽斯”等聊天机器人等,中文的如“白丝魔理沙”、“乌贼娘”等由网友制作的聊天机器人。据悉,还有一个“约翰·列侬人工智能计划”,以再现当年“披头士”乐队主唱的风采为目标。1950年,图灵在哲学刊物《思维》上发表“计算机器与智能”的文章,提出了后来经典的图灵测试——交谈能检验智能,如果一台计算机能像人一样对话,它就能像人一样思考。他由此获称“人工智能之父”。
1991年,美国科学家兼慈善家休·勒布纳设立人工智能年度比赛——勒布纳奖,号称是对图灵测试的第一种实践,旨在奖励最擅长模仿人类真实对话场景的机器人。
2008年,勒布纳奖人工智能奖最后一轮10月12日在英国雷丁大学展开。艾尔博特等6种软件程序击败另外7种程序,获决赛资格。艾尔博特与12个陌生人交谈,力图让他们相信它是“人”。一番争论、笑声过后,这一电脑程序成功骗过3人,在今年人工智能比赛中拔得头筹,朝“成为史上第一台能思考的机器”目标更近一步。
在现有技术中,聊天机器人所采用的输出音频均是固定不变的,即随着聊天对象的变化,输出音频的音色始终不变化,当不同性别、不同年龄的聊天对象与其进行聊天时,其其音色无法变化,过于单调和死板,如与孩童聊天时若同样使用孩童的音色来进行聊天,来必然会增加更多的趣味性。
发明内容
本发明的目的在于提供一种聊天机器人的音色配置装置及其方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种聊天机器人的音色配置装置,包括数据采集模块、控制模块、数据分析模块和数据输出模块,所述数据采集模块、控制模块、数据分析模块和数据输出模块依次连接,所述数据采集模块包括图像采集模块、升高测量模块和音频采集模块,图像采集模块用于采集聊天对象的音容相貌,升高测量模块用于采集聊天对象的升高,音频采集模块用于采集聊天对象的音频;所述数据分析模块包括性别判断模块和年龄判断模块,根据图像采集模块、升高测量模块个音频采集模块传送的数据共同确定聊天对象的年龄,根据音频采集模块来判断聊天对象的年龄;所述数据输出模块包括音色储存模块,音色储存模块连接音色对比模块,音色对比模块连接音色配置模块,音色配置模块连接音频输出模块,音频采集模块将采集到音频数据与音色储存模块内储存的音色作对比,以进一步确定聊天对象的音色,然后根据确定下来的音色配置输出的音色,再通过音频输出模块与聊天对象进行对象。
作为本发明的进一步方案是:所述图像采集模块为摄像头。
作为本发明的再进一步方案是:所述音频采集模块为麦克风。
作为本发明的再进一步方案是:所述音频输出模块为麦克风。
作为本发明的再进一步方案是:所述性别判断模块包括性别特征提取模块和性别对比模块。
作为本发明的再进一步方案是:所述年龄判断模块包括年龄特征提取模块和年龄对比模块。
一种聊天机器人的音色配置方法,包括以下步骤:
(1)数据采集模块中的图像采集模块采集聊天记录的音容相貌,升高测量模块采集聊天对象的升高,音频采集模块采集聊天对象的音频,得到采集数据;
(2)所述采集采集数据传送给控制模块,控制模块再发送给数据分析模块;
(3)性别判断模块中的性别特征提取模块对聊天对象的性别特征(如毛发、胡须特征和衣着特征),再将这些性别与性别对比模块中储存的性别特征进行对比来确定聊天对象的性别;年龄判断模块中的年龄特征提取模块对聊天对象的面部特征(如皱纹、面色特征和毛孔特征),再将这些面部与年龄对比模块中储存的面部特征进行对比来确定聊天对象的年龄范围,该范围以3岁为一个间隔,如0-3岁,4-6岁.....;
(4)音频采集模块采集的音频与音色储存模块作对比,音色对比模块根据对比情况来判断聊天对象的音色,音色配置模块根据确定的聊天对象的音色、性别和年龄来确定需要输出音频的音色,音频再通过音频输出模块输出与聊天对象进行聊天。
与现有技术相比,本发明的有益效果是可以根据聊天对象的性别和年龄来选择与之相适应的音色来进行聊天,增加了聊天的趣味性,有效提高了人们交流的兴趣,使应用范围更加广泛。
附图说明
图1为本发明的原理框体。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中,一种聊天机器人的音色配置装置,包括数据采集模块、控制模块、数据分析模块和数据输出模块,所述数据采集模块、控制模块、数据分析模块和数据输出模块依次连接,所述数据采集模块包括图像采集模块、升高测量模块和音频采集模块,图像采集模块用于采集聊天对象的音容相貌,升高测量模块用于采集聊天对象的升高,音频采集模块用于采集聊天对象的音频;所述数据分析模块包括性别判断模块和年龄判断模块,根据图像采集模块、升高测量模块个音频采集模块传送的数据共同确定聊天对象的年龄,根据音频采集模块来判断聊天对象的年龄;所述数据输出模块包括音色储存模块,音色储存模块连接音色对比模块,音色对比模块连接音色配置模块,音色配置模块连接音频输出模块,音频采集模块将采集到音频数据与音色储存模块内储存的音色作对比,以进一步确定聊天对象的音色,然后根据确定下来的音色配置输出的音色,再通过音频输出模块与聊天对象进行对象。
所述图像采集模块为摄像头。
所述音频采集模块为麦克风,所述音频输出模块为麦克风。
所述性别判断模块包括性别特征提取模块和性别对比模块。
所述年龄判断模块包括年龄特征提取模块和年龄对比模块。
一种聊天机器人的音色配置方法,包括以下步骤:
(1)数据采集模块中的图像采集模块采集聊天记录的音容相貌,升高测量模块采集聊天对象的升高,音频采集模块采集聊天对象的音频,得到采集数据;
(2)所述采集采集数据传送给控制模块,控制模块再发送给数据分析模块;
(3)性别判断模块中的性别特征提取模块对聊天对象的性别特征(如毛发、胡须特征和衣着特征),再将这些性别与性别对比模块中储存的性别特征进行对比来确定聊天对象的性别;年龄判断模块中的年龄特征提取模块对聊天对象的面部特征(如皱纹、面色特征和毛孔特征),再将这些面部与年龄对比模块中储存的面部特征进行对比来确定聊天对象的年龄范围,该范围以3岁为一个间隔,如0-3岁,4-6岁.....;
(4)音频采集模块采集的音频与音色储存模块作对比,音色对比模块根据对比情况来判断聊天对象的音色,音色配置模块根据确定的聊天对象的音色、性别和年龄来确定需要输出音频的音色,音频再通过音频输出模块输出与聊天对象进行聊天。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (7)

1.一种聊天机器人的音色配置装置,其特征在于,包括数据采集模块、控制模块、数据分析模块和数据输出模块,所述数据采集模块、控制模块、数据分析模块和数据输出模块依次连接,所述数据采集模块包括图像采集模块、升高测量模块和音频采集模块,图像采集模块用于采集聊天对象的音容相貌,升高测量模块用于采集聊天对象的升高,音频采集模块用于采集聊天对象的音频;所述数据分析模块包括性别判断模块和年龄判断模块,根据图像采集模块、升高测量模块个音频采集模块传送的数据共同确定聊天对象的年龄,根据音频采集模块来判断聊天对象的年龄;所述数据输出模块包括音色储存模块,音色储存模块连接音色对比模块,音色对比模块连接音色配置模块,音色配置模块连接音频输出模块,音频采集模块将采集到音频数据与音色储存模块内储存的音色作对比,以进一步确定聊天对象的音色,然后根据确定下来的音色配置输出的音色,再通过音频输出模块与聊天对象进行对象。
2.根据权利要求1所述的一种聊天机器人的音色配置装置,其特征在于,所述图像采集模块为摄像头。
3.根据权利要求1所述的一种聊天机器人的音色配置装置,其特征在于,所述音频采集模块为麦克风。
4.根据权利要求1所述的一种聊天机器人的音色配置装置,其特征在于,所述音频输出模块为麦克风。
5.根据权利要求1所述的一种聊天机器人的音色配置装置,其特征在于,所述性别判断模块包括性别特征提取模块和性别对比模块。
6.根据权利要求1所述的一种聊天机器人的音色配置装置,其特征在于,所述年龄判断模块包括年龄特征提取模块和年龄对比模块。
7.一种根据权利要求1-6任一所述的聊天机器人的音色配置方法,其特征在于,包括以下步骤:
(1)数据采集模块中的图像采集模块采集聊天记录的音容相貌,升高测量模块采集聊天对象的升高,音频采集模块采集聊天对象的音频,得到采集数据;
(2)所述采集采集数据传送给控制模块,控制模块再发送给数据分析模块;
(3)性别判断模块中的性别特征提取模块对聊天对象的性别特征(如毛发、胡须特征和衣着特征),再将这些性别与性别对比模块中储存的性别特征进行对比来确定聊天对象的性别;年龄判断模块中的年龄特征提取模块对聊天对象的面部特征(如皱纹、面色特征和毛孔特征),再将这些面部与年龄对比模块中储存的面部特征进行对比来确定聊天对象的年龄范围,该范围以3岁为一个间隔,如0-3岁,4-6岁.....;
(4)音频采集模块采集的音频与音色储存模块作对比,音色对比模块根据对比情况来判断聊天对象的音色,音色配置模块根据确定的聊天对象的音色、性别和年龄来确定需要输出音频的音色,音频再通过音频输出模块输出与聊天对象进行聊天。
CN201710757531.9A 2017-08-29 2017-08-29 一种聊天机器人的音色配置装置及其方法 Pending CN107492381A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710757531.9A CN107492381A (zh) 2017-08-29 2017-08-29 一种聊天机器人的音色配置装置及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710757531.9A CN107492381A (zh) 2017-08-29 2017-08-29 一种聊天机器人的音色配置装置及其方法

Publications (1)

Publication Number Publication Date
CN107492381A true CN107492381A (zh) 2017-12-19

Family

ID=60651178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710757531.9A Pending CN107492381A (zh) 2017-08-29 2017-08-29 一种聊天机器人的音色配置装置及其方法

Country Status (1)

Country Link
CN (1) CN107492381A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110154016A (zh) * 2018-08-09 2019-08-23 腾讯科技(深圳)有限公司 机器人控制方法、装置、存储介质和计算机设备
CN110610703A (zh) * 2019-07-26 2019-12-24 深圳壹账通智能科技有限公司 基于机器人识别的语音输出方法、装置、机器人及介质
CN111428637A (zh) * 2020-03-24 2020-07-17 新石器慧通(北京)科技有限公司 无人驾驶车辆主动发起人机交互的方法及无人驾驶车辆

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1625487A1 (en) * 2003-05-14 2006-02-15 Ncr International Inc. Self-service terminal
JP4881980B2 (ja) * 2008-12-23 2012-02-22 韓國電子通信研究院 音声及び映像に基づく性別−年齢識別方法及びその装置
CN104123938A (zh) * 2013-04-29 2014-10-29 富泰华工业(深圳)有限公司 语音控制系统、电子装置及语音控制方法
US9317785B1 (en) * 2014-04-21 2016-04-19 Video Mining Corporation Method and system for determining ethnicity category of facial images based on multi-level primary and auxiliary classifiers
CN106503275A (zh) * 2016-12-30 2017-03-15 首都师范大学 聊天机器人的音色配置方法及装置
BR112016024007A2 (pt) * 2014-04-17 2017-08-15 Softbank Robotics Europe métodos e sistemas para gerenciar os diálogos de um robô

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1625487A1 (en) * 2003-05-14 2006-02-15 Ncr International Inc. Self-service terminal
JP4881980B2 (ja) * 2008-12-23 2012-02-22 韓國電子通信研究院 音声及び映像に基づく性別−年齢識別方法及びその装置
KR101189765B1 (ko) * 2008-12-23 2012-10-15 한국전자통신연구원 음성 및 영상에 기반한 성별-연령 판별방법 및 그 장치
CN104123938A (zh) * 2013-04-29 2014-10-29 富泰华工业(深圳)有限公司 语音控制系统、电子装置及语音控制方法
BR112016024007A2 (pt) * 2014-04-17 2017-08-15 Softbank Robotics Europe métodos e sistemas para gerenciar os diálogos de um robô
US9317785B1 (en) * 2014-04-21 2016-04-19 Video Mining Corporation Method and system for determining ethnicity category of facial images based on multi-level primary and auxiliary classifiers
CN106503275A (zh) * 2016-12-30 2017-03-15 首都师范大学 聊天机器人的音色配置方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110154016A (zh) * 2018-08-09 2019-08-23 腾讯科技(深圳)有限公司 机器人控制方法、装置、存储介质和计算机设备
CN110610703A (zh) * 2019-07-26 2019-12-24 深圳壹账通智能科技有限公司 基于机器人识别的语音输出方法、装置、机器人及介质
CN111428637A (zh) * 2020-03-24 2020-07-17 新石器慧通(北京)科技有限公司 无人驾驶车辆主动发起人机交互的方法及无人驾驶车辆

Similar Documents

Publication Publication Date Title
JP7184914B2 (ja) 対話型コンテンツにおけるイベントの発見及び検出
CN106625678B (zh) 机器人表情控制方法和装置
CN109176535A (zh) 基于智能机器人的交互方法及系统
CN107243905A (zh) 基于养老机器人的情绪自适应系统
CN110119815A (zh) 模型训练方法、装置、存储介质及设备
CN109769099A (zh) 通话人物异常的检测方法和装置
CN111841018B (zh) 模型训练方法、模型使用方法、计算机设备及存储介质
CN108108340A (zh) 用于智能机器人的对话交互方法及系统
CN107492381A (zh) 一种聊天机器人的音色配置装置及其方法
CN107511832A (zh) 云端互动系统及其多感知型智能机器人和感知互动方法
CN110085225A (zh) 语音交互方法、装置、智能机器人及计算机可读存储介质
CN104965695B (zh) 模拟用户实时操作的方法和装置
CN106599196A (zh) 一种人工智能对话方法及系统
CN108345385A (zh) 虚拟陪跑人物建立与交互的方法及装置
CN110310647A (zh) 一种语音身份特征提取器、分类器训练方法及相关设备
CN109784277A (zh) 一种基于智能眼镜的情绪识别方法
CN105797374A (zh) 一种配合脸部表情跟随发出相应语音的方法和终端
CN111589120B (zh) 目标物控制方法、计算机设备及计算机可读存储介质
CN110501673A (zh) 一种基于多任务时频卷积神经网络的双耳听觉声源空间方向估计方法和系统
CN103685349A (zh) 一种信息处理的方法及一种电子设备
CN105797376A (zh) 一种根据用户表情控制角色模型行为的方法和终端
CN105797375A (zh) 一种跟随用户脸部表情改变角色模型表情的方法和终端
CN107564542A (zh) 基于幽默识别的情感交互方法和机器人系统
CN114360018A (zh) 三维人脸表情的渲染方法及装置、存储介质及电子装置
CN110287912A (zh) 基于深度学习的目标对象情感状态确定方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171219