CN106855879A - 人工智能心理与音乐咨询的机器人 - Google Patents

人工智能心理与音乐咨询的机器人 Download PDF

Info

Publication number
CN106855879A
CN106855879A CN201611153070.6A CN201611153070A CN106855879A CN 106855879 A CN106855879 A CN 106855879A CN 201611153070 A CN201611153070 A CN 201611153070A CN 106855879 A CN106855879 A CN 106855879A
Authority
CN
China
Prior art keywords
information
topic
robot
music
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611153070.6A
Other languages
English (en)
Inventor
简仁贤
颜彩思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intelligent Technology (shanghai) Co Ltd
Original Assignee
Intelligent Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intelligent Technology (shanghai) Co Ltd filed Critical Intelligent Technology (shanghai) Co Ltd
Priority to CN201611153070.6A priority Critical patent/CN106855879A/zh
Publication of CN106855879A publication Critical patent/CN106855879A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Mechanical Engineering (AREA)
  • Robotics (AREA)
  • Acoustics & Sound (AREA)
  • Library & Information Science (AREA)
  • Toys (AREA)
  • Manipulator (AREA)

Abstract

本发明提供了人工智能心理与音乐咨询的机器人,输入模块获取用户的文字、语音或影像信息;情绪识别模块用于识别获取信息中的情绪信息;文本咨询模块用于识别获取信息中的语法信息;话题识别模块用于识别获取信息中的话题信息;语言行为识别模块用于识别获取信息中的语意信息;回应模块用于根据情绪信息、语法信息、话题信息和语意信息得到回应信号并通过文字、语音或音乐方式输出。该机器人综合考虑了用户的文字内容、语音内容、影像内容和用户情绪等多种因素,能够收集用户文字、语音或影像信息中的情绪信息、语法信息、话题信息和语意信息,并根据上述信息产生相应的文字、语音或音乐做出有效回应。

Description

人工智能心理与音乐咨询的机器人
技术领域
本发明属于人工智能技术领域,具体涉及人工智能心理与音乐咨询的机器人。
背景技术
人工智能是研究、开发用于模拟、延伸和扩展人工智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
机器人是人工智能主要应用的产品,例如人工智能心理与音乐咨询的机器人,该机器人利用收到的用户输入,调取语音库或影像库以及模板来判断用户文字讲话或影像,并根据用户文字、语音或影像内容进行回应。该机器人能够自动根据用户文字、语音或影像内容进行文字或语音音乐输出回应,例如根据用户文字语音或影像内容输出不同的音乐来调节用户情绪,但是现有技术缺乏能够根据用户的情感困扰、或针对自闭症患者做出有效回应的机器人。
发明内容
针对现有技术中的缺陷,本发明提供一种人工智能心理与音乐咨询的机器人,能够根据用户的情感困扰、或针对自闭症患者做出有效回应。
人工智能心理与音乐咨询的机器人,包括输入模块、情绪识别模块、文本咨询模块、话题识别模块、语言行为识别模块和回应模块;输入模块用于获取用户的文字、语音或影像信息;情绪识别模块用于识别获取文字、语音或影像信息中的情绪信息;文本咨询模块用于识别获取文字或语音信息中的语法信息;话题识别模块用于识别获取文字或语音信息中的话题信息;语言行为识别模块用于识别获取文字或语音信息中的语意信息;回应模块用于根据情绪信息、语法信息、话题信息和语意信息得到回应信号并输出。
优选地,所述情绪信息包括以下信息中的一项或多项:用户当前情绪、用户过去主要情绪、用户过去次要情绪。
优选地,所述语法信息包括以下信息中的一项或多项:语意、关键词、专有名词和动词。
优选地,所述话题信息包括以下信息中的一项或多项:当前主要话题、当前次要话题、过去主要话题、过去次要话题、常聊话题、喜好话题和热门话题。
优选地,语意信息包括以下信息中的一项或多项:句型和语气。
优选地,所述回应模块中设有回应数据库和音乐数据库,回应数据库用于存储多个不同回应文字或回应语音信息;音乐数据库用于存储多个不同的音乐信息;回应模块根据情绪信息、语法信息、话题信息和语意信息得到用户情感特征值和机器人情感特征值,并根据用户情感特征值和机器人情感特征值从回应数据库或音乐数据库中挑选对应的回应文字、回应语音信息或音乐信息,作为回应信号输出。
由上述技术方案可知,本发明提供的人工智能心理与音乐咨询的机器人,综合考虑了用户的说话内容和用户情绪等多种因素,能够收集用户语音信息中的情绪信息、语法信息、话题信息和语意信息,并根据上述信息产生相应的文字、语音或音乐做出有效回应。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为人工智能心理与音乐咨询的机器人运行时的流程框图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
实施例:
人工智能心理与音乐咨询的机器人,如图1所示,包括输入模块、情绪识别模块、文本咨询模块、话题识别模块、语言行为识别模块和回应模块;输入模块用于获取用户的文字、语音或影像信息;情绪识别模块用于识别获取文字、语音或影像信息中的情绪信息;文本咨询模块用于识别获取文字或语音信息中的语法信息;话题识别模块用于识别获取文字或语音信息中的话题信息;语言行为识别模块用于识别获取文字或语音信息中的语意信息;回应模块用于根据情绪信息、语法信息、话题信息和语意信息得到回应信号并输出。
所述情绪信息包括以下信息中的一项或多项:用户当前情绪、用户过去主要情绪、用户过去次要情绪。情绪主要包括开心、烦恼、伤心等,用户过去主要情绪和用户过去次要情绪由机器人统计得到,用户过去主要情绪为机器人统计的过去出现次数最多的情绪,用户过去次要情绪为机器人统计的过去出现次数次之的情绪。该机器人结合当前情绪和过去情绪分析用户情绪,分析更加准确。
所述语法信息包括以下信息中的一项或多项:语意、关键词、专有名词和动词。文本咨询模块中设有相应的模板,文本咨询模块接收到语音信息时,根据模板进行拆分,得到语意、关键词、专有名词和动词,并根据语音信息和上下文文意,改写原始的语音信息。其中关键词和专有名词的判定可以通过与预设关键词和预设专有名词进行对比判定。语法信息能够帮助机器人更清楚地了解用户说话的主要思想。
所述话题信息包括以下信息中的一项或多项:当前主要话题、当前次要话题、过去主要话题、过去次要话题、常聊话题、喜好话题和热门话题。机器人根据话题信息进行分类,并在回应的时候从相应的话题分组中获取相应的回应数据。
语意信息包括以下信息中的一项或多项:句型和语气。句型通过与预设句型模板进行对比判断。语意信息用于进一步帮助分析用户情绪。
所述回应模块中设有回应数据库和音乐数据库,回应数据库用于存储多个不同回应文字或回应语音信息;音乐数据库用于存储多个不同的音乐信息;回应模块根据情绪信息、语法信息、话题信息和语意信息得到用户情感特征值和机器人情感特征值,并根据用户情感特征值和机器人情感特征值从回应数据库或音乐数据库中挑选对应的回应文字、回应语音信息或音乐信息,作为回应信号输出。
机器人情感特征值是系统借由过去与用户交互信息,整个外部资讯后,经过计算后得到的机器人情感状态,回应模块可以整合用户情感特征值和机器人情感特征值,形成双方情感特征值进行输出。机器人结合用户情感特征值、双方情感特征值、用户情绪和对话习惯,使用机器学习等相关算法确定当前的回应策略,从回应数据库或音乐数据库中挑选对应的回应文字、语音信息或音乐信息,作为回应信号通过文字、语音或音乐输出装置输出。或者是根据情绪信息、语法信息、话题信息和语意信息利用逻辑规则或机器学习等算法,自发性生成合适的回应信息输出。
该机器人运行时,首先通过输入模块输入用户的语音信息或者是文本句子,然后拆解语音信息中语意,并根据当前或过去的资讯得到用户情绪,根据用户当前与过去情绪,得到机器人自身情绪;其次,整合用户情绪、机器人情绪、语意后,确定回应策略,根据回应策略挑选对应的回应信号输出,或者是根据情绪信息、语法信息、话题信息和语意信息利用逻辑规则或机器学习等算法,自发性生成合适的回应信息输出。该机器人综合考虑了用户的说话内容和用户情绪等多种因素,能够收集用户语音信息中的情绪信息、语法信息、话题信息和语意信息,并根据上述信息产生相应的文字、语音或音乐做出有效回应。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (6)

1.人工智能心理与音乐咨询的机器人,其特征在于,包括输入模块、情绪识别模块、文本咨询模块、话题识别模块、语言行为识别模块和回应模块;输入模块用于获取用户的文字、语音或影像信息;情绪识别模块用于识别获取文字、语音或影像信息中的情绪信息;文本咨询模块用于识别获取文字或语音信息中的语法信息;话题识别模块用于识别获取文字或语音信息中的话题信息;语言行为识别模块用于识别获取文字或语音信息中的语意信息;回应模块用于根据情绪信息、语法信息、话题信息和语意信息得到回应信号并输出。
2.根据权利要求1所述的人工智能心理与音乐咨询的机器人,其特征在于,所述情绪信息包括以下信息中的一项或多项:用户当前情绪、用户过去主要情绪、用户过去次要情绪。
3.根据权利要求1所述的人工智能心理与音乐咨询的机器人,其特征在于,所述语法信息包括以下信息中的一项或多项:语意、关键词、专有名词和动词。
4.根据权利要求1所述的人工智能心理与音乐咨询的机器人,其特征在于,所述话题信息包括以下信息中的一项或多项:当前主要话题、当前次要话题、过去主要话题、过去次要话题、常聊话题、喜好话题和热门话题。
5.根据权利要求1所述的人工智能心理与音乐咨询的机器人,其特征在于,语意信息包括以下信息中的一项或多项:句型和语气。
6.根据权利要求1所述的人工智能心理与音乐咨询的机器人,其特征在于,所述回应模块中设有回应数据库和音乐数据库,回应数据库用于存储多个不同回应文字或回应语音信息;音乐数据库用于存储多个不同的音乐信息;回应模块根据情绪信息、语法信息、话题信息和语意信息得到用户情感特征值和机器人情感特征值,并根据用户情感特征值和机器人情感特征值从回应数据库或音乐数据库中挑选对应的回应文字、回应语音信息或音乐信息,作为回应信号输出。
CN201611153070.6A 2016-12-14 2016-12-14 人工智能心理与音乐咨询的机器人 Pending CN106855879A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611153070.6A CN106855879A (zh) 2016-12-14 2016-12-14 人工智能心理与音乐咨询的机器人

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611153070.6A CN106855879A (zh) 2016-12-14 2016-12-14 人工智能心理与音乐咨询的机器人

Publications (1)

Publication Number Publication Date
CN106855879A true CN106855879A (zh) 2017-06-16

Family

ID=59126254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611153070.6A Pending CN106855879A (zh) 2016-12-14 2016-12-14 人工智能心理与音乐咨询的机器人

Country Status (1)

Country Link
CN (1) CN106855879A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010540A (zh) * 2017-12-14 2018-05-08 上海惠诚科教器械股份有限公司 一种语音交互情绪调节系统
CN108255804A (zh) * 2017-09-25 2018-07-06 上海四宸软件技术有限公司 一种语言交流人工智能系统及其语言处理方法
CN108614678A (zh) * 2018-04-20 2018-10-02 郑州科技学院 一种基于人工智能的多功能智能人机交互方法
CN109352666A (zh) * 2018-10-26 2019-02-19 广州华见智能科技有限公司 一种基于机器语音对话的情感发泄方法及系统
WO2019100350A1 (en) * 2017-11-24 2019-05-31 Microsoft Technology Licensing, Llc Providing a summary of a multimedia document in a session
CN110335662A (zh) * 2019-06-11 2019-10-15 广东德泷智能科技有限公司 一种用于睡眠辅助治疗的人工智能机器人
CN112297016A (zh) * 2019-07-26 2021-02-02 深圳百诺明医说科技有限公司 基于用户语音的诊断建议反馈系统及医疗智能语音机器人
CN113870902A (zh) * 2021-10-27 2021-12-31 安康汇智趣玩具科技技术有限公司 一种语音交互毛绒玩具的情绪识别系统、装置及方法
CN115473864A (zh) * 2022-11-02 2022-12-13 平安银行股份有限公司 机器人聊天方法、计算机设备及存储介质
CN116872222A (zh) * 2023-06-21 2023-10-13 广州市恒缘健康信息科技有限公司 一种心理咨询机器人、系统、控制方法及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101706812A (zh) * 2009-11-24 2010-05-12 清华大学 一种文档的检索方法和装置
CN103116644A (zh) * 2013-02-26 2013-05-22 华南理工大学 Web主题倾向性挖掘与决策支持的方法
CN103810167A (zh) * 2012-11-06 2014-05-21 腾讯科技(深圳)有限公司 获取信息的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101706812A (zh) * 2009-11-24 2010-05-12 清华大学 一种文档的检索方法和装置
CN103810167A (zh) * 2012-11-06 2014-05-21 腾讯科技(深圳)有限公司 获取信息的方法和装置
CN103116644A (zh) * 2013-02-26 2013-05-22 华南理工大学 Web主题倾向性挖掘与决策支持的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
向勇等: "《北大讲坛 文化创新战略,创意与科技》", 31 December 2013, 北京联合出版社 *
罗广清: "基于中文文本情感分类的情感宣泄系统的研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108255804A (zh) * 2017-09-25 2018-07-06 上海四宸软件技术有限公司 一种语言交流人工智能系统及其语言处理方法
US11500917B2 (en) 2017-11-24 2022-11-15 Microsoft Technology Licensing, Llc Providing a summary of a multimedia document in a session
WO2019100350A1 (en) * 2017-11-24 2019-05-31 Microsoft Technology Licensing, Llc Providing a summary of a multimedia document in a session
CN110325982A (zh) * 2017-11-24 2019-10-11 微软技术许可有限责任公司 在会话中提供多媒体文档的摘要
CN110325982B (zh) * 2017-11-24 2023-03-28 微软技术许可有限责任公司 在会话中提供多媒体文档的摘要
CN108010540A (zh) * 2017-12-14 2018-05-08 上海惠诚科教器械股份有限公司 一种语音交互情绪调节系统
CN108614678A (zh) * 2018-04-20 2018-10-02 郑州科技学院 一种基于人工智能的多功能智能人机交互方法
CN109352666A (zh) * 2018-10-26 2019-02-19 广州华见智能科技有限公司 一种基于机器语音对话的情感发泄方法及系统
CN110335662A (zh) * 2019-06-11 2019-10-15 广东德泷智能科技有限公司 一种用于睡眠辅助治疗的人工智能机器人
CN112297016A (zh) * 2019-07-26 2021-02-02 深圳百诺明医说科技有限公司 基于用户语音的诊断建议反馈系统及医疗智能语音机器人
CN113870902A (zh) * 2021-10-27 2021-12-31 安康汇智趣玩具科技技术有限公司 一种语音交互毛绒玩具的情绪识别系统、装置及方法
CN113870902B (zh) * 2021-10-27 2023-03-14 安康汇智趣玩具科技技术有限公司 一种语音交互毛绒玩具的情绪识别系统、装置及方法
CN115473864A (zh) * 2022-11-02 2022-12-13 平安银行股份有限公司 机器人聊天方法、计算机设备及存储介质
CN116872222A (zh) * 2023-06-21 2023-10-13 广州市恒缘健康信息科技有限公司 一种心理咨询机器人、系统、控制方法及存储介质
CN116872222B (zh) * 2023-06-21 2024-02-06 广州市恒缘健康信息科技有限公司 一种心理咨询机器人、系统、控制方法及存储介质

Similar Documents

Publication Publication Date Title
CN106855879A (zh) 人工智能心理与音乐咨询的机器人
US11645547B2 (en) Human-machine interactive method and device based on artificial intelligence
Lugović et al. Techniques and applications of emotion recognition in speech
US9900436B2 (en) Coordinating voice calls between representatives and customers to influence an outcome of the call
Schuller et al. Cross-corpus acoustic emotion recognition: Variances and strategies
Klaylat et al. Emotion recognition in Arabic speech
Hema et al. Emotional speech recognition using cnn and deep learning techniques
CN105991847A (zh) 通话方法和电子设备
CN110110169A (zh) 人机交互方法及人机交互装置
CN109410927A (zh) 离线命令词与云端解析结合的语音识别方法、装置和系统
Devillers et al. Inference of human beings’ emotional states from speech in human–robot interactions
CN107480122A (zh) 一种人工智能交互方法及人工智能交互装置
CN110032742A (zh) 响应语句生成设备、方法和存储介质以及语音交互系统
Baur et al. eXplainable cooperative machine learning with NOVA
CN106775665A (zh) 基于情绪指标的情绪状态变化信息的获取方法及装置
KR102507809B1 (ko) 공감대 형성을 통한 심리 치료용 인공지능 대화 시스템
Alam et al. Comparative study of speaker personality traits recognition in conversational and broadcast news speech.
CN110502609A (zh) 一种调节情绪的方法、装置及陪伴机器人
Pérez-Espinosa et al. Using acoustic paralinguistic information to assess the interaction quality in speech-based systems for elderly users
Folkins et al. Taxonomies in biology, phonetics, phonology, and speech motor control
Johar Paralinguistic profiling using speech recognition
Esposito et al. Recent Advances in Nonlinear Speech Processing: Directions and Challenges
Schrank et al. Automatic detection of uncertainty in spontaneous German dialogue.
Carbajal et al. The “language filter” hypothesis: A feasibility study of language separation in infancy using unsupervised clustering of i-vectors
Mairesse Learning to adapt in dialogue systems: data-driven models for personality recognition and generation.

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170616

RJ01 Rejection of invention patent application after publication