CN108682413B - 一种基于语音转换的情感疏导系统 - Google Patents

一种基于语音转换的情感疏导系统 Download PDF

Info

Publication number
CN108682413B
CN108682413B CN201810374212.4A CN201810374212A CN108682413B CN 108682413 B CN108682413 B CN 108682413B CN 201810374212 A CN201810374212 A CN 201810374212A CN 108682413 B CN108682413 B CN 108682413B
Authority
CN
China
Prior art keywords
voice
user
module
information
emotion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810374212.4A
Other languages
English (en)
Other versions
CN108682413A (zh
Inventor
龙艳花
陆宇
杜如帆
张玲
袁倩
王懿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Normal University
Original Assignee
Shanghai Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Normal University filed Critical Shanghai Normal University
Priority to CN201810374212.4A priority Critical patent/CN108682413B/zh
Publication of CN108682413A publication Critical patent/CN108682413A/zh
Application granted granted Critical
Publication of CN108682413B publication Critical patent/CN108682413B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)
  • Child & Adolescent Psychology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于语音转换的情感疏导系统,涉及语音转换领域,包括语音模块和互动交流模块,语音模块包括语音分享模块和音乐推荐模块,语音分享模块获取输入系统的语音信息、对语音信息进行韵律转换并对语音信息进行敏感词监测;音乐推荐模块根据输入系统的信息推荐音乐;互动交流模块包括心里话模块和房间模块,用户能够通过心里话模块上传信息,上传的信息为文字信息或者语音信息,用户能够通过房间模块创建或者加入房间,进行多人在线交流,在线交流过程中,语音信息能够实时进行韵律转换。本发明的情感疏导系统通过为用户提供一个情感宣泄的出口以降低用户的压力,通过系统自动向用户提供正向反馈及鼓励信息,让用户感受到支持和鼓励。

Description

一种基于语音转换的情感疏导系统
技术领域
本发明涉及语音转换领域,尤其涉及一种基于语音转换的情感疏导系统。
背景技术
目前,经济快速发展的同时,人们的生活节奏不断加快,承受的压力也不断增大,各阶层、各年龄段均有人处于高压状态,人们承受着来自家庭、经济、就业、工作、学业等多个方面的精神压力。随压力一起出现的是现在广为人知的抑郁症和逐年上升的自杀率。抑郁的诱因并非完全来自压力,但是目前社会对抑郁症缺乏了解,敢于正视抑郁并接受治疗的少之又少,而更多数的抑郁患者无法向熟悉的人倾诉,难以获得周围的人的理解和支持。据世界卫生组织研究显示,目前抑郁症已成为世界第四大疾病,中国抑郁焦虑患者人数呈逐年上升的态势。
目前以减轻压力为目标产生的国内app(手机软件)有:减压宝、喜马拉雅、高考零分作文、Soul等,通过音乐、阅读及互动减压为主。减压宝的特色在于免费减压音频、在线咨询专家、自我测试、心理健康报告;喜马拉雅是一款听书类app,它通过声音来使人放松;Soul是由广场、星球、发表、消息、用户中心构成,其中广场是可以看到所有人的动态,星球可随机加好友,在发表模块支持发布文字、语音、视频信息;而其他娱乐性app则是通过提供幽默内容达到减压目的。
在快节奏的生活中,尤其是在年轻人中,通过运动和写文字去减压效果不明显,需要一款快捷方便的语音减压系统以缓解压力。通过分享自己的喜悦、愤怒和悲伤,把负面情绪以及心底的秘密在不暴露自己身份的同时通过语言倾诉出来,减轻自己的压力。
因此,本领域的技术人员致力于开发一种基于语音转换的情感疏导系统,让人们能够通过该软件平台分享自己的故事,以语音转换的形式对外进行传播,且能收到故事倾听者的感受及正面反馈。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是开发一种基于语音转换的情感疏导系统,让人们能够通过该软件平台分享自己的故事,以语音转换的形式对外进行传播,且能收到故事倾听者的感受及正面反馈。
为实现上述目的,本发明提供了一种基于语音转换的情感疏导系统,包括语音模块和互动交流模块,所述语音模块包括语音分享模块和音乐推荐模块,所述语音分享模块获取输入系统的语音信息、对语音信息进行韵律转换并对语音信息进行敏感词监测;所述音乐推荐模块根据输入系统的信息推荐音乐;互动交流模块包括心里话模块和房间模块,用户能够通过所述心里话模块上传信息,上传的信息为文字信息或者语音信息,用户能够通过所述房间模块创建或者加入房间,进行多人在线交流,在线交流过程中,语音信息能够实时进行韵律转换。
进一步地,所述语音分享模块中获取语音信息包括获取用户上传至系统中的语音信息和将用户输入的文字内容转换为语音信息,之后将获取的语音信息上传至系统服务器中,根据用户选择的目标语音进行韵律转换,所述目标语音包括方言及明星声音。
进一步地,根据用户选择的目标语音进行韵律转换方法包括:
步骤S11,对原始语音重采样,采样率由16kHz转换为8kHz,进入步骤S12;
步骤S12,提取语音韵律特征,如基频、能量、共振峰、语速,进入步骤S13;
步骤S13,调整韵律特征,进入步骤S15;
步骤S14,提取谐波、噪声分量,进入步骤S15;
步骤S15,将步骤S13调整后的韵律特征与步骤S14提取的谐波、噪声合成,进入步骤S16;
步骤S16,进行韵律特性转换后得到目标语音。
进一步地,所述语音分享模块中敏感词监测方法包括:
步骤S21,获取待检语音文件,包括用户上传的分享语音源文件和其他用户上传的评论语音,获取语音文件的帧数,进入步骤S23;
步骤S22,选取库中预设的语音关键词,获取语音关键词的帧数,进入步骤S23;
步骤S23,计算步骤S22中获取的语音关键词与步骤S21中获取的语音文件的帧数距离,获得距离矩阵,进入步骤24;
步骤S24,对步骤S23获得的距离矩阵归一化处理,进入步骤S25;
步骤S25,规划最小的匹配路径,采用动态规划方法:
步骤S251,初始化参数,进入步骤S252;
步骤S252,迭代计算,进入步骤S253;
步骤S253,找到关键词对文件的匹配分数,分数越低匹配度越高,进入步骤S254;
步骤S254,关键词匹配后,即识别出语音信息中的敏感词后,通知用户该信息为敏感信息无法上传,并将该信息删除,进入步骤S26;
步骤S26,判断库中预设的语音关键词是否匹配完毕,是,则进入步骤S27,否,则进入步骤S22;
步骤S27,在检测完毕的语音文件设置敏感词检测标记,系统后续再次获取的带有标记语音文件时,不对此文件进行重复检测。
进一步地,所述敏感词监测方法还包括人工审核,系统收集用户对于语音信息的反馈,如用户举报信息包括敏感词,则进行人工审核,并对上传敏感信息的用户发送警告信息。
进一步地,所述情感疏导系统记录用户违规次数,在用户违规并接到警告信息后,如再次上传含有敏感内容,将此用户列入重点监控名单,对重点监控名单中的用户同时进行自动监测和人工审核,如再次检测到敏感内容,则禁用该账户。
进一步地,所述音乐推荐模块根据用户输入语音分享模块的内容识别用户情绪,根据用户情绪以及用户分享或常听的音乐类型推荐适合音乐。
进一步地,所述心里话模块中包括发布模块和反馈模块,所述发布模块包括心情如何、文字信息上传、图像信息上传和定位,所述反馈模块包括正向反馈按钮和评论功能;用户在使用所述发布模块时,心情如何为必选项,文字信息上传、图像信息和定位为可选项;用户在使用反馈模块时,能够通过点击正向反馈按钮向用户传递支持,每次点击计数一次,可设置单用户点击正向反馈最大次数,超过该次数后不再增加正向反馈按钮计数,评论功能区包括预设内容和自定义内容,用户可选择通过预设内容向用户提供正向鼓励或自定义评论内容。
进一步地,在用户通过所述发布模块发布信息后,系统在一定时间内,自动触发用户正向反馈按钮并计入计数,在触发正向反馈按钮的同时,系统根据用户选择的心情触发正向鼓励评论,让用户感受到关注和鼓励。
进一步地,系统对所述评论功能区中的自定义评论内容进行过滤,对于负面评论进行过滤,仅显示对用户进行正向鼓励的内容。
进一步地,所述情感疏导系统还包括用户账户管理模块,所述用户账户管理模块包括账户名创建模块、头像设置模块、密码管理模块和好友管理模块,系统用户能够通过所述账户名创建模块建立账号;系统用户能够通过头像设置模块上传个性化图片作为头像;系统用户能够通过密码管理模块进行密码修改和密码找回;系统用户能够通过好友管理模块对好友进行管理。
进一步地,在所述情感疏导系统中,用户能够在所述用户账户管理模块中选择使用游客模式直接登录,游客模式下随机生成账号名称,游客模式用于系统体验。
技术效果
本发明的情感疏导系统通过为用户提供一个情感宣泄的出口以降低用户的压力,用户在使用该情感疏导系统过程中,上传的语音信息均经过语音转换,可有效保护个人隐私,另外,通过系统自动向用户提供正向反馈及鼓励信息,让用户感受到支持和鼓励;通过敏感词监测功能,对于违反协议和侮辱性词汇的语音不予发布,以保障网络交流的健康安全并对用户自身隐私进行保护。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的一个较佳实施例的功能模块示意图;
图2是本发明的一个较佳实施例的目标语音进行韵律转换流程图;
图3是本发明的一个较佳实施例的敏感词监测流程图。
具体实施方式
以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
通常,为实施本发明的实施例而执行的例行程序可能是一个操作系统的一部分或一个具体应用程序、部件、计算机程序、模块、对象或指令序列。本发明的计算机程序一般是由许多指令组成的,由本地计算机将这些指令转换成为计算机可读格式,从而成为可执行的指令。这些程序也由变量和数据结构组成,它们或者存在于程序之中或者能在内存或存储设备中找到。此外,可以根据在本发明的具体实施例中执行的应用程序来鉴定下述各种不同的、计算机程序。然而,应当理解,仅仅是为了方便才使用下面任何特定的程序术语,因此,本发明不应只限于用在由这些术语所确定和/或暗指的任何具体的应用程序中。
下面将论及本发明的实施例。然而,应当理解,本发明并不限于具体描述的实施例。相反,下列特征和元素的任何结合,不管是否与各个实施例相关,都是打算用来贯彻和实施本发明的。此外,在不同的实施例中本发明提供了优于以前工艺的许多优点。然而,尽管本发明的实施例可能具有超过其它可能的解决方案和/或先前工艺的若干优点,但是,不管一个指定的实施例是否具有某一个特定的优点,它都不成其为对本发明的限制。因此,下面的各个方面、特征、实施例和优点仅仅是说明性的,除非明确提出而外,都不能认为是附后的权利要求的组成部分或限制。
如图1所示,一种基于语音转换的情感疏导系统,包括语音模块、互动交流模块和用户账户管理模块,语音模块包括语音分享模块和音乐推荐模块,语音分享模块获取输入系统的语音信息、对语音信息进行韵律转换并对语音信息进行敏感词监测;音乐推荐模块根据输入系统的信息推荐音乐;互动交流模块包括心里话模块和房间模块,用户能够通过心里话模块上传信息,上传的信息为文字信息或者语音信息,用户能够通过房间模块创建或者加入房间,进行多人在线交流,在线交流过程中,语音信息能够实时进行韵律转换;用户账户管理模块包括账户名创建模块、头像设置模块、密码管理模块和好友管理模块,系统用户能够通过账户名创建模块建立账号;系统用户能够通过头像设置模块上传个性化图片作为头像;系统用户能够通过密码管理模块进行密码修改和密码找回;系统用户能够通过好友管理模块对好友进行管理。
语音分享模块中获取语音信息包括获取用户上传至系统中的语音信息和将用户输入的文字内容转换为语音信息,之后将获取的语音信息上传至系统服务器中,根据用户选择的目标语音进行韵律转换,目标语音包括方言及明星声音。
如图2所示,根据用户选择的目标语音进行韵律转换方法包括:
步骤S11,对原始语音重采样,采样率由16kHz转换为8kHz,进入步骤S12;
步骤S12,提取语音韵律特征,如基频、能量、共振峰、语速,进入步骤S13;
步骤S13,调整韵律特征,进入步骤S15;
步骤S14,提取谐波、噪声分量,进入步骤S15;
步骤S15,将步骤S13调整后的韵律特征与步骤S14提取的谐波、噪声合成,进入步骤S16;
步骤S16,通过公式
Figure BDA0001639482590000051
进行韵律特性转换后得到目标语音,公式
Figure BDA0001639482590000052
Figure BDA0001639482590000053
Figure BDA0001639482590000054
其中,sh(t)为浊音部分的合成语音,sn(t)为合成的非浊音部分语音和静音,L(t)表示谐波的个数,ω0(t)表示原始基频参数,Ak(t)为信号的幅度,α,β和γ是合成时对原始幅度Ak(t),对语速h(k,t)和共振峰f(k,t)的规整因子,δ和φ分别是对原始基频ω0(t)和改变后的基频p(t)的规整因子。
通过这种方式,可以不需要使用训练语料就快速合成出音色与原始语音非常不同的语音,即达到了把故事分享者的语音进行了音色、语速转换后的语音了,能较好的保护好用户的真实身份。
如图3所示,语音分享模块中敏感词监测方法包括:
步骤S21,获取待检语音文件s=(s1,s2,…,sn),其中n为语音句子的帧数,包括用户上传的分享语音源文件和其他用户上传的评论语音,获取语音文件的帧数,进入步骤S23;
步骤S22,选取库中预设的语音关键词,q=(q1,q2,…,qm),其中m为语音关键词的帧数获取语音关键词的帧数,进入步骤S23;
步骤S23,计算步骤S22中获取的语音关键词与步骤S21中获取的语音文件的帧数距离,获得距离矩阵dist,dist(i,j)代表关键词的第i帧与句子的第j帧之间的距离,1≤i≤m,1≤j≤n,对于MFCC和SBN(stacked bottle-neck)特征,使用余弦距离:
Figure BDA0001639482590000055
对于后验特征,使用内积距离:
dist(i,j)=-ln(qiTsj)
进入步骤24;
步骤S24,对步骤S23获得的距离矩阵归一化处理使距离取值在0到1之间,
Figure BDA0001639482590000061
进入步骤S25;
步骤S25,找到一条使平均累积距离cost(i,j)=a(i,j)/l(i,j),其中a(i,j)代表从某个起点(1,e)到达(i,j)所经历的累计距离,而l(i,j)表示从某个起点(1,e)开始到达(i,j)所经历的路径长度,规划最小的匹配路径,采用动态规划方法:
步骤S251,初始化参数a和l,
Figure BDA0001639482590000062
Figure BDA0001639482590000063
,进入步骤S252;
步骤S252,迭代计算,对于i>0且j>0的部分从{(i-1,j),(i,j-1),(i-1,j-1)}中选取一个点(u,v),使
Figure BDA0001639482590000064
最小,则:
Figure BDA0001639482590000065
进入步骤S253;
步骤S253,找到关键词对文件的匹配分数
Figure BDA0001639482590000071
分数越低匹配度越高,进入步骤S254;
步骤S254,关键词匹配后,即识别出语音信息中的敏感词后,通知用户该信息为敏感信息无法上传,并将该信息删除,进入步骤S26;
步骤S26,判断库中预设的语音关键词是否匹配完毕,是,则进入步骤S27,否,则进入步骤S22;
步骤S27,在检测完毕的语音文件设置敏感词检测标记,系统后续再次获取的带有标记语音文件时,不对此文件进行重复检测。
敏感词监测方法还包括人工审核,系统收集用户对于语音信息的反馈,如用户举报信息包括敏感词,则进行人工审核,并对上传敏感信息的用户发送警告信息,情感疏导系统记录用户违规次数,在用户违规并接到警告信息后,如再次上传含有敏感内容,将此用户列入重点监控名单,对重点监控名单中的用户同时进行自动监测和人工审核,如再次检测到敏感内容,则禁用该账户。
音乐推荐模块根据用户输入语音分享模块的内容识别用户情绪,根据用户情绪以及用户分享或常听的音乐类型推荐适合音乐。
心里话模块中包括发布模块和反馈模块,发布模块包括心情如何、文字信息上传、图像信息上传和定位,反馈模块包括正向反馈按钮和评论功能;用户在使用发布模块时,心情如何为必选项,文字信息上传、图像信息和定位为可选项;用户在使用反馈模块时,能够通过点击正向反馈按钮向用户传递支持,每次点击计数一次,可设置单用户点击正向反馈最大次数,超过该次数后不再增加正向反馈按钮计数,评论功能区包括预设内容和自定义内容,用户可选择通过预设内容向用户提供正向鼓励或自定义评论内容。
在用户通过发布模块发布信息后,系统在一定时间内,自动触发用户正向反馈按钮并计入计数,在触发正向反馈按钮的同时,系统根据用户选择的心情触发正向鼓励评论,让用户感受到关注和鼓励。
系统对评论功能区中的自定义评论内容进行过滤,对于负面评论进行过滤,仅显示对用户进行正向鼓励的内容。
在情感疏导系统中,用户能够在用户账户管理模块中选择使用游客模式直接登录,游客模式下随机生成账号名称,游客模式用于系统体验。
实施例1:
一种基于语音转换的情感疏导系统,包括语音模块、互动交流模块和用户账户管理模块。
用户进入该基于语音转换的情感疏导系统,通过用户账户管理模块建立账号,建立账号时可选择随机生成昵称或者自定义昵称,自定义框中设置有提示内容“为更好的保护您的隐私,建议不要使用真实姓名”。用户通过头像设置模块上传了一张真人照片,系统检测到头像为真实照片后,在用户确认上传为头像前,系统弹出提示信息:“为更好的保护您的隐私,建议您选择与本人关联度较弱的图片作为头像”,用户重新上传了一张卡通动物图片作为头像,无提示信息产生,用户确认上传头像。用户通过密码管理模块进行密码修改。用户通过好友管理模块添加了系统推荐的好友并将不想再联系的好友删除。
语音分享模块中,用户用手机用户端录制一段60秒的语音并上传到语音分享模块中,系统将获取的语音信息上传至系统服务器中;用户选择明星A的声音作为转换目标声音,用户确认目标声音后,语音分享模块开始对语音进行韵律转换,并对该用户的情绪状态进行识别,系统经过分析后发现该用户语音中的情绪为“伤心”。
语音分享模块在进行韵律转换的同时对上传的语音信息进行敏感词监测,识别出语音信息中的敏感词后通知用户该信息为敏感信息无法上传,并将该信息删除。
语音分享模块的敏感词监测方法还包括人工审核,系统收集用户对于语音信息的反馈,如用户举报信息包括敏感词,则进行人工审核,并对上传敏感信息的用户发送警告信息,情感疏导系统记录用户违规次数,在用户违规并接到警告信息后,如再次上传含有敏感内容,将此用户列入重点监控名单,对重点监控名单中的用户同时进行自动监测和人工审核,如再次检测到敏感内容,则禁用该账户。
音乐推荐模块根据用户输入语音分享模块的内容识别得到的用户情绪“伤心”以及用户录入语音前在该系统中听的音乐推荐适合音乐,如贝多芬的《小夜曲》,让用户从伤心的情绪中尽快走出来。
用户通过互动交流模块包括心里话模块和房间模块,用户通过心里话模块的发布模块发表心情,其中,心情如何为必选项,用户选择了“伤心”,输入文字“陪伴我多年的柚子去世了,愿你在天堂一切安好”,并上传了一张橘猫的照片。其他用户通过点击反馈模块的正向反馈按钮“加油,一切都会好起来的”对该用户进行支持,某用户为表对该用户的鼓励,点击正向反馈按钮10次后系统弹出提示“已经到达最大支持次数,请您继续支持其他的心情”;某用户通过在评论功能区通过选择系统预设内容“好好照顾自己”对该用户进行鼓励;某用户通过输入自定义内容分享自己的经历送出鼓励。在用户通过发布模块发布信息后,系统在10分钟内,自动触发用户正向反馈按钮1次,在触发正向反馈按钮的同时,系统根据用户选择的心情触发正向鼓励评论,让用户感受到关注和鼓励。
系统对评论功能区中的自定义评论内容进行过滤,对于负面评论进行过滤,仅显示对用户进行正向鼓励的内容。
用户在房间模块中可以创建房间,邀请在线用户加入一起进行语音或文字聊天,其他用户可以在房间模块中加入已经创建的房间,用户们进行语音聊天时,语音信息能够实时进行韵律转换。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (8)

1.一种基于语音转换的情感疏导系统,其特征在于,包括语音模块和互动交流模块,所述语音模块包括语音分享模块和音乐推荐模块,所述语音分享模块获取输入系统的语音信息、对语音信息进行韵律转换并对语音信息进行敏感词监测;所述音乐推荐模块根据输入系统的信息推荐音乐;互动交流模块包括心里话模块和房间模块,用户能够通过所述心里话模块上传信息,上传的信息为文字信息或者语音信息,用户能够通过所述房间模块创建或者加入房间,进行多人在线交流,在线交流过程中,语音信息能够实时进行韵律转换;所述语音分享模块中获取语音信息包括获取用户上传至系统中的语音信息和将用户输入的文字内容转换为语音信息,之后将获取的语音信息上传至系统服务器中,根据用户选择的目标语音进行韵律转换,所述目标语音包括方言及明星声音;
根据用户选择的目标语音进行韵律转换方法包括:
步骤S11,对原始语音重采样,进入步骤S12;
步骤S12,提取语音韵律特征,进入步骤S13;
步骤S13,调整韵律特征,进入步骤S15;
步骤S14,提取谐波、噪声分量,进入步骤S15;
步骤S15,将步骤S13调整后的韵律特征与步骤S14提取的谐波、噪声合成,进入步骤S16;
步骤S16,通过公式
Figure FDA0002550532870000011
进行韵律特性转换后得到目标语音,公式
Figure FDA0002550532870000012
Figure FDA0002550532870000013
Figure FDA0002550532870000014
其中,sh(t)为浊音部分的合成语音,sn(t)为合成的非浊音部分语音和静音,L(t)表示谐波的个数,ω0(t)表示原始基频参数,Ak(t)为信号的幅度,α,β和γ是合成时对原始幅度Ak(t),对语速h(k,t)和共振峰f(k,t)的规整因子,δ和φ分别是对原始基频ω0(t)和改变后的基频p(t)的规整因子。
2.如权利要求1所述的基于语音转换的情感疏导系统,其特征在于,所述语音分享模块中敏感词监测方法包括:
步骤S21,获取待检语音文件,获取语音文件的帧数,进入步骤S23;
步骤S22,选取库中预设的语音关键词,获取语音关键词的帧数,进入步骤S23;
步骤S23,计算步骤S22中获取的语音关键词与步骤S21中获取的语音文件的帧数距离,获得距离矩阵,进入步骤24;
步骤S24,对步骤S23获得的距离矩阵归一化处理,进入步骤S25;
步骤S25,规划最小的匹配路径,采用动态规划方法:
步骤S251,初始化参数,进入步骤S252;
步骤S252,迭代计算,进入步骤S253;
步骤S253,找到关键词对文件的匹配分数,分数越低匹配度越高,进入步骤S254;
步骤S254,关键词匹配后,即识别出语音信息中的敏感词后,通知用户该信息为敏感信息无法上传,并将该信息删除,进入步骤S26;
步骤S26,判断库中预设的语音关键词是否匹配完毕,是,则进入步骤S27,否,则进入步骤S22;
步骤S27,在检测完毕的语音文件设置敏感词检测标记,系统后续再次获取的带有标记语音文件时,不对此文件进行重复检测。
3.如权利要求2所述的基于语音转换的情感疏导系统,其特征在于,所述敏感词监测方法还包括人工审核,系统收集用户对于语音信息的反馈,如用户举报信息包括敏感词,则进行人工审核,并对上传敏感信息的用户发送警告信息。
4.如权利要求2或3所述的基于语音转换的情感疏导系统,其特征在于,所述情感疏导系统记录用户违规次数,在用户违规并接到警告信息后,如再次上传含有敏感内容,将此用户列入重点监控名单,对重点监控名单中的用户同时进行自动监测和人工审核,如再次检测到敏感内容,则禁用用户账户。
5.如权利要求1所述的基于语音转换的情感疏导系统,其特征在于,所述音乐推荐模块根据用户输入语音分享模块的内容识别用户情绪,根据用户情绪以及用户分享或常听的音乐类型推荐适合音乐。
6.如权利要求1所述的基于语音转换的情感疏导系统,其特征在于,所述心里话模块中包括发布模块和反馈模块,所述发布模块包括心情如何、文字信息上传、图像信息上传和定位,所述反馈模块包括正向反馈按钮和评论功能;用户在使用所述发布模块时,心情如何为必选项,文字信息上传、图像信息和定位为可选项;用户在使用反馈模块时,能够通过点击正向反馈按钮向用户传递支持,每次点击计数一次,可设置单用户点击正向反馈最大次数,超过该次数后不再增加正向反馈按钮计数,评论功能区包括预设内容和自定义内容,用户可选择通过预设内容向用户提供正向鼓励或自定义评论内容。
7.如权利要求6所述的基于语音转换的情感疏导系统,其特征在于,在用户通过所述发布模块发布信息后,系统在一定时间内,自动触发用户正向反馈按钮并计入计数,在触发正向反馈按钮的同时,系统根据用户选择的心情触发正向鼓励评论,让用户感受到关注和鼓励。
8.如权利要求6所述的基于语音转换的情感疏导系统,其特征在于,系统对所述评论功能区中的自定义评论内容进行过滤,对于负面评论进行过滤,仅显示对用户进行正向鼓励的内容。
CN201810374212.4A 2018-04-24 2018-04-24 一种基于语音转换的情感疏导系统 Active CN108682413B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810374212.4A CN108682413B (zh) 2018-04-24 2018-04-24 一种基于语音转换的情感疏导系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810374212.4A CN108682413B (zh) 2018-04-24 2018-04-24 一种基于语音转换的情感疏导系统

Publications (2)

Publication Number Publication Date
CN108682413A CN108682413A (zh) 2018-10-19
CN108682413B true CN108682413B (zh) 2020-09-29

Family

ID=63802415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810374212.4A Active CN108682413B (zh) 2018-04-24 2018-04-24 一种基于语音转换的情感疏导系统

Country Status (1)

Country Link
CN (1) CN108682413B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109616131B (zh) * 2018-11-12 2023-07-07 南京南大电子智慧型服务机器人研究院有限公司 一种数字实时语音变音方法
CN109671422B (zh) * 2019-01-09 2022-06-17 浙江工业大学 一种获取纯净语音的录音方法
CN109857852B (zh) * 2019-01-24 2021-02-23 安徽商贸职业技术学院 一种电商在线评论训练集特征的筛选判断方法及系统
CN112651013B (zh) * 2020-12-29 2023-03-31 五八有限公司 用户账户处理方法、装置、电子设备和计算机可读介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1274222A2 (en) * 2001-07-02 2003-01-08 Nortel Networks Limited Instant messaging using a wireless interface
CN1567428A (zh) * 2003-06-19 2005-01-19 北京中科信利技术有限公司 一种基于数字信号处理的语音变声方法
CN1719514A (zh) * 2004-07-06 2006-01-11 中国科学院自动化研究所 基于语音分析与合成的高品质实时变声方法
CN101622659A (zh) * 2007-06-06 2010-01-06 松下电器产业株式会社 音质编辑装置及音质编辑方法
CN103632672A (zh) * 2012-08-28 2014-03-12 腾讯科技(深圳)有限公司 一种变声系统、方法及人机交互系统及方法
CN104038788A (zh) * 2014-06-19 2014-09-10 中山大学深圳研究院 一种小区社交网络系统及内容推荐方法
CN104038410A (zh) * 2014-06-12 2014-09-10 上海高派信息科技有限公司 一种群组成员身份信息保护方法及系统
CN105006230A (zh) * 2015-06-10 2015-10-28 合肥工业大学 一种面向非特定人的语音敏感信息检测和过滤方法
CN106730234A (zh) * 2017-01-11 2017-05-31 上海北辰软件股份有限公司 一种智能情绪疏导系统
CN106847310A (zh) * 2017-02-17 2017-06-13 安徽金猫数字科技有限公司 一种基于语音识别的情感分析系统
CN107562850A (zh) * 2017-08-28 2018-01-09 百度在线网络技术(北京)有限公司 音乐推荐方法、装置、设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4170217B2 (ja) * 2001-08-31 2008-10-22 株式会社ケンウッド ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム
US7519534B2 (en) * 2002-10-31 2009-04-14 Agiletv Corporation Speech controlled access to content on a presentation medium
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
CN102682761A (zh) * 2011-03-12 2012-09-19 谢津 个性化的声音处理系统和设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1274222A2 (en) * 2001-07-02 2003-01-08 Nortel Networks Limited Instant messaging using a wireless interface
CN1567428A (zh) * 2003-06-19 2005-01-19 北京中科信利技术有限公司 一种基于数字信号处理的语音变声方法
CN1719514A (zh) * 2004-07-06 2006-01-11 中国科学院自动化研究所 基于语音分析与合成的高品质实时变声方法
CN101622659A (zh) * 2007-06-06 2010-01-06 松下电器产业株式会社 音质编辑装置及音质编辑方法
CN103632672A (zh) * 2012-08-28 2014-03-12 腾讯科技(深圳)有限公司 一种变声系统、方法及人机交互系统及方法
CN104038410A (zh) * 2014-06-12 2014-09-10 上海高派信息科技有限公司 一种群组成员身份信息保护方法及系统
CN104038788A (zh) * 2014-06-19 2014-09-10 中山大学深圳研究院 一种小区社交网络系统及内容推荐方法
CN105006230A (zh) * 2015-06-10 2015-10-28 合肥工业大学 一种面向非特定人的语音敏感信息检测和过滤方法
CN106730234A (zh) * 2017-01-11 2017-05-31 上海北辰软件股份有限公司 一种智能情绪疏导系统
CN106847310A (zh) * 2017-02-17 2017-06-13 安徽金猫数字科技有限公司 一种基于语音识别的情感分析系统
CN107562850A (zh) * 2017-08-28 2018-01-09 百度在线网络技术(北京)有限公司 音乐推荐方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN108682413A (zh) 2018-10-19

Similar Documents

Publication Publication Date Title
CN108682413B (zh) 一种基于语音转换的情感疏导系统
US11113419B2 (en) Selective enforcement of privacy and confidentiality for optimization of voice applications
TW491991B (en) System, method, and article of manufacture for a voice recognition system for navigating on the internet utilizing audible information
Carter et al. Language, discourse and literature: An introductory reader in discourse stylistics
JP5394118B2 (ja) 行動分析装置及びコールセンターシステム
Pisanski et al. Volitional exaggeration of body size through fundamental and formant frequency modulation in humans
TW548631B (en) System, method, and article of manufacture for a voice recognition system for identity authentication in order to gain access to data on the Internet
Ren Affective information processing and recognizing human emotion
JP2003508805A (ja) 複数の音声信号パラメータの分析を通して音声信号の感情を検出する装置、方法、及び、製造物品
McCloy et al. Talker versus dialect effects on speech intelligibility: A symmetrical study
Batliner et al. Ethics and good practice in computational paralinguistics
US20200388281A1 (en) Information processing system, and information processing method
MacArthur et al. Beyond poet voice: sampling the (non-) performance styles of 100 American poets
Fish et al. The sound of (in) sincerity
Künzel Automatic speaker recognition with crosslanguage speech material
Milne et al. From Verbal Account to Written Evidence: Do Written Statements Generated by Officers Accurately Represent What Witnesses Say?
Koenecke et al. Careless Whisper: Speech-to-Text Hallucination Harms
JP6697373B2 (ja) 文生成装置、文生成方法及びプログラム
Caniago et al. Commissive act used in Fatherhood movie (2021)
Kurbesov et al. Automated voice recognition of emotions through the use of neural networks
Nolan Language, Culture and Knowledge in Context: A Functional-Cognitive Approach
US20240038222A1 (en) System and method for consent detection and validation
Ruano Charles Dickens's Influence on Shaw Revisited: A Corpus-Based Stylistic Study
Velichko et al. Comparative analysis of classification methods for automatic deception detection in speech
Powell The place of identity dissonance and emotional motivations in bio-cultural models of religious experience: A report from the 19th century

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20181019

Assignee: YUNZHISHENG (SHANGHAI) INTELLIGENT TECHNOLOGY Co.,Ltd.

Assignor: SHANGHAI NORMAL University

Contract record no.: X2021310000035

Denomination of invention: An emotional counseling system based on speech conversion

Granted publication date: 20200929

License type: Common License

Record date: 20210929