CN108682413A - 一种基于语音转换的情感疏导系统 - Google Patents
一种基于语音转换的情感疏导系统 Download PDFInfo
- Publication number
- CN108682413A CN108682413A CN201810374212.4A CN201810374212A CN108682413A CN 108682413 A CN108682413 A CN 108682413A CN 201810374212 A CN201810374212 A CN 201810374212A CN 108682413 A CN108682413 A CN 108682413A
- Authority
- CN
- China
- Prior art keywords
- voice
- user
- module
- emotion
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 39
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 24
- 238000012544 monitoring process Methods 0.000 claims abstract description 26
- 230000001020 rhythmical effect Effects 0.000 claims abstract description 17
- 230000003993 interaction Effects 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims description 18
- 230000036651 mood Effects 0.000 claims description 13
- 238000012795 verification Methods 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000012217 deletion Methods 0.000 claims description 5
- 230000037430 deletion Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012552 review Methods 0.000 claims description 4
- 238000012952 Resampling Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 230000000977 initiatory effect Effects 0.000 claims description 3
- 230000033764 rhythmic process Effects 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims 1
- 239000004744 fabric Substances 0.000 claims 1
- 230000008859 change Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000006837 decompression Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000003001 depressive effect Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 244000276331 Citrus maxima Species 0.000 description 1
- 235000001759 Citrus maxima Nutrition 0.000 description 1
- 241000675108 Citrus tangerina Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000004630 mental health Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Child & Adolescent Psychology (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种基于语音转换的情感疏导系统,涉及语音转换领域,包括语音模块和互动交流模块,语音模块包括语音分享模块和音乐推荐模块,语音分享模块获取输入系统的语音信息、对语音信息进行韵律转换并对语音信息进行敏感词监测;音乐推荐模块根据输入系统的信息推荐音乐;互动交流模块包括心里话模块和房间模块,用户能够通过心里话模块上传信息,上传的信息为文字信息或者语音信息,用户能够通过房间模块创建或者加入房间,进行多人在线交流,在线交流过程中,语音信息能够实时进行韵律转换。本发明的情感疏导系统通过为用户提供一个情感宣泄的出口以降低用户的压力,通过系统自动向用户提供正向反馈及鼓励信息,让用户感受到支持和鼓励。
Description
技术领域
本发明涉及语音转换领域,尤其涉及一种基于语音转换的情感疏导系统。
背景技术
目前,经济快速发展的同时,人们的生活节奏不断加快,承受的压力也不断增大,各阶层、各年龄段均有人处于高压状态,人们承受着来自家庭、经济、就业、工作、学业等多个方面的精神压力。随压力一起出现的是现在广为人知的抑郁症和逐年上升的自杀率。抑郁的诱因并非完全来自压力,但是目前社会对抑郁症缺乏了解,敢于正视抑郁并接受治疗的少之又少,而更多数的抑郁患者无法向熟悉的人倾诉,难以获得周围的人的理解和支持。据世界卫生组织研究显示,目前抑郁症已成为世界第四大疾病,中国抑郁焦虑患者人数呈逐年上升的态势。
目前以减轻压力为目标产生的国内app(手机软件)有:减压宝、喜马拉雅、高考零分作文、Soul等,通过音乐、阅读及互动减压为主。减压宝的特色在于免费减压音频、在线咨询专家、自我测试、心理健康报告;喜马拉雅是一款听书类app,它通过声音来使人放松;Soul是由广场、星球、发表、消息、用户中心构成,其中广场是可以看到所有人的动态,星球可随机加好友,在发表模块支持发布文字、语音、视频信息;而其他娱乐性app则是通过提供幽默内容达到减压目的。
在快节奏的生活中,尤其是在年轻人中,通过运动和写文字去减压效果不明显,需要一款快捷方便的语音减压系统以缓解压力。通过分享自己的喜悦、愤怒和悲伤,把负面情绪以及心底的秘密在不暴露自己身份的同时通过语言倾诉出来,减轻自己的压力。
因此,本领域的技术人员致力于开发一种基于语音转换的情感疏导系统,让人们能够通过该软件平台分享自己的故事,以语音转换的形式对外进行传播,且能收到故事倾听者的感受及正面反馈。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是开发一种基于语音转换的情感疏导系统,让人们能够通过该软件平台分享自己的故事,以语音转换的形式对外进行传播,且能收到故事倾听者的感受及正面反馈。
为实现上述目的,本发明提供了一种基于语音转换的情感疏导系统,包括语音模块和互动交流模块,所述语音模块包括语音分享模块和音乐推荐模块,所述语音分享模块获取输入系统的语音信息、对语音信息进行韵律转换并对语音信息进行敏感词监测;所述音乐推荐模块根据输入系统的信息推荐音乐;互动交流模块包括心里话模块和房间模块,用户能够通过所述心里话模块上传信息,上传的信息为文字信息或者语音信息,用户能够通过所述房间模块创建或者加入房间,进行多人在线交流,在线交流过程中,语音信息能够实时进行韵律转换。
进一步地,所述语音分享模块中获取语音信息包括获取用户上传至系统中的语音信息和将用户输入的文字内容转换为语音信息,之后将获取的语音信息上传至系统服务器中,根据用户选择的目标语音进行韵律转换,所述目标语音包括方言及明星声音。
进一步地,根据用户选择的目标语音进行韵律转换方法包括:
步骤S11,对原始语音重采样,采样率由16kHz转换为8kHz,进入步骤S12;
步骤S12,提取语音韵律特征,如基频、能量、共振峰、语速,进入步骤S13;
步骤S13,调整韵律特征,进入步骤S15;
步骤S14,提取谐波、噪声分量,进入步骤S15;
步骤S15,将步骤S13调整后的韵律特征与步骤S14提取的谐波、噪声合成,进入步骤S16;
步骤S16,进行韵律特性转换后得到目标语音。
进一步地,所述语音分享模块中敏感词监测方法包括:
步骤S21,获取待检语音文件,包括用户上传的分享语音源文件和其他用户上传的评论语音,获取语音文件的帧数,进入步骤S23;
步骤S22,选取库中预设的语音关键词,获取语音关键词的帧数,进入步骤S23;
步骤S23,计算步骤S22中获取的语音关键词与步骤S21中获取的语音文件的帧数距离,获得距离矩阵,进入步骤24;
步骤S24,对步骤S23获得的距离矩阵归一化处理,进入步骤S25;
步骤S25,规划最小的匹配路径,采用动态规划方法:
步骤S251,初始化参数,进入步骤S252;
步骤S252,迭代计算,进入步骤S253;
步骤S253,找到关键词对文件的匹配分数,分数越低匹配度越高,进入步骤S254;
步骤S254,关键词匹配后,即识别出语音信息中的敏感词后,通知用户该信息为敏感信息无法上传,并将该信息删除,进入步骤S26;
步骤S26,判断库中预设的语音关键词是否匹配完毕,是,则进入步骤S27,否,则进入步骤S22;
步骤S27,在检测完毕的语音文件设置敏感词检测标记,系统后续再次获取的带有标记语音文件时,不对此文件进行重复检测。
进一步地,所述敏感词监测方法还包括人工审核,系统收集用户对于语音信息的反馈,如用户举报信息包括敏感词,则进行人工审核,并对上传敏感信息的用户发送警告信息。
进一步地,所述情感疏导系统记录用户违规次数,在用户违规并接到警告信息后,如再次上传含有敏感内容,将此用户列入重点监控名单,对重点监控名单中的用户同时进行自动监测和人工审核,如再次检测到敏感内容,则禁用该账户。
进一步地,所述音乐推荐模块根据用户输入语音分享模块的内容识别用户情绪,根据用户情绪以及用户分享或常听的音乐类型推荐适合音乐。
进一步地,所述心里话模块中包括发布模块和反馈模块,所述发布模块包括心情如何、文字信息上传、图像信息上传和定位,所述反馈模块包括正向反馈按钮和评论功能;用户在使用所述发布模块时,心情如何为必选项,文字信息上传、图像信息和定位为可选项;用户在使用反馈模块时,能够通过点击正向反馈按钮向用户传递支持,每次点击计数一次,可设置单用户点击正向反馈最大次数,超过该次数后不再增加正向反馈按钮计数,评论功能区包括预设内容和自定义内容,用户可选择通过预设内容向用户提供正向鼓励或自定义评论内容。
进一步地,在用户通过所述发布模块发布信息后,系统在一定时间内,自动触发用户正向反馈按钮并计入计数,在触发正向反馈按钮的同时,系统根据用户选择的心情触发正向鼓励评论,让用户感受到关注和鼓励。
进一步地,系统对所述评论功能区中的自定义评论内容进行过滤,对于负面评论进行过滤,仅显示对用户进行正向鼓励的内容。
进一步地,所述情感疏导系统还包括用户账户管理模块,所述用户账户管理模块包括账户名创建模块、头像设置模块、密码管理模块和好友管理模块,系统用户能够通过所述账户名创建模块建立账号;系统用户能够通过头像设置模块上传个性化图片作为头像;系统用户能够通过密码管理模块进行密码修改和密码找回;系统用户能够通过好友管理模块对好友进行管理。
进一步地,在所述情感疏导系统中,用户能够在所述用户账户管理模块中选择使用游客模式直接登录,游客模式下随机生成账号名称,游客模式用于系统体验。
技术效果
本发明的情感疏导系统通过为用户提供一个情感宣泄的出口以降低用户的压力,用户在使用该情感疏导系统过程中,上传的语音信息均经过语音转换,可有效保护个人隐私,另外,通过系统自动向用户提供正向反馈及鼓励信息,让用户感受到支持和鼓励;通过敏感词监测功能,对于违反协议和侮辱性词汇的语音不予发布,以保障网络交流的健康安全并对用户自身隐私进行保护。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的一个较佳实施例的功能模块示意图;
图2是本发明的一个较佳实施例的目标语音进行韵律转换流程图;
图3是本发明的一个较佳实施例的敏感词监测流程图。
具体实施方式
以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
通常,为实施本发明的实施例而执行的例行程序可能是一个操作系统的一部分或一个具体应用程序、部件、计算机程序、模块、对象或指令序列。本发明的计算机程序一般是由许多指令组成的,由本地计算机将这些指令转换成为计算机可读格式,从而成为可执行的指令。这些程序也由变量和数据结构组成,它们或者存在于程序之中或者能在内存或存储设备中找到。此外,可以根据在本发明的具体实施例中执行的应用程序来鉴定下述各种不同的、计算机程序。然而,应当理解,仅仅是为了方便才使用下面任何特定的程序术语,因此,本发明不应只限于用在由这些术语所确定和/或暗指的任何具体的应用程序中。
下面将论及本发明的实施例。然而,应当理解,本发明并不限于具体描述的实施例。相反,下列特征和元素的任何结合,不管是否与各个实施例相关,都是打算用来贯彻和实施本发明的。此外,在不同的实施例中本发明提供了优于以前工艺的许多优点。然而,尽管本发明的实施例可能具有超过其它可能的解决方案和/或先前工艺的若干优点,但是,不管一个指定的实施例是否具有某一个特定的优点,它都不成其为对本发明的限制。因此,下面的各个方面、特征、实施例和优点仅仅是说明性的,除非明确提出而外,都不能认为是附后的权利要求的组成部分或限制。
如图1所示,一种基于语音转换的情感疏导系统,包括语音模块、互动交流模块和用户账户管理模块,语音模块包括语音分享模块和音乐推荐模块,语音分享模块获取输入系统的语音信息、对语音信息进行韵律转换并对语音信息进行敏感词监测;音乐推荐模块根据输入系统的信息推荐音乐;互动交流模块包括心里话模块和房间模块,用户能够通过心里话模块上传信息,上传的信息为文字信息或者语音信息,用户能够通过房间模块创建或者加入房间,进行多人在线交流,在线交流过程中,语音信息能够实时进行韵律转换;用户账户管理模块包括账户名创建模块、头像设置模块、密码管理模块和好友管理模块,系统用户能够通过账户名创建模块建立账号;系统用户能够通过头像设置模块上传个性化图片作为头像;系统用户能够通过密码管理模块进行密码修改和密码找回;系统用户能够通过好友管理模块对好友进行管理。
语音分享模块中获取语音信息包括获取用户上传至系统中的语音信息和将用户输入的文字内容转换为语音信息,之后将获取的语音信息上传至系统服务器中,根据用户选择的目标语音进行韵律转换,目标语音包括方言及明星声音。
如图2所示,根据用户选择的目标语音进行韵律转换方法包括:
步骤S11,对原始语音重采样,采样率由16kHz转换为8kHz,进入步骤S12;
步骤S12,提取语音韵律特征,如基频、能量、共振峰、语速,进入步骤S13;
步骤S13,调整韵律特征,进入步骤S15;
步骤S14,提取谐波、噪声分量,进入步骤S15;
步骤S15,将步骤S13调整后的韵律特征与步骤S14提取的谐波、噪声合成,进入步骤S16;
步骤S16,通过公式进行韵律特性转换后得到目标语音,公式为
其中,sh(t)为浊音部分的合成语音,sn(t)为合成的非浊音部分语音和静音,L(t)表示谐波的个数,ω0(t)表示原始基频参数,Ak(t)为信号的幅度,α,β和γ是合成时对原始幅度Ak(t),对语速h(k,t)和共振峰f(k,t)的规整因子,δ和φ分别是对原始基频ω0(t)和改变后的基频p(t)的规整因子。
通过这种方式,可以不需要使用训练语料就快速合成出音色与原始语音非常不同的语音,即达到了把故事分享者的语音进行了音色、语速转换后的语音了,能较好的保护好用户的真实身份。
如图3所示,语音分享模块中敏感词监测方法包括:
步骤S21,获取待检语音文件s=(s1,s2,…,sn),其中n为语音句子的帧数,包括用户上传的分享语音源文件和其他用户上传的评论语音,获取语音文件的帧数,进入步骤S23;
步骤S22,选取库中预设的语音关键词,q=(q1,q2,…,qm),其中m为语音关键词的帧数获取语音关键词的帧数,进入步骤S23;
步骤S23,计算步骤S22中获取的语音关键词与步骤S21中获取的语音文件的帧数距离,获得距离矩阵dist,dist(i,j)代表关键词的第i帧与句子的第j帧之间的距离,1≤i≤m,1≤j≤n,对于MFCC和SBN(stacked bottle-neck)特征,使用余弦距离:
对于后验特征,使用内积距离:
dist(i,j)=-ln(qiTsj)
进入步骤24;
步骤S24,对步骤S23获得的距离矩阵归一化处理使距离取值在0到1之间,
进入步骤S25;
步骤S25,找到一条使平均累积距离cost(i,j)=a(i,j)/l(i,j),其中a(i,j)代表从某个起点(1,e)到达(i,j)所经历的累计距离,而l(i,j)表示从某个起点(1,e)开始到达(i,j)所经历的路径长度,规划最小的匹配路径,采用动态规划方法:
步骤S251,初始化参数a和l,
,进入步骤S252;
步骤S252,迭代计算,对于i>0且j>0的部分从{(i-1,j),(i,j-1),(i-1,j-1)}中选取一个点(u,v),使最小,则:
进入步骤S253;
步骤S253,找到关键词对文件的匹配分数分数越低匹配度越高,进入步骤S254;
步骤S254,关键词匹配后,即识别出语音信息中的敏感词后,通知用户该信息为敏感信息无法上传,并将该信息删除,进入步骤S26;
步骤S26,判断库中预设的语音关键词是否匹配完毕,是,则进入步骤S27,否,则进入步骤S22;
步骤S27,在检测完毕的语音文件设置敏感词检测标记,系统后续再次获取的带有标记语音文件时,不对此文件进行重复检测。
敏感词监测方法还包括人工审核,系统收集用户对于语音信息的反馈,如用户举报信息包括敏感词,则进行人工审核,并对上传敏感信息的用户发送警告信息,情感疏导系统记录用户违规次数,在用户违规并接到警告信息后,如再次上传含有敏感内容,将此用户列入重点监控名单,对重点监控名单中的用户同时进行自动监测和人工审核,如再次检测到敏感内容,则禁用该账户。
音乐推荐模块根据用户输入语音分享模块的内容识别用户情绪,根据用户情绪以及用户分享或常听的音乐类型推荐适合音乐。
心里话模块中包括发布模块和反馈模块,发布模块包括心情如何、文字信息上传、图像信息上传和定位,反馈模块包括正向反馈按钮和评论功能;用户在使用发布模块时,心情如何为必选项,文字信息上传、图像信息和定位为可选项;用户在使用反馈模块时,能够通过点击正向反馈按钮向用户传递支持,每次点击计数一次,可设置单用户点击正向反馈最大次数,超过该次数后不再增加正向反馈按钮计数,评论功能区包括预设内容和自定义内容,用户可选择通过预设内容向用户提供正向鼓励或自定义评论内容。
在用户通过发布模块发布信息后,系统在一定时间内,自动触发用户正向反馈按钮并计入计数,在触发正向反馈按钮的同时,系统根据用户选择的心情触发正向鼓励评论,让用户感受到关注和鼓励。
系统对评论功能区中的自定义评论内容进行过滤,对于负面评论进行过滤,仅显示对用户进行正向鼓励的内容。
在情感疏导系统中,用户能够在用户账户管理模块中选择使用游客模式直接登录,游客模式下随机生成账号名称,游客模式用于系统体验。
实施例1:
一种基于语音转换的情感疏导系统,包括语音模块、互动交流模块和用户账户管理模块。
用户进入该基于语音转换的情感疏导系统,通过用户账户管理模块建立账号,建立账号时可选择随机生成昵称或者自定义昵称,自定义框中设置有提示内容“为更好的保护您的隐私,建议不要使用真实姓名”。用户通过头像设置模块上传了一张真人照片,系统检测到头像为真实照片后,在用户确认上传为头像前,系统弹出提示信息:“为更好的保护您的隐私,建议您选择与本人关联度较弱的图片作为头像”,用户重新上传了一张卡通动物图片作为头像,无提示信息产生,用户确认上传头像。用户通过密码管理模块进行密码修改。用户通过好友管理模块添加了系统推荐的好友并将不想再联系的好友删除。
语音分享模块中,用户用手机用户端录制一段60秒的语音并上传到语音分享模块中,系统将获取的语音信息上传至系统服务器中;用户选择明星A的声音作为转换目标声音,用户确认目标声音后,语音分享模块开始对语音进行韵律转换,并对该用户的情绪状态进行识别,系统经过分析后发现该用户语音中的情绪为“伤心”。
语音分享模块在进行韵律转换的同时对上传的语音信息进行敏感词监测,识别出语音信息中的敏感词后通知用户该信息为敏感信息无法上传,并将该信息删除。
语音分享模块的敏感词监测方法还包括人工审核,系统收集用户对于语音信息的反馈,如用户举报信息包括敏感词,则进行人工审核,并对上传敏感信息的用户发送警告信息,情感疏导系统记录用户违规次数,在用户违规并接到警告信息后,如再次上传含有敏感内容,将此用户列入重点监控名单,对重点监控名单中的用户同时进行自动监测和人工审核,如再次检测到敏感内容,则禁用该账户。
音乐推荐模块根据用户输入语音分享模块的内容识别得到的用户情绪“伤心”以及用户录入语音前在该系统中听的音乐推荐适合音乐,如贝多芬的《小夜曲》,让用户从伤心的情绪中尽快走出来。
用户通过互动交流模块包括心里话模块和房间模块,用户通过心里话模块的发布模块发表心情,其中,心情如何为必选项,用户选择了“伤心”,输入文字“陪伴我多年的柚子去世了,愿你在天堂一切安好”,并上传了一张橘猫的照片。其他用户通过点击反馈模块的正向反馈按钮“加油,一切都会好起来的”对该用户进行支持,某用户为表对该用户的鼓励,点击正向反馈按钮10次后系统弹出提示“已经到达最大支持次数,请您继续支持其他的心情”;某用户通过在评论功能区通过选择系统预设内容“好好照顾自己”对该用户进行鼓励;某用户通过输入自定义内容分享自己的经历送出鼓励。在用户通过发布模块发布信息后,系统在10分钟内,自动触发用户正向反馈按钮1次,在触发正向反馈按钮的同时,系统根据用户选择的心情触发正向鼓励评论,让用户感受到关注和鼓励。
系统对评论功能区中的自定义评论内容进行过滤,对于负面评论进行过滤,仅显示对用户进行正向鼓励的内容。
用户在房间模块中可以创建房间,邀请在线用户加入一起进行语音或文字聊天,其他用户可以在房间模块中加入已经创建的房间,用户们进行语音聊天时,语音信息能够实时进行韵律转换。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (10)
1.一种基于语音转换的情感疏导系统,其特征在于,包括语音模块和互动交流模块,所述语音模块包括语音分享模块和音乐推荐模块,所述语音分享模块获取输入系统的语音信息、对语音信息进行韵律转换并对语音信息进行敏感词监测;所述音乐推荐模块根据输入系统的信息推荐音乐;互动交流模块包括心里话模块和房间模块,用户能够通过所述心里话模块上传信息,上传的信息为文字信息或者语音信息,用户能够通过所述房间模块创建或者加入房间,进行多人在线交流,在线交流过程中,语音信息能够实时进行韵律转换。
2.如权利要求1所述的基于语音转换的情感疏导系统,其特征在于,所述语音分享模块中获取语音信息包括获取用户上传至系统中的语音信息和将用户输入的文字内容转换为语音信息,之后将获取的语音信息上传至系统服务器中,根据用户选择的目标语音进行韵律转换,所述目标语音包括方言及明星声音。
3.如权利要求2所述的基于语音转换的情感疏导系统,其特征在于,根据用户选择的目标语音进行韵律转换方法包括:
步骤S11,对原始语音重采样,进入步骤S12;
步骤S12,提取语音韵律特征,进入步骤S13;
步骤S13,调整韵律特征,进入步骤S15;
步骤S14,提取谐波、噪声分量,进入步骤S15;
步骤S15,将步骤S13调整后的韵律特征与步骤S14提取的谐波、噪声合成,进入步骤S16;
步骤S16,进行韵律特性转换后得到目标语音。
4.如权利要求1所述的基于语音转换的情感疏导系统,其特征在于,所述语音分享模块中敏感词监测方法包括:
步骤S21,获取待检语音文件,获取语音文件的帧数,进入步骤S23;
步骤S22,选取库中预设的语音关键词,获取语音关键词的帧数,进入步骤S23;
步骤S23,计算步骤S22中获取的语音关键词与步骤S21中获取的语音文件的帧数距离,获得距离矩阵,进入步骤24;
步骤S24,对步骤S23获得的距离矩阵归一化处理,进入步骤S25;
步骤S25,规划最小的匹配路径,采用动态规划方法:
步骤S251,初始化参数,进入步骤S252;
步骤S252,迭代计算,进入步骤S253;
步骤S253,找到关键词对文件的匹配分数,分数越低匹配度越高,进入步骤S254;
步骤S254,关键词匹配后,即识别出语音信息中的敏感词后,通知用户该信息为敏感信息无法上传,并将该信息删除,进入步骤S26;
步骤S26,判断库中预设的语音关键词是否匹配完毕,是,则进入步骤S27,否,则进入步骤S22;
步骤S27,在检测完毕的语音文件设置敏感词检测标记,系统后续再次获取的带有标记语音文件时,不对此文件进行重复检测。
5.如权利要求4所述的基于语音转换的情感疏导系统,其特征在于,所述敏感词监测方法还包括人工审核,系统收集用户对于语音信息的反馈,如用户举报信息包括敏感词,则进行人工审核,并对上传敏感信息的用户发送警告信息。
6.如权利要求4或5所述的基于语音转换的情感疏导系统,其特征在于,所述情感疏导系统记录用户违规次数,在用户违规并接到警告信息后,如再次上传含有敏感内容,将此用户列入重点监控名单,对重点监控名单中的用户同时进行自动监测和人工审核,如再次检测到敏感内容,则禁用该账户。
7.如权利要求1所述的基于语音转换的情感疏导系统,其特征在于,所述音乐推荐模块根据用户输入语音分享模块的内容识别用户情绪,根据用户情绪以及用户分享或常听的音乐类型推荐适合音乐。
8.如权利要求1所述的基于语音转换的情感疏导系统,其特征在于,所述心里话模块中包括发布模块和反馈模块,所述发布模块包括心情如何、文字信息上传、图像信息上传和定位,所述反馈模块包括正向反馈按钮和评论功能;用户在使用所述发布模块时,心情如何为必选项,文字信息上传、图像信息和定位为可选项;用户在使用反馈模块时,能够通过点击正向反馈按钮向用户传递支持,每次点击计数一次,可设置单用户点击正向反馈最大次数,超过该次数后不再增加正向反馈按钮计数,评论功能区包括预设内容和自定义内容,用户可选择通过预设内容向用户提供正向鼓励或自定义评论内容。
9.如权利要求8所述的基于语音转换的情感疏导系统,其特征在于,在用户通过所述发布模块发布信息后,系统在一定时间内,自动触发用户正向反馈按钮并计入计数,在触发正向反馈按钮的同时,系统根据用户选择的心情触发正向鼓励评论,让用户感受到关注和鼓励。
10.如权利要求8所述的基于语音转换的情感疏导系统,其特征在于,系统对所述评论功能区中的自定义评论内容进行过滤,对于负面评论进行过滤,仅显示对用户进行正向鼓励的内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810374212.4A CN108682413B (zh) | 2018-04-24 | 2018-04-24 | 一种基于语音转换的情感疏导系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810374212.4A CN108682413B (zh) | 2018-04-24 | 2018-04-24 | 一种基于语音转换的情感疏导系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108682413A true CN108682413A (zh) | 2018-10-19 |
CN108682413B CN108682413B (zh) | 2020-09-29 |
Family
ID=63802415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810374212.4A Active CN108682413B (zh) | 2018-04-24 | 2018-04-24 | 一种基于语音转换的情感疏导系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108682413B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109616131A (zh) * | 2018-11-12 | 2019-04-12 | 南京南大电子智慧型服务机器人研究院有限公司 | 一种数字实时语音变音方法 |
CN109671422A (zh) * | 2019-01-09 | 2019-04-23 | 浙江工业大学 | 一种获取纯净语音的录音方法 |
CN109857852A (zh) * | 2019-01-24 | 2019-06-07 | 安徽商贸职业技术学院 | 一种电商在线评论训练集特征的筛选判断方法及系统 |
CN112651013A (zh) * | 2020-12-29 | 2021-04-13 | 五八有限公司 | 用户账户处理方法、装置、电子设备和计算机可读介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1274222A2 (en) * | 2001-07-02 | 2003-01-08 | Nortel Networks Limited | Instant messaging using a wireless interface |
CN1473325A (zh) * | 2001-08-31 | 2004-02-04 | ��ʽ���罨�� | 基音波形信号发生设备、基音波形信号发生方法及程序 |
US20040193426A1 (en) * | 2002-10-31 | 2004-09-30 | Maddux Scott Lynn | Speech controlled access to content on a presentation medium |
CN1567428A (zh) * | 2003-06-19 | 2005-01-19 | 北京中科信利技术有限公司 | 一种基于数字信号处理的语音变声方法 |
CN1719514A (zh) * | 2004-07-06 | 2006-01-11 | 中国科学院自动化研究所 | 基于语音分析与合成的高品质实时变声方法 |
CN101471072A (zh) * | 2007-12-27 | 2009-07-01 | 华为技术有限公司 | 高频重建方法、编码模块和解码模块 |
CN101622659A (zh) * | 2007-06-06 | 2010-01-06 | 松下电器产业株式会社 | 音质编辑装置及音质编辑方法 |
CN102682761A (zh) * | 2011-03-12 | 2012-09-19 | 谢津 | 个性化的声音处理系统和设备 |
CN103632672A (zh) * | 2012-08-28 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 一种变声系统、方法及人机交互系统及方法 |
CN104038410A (zh) * | 2014-06-12 | 2014-09-10 | 上海高派信息科技有限公司 | 一种群组成员身份信息保护方法及系统 |
CN104038788A (zh) * | 2014-06-19 | 2014-09-10 | 中山大学深圳研究院 | 一种小区社交网络系统及内容推荐方法 |
CN105006230A (zh) * | 2015-06-10 | 2015-10-28 | 合肥工业大学 | 一种面向非特定人的语音敏感信息检测和过滤方法 |
CN106730234A (zh) * | 2017-01-11 | 2017-05-31 | 上海北辰软件股份有限公司 | 一种智能情绪疏导系统 |
CN106847310A (zh) * | 2017-02-17 | 2017-06-13 | 安徽金猫数字科技有限公司 | 一种基于语音识别的情感分析系统 |
CN107562850A (zh) * | 2017-08-28 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 音乐推荐方法、装置、设备及存储介质 |
-
2018
- 2018-04-24 CN CN201810374212.4A patent/CN108682413B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1274222A2 (en) * | 2001-07-02 | 2003-01-08 | Nortel Networks Limited | Instant messaging using a wireless interface |
CN1473325A (zh) * | 2001-08-31 | 2004-02-04 | ��ʽ���罨�� | 基音波形信号发生设备、基音波形信号发生方法及程序 |
US20040193426A1 (en) * | 2002-10-31 | 2004-09-30 | Maddux Scott Lynn | Speech controlled access to content on a presentation medium |
CN1567428A (zh) * | 2003-06-19 | 2005-01-19 | 北京中科信利技术有限公司 | 一种基于数字信号处理的语音变声方法 |
CN1719514A (zh) * | 2004-07-06 | 2006-01-11 | 中国科学院自动化研究所 | 基于语音分析与合成的高品质实时变声方法 |
CN101622659A (zh) * | 2007-06-06 | 2010-01-06 | 松下电器产业株式会社 | 音质编辑装置及音质编辑方法 |
CN101471072A (zh) * | 2007-12-27 | 2009-07-01 | 华为技术有限公司 | 高频重建方法、编码模块和解码模块 |
CN102682761A (zh) * | 2011-03-12 | 2012-09-19 | 谢津 | 个性化的声音处理系统和设备 |
CN103632672A (zh) * | 2012-08-28 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 一种变声系统、方法及人机交互系统及方法 |
CN104038410A (zh) * | 2014-06-12 | 2014-09-10 | 上海高派信息科技有限公司 | 一种群组成员身份信息保护方法及系统 |
CN104038788A (zh) * | 2014-06-19 | 2014-09-10 | 中山大学深圳研究院 | 一种小区社交网络系统及内容推荐方法 |
CN105006230A (zh) * | 2015-06-10 | 2015-10-28 | 合肥工业大学 | 一种面向非特定人的语音敏感信息检测和过滤方法 |
CN106730234A (zh) * | 2017-01-11 | 2017-05-31 | 上海北辰软件股份有限公司 | 一种智能情绪疏导系统 |
CN106847310A (zh) * | 2017-02-17 | 2017-06-13 | 安徽金猫数字科技有限公司 | 一种基于语音识别的情感分析系统 |
CN107562850A (zh) * | 2017-08-28 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 音乐推荐方法、装置、设备及存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109616131A (zh) * | 2018-11-12 | 2019-04-12 | 南京南大电子智慧型服务机器人研究院有限公司 | 一种数字实时语音变音方法 |
CN109616131B (zh) * | 2018-11-12 | 2023-07-07 | 南京南大电子智慧型服务机器人研究院有限公司 | 一种数字实时语音变音方法 |
CN109671422A (zh) * | 2019-01-09 | 2019-04-23 | 浙江工业大学 | 一种获取纯净语音的录音方法 |
CN109857852A (zh) * | 2019-01-24 | 2019-06-07 | 安徽商贸职业技术学院 | 一种电商在线评论训练集特征的筛选判断方法及系统 |
CN109857852B (zh) * | 2019-01-24 | 2021-02-23 | 安徽商贸职业技术学院 | 一种电商在线评论训练集特征的筛选判断方法及系统 |
CN112651013A (zh) * | 2020-12-29 | 2021-04-13 | 五八有限公司 | 用户账户处理方法、装置、电子设备和计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108682413B (zh) | 2020-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pisanski et al. | Voice pitch modulation in human mate choice | |
Bryant et al. | The perception of spontaneous and volitional laughter across 21 societies | |
Bachorowski et al. | Vocal expression of emotion: Acoustic properties of speech are associated with emotional intensity and context | |
TW491991B (en) | System, method, and article of manufacture for a voice recognition system for navigating on the internet utilizing audible information | |
JP4644403B2 (ja) | 複数の音声信号パラメータの分析を通して音声信号の感情を検出する装置、方法、及び、製造物品 | |
Scherer | Vocal communication of emotion: A review of research paradigms | |
Tusing et al. | The sounds of dominance. Vocal precursors of perceived dominance during interpersonal influence | |
Scherer | On the symbolic functions of vocal affect expression | |
CN108682413A (zh) | 一种基于语音转换的情感疏导系统 | |
US8965770B2 (en) | Detecting emotion in voice signals in a call center | |
TW548631B (en) | System, method, and article of manufacture for a voice recognition system for identity authentication in order to gain access to data on the Internet | |
Scherer | How emotion is expressed in speech and singing | |
US20020002460A1 (en) | System method and article of manufacture for a voice messaging expert system that organizes voice messages based on detected emotions | |
WO2001016892A1 (en) | System, method, and article of manufacture for a border crossing system that allows selective passage based on voice analysis | |
Redford et al. | Lay listener classification and evaluation of typical and atypical children’s speech | |
Shafiro et al. | The influence of environmental sound training on the perception of spectrally degraded speech and environmental sounds | |
Agarwal et al. | Recognition of emotions of speech and mood of music: a review | |
Suttora et al. | Relationships between structural and acoustic properties of maternal talk and children’s early word recognition | |
Engelberg et al. | The credibility of acted screams: Implications for emotional communication research | |
Kirchhuebel | The acoustic and temporal characteristics of deceptive speech | |
Potapova et al. | On individual polyinformativity of speech and voice regarding speakers auditive attribution (forensic phonetic aspect) | |
Wiegersma et al. | Recognizing hotspots in Brief Eclectic Psychotherapy for PTSD by text and audio mining | |
He | Stress and emotion recognition in natural speech in the work and family environments | |
Lutfi et al. | The listener effect in multitalker speech segregation and talker identification | |
Watt et al. | Forensic phonetics and automatic speaker recognition: The complementarity of human-and machine-based forensic speaker comparison |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20181019 Assignee: YUNZHISHENG (SHANGHAI) INTELLIGENT TECHNOLOGY Co.,Ltd. Assignor: SHANGHAI NORMAL University Contract record no.: X2021310000035 Denomination of invention: An emotional counseling system based on speech conversion Granted publication date: 20200929 License type: Common License Record date: 20210929 |