CN102682766A

CN102682766A - 可自学习的情侣声音对换机

Info

Publication number: CN102682766A
Application number: CN2012101458272A
Authority: CN
Inventors: 黄莹; 陈恩策; 赵伟; 叶子晟; 唐厚君
Original assignee: 黄莹
Priority date: 2012-05-12
Filing date: 2012-05-12
Publication date: 2012-09-19

Abstract

本发明是一种可自学习的情侣声音对换机，属于声音信号处理领域，提出了一种声音转换的新方法。本发明分为四大模块：声音输入及分析模块、声音转换及输出模块、DSP控制中心、按键操作模块，实现了对两人声音的对换。应用神经网络自学习技术，分析原始声音基频和共振峰频率的关系，得到转换目标函数；再经过频谱分析仪对比两声音基频差，修正目标函数，即可得到转换函数。分别将原始声音I，II和目标声音I，II存储在存储器的四个分区中，由DSP指针指示。对换声音时，只需将原始声音区对换，及将指针指向对方地址即可。本发明将情侣两人身份对换后重现对话场景，可以解决沟通不当引起的争端。

Description

可自学习的情侣声音对换机

技术领域

本发明专利属于声音信号处理技术领域，特别是变声技术领域。

背景技术

情侣声音对换机的关键技术是对原声音的音频进行识别、分析、处理、转换、存储及输出。

一个人的声音特征主要由音调和音色决定。人类语音可分为有声语音和无声语音，前者是由声带振动激励的脉冲信号经过腔调制变成不同的音，它是人类语言中元音的基础，声带振动的频率称为基频。无声语音则是声带保持开启状态，禁止振动引发的。

人的性别和年龄是决定音色的两个条件，对应的两个声学参数是声门振动的基频和共振峰频率。一般女声的基频和共振峰频率高于男声，而随着年龄的增长，声道增长，基频和共振峰频率会降低。具体参数如表1所示：

表1 不同人群声音的基频和共振峰频率关系表

人群	基频分布Hz	共振峰频率分布Hz
			男声	[50,180]	偏低
女声	[160,380]	中
			童声	[400,1000]	偏高

由上可知，在进行性别变声时，主要考虑基频和共振峰频率的变化。为了获得自然度、真实感较好的变声效果，基频和共振峰频率通常必须各自独立地伸缩变化。根据重采样定理知道，只要基频检测足够精确，就可以保证两者的改变不相关。

发明内容

目前，很多硬件变声器都只可以选择固定几种声音（一般为7种），且声音失真度较大。除此以外，不同人发出的声音变换的目标声音相同，无法做区分。

为了克服以上困难，本发明提出了一种新的方法。基于神经网络自学习系统，采用频谱分析仪对原声进行采样分析，得到其基频和共振峰频率的对应关系和范围，学习结束后的两个系统对换目标函数，即可实现情侣声音的对换。

本发明的技术方案如下：

采用DSP作为控制芯片，其有两个功能，一是进行定时和逻辑控制；二是由写入的神经网络程序及频谱分析仪的输出，进行语音识别自学习。

声音经过运放和模/数转换后，分别输入频谱分析仪和DSP，DSP中预存神经网络自学习处理程序，经过一段时间的学习，可以得出基频与共振峰频率的对应关系，并将关系输送至声音转换IC。存储器分为四个区：原始声音I区、目标声音I区、原始声音II区和目标声音II区，分别由不同的起始地址指示。播放时，可以选择原声播放，也可以选择男女声音转换后播放。

男女声对换原理如下：经过一段时间的学习，对换机可以识别两者的原始声音，分别存储到存储区对应区域，并可以得到根据基频给出对应的共振峰频率，,称目标函数，对应神经网络算法，表现在权值的确定上。对换时，首先由情侣双方阅读一段相同的话，记录两者的频率差，由此修改目标函数。然后，仅需对换原始声I区和II区的数据，便可实现声音的对换。

本发明的有益效果是：应用神经网络自学习技术，提出了一种新型的变换声音的方法，最大限度不失真地实现了情侣双方声音的对换。

附图说明

图1是基频和共振峰频率分布的变化图。

图2是可自学习情侣声音对换机的结构图，分为四大模块：声音输入及分析模块；声音转换及输出模块；DSP控制中心；以及按键操作模块。

图3是可自学习情侣声音对换机流程图。主要分为步：1.自学习得到目标函数；2.输入两声音，计算频率差；3.调整目标函数；4.对换原始声音存储I区和II区数据；5.转换，播放。

具体实施方式

对照附图2进行说明：

首先，开启“学习”功能，获得目标函数，学习结束后，指示灯提示；

第二，用数据线连接两机，启动“对换”按钮，拷贝学习目标函数到对方对换机上；

第三，启动“对比”功能，由双方各朗读一段相同的句子，经频谱分析仪分析，得出两人的基频差，并调整目标函数，存入声音转换IC；

第四，启动“录制”按钮，录制对话声音；

第五，启动“播放”按钮，播放两人声音；按下“对换”按钮，对换男女声音。

Claims

1.一种可自学习的情侣声音对换机，分为四大模块：声音输入及分析模块、声音转换及输出模块、DSP控制中心、按键操作模块，其特征是：可以高保真地对情侣声音进行对换，保证原声音的音色和音调。

2.根据权利要求1所述的所述的可自学习情侣声音对换机，其特征是：采用DSP作为主控芯片，基于神经网络B-P模型，实现对原声基频和共振峰频率的学习和分析，以得出目标函数，对应神经网络即为权值。

3.根据权利要求1所述的所述的可自学习情侣声音对换机，其特征是：可以经频谱分析仪对原始声音I和II进行对比，得出两声音的基频差，并调整目标函数至。

4.根据权利要求1所述的所述的可自学习情侣声音对换机，其特征是：将存储器分为四个区：原始声音I区、目标声音I区、原始声音II区和目标声音II区，分别由不同的起始地址指示，播放时，可以选择原声播放，也可以选择将男女声音对换后播放。

5.根据权利要求1所述的所述的可自学习情侣声音对换机，其特征是：在对换两人声音时，只需将原始声音I区和II区的声音对换即可，对DSP而言，只需将指针指向对方地址即可，方便软件和硬件实现。