CN108182946A - 一种基于声纹识别的声乐模式选择方法及装置 - Google Patents
一种基于声纹识别的声乐模式选择方法及装置 Download PDFInfo
- Publication number
- CN108182946A CN108182946A CN201711423534.5A CN201711423534A CN108182946A CN 108182946 A CN108182946 A CN 108182946A CN 201711423534 A CN201711423534 A CN 201711423534A CN 108182946 A CN108182946 A CN 108182946A
- Authority
- CN
- China
- Prior art keywords
- vocal music
- audio data
- detected
- music pattern
- acoustic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001755 vocal effect Effects 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 238000001228 spectrum Methods 0.000 claims description 7
- 238000013481 data capture Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000010187 selection method Methods 0.000 abstract description 7
- 238000013461 design Methods 0.000 abstract description 6
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000004218 nerve net Anatomy 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于声纹识别的声乐模式选择方法及装置,包括:S1:对待检测音频数据进行特征提取,获取待检测音频数据的声学特征;S2:将待检测音频数据的声学特征分别与声学数据库中各个声乐模式对应的预置声学模型进行特征匹配,获取待检测音频数据与各个声乐模式对应的匹配分数;S3:输出最高匹配分数对应的声乐模式。本发明中通过提取待检测音频数据中的声学特征,将待检测音频数据的声学特征与各个声乐模式对应的预置声学模型进行特征匹配,可以得到待检测音频数据与各个声乐模式的匹配分数,将最高匹配分数对应的声乐模式输出即可获取录音者适合的声乐模式,解决了设计一种能够自动辨别使用者适合的声乐模式的选择方法的技术问题。
Description
技术领域
本发明涉及声乐领域,尤其涉及一种基于声纹识别的声乐模式选择方法及装置。
背景技术
当前的声乐学习中,为了确定哪一个声学模式更加符合学习者的个人特点,需要通过专业的老师进行分辨。
如果业余练习者没有专业的老师进行指导则无法准确辨别适合自身声音特点的声乐模式,或者当老师同时带有多个学生时,一一进行辨认指导会对老师造成较大的工作负担。
因此,设计一种能够自动辨别使用者适合的声乐模式的选择方法成为了本领域技术人员亟需解决的技术问题。
发明内容
本发明提供了一种基于声纹识别的声乐模式选择方法及装置,解决了设计一种能够自动辨别使用者适合的声乐模式的选择方法的技术问题。
本发明提供了一种基于声纹识别的声乐模式选择方法,包括:
S1:对待检测音频数据进行特征提取,获取待检测音频数据的声学特征;
S2:将待检测音频数据的声学特征分别与声学数据库中各个声乐模式对应的预置声学模型进行特征匹配,获取待检测音频数据与各个声乐模式对应的匹配分数;
S3:输出最高匹配分数对应的声乐模式。
优选地,步骤S1之前还包括:步骤S01;
S01:获取预置数量的各种声乐模式的样本音频数据,分别对各个声乐模式对应的样本音频数据进行训练建模,获取各个声乐模式对应的预置声学模型并存入声学数据库中。
优选地,步骤S01之后,步骤S1之前还包括:步骤S02;
S02:获取待检测音频数据。
优选地,步骤S1具体包括:对待检测音频数据进行去噪处理,对去噪后的待检测音频数据进行特征提取,获取待检测音频数据的声学特征。
优选地,声学特征具体包括:声谱特征、韵律学特征和音质特征;
声乐模式具体包括:美声唱法、民族唱法和通俗唱法。
本发明提供了一种基于声纹识别的声乐模式选择装置,包括:
特征提取单元,用于对待检测音频数据进行特征提取,获取待检测音频数据的声学特征;
声乐匹配单元,用于将待检测音频数据的声学特征分别与声学数据库中各个声乐模式对应的预置声学模型进行特征匹配,获取待检测音频数据与各个声乐模式对应的匹配分数;
结果输出单元,用于输出最高匹配分数对应的声乐模式。
优选地,还包括:模型训练单元;
模型训练单元,用于获取预置数量的各种声乐模式的样本音频数据,分别对各个声乐模式对应的样本音频数据进行训练建模,获取各个声乐模式对应的预置声学模型并存入声学数据库中。
优选地,还包括:数据获取单元;
数据获取单元,用于获取待检测音频数据。
优选地,特征提取单元,具体用于对待检测音频数据进行去噪处理,对去噪后的待检测音频数据进行特征提取,获取待检测音频数据的声学特征。
优选地,声学特征具体包括:声谱特征、韵律学特征和音质特征;
声乐模式具体包括:美声唱法、民族唱法和通俗唱法。
从以上技术方案可以看出,本发明具有以下优点:
本发明提供了一种基于声纹识别的声乐模式选择方法,包括:S1:对待检测音频数据进行特征提取,获取待检测音频数据的声学特征;S2:将待检测音频数据的声学特征分别与声学数据库中各个声乐模式对应的预置声学模型进行特征匹配,获取待检测音频数据与各个声乐模式对应的匹配分数;S3:输出最高匹配分数对应的声乐模式。
本发明中通过提取待检测音频数据中的声学特征,将待检测音频数据的声学特征与各个声乐模式对应的预置声学模型进行特征匹配,可以得到待检测音频数据与各个声乐模式的匹配分数,通过匹配分数的高低可以得知待检测音频数据的录音者与各个声乐模式的匹配程度,将最高匹配分数对应的声乐模式输出即可获取录音者适合的声乐模式,解决了设计一种能够自动辨别使用者适合的声乐模式的选择方法的技术问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种基于声纹识别的声乐模式选择方法的一个实施例的流程示意图;
图2为本发明实施例提供的一种基于声纹识别的声乐模式选择方法的另一个实施例的流程示意图;
图3为本发明实施例提供的一种基于声纹识别的声乐模式选择装置的一个实施例的结构示意图。
具体实施方式
本发明实施例提供了一种基于声纹识别的声乐模式选择方法及装置,解决了设计一种能够自动辨别使用者适合的声乐模式的选择方法的技术问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例提供了一种基于声纹识别的声乐模式选择方法的一个实施例,包括:
步骤101:对待检测音频数据进行特征提取,获取待检测音频数据的声学特征;
需要说明的是,需要对用户适合的声乐模式进行辨识选择则需要对用户的待检测音频数据进行特征提取获取待检测音频数据的声学特征。
步骤102:将待检测音频数据的声学特征分别与声学数据库中各个声乐模式对应的预置声学模型进行特征匹配,获取待检测音频数据与各个声乐模式对应的匹配分数;
需要说明的是,将待检测音频数据的声学特征分别与声学数据库中各个声乐模式对应的预置声学模型进行特征匹配可以获取待检测音频数据与各个声乐模式对应的匹配分数,匹配分数表示待检测音频数据对应的用户与各个声乐模式的匹配程度。
步骤103:输出最高匹配分数对应的声乐模式。
需要说明的是,匹配分数最高表示待检测音频数据与对应的声乐模式的匹配程度最好,输出最高匹配分数对应的声乐模式即可获取最适合用户的声乐模式,为用户的声乐学习提供参考。
本实施例中通过提取待检测音频数据中的声学特征,将待检测音频数据的声学特征与各个声乐模式对应的预置声学模型进行特征匹配,可以得到待检测音频数据与各个声乐模式的匹配分数,通过匹配分数的高低可以得知待检测音频数据的录音者与各个声乐模式的匹配程度,将最高匹配分数对应的声乐模式输出即可获取录音者适合的声乐模式,解决了设计一种能够自动辨别使用者适合的声乐模式的选择方法的技术问题。
以上为本发明实施例提供的一种基于声纹识别的声乐模式选择方法的一个实施例,以下为本发明实施例提供的一种基于声纹识别的声乐模式选择方法的另一个实施例。
请参阅图2,本发明实施例提供了一种基于声纹识别的声乐模式选择方法的另一个实施例,包括:
步骤201:获取预置数量的各种声乐模式的样本音频数据,分别对各个声乐模式对应的样本音频数据进行训练建模,获取各个声乐模式对应的预置声学模型并存入声学数据库中;
需要说明的是,获取预置数量的各种声乐模式的样本音频数据,分别对各个声乐模式对应的样本音频数据进行训练建模,建模的过程可以根据需要通过聚类算法和神经网络算法等建模方法中的一种或者多种进行建模。
步骤202:获取待检测音频数据;
需要说明的是,当用户需要检测自己适合的声乐模式时,用户需要输入包含自身声音的歌曲、朗诵、说话或者其他音频数据作为待检测音频数据,其中为了提高检测的准确性,进一步为用户唱的歌曲的音频数据;
获取到的待检测音频数据的格式可以为PCM格式的数据。
步骤203:对待检测音频数据进行去噪处理,对去噪后的待检测音频数据进行特征提取,获取待检测音频数据的声学特征;
需要说明的是,对待检测音频数据进行去噪处理可以过滤背景噪音等噪声,提高声乐模式检测的准确性。
步骤204:将待检测音频数据的声学特征分别与声学数据库中各个声乐模式对应的预置声学模型进行特征匹配,获取待检测音频数据与各个声乐模式对应的匹配分数;
需要说明的是,将待检测音频数据的声学特征分别与声学数据库中各个声乐模式对应的预置声学模型进行特征匹配可以获取多个匹配分数,每个匹配分数分别代表待检测音频数据与对应的声乐模式的匹配程度。
步骤205:输出最高匹配分数对应的声乐模式。
需要说明的是,匹配分数最高说明待检测音频数据与该声乐模式的匹配程度最高,输出最高匹配分数对应的声乐模式即可得到与待检测音频数据对应的用户最适合的声乐模式;
输出的形式包括但不限于语音和文字的形式。
进一步地,声学特征具体包括:声谱特征、韵律学特征和音质特征;
声乐模式具体包括:美声唱法、民族唱法和通俗唱法。
需要说明的是,声谱特征具体包括:MFCC特征和GFCC特征;
韵律学特征具体包括:Pitch特征、Short Term Energy特征、ZCR特征和Speed特征;
音质特征具体包括:Formants特征;
实际应用过程中可以使用上述声学特征中的一种或者多种声学特征进行建模和匹配辨识,也可以替换成其他能代表说话人声音信息的声学特征;
声乐模式当前主要包括:美声唱法、民族唱法和通俗唱法。
本实施例中通过提取待检测音频数据中的声学特征,将待检测音频数据的声学特征与各个声乐模式对应的预置声学模型进行特征匹配,可以得到待检测音频数据与各个声乐模式的匹配分数,通过匹配分数的高低可以得知待检测音频数据的录音者与各个声乐模式的匹配程度,将最高匹配分数对应的声乐模式输出即可获取录音者适合的声乐模式,解决了设计一种能够自动辨别使用者适合的声乐模式的选择方法的技术问题。
以上为本发明实施例提供的一种基于声纹识别的声乐模式选择方法的另一个实施例,以下为本发明实施例提供的一种基于声纹识别的声乐模式选择装置的一个实施例。
请参阅图3,本发明实施例提供了一种基于声纹识别的声乐模式选择装置的一个实施例,包括:
特征提取单元303,用于对待检测音频数据进行特征提取,获取待检测音频数据的声学特征;
声乐匹配单元304,用于将待检测音频数据的声学特征分别与声学数据库中各个声乐模式对应的预置声学模型进行特征匹配,获取待检测音频数据与各个声乐模式对应的匹配分数;
结果输出单元305,用于输出最高匹配分数对应的声乐模式。
进一步地,还包括:模型训练单元301;
模型训练单元301,用于获取预置数量的各种声乐模式的样本音频数据,分别对各个声乐模式对应的样本音频数据进行训练建模,获取各个声乐模式对应的预置声学模型并存入声学数据库中。
进一步地,还包括:数据获取单元302;
数据获取单元302,用于获取待检测音频数据。
进一步地,特征提取单元303,具体用于对待检测音频数据进行去噪处理,对去噪后的待检测音频数据进行特征提取,获取待检测音频数据的声学特征。
进一步地,声学特征具体包括:声谱特征、韵律学特征和音质特征;
声乐模式具体包括:美声唱法、民族唱法和通俗唱法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于声纹识别的声乐模式选择方法,其特征在于,包括:
S1:对待检测音频数据进行特征提取,获取待检测音频数据的声学特征;
S2:将待检测音频数据的声学特征分别与声学数据库中各个声乐模式对应的预置声学模型进行特征匹配,获取待检测音频数据与各个声乐模式对应的匹配分数;
S3:输出最高匹配分数对应的声乐模式。
2.根据权利要求1所述的一种基于声纹识别的声乐模式选择方法,其特征在于,步骤S1之前还包括:步骤S01;
S01:获取预置数量的各种声乐模式的样本音频数据,分别对各个声乐模式对应的样本音频数据进行训练建模,获取各个声乐模式对应的预置声学模型并存入声学数据库中。
3.根据权利要求2所述的一种基于声纹识别的声乐模式选择方法,其特征在于,步骤S01之后,步骤S1之前还包括:步骤S02;
S02:获取待检测音频数据。
4.根据权利要求1所述的一种基于声纹识别的声乐模式选择方法,其特征在于,步骤S1具体包括:对待检测音频数据进行去噪处理,对去噪后的待检测音频数据进行特征提取,获取待检测音频数据的声学特征。
5.根据权利要求1所述的一种基于声纹识别的声乐模式选择方法,其特征在于,声学特征具体包括:声谱特征、韵律学特征和音质特征;
声乐模式具体包括:美声唱法、民族唱法和通俗唱法。
6.一种基于声纹识别的声乐模式选择装置,其特征在于,包括:
特征提取单元,用于对待检测音频数据进行特征提取,获取待检测音频数据的声学特征;
声乐匹配单元,用于将待检测音频数据的声学特征分别与声学数据库中各个声乐模式对应的预置声学模型进行特征匹配,获取待检测音频数据与各个声乐模式对应的匹配分数;
结果输出单元,用于输出最高匹配分数对应的声乐模式。
7.根据权利要求6所述的一种基于声纹识别的声乐模式选择装置,其特征在于,还包括:模型训练单元;
模型训练单元,用于获取预置数量的各种声乐模式的样本音频数据,分别对各个声乐模式对应的样本音频数据进行训练建模,获取各个声乐模式对应的预置声学模型并存入声学数据库中。
8.根据权利要求7所述的一种基于声纹识别的声乐模式选择装置,其特征在于,还包括:数据获取单元;
数据获取单元,用于获取待检测音频数据。
9.根据权利要求6所述的一种基于声纹识别的声乐模式选择装置,其特征在于,特征提取单元,具体用于对待检测音频数据进行去噪处理,对去噪后的待检测音频数据进行特征提取,获取待检测音频数据的声学特征。
10.根据权利要求6所述的一种基于声纹识别的声乐模式选择装置,其特征在于,声学特征具体包括:声谱特征、韵律学特征和音质特征;
声乐模式具体包括:美声唱法、民族唱法和通俗唱法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711423534.5A CN108182946B (zh) | 2017-12-25 | 2017-12-25 | 一种基于声纹识别的声乐模式选择方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711423534.5A CN108182946B (zh) | 2017-12-25 | 2017-12-25 | 一种基于声纹识别的声乐模式选择方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108182946A true CN108182946A (zh) | 2018-06-19 |
CN108182946B CN108182946B (zh) | 2021-04-13 |
Family
ID=62547440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711423534.5A Active CN108182946B (zh) | 2017-12-25 | 2017-12-25 | 一种基于声纹识别的声乐模式选择方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108182946B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112965968A (zh) * | 2021-03-04 | 2021-06-15 | 湖南大学 | 一种基于注意力机制的异构数据模式匹配方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005266198A (ja) * | 2004-03-18 | 2005-09-29 | Pioneer Electronic Corp | 音響情報再生装置および音楽データのキーワード作成方法 |
CN101339765A (zh) * | 2007-07-04 | 2009-01-07 | 黎自奋 | 一种可广泛应用的国语单音辨认系统 |
CN102404278A (zh) * | 2010-09-08 | 2012-04-04 | 盛乐信息技术(上海)有限公司 | 一种基于声纹识别的点歌系统及其应用方法 |
CN104766603A (zh) * | 2014-01-06 | 2015-07-08 | 安徽科大讯飞信息科技股份有限公司 | 构建个性化歌唱风格频谱合成模型的方法及装置 |
CN104882147A (zh) * | 2015-06-05 | 2015-09-02 | 福建星网视易信息系统有限公司 | 一种演唱评分显示方法、装置及系统 |
CN105245956A (zh) * | 2015-09-30 | 2016-01-13 | 上海车音网络科技有限公司 | 一种音视频数据推荐方法、装置及系统 |
CN105575393A (zh) * | 2015-12-02 | 2016-05-11 | 中国传媒大学 | 一种基于人声音色的个性化点唱歌曲推荐方法 |
CN105989842A (zh) * | 2015-01-30 | 2016-10-05 | 福建星网视易信息系统有限公司 | 对比声纹相似度的方法、装置及其在数字娱乐点播系统中的应用 |
CN106128467A (zh) * | 2016-06-06 | 2016-11-16 | 北京云知声信息技术有限公司 | 语音处理方法及装置 |
-
2017
- 2017-12-25 CN CN201711423534.5A patent/CN108182946B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005266198A (ja) * | 2004-03-18 | 2005-09-29 | Pioneer Electronic Corp | 音響情報再生装置および音楽データのキーワード作成方法 |
CN101339765A (zh) * | 2007-07-04 | 2009-01-07 | 黎自奋 | 一种可广泛应用的国语单音辨认系统 |
CN102404278A (zh) * | 2010-09-08 | 2012-04-04 | 盛乐信息技术(上海)有限公司 | 一种基于声纹识别的点歌系统及其应用方法 |
CN104766603A (zh) * | 2014-01-06 | 2015-07-08 | 安徽科大讯飞信息科技股份有限公司 | 构建个性化歌唱风格频谱合成模型的方法及装置 |
CN105989842A (zh) * | 2015-01-30 | 2016-10-05 | 福建星网视易信息系统有限公司 | 对比声纹相似度的方法、装置及其在数字娱乐点播系统中的应用 |
CN104882147A (zh) * | 2015-06-05 | 2015-09-02 | 福建星网视易信息系统有限公司 | 一种演唱评分显示方法、装置及系统 |
CN105245956A (zh) * | 2015-09-30 | 2016-01-13 | 上海车音网络科技有限公司 | 一种音视频数据推荐方法、装置及系统 |
CN105575393A (zh) * | 2015-12-02 | 2016-05-11 | 中国传媒大学 | 一种基于人声音色的个性化点唱歌曲推荐方法 |
CN106128467A (zh) * | 2016-06-06 | 2016-11-16 | 北京云知声信息技术有限公司 | 语音处理方法及装置 |
Non-Patent Citations (8)
Title |
---|
AIKAWA 等: ""Acoustic correlates of voice quality improvement by voice training"", 《INTERSPEECH-2010》 * |
LARTILLOT 等: ""Automatic Modeling of Musical Style"", 《PROCEEDINGS OF THE 2001 INTERNATIONAL COMPUTER MUSIC CONFERENCE》 * |
R.DANNENBERG 等: ""Pattern discovery techniques for music audio"", 《PROC.3RD INT.CONF.MUSIC INFORMATION RETRIEVAL》 * |
于善英: ""美声与民族唱法歌手共振峰特征研究"", 《西安音乐学院学报》 * |
吴海霞 等: ""基于内容和旋律的音频片段识别与检索"", 《太原师范学院学报(自然科学版)》 * |
吴静: ""中国民族唱法音色的声学阐释"", 《中国音乐学》 * |
唐杰: ""基于内容的音频检索技术研究"", 《HTTP://D.WANFANGDATA.COM.CN/THESIS/Y1758529》 * |
王建群 等: ""歌唱艺术嗓音声学参数分析"", 《听力学及言语疾病杂志》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112965968A (zh) * | 2021-03-04 | 2021-06-15 | 湖南大学 | 一种基于注意力机制的异构数据模式匹配方法 |
CN112965968B (zh) * | 2021-03-04 | 2023-10-24 | 湖南大学 | 一种基于注意力机制的异构数据模式匹配方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108182946B (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Reimao et al. | For: A dataset for synthetic speech detection | |
CN107274916B (zh) | 基于声纹信息对音频/视频文件进行操作的方法及装置 | |
Gow Jr | Does English coronal place assimilation create lexical ambiguity? | |
Koolagudi et al. | IITKGP-SESC: speech database for emotion analysis | |
CN101751919B (zh) | 一种汉语口语重音自动检测方法 | |
CN103824565B (zh) | 一种基于音符和时值建模的哼唱识谱方法及系统 | |
CN108922541B (zh) | 基于dtw和gmm模型的多维特征参数声纹识别方法 | |
CN102376182B (zh) | 语言学习系统、语言学习方法及其程序产品 | |
CN108039176A (zh) | 一种防录音攻击的声纹认证方法、装置及门禁系统 | |
Székely et al. | Clustering Expressive Speech Styles in Audiobooks Using Glottal Source Parameters. | |
CN101261832A (zh) | 汉语语音情感信息的提取及建模方法 | |
CN108305643A (zh) | 情感信息的确定方法和装置 | |
CN106531185A (zh) | 基于语音相似度的语音评测方法及系统 | |
CN104252872B (zh) | 歌词生成方法和智能终端 | |
CN108010516A (zh) | 一种语义独立的语音情绪特征识别方法及装置 | |
CN109669661A (zh) | 一种听写进度的控制方法及电子设备 | |
CN109791616A (zh) | 自动语音识别 | |
CN108877769B (zh) | 识别方言种类的方法和装置 | |
CN106302987A (zh) | 一种音频推荐方法及设备 | |
Hasrul et al. | Human affective (emotion) behaviour analysis using speech signals: a review | |
CN108986841A (zh) | 音频信息处理方法、装置及存储介质 | |
CN109002529A (zh) | 音频检索方法及装置 | |
CN105895079A (zh) | 语音数据的处理方法和装置 | |
CN108182946A (zh) | 一种基于声纹识别的声乐模式选择方法及装置 | |
KR102113879B1 (ko) | 참조 데이터베이스를 활용한 화자 음성 인식 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 510700 room a401-1, zone a, Guangzhou International Business Incubator, No. 3, Juquan Road, Science City, Huangpu District, Guangzhou, Guangdong Province (office only) Patentee after: GUANGZHOU SPEAKIN INTELLIGENT TECHNOLOGY Co.,Ltd. Address before: 510000 Building 1, No.12 Keyun Road, Tianhe District, Guangzhou City, Guangdong Province (Location: 705) Patentee before: SPEAKIN TECHNOLOGIES Co.,Ltd. |