CN109979488A - 基于重音分析的人声转乐谱系统 - Google Patents

基于重音分析的人声转乐谱系统 Download PDF

Info

Publication number
CN109979488A
CN109979488A CN201910192278.6A CN201910192278A CN109979488A CN 109979488 A CN109979488 A CN 109979488A CN 201910192278 A CN201910192278 A CN 201910192278A CN 109979488 A CN109979488 A CN 109979488A
Authority
CN
China
Prior art keywords
note
pitch
voice
frequency
music
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910192278.6A
Other languages
English (en)
Other versions
CN109979488B (zh
Inventor
邱兆林
黄怡璠
刘洪甫
李灿晨
季俊涛
任宇凡
张克俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910192278.6A priority Critical patent/CN109979488B/zh
Publication of CN109979488A publication Critical patent/CN109979488A/zh
Application granted granted Critical
Publication of CN109979488B publication Critical patent/CN109979488B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H7/00Instruments in which the tones are synthesised from a data store, e.g. computer organs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/081Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for automatic key or tonality recognition, e.g. using musical rules or a knowledge base
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/101Music Composition or musical creation; Tools or processes therefor
    • G10H2210/111Automatic composing, i.e. using predefined musical rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • G10L2025/906Pitch tracking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

本发明公开了一种基于重音分析的人声转乐谱系统,该人声转乐谱系统应用时,实现以下步骤:(1)对人声音频进行采样,获得多个样本片段,然后对每个样本片段进行频率分析;(2)对每个样本片段进行重音分析;(3)根据重音分析结果和频率分析结果,对人声音频进行音符分割;(4)获得每个音符后,根据频率变化,测定每个音符的音高;(5)在获得每个音符的音高后,基于绝对音高对乐谱进行调性分析和调整,以获得最终的乐谱。该人声转乐谱系统能够时间将输入人声信号转化为乐谱。

Description

基于重音分析的人声转乐谱系统
技术领域
本发明涉及数字音频信号处理领域,具体涉及一种基于重音分析的人声转乐谱系统。
背景技术
如今,使用计算机软件来进行作曲已经相当成熟,通过一些简单而且强大的作曲软件可以让即使没有进行过音乐知识培训的人也能够轻松制作出音乐。然而对于没有音乐理论基础的人来说,学习使用作曲软件通常会比较困难,制作音乐的门槛依然比较高。
另一方面,基于深度学习的自动作曲技术正在飞速发展,通过一个模型就可以实现简单的作曲。这种技术大大降低了作曲的成本,并且可以在短时间内大量作曲。一些类型的自动作曲模型还支持给主旋律进行配乐。这种模型的输入为一段主旋律的乐谱,输出为一个完整的多音轨乐谱。这种模型更加方便了特定类型音乐的创作。而若使得这种创作方式得到充分应用,需要一个快速创造乐谱的工具。
人声转乐谱系统使用人的歌声作为输入,通过提取其中的音高、时长、力度等声学特征,将其转换为乐谱作为输出。通过人声转乐谱系统,人们可以非常高效地输入和保存乐谱,而避免设计任何乐理或记谱知识。而配合自动作曲技术与自动配乐技术,人们就可以很快地创作出自己想要的音乐。
从上世纪七十年代到现在,人声转乐谱的相关技术一直有学者进行研究。目前虽然有一些人声转乐谱领域方面的研究,但是传统的人声转乐谱系统存在一些问题。音高判定的算法方面分为在时间维度上计算的时域法、在频率维度上计算的频域法、还有时频结合分析的方法。时域法通常有较高的复杂度,难以用于实时的转化的应用中,而频域法通常有较低的准确率。
许多人声转乐谱系统只进行音高分析,而对时间维度不进行任何处理。这样得到的是一个音高-时间的关系图。严格意义上来讲这种系统不能被称为人声转乐谱系统,因为一个完整的人声转乐谱系统的输出必须是乐谱。人声转乐谱系统需要对人声片段进行分析,计算出乐谱的进行速度,并且对每个音符划分时长。由于人的歌声不一定完全符合节奏,如何正确划分音符成了一个难点。
一些时候,一个完整的长音可能会被错误地分析为几个连续的短音符,而另一些时候,一些连续的短音又可能被分析为一个连续的长音符。此外,人声转乐谱系统比较容易受到人歌唱时的表现手法的影响。表现手法包括人的力度的变化,情感的波动、颤音、气流,甚至歌词的发音方式。这些影响通常会导致音高的识别错误。
发明内容
本发明的目的是提供一种基于重音分析的人声转乐谱系统。该人声转乐谱系统能够时间将输入人声信号转化为乐谱。
为实现上述发明目的,本发明提供以下技术方案:
一种基于重音分析的人声转乐谱系统,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,所述计算机处理器执行所述计算机程序时实现以下步骤:
(1)对人声音频进行采样,获得多个样本片段,然后对每个样本片段进行频率分析;
(2)对每个样本片段进行重音分析;
(3)根据重音分析结果和频率分析结果,对人声音频进行音符分割;
(4)获得每个音符后,根据频率变化,测定每个音符的音高;
(5)在获得每个音符的音高后,基于绝对音高对乐谱进行调性分析和调整,以获得最终的乐谱。
该人声转乐谱系统中,以人声音频作为输入,通过提取其中的音高、时长、力度等声学特征,将其转换为乐谱作为输出。通过人声转乐谱系统,人们可以非常高效地输入和保存乐谱,而避免设计任何乐理或记谱知识。而配合自动作曲技术与自动配乐技术,人们就可以很快地创作出自己想要的音乐。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是实施例提供的基于重音分析的人声转乐谱方法的流程图;
图2是实施例提供的波长计算的示意图;
图3是实施例提供的重音分析的示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
本实施例提供了一种基于重音分析的人声转乐谱系统,该人声转乐谱系统能够实现将人声转化为乐谱,使得人人都可以创作音乐。
该人声转乐谱系统主要包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,如图1所示,所述计算机处理器执行所述计算机程序时实现以下步骤,也就是实现人声转乐谱的步骤包括:
S101,对人声音频进行采样,获得多个样本片段,然后对每个样本片段进行频率分析。
人声音频可以是通过各种录音设备采集的Wave文件,具体以波形的形式进行呈现。一般来说采集的人声音频波形过于紧密且可能存在一些噪声,不利于对音频进行分析和处理,因此需要对音频进行采样,本实施例中,以0.02s为时间间隔,对人声音频进行截取获得样本片段。
本实施例中,采用时域法对波形进行频率分析,即在时间维度上寻找一个波形的长度,根据波长计算频率。传统的时域法会遍历波长,把样本波形后移至猜测波长,然后与原波形做差。
一种典型的时域法是采用自相关函数进行波长搜素,自相关函数为:其中x为样本波形,l∈[0,N)为时间,随后选取该样本片段上的rx的除了0处的首个极大值。还有一些方法计算差的平方,即计算用来衡量两段波形的差。
对于人声波形,这些函数的结果通常都会比较接近余弦波的形状,即随着时间波形的相似性先增大,增大到极大值后减小,接近0。根据人声波形的特征,本实施例采用类似二分法的方法搜索样本片段中波形中的极点,以确定波长,如图2所示,对每个样本片段进行频率分析的具体方法为:
(a)将样本片段平均分成N份,考虑N份片段的N端点,并搜索寻找N个端点中自相关函数值的首次出现的极大值,或差值函数首次出现的极小值所在的那个片段;
(b)以该片段作为输入,按照步骤(a)再进行迭代搜索寻找,直到确定极值点为止;
(c)相邻两个极值点之间的距离即为波长,波长的倒数即为频率,以此获得每个样本片段的频率分析结果。
该频率确定方法,比传统的方法具有更优的时间复杂度,使得人声转乐谱的运行速度得到了提高。
S102,对每个样本片段进行重音分析。
重音可以理解为音量较高的音符,或者是持续时间较长的音符。本实施例结合音量以及音量的变化区域来实现对样本片段的重音分析。如图3所示,对每个样本片段进行重音分析的具体过程为:
首先,以每个样本片段中波形的平方和作为该样本片段的音量,根据音量和时间构建音量-时间变化曲线;
然后,计算音量-时间变化曲线相对于音量的离散导数,并以0.03秒对离散导数曲线进行采样获得采样点,分析音量的瞬间变化趋势,以变化剧烈的离散导数曲线对应的采样点作为重音的起始位置。
本实施例中,认为音量的离散导数曲线的斜率大于则认为音量的瞬间变化较剧烈,也就是离散导数曲线变化剧烈。
在获得重音后,还可以根据这些重音的起始位置以及重音的持续时间,即初步计算形成乐曲速度。
S103,根据重音分析结果和频率分析结果,对人声音频进行音符分割,具体过程为:
首先,对频率变化和音量变化赋予不同权重后,计算音符的把握度:
c(t)=wf×δ(f,t)+wv×δ(v,t)
其中,c(t)表示t时刻音符的把握度,δ(f,t)是频率f相对于时间t的变化函数,δ(v,t)是音量v相对于时间t的变化函数,wf为函数δ(f,t)的权重,wv为函数δ(v,t)的权重,且wf<wv
然后,当音符的把握度大于阈值时,则在此时刻认为是音符开始的位置,即对音符进行分割。
本实施例中,当频率和音量同时变化时可以有更大的把握认为此处是音符的开始位置,一般认为重音出现更加意味着音符的开始,则设置音量变化权重大于频率变化权重,经实验验证,当wf与wv取值比例为为3:1时,音符分割的准确性较高,能够达到90%以上。
在另外一个实施方式中,根据重音分析结果和频率分析结果以及乐曲速度,对人声音频进行音符分割,具体过程为:
首先,对频率变化、音量变化以及乐曲速度(节拍信息)赋予不同权重后,计算音符的把握度:
c(t)=wf×δ(f,t)+wv×δ(v,t)+wBPM×b(t,BPM)
其中,wBPM表示函数b(t,BPM)的权重,b(t,BPM)表示据乐曲速度计算节拍信息的函数,t时刻越接近整拍则函数值越大;然后,当音符的把握度大于阈值时,则在此时刻认为是音符开始的位置,即对音符进行分割。
根据乐曲速度可以计算出每个音符在小节中的位置,整拍位置将被赋予更大的权重,即具有更大的把握度,这样结合频率变化、音量变化以及音符所在的位置能够更准确地实现对音符的分割。
S104,获得每个音符后,根据频率变化,测定每个音符的音高,具体过程为:
首先,计算音频的频率信息:
其中,x[i]表示音符中第i个采样点的频率,v[i]表示音符中第i个采样点处的音量,认为音量更大的位置拥有更大的权重;w(i,N)为位置权重函数,它调整一个音符的前中后位置的频率对整个音符的重要程度;
针对函数w(i,N),一般认为音符前部由于可能受到气流的干扰比较大,因此音符前部权重相对略低;音符后部可能出现颤音,因此音符后部的权重缓慢下降;音符中部是个最稳定的区间,因此音符的中部权重相对较高。
然后,根据十二等音律计算音高其中basepitch表示基准音高,即440Hz对应的音高A5。
相比于直接计算频率的平均值获得的音高,利用该方法测定的音高准确率得到了明显提升。且具有更优的时间复杂度,使得人声转乐谱的运行速度得到了提高。
S105,在获得每个音符的音高后,基于绝对音高对乐谱进行调性分析和调整,以获得最终的乐谱。
具体地,基于绝对音高对乐谱进行调性分析和调整的过程为:
首先,采用标准的大调分析法进行调性分析,将所有音符映射到一个八度内,以能够使最多的音符落入大调的音阶(do、re、mi、fa、so、la、si)内的音符为主音,获得调性分析结果;
然后,根据调性分析结果对不属于调式主音上的音符进行判断,计算标准音高与人声音高的差值,分析音符出错的可能性p=wf×(f0-fpitch)+H(pitch),其中,wf为音高差值的权重,f0-fpitch为标准音高与人生音高的差值,H(pitch)为音乐理论中出现在大调音阶以外音符出现的频率的统计结果;
最后,根据音符出错可能性p,将不属于调式主音上的音符修正至高半音、低半音、或者不修正。
具体地,对于p>1的音符,计算人声的频率f0与高半音的频率fpitch+1、低半音的频率fpitch-1的差值,修正至这两个音当中频率差距更小的音。对于p≤1的音符不进行修正。
本实施例中,将调性分析纳入了人声转乐谱系统中,结合音乐理论计算音符偏差的可能性,自动修正偏差音符,提高了转化乐谱的准确性。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于重音分析的人声转乐谱系统,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于,所述计算机处理器执行所述计算机程序时实现以下步骤:
(1)对人声音频进行采样,获得多个样本片段,然后对每个样本片段进行频率分析;
(2)对每个样本片段进行重音分析;
(3)根据重音分析结果和频率分析结果,对人声音频进行音符分割;
(4)获得每个音符后,根据频率变化,测定每个音符的音高;
(5)在获得每个音符的音高后,基于绝对音高对乐谱进行调性分析和调整,以获得最终的乐谱。
2.如权利要求1所述的基于重音分析的人声转乐谱系统,其特征在于,对每个样本片段进行频率分析的具体方法为:
(a)将样本片段平均分成N份,考虑N份片段的N端点,并搜索寻找N个端点中自相关函数值的首次出现的极大值,或差值函数首次出现的极小值所在的那个片段;
(b)以该片段作为输入,按照步骤(a)再进行迭代搜索寻找,直到确定极值点为止;
(c)相邻两个极值点之间的距离即为波长,波长的倒数即为频率,以此获得每个样本片段的频率分析结果。
3.如权利要求1所述的基于重音分析的人声转乐谱系统,其特征在于,对每个样本片段进行重音分析的具体过程为:
首先,以每个样本片段中波形的平方和作为该样本片段的音量,根据音量和时间构建音量-时间变化曲线;
然后,计算音量-时间变化曲线相对于音量的离散导数,并以0.03秒对离散导数曲线进行采样获得采样点,分析音量的瞬间变化趋势,以变化剧烈的离散导数曲线对应的采样点作为重音的起始位置。
4.如权利要求3所述的基于重音分析的人声转乐谱系统,其特征在于,在获得重音后,根据这些重音的起始位置以及重音的持续时间,即初步计算形成乐曲速度。
5.如权利要求1所述的基于重音分析的人声转乐谱系统,其特征在于,根据重音分析结果和频率分析结果,对人声音频进行音符分割的具体过程为:
首先,对频率变化和音量变化赋予不同权重后,计算音符的把握度:
c(t)=wf×δ(f,t)+wv×δ(v,t)
其中,c(t)表示t时刻音符的把握度,δ(f,t)是频率f相对于时间t的变化函数,δ(v,t)是音量v相对于时间t的变化函数,wf为函数δ(f,t)的权重,wv为函数δ(v,t)的权重,且wf<wv
然后,当音符的把握度大于阈值时,则在此时刻认为是音符开始的位置,即对音符进行分割。
6.如权利要求1所述的基于重音分析的人声转乐谱系统,其特征在于,根据重音分析结果和频率分析结果以及乐曲速度,对人声音频进行音符分割,具体过程为:
首先,对频率变化、音量变化以及乐曲速度赋予不同权重后,计算音符的把握度:
c(t)=wf×δ(f,t)+wv×δ(v,t)+wBPM×b(t,BPM)
其中,wBPM表示函数b(t,BPM)的权重,b(t,BPM)表示根据乐曲速度计算节拍信息的函数,t时刻越接近整拍则函数值越大;;
然后,当音符的把握度大于阈值时,则在此时刻认为是音符开始的位置,即对音符进行分割。
7.如权利要求1所述的基于重音分析的人声转乐谱系统,其特征在于,测定每个音符的音高的具体过程为:
首先,计算音频的频率信息:
其中,x[i]表示音符中第i个采样点的频率,v[i]表示音符中第i个采样点处的音量,认为音量更大的位置拥有更大的权重;w(i,N)为位置权重函数,它调整一个音符的前中后位置的频率对整个音符的重要程度;
然后,根据十二等音律计算音高其中base pitch表示基准音高,即440Hz对应的音高A5。
8.如权利要求1所述的基于重音分析的人声转乐谱系统,其特征在于,基于绝对音高对乐谱进行调性分析和调整的过程为:
首先,采用标准的大调分析法进行调性分析,将所有音符映射到一个八度内,以能够使最多的音符落入大调的音阶内的音符为主音,获得调性分析结果;
然后,根据调性分析结果对不属于调式主音上的音符进行判断,计算标准音高与人声音高的差值,分析音符出错的可能性p=wf×(f0-fpitch)+H(pitch),其中,wf为音高差值的权重,f0-fpitch为标准音高与人生音高的差值,H(pitch)为音乐理论中出现在大调音阶以外音符出现的频率的统计结果;
最后,根据音符出错可能性p,将不属于调式主音上的音符修正至高半音、低半音、或者不修正。
CN201910192278.6A 2019-03-14 2019-03-14 基于重音分析的人声转乐谱系统 Active CN109979488B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910192278.6A CN109979488B (zh) 2019-03-14 2019-03-14 基于重音分析的人声转乐谱系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910192278.6A CN109979488B (zh) 2019-03-14 2019-03-14 基于重音分析的人声转乐谱系统

Publications (2)

Publication Number Publication Date
CN109979488A true CN109979488A (zh) 2019-07-05
CN109979488B CN109979488B (zh) 2021-05-14

Family

ID=67078837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910192278.6A Active CN109979488B (zh) 2019-03-14 2019-03-14 基于重音分析的人声转乐谱系统

Country Status (1)

Country Link
CN (1) CN109979488B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110364184A (zh) * 2019-07-15 2019-10-22 西安音乐学院 基于深度卷积神经网络dcnn和ctc算法的音准评估方法
CN111460208A (zh) * 2020-03-30 2020-07-28 张寅� 一种音乐搜索方法及系统
CN111526427A (zh) * 2020-04-30 2020-08-11 维沃移动通信有限公司 视频生成方法、装置及电子设备
CN111552830A (zh) * 2020-04-26 2020-08-18 苏州缪斯谈谈科技有限公司 一种用户自选乐谱练习方法和系统
CN112071287A (zh) * 2020-09-10 2020-12-11 北京有竹居网络技术有限公司 用于生成歌谱的方法、装置、电子设备和计算机可读介质
CN112365868A (zh) * 2020-11-17 2021-02-12 北京达佳互联信息技术有限公司 声音处理方法、装置、电子设备及存储介质
CN112435680A (zh) * 2019-08-08 2021-03-02 北京字节跳动网络技术有限公司 音频处理方法、装置、电子设备及计算机可读存储介质
CN112908288A (zh) * 2021-01-25 2021-06-04 北京达佳互联信息技术有限公司 节拍检测方法、装置、电子设备和存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4602545A (en) * 1985-01-24 1986-07-29 Cbs Inc. Digital signal generator for musical notes
CN103035253A (zh) * 2012-12-20 2013-04-10 成都玉禾鼎数字娱乐有限公司 一种自动识别音乐旋律调号的方法
CN103354092A (zh) * 2013-06-27 2013-10-16 天津大学 一种带检错功能的音频乐谱比对方法
US20130311190A1 (en) * 2012-05-21 2013-11-21 Bruce Reiner Method and apparatus of speech analysis for real-time measurement of stress, fatigue, and uncertainty
CN104200818A (zh) * 2014-08-06 2014-12-10 重庆邮电大学 一种音高检测方法
CN104599666A (zh) * 2014-09-26 2015-05-06 威盛电子股份有限公司 音频文件合成方法及其所适用的音频文件合成系统
CN104992712A (zh) * 2015-07-06 2015-10-21 成都云创新科技有限公司 能识别音乐自动成谱的方法
KR20160106239A (ko) * 2015-03-02 2016-09-12 이신노 실시간 조율이 가능한 악보생성 어플리케이션을 구비한 모바일 단말기
CN106683651A (zh) * 2015-11-11 2017-05-17 谢剑 乐谱的展现方法
CN106782460A (zh) * 2016-12-26 2017-05-31 广州酷狗计算机科技有限公司 生成乐谱的方法和装置
CN108074588A (zh) * 2016-11-15 2018-05-25 北京唱吧科技股份有限公司 一种音高计算方法及装置
CN108735231A (zh) * 2018-04-27 2018-11-02 大连民族大学 主旋律音高序列估计方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4602545A (en) * 1985-01-24 1986-07-29 Cbs Inc. Digital signal generator for musical notes
US20130311190A1 (en) * 2012-05-21 2013-11-21 Bruce Reiner Method and apparatus of speech analysis for real-time measurement of stress, fatigue, and uncertainty
CN103035253A (zh) * 2012-12-20 2013-04-10 成都玉禾鼎数字娱乐有限公司 一种自动识别音乐旋律调号的方法
CN103354092A (zh) * 2013-06-27 2013-10-16 天津大学 一种带检错功能的音频乐谱比对方法
CN104200818A (zh) * 2014-08-06 2014-12-10 重庆邮电大学 一种音高检测方法
CN104599666A (zh) * 2014-09-26 2015-05-06 威盛电子股份有限公司 音频文件合成方法及其所适用的音频文件合成系统
KR20160106239A (ko) * 2015-03-02 2016-09-12 이신노 실시간 조율이 가능한 악보생성 어플리케이션을 구비한 모바일 단말기
CN104992712A (zh) * 2015-07-06 2015-10-21 成都云创新科技有限公司 能识别音乐自动成谱的方法
CN106683651A (zh) * 2015-11-11 2017-05-17 谢剑 乐谱的展现方法
CN108074588A (zh) * 2016-11-15 2018-05-25 北京唱吧科技股份有限公司 一种音高计算方法及装置
CN106782460A (zh) * 2016-12-26 2017-05-31 广州酷狗计算机科技有限公司 生成乐谱的方法和装置
CN108735231A (zh) * 2018-04-27 2018-11-02 大连民族大学 主旋律音高序列估计方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
EMMANOUIL BENETOS ET AL.: "Joint Multi-Pitch Detection Using Harmonic Envelope Estimation for Polyphonic Music Transcription", 《IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING》 *
MEINARD MÜLLER ET AL.: "Signal Processing for Music Analysis", 《IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING》 *
方诗虹: "基于振动频率识别的可视化音频简谱输出的设计与实现", 《西南民族大学学报(自然科学版)》 *
曹西征: "基于WAV文件的独奏乐曲信号中的乐谱识别", 《计算机应用》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110364184A (zh) * 2019-07-15 2019-10-22 西安音乐学院 基于深度卷积神经网络dcnn和ctc算法的音准评估方法
CN110364184B (zh) * 2019-07-15 2022-01-28 西安音乐学院 基于深度卷积神经网络dcnn和ctc算法的音准评估方法
CN112435680A (zh) * 2019-08-08 2021-03-02 北京字节跳动网络技术有限公司 音频处理方法、装置、电子设备及计算机可读存储介质
CN111460208A (zh) * 2020-03-30 2020-07-28 张寅� 一种音乐搜索方法及系统
CN111552830A (zh) * 2020-04-26 2020-08-18 苏州缪斯谈谈科技有限公司 一种用户自选乐谱练习方法和系统
CN111526427A (zh) * 2020-04-30 2020-08-11 维沃移动通信有限公司 视频生成方法、装置及电子设备
CN112071287A (zh) * 2020-09-10 2020-12-11 北京有竹居网络技术有限公司 用于生成歌谱的方法、装置、电子设备和计算机可读介质
CN112365868A (zh) * 2020-11-17 2021-02-12 北京达佳互联信息技术有限公司 声音处理方法、装置、电子设备及存储介质
CN112365868B (zh) * 2020-11-17 2024-05-28 北京达佳互联信息技术有限公司 声音处理方法、装置、电子设备及存储介质
CN112908288A (zh) * 2021-01-25 2021-06-04 北京达佳互联信息技术有限公司 节拍检测方法、装置、电子设备和存储介质
CN112908288B (zh) * 2021-01-25 2023-11-21 北京达佳互联信息技术有限公司 节拍检测方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN109979488B (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN109979488A (zh) 基于重音分析的人声转乐谱系统
Marolt A connectionist approach to automatic transcription of polyphonic piano music
Gómez et al. Towards computer-assisted flamenco transcription: An experimental comparison of automatic transcription algorithms as applied to a cappella singing
CN107767847B (zh) 一种智能钢琴演奏测评方法及系统
CN104992712B (zh) 能识别音乐自动成谱的方法
US9804818B2 (en) Musical analysis platform
US20170092245A1 (en) Musical analysis platform
US20130205975A1 (en) Method for Giving Feedback on a Musical Performance
Eggink et al. Instrument recognition in accompanied sonatas and concertos
Benetos et al. Automatic transcription of Turkish microtonal music
Yazawa et al. Audio-based guitar tablature transcription using multipitch analysis and playability constraints
Perez-Carrillo et al. Indirect acquisition of violin instrumental controls from audio signal with hidden Markov models
CN105825868A (zh) 一种演唱者有效音域的提取方法
Lerch Software-based extraction of objective parameters from music performances
CN112634841B (zh) 一种基于声音识别的吉他谱自动生成方法
Özaslan et al. Characterization of embellishments in ney performances of makam music in turkey
Dittmar et al. Real-time guitar string detection for music education software
JP2016184112A (ja) アンサンブル評価装置
Jie et al. A violin music transcriber for personalized learning
Noland et al. Influences of signal processing, tone profiles, and chord progressions on a model for estimating the musical key from audio
Bastas et al. A few-sample strategy for guitar tablature transcription based on inharmonicity analysis and playability constraints
Ali-MacLachlan Computational analysis of style in Irish traditional flute playing
Kitahara et al. Category-level identification of non-registered musical instrument sounds
You et al. Music tonality detection based on Krumhansl-Schmuckler profile
Zlatintsi et al. Musical instruments signal analysis and recognition using fractal features

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant