CN102074233A - 乐曲辨识系统及方法 - Google Patents

乐曲辨识系统及方法 Download PDF

Info

Publication number
CN102074233A
CN102074233A CN200910310161XA CN200910310161A CN102074233A CN 102074233 A CN102074233 A CN 102074233A CN 200910310161X A CN200910310161X A CN 200910310161XA CN 200910310161 A CN200910310161 A CN 200910310161A CN 102074233 A CN102074233 A CN 102074233A
Authority
CN
China
Prior art keywords
melody
scale
eigenwert
note
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910310161XA
Other languages
English (en)
Inventor
李后贤
李章荣
罗治平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN200910310161XA priority Critical patent/CN102074233A/zh
Priority to US12/788,335 priority patent/US8101842B2/en
Publication of CN102074233A publication Critical patent/CN102074233A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/086Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for transcription of raw audio or music data to a displayed or printed staff representation or to displayable MIDI-like note-oriented data, e.g. in pianoroll format
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/091Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for performance evaluation, i.e. judging, grading or scoring the musical qualities or faithfulness of a performance, e.g. with respect to pitch, tempo or other timings of a reference performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

一种乐曲辨识系统,包括一音阶记录单元、一特征撷取单元、一存储单元及一比较单元,所述音阶记录单元用于分别记录一第一乐曲、一第二乐曲的每个音符的音阶,并分别将所述第一、第二乐曲的每一音符的音阶传送给所述特征撷取单元,所述特征撷取单元记录所述第一乐曲的音阶变化及所述第二乐曲的音阶变化,并将所述第一乐曲的音阶变化转化为一第一乐曲特征值,以及将所述第二乐曲的音阶变化转化为一第二乐曲特征值,所述存储单元存储所述第一、第二乐曲特征值,所述比较单元对所述存储单元中的第一、第二乐曲特征值进行比较,以判断所述第一、第二乐曲是否相同。本发明还提供一种乐曲辨识方法,所述乐曲辨识系统及方法的智能程度较高。

Description

乐曲辨识系统及方法
技术领域
本发明涉及一种乐曲辨识系统及方法。
背景技术
近年来音乐辨识技术在各个领域得到了广泛应用。例如,电子玩具可基于音乐辨识技术实现与人或其他玩具之间的互动,又如,乐曲检索系统中可内建乐曲辨识系统,当人们搜索乐曲时,可以不通过输入乐曲名称的检索方式,而直接以声讯的方式进行检索。传统的音乐辨识技术是将乐曲各小节的音符、音长、节拍等信息通过一定的转化规则转化为频率信息,这些频率信息作为乐曲特征,两个乐曲之间的乐曲特征进行比对之后,即可判断出该两乐曲是否相同。然而,当两个乐曲仅仅是调式、节拍不同时,经人耳可判断出这两个乐曲相同,而采用传统的音乐辨识技术则会判定该两乐曲不同,因此,传统的音乐辨识技术准确性和智能程度还有待提高。
发明内容
鉴于以上内容,有必要提供一种乐曲辨识系统及方法,可准确判断两乐曲是否为同一乐曲。
一种乐曲辨识系统,包括一音阶记录单元、一特征撷取单元、一存储单元及一比较单元,所述音阶记录单元用于分别记录一第一乐曲、一第二乐曲的每个音符的音阶,并分别将所述第一、第二乐曲的每一音符的音阶传送给所述特征撷取单元,所述特征撷取单元记录所述第一乐曲的音阶变化及所述第二乐曲的音阶变化,并将所述第一乐曲的音阶变化转化为一第一乐曲特征值,以及将所述第二乐曲的音阶变化转化为一第二乐曲特征值,所述存储单元存储所述第一、第二乐曲特征值,所述比较单元对所述存储单元中的第一、第二乐曲特征值进行比较,以判断所述第一、第二乐曲是否相同。
一种乐曲辨识方法,包括以下步骤:
记录一需辨识乐曲的每个音符的音阶;
获取所述需辨识乐曲的音阶变化,并将所述需辨识乐曲的音阶变化转化为一乐曲特征值;
存储所述乐曲特征值;以及
将存储的需辨识的乐曲特征值与一样本特征值进行比较,以判断所述需辨识的乐曲是否与一样本乐曲相同。
所述乐曲辨识系统及方法通过记录乐曲的每个音符的音阶并将其变化转化为乐曲特征值,即使两个相同乐曲之间的调式、节拍不同,所述乐曲辨识系统及方法也可准确判断出所述两乐曲相同,所述乐曲辨识系统具有较高的智能程度。
附图说明
图1是本发明乐曲辨识系统较佳实施方式的模块图。
图2为一乐曲的乐谱。
图3是本发明乐曲辨识方法较佳实施方式的流程图。
具体实施方式
下面结合附图及较佳实施方式对本发明作进一步详细描述:
请参照图1,本发明乐曲辨识系统1的较佳实施方式包括一音阶记录单元10、一特征撷取单元20、一存储单元30及一比较单元40。所述乐曲辨识系统1用于判断一第一乐曲及一第二乐曲是否相同。
所述音阶记录单元10用于分别记录所述第一、第二乐曲的每个音符的音阶,并分别将所述第一、第二乐曲的每一音符的音阶传送给所述特征撷取单元20。所述特征撷取单元20记录所述第一乐曲的音阶变化及所述第二乐曲的音阶变化,并将所述第一乐曲的音阶变化转化为一第一乐曲特征值、将所述第二乐曲的音阶变化转化为一二乐曲特征值。所述存储单元30用于存储所述第一、第二乐曲的乐曲特征值。所述比较单元40用于对所述存储单元30中的第一、第二乐曲特征值进行比较,以判断所述第一、第二乐曲是否相同。
本实施方式中,所述第一乐曲为一样本乐曲,所述第一乐曲特征值可作为样本特征值并预先存储在所述存储单元30中,以与其他乐曲进行比较。所述第一、第二乐曲特征值分别包括一组顺序排列的数字值,其中第一个数字值为一基准值,所述基准值之外的每一数字值表示两相邻音符中后一音符与前一音符的音阶之差,每组数字值是按照对应的第一或第二乐曲的音符的顺序排列的。比如,第二个数字值表示第二个音符与第一个音符的音阶之差,第三个数字值表示第三个音符与第二个音符的音阶之差。
请继续参考图2,为一乐曲的乐谱50,所述音阶记录单元10记录所述乐谱50中的音符A-G的音阶,所述特征撷取单元20以所述乐谱50中的首个音符B的音阶为一基准值0,所述基准值0为所述乐曲的乐曲特征值的第一个数字值,所述特征撷取单元20以后续每一个音符与前一个音符的音阶之差来表示所述乐谱50中音符的音阶变化,本实施方式中,以一个半音的增加为一单位1进行转化,例如,由于第二个音符C的音阶比所述首个音符B的音阶增大半音,因此所述乐曲的乐曲特征值的第二个数字值为1,由于后续每一个音符都比前一个音符增加半个音阶,因此所述乐曲的乐曲特征值即可表示为(0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1),该乐曲特征值存储于所述存储单元30中。
所述乐曲辨识系统1可采用上述方法撷取到另一乐曲的乐曲特征值,如(0,1,1,1,1,1,1,0,1,1,1,1,1,-2,1,1)并存储到所述存储单元中,该乐曲特征值中的第八个数字值“0”表示对应的前后两个音符的音阶相同,倒数第三个数字值“-2”表示对应的后一音符的音阶比其前一个音符的音阶减少2,即两个半音,所述比较单元40判断上述两个乐曲特征值的相同度是否大于一预设值,如85%,当上述两个乐曲特征值的相同度大于所述预设值时,则判定对应的乐曲相同,由于上述两乐曲特征值中有14个数字值相同,其相同度为87.5%,因此,上述两个乐曲相同。
请参照图3,本发明音乐辨识方法的较佳实施方式应用于图1中的乐曲辨识系统1,所述音乐辨识方法包括以下步骤:
步骤S1:所述音阶记录单元10记录一乐曲的每个音符的音阶。
步骤S2:所述特征撷取单元20接收所述乐曲每个音符的音阶以获取所述乐曲的音阶变化,并将所述乐曲的音阶变化转化为对应的乐曲特征值。
步骤S3:所述存储单元30存储所述乐曲特征值。
步骤S4:所述比较单元40将所述乐曲特征值与一样本特征值进行比较,判断所述乐曲是否与一样本乐曲相同。本实施方式中,所述样本特征值为所述样本乐曲的乐曲特征值,其预先存储在所述存储单元30中,所述比较单元40通过计算所述乐曲特征值与所述样本特征值的相同度,并将所述乐曲特征值与所述样本特征值的相同度与一预设值进行比较,以判断所述乐曲是否与一样本乐曲相同。
所述乐曲辨识系统及方法通过记录乐曲的每个音符的音阶,获取所述乐曲的音阶变化并将其转化为乐曲特征值,由于乐曲的音阶变化不会随调式(比如C大调、G大调等)、节拍发生改变,因此即使两个相同乐曲之间的调式、节拍发生改变,所述乐曲辨识系统及方法也能准确判断出所述两乐曲相同,因此,所述乐曲辨识系统及方法具有较高的智能程度。

Claims (5)

1.一种乐曲辨识系统,包括一音阶记录单元、一特征撷取单元、一存储单元及一比较单元,所述音阶记录单元用于分别记录一第一乐曲、一第二乐曲的每个音符的音阶,并分别将所述第一、第二乐曲的每一音符的音阶传送给所述特征撷取单元,所述特征撷取单元记录所述第一乐曲的音阶变化及所述第二乐曲的音阶变化,并将所述第一乐曲的音阶变化转化为一第一乐曲特征值,以及将所述第二乐曲的音阶变化转化为一第二乐曲特征值,所述存储单元存储所述第一、第二乐曲特征值,所述比较单元对所述存储单元中的第一、第二乐曲特征值进行比较,以判断所述第一、第二乐曲是否相同。
2.如权利要求1所述的乐曲辨识系统,其特征在于:所述第一、第二乐曲特征值分别包括一组数字值,其中第一个数字值为一基准值,所述基准值之外的每一数字值表示两相邻音符中后一音符与前一音符的音阶之差,所述第一、第二乐曲特征值中的数字值分别是按照所述第一、第二乐曲的音符的顺序排列的。
3.一种乐曲辨识方法,包括以下步骤:
记录一需辨识乐曲的每个音符的音阶;
获取所述需辨识乐曲的音阶变化,并将所述需辨识乐曲的音阶变化转化为一乐曲特征值;
存储所述乐曲特征值;以及
将存储的需辨识的乐曲特征值与一样本特征值进行比较,以判断所述需辨识的乐曲是否与一样本乐曲相同。
4.如权利要求3所述的乐曲辨识方法,其特征在于:所述乐曲辨识方法通过计算所述需辨识的乐曲特征值与所述样本特征值的相同度,并将所述需辨识的乐曲特征值与所述样本特征值的相同度与一预设值进行比较,以判断所述需辨识的乐曲是否与样本乐曲相同。
5.如权利要求3所述的乐曲辨识方法,其特征在于:所述乐曲特征值包括一组数字值,其中第一个数字值为一基准值,所述基准值之外的每一数字值表示两相邻音符中后一音符与前一音符的音阶之差,所述需辨识的乐曲特征值及样本特征值中的数字值分别是按照所述需辨识的乐曲及样本乐曲的音符的顺序排列的。
CN200910310161XA 2009-11-20 2009-11-20 乐曲辨识系统及方法 Pending CN102074233A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN200910310161XA CN102074233A (zh) 2009-11-20 2009-11-20 乐曲辨识系统及方法
US12/788,335 US8101842B2 (en) 2009-11-20 2010-05-27 Music comparing system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910310161XA CN102074233A (zh) 2009-11-20 2009-11-20 乐曲辨识系统及方法

Publications (1)

Publication Number Publication Date
CN102074233A true CN102074233A (zh) 2011-05-25

Family

ID=44032751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910310161XA Pending CN102074233A (zh) 2009-11-20 2009-11-20 乐曲辨识系统及方法

Country Status (2)

Country Link
US (1) US8101842B2 (zh)
CN (1) CN102074233A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050972A (zh) * 2013-03-14 2014-09-17 雅马哈株式会社 声音信号分析设备以及声音信号分析方法和程序
CN111081209A (zh) * 2019-12-19 2020-04-28 中国地质大学(武汉) 基于模板匹配的中国民族音乐调式识别方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI426501B (zh) * 2010-11-29 2014-02-11 Inst Information Industry 旋律辨識方法與其裝置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5739451A (en) * 1996-12-27 1998-04-14 Franklin Electronic Publishers, Incorporated Hand held electronic music encyclopedia with text and note structure search
FR2785438A1 (fr) * 1998-09-24 2000-05-05 Baron Rene Louis Procede et dispositif de generation musicale
US6747201B2 (en) * 2001-09-26 2004-06-08 The Regents Of The University Of Michigan Method and system for extracting melodic patterns in a musical piece and computer-readable storage medium having a program for executing the method
US6967275B2 (en) * 2002-06-25 2005-11-22 Irobot Corporation Song-matching system and method
EP1785891A1 (en) * 2005-11-09 2007-05-16 Sony Deutschland GmbH Music information retrieval using a 3D search algorithm
WO2008101126A1 (en) * 2007-02-14 2008-08-21 Museami, Inc. Web portal for distributed audio file editing

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050972A (zh) * 2013-03-14 2014-09-17 雅马哈株式会社 声音信号分析设备以及声音信号分析方法和程序
CN104050972B (zh) * 2013-03-14 2019-07-30 雅马哈株式会社 声音信号分析设备以及声音信号分析方法和程序
CN111081209A (zh) * 2019-12-19 2020-04-28 中国地质大学(武汉) 基于模板匹配的中国民族音乐调式识别方法
CN111081209B (zh) * 2019-12-19 2022-06-07 中国地质大学(武汉) 基于模板匹配的中国民族音乐调式识别方法

Also Published As

Publication number Publication date
US8101842B2 (en) 2012-01-24
US20110120289A1 (en) 2011-05-26

Similar Documents

Publication Publication Date Title
CN102654859B (zh) 一种歌曲推荐方法及系统
JP5019836B2 (ja) データ再生機能を有する電子装置
US8909525B2 (en) Interactive voice recognition electronic device and method
CN101996627B (zh) 语音处理装置、语音处理方法和程序
US8892565B2 (en) Method and apparatus for accessing an audio file from a collection of audio files using tonal matching
CN101017502B (zh) 使用歌词的重复模式提取歌词结构的设备、系统和方法
US7177800B2 (en) Method and device for the processing of speech information
CN110136689B (zh) 基于迁移学习的歌声合成方法、装置及存储介质
CN102473408B (zh) 卡拉ok主机装置和方法
US7593937B2 (en) Apparatus, medium, and method clustering audio files
CN106295717A (zh) 一种基于稀疏表示和机器学习的西洋乐器分类方法
CN111462748A (zh) 语音识别处理方法、装置、电子设备及存储介质
CN109815311B (zh) 一种可识别普通书籍的点读方法及系统
US20040064306A1 (en) Voice activated music playback system
KR101567449B1 (ko) 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법
CN102074233A (zh) 乐曲辨识系统及方法
JP5465926B2 (ja) 音声認識辞書作成装置及び音声認識辞書作成方法
CN101656792A (zh) 移动终端播放歌曲的方法及相关装置
KR20200056342A (ko) 대상 화자 음성과 동일한 음성을 가진 컨텐츠를 검색하는 방법 및 이를 실행하기 위한 장치
CN102013265A (zh) 一种解析歌词并使其与歌曲同步播放的装置及方法
CN113781989A (zh) 一种音频的动画播放、节奏卡点识别方法及相关装置
CN202102705U (zh) 工尺谱乐谱到midi信号的自动转换装置
KR100745250B1 (ko) 오디오/비디오 동기용 멀티미디어 파일 작성 프로그램을기록한 컴퓨터로 읽을 수 있는 기록매체 및 오디오/비디오동조화 장치
CN105138696B (zh) 一种音乐推送方法及装置
KR100264390B1 (ko) 노래 반주기의 가수사진 표시 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110525