CN112331170A - 佛乐旋律相似度的分析方法、装置、设备及存储介质 - Google Patents

佛乐旋律相似度的分析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112331170A
CN112331170A CN202011169283.4A CN202011169283A CN112331170A CN 112331170 A CN112331170 A CN 112331170A CN 202011169283 A CN202011169283 A CN 202011169283A CN 112331170 A CN112331170 A CN 112331170A
Authority
CN
China
Prior art keywords
melody
analyzed
segment
comparison
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011169283.4A
Other languages
English (en)
Other versions
CN112331170B (zh
Inventor
蒋慧军
王若竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011169283.4A priority Critical patent/CN112331170B/zh
Priority to PCT/CN2020/131655 priority patent/WO2021203713A1/zh
Publication of CN112331170A publication Critical patent/CN112331170A/zh
Application granted granted Critical
Publication of CN112331170B publication Critical patent/CN112331170B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/056Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction or identification of individual instrumental parts, e.g. melody, chords, bass; Identification or separation of instrumental parts by their characteristic voices or timbres
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/091Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for performance evaluation, i.e. judging, grading or scoring the musical qualities or faithfulness of a performance, e.g. with respect to pitch, tempo or other timings of a reference performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Auxiliary Devices For Music (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,提供一种佛乐旋律相似度的分析方法、装置、设备及存储介质,用于提高佛乐旋律相似度分析的可解释性。佛乐旋律相似度的分析方法包括:分别对预处理对比佛乐旋律和预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集;获取片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵;通过匹配算法、片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵,对每个对比旋律片段和对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集。此外,本发明还涉及区块链技术,预处理对比佛乐旋律和预处理待分析佛乐旋律可存储于区块链中。

Description

佛乐旋律相似度的分析方法、装置、设备及存储介质
技术领域
本发明涉及人工智能的相似度匹配领域,尤其涉及一种佛乐旋律相似度的分析方法、装置、设备及存储介质。
背景技术
旋律相似性在音乐分析、音乐版权检测、音乐信息提取等领域中起到重要的作用,例如:就佛乐而言,佛乐旋律相似性的定量研究对于保护其艺术作品著作以及佛乐相互关联的主要派系分析,都有着积极的意义,佛乐旋律相似性也应用于佛乐乐曲抄袭的检测技术中。目前,一般都是通过基于深度学习的相似性度量算法,对参考佛乐乐曲和待分析佛乐乐曲的相似度进行分析,根据相似度的程度来判断待分析佛乐乐曲是否抄袭于参考佛乐乐曲。
但是,由于上述的相似度分析方法,对于主题曲调改编及新增引子、尾声等能够降低乐曲整体相似度的乐曲旋律修改内容,无法有效地识别出来,仅能输出整曲相似度,因而,导致佛乐旋律相似度分析的可解释性低。
发明内容
本发明提供一种佛乐旋律相似度的分析方法、装置、设备及存储介质,用于提高佛乐旋律相似度分析的可解释性。
本发明第一方面提供了一种佛乐旋律相似度的分析方法,包括:
获取预处理对比佛乐旋律和预处理待分析佛乐旋律,并通过预置模型,分别对所述预处理对比佛乐旋律和所述预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集;
分别对所述对比旋律片段集和所述待分析旋律片段集进行节奏特征和音程特征提取,得到对比旋律特征和待分析旋律特征,根据所述对比旋律特征,生成所述对比旋律片段集中每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,并根据所述待分析旋律特征,生成所述待分析旋律片段集中每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列;
获取每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,分别与每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列之间的片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵;
通过预置的匹配算法、所述片段音高相似度矩阵、所述片段音程相似度矩阵和所述片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集。
可选的,在本发明第一方面的第一种实现方式中,所述通过预置的匹配算法、所述片段音高相似度矩阵、所述片段音程相似度矩阵和所述片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集,包括:
根据所述片段音高相似度矩阵、所述片段音程相似度矩阵、所述片段时值相似度矩阵和预设多模式匹配规则,生成每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,得到二维矩阵集;
通过预置的最长公共子串算法,对所述二维矩阵集中每个二维矩阵依次进行相似度匹配和最长公共子序列查找,得到每个二维矩阵的目标最长公共子序列;
将每个二维矩阵的目标最长公共子序列对应的对比旋律片段和待分析旋律片段,确定为相似度佛乐旋律片段,得到相似佛乐旋律片段集。
可选的,在本发明第一方面的第二种实现方式中,所述根据所述片段音高相似度矩阵、所述片段音程相似度矩阵、所述片段时值相似度矩阵和预设多模式匹配规则,生成每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,得到二维矩阵集,包括:
获取所述片段音高相似度矩阵的音高元素值,以及所述片段时值相似度矩阵的时值元素值;
根据预设多模式匹配规则中的完全匹配规则,判断所述音高元素值和所述时值元素值是否均为1,所述预设多模式匹配规则包括完全匹配规则、模进匹配规则、节奏匹配规则和旋律匹配规则;
若所述音高元素值和所述时值元素值不均为1,则通过所述模进匹配规则,将所述片段音程相似度矩阵和所述片段时值相似度矩阵进行矩阵相加,得到模进匹配矩阵,通过所述旋律匹配规则,将所述片段音程相似度矩阵和所述片段时值相似度矩阵进行矩阵相加,得到旋律匹配矩阵;
将所述模进匹配矩阵、所述片段时值相似度矩阵和所述旋律匹配矩阵进行矩阵相加,得到每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵;
根据每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,获得二维矩阵集。
可选的,在本发明第一方面的第三种实现方式中,所述通过预置的最长公共子串算法,对所述二维矩阵集中每个二维矩阵依次进行相似度匹配和最长公共子序列查找,得到每个二维矩阵的目标最长公共子序列,包括:
通过预置的最长公共子串算法,将所述二维矩阵集中每个二维矩阵的初始元素值与预设阈值进行对比分析;
将大于所述预设阈值的初始元素值设置为1,得到目标元素值;
根据所述目标元素值确定公共子序列的公共子序列长度,并对所述公共子序列长度进行排序;
将排序第一的公共子序列长度对应的公共子序列确定为每个二维矩阵的目标最长公共子序列。
可选的,在本发明第一方面的第四种实现方式中,所述通过预置模型,分别对所述预处理对比佛乐旋律和所述预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集,包括:
通过预置模型,分别对所述预处理对比佛乐旋律和所述预处理待分析佛乐旋律进行旋律分段端点检测,得到对比分段端点和待分析分段端点;
根据所述对比分段端点,对所述预处理对比佛乐旋律进行分段处理,得到多个对比片段,根据所述待分析分段端点,对所述预处理待分析佛乐旋律进行分段处理,得到多个待分析片段;
通过基于十二平均律的音高编码算法,对所述多个对比片段和所述多个待分析片段进行编码,得到对比旋律片段集和待分析旋律片段集。
可选的,在本发明第一方面的第五种实现方式中,所述获取预处理对比佛乐旋律和预处理待分析佛乐旋律,包括:
获取初始对比佛乐旋律和初始待分析佛乐旋律,并分别对所述初始对比佛乐旋律和所述初始待分析佛乐旋律进行时值设置,得到候选对比佛乐旋律和候选待分析佛乐旋律;
分别对所述候选对比佛乐旋律和所述候选待分析佛乐旋律依次进行休止符移除处理和音符合并处理,得到预处理对比佛乐旋律和预处理待分析佛乐旋律。
可选的,在本发明第一方面的第六种实现方式中,所述通过预置的匹配算法、所述片段音高相似度矩阵、所述片段音程相似度矩阵和所述片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集之后,还包括:
将所述相似佛乐旋律片段集写入预置的消息队列中,得到目标消息队列;
通过所述目标消息队列,将所述相似佛乐旋律片段集中的相似佛乐旋律片段发送至对应的审核端,并接收所述审核端发送的基于所述相似佛乐旋律片段的审核结果;
根据所述审核结果,对所述相似佛乐旋律片段进行相似性更正。
本发明第二方面提供了一种佛乐旋律相似度的分析装置,包括:
分段编码模块,用于获取预处理对比佛乐旋律和预处理待分析佛乐旋律,并通过预置模型,分别对所述预处理对比佛乐旋律和所述预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集;
生成模块,用于分别对所述对比旋律片段集和所述待分析旋律片段集进行节奏特征和音程特征提取,得到对比旋律特征和待分析旋律特征,根据所述对比旋律特征,生成所述对比旋律片段集中每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,并根据所述待分析旋律特征,生成所述待分析旋律片段集中每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列;
获取模块,用于获取每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,分别与每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列之间的片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵;
匹配模块,用于通过预置的匹配算法、所述片段音高相似度矩阵、所述片段音程相似度矩阵和所述片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集。
可选的,在本发明第二方面的第一种实现方式中,所述匹配模块包括:
生成单元,用于根据所述片段音高相似度矩阵、所述片段音程相似度矩阵、所述片段时值相似度矩阵和预设多模式匹配规则,生成每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,得到二维矩阵集;
匹配查找单元,用于通过预置的最长公共子串算法,对所述二维矩阵集中每个二维矩阵依次进行相似度匹配和最长公共子序列查找,得到每个二维矩阵的目标最长公共子序列;
确定单元,用于将每个二维矩阵的目标最长公共子序列对应的对比旋律片段和待分析旋律片段,确定为相似度佛乐旋律片段,得到相似佛乐旋律片段集。
可选的,在本发明第二方面的第二种实现方式中,所述生成单元具体用于:
获取所述片段音高相似度矩阵的音高元素值,以及所述片段时值相似度矩阵的时值元素值;
根据预设多模式匹配规则中的完全匹配规则,判断所述音高元素值和所述时值元素值是否均为1,所述预设多模式匹配规则包括完全匹配规则、模进匹配规则、节奏匹配规则和旋律匹配规则;
若所述音高元素值和所述时值元素值不均为1,则通过所述模进匹配规则,将所述片段音程相似度矩阵和所述片段时值相似度矩阵进行矩阵相加,得到模进匹配矩阵,通过所述旋律匹配规则,将所述片段音程相似度矩阵和所述片段时值相似度矩阵进行矩阵相加,得到旋律匹配矩阵;
将所述模进匹配矩阵、所述片段时值相似度矩阵和所述旋律匹配矩阵进行矩阵相加,得到每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵;
根据每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,获得二维矩阵集。
可选的,在本发明第二方面的第三种实现方式中,所述匹配查找单元具体用于:
通过预置的最长公共子串算法,将所述二维矩阵集中每个二维矩阵的初始元素值与预设阈值进行对比分析;
将大于所述预设阈值的初始元素值设置为1,得到目标元素值;
根据所述目标元素值确定公共子序列的公共子序列长度,并对所述公共子序列长度进行排序;
将排序第一的公共子序列长度对应的公共子序列确定为每个二维矩阵的目标最长公共子序列。
可选的,在本发明第二方面的第四种实现方式中,所述分段编码模块具体用于:
通过预置模型,分别对所述预处理对比佛乐旋律和所述预处理待分析佛乐旋律进行旋律分段端点检测,得到对比分段端点和待分析分段端点;
根据所述对比分段端点,对所述预处理对比佛乐旋律进行分段处理,得到多个对比片段,根据所述待分析分段端点,对所述预处理待分析佛乐旋律进行分段处理,得到多个待分析片段;
通过基于十二平均律的音高编码算法,对所述多个对比片段和所述多个待分析片段进行编码,得到对比旋律片段集和待分析旋律片段集。
可选的,在本发明第二方面的第五种实现方式中,所述分段编码模块还可以具体用于:
获取初始对比佛乐旋律和初始待分析佛乐旋律,并分别对所述初始对比佛乐旋律和所述初始待分析佛乐旋律进行时值设置,得到候选对比佛乐旋律和候选待分析佛乐旋律;
分别对所述候选对比佛乐旋律和所述候选待分析佛乐旋律依次进行休止符移除处理和音符合并处理,得到预处理对比佛乐旋律和预处理待分析佛乐旋律。
可选的,在本发明第二方面的第六种实现方式中,所述佛乐旋律相似度的分析装置,还包括:
写入模块,用于将所述相似佛乐旋律片段集写入预置的消息队列中,得到目标消息队列;
发送接收模块,用于通过所述目标消息队列,将所述相似佛乐旋律片段集中的相似佛乐旋律片段发送至对应的审核端,并接收所述审核端发送的基于所述相似佛乐旋律片段的审核结果;
更正模块,用于根据所述审核结果,对所述相似佛乐旋律片段进行相似性更正。
本发明第三方面提供了一种佛乐旋律相似度的分析设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述佛乐旋律相似度的分析设备执行上述的佛乐旋律相似度的分析方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的佛乐旋律相似度的分析方法。
本发明提供的技术方案中,获取预处理对比佛乐旋律和预处理待分析佛乐旋律,并分别对预处理对比佛乐旋律和预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集;生成对比旋律片段集中每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,并生成待分析旋律片段集中每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列;获取每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,分别与每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列之间的片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵;通过预置的匹配算法、片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集。本发明实施例中,通过对预处理对比佛乐旋律和预处理待分析佛乐旋律依次进行片段分割和编码,以及匹配算法、相似度矩阵的多模式匹配,结合了音高、音程和时值进行层级化的相似度匹配,可解释性地揭示了预处理对比佛乐旋律和预处理待分析佛乐旋律之间的相似片段,提高了佛乐旋律相似度分析的可解释性。
附图说明
图1为本发明实施例中佛乐旋律相似度的分析方法的一个实施例示意图;
图2为本发明实施例中佛乐旋律相似度的分析方法的另一个实施例示意图;
图3为本发明实施例中佛乐旋律相似度的分析装置的一个实施例示意图;
图4为本发明实施例中佛乐旋律相似度的分析装置的另一个实施例示意图;
图5为本发明实施例中佛乐旋律相似度的分析设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种佛乐旋律相似度的分析方法、装置、设备及存储介质,提高了佛乐旋律相似度分析的可解释性。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中佛乐旋律相似度的分析方法的一个实施例包括:
101、获取预处理对比佛乐旋律和预处理待分析佛乐旋律,并通过预置模型,分别对预处理对比佛乐旋律和预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集。
可以理解的是,本发明的执行主体可以为佛乐旋律相似度的分析装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
服务器通过乐曲旋律采集器采集初始待分析佛乐旋律,或者获取待分析佛乐旋律图像,通过预置旋律转换模型对待分析佛乐旋律图像进行图像预处理、旋律区域识别和旋律区域分割,得到旋律区域图像,对旋律区域图像进行特征提取得到旋律音符特征,将预置的旋律音符模板与旋律音符特征进行对比分析,得到目标旋律音符,根据目标旋律音符生成初始待分析佛乐旋律;服务器从预置数据库中提取初始对比佛乐旋律,对初始对比佛乐旋律和初始待分析佛乐旋律进行与数据清洗、数据转换和音轨处理,得到预处理对比佛乐旋律和预处理待分析佛乐旋律。
服务器调用预置的乐曲分段检测器,通过预置模型,该预置模型人人工智能的基于深度学习的神经网络模型,生成预处理对比佛乐旋律的对比旋律波形图和预处理待分析佛乐旋律的待分析旋律波形图,获取对比旋律波形图的断点和待分析旋律波形图的断点,根据对比旋律波形图的断点对预处理对比佛乐旋律进行片段分割,得到多个对比片段,根据待分析旋律波形图的断点对预处理待分析佛乐旋律进行片段分割,得到多个待分析片段,调用预置的基于十二平均律的音高编码器,分别对多个对比片段和多个待分析片段进行编码,例如:F={(60,4);(65,6);(67,8);(69,4);(67,8);……},得到多个对比旋律片段,即对比旋律片段集和多个待分析旋律片段,即待分析旋律片段集。
102、分别对对比旋律片段集和待分析旋律片段集进行节奏特征和音程特征提取,得到对比旋律特征和待分析旋律特征,根据对比旋律特征,生成对比旋律片段集中每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,并根据待分析旋律特征,生成待分析旋律片段集中每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列。
服务器获得编码后的对比旋律片段集和待分析旋律片段集,按照预置窗口对对比旋律片段集中每个对比旋律片段的编码序列进行滑动,从每个对比旋律片段的编码序列中提取对比音高特征(编码)、对比音程特征(编码)和对比时值特征(编码),按照预置窗口滑动的时序,生成对比音高特征(编码)的对比音高序列、对比音程特征(编码)的对比音程序列和对比时值特征(编码)的对比时值序列,例如:对比音高序列ε(V1)=(60,65,67,69,67,65,67,69,69,67),对比音程序列π(V1)=(5,2,2,-2,-2,2,2,0,-2),对比时值序列ρ(V1)=(4,6,8,4,8,8,3,8,8,6)。同理可得,每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列。
可选的,服务器调用预置的深度学习神经网络模型,对对比旋律片段集和待分析旋律片段集进行卷积处理、池化处理和节奏特征、音程特征提取,得到对比旋律特征和待分析旋律特征。
103、获取每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,分别与每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列之间的片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵。
服务器将每个对比旋律片段对应的对比音高序列作为行,将每个待分析旋律片段对应的被对比音高序列作为列,根据行和列生成对比音高序列和被对比音高序列之间的片段音高相似度矩阵;服务器也可通过预置的余弦距离算法或欧式距离算法,计算对比音高序列和被对比音高序列之间的相似度,根据该相似度创建生成对比音高序列和被对比音高序列之间的片段音高相似度矩阵,同理可得片段音程相似度矩阵和片段时值相似度矩阵。
104、通过预置的匹配算法、片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集。
服务器通过预置的匹配算法和预置的多种匹配模式,将片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵进行组合,得到组合矩阵,通过组合矩阵对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行字符串匹配,从而得到相似佛乐旋律片段集。其中,预置的匹配算法可为最长公共子串算法(longest commonsubsequence,LCS)、字符串匹配算法(the knuth-morris-pratt algorithm,KMP)、字符串匹配算法Sunny或字符串匹配算法Rabin-Karp中的至少一种算法。
多模式匹配为完全匹配、模进匹配、节奏匹配和旋律匹配中的至少一种,完全匹配、模进匹配、节奏匹配和旋律匹配可为按照预设的逻辑顺序进行执行,例如:先进行完全匹配,再依次进行模进匹配、节奏匹配和旋律匹配。其中,完全匹配为音高序列和时值序列都完全一样:片段音高相似度矩阵中字符串对应的字符值均为1,即对比旋律片段的音高序列和待分析旋律片段的音高序列完全一致,片段时值相似度矩阵中字符串对应的字符值均为1,即对比旋律片段的时值序列和待分析旋律片段的时值序列完全一致;模进匹配为音程序列和时值序列的匹配;节奏匹配为时值序列的比较;旋律匹配为音程序列和时值序列的匹配。
例如,以对比旋律片段A和每个对比旋律片段A对应的待分析旋律片段B为例说明,对比旋律片段A和待分析旋律片段B对应的片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵分别为矩阵C、矩阵D和矩阵E,服务器通过字符串匹配算法Sunny,判断矩阵C中各字符是否大于第一阈值,若是,则字符相同,若否,则字符不相同,将相同的字符进行标识得到字符串1,判断矩阵D各字符是否大于第二阈值,若是,则字符相同,若否,则字符不相同,将相同的字符进行标识得到字符串2,判断矩阵E各字符是否大于第三阈值,若是,则字符相同,若否,则字符不相同,将相同的字符进行标识得到字符串3,判断字符串1、字符串2和字符串3中标识的字符数量是否均大于第四阈值,若是,则为相似佛乐旋律片段,若否,则不为相似佛乐旋律片段。
本发明实施例中,通过对预处理对比佛乐旋律和预处理待分析佛乐旋律依次进行片段分割和编码,以及匹配算法、相似度矩阵的多模式匹配,结合了音高、音程和时值进行层级化的相似度匹配,可解释性地揭示了预处理对比佛乐旋律和预处理待分析佛乐旋律之间的相似片段,提高了佛乐旋律相似度分析的可解释性。
请参阅图2,本发明实施例中佛乐旋律相似度的分析方法的另一个实施例包括:
201、获取预处理对比佛乐旋律和预处理待分析佛乐旋律,并通过预置模型,分别对预处理对比佛乐旋律和预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集。
具体地,服务器获取初始对比佛乐旋律和初始待分析佛乐旋律,并分别对初始对比佛乐旋律和初始待分析佛乐旋律进行时值设置,得到候选对比佛乐旋律和候选待分析佛乐旋律;分别对候选对比佛乐旋律和候选待分析佛乐旋律依次进行休止符移除处理和音符合并处理,得到预处理对比佛乐旋律和预处理待分析佛乐旋律。
例如,服务器获得候选对比佛乐旋律和候选待分析佛乐旋律后,通过预置休止符模板,分别对候选对比佛乐旋律和候选待分析佛乐旋律中的音符进行相似度对比,将相似度大于预置的目标阈值的字符判定为休止符,对候选对比佛乐旋律和候选待分析佛乐旋律中的休止符进行删除,将候选对比佛乐旋律中的音符生成字符串,生成该字符串的二维矩阵,对该字符串的二维矩阵进行字符串匹配,得到并标识相同的字符,将标识的字符进行去重合并处理,得到预处理对比佛乐旋律,同理可得预处理待分析佛乐旋律。
具体地,服务器通过预置模型,分别对预处理对比佛乐旋律和预处理待分析佛乐旋律进行旋律分段端点检测,得到对比分段端点和待分析分段端点;根据对比分段端点,对预处理对比佛乐旋律进行分段处理,得到多个对比片段,根据待分析分段端点,对预处理待分析佛乐旋律进行分段处理,得到多个待分析片段;通过基于十二平均律的音高编码算法,对多个对比片段和多个待分析片段进行编码,得到对比旋律片段集和待分析旋律片段集。
服务器生成预处理对比佛乐旋律的佛乐旋律信号图,通过预置的基于短时能量和短时过零率的端点检测算法,对佛乐旋律信号图进行端点检测,得到对比分段端点,根据对比分段端点对预处理对比佛乐旋律进行分段处理,得到多个对比片段,通过预置的编码器和基于十二平均律音高频率表,对多个对比片段分别进行编码,得到多个对比旋律片段,即对比旋律片段集,同理可得待分析旋律片段集。
202、分别对对比旋律片段集和待分析旋律片段集进行节奏特征和音程特征提取,得到对比旋律特征和待分析旋律特征,根据对比旋律特征,生成对比旋律片段集中每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,并根据待分析旋律特征,生成待分析旋律片段集中每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列。
203、获取每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,分别与每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列之间的片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵。
步骤202-203的执行过程与上述步骤102-103的执行过程类似,在不再赘述。
204、根据片段音高相似度矩阵、片段音程相似度矩阵、片段时值相似度矩阵和预设多模式匹配规则,生成每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,得到二维矩阵集。
具体地,服务器获取片段音高相似度矩阵的音高元素值,以及片段时值相似度矩阵的时值元素值;根据预设多模式匹配规则中的完全匹配规则,判断音高元素值和时值元素值是否均为1,预设多模式匹配规则包括完全匹配规则、模进匹配规则、节奏匹配规则和旋律匹配规则;若音高元素值和时值元素值不均为1,则通过模进匹配规则,将片段音程相似度矩阵和片段时值相似度矩阵进行矩阵相加,得到模进匹配矩阵,通过旋律匹配规则,将片段音程相似度矩阵和片段时值相似度矩阵进行矩阵相加,得到旋律匹配矩阵;将模进匹配矩阵、片段时值相似度矩阵和旋律匹配矩阵进行矩阵相加,得到每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵;根据每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,获得二维矩阵集。
服务器通过将片段音高相似度矩阵和片段时值相似度矩阵展平成向量,计算向量的乘积除以模长,得到音高元素值和时值元素值,或者,服务器将片段音高相似度矩阵中每个元素的值的绝对值作为音高元素值,音高元素值的数量包括一个或一个以上,一个音高元素值对应字符串中每个字符,同理可得片段时值相似度矩阵的时值元素值;根据预设多模式匹配规则中的完全匹配规则,判断音高元素值和时值元素值是否均为1,若是,则执行结束,判定对应的对比旋律片段和待分析旋律片段为相似佛乐旋律片段;若否,则根据模进匹配规则、节奏匹配规则和旋律匹配规则,将片段音程相似度矩阵、片段时值相似度矩阵进行组合矩阵相加,得到每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵集,从而得到二维矩阵集,其中,可按照预设的权重值将模进匹配矩阵、片段时值相似度矩阵和旋律匹配矩阵进行矩阵相加。
205、通过预置的最长公共子串算法,对二维矩阵集中每个二维矩阵依次进行相似度匹配和最长公共子序列查找,得到每个二维矩阵的目标最长公共子序列。
具体地,服务器通过预置的最长公共子串算法,将二维矩阵集中每个二维矩阵的初始元素值与预设阈值进行对比分析;将大于预设阈值的初始元素值设置为1,得到目标元素值;根据目标元素值确定公共子序列的公共子序列长度,并对公共子序列长度进行排序;将排序第一的公共子序列长度对应的公共子序列确定为每个二维矩阵的目标最长公共子序列。
例如,以二维矩阵集中的公共子序列H和公共子序列G为例,公共子序列H的行H1对应为H11、H12、H13和H14,公共子序列H的行H2对应为H21、H22、H23和H24,[H11,H21]的初始元素值1(即相似度)为0.86,[H12,H22]的初始元素值2(即相似度)为0.90,[H13,H23]的初始元素值3(即相似度)为0.89,[H14,H24]的初始元素值4(即相似度)为0.68,预设预置为0.85,则将初始元素值1、初始元素值2和初始元素值3设置为1,得到目标元素值1(1)、目标元素值2(1)和目标元素值3(1),将初始元素值4设置为0,得到目标元素值4(0),公共子序列H的公共子序列长度为3;
公共子序列G的行G1对应为G11、G12、G13和G14,公共子序列G的行G2对应为G21、G22、G23和G24,[G11,G21]的初始元素值1(即相似度)为0.88,[G12,G22]的初始元素值2(即相似度)为0.76,[G13,G23]的初始元素值3(即相似度)为0.89,[G14,G24]的初始元素值4(即相似度)为0.60,预设预置为0.85,则将初始元素值1和初始元素值3设置为1,得到目标元素值1(1)和目标元素值3(1),将初始元素值2和初始元素值4设置为0,得到目标元素值2(0)和目标元素值4(0),公共子序列G的公共子序列长度为2;将排序第一的公共子序列H确定为二维矩阵的目标最长公共子序列,同理可得其他二维矩阵的目标最长公共子序列。
206、将每个二维矩阵的目标最长公共子序列对应的对比旋律片段和待分析旋律片段,确定为相似度佛乐旋律片段,得到相似佛乐旋律片段集。
服务器将每个二维矩阵的目标最长公共子序列对应的对比旋律片段和待分析旋律片段,确定为相似度佛乐旋律片段,从而得到相似佛乐旋律片段集。
具体地,服务器将每个二维矩阵的目标最长公共子序列对应的对比旋律片段和待分析旋律片段,确定为相似度佛乐旋律片段,得到相似佛乐旋律片段集之后,还将相似佛乐旋律片段集写入预置的消息队列中,得到目标消息队列;通过目标消息队列,将相似佛乐旋律片段集中的相似佛乐旋律片段发送至对应的审核端,并接收审核端发送的基于相似佛乐旋律片段的审核结果;根据审核结果,对相似佛乐旋律片段进行相似性更正。
例如,服务器将相似佛乐旋律片段集写入预置的消息队列,得到目标消息队列:相似佛乐旋律片段1,相似佛乐旋律片段2,相似佛乐旋律片段3,相似佛乐旋律片段4,相似佛乐旋律片段5,.......,通过目标消息队列将相似佛乐旋律片段1和相似佛乐旋律片段3发送审核端1,将相似佛乐旋律片段2、相似佛乐旋律片段3和相似佛乐旋律片段5发送审核端2,审核端1对相似佛乐旋律片段1和相似佛乐旋律片段3进行审核,得到审核结果1(相似佛乐旋律片段1是为相似佛乐旋律片段,相似佛乐旋律片段3不是相似佛乐旋律片段),并将审核结果1发送至服务器,审核端2对相似佛乐旋律片段2、相似佛乐旋律片段3和相似佛乐旋律片段5进行审核,得到审核结果2(相似佛乐旋律片段2、相似佛乐旋律片段3和相似佛乐旋律片段5均为相似佛乐旋律片段),并将审核结果2发送至服务器,服务器根据审核结果1和审核结果2对相似佛乐旋律片段的相似性进行更正,以提高佛乐旋律相似度分析的准确性,进而提高了佛乐旋律相似度分析的可解释性;服务器还可根据审核结果1和审核结果2统计相似佛乐旋律片段的分析准确率,根据分析准确率和预置的优化算法,对预置模型的权重值和/或模型参数进行调整,提高了预置模型的精度,其中,审核端的审核包括人工审核和/或机器审核。
本发明实施例中,通过对预处理对比佛乐旋律和预处理待分析佛乐旋律依次进行片段分割和编码,以及匹配算法、相似度矩阵的多模式匹配,结合了音高、音程和时值进行层级化的相似度匹配,可解释性地揭示了预处理对比佛乐旋律和预处理待分析佛乐旋律之间的相似片段,提高了佛乐旋律相似度分析的可解释性。
上面对本发明实施例中佛乐旋律相似度的分析方法进行了描述,下面对本发明实施例中佛乐旋律相似度的分析装置进行描述,请参阅图3,本发明实施例中佛乐旋律相似度的分析装置一个实施例包括:
分段编码模块301,用于获取预处理对比佛乐旋律和预处理待分析佛乐旋律,并通过预置模型,分别对预处理对比佛乐旋律和预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集;
生成模块302,用于分别对对比旋律片段集和待分析旋律片段集进行节奏特征和音程特征提取,得到对比旋律特征和待分析旋律特征,根据对比旋律特征,生成对比旋律片段集中每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,并根据待分析旋律特征,生成待分析旋律片段集中每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列;
获取模块303,用于获取每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,分别与每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列之间的片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵;
匹配模块304,用于通过预置的匹配算法、片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集。
上述佛乐旋律相似度的分析装置中各个模块的功能实现与上述佛乐旋律相似度的分析方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明实施例中,通过对预处理对比佛乐旋律和预处理待分析佛乐旋律依次进行片段分割和编码,以及匹配算法、相似度矩阵的多模式匹配,结合了音高、音程和时值进行层级化的相似度匹配,可解释性地揭示了预处理对比佛乐旋律和预处理待分析佛乐旋律之间的相似片段,提高了佛乐旋律相似度分析的可解释性。
请参阅图4,本发明实施例中佛乐旋律相似度的分析装置的另一个实施例包括:
分段编码模块301,用于获取预处理对比佛乐旋律和预处理待分析佛乐旋律,并通过预置模型,分别对预处理对比佛乐旋律和预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集;
生成模块302,用于分别对对比旋律片段集和待分析旋律片段集进行节奏特征和音程特征提取,得到对比旋律特征和待分析旋律特征,根据对比旋律特征,生成对比旋律片段集中每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,并根据待分析旋律特征,生成待分析旋律片段集中每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列;
获取模块303,用于获取每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,分别与每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列之间的片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵;
匹配模块304,用于通过预置的匹配算法、片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集;
其中,匹配模块304具体包括:
生成单元3041,用于根据片段音高相似度矩阵、片段音程相似度矩阵、片段时值相似度矩阵和预设多模式匹配规则,生成每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,得到二维矩阵集;
匹配查找单元3042,用于通过预置的最长公共子串算法,对二维矩阵集中每个二维矩阵依次进行相似度匹配和最长公共子序列查找,得到每个二维矩阵的目标最长公共子序列;
确定单元3043,用于将每个二维矩阵的目标最长公共子序列对应的对比旋律片段和待分析旋律片段,确定为相似度佛乐旋律片段,得到相似佛乐旋律片段集。
可选的,生成单元3041还可以具体用于:
获取片段音高相似度矩阵的音高元素值,以及片段时值相似度矩阵的时值元素值;
根据预设多模式匹配规则中的完全匹配规则,判断音高元素值和时值元素值是否均为1,预设多模式匹配规则包括完全匹配规则、模进匹配规则、节奏匹配规则和旋律匹配规则;
若音高元素值和时值元素值不均为1,则通过模进匹配规则,将片段音程相似度矩阵和片段时值相似度矩阵进行矩阵相加,得到模进匹配矩阵,通过旋律匹配规则,将片段音程相似度矩阵和片段时值相似度矩阵进行矩阵相加,得到旋律匹配矩阵;
将模进匹配矩阵、片段时值相似度矩阵和旋律匹配矩阵进行矩阵相加,得到每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵;
根据每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,获得二维矩阵集。
可选的,匹配查找单元3042还可以具体用于:
通过预置的最长公共子串算法,将二维矩阵集中每个二维矩阵的初始元素值与预设阈值进行对比分析;
将大于预设阈值的初始元素值设置为1,得到目标元素值;
根据目标元素值确定公共子序列的公共子序列长度,并对公共子序列长度进行排序;
将排序第一的公共子序列长度对应的公共子序列确定为每个二维矩阵的目标最长公共子序列。
可选的,分段编码模块301还可以具体用于:
通过预置模型,分别对预处理对比佛乐旋律和预处理待分析佛乐旋律进行旋律分段端点检测,得到对比分段端点和待分析分段端点;
根据对比分段端点,对预处理对比佛乐旋律进行分段处理,得到多个对比片段,根据待分析分段端点,对预处理待分析佛乐旋律进行分段处理,得到多个待分析片段;
通过基于十二平均律的音高编码算法,对多个对比片段和多个待分析片段进行编码,得到对比旋律片段集和待分析旋律片段集。
可选的,分段编码模块301还可以具体用于:
获取初始对比佛乐旋律和初始待分析佛乐旋律,并分别对初始对比佛乐旋律和初始待分析佛乐旋律进行时值设置,得到候选对比佛乐旋律和候选待分析佛乐旋律;
分别对候选对比佛乐旋律和候选待分析佛乐旋律依次进行休止符移除处理和音符合并处理,得到预处理对比佛乐旋律和预处理待分析佛乐旋律。
可选的,佛乐旋律相似度的分析装置,还包括:
写入模块305,用于将相似佛乐旋律片段集写入预置的消息队列中,得到目标消息队列;
发送接收模块306,用于通过目标消息队列,将相似佛乐旋律片段集中的相似佛乐旋律片段发送至对应的审核端,并接收审核端发送的基于相似佛乐旋律片段的审核结果;
更正模块307,用于根据审核结果,对相似佛乐旋律片段进行相似性更正。
上述佛乐旋律相似度的分析装置中各模块和各单元的功能实现与上述佛乐旋律相似度的分析方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明实施例中,通过对预处理对比佛乐旋律和预处理待分析佛乐旋律依次进行片段分割和编码,以及匹配算法、相似度矩阵的多模式匹配,结合了音高、音程和时值进行层级化的相似度匹配,可解释性地揭示了预处理对比佛乐旋律和预处理待分析佛乐旋律之间的相似片段,提高了佛乐旋律相似度分析的可解释性。
上面图3和图4从模块化功能实体的角度对本发明实施例中的佛乐旋律相似度的分析装置进行详细描述,下面从硬件处理的角度对本发明实施例中佛乐旋律相似度的分析设备进行详细描述。
图5是本发明实施例提供的一种佛乐旋律相似度的分析设备的结构示意图,该佛乐旋律相似度的分析设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对佛乐旋律相似度的分析设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在佛乐旋律相似度的分析设备500上执行存储介质530中的一系列指令操作。
佛乐旋律相似度的分析设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的佛乐旋律相似度的分析设备结构并不构成对佛乐旋律相似度的分析设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行佛乐旋律相似度的分析方法的步骤。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种佛乐旋律相似度的分析方法,其特征在于,所述佛乐旋律相似度的分析方法包括:
获取预处理对比佛乐旋律和预处理待分析佛乐旋律,并通过预置模型,分别对所述预处理对比佛乐旋律和所述预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集;
分别对所述对比旋律片段集和所述待分析旋律片段集进行节奏特征和音程特征提取,得到对比旋律特征和待分析旋律特征,根据所述对比旋律特征,生成所述对比旋律片段集中每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,并根据所述待分析旋律特征,生成所述待分析旋律片段集中每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列;
获取每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,分别与每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列之间的片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵;
通过预置的匹配算法、所述片段音高相似度矩阵、所述片段音程相似度矩阵和所述片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集。
2.根据权利要求1所述的佛乐旋律相似度的分析方法,其特征在于,所述通过预置的匹配算法、所述片段音高相似度矩阵、所述片段音程相似度矩阵和所述片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集,包括:
根据所述片段音高相似度矩阵、所述片段音程相似度矩阵、所述片段时值相似度矩阵和预设多模式匹配规则,生成每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,得到二维矩阵集;
通过预置的最长公共子串算法,对所述二维矩阵集中每个二维矩阵依次进行相似度匹配和最长公共子序列查找,得到每个二维矩阵的目标最长公共子序列;
将每个二维矩阵的目标最长公共子序列对应的对比旋律片段和待分析旋律片段,确定为相似度佛乐旋律片段,得到相似佛乐旋律片段集。
3.根据权利要求2所述的佛乐旋律相似度的分析方法,其特征在于,所述根据所述片段音高相似度矩阵、所述片段音程相似度矩阵、所述片段时值相似度矩阵和预设多模式匹配规则,生成每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,得到二维矩阵集,包括:
获取所述片段音高相似度矩阵的音高元素值,以及所述片段时值相似度矩阵的时值元素值;
根据预设多模式匹配规则中的完全匹配规则,判断所述音高元素值和所述时值元素值是否均为1,所述预设多模式匹配规则包括完全匹配规则、模进匹配规则、节奏匹配规则和旋律匹配规则;
若所述音高元素值和所述时值元素值不均为1,则通过所述模进匹配规则,将所述片段音程相似度矩阵和所述片段时值相似度矩阵进行矩阵相加,得到模进匹配矩阵,通过所述旋律匹配规则,将所述片段音程相似度矩阵和所述片段时值相似度矩阵进行矩阵相加,得到旋律匹配矩阵;
将所述模进匹配矩阵、所述片段时值相似度矩阵和所述旋律匹配矩阵进行矩阵相加,得到每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵;
根据每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段之间的二维矩阵,获得二维矩阵集。
4.根据权利要求2所述的佛乐旋律相似度的分析方法,其特征在于,所述通过预置的最长公共子串算法,对所述二维矩阵集中每个二维矩阵依次进行相似度匹配和最长公共子序列查找,得到每个二维矩阵的目标最长公共子序列,包括:
通过预置的最长公共子串算法,将所述二维矩阵集中每个二维矩阵的初始元素值与预设阈值进行对比分析;
将大于所述预设阈值的初始元素值设置为1,得到目标元素值;
根据所述目标元素值确定公共子序列的公共子序列长度,并对所述公共子序列长度进行排序;
将排序第一的公共子序列长度对应的公共子序列确定为每个二维矩阵的目标最长公共子序列。
5.根据权利要求1所述的佛乐旋律相似度的分析方法,其特征在于,所述通过预置模型,分别对所述预处理对比佛乐旋律和所述预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集,包括:
通过预置模型,分别对所述预处理对比佛乐旋律和所述预处理待分析佛乐旋律进行旋律分段端点检测,得到对比分段端点和待分析分段端点;
根据所述对比分段端点,对所述预处理对比佛乐旋律进行分段处理,得到多个对比片段,根据所述待分析分段端点,对所述预处理待分析佛乐旋律进行分段处理,得到多个待分析片段;
通过基于十二平均律的音高编码算法,对所述多个对比片段和所述多个待分析片段进行编码,得到对比旋律片段集和待分析旋律片段集。
6.根据权利要求1所述的佛乐旋律相似度的分析方法,其特征在于,所述获取预处理对比佛乐旋律和预处理待分析佛乐旋律,包括:
获取初始对比佛乐旋律和初始待分析佛乐旋律,并分别对所述初始对比佛乐旋律和所述初始待分析佛乐旋律进行时值设置,得到候选对比佛乐旋律和候选待分析佛乐旋律;
分别对所述候选对比佛乐旋律和所述候选待分析佛乐旋律依次进行休止符移除处理和音符合并处理,得到预处理对比佛乐旋律和预处理待分析佛乐旋律。
7.根据权利要求1-6中任一项所述的佛乐旋律相似度的分析方法,其特征在于,所述通过预置的匹配算法、所述片段音高相似度矩阵、所述片段音程相似度矩阵和所述片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集之后,还包括:
将所述相似佛乐旋律片段集写入预置的消息队列中,得到目标消息队列;
通过所述目标消息队列,将所述相似佛乐旋律片段集中的相似佛乐旋律片段发送至对应的审核端,并接收所述审核端发送的基于所述相似佛乐旋律片段的审核结果;
根据所述审核结果,对所述相似佛乐旋律片段进行相似性更正。
8.一种佛乐旋律相似度的分析装置,其特征在于,所述佛乐旋律相似度的分析装置包括:
分段编码模块,用于获取预处理对比佛乐旋律和预处理待分析佛乐旋律,并通过预置模型,分别对所述预处理对比佛乐旋律和所述预处理待分析佛乐旋律依次进行片段分割和编码,得到对比旋律片段集和待分析旋律片段集;
生成模块,用于分别对所述对比旋律片段集和所述待分析旋律片段集进行节奏特征和音程特征提取,得到对比旋律特征和待分析旋律特征,根据所述对比旋律特征,生成所述对比旋律片段集中每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,并根据所述待分析旋律特征,生成所述待分析旋律片段集中每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列;
获取模块,用于获取每个对比旋律片段对应的对比音高序列、对比音程序列和对比时值序列,分别与每个待分析旋律片段对应的被对比音高序列、被对比音程序列和被对比时值序列之间的片段音高相似度矩阵、片段音程相似度矩阵和片段时值相似度矩阵;
匹配模块,用于通过预置的匹配算法、所述片段音高相似度矩阵、所述片段音程相似度矩阵和所述片段时值相似度矩阵,对每个对比旋律片段和每个对比旋律片段对应的待分析旋律片段进行多模式匹配,得到相似佛乐旋律片段集。
9.一种佛乐旋律相似度的分析设备,其特征在于,所述佛乐旋律相似度的分析设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述佛乐旋律相似度的分析设备执行如权利要求1-7中任意一项所述的佛乐旋律相似度的分析方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述佛乐旋律相似度的分析方法。
CN202011169283.4A 2020-10-28 2020-10-28 佛乐旋律相似度的分析方法、装置、设备及存储介质 Active CN112331170B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011169283.4A CN112331170B (zh) 2020-10-28 2020-10-28 佛乐旋律相似度的分析方法、装置、设备及存储介质
PCT/CN2020/131655 WO2021203713A1 (zh) 2020-10-28 2020-11-26 佛乐旋律相似度的分析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011169283.4A CN112331170B (zh) 2020-10-28 2020-10-28 佛乐旋律相似度的分析方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112331170A true CN112331170A (zh) 2021-02-05
CN112331170B CN112331170B (zh) 2023-09-15

Family

ID=74296938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011169283.4A Active CN112331170B (zh) 2020-10-28 2020-10-28 佛乐旋律相似度的分析方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN112331170B (zh)
WO (1) WO2021203713A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112951239A (zh) * 2021-03-24 2021-06-11 平安科技(深圳)有限公司 基于注意力模型的佛乐生成方法、装置、设备及存储介质
CN113077770A (zh) * 2021-03-22 2021-07-06 平安科技(深圳)有限公司 佛乐生成方法、装置、设备及存储介质
CN113096619A (zh) * 2021-03-24 2021-07-09 平安科技(深圳)有限公司 音乐相似度计算方法、装置、设备及存储介质
CN113744763A (zh) * 2021-08-18 2021-12-03 北京达佳互联信息技术有限公司 确定相似旋律的方法和装置
CN115270165A (zh) * 2022-09-28 2022-11-01 南通佳茂霖智能科技有限公司 一种工程勘测的信息管理方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1737796A (zh) * 2005-09-08 2006-02-22 上海交通大学 数字音乐旋律的跨越式高速匹配方法
CN1752970A (zh) * 2005-09-08 2006-03-29 上海交通大学 数字音乐旋律的跨越式高速匹配装置
US20080300702A1 (en) * 2007-05-29 2008-12-04 Universitat Pompeu Fabra Music similarity systems and methods using descriptors
CN101552000A (zh) * 2009-02-25 2009-10-07 北京派瑞根科技开发有限公司 音乐相似性处理方法
CN102521281A (zh) * 2011-11-25 2012-06-27 北京师范大学 一种基于最长匹配子序列算法的哼唱计算机音乐检索方法
CN104978962A (zh) * 2014-04-14 2015-10-14 安徽科大讯飞信息科技股份有限公司 哼唱检索方法及系统
CN106233245A (zh) * 2013-10-30 2016-12-14 音乐策划公司 用于增强音频、使音频输入相符于音乐音调以及创作用于音频输入的和声音轨的系统和方法
JP2019020528A (ja) * 2017-07-13 2019-02-07 株式会社メガチップス 電子メロディ特定装置、プログラム、及び電子メロディ特定方法
CN109493879A (zh) * 2018-12-24 2019-03-19 成都嗨翻屋科技有限公司 音乐旋律节奏分析提取方法及装置
CN111613198A (zh) * 2020-05-12 2020-09-01 浙江大学 一种midi的节奏型识别方法及应用
CN111681631A (zh) * 2020-04-30 2020-09-18 平安科技(深圳)有限公司 搭配和声的方法、装置、电子设备及计算机可读介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1737796A (zh) * 2005-09-08 2006-02-22 上海交通大学 数字音乐旋律的跨越式高速匹配方法
CN1752970A (zh) * 2005-09-08 2006-03-29 上海交通大学 数字音乐旋律的跨越式高速匹配装置
US20080300702A1 (en) * 2007-05-29 2008-12-04 Universitat Pompeu Fabra Music similarity systems and methods using descriptors
CN101552000A (zh) * 2009-02-25 2009-10-07 北京派瑞根科技开发有限公司 音乐相似性处理方法
CN102521281A (zh) * 2011-11-25 2012-06-27 北京师范大学 一种基于最长匹配子序列算法的哼唱计算机音乐检索方法
CN106233245A (zh) * 2013-10-30 2016-12-14 音乐策划公司 用于增强音频、使音频输入相符于音乐音调以及创作用于音频输入的和声音轨的系统和方法
CN104978962A (zh) * 2014-04-14 2015-10-14 安徽科大讯飞信息科技股份有限公司 哼唱检索方法及系统
JP2019020528A (ja) * 2017-07-13 2019-02-07 株式会社メガチップス 電子メロディ特定装置、プログラム、及び電子メロディ特定方法
CN109493879A (zh) * 2018-12-24 2019-03-19 成都嗨翻屋科技有限公司 音乐旋律节奏分析提取方法及装置
CN111681631A (zh) * 2020-04-30 2020-09-18 平安科技(深圳)有限公司 搭配和声的方法、装置、电子设备及计算机可读介质
CN111613198A (zh) * 2020-05-12 2020-09-01 浙江大学 一种midi的节奏型识别方法及应用

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077770A (zh) * 2021-03-22 2021-07-06 平安科技(深圳)有限公司 佛乐生成方法、装置、设备及存储介质
CN113077770B (zh) * 2021-03-22 2024-03-05 平安科技(深圳)有限公司 佛乐生成方法、装置、设备及存储介质
CN112951239A (zh) * 2021-03-24 2021-06-11 平安科技(深圳)有限公司 基于注意力模型的佛乐生成方法、装置、设备及存储介质
CN113096619A (zh) * 2021-03-24 2021-07-09 平安科技(深圳)有限公司 音乐相似度计算方法、装置、设备及存储介质
CN112951239B (zh) * 2021-03-24 2023-07-28 平安科技(深圳)有限公司 基于注意力模型的佛乐生成方法、装置、设备及存储介质
CN113096619B (zh) * 2021-03-24 2024-01-19 平安科技(深圳)有限公司 音乐相似度计算方法、装置、设备及存储介质
CN113744763A (zh) * 2021-08-18 2021-12-03 北京达佳互联信息技术有限公司 确定相似旋律的方法和装置
CN113744763B (zh) * 2021-08-18 2024-02-23 北京达佳互联信息技术有限公司 确定相似旋律的方法和装置
CN115270165A (zh) * 2022-09-28 2022-11-01 南通佳茂霖智能科技有限公司 一种工程勘测的信息管理方法
CN115270165B (zh) * 2022-09-28 2022-12-13 南通佳茂霖智能科技有限公司 一种工程勘测的信息管理方法

Also Published As

Publication number Publication date
WO2021203713A1 (zh) 2021-10-14
CN112331170B (zh) 2023-09-15

Similar Documents

Publication Publication Date Title
CN112331170A (zh) 佛乐旋律相似度的分析方法、装置、设备及存储介质
JP7242912B2 (ja) オリジナル音声の声紋を認識する方法、装置、設備および記憶媒体
JP6587625B2 (ja) オーディオ指紋探索の最適化のためのシステムおよび方法
CN112639831A (zh) 互信息对抗自动编码器
Román et al. An End-to-end Framework for Audio-to-Score Music Transcription on Monophonic Excerpts.
JP4912646B2 (ja) 遺伝子の転写物マッピング方法及びシステム
CN113901797A (zh) 文本纠错方法、装置、设备及存储介质
Kumar et al. Fast and memory efficient approach for mapping NGS reads to a reference genome
US20230123941A1 (en) Multiscale Quantization for Fast Similarity Search
Van Balen et al. Cognition-inspired descriptors for scalable cover song retrieval
Coutinho et al. Text classification using compression-based dissimilarity measures
CN113450828A (zh) 音乐流派的识别方法、装置、设备及存储介质
CN115394383A (zh) 磷光材料的发光波长预测方法及系统
CN115983322A (zh) 基于多粒度推理的视觉自注意力模型的压缩方法
CN110347827B (zh) 面向异构文本运维数据的事件提取方法
CN113421589B (zh) 歌手识别方法、装置、设备及存储介质
US11244742B2 (en) System for generating genomics data, with adjusted quality scores, and device, method, and software product for use therein
CN113096621B (zh) 基于特定风格的音乐生成方法、装置、设备及存储介质
CN112967734B (zh) 基于多声部的音乐数据识别方法、装置、设备及存储介质
Karystinaios et al. Roman Numeral Analysis with Graph Neural Networks: Onset-wise Predictions from Note-wise Features
CN110162629B (zh) 一种基于多基模型框架的文本分类方法
CN109299260B (zh) 数据分类方法、装置以及计算机可读存储介质
KR20210126030A (ko) 생물학적 서열분석
CN113449510B (zh) 文本识别方法、装置、设备及存储介质
CN113066457B (zh) 梵叹音乐生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant