CN115273866A - 一种音频转化方法、装置、及存储介质 - Google Patents

一种音频转化方法、装置、及存储介质 Download PDF

Info

Publication number
CN115273866A
CN115273866A CN202210716965.5A CN202210716965A CN115273866A CN 115273866 A CN115273866 A CN 115273866A CN 202210716965 A CN202210716965 A CN 202210716965A CN 115273866 A CN115273866 A CN 115273866A
Authority
CN
China
Prior art keywords
module
algorithm
converted
music
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210716965.5A
Other languages
English (en)
Other versions
CN115273866B (zh
Inventor
刘虹
吕晓宾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianshui Normal University
Original Assignee
Tianshui Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianshui Normal University filed Critical Tianshui Normal University
Priority to CN202210716965.5A priority Critical patent/CN115273866B/zh
Publication of CN115273866A publication Critical patent/CN115273866A/zh
Application granted granted Critical
Publication of CN115273866B publication Critical patent/CN115273866B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种音频转化方法、装置、及存储介质,用于音频转化,包括:编解码模块、检查模块、生成模块、识别模块、控制模块、接收模块;控制模块,用于对编解码模块、生成模块、识别模块、接收模块的工作进行运行控制;接收模块,接收待转化音乐文件;识别模块,用于对待转化音乐文件的格式和待转化音乐文件包含的音乐信息进行识别;编解码模块基于预设编码协议对待转化音乐文件进行编解码;生成模块,基于编解码模块的编解码结果生成目标音乐文件。本发明减少计算处理步骤,基于目标检测原理对音频进行转化,在保证工作效率的同时,准确识别音乐文件格式,并提高了音乐文件格式同步的准确性。

Description

一种音频转化方法、装置、及存储介质
技术领域
本发明涉及计算机技术领域,特别涉及一种音频转化方法、装置、及存储介质。
背景技术
随着互联网的发展,衍生出了越来越多的新兴社交行业,声音社交就是其中的一种,对于此类社交通常采用抖音APP、网易云APP等各类声音社交软件,提供音频播放、音频转化功能。但是在此类软件中使用的音频转化器,是一种对音频进行编解码,并根据数字音频编码规范保存为新音频格式,但是这种转化是一种有损压缩,本领域技术人员一直在对如何减少损耗量进行不断的改进;
基于此,本领域技术人员亟需提供一种新的音频转化器,进一步改进现有技术中音频转化器对音频转化时的损耗量。
发明内容
本发明的目的在于,提供一种音频转化方法、装置、及存储介质,解决现有技术中音频转化器对音频转化时的损耗量的问题。
为了实现上述目的,本发明提供了如下技术方案:
一种音频转化器,包括:编解码模块、检查模块、生成模块、识别模块、控制模块、接收模块;
所述控制模块,用于对所述编解码模块、所述生成模块、识别模块、所述接收模块的工作进行运行控制;
所述接收模块,接收待转化音乐文件;
所述识别模块,用于对所述待转化音乐文件的格式和所述待转化音乐文件包含的音乐信息进行识别;
所述编解码模块基于预设编码协议对所述待转化音乐文件进行编解码;
所述生成模块基于所述编解码模块的编解码结果生成目标音乐文件。
优选的,还包括:检查模块;所述检查模块用于对识别模块的识别结果、生成模块生成的文件格式进行检查确认。
优选的,所述预测编码协议中包括:定位算法、ROI算法、PCM算法、快速排序算法;
所述定位算法与所述ROI算法,采用图像目标检测原理对所述音乐信息进行时间点检测,所述快速排序算法基于所述时间点检测结果对所述音乐信息按预设时间条件进行快速排序;
所述PCM算法对所快速排序结果进行解码处理,得到目标PCM数据。
一种音频转化方法,包括以下步骤:
获取待转化音乐文件;
识别待转化音乐文件的格式和所述待转化文件包含的音乐信息;
基于预设编码协议对所述待转化音乐文件进行编解码,获得目标PCM数据;
基于所述目标PCM数据生成所述目标音乐文件。
优选的,所述预测编码协议中包括:定位算法、ROI算法、PCM算法、快速排序算法;
所述定位算法与所述ROI算法,采用图像目标检测原理对所述音乐信息进行时间点检测,所述快速排序算法基于所述时间点检测结果对所述音乐信息按预设时间条件进行快速排序;
所述PCM算法对所快速排序结果进行解码处理,得到目标PCM数据。
优选的,所述定位算法与所述ROI算法,采用图像目标检测原理对所述音乐信息进行时间点检测,包括以下步骤:
获取所述音乐信息的频谱图;
采用定位算法和所述ROI算法确定所述频谱图中的突变段;
根据所述突变段确定突变起始时间点;
所述突变起始时间点为所述时间点检测结果。
优选的,所述音乐信息包括:乐器信息、声部信息、音符信息、谱表信息、语言类型信息。
优选的,识别所述待转化音乐文件的格式包括:
获取所述待转化音乐文件的头特征;
基于头特征对所述待转化音乐文件的文件类型进行判断,获得文件类型判断结果;
根据所述文件类型判断结果获取所述待转化文件的文本格式识别特征;
基于所述文本格式识别特征确定待转化音乐文件的实际文本格式。
优选的,所述文件类型包括:文本文件和非文本文件。
一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述的一种音频转化方法。
经由上述的内容可知与现有技术相比,本发明的有益效果在于:
减少计算处理步骤,基于目标检测原理对音频进行转化,在保证工作效率的同时,准确识别音乐文件格式,并提高了音乐文件格式同步的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明装置框图;
图2为本发明方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例公开了一种音频转化器,包括:编解码模块、检查模块、生成模块、识别模块、控制模块、接收模块;
具体的:
控制模块,用于对编解码模块、生成模块、识别模块、接收模块的工作进行运行控制;
接收模块,接收待转化音乐文件;
识别模块,用于对待转化音乐文件的格式和待转化音乐文件包含的音乐信息进行识别;
编解码模块基于预设编码协议对待转化音乐文件进行编解码;
生成模块,基于编解码模块的编解码结果生成目标音乐文件。
其中,在本实施例中还包括:检查模块;检查模块用于对识别模块的识别结果、生成模块生成的文件格式进行检查确认。
预测编码协议中包括:定位算法、ROI算法、PCM算法、快速排序算法;
定位算法与ROI算法,采用图像目标检测原理对音乐信息进行时间点检测,快速排序算法基于时间点检测结果对音乐信息按预设时间条件进行快速排序;
PCM算法对所快速排序结果进行解码处理,得到目标PCM数据。音乐播放器基于获取的目标PCM数据进行音频播放。
实施例2:
本实施例公开了一种音频转化方法,包括以下步骤:
获取待转化音乐文件;
识别待转化音乐文件的格式和待转化文件包含的音乐信息;
基于预设编码协议对待转化音乐文件进行编解码,获得目标PCM数据;
基于目标PCM数据生成目标音乐文件。
具体的:
预测编码协议中包括:定位算法、ROI算法、PCM算法、快速排序算法;
定位算法与ROI算法,采用图像目标检测原理对音乐信息进行时间点检测,快速排序算法基于时间点检测结果对音乐信息按预设时间条件进行快速排序;
PCM算法对所快速排序结果进行解码处理,得到目标PCM数据。
其中,定位算法与ROI算法,采用图像目标检测原理对音乐信息进行时间点检测,包括以下步骤:
获取音乐信息的频谱图;
采用定位算法和ROI算法确定频谱图中的突变段;
根据突变段确定突变起始时间点;
突变起始时间点为时间点检测结果。
在本实施例中音乐信息包括:乐器信息、声部信息、音符信息、谱表信息、语言类型信息。具体在本实施例中还能具体获取到音符信息中的具体信息,即每个音符的序号、时间点、具体数值、持续时间。
其中,识别待转化音乐文件的格式包括:
获取待转化音乐文件的头特征;
基于头特征对待转化音乐文件的文件类型进行判断,获得文件类型判断结果;其中,文件类型包括:文本文件和非文本文件。
根据文件类型判断结果获取待转化文件的文本格式识别特征;
基于文本格式识别特征确定待转化音乐文件的实际文本格式。
另外,基于音乐信息中具体包含的音符已被识别,为提高同步问题和表示复杂的乐谱时,根据实际效果和识别结果,将音乐信息按音符时间点进行排序。
对于实施例公开的装置而言,由于其在实施例公开的内容相对应,所以描述的比较简单,相关之处参见部分说明即可。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种音频转化器,其特征在于,包括:编解码模块、检查模块、生成模块、识别模块、控制模块、接收模块;
所述控制模块,用于对所述编解码模块、所述生成模块、识别模块、所述接收模块的工作进行运行控制;
所述接收模块,接收待转化音乐文件;
所述识别模块,用于对所述待转化音乐文件的格式和所述待转化音乐文件包含的音乐信息进行识别;
所述编解码模块基于预设编码协议对所述待转化音乐文件进行编解码;
所述生成模块基于所述编解码模块的编解码结果生成目标音乐文件。
2.根据权利要求1所述的一种音频转化器,其特征在于,还包括:检查模块;所述检查模块用于对识别模块的识别结果、生成模块生成的文件格式进行检查确认。
3.根据权利要求1所述的一种音频转化器,其特征在于,所述预测编码协议中包括:定位算法、ROI算法、PCM算法、快速排序算法;
所述定位算法与所述ROI算法,采用图像目标检测原理对所述音乐信息进行时间点检测,所述快速排序算法基于所述时间点检测结果对所述音乐信息按预设时间条件进行快速排序;
所述PCM算法对所快速排序结果进行解码处理,得到目标PCM数据。
4.一种音频转化方法,其特征在于,包括以下步骤:
获取待转化音乐文件;
识别待转化音乐文件的格式和所述待转化文件包含的音乐信息;
基于预设编码协议对所述待转化音乐文件进行编解码,获得目标PCM数据;
基于所述目标PCM数据生成所述目标音乐文件。
5.根据权利要求4所述的一种音频转化方法,其特征在于,所述预测编码协议中包括:定位算法、ROI算法、PCM算法、快速排序算法;
所述定位算法与所述ROI算法,采用图像目标检测原理对所述音乐信息进行时间点检测,所述快速排序算法基于所述时间点检测结果对所述音乐信息按预设时间条件进行快速排序;
所述PCM算法对所快速排序结果进行解码处理,得到目标PCM数据。
6.根据权利要求5所述的一种音频转化方法,其特征在于,所述定位算法与所述ROI算法,采用图像目标检测原理对所述音乐信息进行时间点检测,包括以下步骤:
获取所述音乐信息的频谱图;
采用定位算法和所述ROI算法确定所述频谱图中的突变段;
根据所述突变段确定突变起始时间点;
所述突变起始时间点为所述时间点检测结果。
7.根据权利要求4所述的一种音频转化方法,其特征在于,所述音乐信息包括:乐器信息、声部信息、音符信息、谱表信息、语言类型信息。
8.根据权利要求4所述的一种音频转化方法,其特征在于,识别所述待转化音乐文件的格式包括:
获取所述待转化音乐文件的头特征;
基于头特征对所述待转化音乐文件的文件类型进行判断,获得文件类型判断结果;
根据所述文件类型判断结果获取所述待转化文件的文本格式识别特征;
基于所述文本格式识别特征确定待转化音乐文件的实际文本格式。
9.根据权利要求8所述的一种音频转化方法,其特征在于,所述文件类型包括:文本文件和非文本文件。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述权利要求4-9任一项所述的一种音频转化方法。
CN202210716965.5A 2022-06-23 2022-06-23 一种音频转化方法、装置、及存储介质 Active CN115273866B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210716965.5A CN115273866B (zh) 2022-06-23 2022-06-23 一种音频转化方法、装置、及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210716965.5A CN115273866B (zh) 2022-06-23 2022-06-23 一种音频转化方法、装置、及存储介质

Publications (2)

Publication Number Publication Date
CN115273866A true CN115273866A (zh) 2022-11-01
CN115273866B CN115273866B (zh) 2024-05-10

Family

ID=83761946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210716965.5A Active CN115273866B (zh) 2022-06-23 2022-06-23 一种音频转化方法、装置、及存储介质

Country Status (1)

Country Link
CN (1) CN115273866B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010008954A (ko) * 1999-07-06 2001-02-05 구자홍 음악 파일 생성 및 재생기
CN102291205A (zh) * 2011-09-19 2011-12-21 朱建 一种基于多频声波的高可靠性数据传输方法及装置
US20160071429A1 (en) * 2014-09-05 2016-03-10 Simon Gebauer Method of Presenting a Piece of Music to a User of an Electronic Device
CN105632542A (zh) * 2015-12-23 2016-06-01 小米科技有限责任公司 音频播放方法及装置
CN105976825A (zh) * 2016-06-15 2016-09-28 贵阳朗玛信息技术股份有限公司 音乐分享装置及方法
CN109785868A (zh) * 2019-01-09 2019-05-21 上海音乐学院 音乐文件转化与播放方法、装置、计算机设备及存储介质
CN110246472A (zh) * 2019-05-09 2019-09-17 平安科技(深圳)有限公司 一种音乐风格的转换方法、装置及终端设备
US20210050028A1 (en) * 2018-01-26 2021-02-18 Lg Electronics Inc. Method for transmitting and receiving audio data and apparatus therefor
CN113196795A (zh) * 2018-12-21 2021-07-30 高通股份有限公司 与设备外部的所选目标对象相关联的声音的呈现
US20220172638A1 (en) * 2020-12-02 2022-06-02 Joytunes Ltd. Method and apparatus for an adaptive and interactive teaching of playing a musical instrument

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010008954A (ko) * 1999-07-06 2001-02-05 구자홍 음악 파일 생성 및 재생기
CN102291205A (zh) * 2011-09-19 2011-12-21 朱建 一种基于多频声波的高可靠性数据传输方法及装置
US20160071429A1 (en) * 2014-09-05 2016-03-10 Simon Gebauer Method of Presenting a Piece of Music to a User of an Electronic Device
CN105632542A (zh) * 2015-12-23 2016-06-01 小米科技有限责任公司 音频播放方法及装置
CN105976825A (zh) * 2016-06-15 2016-09-28 贵阳朗玛信息技术股份有限公司 音乐分享装置及方法
US20210050028A1 (en) * 2018-01-26 2021-02-18 Lg Electronics Inc. Method for transmitting and receiving audio data and apparatus therefor
CN113196795A (zh) * 2018-12-21 2021-07-30 高通股份有限公司 与设备外部的所选目标对象相关联的声音的呈现
CN109785868A (zh) * 2019-01-09 2019-05-21 上海音乐学院 音乐文件转化与播放方法、装置、计算机设备及存储介质
CN110246472A (zh) * 2019-05-09 2019-09-17 平安科技(深圳)有限公司 一种音乐风格的转换方法、装置及终端设备
US20220172638A1 (en) * 2020-12-02 2022-06-02 Joytunes Ltd. Method and apparatus for an adaptive and interactive teaching of playing a musical instrument

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
林静;贺前华;李新超;杨继臣;: "基于高频加权CQT谱的音符起始点检测", 计算机工程与设计, no. 09, 16 September 2015 (2015-09-16) *

Also Published As

Publication number Publication date
CN115273866B (zh) 2024-05-10

Similar Documents

Publication Publication Date Title
WO2020224119A1 (zh) 用于语音识别的音频语料筛选方法、装置及计算机设备
CN112233653B (zh) 多方言口音普通话语音识别模型训练方法、装置及设备
US10991366B2 (en) Method of processing dialogue query priority based on dialog act information dependent on number of empty slots of the query
KR101183344B1 (ko) 사용자 정정들을 이용한 자동 음성 인식 학습
CN111341305B (zh) 一种音频数据标注方法、装置及系统
CN109346109B (zh) 基频提取方法和装置
CN111863033B (zh) 音频质量识别模型的训练方法、装置、服务器和存储介质
WO2021123792A1 (en) A Text-to-Speech Synthesis Method and System, a Method of Training a Text-to-Speech Synthesis System, and a Method of Calculating an Expressivity Score
US11074897B2 (en) Method and apparatus for training adaptation quality evaluation model, and method and apparatus for evaluating adaptation quality
CN112151014A (zh) 语音识别结果的测评方法、装置、设备及存储介质
CN109300468B (zh) 一种语音标注方法及装置
CN112509561A (zh) 情绪识别方法、装置、设备及计算机可读存储介质
CN111883137A (zh) 基于语音识别的文本处理方法及装置
CN110503941B (zh) 语言能力评测方法、装置、系统、计算机设备及存储介质
US11037583B2 (en) Detection of music segment in audio signal
WO2022126969A1 (zh) 业务语音的质检方法、装置、设备及存储介质
CN115273866A (zh) 一种音频转化方法、装置、及存储介质
CN112185392A (zh) 一种用于供电智能客户的语音识别处理系统
CN114358026A (zh) 语音翻译方法、装置、设备和计算机可读存储介质
CN111899729B (zh) 一种语音模型的训练方法、装置、服务器和存储介质
CN113421572B (zh) 实时音频对话报告生成方法、装置、电子设备及存储介质
CN113284514B (zh) 音频处理方法和装置
CN113658581B (zh) 声学模型的训练、语音处理方法、装置、设备及存储介质
CN116597799A (zh) 音频转录方法、装置、计算机设备及存储介质
JP5336788B2 (ja) 音声認識装置およびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant