CN114944154B - 音频调整方法、装置、设备及存储介质 - Google Patents

音频调整方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114944154B
CN114944154B CN202210881049.7A CN202210881049A CN114944154B CN 114944154 B CN114944154 B CN 114944154B CN 202210881049 A CN202210881049 A CN 202210881049A CN 114944154 B CN114944154 B CN 114944154B
Authority
CN
China
Prior art keywords
frequency band
mode
sound information
sound
target frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210881049.7A
Other languages
English (en)
Other versions
CN114944154A (zh
Inventor
邓刚
贾英智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Changfeng Imaging Equipment Co ltd
Original Assignee
Shenzhen Changfeng Imaging Equipment Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Changfeng Imaging Equipment Co ltd filed Critical Shenzhen Changfeng Imaging Equipment Co ltd
Priority to CN202210881049.7A priority Critical patent/CN114944154B/zh
Publication of CN114944154A publication Critical patent/CN114944154A/zh
Application granted granted Critical
Publication of CN114944154B publication Critical patent/CN114944154B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种音频调整方法、装置、设备及存储介质。该方法包括:获取当前选择的修音模式和采集的当前声音信息;若修音模式为自动模式,则对当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于第一目标频段对当前声音信息进行频段过滤得到调整后的声音信息;若修音模式为指定模式,则根据指定模式确定对应的第二目标频段,基于第二目标频段对当前声音信息进行频段过滤得到调整后的声音信息。本发明实施例能够根据实际需求自行切换修音模式,在用户指定目标频段时采用指定模式,而在不确定当前声音信息对应的目标频段时采用自动模式,适用于各种情况下的修音需求,应用范围更广。

Description

音频调整方法、装置、设备及存储介质
技术领域
本发明涉及音频处理技术领域,尤其涉及一种音频调整方法、装置、设备及存储介质。
背景技术
自然界中,每种声音都有对应的频率,每种乐器或者不同的人声也有不同的频率范围。而在麦克风收音过程中,难免会收入各种噪声,以至于在播放时产生杂声,造成较差的用户体验。
现有的麦克风,一般采用手动打开低切开关(高通开关)、高切开关(低通开关)或者带通开关的方式,选择过滤掉固定频段的频率或者只保留固定频段的频率的方式。但是此种方式可供选择的频段有限,无法满足不同频段类型的采音需求。
发明内容
有鉴于此,本发明提供了一种音频调整方法、装置、设备及存储介质,既能够通过自动模式自动匹配声音分类模型进行修音,还能够通过指定模式在自动匹配失败时进行修音,满足不同需求。
为解决上述技术问题,本发明采用以下技术方案:
第一方面,本发明提供了一种音频调整方法,该方法包括:
获取当前选择的修音模式和采集的当前声音信息;
若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息;
若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
可选的,在一些实施例中,还包括:
采集包括不同声音类型的多种预设声音信息;
以所述多种预设声音信息按照频率范围划分声音类型建立声音分类模型。
可选的,在一些实施例中,所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,包括:
将所述当前声音信息与所述声音分类模型中的多种预设声音信息进行匹配,以确定所述当前声音信息与不同预设声音信息的相似度;
判断是否存在相似度满足预设要求的预设声音信息;
若是,则选择相似度最高的预设声音信息对应的频率范围作为所述第一目标频段。
可选的,在一些实施例中,所述判断是否存在相似度满足预设要求的预设声音信息之后,还包括:
若否,则提示匹配失败,并执行所述获取当前选择的修音模式和采集的当前声音信息。
可选的,在一些实施例中,所述指定模式包括低通模式、带通模式和高通模式,所述则根据所述指定模式确定对应的第二目标频段包括:
若所述指定模式为低通模式,则以第一临界点频率以下的频段作为所述第二目标频段;
若所述指定模式为带通模式,则以大于等于第二临界点频率且小于等于第三临界点频率的频段作为所述第二目标频段;
若所述指定模式为高通模式,则以第四临界点频率以上的频段作为所述第二目标频段。
第二方面,本发明实施例还提供了一种音频调整装置,包括:
数据获取模块,用于获取当前选择的修音模式和采集的当前声音信息;
自动修音模块,用于若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息;
指定修音模块,用于若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
可选的,在一些实施例中,所述自动修音模块包括:
相似度匹配单元,用于将所述当前声音信息与所述声音分类模型中的多种预设声音信息进行匹配,以确定所述当前声音信息与不同预设声音信息的相似度;
相似度判断单元,用于判断是否存在相似度满足预设要求的预设声音信息;
频段确定单元,用于若存在,则选择相似度最高的预设声音信息对应的频率范围作为所述第一目标频段。
可选的,在一些实施例中,所述指定模式包括低通模式、带通模式和高通模式,所述指定修音模块包括:
低通单元,用于若所述指定模式为低通模式,则以第一临界点频率以下的频段作为所述第二目标频段;
带通单元,用于若所述指定模式为带通模式,则以大于等于第二临界点频率且小于等于第三临界点频率的频段作为所述第二目标频段;
高通单元,用于若所述指定模式为高通模式,则以第四临界点频率以上的频段作为所述第二目标频段。
第三方面,本发明提供了一种音频设备,包括存储器和处理器,所述存储器上存储有可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明任一实施例提供的的音频调整方法。
第四方面,本发明提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被执行时实现如本发明任一实施例提供的的音频调整方法。
同现有技术相比,本发明提供的音频调整方法,先获取当前选择的修音模式和采集的当前声音信息,然后根据修音模式对当前声音信息进行音频调整:若修音模式为自动模式,则将当前声音信息输入预设的声音分类模型匹配确定第一目标频段,基于第一目标频段对当前声音信息进行频段过滤得到调整后的声音信息,若修音模式为指定模式,则根据指定模式确定对应的第二目标频段,基于第二目标频段对当前声音信息进行频段过滤得到调整后的声音信息,该方法能够根据实际需求自行切换修音模式,在用户指定目标频段时采用指定模式,而在不确定当前声音信息对应的目标频段时采用自动模式,适用于各种情况下的修音需求,应用范围更广。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见的,下面描述中的附图仅仅是本申请的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明实施例一提供的一种音频调整方法的流程图;
图2是本发明实施例二提供的一种音频调整方法的流程图;
图3是本发明实施例二提供的一种音频调整方法的子流程图;
图4是本发明实施例二提供的一种音频调整方法的子流程图;
图5是本发明实施例三提供的一种音频调整装置的结构示意图;
图6是本发明实施例四提供的一种音频设备的结构示意图。
具体实施方式
下面结合本申请实施例中的附图,对本申请实施中的技术方案进行清楚、完整的描述。可以理解的是,此处所描述的具体实施例仅仅是本申请一部分实施例,而不是全部的实施例,仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
此外,术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等,但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。举例来说,在不脱离本发明的范围的情况下,可以将第一用例称为第二用例,且类似地,可将第二用例称为第一用例。第一用例和第二用例两者都是用例,但其不是同一用例。术语“第一”、“第二”等而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者多个特征的组合。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。需要说明的是,当一个部被称为“固定于”另一个部,它可以直接在另一个部上也可以存在居中的部。当一个部被认为是“连接”到另一个部,它可以是直接连接到另一个部或者可能同时存在居中部。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述,只是为了说明的目的,并不表示是唯一的实施方式。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
参见图1,本实施例提供了一种音频调整方法,可以应用于音频设备的修音过程,具体的本实施例提供的音频调整方法包括:
S110、获取当前选择的修音模式和采集的当前声音信息。
本实施例中,音频设备上设置有用于采集声音信息的装置,例如麦克风,其能够实时采集当前声音信息。示例性的,本实施例提供的音频设备可以是录音设备,其用于进行曲乐的录制,能够采集各种类型的乐器声音以及人物歌声等,再例如本实施例提供的音频设备可以是通讯终端,其在通讯时用于进行通话语音的采集。
本实施例中,音频设备上还设置有用于选择修音模式的切换装置,以根据用户的指令切换音频设备的修音模式,例如物理按键,其能够根据用户的操作生成对应指令以选择修音模式。在一个具体示例中,音频设备上设置有至少一个按键,每个按键对应一种修音模式,在另一个示例中,音频设备上设置有触控屏,能够显示各种修音模式以供用户触碰选择,在还一个示例中,音频设备上设置有语音识别装置,用于接收并识别用户的语音指令,以根据用户的语音指令选择修音模式。
S120、若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
自动模式表示采用声音分类模型对当前声音信息自动匹配以选择合适的目标频段对其(当前声音信息)进行音频调整。具体的,本实施例中音频设备中预先存储有预设的声音分类模型,其能够对声音信息进行识别分类,并确定其对应的目标频段,此处所指的目标频段表示不同种类声音对应的标准频段(预先设置好的),在进行音频调整时,会基于目标频段对声音信息进行过滤,以得到保留目标频段内声音信号的声音信息,也即调整后的声音信息,为了与后续的目标频段便于区分,此处将自动模式下确定的目标频段称为第一目标频段。
S130、若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
与自动模式不同的是,指定模式下音频设备确定有固定的目标频段,用于对声音信息进行过滤,而非是根据当前声音信息进行自动调整,例如在指定模式下,目标频段始终为低于100Hz,则音频设备不论接收到何种当前声音信息都仅保留低于100Hz的声音信号,而在自动模式下,目标频段可能会根据当前声音信息自动变更为高于100Hz或其他频段,为了便于区分,将指定模式下的目标频段称为第二目标频段。
本实施例提供了一种音频调整方法,先获取当前选择的修音模式和采集的当前声音信息,然后根据修音模式对当前声音信息进行音频调整:若修音模式为自动模式,则将当前声音信息输入预设的声音分类模型匹配确定第一目标频段,基于第一目标频段对当前声音信息进行频段过滤得到调整后的声音信息,若修音模式为指定模式,则根据指定模式确定对应的第二目标频段,基于第二目标频段对当前声音信息进行频段过滤得到调整后的声音信息,该方法能够根据实际需求自行切换修音模式,在用户指定目标频段时采用指定模式,而在不确定当前声音信息对应的目标频段时采用自动模式,适用于各种情况下的修音需求,应用范围更广。
实施例二
实施例二提供了一种音频调整方法,其可以在实施例一的基础上实现,对实施例一中的部分内容进行了具体的解释或举例,具体包括:
如图2所示,还包括建立声音分类模型的过程:
S210、采集包括不同声音类型的多种预设声音信息。
不同声音类型通常根据需求自行选择,例如女声、男声、琴声、鼓声等人声和/或乐器以及更广泛的类型,多种预设声音信息为与声音类型对应的多个声音样本,例如不同男性的声音、同一乐器的不同演奏声音等,此处不再一一举例。
S220、以所述多种预设声音信息按照频率范围划分声音类型建立声音分类模型。
根据多种预设声音信息,确定不同声音类型对应的频段,也即频率范围,据此训练一个声音分类模型,用于根据输入的声音信息的频率确定其最符合的声音类型,以找到其所属的频段,也即第一目标频段。
S230、获取当前选择的修音模式和采集的当前声音信息;
S240、若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息;
S250、若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
应当理解的是,步骤S210-220并非被限定于仅在步骤S230之前实施,在一些替代实施例中,在调音的过程中以及调音结束后,均可以实施对声音分类模型的调整,即在步骤S230之后以及步骤S240之后等等情况下均可以执行步骤S210-220实现对声音分类模型的调整,在一些具体示例中,例如在音频设备中实施在线系统升级时同步更新声音分类模型,或者由于声音分类模型过于落后用户手动添加预设声音信息以更新声音分类模型等情况,此处不再一一举例。
更具体的,在一些实施例中,如图3所示,步骤S240中,所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段包括步骤S241-243:
S241、将所述当前声音信息与所述声音分类模型中的多种预设声音信息进行匹配,以确定所述当前声音信息与不同预设声音信息的相似度;
S242、判断是否存在相似度满足预设要求的预设声音信息;
S243、若是,则选择相似度最高的预设声音信息对应的频率范围作为所述第一目标频段。
预设的声音分类模型中每种声音类型都有对应的预设声音信息,多种声音类型也对应有多种预设声音信息,在接收到当前声音信息后,对当前声音信息和多种预设声音信息进行匹配比较,得到对应的相似度,相似度越高表示当前声音信息越接近预设声音信息,当相似度满足预设要求,说明当前声音信息符合预设声音信息对应的声音类型,此时可以将预设声音信息对应的声音类型的频率范围作为第一目标频段。而若有多个预设声音信息都满足相似度符合预设要求这一条件,说明当前声音信息有多个匹配的声音类型,此时选择相似度最高的预设声音信息确定对应的声音类型,从而确定与声音类型对应的第一目标频段。
更具体的,在一些实施例中,如图4所示在步骤S242之后,还包括自动修音失败后的步骤S244:
S244、若否,则提示匹配,并执行所述获取当前选择的修音模式和采集的当前声音信息。
当不存在满足相似度符合预设要求的预设声音信息,说明当前声音信息并非声音分类模型中存储的声音类型,此时自动模式无法完成音频调成,需要用户重新修改修音模式为指定模式,以手动确定第二目标频段进行音频调整。
更具体的,在一些实施例中,所述指定模式包括低通模式、带通模式和高通模式,所述则根据所述指定模式确定对应的第二目标频段包括:
若所述指定模式为低通模式,则以第一临界点频率以下的频段作为所述第二目标频段。
若所述指定模式为带通模式,则以大于等于第二临界点频率且小于等于第三临界点频率的频段作为所述第二目标频段。
若所述指定模式为高通模式,则以第四临界点频率以上的频段作为所述第二目标频段。
本实施例中,音频设备中预先存储有三种可供切换的指定模式,用于覆盖三个频率范围:第一临界点频率、第二临界点频率、第三临界点频率和第四临界点频率都是预先设置好的,用于划分不同的频率范围,在一些替代实施例中中还能够通过更多的临界点频率提供更多的指定模式以实现更细致化的音频调整。可选的,在一些实施例中,还能够根据用户的实际需求实时输入临界点频率以自行定义指定模式,此处不再一一举例。
本实施例在前述实施例的基础上,对音频调整方法做了进一步解释和补充,对自动模式和指定模式做了更详细的解释,通过自动模式和指定模式能够覆盖更广泛的声音类型,实现针对性的音频调整,更符合用户的实际需求。
实施例三
图5为本发明实施例三提供的一种音频调整装置300的结构示意图,如图5所述,该装置统300包括:
数据获取模块310,用于获取当前选择的修音模式和采集的当前声音信息。
自动修音模块320,用于若所述修音模式为自动模式,则对将所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
指定修音模块330,用于若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
可选的,在一些实施例中,所述自动修音模块包括:
相似度匹配单元,用于将所述当前声音信息与所述声音分类模型中的多种预设声音信息进行匹配,以确定所述当前声音信息与不同预设声音信息的相似度;
相似度判断单元,用于判断是否存在相似度满足预设要求的预设声音信息;
频段确定单元,用于若是,则选择相似度最高的预设声音信息对应的频率范围作为所述第一目标频段。
可选的,在一些实施例中,所述指定模式包括低通模式、带通模式和高通模式,所述指定修音模块包括:
低通单元,用于若所述指定模式为低通模式,则以第一临界点频率以下的频段作为所述第二目标频段;
带通单元,用于若所述指定模式为带通模式,则以大于等于第二临界点频率且小于等于第三临界点频率的频段作为所述第二目标频段;
高通单元,用于若所述指定模式为高通模式,则以第四临界点频率以上的频段作为所述第二目标频段。
本实施例提供了一种音频调整装置,先获取当前选择的修音模式和采集的当前声音信息,然后根据修音模式对当前声音信息进行音频调整:若修音模式为自动模式,则将当前声音信息输入预设的声音分类模型匹配确定第一目标频段,基于第一目标频段对当前声音信息进行频段过滤得到调整后的声音信息,若修音模式为指定模式,则根据指定模式确定对应的第二目标频段,基于第二目标频段对当前声音信息进行频段过滤得到调整后的声音信息,该装置能够根据实际需求自行切换修音模式,在用户指定目标频段时采用指定模式,而在不确定当前声音信息对应的目标频段时采用自动模式,适用于各种情况下的修音需求,应用范围更广。
实施例四
图6为本发明实施例四提供的一种可以实现音频调整方法的音频设备400的结构示意图,如图6所示,该设备包括存储器410、处理器420,设备中处理器420的数量可以是一个或多个,图6中以一个处理器420为例;设备中的存储器410、处理器420可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器410作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的音频调整方法对应的程序指令/模块(例如,音频调整装置中的数据获取模块310、自动修音模块320、指定修音模块330)。处理器420通过运行存储在存储器410中的软件程序、指令以及模块,从而执行音频调整装置的各种功能应用以及数据处理,即实现上述的音频调整方法。
其中,所述处理器420用于运行存储在存储器410中的计算机可执行程序,以实现如下步骤:步骤S110、获取当前选择的修音模式和采集的当前声音信息;步骤S120、若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息;步骤S130、若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
当然,本发明实施例所提供的一种音频调整装置,该装置不限于如上所述的方法操作,还可以执行本发明实施例任意实施例所提供的音频调整方法中的相关操作。
存储器410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器410可进一步包括相对于处理器420远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的示例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实施例五
本发明实施例五还提供一种包括计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种音频调整方法,该音频调整方法包括:
获取当前选择的修音模式和采集的当前声音信息;
若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息;
若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的声音信息。
当然,本发明实施例所提供的一种包括计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的音频调整方法中的相关操作。
通过以上关于实施方式的描述,所述领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(RandomAccess Memory, RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台音频设备(可以是个人计算机,设备,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述授权装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种音频调整方法,其特征在于,包括:
获取当前选择的修音模式和采集的当前声音信息;
若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的保留所述第一目标频段内声音信号的声音信息;
若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的保留所述第二目标频段内声音信号的声音信息;
所述方法还包括:
采集包括不同声音类型的多种预设声音信息;
以所述多种预设声音信息按照频率范围划分声音类型并建立声音分类模型;
所述第一目标频段为所述当前声音信息的频率最符合的声音类型所属的频段。
2.根据权利要求1所述的音频调整方法,其特征在于,所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,包括:
将所述当前声音信息与所述声音分类模型中的多种预设声音信息进行匹配,以确定所述当前声音信息与不同预设声音信息的相似度;
判断是否存在相似度满足预设要求的预设声音信息;
若是,则选择相似度最高的预设声音信息对应的频率范围作为所述第一目标频段。
3.根据权利要求2所述的音频调整方法,其特征在于,还包括:
若否,则提示匹配失败,并执行所述获取当前选择的修音模式和采集的当前声音信息。
4.根据权利要求1所述的音频调整方法,其特征在于,所述指定模式包括低通模式、带通模式和高通模式,所述则根据所述指定模式确定对应的第二目标频段包括:
若所述指定模式为低通模式,则以第一临界点频率以下的频段作为所述第二目标频段;
若所述指定模式为带通模式,则以大于等于第二临界点频率且小于等于第三临界点频率的频段作为所述第二目标频段;
若所述指定模式为高通模式,则以第四临界点频率以上的频段作为所述第二目标频段。
5.一种音频调整装置,其特征在于,包括:
数据获取模块,用于获取当前选择的修音模式和采集的当前声音信息;
自动修音模块,用于若所述修音模式为自动模式,则对所述当前声音信息输入预设的声音分类模型匹配,确定第一目标频段,基于所述第一目标频段对所述当前声音信息进行频段过滤得到调整后的保留所述第一目标频段内声音信号的声音信息;
指定修音模块,用于若所述修音模式为指定模式,则根据所述指定模式确定对应的第二目标频段,基于所述第二目标频段对所述当前声音信息进行频段过滤得到调整后的保留所述第二目标频段内声音信号的声音信息;
所述装置还包括:
声音信息采集模块,用于采集包括不同声音类型的多种预设声音信息;
声音分类模型建立模块,用于以所述多种预设声音信息按照频率范围划分声音类型并建立声音分类模型;
所述第一目标频段为所述当前声音信息的频率最符合的声音类型所属的频段。
6.根据权利要求5所述的音频调整装置,其特征在于,所述自动修音模块包括:
相似度匹配单元,用于将所述当前声音信息与所述声音分类模型中的多种预设声音信息进行匹配,以确定所述当前声音信息与不同预设声音信息的相似度;
相似度判断单元,用于判断是否存在相似度满足预设要求的预设声音信息;
频段确定单元,用于若存在,则选择相似度最高的预设声音信息对应的频率范围作为所述第一目标频段。
7.根据权利要求5所述的音频调整装置,其特征在于,所述指定模式包括低通模式、带通模式和高通模式,所述指定修音模块包括:
低通单元,用于若所述指定模式为低通模式,则以第一临界点频率以下的频段作为所述第二目标频段;
带通单元,用于若所述指定模式为带通模式,则以大于等于第二临界点频率且小于等于第三临界点频率的频段作为所述第二目标频段;
高通单元,用于若所述指定模式为高通模式,则以第四临界点频率以上的频段作为所述第二目标频段。
8.一种音频设备,其特征在于,包括存储器和处理器,所述存储器上存储有可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-4任意一项所述的音频调整方法。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被执行时,实现如权利要求1-4任意一项所述的音频调整方法。
CN202210881049.7A 2022-07-26 2022-07-26 音频调整方法、装置、设备及存储介质 Active CN114944154B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210881049.7A CN114944154B (zh) 2022-07-26 2022-07-26 音频调整方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210881049.7A CN114944154B (zh) 2022-07-26 2022-07-26 音频调整方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114944154A CN114944154A (zh) 2022-08-26
CN114944154B true CN114944154B (zh) 2022-11-15

Family

ID=82910316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210881049.7A Active CN114944154B (zh) 2022-07-26 2022-07-26 音频调整方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114944154B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873981A (zh) * 2012-12-11 2014-06-18 圆展科技股份有限公司 音频调整方法与声学处理装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE516798C2 (sv) * 1996-07-03 2002-03-05 Thomas Lagoe Anordning och sätt för analys och filtrering av ljud
DE19948308C2 (de) * 1999-10-06 2002-05-08 Cortologic Ag Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung
US20040131206A1 (en) * 2003-01-08 2004-07-08 James Cao User selectable sound enhancement feature
ATE396537T1 (de) * 2004-01-19 2008-06-15 Nxp Bv System für die audiosignalverarbeitung
CN107331403B (zh) * 2017-06-27 2020-11-06 深圳创维-Rgb电子有限公司 一种基于算法的音频优化方法、智能终端及存储装置
CN112752190A (zh) * 2019-10-29 2021-05-04 骅讯电子企业股份有限公司 音频调整方法以及音频调整装置
CN113299307B (zh) * 2021-05-21 2024-02-06 深圳市长丰影像器材有限公司 麦克风阵列信号处理方法、系统、计算机设备及存储介质
CN113707113B (zh) * 2021-08-24 2024-02-23 北京达佳互联信息技术有限公司 用户歌声的修音方法、装置及电子设备
CN114710173B (zh) * 2022-05-27 2022-10-11 深圳市长丰影像器材有限公司 一种干扰信号过滤方法、装置、电子设备和存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873981A (zh) * 2012-12-11 2014-06-18 圆展科技股份有限公司 音频调整方法与声学处理装置

Also Published As

Publication number Publication date
CN114944154A (zh) 2022-08-26

Similar Documents

Publication Publication Date Title
US11715446B2 (en) Music classification method and beat point detection method, storage device and computer device
KR102262686B1 (ko) 음성 품질 평가 방법 및 음성 품질 평가 장치
CN103971680B (zh) 一种语音识别的方法、装置
CN106898348B (zh) 一种出声设备的去混响控制方法和装置
CN108182937A (zh) 关键词识别方法、装置、设备及存储介质
CN108346433A (zh) 一种音频处理方法、装置、设备及可读存储介质
CN108874895B (zh) 交互信息推送方法、装置、计算机设备及存储介质
CN105760060B (zh) 快速页面定位方法
CN106168958B (zh) 一种音频信息的推荐方法以及服务器
CN106469557B (zh) 伴奏音乐的提供方法和装置
CN104422922A (zh) 一种移动终端实现声源定位的方法及装置
CN105722249B (zh) 一种切换连接的方法、装置以及终端
CN111862951A (zh) 语音端点检测方法及装置、存储介质、电子设备
CN105812484B (zh) 车载交互系统
CN109819375A (zh) 调节音量的方法与装置、存储介质、电子设备
CN110097884B (zh) 一种语音交互方法和装置
CN112786057B (zh) 一种声纹识别方法、装置、电子设备及存储介质
CN111081223A (zh) 一种语音识别方法、装置、设备和存储介质
CN112331195B (zh) 语音交互方法、装置以及系统
CN112151013A (zh) 智能设备交互方法
CN114944154B (zh) 音频调整方法、装置、设备及存储介质
CN110930987A (zh) 音频处理方法、装置和存储介质
WO2019052361A1 (zh) 铃音设置方法及装置
CN113436613A (zh) 语音识别方法、装置、电子设备及存储介质
CN112509597A (zh) 录音数据识别方法和装置、录音设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant