CN109119088A - 一种音频信号的调节方法、装置、设备及计算机存储介质 - Google Patents

一种音频信号的调节方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN109119088A
CN109119088A CN201810994357.4A CN201810994357A CN109119088A CN 109119088 A CN109119088 A CN 109119088A CN 201810994357 A CN201810994357 A CN 201810994357A CN 109119088 A CN109119088 A CN 109119088A
Authority
CN
China
Prior art keywords
target
spectrum type
frequency
frequency distribution
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810994357.4A
Other languages
English (en)
Inventor
张�杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Techology Co Ltd
Original Assignee
Goertek Techology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Techology Co Ltd filed Critical Goertek Techology Co Ltd
Priority to CN201810994357.4A priority Critical patent/CN109119088A/zh
Publication of CN109119088A publication Critical patent/CN109119088A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种音频信号的调节方法,首先是获取当前用户的目标频谱类型,由于预先设置了关于频谱类型和EQ补偿信号的对应关系,因此,当得到了目标频谱类型后,就可以利用对应关系查找与目标频谱类型对应的目标EQ补偿信号,最后将目标EQ补偿信号加入当前用户待播放的音频信号中以进行调节。可见,应用于本方法提供的技术方案一方面不需要用户手动调节,即可在用户收听音频信号时,自动对音频信号进行EQ补偿,另一方面,目标EQ补偿信号是依据当前用户目标频谱类型得到的,因此,相对于固定的EQ补偿方式,更适应用户的听觉习惯,提高了用户的体验感。本发明还公开了一种音频信号的调节装置、设备及计算机存储介质,具有上述有益效果。

Description

一种音频信号的调节方法、装置、设备及计算机存储介质
技术领域
本发明涉及音频信号处理技术领域,特别是涉及一种音频信号的调节方法、装置、设备及计算机存储介质。
背景技术
目前,终端(例如,手机、耳机等)上存储的音频文件通常是由不同频率的音频信号组成的,而这些音频信号在每个单频点是固定频率的。但是由于用户因年龄、性别、用耳习惯等不同,听觉系统对各频段敏感程度也会有所不同,因此,对于同一份音频文件,不同的用户收听到的效果却是因人而异。
现有技术中,为了满足不同用户的聆听需求,常见的音频信号调节方法是在终端APP上配置可以单频点添加增益的滤波器选项,但普通终端用户不具备相关专业知识,并不能确定应该在哪些单频点设置增益,以及增益如何设置,并且该操作较为刻板,使用不便。
发明内容
本发明的目的是提供一种音频信号的调节方法、装置、设备及计算机存储介质,用于在用户收听音频文件时,对音频文件中的音频信号自动进行EQ补偿,从而满足不同用户的聆听需求,无需用户手动调节。
为解决上述技术问题,本发明提供一种音频信号的调节方法,包括:
S1:获取当前用户的目标频谱类型;
S2:根据预先设置的频谱类型和EQ补偿信号的对应关系,查找与所述目标频谱类型对应的目标EQ补偿信号;
S3:将所述目标EQ补偿信号加入当前用户待播放的音频信号中以进行调节。
优选地,S1具体包括:
S10:统计当前用户所收听的音频文件,所述音频文件的累积播放时长不小于预定时长;
S11:对所述音频文件进行频谱分析得到目标频率分布曲线;
S12:将所述目标频率分布曲线与预设频谱中的预设频率分布曲线比较得到所述目标频谱类型;
其中,所述预设频谱包括多种预设频率分布曲线和与各所述预设频率分布曲线对应的频谱类型。
优选地,所述S12具体包括:
S120:判断所述音频文件是否为一个,如果是,则进入S121,否则进入S124;
S121:判断所述目标频率分布曲线是否与所述预设频谱中的一种预设频率分布曲线全部吻合;如果是,则进入S122,否则进入S123;
S122:将当前预设频率分布曲线对应的频谱类型作为所述目标频谱类型;
S123:选取所述目标频率分布曲线中的预设类型的频点,得到各所述频点的幅度值,统计各所述频点对应的预设频率分布曲线,并将统计结果中出现次数最多的预设频率分布曲线对应的频谱类型作为所述目标频谱类型;
S124:选取其中一条所述目标频率分布曲线;
S125:判断当前目标频率分布曲线是否与所述预设频谱中的一种预设频率分布曲线全部吻合;如果是,则进入S126,否则进入S127;
S126:将当前预设频率分布曲线对应的频谱类型作为当前目标频率分布曲线对应的频谱类型,进入S128;
S127:选取当前目标频率分布曲线中的预设类型的频点,得到各所述频点的幅度值,统计各所述频点对应的预设频率分布曲线,并将统计结果中出现次数最多的预设频率分布曲线对应的频谱类型作为当前目标频率分布曲线对应的频谱类型,进入S128;
S128:判断是否有剩余的所述目标频率分布曲线,如果是,则返回S124,否则进入S129;
S129:统计得到的多个频谱类型,将统计结果中出现次数最多的频谱类型作为所述目标频谱类型。
优选地,S2具体包括:
判断所述对应关系中是否包含有所述目标频谱类型;
如果是,则与将所述目标频谱类型对应的补偿信号作为所述目标EQ补偿信号;
如果否,则将与所述目标频谱类型最接近的频谱类型对应的补偿信号作为所述目标EQ补偿信号。
优选地,在S2和S3之间还包括:
向当前用户输出是否进行EQ补偿的选择信息;
若当前用户选择进行EQ补偿,则进入S3。
优选地,S1之前还包括:
获取当前用户的身份信息;
根据所述身份信息判断是否已得到当前用户的目标频谱类型;
如果是,则进入S2,如果否,则进入S1。
优选地,所述获取当前用户的身份信息具体为:通过指纹采集模块和/或心率采集模块获取当前用户的身份信息。
为解决上述技术问题,本发明还提供一种音频信号的调节装置,包括:
获取模块,用于获取当前用户的目标频谱类型;
查找模块,用于根据预先设置的频谱类型和EQ补偿信号的对应关系,查找与所述目标频谱类型对应的目标EQ补偿信号;
补偿模块,用于将所述目标EQ补偿信号加入当前用户待播放的音频信号中以进行调节。
为解决上述技术问题,本发明还提供一种音频信号的调节设备,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述所述的音频信号的调节方法的步骤。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的音频信号的调节方法的步骤。
本发明所提供的音频信号的调节方法,首先是获取当前用户的目标频谱类型,由于预先设置了关于频谱类型和EQ补偿信号的对应关系,因此,当得到了目标频谱类型后,就可以利用对应关系查找与目标频谱类型对应的目标EQ补偿信号,最后将目标EQ补偿信号加入当前用户待播放的音频信号中以进行调节。由此可见,应用于本方法提供的技术方案一方面不需要用户手动调节,即可在用户收听音频信号时,自动对音频信号进行EQ补偿,另一方面,目标EQ补偿信号是依据当前用户目标频谱类型得到的,因此,相对于固定的EQ补偿方式,更适应用户的听觉习惯,提高了用户的体验感。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种音频信号的调节方法的流程图;
图2为本发明实施例提供的另一种音频信号的调节方法的流程图
图3为本发明实施例提供的一种S12的流程图;
图4为本发明实施例提供的一种音频信号的调节装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
本发明的核心是提供一种音频信号的调节方法、装置、设备及计算机存储介质,用于在用户收听音频文件时,对音频文件中的音频信号自动进行EQ补偿,从而满足不同用户的聆听需求,无需用户手动调节。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
图1为本发明实施例提供的一种音频信号的调节方法的流程图。如图1所示,该方法包括:
S1:获取当前用户的目标频谱类型。
本实施例中,当前用户是指要收听待播放的音频信号的用户,需要说明的是,当前用户可以是固定的一个用户,也可以是不固定的用户,例如,对于一个能够播放音频信号的终端(可以是耳机、手机、PC机等)来说,可以是由一个用户使用,那么当前用户始终是该用户,也可以是由多个用户使用,那么当前用户可能会更换。但是,需要说明的是,对于S1-S3中提到的当前用户来说,本实施例中是一个固定不变的用户。如果将S1-S3看成是调节方法的一个完整周期的话,则不同周期对应的当前用户可能是不同的,但是同一个周期对应的当前用户是相同的。
鉴于上述应用场景,S1中首先需要确定当前用户,才能够确定当前用户的目标频谱类型,对于如何确定当前用户可以是通过身份验证的方式得到,也可以是通过终端与用户的绑定关系得到。例如,对于前者来说,可以通过指纹、密码、心率等验证信息确定当前用户,如果是该方式,则需要预先存储验证信息和用户的对应关系;对于后者来说,由于事先进行了绑定,则无论是谁收听,默认的都是绑定的那位用户。
本实施例中,不限定目标频谱类型的获取方式,例如,在一种具体实施方式中,可以向用户提供多种频谱类型,供用户自行选择,从而得到该用户的频谱类型,即目标频谱类型;在另一种具体实施方式中,还可以是根据用户平时收听的音频文件来确定用户属于哪种频谱类型,从而确定该用户的频谱类型,即目标频谱类型。需要说明的是,本发明中的频谱类型通常是有多种,而目标频谱类型是频谱类型中的一种,只是为了与其余的频谱类型进行区分,并没有其它特殊的含义。另外,频谱类型的划分需要预先进行,其划分依据本实施例不作限定,例如,可以依据不同年龄人耳的收听习惯进行划分、也可以根据人耳对不同频率的敏感程度进行划分,本实施例不再赘述。频谱类型设置的越多,则与用户的匹配程度就会越高。
另外,本实施例中,当前用户的目标频谱类型可以是预先就已经确定的,或者是现生成的。例如通过上文描述的获取方式来说,如果是首次获取,则可以是现生成的,在首次得到目标频谱类型后,就可以存储该目标频谱类型与当前用户的对应关系,当下一次进行S1时,直接通过对应关系就可以获取到当前用户的目标频谱类型。
进一步,本实施例中对于S1的触发时机不作限定,可以是检测到用户开启终端的操作后就执行,也可以是检测到用户开启音频播放的操作时再执行。对于前者来说,能够在用户收听音频文件之前预先执行,避免用户等待,但是需要终端记忆该操作,并且用户可能在整个开机时间均不收听音频文件,那么该步骤的执行就是资源浪费。对于后者来说,虽然需要用户等待,但是能够避免资源浪费。
S2:根据预先设置的频谱类型和EQ补偿信号的对应关系,查找与目标频谱类型对应的目标EQ补偿信号。
本步骤中,需要预先设置关于频谱类型和EQ补偿信号的对应关系,可以将该对应关系存储于终端上,或者存储于服务器上,终端在查找时,与服务器进行数据交互。
每种频谱类型对应的EQ补偿信号实际上是将某些频点的幅度值(增益)进行调整,例如,可以增大(正值)也可以减小(负值),补偿之后低频鼓声突出或高频弦乐突出,从而满足不用用户的聆听需求。至于EQ补偿信号可以通过多种方式计算,例如,若用户收听多为10kHz较高的音频信号,则可能由于年龄的增长或不健康的用耳习惯导致其高频信号的灵敏度偏低,则对应的目标EQ补偿信号就是用于高频提升的信号。反之,若多为某一频段较低的音频信号,则说明用户对该频段较敏感,则对应的目标EQ补偿信号就是用于将该频段降低的信号。如此可使用户在收听大多数音频文件时有更舒适的听觉感受,可以欣赏更多类型的音频文件。至于EQ补偿信号具体设置,可参见现有技术,本实施例不再赘述。
本步骤中的频谱类型是有多个,EQ补偿信号也是有多个,因此,目标EQ补偿信号是多个EQ补偿信号中的一种,只是为了与其他EQ补偿信号作区分,并没有其它特殊含义。例如,频谱类型和EQ补偿信号的对应关系中包含的频谱类型有A、B、C、D,对应的EQ补偿信号依次为a、b、c、d,当目标频率类型为A时,则目标EQ补偿信号就是a。
S3:将目标EQ补偿信号加入当前用户待播放的音频信号中以进行调节。
本发明中对于当前用户待播放的音频信号的内容不作限定,且播放时长也不作限定。在具体实施中,待播放的音频信号可以包含有一个音频文件或者多个音频文件。为了避免频繁进行S1和S2,在一种具体实施中,如果两个音频文件的播放间隔小于预设值,则在播放完第一个音频文件后,直接将当前的目标EQ补偿信号作为下一个音频文件的播放时对应的音频信号的调节信号。当然,也可以在每播放完一个音频文件就视为完成一次音频信号的调节,然后进入下一个调节周期,即重新执行S1-S3。
需要说明的是,步骤S1-S3只是音频信号的调节方法中包含的三个步骤,但是并不一定在每种场景下都需要依次执行这三个步骤,具体实施方式在上文中具有详细描述,此处不再赘述。
本实施例提供的音频信号的调节方法,首先是获取当前用户的目标频谱类型,由于预先设置了关于频谱类型和EQ补偿信号的对应关系,因此,当得到了目标频谱类型后,就可以利用对应关系查找与目标频谱类型对应的目标EQ补偿信号,最后将目标EQ补偿信号加入当前用户待播放的音频信号中以进行调节。由此可见,应用于本方法提供的技术方案一方面不需要用户手动调节,即可在用户收听音频信号时,自动对音频信号进行EQ补偿,另一方面,目标EQ补偿信号是依据当前用户目标频谱类型得到的,因此,相对于固定的EQ补偿方式,更适应用户的听觉习惯,提高了用户的体验感。
图2为本发明实施例提供的另一种音频信号的调节方法的流程图。如图2所示,在上述实施例的基础上,本实施例中,通过预先统计用户的收听的音频文件来确定用户的目标频谱类型。S1具体包括:
S10:统计当前用户所收听的音频文件,音频文件的累积播放时长不小于预定时长。
S11:对音频文件进行频谱分析得到目标频率分布曲线。
S12:将目标频率分布曲线与预设频谱中的预设频率分布曲线比较得到目标频谱类型。其中,预设频谱包括多种预设频率分布曲线和与各预设频率分布曲线对应的频谱类型。
需要说明的是,本发明中的音频文件可以是一个,也可以是多个,只要音频文件的累积播放时长不小于预定时长即可。若音频文件为一个,则该音频文件的播放时长不小于预定时长,若音频文件为多个,则每一个音频文件的播放时长相加之和的累积播放时长不小于预定时长。在具体实施中,预定时长可以根据具体情况而定,可以理解的是,预定时长越长则得到的目标频谱类型更接近用户的习惯,即更能真实反映用户的需求,但是预定时长过长也会相应增加处理所需要的时间。作为优选地实施方式,预定时长具体为10小时。
虽然,对于音频文件的数量不作限定,但是如果音频文件为一个的话,一旦选取的不够客观,则容易造成目标频谱类型不能很好反应用户的收听习惯,因此,作为优选地实施方式,音频文件的数量为多个。以此,能够提高统计过程中的容错率,避免由于音频文件的选取不当而造成最后音频信号调节不满足用户的需求。
如果音频文件为多个,则这些音频文件可以是用户在某一时间段连续收听的,也可以是随机选取用户在不连续的时间段收听的,本实施例不作限定。此外,音频文件的播放通常是持续若干分钟,在收听过程中,用户可能在当前音频文件还未播放完毕就切换至下一个音频文件,导致音频文件未播放完毕,这种情况下,有可能是用户不喜欢该类型的音频文件,因此,为了更真实反应用户的收听习惯,在选取音频文件时,优选用户完整收听的音频文件。
另外,音频文件的类型虽然不作限定,但是考虑到用户的真实需求,通常是在播放音乐类型的音频文件时,才更需要进行音频信号的调节,如果是普通的新闻广播或者相声类的音频文件,则可能用户并不需要进行调节。因此,在具体实施中,音频文件优选地是音乐类型的音频文件。基于此,则S3之前还可以增加一个步骤,即判断待播放的音频信号是否为音乐类型的音频文件,如果是,则进入S3,否则结束。
统计好用户的音频文件后,需要对音频文件进行音频分析从而得到对应的目标频率分布曲线。作为优选地实施方式,可以通过FFT(快速傅立叶变换)对音频文件进行频谱分析。FFT相对于传统的DFT,其算法高效,能够节约计算的时间。
可以理解的是,如果音频文件为一个,则目标频率分布曲线就是一条,如果音频文件为多个,则目标频率分布曲线就是多条。无论目标频率分布曲线是多条还是一条,都需要与预设频谱中的预设频率分布曲线进行比较得到目标频谱类型。预设频谱中包含有多条预设频率分布曲线和多个频谱类型,二者是一一对应的。在具体实施中,每一种预设频率分布曲线是由两条曲线构成,一条曲线的横坐标是频率,纵坐标是幅度值的上限(简称上限),另一条曲线的横坐标是频率,纵坐标是幅度值的下限(简称下限),目标频率分布曲线的横坐标是频率,纵坐标是幅度值。本实施例中,就是比较目标频率分布曲线与哪一种预设频率分布曲线中最为接近,则最为接近的曲线对应的频谱类型就是该目标频率分布曲线的频谱类型,即目标频谱类型。
通常情况下,终端是有两个声道,一个是左声道,另一个是右声道,通过左声道可以得到一条目标频率分布曲线,通过右声道可以得到一条目标频率分布曲线。由于在原始录音时,麦克风的摆放位置不同,所以这两条目标频率分布曲线存在偏差,但是二者的差异较小,通常不影响频谱类型的判断。因此,在具体实施中,可以选取右声道对应的目标频率分布曲线,也可以选取左声道对应的目标频率分布曲线,或者对两个声道的目标频率分布曲线做均值运算得到一条目标频率分布曲线,本实施例不作限定。需要说明的是,本实施例中提到的目标频率分布曲线均是某一声道得到的目标频率分布曲线,或者是均值之后得到的一条目标频率分布曲线。
本实施例中,通过统计当前用户所收听的音频文件来确定该用户对应的目标频谱类型,更能够真实反映用户的用耳习惯,从而最终对音频信号的调节也更为准确。
图3为本发明实施例提供的一种S12的流程图。如果预设频谱中包含的预设频率分布曲线的种类越多,则目标频率分布曲线的全部频点落在某一预设频率分布曲线内的概率越大,但是事实上,预设频谱中不可能将每一个用户的目标频率分布曲线都涵盖,因此,本实施例中提供了一种目标音频分布曲线与预设频谱中的预设频率分布曲线比较的方法。在上述实施例的基础上,作为优选地实施方式,S12具体包括:
S120:判断音频文件是否为一个,如果是,则进入S121,否则进入S124。
S121:判断目标频率分布曲线是否与预设频谱中的一种预设频率分布曲线全部吻合;如果是,则进入S122,否则进入S123。
S122:将当前预设频率分布曲线对应的频谱类型作为目标频谱类型。
S123:选取目标频率分布曲线中的预设类型的频点,得到各频点的幅度值,统计各频点对应的预设频率分布曲线,并将统计结果中出现次数最多的预设频率分布曲线对应的频谱类型作为目标频谱类型。
S124:选取其中一条目标频率分布曲线。
S125:判断当前目标频率分布曲线是否与预设频谱中的一种预设频率分布曲线全部吻合;如果是,则进入S126,否则进入S127。
S126:将当前预设频率分布曲线对应的频谱类型作为当前目标频率分布曲线对应的频谱类型,进入S128。
S127:选取当前目标频率分布曲线中的预设类型的频点,得到各频点的幅度值,统计各频点对应的预设频率分布曲线,并将统计结果中出现次数最多的预设频率分布曲线对应的频谱类型作为当前目标频率分布曲线对应的频谱类型,进入S128。
S128:判断是否有剩余的目标频率分布曲线,如果是,则返回S124,否则进入S129。
S129:统计得到的多个频谱类型,将统计结果中出现次数最多的频谱类型作为目标频谱类型。
具体的,本实施例中首先判断音频文件是否为一个,如果是,则只有一条目标频率分布曲线,只需要判断该目标频率分布曲线与预设频谱中的哪一种预设频率分布曲线最接近即可,如果否,则就有多条目标频率分布曲线,需要将每一条目标频率分布曲线与预设频谱中的预设频率分布曲线比较。
本实施例中所述的吻合包含有以下三种情况,一种是目标频率分布曲线与某一种预设频率分布曲线中的上限对应的曲线完全重合,另一种是目标频率分布曲线与某一种预设频率分布曲线中的下限对应的曲线完全重合,最后一种是目标频率分布曲线在某一种预设频率分布曲线的上限对应的曲线和下限对应的曲线之间(可以是所有的频点的幅度值都在上限和下限之间,也可以是部分频点的幅度值与上限或下限相等)。满足以上三种情况中的一种,则目标频率分布曲线就是与预设频谱中的一种预设频率分布曲线全部吻合,否则,需要进一步判断。通常情况下,一条目标频率分布曲线是由大量不同的单频点构成的,如果对所有的频点进行判断是不可能实现的,因此,本实施例中选取一些特殊的频点,即预设类型的频点。在具体实施中,预设类型的频点选取的依据是频率分布曲线的拐点、常见的乐器的频点等。优选地,频点具体包括50Hz、100Hz、400Hz、1kHz、2kHz、7kHz和10kHz。可以理解的是,以上列举的频点仅仅是一种具体实施方式,并不代表只有这几个频点可以作为判断的依据。
本实施例中,S123中的统计各频点对应的预设频率分布曲线具体是如下操作:在选取频点后也就能从目标频率分布曲线上得到各频点的幅度值,然后仅对每个频点的幅度值作为判断依据,即统计每一个幅度值是位于哪一种预设频率分布曲线的上限和下限之间,这样一个幅度值就可以确定一种预设频率分布曲线,多个幅度值就确定了多条预设频率分布曲线。将出现次数最多的预设频率分布曲线对应的频谱类型作为目标频谱类型。
以上过程是对于一个音频文件的情况的描述,如果是多个音频文件,则对应的过程其实与一个音频文件的情况是类似的,相同的部分不再赘述。对于多个音频文件经过S124-S127之后,就得到了多个频谱类型,本实施例中是将出现次数最多的频谱类型作为目标频谱类型。
表1为本发明实施例提供的一种预设频谱的分布表。需要说明的是,表1中仅仅是一种预设频谱的一种具体划分方式,并不代表只有这一种划分方式。值得注意的是,表1中,仅仅是在50Hz这个频点对应的频谱类型不同,其余频点的类型都是相同,因此,针对于表1这样的划分方式,可以不对其它频点进行判断。
表1
为了让本领域技术人员更加清楚本发明的技术方案,以下给出一个具体例子进行说明。当一条目标频率分布曲线与预设频谱中的预设频率分布曲线都不吻合时,选取预设类型的频点,分别是50Hz、100Hz、400Hz、1kHz、2kHz、7kHz和10kHz。其中,50Hz的频点处的幅度值为-35(频谱类型为A2),100Hz的频点处的幅度值为-35(频谱类型为A1或A2或A3),400Hz的频点处的幅度值为-30(频谱类型为A1或A2或A3),1kHz的频点处的幅度值为-40(频谱类型为A1或A2或A3),2kHz的频点处的幅度值为-50(频谱类型为A1或A2或A3),7kHz的频点处的幅度值为-50(频谱类型为A1或A2或A3),10kHz的频点处的幅度值为-60(频谱类型为频谱类型为A1或A2或A3)。很显然,通过上述统计结果,由于在除了50Hz频点处有不同的频谱类型外,其余频点的频谱类型是相同的,因此,可以不考虑其它频点,A2出现的次数最多,那么A2就是目标频谱类型。
在具体实施中,虽然统计结果中出现两个或两个以上次数一样多的频谱类型的情况非常罕见,但是优选地,如果出现上述情况,则可以选取其中的一条频谱类型作为目标频谱类型,或者对这些频率类型对应的EQ补偿信号做均值运算,从而得到目标EQ补偿信号。
本实施例中提供了一种获取目标频谱类型的具体实现方法,该方法考虑到一个音频文件和多个音频文件的情况,能够提高方法的适用范围,另外,在目标频率分布曲线与预设频率分布曲线不吻合时,通过预设类型的频点进一步确定对应的预设频率分布曲线,然后将出现次数最多的预设频率分布曲线作为目标预设频率分布曲线,实际上是利用了概率分布的统计方法,能够进一步提高目标频谱类型的准确性。
在上述实施例的基础上,作为优选地实施方式,S2具体包括:
判断对应关系中是否包含有目标频谱类型;
如果是,则与将目标频谱类型对应的补偿信号作为目标EQ补偿信号;
如果否,则将与目标频谱类型最接近的频谱类型对应的补偿信号作为目标EQ补偿信号。
在具体实施中,预先设置的频谱类型有可能不存在目标频谱类型,例如,如果一个新用户,其听觉习惯与其他人有较大差异。针对这种情况,本实施中首先是要判断对应关系中是否包含有目标频谱类型,如果有,则直接将该类型对应的补偿信号作为目标EQ补偿信号,如果没有,则需要将与目标频谱类型最接近的频谱类型对应的补偿信号作为目标EQ补偿信号。这里的最接近的频谱类型的判断依据可以按照上一实施中,S120-S129的方式得到,具体不再赘述。
本实施例中无论是预先设置的频谱类型中是否包含有目标频谱类型,都可以得到对应的目标EQ补偿信号,降低了划分频谱类型的难度,提高了方法的适用范围。
在上述实施例的基础上,作为优选地实施方式,在S2和S3之间还包括:
向当前用户输出是否进行EQ补偿的选择信息。
若当前用户选择进行EQ补偿,则进入S3。
在具体实施中,并不是所有的用户都乐意接受对音频信号的调节,或者有的用户在某些时段不乐意接受对音频信号的调节,考虑到用户的体验,本实施例中,在进行音频信号调节之前,向用户输出是否进行EQ补偿的选择信息以供用户自行选择,如果用户选择了,则进行调节,否则,直接播放音频信号。
可以理解的是,选择信息的输出方式有多种,可以根据终端的类型来设定,例如,终端为手机,则可以在显示界面上输出选择信息,操作的方式可以是点击、可以是滑动等;终端为耳机,则可以是以语音输出的方式输出,然后接收用户反馈的语音信息进行判断从而确定用户是否要进行调节。
在上述实施例的基础上,作为优选地实施方式,S1之前还包括:
获取当前用户的身份信息;
根据身份信息判断是否已得到当前用户的目标频谱类型;
如果是,则进入S2,如果否,则进入S1。
在具体实施中,每个终端都可能会出现多个用户共同使用的情况,例如耳机可以是两个人共同使用或者是整个家庭的人一起使用。如果当前用户与上一个用户是相同的话,则对应的目标频谱类型是相同的,相当于已经获取了当前用户的目标频谱类型,因此,可以直接进入S2。应用该方法,如果当前用户不变的话,则不需要重复进行S1,能够节约时间。
本实施例中如何确定当前用户是否改变,是通过身份信息来确定的。而身份信息的获取途径本实施例不作限定。例如可以通过指纹信息进行识别,也可以是通过图像信息进行识别,也可以是心率识别,也可以是语音控制命令识别,当然也可以是声纹识别。可以根据终端的具体情况(例如终端的大小,硬件计算能力等)以及用户识别准确性的需求等选择对应的获取途径。
优选地,获取当前用户的身份信息具体为:通过指纹采集模块和/或心率采集模块获取当前用户的身份信息。
选择识别模块指纹识别,则可以采集用户的指纹信息,根据指纹信息获取用户的身份信息。或者是利用心率采集模块采集用户心率数值,根据用户心率数值获取用户身份信息。具体的,当终端为助听器或者是耳机(如无线耳机或者是入耳式耳机)时,由于设备体积相对较小,为了方便进行用户身份识别,可以通过心率采集模块来获取用户的身份信息。具体的,通过心率检测获取用户的心率数值;根据心率数值获取用户的身份信息。
具体的,本实施例中并不限定心率采集模块的具体位置,例如可以是在终端的任何位置增加一个心率采集模块,但是为了提取到更加准确的心率数值,当终端为耳机时,可以将心率采集模块设置在耳机前腔,用于测量使用者的心率脉动参数及心率数值。此时,耳机中的电路板将采集到的心率数值进行处理,获取使用者的身份信息。
上述实施例对于音频信号的调节方法进行了详细描述,本发明还提供一种音频信号的调节装置的实施例。图4为本发明实施例提供的一种音频信号的调节装置的结构图。该装置主要是功能模块的角度描述,包括:
获取模块10,用于获取当前用户的目标频谱类型。
查找模块11,用于根据预先设置的频谱类型和EQ补偿信号的对应关系,查找与目标频谱类型对应的目标EQ补偿信号。
补偿模块12,用于将目标EQ补偿信号加入当前用户待播放的音频信号中以进行调节。
需要说明的是,基于上述任意实施例,所述装置可以是基于可编程逻辑器件实现的,可编程逻辑器件包括FPGA,CPLD,单片机等。
本发明还提供一种与音频信号调节方法对应的音频信号的调节设备的实施例。该设备包括存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上述实施例所述的音频信号的调节方法的步骤。
基于上述实施例,音频信号调节方法由终端来实现,则存储器和处理器就可以是终端自身的存储器和处理器。在本发明的一些实施例中,处理器和存储器可通过总线或其它方式连接。
最后,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述实施例所述的音频信号的调节方法的步骤。
在具体实施中,所述模块如果以软件功能的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,当读取该存储介质时,执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
由于上述装置、设备以及计算机存储介质中对应的实施例与方法部分的实施例是相对应的,因此,三者对应的有益效果也与方法相同,这三个部分的实施例不再赘述。
以上对本发明所提供的音频信号的调节方法、装置、设备及计算机存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种音频信号的调节方法,其特征在于,包括:
S1:获取当前用户的目标频谱类型;
S2:根据预先设置的频谱类型和EQ补偿信号的对应关系,查找与所述目标频谱类型对应的目标EQ补偿信号;
S3:将所述目标EQ补偿信号加入当前用户待播放的音频信号中以进行调节。
2.根据权利要求1所述的音频信号的调节方法,其特征在于,S1具体包括:
S10:统计当前用户所收听的音频文件,所述音频文件的累积播放时长不小于预定时长;
S11:对所述音频文件进行频谱分析得到目标频率分布曲线;
S12:将所述目标频率分布曲线与预设频谱中的预设频率分布曲线比较得到所述目标频谱类型;
其中,所述预设频谱包括多种预设频率分布曲线和与各所述预设频率分布曲线对应的频谱类型。
3.根据权利要求2所述的音频信号的调节方法,其特征在于,所述S12具体包括:
S120:判断所述音频文件是否为一个,如果是,则进入S121,否则进入S124;
S121:判断所述目标频率分布曲线是否与所述预设频谱中的一种预设频率分布曲线全部吻合;如果是,则进入S122,否则进入S123;
S122:将当前预设频率分布曲线对应的频谱类型作为所述目标频谱类型;
S123:选取所述目标频率分布曲线中的预设类型的频点,得到各所述频点的幅度值,统计各所述频点对应的预设频率分布曲线,并将统计结果中出现次数最多的预设频率分布曲线对应的频谱类型作为所述目标频谱类型;
S124:选取其中一条所述目标频率分布曲线;
S125:判断当前目标频率分布曲线是否与所述预设频谱中的一种预设频率分布曲线全部吻合;如果是,则进入S126,否则进入S127;
S126:将当前预设频率分布曲线对应的频谱类型作为当前目标频率分布曲线对应的频谱类型,进入S128;
S127:选取当前目标频率分布曲线中的预设类型的频点,得到各所述频点的幅度值,统计各所述频点对应的预设频率分布曲线,并将统计结果中出现次数最多的预设频率分布曲线对应的频谱类型作为当前目标频率分布曲线对应的频谱类型,进入S128;
S128:判断是否有剩余的所述目标频率分布曲线,如果是,则返回S124,否则进入S129;
S129:统计得到的多个频谱类型,将统计结果中出现次数最多的频谱类型作为所述目标频谱类型。
4.根据权利要求1-3任意一项所述的音频信号的调节方法,其特征在于,S2具体包括:
判断所述对应关系中是否包含有所述目标频谱类型;
如果是,则与将所述目标频谱类型对应的补偿信号作为所述目标EQ补偿信号;
如果否,则将与所述目标频谱类型最接近的频谱类型对应的补偿信号作为所述目标EQ补偿信号。
5.根据权利要求1所述的音频信号的调节方法,其特征在于,在S2和S3之间还包括:
向当前用户输出是否进行EQ补偿的选择信息;
若当前用户选择进行EQ补偿,则进入S3。
6.根据权利要求1所述的音频信号的调节方法,其特征在于,S1之前还包括:
获取当前用户的身份信息;
根据所述身份信息判断是否已得到当前用户的目标频谱类型;
如果是,则进入S2,如果否,则进入S1。
7.根据权利要求6所述的音频信号的调节方法,其特征在于,所述获取当前用户的身份信息具体为:通过指纹采集模块和/或心率采集模块获取当前用户的身份信息。
8.一种音频信号的调节装置,其特征在于,包括:
获取模块,用于获取当前用户的目标频谱类型;
查找模块,用于根据预先设置的频谱类型和EQ补偿信号的对应关系,查找与所述目标频谱类型对应的目标EQ补偿信号;
补偿模块,用于将所述目标EQ补偿信号加入当前用户待播放的音频信号中以进行调节。
9.一种音频信号的调节设备,其特征在于,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的音频信号的调节方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的音频信号的调节方法的步骤。
CN201810994357.4A 2018-08-29 2018-08-29 一种音频信号的调节方法、装置、设备及计算机存储介质 Pending CN109119088A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810994357.4A CN109119088A (zh) 2018-08-29 2018-08-29 一种音频信号的调节方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810994357.4A CN109119088A (zh) 2018-08-29 2018-08-29 一种音频信号的调节方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN109119088A true CN109119088A (zh) 2019-01-01

Family

ID=64861187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810994357.4A Pending CN109119088A (zh) 2018-08-29 2018-08-29 一种音频信号的调节方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN109119088A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023044608A1 (zh) * 2021-09-22 2023-03-30 京东方科技集团股份有限公司 音频调节方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202587111U (zh) * 2012-05-17 2012-12-05 厦门毅想通信研发中心有限公司 音频信号处理系统及应用该音频信号处理系统的移动终端
CN103037100A (zh) * 2012-12-21 2013-04-10 广东欧珀移动通信有限公司 一种适用于智能手机的智能切换eq音效的方法
US20130272541A1 (en) * 2007-09-17 2013-10-17 Samsung Electronics Co., Ltd. Mobile communication device capable of setting tone color and method of setting tone color
CN105869626A (zh) * 2016-05-31 2016-08-17 宇龙计算机通信科技(深圳)有限公司 一种语速自动调节的方法及终端
CN105939421A (zh) * 2016-06-14 2016-09-14 努比亚技术有限公司 一种终端参数调整装置及方法
CN105955700A (zh) * 2016-06-16 2016-09-21 广东欧珀移动通信有限公司 一种音效调节方法及用户终端
CN106601268A (zh) * 2016-12-26 2017-04-26 腾讯音乐娱乐(深圳)有限公司 一种多媒体数据处理方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130272541A1 (en) * 2007-09-17 2013-10-17 Samsung Electronics Co., Ltd. Mobile communication device capable of setting tone color and method of setting tone color
CN202587111U (zh) * 2012-05-17 2012-12-05 厦门毅想通信研发中心有限公司 音频信号处理系统及应用该音频信号处理系统的移动终端
CN103037100A (zh) * 2012-12-21 2013-04-10 广东欧珀移动通信有限公司 一种适用于智能手机的智能切换eq音效的方法
CN105869626A (zh) * 2016-05-31 2016-08-17 宇龙计算机通信科技(深圳)有限公司 一种语速自动调节的方法及终端
CN105939421A (zh) * 2016-06-14 2016-09-14 努比亚技术有限公司 一种终端参数调整装置及方法
CN105955700A (zh) * 2016-06-16 2016-09-21 广东欧珀移动通信有限公司 一种音效调节方法及用户终端
CN106601268A (zh) * 2016-12-26 2017-04-26 腾讯音乐娱乐(深圳)有限公司 一种多媒体数据处理方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023044608A1 (zh) * 2021-09-22 2023-03-30 京东方科技集团股份有限公司 音频调节方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US7542816B2 (en) System, method and computer program product for automatically selecting, suggesting and playing music media files
US20140309549A1 (en) Methods for testing hearing
CN109218535A (zh) 智能调节音量的方法、装置、存储介质及终端
CN110418232A (zh) 一种音量调节方法及装置、计算机可读存储介质
CN107085512A (zh) 一种音频播放方法及移动终端
CN108919953A (zh) 一种音乐调整方法、装置及存储介质
CN103177743B (zh) 一种歌曲播放方法及装置
CN105404642B (zh) 一种音频播放方法及用户终端
CN110193127A (zh) 音乐辅助睡眠的方法、装置、计算机设备及存储介质
CN112866770B (zh) 一种设备控制方法、装置、电子设备及存储介质
CN108363530B (zh) 电子装置、音乐播放方法及相关产品
CN110047515A (zh) 一种音频识别方法、装置、设备及存储介质
CN105898650A (zh) 用于智能设备的音量提示方法及系统
CN106775568A (zh) 一种音效调节方法、装置及移动终端
CN110428835B (zh) 一种语音设备的调节方法、装置、存储介质及语音设备
CN102881309B (zh) 歌词文件生成方法及装置
CN110825449A (zh) 一种音乐播放方法、电子设备及存储介质
CN104728994B (zh) 空调的控制方法、控制装置及空调
CN105843580A (zh) 一种车载播放器音量调整方法和装置
CN108513206B (zh) 一种音响系统控制方法、装置、终端设备和存储介质
CN106411969B (zh) 歌单生成方法及装置
CN109119088A (zh) 一种音频信号的调节方法、装置、设备及计算机存储介质
US20150194154A1 (en) Method for processing audio signal and audio signal processing apparatus adopting the same
CN108962286A (zh) 音频识别方法、装置及存储介质
CN109510907B (zh) 铃音设置方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190101