CN111246344A - 一种用于音频处理的方法及智能音箱 - Google Patents

一种用于音频处理的方法及智能音箱 Download PDF

Info

Publication number
CN111246344A
CN111246344A CN202010287895.7A CN202010287895A CN111246344A CN 111246344 A CN111246344 A CN 111246344A CN 202010287895 A CN202010287895 A CN 202010287895A CN 111246344 A CN111246344 A CN 111246344A
Authority
CN
China
Prior art keywords
audio
data
noise
played
magnetic field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010287895.7A
Other languages
English (en)
Other versions
CN111246344B (zh
Inventor
袁昌龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Enkor Electronics Shenzhen Co ltd
Original Assignee
Enkor Electronics Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enkor Electronics Shenzhen Co ltd filed Critical Enkor Electronics Shenzhen Co ltd
Priority to CN202010287895.7A priority Critical patent/CN111246344B/zh
Publication of CN111246344A publication Critical patent/CN111246344A/zh
Application granted granted Critical
Publication of CN111246344B publication Critical patent/CN111246344B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明提供了一种用于音频处理的方法及智能音箱,该方法包括:获取待播放音频数据,获取当前运行信息,当前运行信息包括运行电压、运行电流和运行振动幅度;获取当前所处环境的磁场干扰信息,根据运行电压、运行电流和磁场干扰信息对待播放音频进行降噪;对待播放音频数据进行语音端点检测,根据语音端点检测结果对待播放音频数据进行音频分割,得到有效音频;根据运行振动幅度对待播放音频中的有效音频进行音频降噪,将音频降噪后的待播放音频数据进行播放。本发明通过基于当前所处环境的磁场干扰信息的获取,以使对不同磁场干扰环境下产生的噪声数据进行降噪,提高了音频降噪效率。

Description

一种用于音频处理的方法及智能音箱
技术领域
本发明属于音频处理技术领域,尤其涉及一种用于音频处理的方法及智能音箱。
背景技术
随着技术的不断进步,智能音箱已经逐步普及。尤其是智能音箱,能够与智能手机、平板电脑等多种智能设备进行数据交互,同时其具有体积小巧、轻便等优点广受用户的喜爱。智能音箱可接收用户通过移动终端(手机、Pad、个人电脑等)推送的待播放音频数据以实现对应音频播放的效果。为提高用户的视听体验,智能音箱的音频降噪问题越来越受人们所重视。
现有的智能音箱使用过程中,均是通过采用滤波器的方式进行音频的降噪处理,但由于滤波器只能针对指定的噪声数据进行滤波降噪,进而导致音频降噪效率低下,降低了用户的视听体验。
发明内容
本发明实施例的目的在于提供一种用于音频处理的方法及智能音箱,旨在解决现有的智能音箱使用过程中,由于采用滤波器进行指定噪声数据降噪所导致的音频降噪效率低下的问题。
本发明实施例是这样实现的,一种用于音频处理的方法,所述方法包括:
获取待播放音频数据,并获取当前运行信息,所述当前运行信息包括运行电压、运行电流和运行振动幅度;
获取当前所处环境的磁场干扰信息,并根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪;
对所述待播放音频数据进行语音端点检测,并根据所述语音端点检测结果对所述待播放音频数据进行音频分割,得到有效音频;
根据所述运行振动幅度对所述待播放音频中的有效音频进行音频降噪,并将音频降噪后的所述待播放音频数据进行播放。
更进一步的,所述根据所述语音端点检测结果对所述待播放音频数据进行音频分割的步骤包括:
将所述语音端点检测结果中相邻有效音频点至无效音频点之间的音频数据标记为所述有效音频;
分别获取每个所述有效音频点的播放时间,并根据所述播放时间对所述有效音频进行时间标记。
更进一步的,所述根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪的步骤包括:
根据所述运行电流和所述运行电压在预存储的噪声数据库中查询噪声数据,得到第一噪声数据;
根据所述磁场干扰信息中存储的磁场强度在所述噪声数据库中查询噪声数据,得到第二噪声数据;
根据所述第一噪声数据和所述第二噪声数据对所述待播放音频数据进行降噪。
更进一步的,所述根据所述运行振动幅度对所述待播放音频中的有效音频进行音频降噪的步骤包括:
获取所述有效音频中每个音频点的音频响度,并将所述音频响度与预存储的振动幅度表进行匹配,以得到每个所述音频点对应的运行振动幅度;
根据所述运行振动幅度在噪声数据库中查询噪声数据,以得到每个所述音频点对应的第三噪声数据;
根据所述第三噪声数据对所述待播放音频数据中对应所述有效音频进行降噪。
更进一步的,所述根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪的步骤还包括:
控制梯度磁场脉冲驱动梯度磁场发生装置,对当前所处的音频环境施加有梯度的反向磁场信息;
通过恒定周期重复控制所述梯度磁场脉冲改变梯度磁场脉冲的波形,以使所述当前所处的音频环境中的磁场噪声频率向低频侧偏移。
更进一步的,所述将音频降噪后的所述待播放音频数据进行播放的步骤之前,所述方法还包括:
根据预存储的采集时间对所述当前所处环境进行音频采集,得到第四噪声数据;
根据所述第四噪声数据对所述待播放音频数据进行降噪,并将降噪后的所述待播放音频数据进行播放。
更进一步的,所述将音频降噪后的所述待播放音频数据进行播放的步骤之前,所述方法还包括:
获取待播放音频数据的播放总时间,并根据所述播放总时间查询热噪声曲线;
根据所述热噪声曲线对所述待播放音频数据进行降噪,并将降噪后的所述待播放音频数据进行播放。
本发明实施例的另一目的在于提供一种智能音箱,包括:
运行信息获取模块,用于获取待播放音频数据,并获取当前运行信息,所述当前运行信息包括运行电压、运行电流和运行振动幅度;
第一降噪模块,用于获取当前所处环境的磁场干扰信息,并根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪;
音频端点检测模块,用于对所述待播放音频数据进行语音端点检测,并根据所述语音端点检测结果对所述待播放音频数据进行音频分割,得到有效音频;
第二降噪模块,用于根据所述运行振动幅度对所述待播放音频中的有效音频进行音频降噪,并将音频降噪后的所述待播放音频数据进行播放。
更进一步的,所述音频端点检测模块还用于:
将所述语音端点检测结果中相邻有效音频点至无效音频点之间的音频数据标记为所述有效音频;
分别获取每个所述有效音频点的播放时间,并根据所述播放时间对所述有效音频进行时间标记。
更进一步的,所述第一降噪模块还用于:
根据所述运行电流和所述运行电压在预存储的噪声数据库中查询噪声数据,得到第一噪声数据;
根据所述磁场干扰信息中存储的磁场强度在所述噪声数据库中查询噪声数据,得到第二噪声数据;
根据所述第一噪声数据和所述第二噪声数据对所述待播放音频数据进行降噪。
本发明实施例的另一目的在于提供一种存储介质,其存储有上述的移动终端中所使用的计算机程序,该计算机程序被处理器执行时实现上述的用于音频处理的方法的步骤。
本发明实施例,通过基于智能音箱运行信息的获取,以针对不同运行状态下的智能音箱发出的噪声进行音频降噪,提高了音频降噪的准确性,且通过基于当前所处环境的磁场干扰信息的获取,以使对不同磁场干扰环境下产生的噪声数据进行降噪,提高了音频降噪效率。
附图说明
图1是本发明第一实施例提供的用于音频处理的方法的流程图;
图2是本发明第二实施例提供的用于音频处理的方法的流程图;
图3是本发明第三实施例提供的用于音频处理的方法的流程图;
图4是本发明第四实施例提供的智能音箱的结构示意图;
图5是本发明第五实施例提供的移动终端的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
实施例一
请参阅图1,是本发明第一实施例提供的用于音频处理的方法的流程图,包括步骤:
步骤S10,获取待播放音频数据,并获取当前运行信息;
其中,该用于音频处理的方法可应用于任一智能音箱中,用于降低智能音箱在待播放音频数据播放过程中的噪音,优选的,该步骤中,可以通过在智能音箱中设置多个不同的传感器,基于该多个不同的传感器对该智能音箱的当前运行信息进行获取;
具体的,该步骤中,当智能音箱接收到用户通过移动终端(手机、Pad、个人电脑等)推送的待播放音频数据时,发送采集指令至各个传感器,以得到该当前运行信息,该当前运行信息包括运行电压、运行电流和运行振动幅度。
步骤S20,获取当前所处环境的磁场干扰信息,并根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪;
其中,该智能音箱上设有磁场传感器,基于该磁场传感器能有效的对智能音箱当前所处环境的磁场强度和方向进行检测,以得到该磁场干扰信息;
具体的,本实施例中预存储有噪声数据库,该噪声数据库中存储有不同运行电压、运行电流和磁场干扰信息与对应噪声数据之间的对应关系,由于当智能音箱处于不同运行电压、运行电流和磁场干扰强度下时,自身内部所产生的噪声数据不相同,因此,为提高对待播放音频数据的降噪准确性,可以通过基于当前运行电压、当前运行电流、当前磁场干扰信息与噪声数据库之间的匹配结果,以查询该智能音箱当前运行信息下所对应的目标噪声数据;
优选的,该步骤中,可以通过将匹配到的目标噪声数据与该待播放音频数据进行音频分析的方式进行降噪,即可以通过采用频谱分析、功率谱分析或倒频谱等分析的结果,对该待播放音频数据进行降噪。
步骤S30,对所述待播放音频数据进行语音端点检测,并根据所述语音端点检测结果对所述待播放音频数据进行音频分割,得到有效音频;
其中,语音端点检测(Voice Activity Detection,VAD)又称语音活动检测和语音边界检测,该语音端点检测的目的是从待播放音频数据的声音信号流里识别各个语音节点的静音期,因此,基于该各个语音节点的静音期检测结果,能有效的对该待播放音频数据中的语音节点进行分割,以得到有效音频和静音音频,该有效音频所对应的音频数据为有声音频,该静音音频所对应的音频数据为无声音频。
步骤S40,根据所述运行振动幅度对所述待播放音频中的有效音频进行音频降噪,并将音频降噪后的所述待播放音频数据进行播放;
其中,在音频数据的播放过程中,不同响度的音频对该智能音箱所产生的振动幅度不相同,而当智能音箱处于不同振动幅度下时,内部元器件或电子电路所产生的晃动不相同,导致不同运行振动幅度下智能音箱所产生的噪声数据不相同,因此,该步骤中,可以基于该运行振动幅度对该有效音频进行降噪,以提高对该待播放音频数据的音频降噪效果;
具体的,该运行振动幅度中存储有每个时间点与对应振动幅度值之间的对应关系,因此,基于该时间点可以将运行振动幅度中的每个振动幅度值与待播放音频数据中的音频节点进行对齐,并基于对齐结果能针对性的进行音频降噪,进一步地提高了对待播放音频数据的降噪效果。
本实施例,通过基于智能音箱运行信息的获取,以针对不同运行状态下的智能音箱发出的噪声进行音频降噪,提高了音频降噪的准确性,且通过基于当前所处环境的磁场干扰信息的获取,以使对不同磁场干扰环境下产生的噪声数据进行降噪,提高了音频降噪效率。
实施例二
请参阅图2,是本发明第二实施例提供的用于音频处理的方法的流程图,包括步骤:
步骤S11,获取待播放音频数据,并获取当前运行信息;
其中,该用于音频处理的方法可应用于任一智能音箱中,用于降低智能音箱在待播放音频数据播放过程中的噪音,所述当前运行信息包括运行电压、运行电流和运行振动幅度。
步骤S21,获取当前所处环境的磁场干扰信息,并根据所述运行电流和所述运行电压在预存储的噪声数据库中查询噪声数据,得到第一噪声数据;
其中,该噪声数据库中存储有不同运行电流、运行电压与对应噪声数据之间的对应关系,因此,通过将该运行电流和运行电压在噪声数据库中查询噪声数据,以得到该智能音箱中基于电流和电压所产生的噪声数据。
步骤S31,根据所述磁场干扰信息中存储的磁场强度在所述噪声数据库中查询噪声数据,得到第二噪声数据;
其中,该噪声数据库中存储有不同磁场强度与对应噪声数据之间的对应关系,因此,通过将该磁场强度在噪声数据库中查询噪声数据,以得到该智能音箱中基于外部磁场干扰所产生的噪声数据。
具体的,该步骤中,通过基于该磁场干扰信息查询到的第二噪声数据能有效的降低由于磁场干扰对待播放音频数据的噪声影响,优选的,该步骤中,根据所述磁场干扰信息对所述待播放音频进行降噪的步骤还包括:
控制梯度磁场脉冲驱动梯度磁场发生装置,对当前所处的音频环境施加有梯度的反向磁场信息;
通过恒定周期重复控制所述梯度磁场脉冲改变梯度磁场脉冲的波形,以使所述当前所处的音频环境中的磁场噪声频率向低频侧偏移;
其中,通过驱动梯度磁场发生装置对当前所处的音频环境施加有梯度的反向磁场信息的设计,能有效的对当前所处音频环境中的磁场干扰进行抑制,进而降低了由于磁场干扰对待播放音频数据的噪声影响。
步骤S41,根据所述第一噪声数据和所述第二噪声数据对所述待播放音频数据进行降噪;
其中,可以通过将查询到的第一噪声数据和第二噪声数据与该待播放音频数据进行音频分析的方式进行降噪,即可以通过采用频谱分析、功率谱分析或倒频谱等分析的结果,对该待播放音频数据进行降噪。
优选的,该步骤中,还可以通过将该第一噪声数据和第二噪声数据进行音频组合,得到组合音频,通过将该组合音频与该待播放音频数据进行音频分析,并基于音频分析结果对应进行音频降噪。
步骤S51,对所述待播放音频数据进行语音端点检测,并将所述语音端点检测结果中相邻有效音频点至无效音频点之间的音频数据标记为所述有效音频;
其中,该语音端点检测中存储该待播放音频数据中各个音频点的音量标记值,当该音量标记值越大时,则对应音频点的音频数据声音越大,该步骤中,通过依序判断每个音频点上的音量标记值是否大于标记阈值,并当判断到音量标记值大于该标记阈值时,则判定对应音频点为有效音频点,当判断到音量标记值小于或等于该标记阈值时,则判定对应音频点为无效音频点;
优选的,该步骤中,相邻有效音频点至无效音频点之间的音频数据为有效音频,相邻有效音频点至有效音频点之间的音频数据为有效音频,相邻无效音频点至有效音频点之间的音频数据为无效音频,相邻无效音频点至无效音频点之间的音频数据为无效音频;
例如,当该待检测音频数据依序包括音频点A、音频点B、音频点C和音频点D,根据该语音端点检测的结果判断到该音频点A为无效音频、音频点B为有效音频、音频点C为无效音频和音频点D为无效音频,因此,该音频点A至音频点B之间的音频数据为有效音频,该音频点B至音频点C之间的音频数据为有效音频,该音频点C至音频点D之间的音频数据为无效音频。
步骤S61,分别获取每个所述有效音频点的播放时间,并根据所述播放时间对所述有效音频进行时间标记;
其中,每个音频点均对应唯一一个播放时间,因此,根据该播放时间能对所述有效音频中对应的音频点进行时间标记,以使得到该有效音频的播放时间段。
步骤S71,获取所述有效音频中每个音频点的音频响度,并将所述音频响度与预存储的振动幅度表进行匹配,以得到每个所述音频点对应的运行振动幅度;
其中,该振动幅度表中存储有不同音频响度与运行振动幅度之间的对应关系,因此,通过将所述音频响度与振动幅度表进行匹配,以查询该有效音频中每个有效音频点所对应的运行振动幅度。
步骤S81,根据所述运行振动幅度在噪声数据库中查询噪声数据,以得到每个所述音频点对应的第三噪声数据;
其中,在音频数据的播放过程中,不同响度的音频对该智能音箱所产生的振动幅度不相同,而当智能音箱处于不同振动幅度下时,内部元器件或电子电路所产生的晃动不相同,导致不同运行振动幅度下智能音箱所产生的噪声数据不相同;
因此,本实施例中,为保障消除每个由于有效音频中有效音频点播放振动所产生的噪声,该步骤基于每个所述运行振动幅度与噪声数据库之间的匹配结果,以得到该第三噪声数据,该第三噪声数据中存储有每个有效音频点与对应噪声数据之间的对应关系。
步骤S91,根据所述第三噪声数据对所述待播放音频数据中对应所述有效音频进行降噪,并将音频降噪后的所述待播放音频数据进行播放;
其中,基于该第三噪声数据中每个有效音频点与对应噪声数据之间的对应关系,能有效的对该待播放音频数据中对应有效音频进行音频降噪处理,以使能对不同运行振动幅度所产生的噪声数据进行降噪,提高了对该待播放音频数据的降噪效果。
本实施例中,通过基于智能音箱运行信息的获取,以针对不同运行状态下的智能音箱发出的噪声进行音频降噪,提高了音频降噪的准确性,且通过基于当前所处环境的磁场干扰信息的获取,以使对不同磁场干扰环境下产生的噪声数据进行降噪,提高了音频降噪效率。
实施例三
请参阅图3,是本发明第三实施例提供的用于音频处理的方法的流程图,包括步骤:
步骤S12,获取待播放音频数据,并获取当前运行信息;
其中,该用于音频处理的方法可应用于任一智能音箱中,用于降低智能音箱在待播放音频数据播放过程中的噪音,所述当前运行信息包括运行电压、运行电流和运行振动幅度。
步骤S22,获取当前所处环境的磁场干扰信息,并根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪;
步骤S32,对所述待播放音频数据进行语音端点检测,并根据所述语音端点检测结果对所述待播放音频数据进行音频分割,得到有效音频;
步骤S42,根据所述运行振动幅度对所述待播放音频中的有效音频进行音频降噪,并根据预存储的采集时间对所述当前所处环境进行音频采集,得到第四噪声数据;
其中,该当前所处环境可以为该智能音箱的内部发声环境或智能音箱的外部环境,该采集时间可以根据需求进行设置,例如该采集时间可以设置为0.5秒、1秒或2秒等;
优选的,该步骤中,通过对该当前所处环境进行音频采集的设计,能有效的获取到该当前所处环境的环境音频,并将该环境音频设置为第四噪声数据。
步骤S52,根据所述第四噪声数据对所述待播放音频数据进行降噪,获取待播放音频数据的播放总时间,并根据所述播放总时间查询热噪声曲线;
其中,通过根据所述第四噪声数据对所述待播放音频数据进行降噪的设计,能有效的降低由于该智能音箱的内部发声环境或外部环境所产生的噪声数据对该待播放音频数据的噪声影响,提高了对该待播放音频的降噪效果。
优选的,本实施例中预存储有热噪数据库,该热噪数据库中存储有不同播放时间长度所对应的热噪声曲线,因此,通过将该播放总时间与热噪数据库中存储的播放时间长度进行匹配,以得到对应的热噪声曲线,该热噪声曲线为该智能音箱运行过程中,每个运行时间点由于设备发热所对应产生的噪声数据。
步骤S62,根据所述热噪声曲线对所述待播放音频数据进行降噪,并获取当前供电模式;
其中,通过根据所述热噪声曲线对所述待播放音频数据进行降噪的设计,能有效的降低由于该智能音箱运行过程中发热所产生的噪声数据对该待播放音频数据的噪声影响,提高了对该待播放音频的降噪效果。
优选的,该智能音箱运行过程中电源供电会产生噪声数据,且智能音箱处于不同的供电模式下所对应的电源接地方式不相同,进而使得不同供电模式下所产生的噪声数据不相同,因此,该步骤中,通过获取该智能音箱的当前供电模式,以提高后续针对电源所产生的噪声数据降噪的准确性。
步骤S72,根据所述当前供电模式在噪声数据库中查询噪声数据,得到第五噪声数据;
其中,该噪声数据中存储有不同供电模式与对应噪声数据之间的对应关系,不同供电模式下的接地数量和接地方式不相同,因此,该步骤中,通过将该当前供电模式所对应的接地数量和接地方式与噪声数据库进行匹配,以查询该第五噪声数据。
步骤S82,根据所述第五噪声数据对所述待播放音频数据进行降噪,并将降噪后的所述待播放音频数据进行播放;
其中,通过根据所述第五噪声数据对所述待播放音频数据进行降噪的设计,能有效的降低由于该智能音箱运行过程中供电模式接地方式对该待播放音频数据的噪声影响,提高了对该待播放音频的降噪效果。
本实施例,通过基于智能音箱运行信息的获取,以针对不同运行状态下的智能音箱发出的噪声进行音频降噪,提高了音频降噪的准确性,且通过基于当前所处环境的磁场干扰信息的获取,以使对不同磁场干扰环境下产生的噪声数据进行降噪,提高了音频降噪效率。
实施例四
请参阅图4,是本发明第四实施例提供的智能音箱100的结构示意图,包括:运行信息获取模块10、第一降噪模块11、音频端点检测模块12和第二降噪模块13,其中:
运行信息获取模块10,用于获取待播放音频数据,并获取当前运行信息,所述当前运行信息包括运行电压、运行电流和运行振动幅度,其中,该用于音频处理的方法可应用于任一智能音箱中,用于降低智能音箱在待播放音频数据播放过程中的噪音,优选的,该模块中,可以通过在智能音箱中设置多个不同的传感器,基于该多个不同的传感器对该智能音箱的当前运行信息进行获取。
第一降噪模块11,用于获取当前所处环境的磁场干扰信息,并根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪,其中,该智能音箱上设有磁场传感器,基于该磁场传感器能有效的对智能音箱当前所处环境的磁场强度和方向进行检测,以得到该磁场干扰信息;具体的,本实施例中预存储有噪声数据库,该噪声数据库中存储有不同运行电压、运行电流和磁场干扰信息与对应噪声数据之间的对应关系,由于当智能音箱处于不同运行电压、运行电流和磁场干扰强度下时,自身内部所产生的噪声数据不相同,因此,为提高对待播放音频数据的降噪准确性,可以通过基于当前运行电压、当前运行电流、当前磁场干扰信息与噪声数据库之间的匹配结果,以查询该智能音箱当前运行信息下所对应的目标噪声数据。
其中,所述第一降噪模块11还用于:根据所述运行电流和所述运行电压在预存储的噪声数据库中查询噪声数据,得到第一噪声数据;
根据所述磁场干扰信息中存储的磁场强度在所述噪声数据库中查询噪声数据,得到第二噪声数据;
根据所述第一噪声数据和所述第二噪声数据对所述待播放音频数据进行降噪。
优选的,所述第一降噪模块11还用于:控制梯度磁场脉冲驱动梯度磁场发生装置,对当前所处的音频环境施加有梯度的反向磁场信息;
通过恒定周期重复控制所述梯度磁场脉冲改变梯度磁场脉冲的波形,以使所述当前所处的音频环境中的磁场噪声频率向低频侧偏移。
音频端点检测模块12,用于对所述待播放音频数据进行语音端点检测,并根据所述语音端点检测结果对所述待播放音频数据进行音频分割,得到有效音频,其中,语音端点检测(Voice Activity Detection,VAD)又称语音活动检测和语音边界检测,该语音端点检测的目的是从待播放音频数据的声音信号流里识别各个语音节点的静音期,因此,基于该各个语音节点的静音期检测结果,能有效的对该待播放音频数据中的语音节点进行分割,以得到有效音频和静音音频,该有效音频所对应的音频数据为有声音频,该静音音频所对应的音频数据为无声音频。
其中,所述音频端点检测模块12还用于:将所述语音端点检测结果中相邻有效音频点至无效音频点之间的音频数据标记为所述有效音频;
分别获取每个所述有效音频点的播放时间,并根据所述播放时间对所述有效音频进行时间标记。
第二降噪模块13,用于根据所述运行振动幅度对所述待播放音频中的有效音频进行音频降噪,并将音频降噪后的所述待播放音频数据进行播放,其中,在音频数据的播放过程中,不同响度的音频对该智能音箱所产生的振动幅度不相同,而当智能音箱处于不同振动幅度下时,内部元器件或电子电路所产生的晃动不相同,导致不同运行振动幅度下智能音箱所产生的噪声数据不相同,因此,该模块中,可以基于该运行振动幅度对该有效音频进行降噪,以提高对该待播放音频数据的音频降噪效果。
其中,所述第二降噪模块13还用于:获取所述有效音频中每个音频点的音频响度,并将所述音频响度与预存储的振动幅度表进行匹配,以得到每个所述音频点对应的运行振动幅度;
根据所述运行振动幅度在噪声数据库中查询噪声数据,以得到每个所述音频点对应的第三噪声数据;
根据所述第三噪声数据对所述待播放音频数据中对应所述有效音频进行降噪。
优选的,本实施例中,所述智能音箱100还包括:
第三降噪模块14,用于根据预存储的采集时间对所述当前所处环境进行音频采集,得到第四噪声数据;
根据所述第四噪声数据对所述待播放音频数据进行降噪,并将降噪后的所述待播放音频数据进行播放,其中,该当前所处环境可以为该智能音箱的内部发声环境或智能音箱的外部环境,该采集时间可以根据需求进行设置,例如该采集时间可以设置为0.5秒、1秒或2秒等;优选的,该模块中,通过对该当前所处环境进行音频采集的设计,能有效的获取到该当前所处环境的环境音频,并将该环境音频设置为第四噪声数据。
第四降噪模块15,用于获取待播放音频数据的播放总时间,并根据所述播放总时间查询热噪声曲线;
根据所述热噪声曲线对所述待播放音频数据进行降噪,并将降噪后的所述待播放音频数据进行播放,优选的,本实施例中预存储有热噪数据库,该热噪数据库中存储有不同播放时间长度所对应的热噪声曲线,因此,通过将该播放总时间与热噪数据库中存储的播放时间长度进行匹配,以得到对应的热噪声曲线,该热噪声曲线为该智能音箱运行过程中,每个运行时间点由于设备发热所对应产生的噪声数据。
第五降噪模块16,用于获取当前供电模式,并根据所述当前供电模式在噪声数据库中查询噪声数据,得到第五噪声数据;
根据所述第五噪声数据对所述待播放音频数据进行降噪,并将降噪后的所述待播放音频数据进行播放,其中,通过根据所述热噪声曲线对所述待播放音频数据进行降噪的设计,能有效的降低由于该智能音箱运行过程中发热所产生的噪声数据对该待播放音频数据的噪声影响,提高了对该待播放音频的降噪效果。
优选的,该智能音箱运行过程中电源供电会产生噪声数据,且智能音箱处于不同的供电模式下所对应的电源接地方式不相同,进而使得不同供电模式下所产生的噪声数据不相同,因此,该模块中,通过获取该智能音箱的当前供电模式,以提高后续针对电源所产生的噪声数据降噪的准确性。
本实施例,通过基于智能音箱运行信息的获取,以针对不同运行状态下的智能音箱发出的噪声进行音频降噪,提高了音频降噪的准确性,且通过基于当前所处环境的磁场干扰信息的获取,以使对不同磁场干扰环境下产生的噪声数据进行降噪,提高了音频降噪效率。
实施例五
请参阅图5,是本发明第五实施例提供的移动终端101,包括存储设备以及处理器,所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述移动终端101执行上述的用于音频处理的方法。
本实施例还提供了一种存储介质,其上存储有上述移动终端101中所使用的计算机程序,该程序在执行时,包括如下步骤:
获取待播放音频数据,并获取当前运行信息,所述当前运行信息包括运行电压、运行电流和运行振动幅度;
获取当前所处环境的磁场干扰信息,并根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪;
对所述待播放音频数据进行语音端点检测,并根据所述语音端点检测结果对所述待播放音频数据进行音频分割,得到有效音频;
根据所述运行振动幅度对所述待播放音频中的有效音频进行音频降噪,并将音频降噪后的所述待播放音频数据进行播放。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元或模块完成,即将存储装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施方式中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。
本领域技术人员可以理解,图4中示出的组成结构并不构成对本发明的智能音箱的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,而图1-3中的用于音频处理的方法亦采用图4中所示的更多或更少的部件,或者组合某些部件,或者不同的部件布置来实现。本发明所称的单元、模块等是指一种能够被所述目标智能音箱中的处理器(图未示)所执行并能够完成特定功能的一系列计算机程序,其均可存储于所述目标智能音箱的存储设备(图未示)内。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于音频处理的方法,应用于任一智能音箱,其特征在于,所述方法包括:
获取待播放音频数据,并获取当前运行信息,所述当前运行信息包括运行电压、运行电流和运行振动幅度;
获取当前所处环境的磁场干扰信息,并根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪;
对所述待播放音频数据进行语音端点检测,并根据所述语音端点检测结果对所述待播放音频数据进行音频分割,得到有效音频;
根据所述运行振动幅度对所述待播放音频中的有效音频进行音频降噪,并将音频降噪后的所述待播放音频数据进行播放。
2.如权利要求1所述的用于音频处理的方法,其特征在于,所述根据所述语音端点检测结果对所述待播放音频数据进行音频分割的步骤包括:
将所述语音端点检测结果中相邻有效音频点至无效音频点之间的音频数据标记为所述有效音频;
分别获取每个所述有效音频点的播放时间,并根据所述播放时间对所述有效音频进行时间标记。
3.如权利要求1所述的用于音频处理的方法,其特征在于,所述根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪的步骤包括:
根据所述运行电流和所述运行电压在预存储的噪声数据库中查询噪声数据,得到第一噪声数据;
根据所述磁场干扰信息中存储的磁场强度在所述噪声数据库中查询噪声数据,得到第二噪声数据;
根据所述第一噪声数据和所述第二噪声数据对所述待播放音频数据进行降噪。
4.如权利要求1所述的用于音频处理的方法,其特征在于,所述根据所述运行振动幅度对所述待播放音频中的有效音频进行音频降噪的步骤包括:
获取所述有效音频中每个音频点的音频响度,并将所述音频响度与预存储的振动幅度表进行匹配,以得到每个所述音频点对应的运行振动幅度;
根据所述运行振动幅度在噪声数据库中查询噪声数据,以得到每个所述音频点对应的第三噪声数据;
根据所述第三噪声数据对所述待播放音频数据中对应所述有效音频进行降噪。
5.如权利要求1所述的用于音频处理的方法,其特征在于,所述根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪的步骤还包括:
控制梯度磁场脉冲驱动梯度磁场发生装置,对当前所处的音频环境施加有梯度的反向磁场信息;
通过恒定周期重复控制所述梯度磁场脉冲改变梯度磁场脉冲的波形,以使所述当前所处的音频环境中的磁场噪声频率向低频侧偏移。
6.如权利要求1所述的用于音频处理的方法,其特征在于,所述将音频降噪后的所述待播放音频数据进行播放的步骤之前,所述方法还包括:
根据预存储的采集时间对所述当前所处环境进行音频采集,得到第四噪声数据;
根据所述第四噪声数据对所述待播放音频数据进行降噪,并将降噪后的所述待播放音频数据进行播放。
7.如权利要求1所述的用于音频处理的方法,其特征在于,所述将音频降噪后的所述待播放音频数据进行播放的步骤之前,所述方法还包括:
获取待播放音频数据的播放总时间,并根据所述播放总时间查询热噪声曲线;
根据所述热噪声曲线对所述待播放音频数据进行降噪,并将降噪后的所述待播放音频数据进行播放。
8.一种智能音箱,其特征在于,包括:
运行信息获取模块,用于获取待播放音频数据,并获取当前运行信息,所述当前运行信息包括运行电压、运行电流和运行振动幅度;
第一降噪模块,用于获取当前所处环境的磁场干扰信息,并根据所述运行电压、所述运行电流和所述磁场干扰信息对所述待播放音频进行降噪;
音频端点检测模块,用于对所述待播放音频数据进行语音端点检测,并根据所述语音端点检测结果对所述待播放音频数据进行音频分割,得到有效音频;
第二降噪模块,用于根据所述运行振动幅度对所述待播放音频中的有效音频进行音频降噪,并将音频降噪后的所述待播放音频数据进行播放。
9.如权利要求8所述的智能音箱,其特征在于,所述音频端点检测模块还用于:
将所述语音端点检测结果中相邻有效音频点至无效音频点之间的音频数据标记为所述有效音频;
分别获取每个所述有效音频点的播放时间,并根据所述播放时间对所述有效音频进行时间标记。
10.如权利要求8所述的智能音箱,其特征在于,所述第一降噪模块还用于:
根据所述运行电流和所述运行电压在预存储的噪声数据库中查询噪声数据,得到第一噪声数据;
根据所述磁场干扰信息中存储的磁场强度在所述噪声数据库中查询噪声数据,得到第二噪声数据;
根据所述第一噪声数据和所述第二噪声数据对所述待播放音频数据进行降噪。
CN202010287895.7A 2020-04-14 2020-04-14 一种用于音频处理的方法及智能音箱 Active CN111246344B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010287895.7A CN111246344B (zh) 2020-04-14 2020-04-14 一种用于音频处理的方法及智能音箱

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010287895.7A CN111246344B (zh) 2020-04-14 2020-04-14 一种用于音频处理的方法及智能音箱

Publications (2)

Publication Number Publication Date
CN111246344A true CN111246344A (zh) 2020-06-05
CN111246344B CN111246344B (zh) 2020-07-31

Family

ID=70869499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010287895.7A Active CN111246344B (zh) 2020-04-14 2020-04-14 一种用于音频处理的方法及智能音箱

Country Status (1)

Country Link
CN (1) CN111246344B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112037609A (zh) * 2020-08-26 2020-12-04 钮小静 一种基于物联网的音乐教学装置
CN112911198A (zh) * 2021-01-18 2021-06-04 广州佰锐网络科技有限公司 一种视频通信中的音频智能降噪的处理系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60121517A (ja) * 1983-12-03 1985-06-29 Matsushita Electric Ind Co Ltd 磁気記録媒体
EP0789476A2 (en) * 1996-02-09 1997-08-13 Texas Instruments Incorporated Noise reduction arrangement
US20090240496A1 (en) * 2008-03-24 2009-09-24 Kabushiki Kaisha Toshiba Speech recognizer and speech recognizing method
JP2014113362A (ja) * 2012-12-11 2014-06-26 Hiroshima City Univ 経頭蓋磁気刺激装置
CN105163238A (zh) * 2015-10-17 2015-12-16 深圳跃豁达科技有限公司 一种主动深度降噪耳机
CN206734121U (zh) * 2016-10-31 2017-12-12 比亚迪股份有限公司 汽车、汽车头枕以及汽车的降噪系统
CN107580277A (zh) * 2017-10-16 2018-01-12 深圳匡合智能有限公司 一种车载音频播放系统
US20180182370A1 (en) * 2014-10-24 2018-06-28 Elwha Llc Active cancellation of noise in temporal bones

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60121517A (ja) * 1983-12-03 1985-06-29 Matsushita Electric Ind Co Ltd 磁気記録媒体
EP0789476A2 (en) * 1996-02-09 1997-08-13 Texas Instruments Incorporated Noise reduction arrangement
US20090240496A1 (en) * 2008-03-24 2009-09-24 Kabushiki Kaisha Toshiba Speech recognizer and speech recognizing method
JP2014113362A (ja) * 2012-12-11 2014-06-26 Hiroshima City Univ 経頭蓋磁気刺激装置
US20180182370A1 (en) * 2014-10-24 2018-06-28 Elwha Llc Active cancellation of noise in temporal bones
CN105163238A (zh) * 2015-10-17 2015-12-16 深圳跃豁达科技有限公司 一种主动深度降噪耳机
CN206734121U (zh) * 2016-10-31 2017-12-12 比亚迪股份有限公司 汽车、汽车头枕以及汽车的降噪系统
CN107580277A (zh) * 2017-10-16 2018-01-12 深圳匡合智能有限公司 一种车载音频播放系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112037609A (zh) * 2020-08-26 2020-12-04 钮小静 一种基于物联网的音乐教学装置
CN112911198A (zh) * 2021-01-18 2021-06-04 广州佰锐网络科技有限公司 一种视频通信中的音频智能降噪的处理系统
CN112911198B (zh) * 2021-01-18 2023-04-14 广州佰锐网络科技有限公司 一种视频通信中的音频智能降噪的处理系统

Also Published As

Publication number Publication date
CN111246344B (zh) 2020-07-31

Similar Documents

Publication Publication Date Title
US20190087153A1 (en) Audio User Interface Apparatus And Method
CN111246344B (zh) 一种用于音频处理的方法及智能音箱
CN110265064B (zh) 音频爆音检测方法、装置和存储介质
CN104123938A (zh) 语音控制系统、电子装置及语音控制方法
JPS6184694A (ja) 認識用辞書学習方法
CN101023469A (zh) 数字滤波方法和装置
CN105405448A (zh) 一种音效处理方法及装置
CN104123115A (zh) 一种音频信息处理方法及电子设备
CN101667814A (zh) 音频播放方法及音频播放装置
US20080160943A1 (en) Method and apparatus to post-process an audio signal
WO2008122974A1 (en) Method and apparatus for the use of cross modal association to isolate individual media sources
CN205754811U (zh) 移动终端及其音频处理系统
Turchet et al. Real-time hit classification in a Smart Cajón
CN108257605B (zh) 多通道录音方法、装置及电子设备
Ick et al. Sound event detection in urban audio with single and multi-rate PCEN
CN110970010A (zh) 噪音消除方法、装置、存储介质及设备
WO2020228226A1 (zh) 一种纯音乐检测方法、装置及存储介质
CN111603776A (zh) 音频数据中枪声的识别方法、马达的驱动方法及相关装置
CN104707331A (zh) 一种游戏体感产生方法及装置
CN112712816A (zh) 语音处理模型的训练方法和装置以及语音处理方法和装置
CN111338485A (zh) 利用音频产生触觉反馈的电路和设备
JP2021536596A (ja) 正規化を介して音響信号をフィンガープリンティングするための方法及び装置
CN110475181A (zh) 设备配置方法、装置、设备和存储介质
CN108449691A (zh) 一种拾音装置及声源距离确定方法
CN111782859A (zh) 一种音频可视化方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant