CN109147739A - 基于语音控制的音效调节方法、介质、装置和计算设备 - Google Patents

基于语音控制的音效调节方法、介质、装置和计算设备 Download PDF

Info

Publication number
CN109147739A
CN109147739A CN201811062678.7A CN201811062678A CN109147739A CN 109147739 A CN109147739 A CN 109147739A CN 201811062678 A CN201811062678 A CN 201811062678A CN 109147739 A CN109147739 A CN 109147739A
Authority
CN
China
Prior art keywords
audio
frequency range
information
adjusts
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811062678.7A
Other languages
English (en)
Other versions
CN109147739B (zh
Inventor
刘锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN201811062678.7A priority Critical patent/CN109147739B/zh
Publication of CN109147739A publication Critical patent/CN109147739A/zh
Application granted granted Critical
Publication of CN109147739B publication Critical patent/CN109147739B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/12Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
    • G10H1/125Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供了一种基于语音控制的音效调节方法。该方法包括:在音频播放过程中获取用户的第一语音信息;对所述第一语音信息进行识别,得到音效调节信息;按照所述音效调节信息调节所述音频的音效。本发明的方法通过语音控制进行音效调节,使得产品交互更加人性化,音效调节更加方便快捷,更好地满足用户的个性化需求,为用户带来了更好的体验。此外,本发明的实施方式提供了一种基于语音控制的音效调节装置、一种介质和一种计算设备。

Description

基于语音控制的音效调节方法、介质、装置和计算设备
技术领域
本发明涉及信息技术领域,更具体地,本发明涉及一种基于语音控 制的音效调节方法、装置、介质和计算设备。
背景技术
在传统的音频播放装置中,通常采用均衡器来进行音效调节。均衡 器是一种可以分别调节各种频率成分电信号放大量的电子设备,通过对 各种不同频率的电信号的调节来补偿扬声器和声场的缺陷,补偿和修饰 各种声源。一般调音台上的均衡器仅能对高频、中频、低频三段频率电 信号分别进行调节。
目前音频播放装置的一些相关技术中,可以在语音交互的过程中同 时进行其他的处理功能,但需要人工手动进行操作。这种方式在通讯过 程中不够方便。
发明内容
如上所述,现有技术在音频播放过程中只能通过手动方式来调节音 频播放的音效。
为此,非常需要一种改进的基于语音控制的音效调节,以使产品交 互更加人性化,音效调节更加方便快捷。
在本上下文中,本发明的实施方式期望提供一种基于语音控制的音 效调节方法和装置。
在本发明实施方式的第一方面中,提供了一种基于语音控制的音效 调节方法,包括:在音频播放过程中获取用户的第一语音信息;对所述 第一语音信息进行识别,得到音效调节信息;按照所述音效调节信息调 节所述音频的音效。
在本发明实施方式的第二方面中,提供了一种介质,其上存储有计 算机程序,该程序被处理器执行实现上述基于语音控制的音效调节方法 中任一所述的方法。
在本发明实施方式的第三方面中,提供了一种装置,包括:语音获 取单元,用于在音频播放过程中获取用户的第一语音信息;语音识别单 元,用于对所述第一语音信息进行识别,得到音效调节信息;控制单元, 用于按照所述音效调节信息调节所述音频的音效。
在本发明实施方式的第四方面中,提供了一种计算设备,包括:一 个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个 程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述 基于语音控制的音效调节方法中任一所述的方法。
根据本发明实施方式的基于语音控制的音效调节方法和装置,使得 产品交互更加人性化,音效调节更加方便快捷,更好地满足用户的个性 化需求,为用户带来了更好的体验。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述 以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非 限制性的方式示出了本发明的若干实施方式,其中:
图1示意性地示出了根据本发明一实施例的基于语音控制的音效调 节方法的流程图;
图2示意性地示出了根据本发明另一实施例的均衡器音效调节示意 图;
图3示意性地示出了根据本发明另一实施例的基于语音控制的音效 调节方法的流程图;
图4示意性地示出了根据本发明又一实施例的基于语音控制的音效 调节方法的音效收藏流程图;
图5示意性地示出了根据本发明一实施例的基于语音控制的音效调 节装置的结构示意图;
图6示意性地示出了根据本发明另一实施例的基于语音控制的音效 调节装置的结构示意图;
图7示意性地示出了根据本发明实施例的介质的示意图;
图8示意性地示出了根据本发明一实施例的计算设备的结构示意 图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当 理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解 进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这 些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围 完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装 置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下 形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等), 或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种基于语音控制的音效调节方法、 介质、装置和计算设备。
在本文中,附图中的任何元素数量均用于示例而非限制,以及任何 命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和 精神。
发明概述
本发明人发现,现有技术中音频播放装置的音效调节通常需要手动 设置或操作,产品交互方法缺乏人性化,音效调节方法不够方便,不能 很好地满足用户的个性化需求,用户体验不佳。
另一方面,随着通讯技术的不断发展,终端设备的控制方式越来越 丰富,也越来越智能。其中,智能语音交互技术是目前被广泛应用的一 项智能技术。智能语音交互是基于语音输入的交互模式,即通过说话就 可以得到反馈结果。这种交互方式是人类最自然最轻松的交互方式,能 高效地解放双手,且可以最大程度地降低操作难度。
有鉴于此,本发明提供了一种基于语音控制的音效调节方法。该方 法包括:在音频播放过程中获取用户的第一语音信息;对所述第一语音 信息进行识别,得到音效调节信息;按照所述音效调节信息调节所述音 频的音效。本发明的方法通过语音控制进行音效调节,使得产品交互更 加人性化,音效调节更加方便快捷,更好地满足用户的个性化需求,为用户带来了更好的体验。此外,本发明的实施方式提供了一种基于语音 控制的音效调节装置、一种介质和一种计算设备。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限 制性实施方式。
示例性方法
下面结合图1来描述根据本发明示例性实施方式的基于语音控制的 音效调节方法。如图1所示,本发明实施例的基于语音控制的音效调节 方法可以包括以下步骤:步骤S110,在音频播放过程中获取用户的第一 语音信息;步骤S120,对第一语音信息进行识别,得到音效调节信息; 步骤S130,按照音效调节信息调节音频的音效。
音效是人工制造或加强的声音,用来增强对电影、电子游戏、音乐 或其他媒体的艺术或其他内容的声音处理。音效是由声音所制造的效果, 包括为增进场面的真实感、气氛或戏剧讯息而加于声带上的杂音或声音。 EQ(Equalizer,均衡器)的作用就是调整各频段信号的增益值,即实现 不同的声音播放效果。不同的EQ模式带给使用者不同的声音播放效果。 同时EQ模式也是最能突出个性的地方,给使用者带来更多的音乐享受。
本发明方法所应用的音频播放装置会在内部预先设置几种比较具有 代表性的EQ模式。EQ模式包括摇滚乐、流行乐、爵士乐、古典乐、 重低音、人声等。
图2示意性地示出了根据本发明另一实施例的均衡器音效调节示意 图。参见图2,通过调节均衡器的EQ特征,可得到不同的音效。图2中 的横坐标是频段值(单位是赫兹Hz),纵坐标是增益值(单位是db)。 自定义音效包括:通过调节EQ均衡器,调节频率范围内各频段的增益 值,而得到的不同的音效。例如在图2所示的均衡器中调节频率范围内 的频段包括50Hz、500Hz、1KHz等。
在步骤S110中,在音频播放过程中获取用户的第一语音信息。其中, 第一语音信息包括用户语音信息中的音效调节信息。在步骤S120中,对 第一语音信息进行识别,得到对应的音效调节信息。在一个示例中,用 户说出了EQ模式名字,例如用户说:“把这个曲子切换到重低音播放。” 从用户语音信息中识别出其中包括EQ模式名字“重低音”。得到用户需求的音效调节信息后,在步骤S130中按照用户需求调节音效。
在一种可能的实施方式中,音效调节信息包括音效模式名称;对第 一语音信息进行识别,得到音效调节信息,包括:对第一语音信息进行 识别,得到音效模式名称;根据音效模式名称获取音效模式包括的各频 段的增益值;按照音效调节信息调节音频的音效,包括:按照音效模式 包括的各频段的增益值调节音频的音效。
例如,在用户和音频播放装置(如音箱)的语音交互过程中,如果 接收到的第一语音信息中包括“切换到摇滚乐”,则识别到EQ模式名 称“摇滚乐”后,根据预先保存的“摇滚乐”对应的各频段的增益值进 行音效调节。
在一种可能的实施方式中,音效调节信息包括待调节频段和待调节 频段对应的调节值;按照音效调节信息调节音频的音效,包括:按照调 节值对待调节频段进行调节。
在用户发起的语音交互信息中,也可以包括在当前播放的音效基础 上再进行相应频段的增益调节信息。在这种实施方式中,对EQ模式中 的不同频段,可以像调节音量一样调节音质。
在一个示例中,用户可以说“把低音加强一些”。其中,“低音” 对应的频段包括31Hz、63Hz、125Hz,“加强”可以将这几个频段的 增益值提高1~2db。具体频段选择和调节数值,可以根据产品需求再定 义,例如根据音乐风格再定义音效的具体调节值。在另一个示例中,用 户可以说“把人声突出一些”。人的嗓子发出的声音的频率范围比较窄, 在调节音效时提升主要集中在中频部分。
在一种可能的实施方式中,上述方法还包括:接收输入的音效模式 名称和与音效模式名称对应的各频段的增益值,并保存音效模式名称与 各频段的增益值的对应关系。
例如,在用户和音频播放装置的语音交互过程中,可支持在APP (Application,应用程序)中用户自定义EQ模式和对应名称。比如用 户将自定义EQ模式起名为“狂躁音质”,并设置“狂躁音质”对应的 各频段的增益值为:在频率31Hz为-2db,在63Hz为+4db,125Hz为-1db。 可将自定义EQ模式名称及其对应的各频段的增益值对应保存。如果接 收到的第一语音信息中,用户说“切换到狂躁音质”,则识别到EQ模 式名称“狂躁音质”后,根据预先保存的“狂躁音质”对应的各频段的 增益值进行音效调节。
在一种可能的实施方式中,上述方法还包括:判断音频的调节后音 效的各频段的增益值与预设的标准音效模式的各频段的增益值之间的差 值是否大于预定的差异度阈值;若是,则给出是否切换为标准音效模式 的提示。
例如,音频播放装置中可预设类似“超重低音”、“完美人声”等 几十种EQ模板。每一首歌曲可设置对应标签用来标识该歌曲对应的EQ 模板中的各个频段值及其对应的各个频段的增益值。根据标签上的信息 匹配预设模板。标签可由音乐APP运营团队根据歌曲的创作风格标注产 生,作为每首歌曲的推荐EQ模板,也就是标准音效模式。例如,“低 音”、“民谣”、“摇滚”等标签,每一种标签对应一个EQ模板中的 各个频段值及其对应的各个频段的增益值。
如果当前播放的EQ模式和推荐EQ模板中相对应的频段的增益值 的差值大于差异度阈值,则触发主动提示,提示用户是否切换到标准音 效模式。例如:标准音效模式中在频率63Hz的增益值为+3db,当前播 放的EQ模式中在频率63Hz的增益值为+10db,而差异度阈值设置为2db,当前播放的EQ模式和推荐EQ模板的差异大于差异度阈值,则 给出语音提示例如:“这首歌的低音调到3db更合适,目前是10db,是 否调整到3db?”。
图3示意性地示出了根据本发明另一实施例的基于语音控制的音效 调节方法的流程图。如图3所示,在一种可能的实施方式中,上述方法 还包括:步骤S310,判断音频的调节后音效的各频段的增益值与预设的 标准音效模式的各频段的增益值之间的差值是否大于预定的差异度阈 值;步骤S320,将差值大于预定的差异度阈值的频段确定为待调节频段; 步骤S330,给出是否对待调节频段进行调节的提示。
在一个示例中,音频播放装置在用户发起的语音交互过程中,以双 工模式进行进一步地交互。例如:在用户说完“把低音加强一些”后, 音频播放装置主动发起说“已调节,人声部分是否需要进一步加强?” 或者“这首歌的低音调到3db更合适,要不要试试”等提示。
图4示意性地示出了根据本发明又一实施例的基于语音控制的音效 调节方法的音效收藏流程图。如图4所示,在一种可能的实施方式中, 按照音效调节信息调节音频的音效之前或之后,还包括:步骤S410,判 断当前播放的音频是否有定制音效版本;步骤S420,若有,则提示用户 是否播放定制音效版本;步骤S430,在用户播放定制音效版本过程中,提示用户是否收藏当前播放的音频的定制音效版本。
参见图4,在一种可能的实施方式中,上述方法还包括:步骤S440, 从第二语音信息中识别出收藏指定音频的定制音效版本的信息;步骤 S450,将定制音效版本与指定音频的名称对应保存。
在一个示例中,支持音频播放装置发起的语音交互过程中,以双工 模式进行进一步地交互。
如音频播放装置可播报语音:“给你推荐一批定制音效的歌单听听, 要不要试试”。
用户说:“可以”。
接收并识别出用户响应后,音频播放装置可继续播报语音:“这首歌 是XX,已由某某调制,请体验”。在此处的播报语音中还可以附上某某 人的调音思路或理念介绍。
音频播放装置可继续播报语音:“如果喜欢,可以收藏该定制音效”。
用户说:“喜欢”,或者“收藏”。
得到用户的上述收藏语音指令后,将定制音效版本与指定音频的名 称对应保存,定制音效版本可收藏到自定义信息中。
在一种可能的实施方式中,在将定制音效版本与指定音频的名称对 应保存之后,还包括:若从用户的第三语音信息中识别出与指定音频的 名称对应的播放指令,则播放与指定音频的名称相对应的定制音效版本。 若用户已收藏了指定音频的定制音效版本,在下一次播放该音频时可以 直接按照定制音效版本中的设置参数去播放。
在一种可能的实施方式中,按照音效调节信息调节音频的音效之后, 还包括:给出音频的音效已调节的提示信息。例如音频播放装置可播报 语音:“也按您的要求调节了音效,请您继续享受美妙的音乐。”。
示例性介质
在介绍了本发明示例性实施方式的方法之后,接下来,参考图7对 本发明示例性实施方式的、用于实现设备控制的介质进行说明。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种计 算机可读介质,其上存储有程序,当该程序被处理器执行时用于实现本 说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方 式的基于语音控制的音效调节方法中的步骤。
具体地,上述处理器执行上述程序时用于实现如下步骤:在音频播 放过程中获取用户的第一语音信息;对第一语音信息进行识别,得到音 效调节信息;按照音效调节信息调节音频的音效。
需要说明的是:上述的介质可以是可读信号介质或者可读存储介质。 可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半 导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具 体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携 式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编 程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图7所示,描述了根据本发明的实施方式的介质70,其可以采用 便携式紧凑盘只读存储器(CD-ROM)并包括程序,并可以在设备上运行。 然而,本发明不限于此,在本文件中,可读存储介质可以是任何包含或 存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用 或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信 号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式, 包括但不限于:电磁信号、光信号或上述的任意合适的组合。可读信号 介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、 传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使 用的程序。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明 操作的程序代码,上述程序设计语言包括面向对象的程序设计语言—诸 如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言 或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、 部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备 可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到 用户计算设备。
示例性装置
在介绍了本发明示例性实施方式的介质之后,接下来,参考图5和 图6对本发明示例性实施方式的、用于实现设备控制的装置进行说明。
图5示意性地示出了根据本发明一实施例的基于语音控制的音效调 节装置的结构示意图。如图5所示,本发明实施例的基于语音控制的音 效调节装置500可以包括:语音获取单元510,用于在音频播放过程中 获取用户的第一语音信息;语音识别单元520,用于对第一语音信息进 行识别,得到音效调节信息;控制单元530,用于按照音效调节信息调节音频的音效。
在一种可能的实施方式中,音效调节信息包括音效模式名称;语音 识别单元520还用于:对第一语音信息进行识别,得到音效模式名称; 根据音效模式名称获取音效模式包括的各频段的增益值;控制单元530 还用于:按照音效模式包括的各频段的增益值调节音频的音效。
在一种可能的实施方式中,音效调节信息包括待调节频段和待调节 频段对应的调节值;控制单元530还用于:按照调节值对待调节频段进 行调节。
图6示意性地示出了根据本发明另一实施例的基于语音控制的音效 调节装置的结构示意图。如图6所示,在一种可能的实施方式中,上述 装置还包括音效设置单元640,用于:接收输入的音效模式名称和与音 效模式名称对应的各频段的增益值,并保存音效模式名称与各频段的增 益值的对应关系。
在一种可能的实施方式中,上述装置还包括推荐提示单元650,用于: 判断音频的调节后音效的各频段的增益值与预设的标准音效模式的各频 段的增益值之间的差值是否大于预定的差异度阈值;若是,则给出是否 切换为标准音效模式的提示。
在一种可能的实施方式中,上述装置还包括推荐提示单元650,用于: 判断音频的调节后音效的各频段的增益值与预设的标准音效模式的各频 段的增益值之间的差值是否大于预定的差异度阈值;将差值大于预定的 差异度阈值的频段确定为待调节频段;给出是否对待调节频段进行调节 的提示。
在一种可能的实施方式中,上述装置还包括收藏单元660,用于:判 断当前播放的音频是否有定制音效版本;若有,则提示用户是否播放定 制音效版本;在用户播放定制音效版本过程中,提示用户是否收藏当前 播放的音频的定制音效版本。
在一种可能的实施方式中,收藏单元660还用于:从第二语音信息 中识别出收藏指定音频的定制音效版本的信息;将定制音效版本与指定 音频的名称对应保存。
在一种可能的实施方式中,控制单元530还用于:若从用户的第三 语音信息中识别出与指定音频的名称对应的播放指令,则播放与指定音 频的名称相对应的定制音效版本。
在一种可能的实施方式中,上述装置还包括音效提示单元670,用于: 给出音频的音效已调节的提示信息。
本发明实施例的基于语音控制的音效调节装置中各单元的功能可以参 见上述方法的相关描述,在此不再赘述。
示例性计算设备
在介绍了本发明示例性实施方式的方法、介质和装置之后,接下来, 参照图8对本发明示例性实施方式的、用于实现设备控制的计算设备进 行说明。
本发明实施例提供了一种计算设备,包括:一个或多个处理器;存储 装置,用于存储一个或多个程序;当上述一个或多个程序被上述一个或多个 处理器执行时,使得上述一个或多个处理器实现上述基于语音控制的音效 调节方法中的任一方法。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为 系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下 形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微 代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、 “模块”或“系统”。
在一些可能的实施方式中,根据本发明实施方式的计算设备可以至 少包括至少一个处理单元、以及至少一个存储单元。其中,上述存储单 元存储有程序代码,当上述程序代码被上述处理单元执行时,使得上述 处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明的 各种示例性实施方式的基于语音控制的音效调节方法中的步骤。
下面参照图8来描述根据本发明的这种实施方式的计算设备80。图 8显示的计算设备80仅仅是一个示例,不应对本发明实施例的功能和使 用范围带来任何限制。
如图8所示,计算设备80以通用计算设备的形式表现。计算设备 80的组件可以包括但不限于:上述至少一个处理单元801、上述至少 一个存储单元802以及连接不同系统组件(包括处理单元801和存储单 元802)的总线803。
总线803包括数据总线、控制总线和地址总线。
存储单元802可以包括易失性存储器形式的可读介质,例如随机存 取存储器(RAM)8021和/或高速缓存存储器8022,可以进一步包括非 易失性存储器形式的可读介质,例如只读存储器(ROM)8023。
存储单元802还可以包括具有一组(至少一个)程序模块8024的 程序/实用工具8025,这样的程序模块8024包括但不限于:操作系统、 一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每 一个或某种组合中可能包括网络环境的实现。
计算设备80也可以与一个或多个外部设备804(例如键盘、指向设 备等)通信。这种通信可以通过输入/输出(I/O)接口805进行。并且, 计算设备80还可以通过网络适配器806与一个或者多个网络(例如局 域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图 8所示,网络适配器806通过总线803与计算设备80的其它模块通信。 应当理解,尽管图中未示出,可以结合计算设备80使用其它硬件和/或 软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部 磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了装置的若干单元/模块或子 单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据 本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以 在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功 能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是, 这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执 行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某 些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个 步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是 应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也 不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表 述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种 修改和等同布置。

Claims (10)

1.一种基于语音控制的音效调节方法,其特征在于,包括:
在音频播放过程中获取用户的第一语音信息;
对所述第一语音信息进行识别,得到音效调节信息;
按照所述音效调节信息调节所述音频的音效。
2.根据权利要求1所述的方法,其特征在于,所述音效调节信息包括音效模式名称;
对所述第一语音信息进行识别,得到音效调节信息,包括:对所述第一语音信息进行识别,得到所述音效模式名称;根据所述音效模式名称获取所述音效模式包括的各频段的增益值;
按照所述音效调节信息调节所述音频的音效,包括:按照所述音效模式包括的各频段的增益值调节所述音频的音效。
3.根据权利要求1所述的方法,其特征在于,所述音效调节信息包括待调节频段和所述待调节频段对应的调节值;
按照所述音效调节信息调节所述音频的音效,包括:
按照所述调节值对所述待调节频段进行调节。
4.根据权利要求2所述的方法,其特征在于,还包括:接收输入的音效模式名称和与所述音效模式名称对应的各频段的增益值,并保存所述音效模式名称与所述各频段的增益值的对应关系。
5.根据权利要求1-4中任一项所述的方法,其特征在于,还包括:
判断所述音频的调节后音效的各频段的增益值与预设的标准音效模式的各频段的增益值之间的差值是否大于预定的差异度阈值;
若是,则给出是否切换为所述标准音效模式的提示。
6.根据权利要求1-4中任一项所述的方法,其特征在于,还包括:
判断所述音频的调节后音效的各频段的增益值与预设的标准音效模式的各频段的增益值之间的差值是否大于预定的差异度阈值;
将所述差值大于预定的差异度阈值的频段确定为待调节频段;
给出是否对所述待调节频段进行调节的提示。
7.根据权利要求1-4中任一项所述的方法,其特征在于,按照所述音效调节信息调节所述音频的音效之前或之后,还包括:
判断当前播放的音频是否有定制音效版本;
若有,则提示用户是否播放所述定制音效版本;
在用户播放所述定制音效版本过程中,提示用户是否收藏当前播放的音频的定制音效版本。
8.一种基于语音控制的音效调节装置,其特征在于,包括:
语音获取单元,用于在音频播放过程中获取用户的第一语音信息;
语音识别单元,用于对所述第一语音信息进行识别,得到音效调节信息;
控制单元,用于按照所述音效调节信息调节所述音频的音效。
9.一种介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
10.一种计算设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
CN201811062678.7A 2018-09-12 2018-09-12 基于语音控制的音效调节方法、介质、装置和计算设备 Active CN109147739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811062678.7A CN109147739B (zh) 2018-09-12 2018-09-12 基于语音控制的音效调节方法、介质、装置和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811062678.7A CN109147739B (zh) 2018-09-12 2018-09-12 基于语音控制的音效调节方法、介质、装置和计算设备

Publications (2)

Publication Number Publication Date
CN109147739A true CN109147739A (zh) 2019-01-04
CN109147739B CN109147739B (zh) 2021-07-23

Family

ID=64825057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811062678.7A Active CN109147739B (zh) 2018-09-12 2018-09-12 基于语音控制的音效调节方法、介质、装置和计算设备

Country Status (1)

Country Link
CN (1) CN109147739B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112863466A (zh) * 2021-01-07 2021-05-28 广州欢城文化传媒有限公司 一种音频社交变声方法及装置
CN113220913A (zh) * 2020-02-04 2021-08-06 阿里巴巴集团控股有限公司 多媒体文件处理方法、装置和交互系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080075303A1 (en) * 2006-09-25 2008-03-27 Samsung Electronics Co., Ltd. Equalizer control method, medium and system in audio source player
CN103597543A (zh) * 2011-02-03 2014-02-19 弗兰霍菲尔运输应用研究公司 语义音轨混合器
US8942385B1 (en) * 2013-11-01 2015-01-27 Global Drumz, Inc. Headphones with multiple equalization presets for different genres of music
CN104811864A (zh) * 2015-04-20 2015-07-29 深圳市冠旭电子有限公司 一种自适应调节音效的方法及系统
CN106126162A (zh) * 2016-06-16 2016-11-16 广东欧珀移动通信有限公司 一种防止音效突变的方法及终端
CN206672078U (zh) * 2017-04-19 2017-11-24 上海魅声电子科技有限公司 一种具备语音控制功能的声卡
CN207382556U (zh) * 2017-11-13 2018-05-18 江西创成微电子有限公司 一种音频处理装置
CN108391193A (zh) * 2018-05-24 2018-08-10 东莞市猎声电子科技有限公司 一种新型智能耳机
CN207732965U (zh) * 2017-11-28 2018-08-14 江西创成微电子有限公司 一种音频处理装置
US20180242072A1 (en) * 2013-11-01 2018-08-23 Quincy Jones Headphones With Multiple Equalization Presets For Different Genres Of Music

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080075303A1 (en) * 2006-09-25 2008-03-27 Samsung Electronics Co., Ltd. Equalizer control method, medium and system in audio source player
CN103597543A (zh) * 2011-02-03 2014-02-19 弗兰霍菲尔运输应用研究公司 语义音轨混合器
US8942385B1 (en) * 2013-11-01 2015-01-27 Global Drumz, Inc. Headphones with multiple equalization presets for different genres of music
US20180242072A1 (en) * 2013-11-01 2018-08-23 Quincy Jones Headphones With Multiple Equalization Presets For Different Genres Of Music
CN104811864A (zh) * 2015-04-20 2015-07-29 深圳市冠旭电子有限公司 一种自适应调节音效的方法及系统
CN106126162A (zh) * 2016-06-16 2016-11-16 广东欧珀移动通信有限公司 一种防止音效突变的方法及终端
CN206672078U (zh) * 2017-04-19 2017-11-24 上海魅声电子科技有限公司 一种具备语音控制功能的声卡
CN207382556U (zh) * 2017-11-13 2018-05-18 江西创成微电子有限公司 一种音频处理装置
CN207732965U (zh) * 2017-11-28 2018-08-14 江西创成微电子有限公司 一种音频处理装置
CN108391193A (zh) * 2018-05-24 2018-08-10 东莞市猎声电子科技有限公司 一种新型智能耳机

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113220913A (zh) * 2020-02-04 2021-08-06 阿里巴巴集团控股有限公司 多媒体文件处理方法、装置和交互系统
CN112863466A (zh) * 2021-01-07 2021-05-28 广州欢城文化传媒有限公司 一种音频社交变声方法及装置
CN112863466B (zh) * 2021-01-07 2024-05-31 广州欢城文化传媒有限公司 一种音频社交变声方法及装置

Also Published As

Publication number Publication date
CN109147739B (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
CN109478400B (zh) 现场音乐表演的多媒体内容的基于网络的处理及分布
CN102893633B (zh) 用于便携式媒体回放装置的音频系统均衡化
CN104080024B (zh) 音量校平器控制器和控制方法以及音频分类器
CN105074822B (zh) 用于音频分类和处理的装置和方法
US9547642B2 (en) Voice to text to voice processing
RU2467406C2 (ru) Способ и устройство для поддержки воспринимаемости речи в многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания
CN103247294B (zh) 信号处理设备、方法、系统和通信终端
CN109121057B (zh) 一种智能助听的方法及其系统
JP2019216408A (ja) 情報を出力するための方法、及び装置
CN111091800B (zh) 歌曲生成方法和装置
CN108648756A (zh) 语音交互方法、装置和系统
CN105390144B (zh) 一种音频处理方法和音频处理装置
CN102244750B (zh) 具有声级控制功能的视频显示装置及其控制方法
CN112216294B (zh) 音频处理方法、装置、电子设备及存储介质
CN109819375A (zh) 调节音量的方法与装置、存储介质、电子设备
CN101518102A (zh) 对话增强技术
CN109147739A (zh) 基于语音控制的音效调节方法、介质、装置和计算设备
CN113077771B (zh) 异步合唱混音方法及装置、存储介质和电子设备
US20140039891A1 (en) Automatic separation of audio data
CN113031907B (zh) 音效参数生成方法及装置、存储介质、电子设备
CN108153508A (zh) 一种音频处理的方法及装置
CN104317404A (zh) 一种声纹控制音频播放设备、控制系统及方法
CN116156214A (zh) 一种视频调音方法、装置、电子设备及存储介质
WO2017000808A1 (zh) 一种音乐播放调节方法
WO2021248964A1 (zh) 家电及其控制方法和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant