CN110619895A - 定向发声控制方法及装置、发声设备、介质和电子设备 - Google Patents

定向发声控制方法及装置、发声设备、介质和电子设备 Download PDF

Info

Publication number
CN110619895A
CN110619895A CN201910844330.1A CN201910844330A CN110619895A CN 110619895 A CN110619895 A CN 110619895A CN 201910844330 A CN201910844330 A CN 201910844330A CN 110619895 A CN110619895 A CN 110619895A
Authority
CN
China
Prior art keywords
directional
directional sound
voice signal
target direction
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910844330.1A
Other languages
English (en)
Inventor
贾玉虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201910844330.1A priority Critical patent/CN110619895A/zh
Publication of CN110619895A publication Critical patent/CN110619895A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/26Sound-focusing or directing, e.g. scanning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种定向发声控制方法、定向发声控制装置、定向发声设备、存储介质和电子设备,涉及定向发声技术领域。该定向发声控制方法包括:检测定向发声设备所处环境中是否存在语音信号;如果存在语音信号,则确定语音信号的发出对象相对于定向发声设备的方向,作为目标方向;控制定向发声设备的声音发出端调整至目标方向,以便沿目标方向执行定向发声。本公开可以提高用户使用定向发声设备的便利性,使得定向发声过程更加智能。

Description

定向发声控制方法及装置、发声设备、介质和电子设备
技术领域
本公开涉及定向发声技术领域,具体而言,涉及一种定向发声控制方法、定向发声控制装置、定向发声设备、存储介质和电子设备。
背景技术
随着视听场景的增加,以及用户对信息私密性的保护需求,定向发声技术应运而生。定向发声技术可以应用于展馆、导购台、商场、超市、医院、汽车、智能家居、银行、智慧交通、盲人辅助器材等各个领域,因其私密性以及不影响他人的特点,受到越来越多的关注。
然而,通常的定向发声技术中,播放声音的方向单一,用户需要移动到对应的定向方向,才能听到对应的声音。对于用户而言,不够便捷。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种定向发声控制方法、定向发声控制装置、定向发声设备、存储介质和电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的用户需要移动到定向方向才能聆听到声音而导致不便捷问题。
根据本公开的第一方面,提供一种定向发声控制方法,应用于定向发声设备执行定向发声的过程中,包括:检测定向发声设备所处环境中是否存在语音信号;如果存在语音信号,则确定语音信号的发出对象相对于定向发声设备的方向,作为目标方向;控制定向发声设备的声音发出端调整至目标方向,以便沿目标方向执行定向发声。
根据本公开的第二方面,提供一种定向发声控制装置,配置于定向发声设备中,定向发声装置包括:语音信号检测模块,用于检测定向发声设备所处环境中是否存在语音信号;目标方向确定模块,用于如果存在语音信号,则确定语音信号的发出对象相对于定向发声设备的方向,作为目标方向;定向发声控制模块,用于控制定向发声设备的声音发出端调整至目标方向,以便沿目标方向执行定向发声。
根据本公开的第三方面,提供一种定向发声设备,包括:语音接收模块,用于接收定向发声设备所处环境中的语音信号并发送;音频处理模块,用于接收由语音接收模块发送的语音信号,确定语音信号相对于定向发声设备的方向,作为目标方向,生成基于目标方向的方向调整指令并发送;方向调整模块,用于接收方向调整指令,控制定向发声设备的声音发出端调整至目标方向,以便定向发声设备沿目标方向执行定向发声。
根据本公开的第四方面,提供一种存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述定向发声控制方法。
根据本公开的第五方面,提供一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述定向发声控制方法。
在本公开的一些实施例所提供的技术方案中,通过检测定向发声设备所处环境中是否存在语音信号,如果存在语音信号,则确定语音信号的发出对象相对于定向发声设备的方向,作为目标方向,并控制定向发声设备的声音发出端调整至目标方向,以便沿目标方向执行定向发声。一方面,定向发声设备基于语音信号自动调整发声方向,避免用户移动的过程,方便快捷,提高了用户体验,使得定向发声过程更加智能;另一方面,由于发声方向可以调整,因此,本公开的定向发声设备的部署方式不受场景的限制,大大提高了定向发声技术的应用范围。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了根据本公开的示例性实施方式的定向发声控制方法的流程图;
图2示出了应用本公开的示例性实施方式的定向发声控制方法的效果示意图;
图3示意性示出了根据本公开的示例性实施方式的定向发声控制装置的方框图;
图4示意性示出了根据本公开的另一示例性实施方式的定向发声控制装置的方框图;
图5示意性示出了根据本公开的示例性实施方式的定向发声设备的方框图;
图6示意性示出了根据本公开的一个实施例的定向发声设备的架构图;
图7示意性示出了根据本公开的示例性实施方式的电子设备的方框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
下面所述的定向发声控制方法可以由定向发声设备执行,应用于该定向发声设备执行定向发声的过程中。也就是说,可以由定向发声设备执行本公开示例性实施方式的定向发声控制方法的各个步骤。在这种情况下,下面所述的定向发声装置可以被配置在该定向发声设备中。
实现本公开示例性实施方式的定向发声方案的定向发声设备可以包括但不限于手机、智能电视、智能音箱、商场或超市内的发声设备等。另外,需要理解的是,本公开所述的定向发声设备可以是集成在其他设备中的设备,也可以是仅用于定向发声的独立设备,本公开对定向发声设备的种类以及应用场景均不作特殊限制。
图1示意性示出了本公开的示例性实施方式的定向发声控制方法的流程图。参考图1,所述定向发声控制方法可以包括以下步骤:
S12.检测定向发声设备所处环境中是否存在语音信号。
语音信号通常指的是用户发出的人声信号,也就是说,语音信号的发出对象可以是用户,具体的,可以是用户在环境中实时发出的语音信号。然而,应当理解的是,语音信号也可以是通过录音的方式提前录入人声并进行语音播放时产生的语音信号,在这种情况下,语音信号的发出对象可以是一些带有扬声器的发声设备。另外,语音信号还可以是非人声的声音信号,例如,乐器声、拍手声、敲击声等。本公开示例性实施方式对语音信号的类型不做限制。
在本公开的示例性实施方式中,可以利用定向发声设备上装配的麦克风阵列(Microphone Array)来检测环境中的语音信号。容易理解的是,麦克风阵列包括两个或更多个麦克风,是用于对声场的空间特性进行采样的装置。
根据本公开的一些实施例,可以响应定向发声触发事件,触发执行检测定向发声设备所处环境中是否存在语音信号的过程。例如,定向发声触发事件可以是,定向发声设备接收到待进行定向发声的音频信号。再例如,定向发声触发事件还可以是,用户手动点击定向发声的触发按钮,以提前为定向发声做准备。又例如,预先规定每隔预定时间(例如,10分钟、1分钟等)执行语音信号的检测过程,在这种情况下,定向发声触发时间可以是,当前时间点为预先规定的检测语音信号的时间点。本公开对定向发声触发事件的类型不做限定。
根据本公开的另一些实施例,无论当前是否接收到待进行定向发声的音频信号,定向发声设备均可以实时检测所处环境中是否存在语音信号,以便于提前为定向发声做准备。其中,实时检测的过程为定向发声设备自行执行的过程。
此外,除采用麦克风阵列检测语音信号外,还可以调整一个麦克风的收音方向,以检测周围环境是否存在语音信号。
S14.如果存在语音信号,则确定语音信号的发出对象相对于定向发声设备的方向,作为目标方向。
在以麦克风阵列检测语音信号的实施例中,首先,可以根据麦克风阵列中各麦克风接收到语音信号的信号强弱和/或接收到语音信号的时间先后顺序,从多个麦克风中确定与语音信号的发出对象对应的目标麦克风。容易理解的是,可以将接收信号强度最强和/或接收到语音信号最早的麦克风确定为目标麦克风。
接下来,根据目标麦克风的配置方向,确定语音信号的发出对象相对于定向发声设备的方向,将该方向作为目标方向。其中,目标麦克风的配置方向指的是,相对于麦克风阵列中其他麦克风的方向,该方向可以是世界坐标系中绝对的方向,例如,东偏南20度。另外,该方向还可以是一个相对的方向,例如,相比于麦克风阵列中其他麦克风,相对于定向发声设备主体的方向。
另外,本公开还提供了对语音信息进行校验的方案,在校验通过后,执行上述确定目标方向的过程。在这种情况下,在进行校验前,定向发生设备还可以对语音信息进行去噪处理,以避免环境噪声对语音信息的干扰。下面将对校验过程进行示例性说明。
根据本公开的一个实施例,首先,定向发声设备可以对语音信号进行声纹识别,以确定声纹识别的结果;随后,可以将声纹识别的结果与预定声纹数据库中的声纹进行比对。其中,可以将预定声纹数据库看作一个白名单,其中存储有一个或多个预先配置的声纹信息。
如果声纹识别的结果与预定声纹数据库中一声纹的相似度大于相似度阈值,则说明检测到的语音信号校验通过,是白名单中的声纹。在这种情况下,可以执行确定目标方向的操作。其中,相似度阈值可以是考虑到环境中可能的噪声而预先人为设定的值,本公开对具体数值不做限制。
例如,预定声纹数据库中有用户A的声纹信息,而没有用户B的声纹信息。在这种情况下,用户A说话时,定向发声设备可以确定出用户A的方向作为目标方向。而在用户B说话时,定向发声设备仅会接收到与其对应的语音信息,但不会执行确定目标方向的操作。
根据本公开的另一个实施例,首先,定向发声设备可以对语音信号进行语音识别,以确定语音识别的结果;随后,可以将语音识别的结果与预定语句进行比对。其中,预定语句可以是预先录入的语句,可以是一句话或一个词,本公开对语句的具体内容不做限制。
如果语音识别的结果与预定语句一致,则说明检测到的语音信号校验通过,在这种情况下,可以执行确定目标方向的操作。
另外,需要说明的是,一方面,可以将语音识别的结果与预定语句的集合进行比较,其中,预定语句的集合包括两个以上的预定语句,且这些语句可以提前录入。在这种情况下,如果语音识别的结果与预定语句的集合中一语句一致,则执行确定目标方向的操作。
另一方面,除语句外,可以预先存储其他声音信息,并结合这些声音信息以及判断条件,确定语音信号是否校验通过。例如,声音信息可以是敲击声音,预先设置的判断条件可以是1秒内敲击两次,在这种情况下,如果定向发声设备检测出语音信号为敲击信号,且1秒内敲击两次,则可以执行确定目标方向的操作。
S16.控制定向发声设备的声音发出端调整至目标方向,以便沿目标方向执行定向发声。
在确定出目标方向后,如果定向发声设备的声音发出端当前的朝向不是目标方向,则可以控制定向发声设备的声音发出端调整至目标方向,具体的,可以通过电机带动转轴转动的方式完成定向发声设备的转动过程。然而,还可以采用其他转动或平移机构实现将声音发出端调整至目标方向的目的,本示例性实施方式中对此不做限定。
在将声音发出端调整至目标方向后,可以沿目标方向执行定向发声。
为了避免在转动过程中音频已定向传播而造成用户不能听到完整音频内容的问题,在本公开的一些实施例中,在定向发声设备的声音发出端调整至目标方向之前,控制定向发声设备不执行定向发声。如果确定出定向发声设备的声音发出端已调整至目标方向,则控制定向发声设备开始执行定向发声。
其中,针对确定定向发声设备的声音发出端已调整至目标方向的过程,在一个实施例中,可以通过检测转动的角度来确定出是否已调整至目标方向。在另一个实施例中,还可以预先结合转动速度计算转动到目标方向所需的时间,在经历该时间时,即可确定出已转动至目标方向。虽然上面实施例以转动为例,然而,进行移动等的调整过程也属于本公开内容的构思。
此外,除上述步骤S12至步骤S16之外,根据本公开的另一个实施例,在响应定向发声触发事件执行检测语音信号的实例中,如果在预设时间段内未检测到环境中存在语音信号,则可以控制定向发声设备的声音发出端调整至预先设定的默认方向。其中,该预设时间段可以为10秒、5秒,本示例性实施方式中对此不做特殊限定。在这种情况下,可以沿该默认方向进行定向发声。
图2示出了应用本公开示例性实施方式的定向发声控制方法的效果示意图。
在现有的一些技术中,定向发声设备只能沿单一固定的方向播放声音,如果用户未处于该方向上,用户需要走向该方向所在区域或者手动调整定向发声设备的声音发出端的方向,才能听到播放的声音内容。
应用本公开示例性的定向发声控制方法,用户发出语音信息,定向发声设备可以根据语音信息确定用户所处方向,并自行控制声音发出端调整至用户所处方向,以播放声音。
综上所述,采用本公开示例性实施方式的定向发声控制方法,定向发声过程更加智能,便利性得到了提高。另外,由于定向发声设备的发声方向可以进行调整,因此,可以极大程度避免由于障碍物等原因而不适合布置定向发声设备的情况,提高了定向发声技术的应用范围。
应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
进一步的,本示例实施方式中还提供了一种定向发声控制装置,配置于定向发声设备中。
图3示意性示出了本公开的示例性实施方式的定向发声控制装置的方框图。参考图3,根据本公开的示例性实施方式的定向发声控制装置3可以包括语音信号检测模块31、目标方向确定模块33和定向发声控制模块35。
具体的,语音信号检测模块31可以用于检测定向发声设备所处环境中是否存在语音信号;目标方向确定模块33可以用于如果存在语音信号,则确定语音信号的发出对象相对于定向发声设备的方向,作为目标方向;定向发声控制模块35可以用于控制定向发声设备的声音发出端调整至目标方向,以便沿目标方向执行定向发声。
基于本公开示例性实施方式的定向发声控制装置,一方面,定向发声设备基于语音信号自动调整发声方向,避免用户移动的过程,方便快捷,提高了用户体验,使得定向发声过程更加智能;另一方面,由于发声方向可以调整,因此,本公开的定向发声设备的部署方式不受场景的限制,大大提高了定向发声技术的应用范围。
根据本公开的示例性实施例,参考图4,相比于定向发声控制装置3,定向发声控制装置4还可以包括默认发声控制模块41。
具体的,默认发声控制模块41可以被配置为执行:响应定向发声触发事件,如果在预设时间段内未检测到环境中存在语音信号,则控制定向发声设备的声音发出端沿预先设定的默认方向执行定向发声。
根据本公开的示例性实施例,借助于麦克风阵列检测所述定向发声设备所处环境中是否存在语音信号。在这种情况下,目标方向确定模块33可以被配置为执行:根据麦克风阵列中各麦克风接收到语音信号的信号强度以及接收时间,从各麦克风中确定与语音信号的发出对象对应的目标麦克风;根据目标麦克风的配置方向,确定语音信号的发出对象相对于定向发声设备的方向,作为目标方向。
根据本公开的示例性实施例,目标方向确定模块33可以被配置为执行:对语音信号进行声纹识别,并将声纹识别的结果与预定声纹数据库中的声纹进行比对;如果声纹识别的结果与预定声纹数据库中一声纹的相似度大于一相似度阈值,则确定语音信号的发出对象相对于定向发声设备的方向,作为目标方向。
根据本公开的示例性实施例,目标方向确定模块33可以被配置为执行:对语音信号进行语音识别,并将语音识别的结果与预定语句进行比对;如果语音识别的结果与预定语句一致,则确定语音信号的发出对象相对于定向发声设备的方向,作为目标方向。
根据本公开的示例性实施例,定向发声控制模块35还可以被配置为执行:在定向发声设备的声音发出端调整至目标方向之前,控制定向发声设备不执行定向发声;以及如果确定出定向发声设备的声音发出端已调整至目标方向,则控制定向发声设备开始执行定向发声。
由于本发明实施方式的程序运行性能分析装置的各个功能模块与上述方法发明实施方式中相同,因此在此不再赘述。
进一步的,本公开示例实施方式中还提供了一种定向发声设备。
参考图5,本公开示例性实施方式的定向发声设备5可以包括语音接收模块51、音频处理模块53和方向调整模块55。
语音接收模块51用于接收定向发声设备5所处环境中的语音信号。具体的,语音接收模块51可以是麦克风阵列,来实现所处环境中各个方向的语音信号检测过程。语音接收模块51可以将确定出的语音信号发送给音频处理模块53。
音频处理模块53可以用于接收由语音接收模块51发送的语音信号,并确定语音信号相对于定向发声设备的方向,作为目标方向,并生成基于目标方向的方向调整指令,并将该方向调整指令发送至方向调整模块55。
方向调整模块55可以用于接收方向调整指令,并基于该方向调整指令控制定向发声设备的声音发出端调整至目标方向,以便定向发声设备沿目标方向执行定向发声。
利用本公开示例性实施方式的定向发声设备,一方面,定向发声设备基于语音信号自动调整发声方向,避免用户移动的过程,方便快捷,提高了用户体验,使得定向发声过程更加智能;另一方面,由于发声方向可以调整,因此,本公开的定向发声设备的部署方式不受场景的限制,大大提高了定向发声技术的应用范围。
下面参考图6,对本公开示例性实施方式的定向发声设备的一个实施例进行说明。其中,图6中麦克风阵列61对应于图5中的语音接收模块51,音频处理模块62对应于图5中的音频处理模块53,转动模块65对应于图5中的方向调整模块55。
参考图6,定向发声设备6除包括麦克风阵列61、音频处理模块62和转动模块65外,还可以包括超声波载波模块63、音频放大模块64、超声波发声模块66和电源模块67。
超声波载波模块63可以用于生成载波信号,并将该载波信号发送至音频放大模块64。
音频放大模块64可以用于获取载波信号以及由音频处理模块62发送的待进行定向发声的原始音频信号,并将载波信号和原始音频信号进行调制处理,生成待播放音频信号。
超声波发声模块66可以用于接收待播放音频信号,并通过扬声器进行播放。
电源模块67为定向发声设备6中各模块的工作提供支持。
在一些实施例中,麦克风阵列61可以实时检测环境中语音信号,在未检测到语音信号时,音频处理模块62可以处于低功耗模式,其他模块处于休眠模式,从而降低了定向发声设备6的功耗,增加续航能力。
在另一些实施例中,音频处理模块62在获取到麦克风阵列61发送的语音信号后,可以对语音信号进行去噪处理,以避免用户使用过程中的噪声干扰。
根据本公开的示例性实施例,音频处理模块62还可以用于在确定出定向发声设备6的声音发出端已调整至目标方向的情况下,将原始音频信号发送至音频放大模块64,使得用户可以听到完整的音频内容。
根据本公开的示例性实施例,音频处理模块62还可以用于响应定向发声触发事件,如果在预设时间段内未接收到由麦克风阵列61发送的语音信号,则向转动模块65发送初始化指令;
转动模块65还用于响应初始化指令,控制定向发声设备6的声音发出端调整至预先设定的默认方向,以便定向发声设备6沿默认方向执行定向发声。
根据本公开的示例性实施例,音频处理模块62还可以用于对语音信号进行声纹识别,并将声纹识别的结果与预定声纹数据库中的声纹进行比对;如果声纹识别的结果与预定声纹数据库中一声纹的相似度大于一相似度阈值,则确定语音信号的发出对象相对于定向发声设备6的方向,作为目标方向。
根据本公开的示例性实施例,音频处理模块62还可以用于对语音信号进行语音识别,并将语音识别的结果与预定语句进行比对;如果语音识别的结果与预定语句一致,则确定语音信号的发出对象相对于定向发声设备6的方向,作为目标方向。
各模块执行的具体操作在上述定向发声控制方法中已进行了描述,在此不再赘述。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
根据本发明的实施方式的用于实现上述方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光盘、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图7来描述根据本发明的这种实施方式的电子设备700。图7显示的电子设备700仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700以通用计算设备的形式表现。电子设备700的组件可以包括但不限于:上述至少一个处理单元710、上述至少一个存储单元720、连接不同系统组件(包括存储单元720和处理单元710)的总线730、显示单元740。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元710执行,使得所述处理单元710执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元710可以执行如图1中所示的步骤S12至步骤S16。
存储单元720可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)7201和/或高速缓存存储单元7202,还可以进一步包括只读存储单元(ROM)7203。
存储单元720还可以包括具有一组(至少一个)程序模块7205的程序/实用工具7204,这样的程序模块7205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线730可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备700也可以与一个或多个外部设备800(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备700交互的设备通信,和/或与使得该电子设备700能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口750进行。并且,电子设备700还可以通过网络适配器760与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器760通过总线730与电子设备700的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

Claims (15)

1.一种定向发声控制方法,应用于定向发声设备执行定向发声的过程中,其特征在于,包括:
检测所述定向发声设备所处环境中是否存在语音信号;
如果存在所述语音信号,则确定所述语音信号的发出对象相对于所述定向发声设备的方向,作为目标方向;
控制所述定向发声设备的声音发出端调整至所述目标方向,以便沿所述目标方向执行定向发声。
2.根据权利要求1所述的定向发声控制方法,其特征在于,所述定向发声控制方法还包括:
响应定向发声触发事件,如果在预设时间段内未检测到所述环境中存在语音信号,则控制所述定向发声设备的声音发出端沿预先设定的默认方向执行定向发声。
3.根据权利要求1所述的定向发声控制方法,其特征在于,通过麦克风阵列检测所述定向发声设备所处环境中是否存在语音信号;其中,确定所述语音信号的发出对象相对于所述定向发声设备的方向,作为目标方向,包括:
根据所述麦克风阵列中各麦克风接收到所述语音信号的信号强度以及接收时间,从各所述麦克风中确定与所述语音信号的发出对象对应的目标麦克风;
根据所述目标麦克风的配置方向,确定所述语音信号的发出对象相对于所述定向发声设备的方向,作为目标方向。
4.根据权利要求1至3中任一项所述的定向发声控制方法,其特征在于,确定所述语音信号的发出对象相对于所述定向发声设备的方向,作为目标方向,包括:
对所述语音信号进行声纹识别,并将声纹识别的结果与预定声纹数据库中的声纹进行比对;
如果所述声纹识别的结果与所述预定声纹数据库中一声纹的相似度大于一相似度阈值,则确定所述语音信号的发出对象相对于所述定向发声设备的方向,作为目标方向。
5.根据权利要求1至3中任一项所述的定向发声控制方法,其特征在于,确定所述语音信号的发出对象相对于所述定向发声设备的方向,作为目标方向,包括:
对所述语音信号进行语音识别,并将语音识别的结果与预定语句进行比对;
如果所述语音识别的结果与所述预定语句一致,则确定所述语音信号的发出对象相对于所述定向发声设备的方向,作为目标方向。
6.根据权利要求1至3中任一项所述的定向发声控制方法,其特征在于,所述定向发声控制方法还包括:
在所述定向发声设备的声音发出端调整至所述目标方向之前,控制所述定向发声设备不执行定向发声;以及
如果确定出所述定向发声设备的声音发出端已调整至所述目标方向,则控制所述定向发声设备开始执行定向发声。
7.一种定向发声控制装置,配置于定向发声设备中,其特征在于,所述定向发声装置包括:
语音信号检测模块,用于检测所述定向发声设备所处环境中是否存在语音信号;
目标方向确定模块,用于如果存在所述语音信号,则确定所述语音信号的发出对象相对于所述定向发声设备的方向,作为目标方向;
定向发声控制模块,用于控制所述定向发声设备的声音发出端调整至所述目标方向,以便沿所述目标方向执行定向发声。
8.一种定向发声设备,其特征在于,包括:
语音接收模块,用于接收所述定向发声设备所处环境中的语音信号并发送;
音频处理模块,用于接收由所述语音接收模块发送的语音信号,确定所述语音信号相对于所述定向发声设备的方向,作为目标方向,生成基于所述目标方向的方向调整指令并发送;
方向调整模块,用于接收所述方向调整指令,控制所述定向发声设备的声音发出端调整至所述目标方向,以便所述定向发声设备沿所述目标方向执行定向发声。
9.根据权利要求8所述的定向发声设备,其特征在于,所述定向发声设备还包括:
超声波载波模块,用于生成载波信号并发送;
音频放大模块,用于获取所述载波信号以及待进行定向发声的原始音频信号,将所述载波信号和所述原始音频信号进行调制处理,生成待播放音频信号;
超声波发声模块,用于接收所述待播放音频信号并播放。
10.根据权利要求9所述的定向发声设备,其特征在于,所述音频处理模块还用于接收所述原始音频信号,如果确定出所述定向发声设备的声音发出端已调整至所述目标方向,则将所述原始音频信号发送至所述音频放大模块。
11.根据权利要求9所述的定向发声设备,其特征在于,所述音频处理模块还用于响应定向发声触发事件,如果在预设时间段内未接收到由所述语音接收模块发送的语音信号,则向所述方向调整模块发送初始化指令;
所述方向调整模块还用于响应所述初始化指令,控制所述定向发声设备的声音发出端调整至预先设定的默认方向,以便所述定向发声设备沿所述默认方向执行定向发声。
12.根据权利要求8至11中任一项所述的定向发声设备,其特征在于,所述音频处理模块还用于对所述语音信号进行声纹识别,并将声纹识别的结果与预定声纹数据库中的声纹进行比对;如果所述声纹识别的结果与所述预定声纹数据库中一声纹的相似度大于一相似度阈值,则确定所述语音信号的发出对象相对于所述定向发声设备的方向,作为目标方向。
13.根据权利要求8至11中任一项所述的定向发声设备,其特征在于,所述音频处理模块还用于对所述语音信号进行语音识别,并将语音识别的结果与预定语句进行比对;如果所述语音识别的结果与所述预定语句一致,则确定所述语音信号的发出对象相对于所述定向发声设备的方向,作为目标方向。
14.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的定向发声控制方法。
15.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至6中任一项所述的定向发声控制方法。
CN201910844330.1A 2019-09-06 2019-09-06 定向发声控制方法及装置、发声设备、介质和电子设备 Pending CN110619895A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910844330.1A CN110619895A (zh) 2019-09-06 2019-09-06 定向发声控制方法及装置、发声设备、介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910844330.1A CN110619895A (zh) 2019-09-06 2019-09-06 定向发声控制方法及装置、发声设备、介质和电子设备

Publications (1)

Publication Number Publication Date
CN110619895A true CN110619895A (zh) 2019-12-27

Family

ID=68922691

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910844330.1A Pending CN110619895A (zh) 2019-09-06 2019-09-06 定向发声控制方法及装置、发声设备、介质和电子设备

Country Status (1)

Country Link
CN (1) CN110619895A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111968615A (zh) * 2020-08-31 2020-11-20 Oppo广东移动通信有限公司 降噪处理方法及装置、终端设备和可读存储介质
CN112165591A (zh) * 2020-09-30 2021-01-01 联想(北京)有限公司 一种音频数据的处理方法、装置及电子设备
CN113050076A (zh) * 2021-03-25 2021-06-29 京东方科技集团股份有限公司 一种发送定向音频信息的方法、装置、系统及电子设备
CN113573209A (zh) * 2020-04-29 2021-10-29 维沃移动通信有限公司 音频处理方法、装置及电子设备
CN113628638A (zh) * 2021-07-30 2021-11-09 深圳海翼智新科技有限公司 音频处理方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101068308A (zh) * 2007-05-10 2007-11-07 华为技术有限公司 一种控制图像采集装置进行目标定位的系统及方法
CN206331789U (zh) * 2016-12-06 2017-07-14 广州杰赛科技股份有限公司 一种定向防扰发声装置
CN107742522A (zh) * 2017-10-23 2018-02-27 科大讯飞股份有限公司 基于麦克风阵列的目标语音获取方法及装置
US20180226065A1 (en) * 2017-02-08 2018-08-09 Logitech Europe S.A. Multi-directional beamforming device for acquiring and processing audible input
CN108551619A (zh) * 2018-04-13 2018-09-18 深圳市沃特沃德股份有限公司 智能定向音响系统及其交互方法
CN109068234A (zh) * 2018-10-29 2018-12-21 歌尔科技有限公司 一种音频设备定向发声方法、装置、音频设备
CN109151659A (zh) * 2018-10-29 2019-01-04 歌尔科技有限公司 一种音频设备定向发声方法、装置和音频设备
CN110188179A (zh) * 2019-05-30 2019-08-30 浙江远传信息技术股份有限公司 语音定向识别交互方法、装置、设备及介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101068308A (zh) * 2007-05-10 2007-11-07 华为技术有限公司 一种控制图像采集装置进行目标定位的系统及方法
CN206331789U (zh) * 2016-12-06 2017-07-14 广州杰赛科技股份有限公司 一种定向防扰发声装置
US20180226065A1 (en) * 2017-02-08 2018-08-09 Logitech Europe S.A. Multi-directional beamforming device for acquiring and processing audible input
CN107742522A (zh) * 2017-10-23 2018-02-27 科大讯飞股份有限公司 基于麦克风阵列的目标语音获取方法及装置
CN108551619A (zh) * 2018-04-13 2018-09-18 深圳市沃特沃德股份有限公司 智能定向音响系统及其交互方法
CN109068234A (zh) * 2018-10-29 2018-12-21 歌尔科技有限公司 一种音频设备定向发声方法、装置、音频设备
CN109151659A (zh) * 2018-10-29 2019-01-04 歌尔科技有限公司 一种音频设备定向发声方法、装置和音频设备
CN110188179A (zh) * 2019-05-30 2019-08-30 浙江远传信息技术股份有限公司 语音定向识别交互方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
应怀樵: "《现代振动与噪声技术》", 30 April 2017 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113573209A (zh) * 2020-04-29 2021-10-29 维沃移动通信有限公司 音频处理方法、装置及电子设备
CN111968615A (zh) * 2020-08-31 2020-11-20 Oppo广东移动通信有限公司 降噪处理方法及装置、终端设备和可读存储介质
CN112165591A (zh) * 2020-09-30 2021-01-01 联想(北京)有限公司 一种音频数据的处理方法、装置及电子设备
CN112165591B (zh) * 2020-09-30 2022-05-31 联想(北京)有限公司 一种音频数据的处理方法、装置及电子设备
CN113050076A (zh) * 2021-03-25 2021-06-29 京东方科技集团股份有限公司 一种发送定向音频信息的方法、装置、系统及电子设备
CN113628638A (zh) * 2021-07-30 2021-11-09 深圳海翼智新科技有限公司 音频处理方法、装置、设备及存储介质
CN113628638B (zh) * 2021-07-30 2024-05-28 深圳海翼智新科技有限公司 音频处理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110619895A (zh) 定向发声控制方法及装置、发声设备、介质和电子设备
KR102296238B1 (ko) 기록된 미디어 핫워드 트리거 억제
KR102493289B1 (ko) 핫워드 억제
US20220159403A1 (en) System and method for assisting selective hearing
CN106462383B (zh) 具有定向接口的免提装置
JP2020016875A (ja) 音声インタラクション方法、装置、設備、コンピュータ記憶媒体及びコンピュータプログラム
CN110611861B (zh) 定向发声控制方法及装置、发声设备、介质和电子设备
US20230164509A1 (en) System and method for headphone equalization and room adjustment for binaural playback in augmented reality
CN109361995A (zh) 一种电器设备的音量调节方法、装置、电器设备和介质
JPWO2019138651A1 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
US20230038982A1 (en) Joint Acoustic Echo Cancelation, Speech Enhancement, and Voice Separation for Automatic Speech Recognition
Lee Simultaneous blind separation and recognition of speech mixtures using two microphones to control a robot cleaner
US12002444B1 (en) Coordinated multi-device noise cancellation
US20230298612A1 (en) Microphone Array Configuration Invariant, Streaming, Multichannel Neural Enhancement Frontend for Automatic Speech Recognition
US20230298609A1 (en) Generalized Automatic Speech Recognition for Joint Acoustic Echo Cancellation, Speech Enhancement, and Voice Separation
Lopatka et al. Enhanced voice user interface employing spatial filtration of signals from acoustic vector sensor
Coelho et al. Microphone Array front-end interface for Home Automation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191227