CN112562666A - 一种筛选设备的方法及服务设备 - Google Patents
一种筛选设备的方法及服务设备 Download PDFInfo
- Publication number
- CN112562666A CN112562666A CN202011371765.8A CN202011371765A CN112562666A CN 112562666 A CN112562666 A CN 112562666A CN 202011371765 A CN202011371765 A CN 202011371765A CN 112562666 A CN112562666 A CN 112562666A
- Authority
- CN
- China
- Prior art keywords
- signal
- awakened
- equipment
- noise
- noise ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012216 screening Methods 0.000 title claims abstract description 25
- 238000012545 processing Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 13
- 230000003993 interaction Effects 0.000 abstract description 31
- 238000004891 communication Methods 0.000 description 40
- 239000010410 layer Substances 0.000 description 39
- 238000010586 diagram Methods 0.000 description 29
- 230000006870 function Effects 0.000 description 23
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000002372 labelling Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000017525 heat dissipation Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C17/00—Arrangements for transmitting signals characterised by the use of a wireless electrical link
- G08C17/02—Arrangements for transmitting signals characterised by the use of a wireless electrical link using a radio link
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C23/00—Non-electrical signal transmission systems, e.g. optical systems
- G08C23/04—Non-electrical signal transmission systems, e.g. optical systems using light waves, e.g. infrared
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
- H04N21/42221—Transmission circuitry, e.g. infrared [IR] or radio frequency [RF]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Automation & Control Theory (AREA)
- Selective Calling Equipment (AREA)
Abstract
本申请涉及计算机技术领域,公开了一种筛选设备的方法及服务设备,获取各待唤醒设备的唤醒信号的信号质量参数后,筛选出一个待唤醒设备作为响应唤醒信号的设备。其中,内置噪声源的待唤醒设备的信号质量参数是根据待唤醒设备的噪声源的噪声情况确定的。从而可以准确筛选出响应唤醒信号的设备,便于用户与设备进行语音交互。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种筛选设备的方法及服务设备。
背景技术
随着语音识别技术的飞速发展,语音交互的应用场景越来越普遍,例如智能家居中的智能音箱、智能电视、智能机器人、智能冰箱、智能空调等都可以通过语音交互进行使用。并且,针对用户距离语音交互设备一定距离时,不需要增加音量的情况下仍然可以进行语音交互的需求,现有设备中通过远场语音的功能实现一定距离的语音交互需求。
但是,当应用场景中存在多个语音交互设备时,用户针对目标设备发出语音信号后,容易出现多个语音交互设备均进行响应的情况,或者出现其他语音交互设备进行响应,而目标设备并没有进行响应的情况,故此,现有技术中存在不能很好的筛选合适的智能设备与用户进行交互。
发明内容
本申请实施例提供一种筛选设备的方法及服务设备,可以解决不能很好的筛选合适的智能设备与用户进行交互的问题。
一方面,本申请一实施例提供了一种服务设备,包括:存储器和控制器;
所述存储器,用于存储计算机程序;
所述控制器与所述存储器连接,被配置为基于所述计算机程序执行:
获取各待唤醒设备的唤醒信号的信号质量参数,其中,内置噪声源的待唤醒设备的信号质量参数是根据所述待唤醒设备的所述噪声源的噪声情况确定的;
基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备。
本申请一实施例中,针对内置噪声源的所述待唤醒设备,所述待唤醒设备的所述信号质量参数是根据所述待唤醒设备的信噪比补偿值对所述待唤醒设备的唤醒信号的信噪比进行补偿处理后得到的;
针对未内置噪声源的待唤醒设备,所述信号质量参数为所述待唤醒设备的唤醒信号的信噪比。
本申请一实施例中,针对任一内置噪声源的待唤醒设备,所述控制器还被配置为:
在关闭所述噪声源的状态下,获取所述待唤醒设备的预设信号的第一信噪比;
在开启所述噪声源的状态下,获取所述待唤醒设备的所述预设信号的第二信噪比;
将所述第一信噪比与所述第二信噪比的差值,确定为所述待唤醒设备的信噪比补偿值。
本申请一实施例中,针对任一内置噪声源的待唤醒设备,所述控制器还被配置为:
在关闭所述噪声源的状态下,获取所述待唤醒设备的多个预设信号各自的信噪比,其中所述多个预设信号属于不同的预设频段;
在开启所述噪声源的状态下,获取所述待唤醒设备的所述多个预设信号的各自的信噪比;
确定每个所述预设信号在关闭所述噪声源的状态下和在开启所述噪声源的状态下分别得到的信噪比的差值;
确定各所述预设信号的信噪比的差值的加权平均值作为所述待唤醒设备的所述信噪比补偿值。
本申请一实施例中,由所述控制器执行所述补偿处理时,所述控制器还被配置为:
针对任一内置噪声源的待唤醒设备,将所述待唤醒设备的信噪比补偿值与所述待唤醒设备的唤醒信号的信噪比之和确定为所述待唤醒设备的信号质量参数。
本申请一实施例中,执行获取各待唤醒设备的唤醒信号的信号质量参数时,所述控制器被配置为:
接收各所述待唤醒设备发送的各自的所述信号质量参数;或者,
接收各所述待唤醒设备发送的各自的唤醒信号的频谱能量值、以及各自的噪声能量值;基于各所述待唤醒设备的各自的唤醒信号的频谱能量值、以及各自的噪声能量值,确定各所述待唤醒设备的所述信号质量参数。
本申请一实施例中,执行基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备时,所述控制器具体被配置为:
将各所述待唤醒设备的所述信号质量参数中,所述信号质量参数最大的待唤醒设备作为响应所述唤醒信号的设备。
本申请一实施例中,若所述服务设备与各所述待唤醒设备中的任一设备均不同,则执行基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备之后,所述控制器还被配置为:
发送响应所述唤醒信号的指令至筛选出的待唤醒设备,以指示筛选出的待唤醒设备响应所述唤醒信号。
本申请一实施例中,若所述服务设备为所述待唤醒设备中的设备,则执行基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备之后,所述控制器还被配置为:
若筛选出的待唤醒设备为所述服务设备,则响应所述唤醒信号;
若筛选出的待唤醒设备为所述除所述服务设备之外的其他待唤醒设备,则发送响应所述唤醒信号的指令至筛选出的待唤醒设备,以指示筛选出的待唤醒设备响应所述唤醒信号。
另一方面,本申请一实施例提供了一种筛选设备的方法,包括:
获取各待唤醒设备的唤醒信号的信号质量参数,其中,内置噪声源的待唤醒设备的信号质量参数是根据所述待唤醒设备的所述噪声源的噪声情况确定的;
基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备。
本申请一实施例中,针对内置噪声源的所述待唤醒设备,所述待唤醒设备的所述信号质量参数是根据所述待唤醒设备的信噪比补偿值对所述待唤醒设备的唤醒信号的信噪比进行补偿处理后得到的;
针对未内置噪声源的待唤醒设备,所述信号质量参数为所述待唤醒设备的唤醒信号的信噪比。
本申请一实施例中,针对任一内置噪声源的待唤醒设备,所述方法还包括:
在关闭所述噪声源的状态下,获取所述待唤醒设备的预设信号的第一信噪比;
在开启所述噪声源的状态下,获取所述待唤醒设备的所述预设信号的第二信噪比;
将所述第一信噪比与所述第二信噪比的差值,确定为所述待唤醒设备的信噪比补偿值。
本申请一实施例中,针对任一内置噪声源的待唤醒设备,所述方法还包括:
在关闭所述噪声源的状态下,获取所述待唤醒设备的多个预设信号各自的信噪比,其中所述多个预设信号属于不同的预设频段;
在开启所述噪声源的状态下,获取所述待唤醒设备的所述多个预设信号的各自的信噪比;
确定每个所述预设信号在关闭所述噪声源的状态下和在开启所述噪声源的状态下分别得到的信噪比的差值;
确定各所述预设信号的信噪比的差值的加权平均值作为所述待唤醒设备的所述信噪比补偿值。
本申请一实施例中,所述方法还包括:
针对任一内置噪声源的待唤醒设备,将所述待唤醒设备的信噪比补偿值与所述待唤醒设备的唤醒信号的信噪比之和确定为所述待唤醒设备的信号质量参数。
本申请一实施例中,所述获取各待唤醒设备的唤醒信号的信号质量参数,包括:
接收各所述待唤醒设备发送的各自的所述信号质量参数;或者,
接收各所述待唤醒设备发送的各自的唤醒信号的频谱能量值、以及各自的噪声能量值;基于各所述待唤醒设备的各自的唤醒信号的频谱能量值、以及各自的噪声能量值,确定各所述待唤醒设备的所述信号质量参数。
本申请一实施例中,所述基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备,包括:
将各所述待唤醒设备的所述信号质量参数中,所述信号质量参数最大的待唤醒设备作为响应所述唤醒信号的设备。
本申请一实施例中,若所述服务设备与各所述待唤醒设备中的任一设备均不同,则所述基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备之后,所述方法还包括:
发送响应所述唤醒信号的指令至筛选出的待唤醒设备,以指示筛选出的待唤醒设备响应所述唤醒信号。
本申请一实施例中,若所述服务设备为所述待唤醒设备中的设备,则所述基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备之后,所述方法还包括:
若筛选出的待唤醒设备为所述服务设备,则响应所述唤醒信号;
若筛选出的待唤醒设备为所述除所述服务设备之外的其他待唤醒设备,则发送响应所述唤醒信号的指令至筛选出的待唤醒设备,以指示筛选出的待唤醒设备响应所述唤醒信号。
再一方面,本申请一实施例提供了一种计算机存储介质,其上存储有计算机程序指令,该计算机程序指令在计算机上运行时,使得所述计算机执行如第一方面所述的任一种方法。
本申请实施例中,服务设备获取各待唤醒设备的唤醒信号的信号质量参数后,筛选出一个待唤醒设备作为响应唤醒信号的设备。其中,针对任一待唤醒设备,若待唤醒设备内置噪声源,则待唤醒设备的信号质量参数是根据待唤醒设备的信噪比补偿值对待唤醒设备的唤醒信号的信噪比进行补偿处理后得到的,若待唤醒设备未内置噪声源,则待唤醒设备的信号质量参数为唤醒信号的信噪比。从而可以准确地筛选出响应唤醒信号的设备,便于用户与设备进行语音交互。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,显而易见地,下面所介绍的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1中示例性示出了根据一些实施例的服务设备与控制装置之间操作场景的示意图;
图2中示例性示出了根据一些实施例的服务设备200的硬件配置框图;
图3中示例性示出了根据一些实施例的控制装置100的硬件配置框图;
图4中示例性示出了根据一些实施例的服务设备200中软件配置示意图;
图5中示例性示出了根据一些实施例的服务设备200中应用程序的图标控件界面显示示意图;
图6中示例性示出了本申请实施例提供的服务设备在语音交互场景的一种应用示意图;
图7中示例性示出了本申请实施例提供的服务设备应用在语音交互场景的流程示意图;
图8中示例性示出了本申请实施例提供的服务设备在语音交互场景的一种应用示意图;
图9中示例性示出了本申请实施例提供的服务设备应用在语音交互场景的流程示意图;
图10中示例性示出了本申请实施例提供的识别模型的供应商下发识别模型的示意图;
图11中示例性示出了本申请实施例提供的服务器得到识别模型的一种流程示意图;
图12中示例性示出了本申请实施例提供的服务器对识别模型进行更新的一种流程示意图;
图13中示例性示出了唤醒信号和噪声的示意图;
图14(a)中示例性示出了集中式网络架构的示意图;
图14(b)中示例性示出了分布式网络架构的示意图;
图14(c)中示例性示出了集中式网络架构的示意图;
图15中示例性示出了筛选待唤醒设备作为响应唤醒信号的设备的应用场景示意图;
图16中示例性示出了智能冰箱1和智能冰箱2之间的交互流程图。
具体实施方式
为使本申请的目的、实施例和优点更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施例进行清楚、完整地描述,显然,所描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
基于本申请描述的示例性实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请所附权利要求保护的范围。此外,虽然本申请中公开内容按照示范性一个或几个实例来介绍,但应理解,可以就这些公开内容的各个方面也可以单独构成一个完整实施例。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施例,而不是意图限定本申请的实施例。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语″第一″、″第二″、″第三″等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明(Unless otherwise indicated)。应该理解这样使用的用语在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。
此外,术语″包括″和″具有″以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的那些组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
本申请中使用的术语″模块″,是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
本申请中使用的术语″遥控器″,是指电子设备(如本申请中公开的服务设备)的一个组件,通常可在较短的距离范围内无线控制电子设备。一般使用红外线和/或射频(RF)信号和/或蓝牙与电子设备连接,也可以包括WiFi、无线USB、蓝牙、动作传感器等功能模块。例如:手持式触摸遥控器,是以触摸屏中用户界面取代一般遥控装置中的大部分物理内置硬键。
本申请中使用的术语″手势″,是指用户通过一种手型的变化或手部运动等动作,用于表达预期想法、动作、目的/或结果的用户行为。
为便于理解本申请实施例提供的方法及智能设备,下面以智能设备中的服务设备为例,对服务设备的结构、服务设备和控制装置的交互进行描述:
图1中示例性示出了根据实施例中服务设备与控制装置之间操作场景的示意图。如图1中示出,用户可通过控制装置100操作服务设备200。其中,控制装置100可以是遥控器1001或智能设备1002。
在一些实施例中,遥控器和服务设备的通信包括红外协议通信或蓝牙协议通信,及其他短距离通信方式等,通过无线或其他有线方式来控制服务设备200。用户可以通过遥控器上按键,语音输入、控制面板输入等输入用户指令,来控制服务设备200。如:用户可以通过遥控器上音量加减键、频道控制键、上/下/左/右的移动按键、语音输入按键、菜单键、开关机按键等输入相应控制指令,来实现控制服务设备200的功能。
在一些实施例中,智能设备1002可以是移动终端、平板电脑、计算机、笔记本电脑、和其他智能设备以控制服务设备200。例如,使用在智能设备上运行的应用程序控制服务设备200。该应用程序通过配置可以在与智能设备关联的屏幕上,在直观的用户界面(UI)中为用户提供各种控制。
在一些实施例中,智能设备1002可与服务设备200安装软件应用,通过网络通信协议实现连接通信,实现一对一控制操作的和数据通信的目的。如:可以实现用智能设备1002与服务设备200建立控制指令协议,将遥控控制键盘同步到智能设备1002上,通过控制智能设备1002上用户界面,实现控制服务设备200的功能。也可以将智能设备1002上显示音视频内容传输到服务设备200上,实现同步显示功能。
如图1中还示出,服务设备200还与服务器400通过多种通信方式进行数据通信。可允许服务设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向服务设备200提供各种内容和互动。示例的,服务设备200通过发送和接收信息,以及电子节目指南(EPG)互动,接收软件程序更新,或访问远程储存的数字媒体库。服务器400可以是一个集群,也可以是多个集群,可以包括一类或多类服务器。通过服务器400提供视频点播和广告服务等其他网络服务内容。
服务设备200,可以液晶显示器、OLED显示器、投影服务设备。具体服务设备类型,尺寸大小和分辨率等不作限定,本领技术人员可以理解的是,服务设备200可以根据需要做性能和配置上一些改变。
服务设备200除了提供广播接收电视功能之外,还可以附加提供计算机支持功能的智能网络电视功能,包括但不限于,网络电视、智能电视、互联网协议电视(IPTV)等。
图2中示例性示出了根据示例性实施例中服务设备200的硬件配置框图。
在一些实施例中,服务设备200中包括控制器250、调谐解调器210、通信器220、检测器230、输入/输出接口255、显示器275,音频输出接口285、存储器260、供电电源290、用户接口265、外部装置接口240中的至少一种。
在一些实施例中,显示器275,用于接收源自第一处理器输出的图像信号,进行显示视频内容和图像以及菜单操控界面的组件。
在一些实施例中,显示器275,包括用于呈现画面的显示屏组件,以及驱动图像显示的驱动组件。
在一些实施例中,显示视频内容,可以来自广播电视内容,也可以是说,可通过有线或无线通信协议接收的各种广播信号。或者,可显示来自网络通信协议接收来自网络服务器端发送的各种图像内容。
在一些实施例中,显示器275用于呈现服务设备200中产生且用于控制服务设备200的用户操控UI界面。
在一些实施例中,根据显示器275类型不同,还包括用于驱动显示的驱动组件。
在一些实施例中,显示器275为一种投影显示器,还可以包括一种投影装置和投影屏幕。
在一些实施例中,通信器220是用于根据各种通信协议类型与外部设备或外部服务器进行通信的组件。例如:通信器可以包括Wifi芯片,蓝牙通信协议芯片,有线以太网通信协议芯片等其他网络通信协议芯片或近场通信协议芯片,以及红外接收器中的至少一种。
在一些实施例中,服务设备200可以通过通信器220与外部控制装置100或内容提供设备之间建立控制信号和数据信号发送和接收。
在一些实施例中,用户接口265,可用于接收控制装置100(如:红外遥控器等)红外控制信号。
在一些实施例中,检测器230是服务设备200用于采集外部环境或与外部交互的信号。
在一些实施例中,检测器230包括光接收器,用于采集环境光线强度的传感器,可以通过采集环境光可以自适应性显示参数变化等。
在一些实施例中,检测器230还可以包括图像采集器,如相机、摄像头等,可以用于采集外部环境场景,以及用于采集用户的属性或与用户交互手势,可以自适应变化显示参数,也可以识别用户手势,以实现与用户之间互动的功能。
在一些实施例中,检测器230还可以包括温度传感器等,如通过感测环境温度。
在一些实施例中,服务设备200可自适应调整图像的显示色温。如当温度偏高的环境时,可调整服务设备200显示图像色温偏冷色调,或当温度偏低的环境时,可以调整服务设备200显示图像偏暖色调。
在一些实施例中,检测器230还可声音采集器等,如麦克风,可以用于接收用户的声音。示例性的,包括用户控制服务设备200的控制指令的语音信号,或采集环境声音,用于识别环境场景类型,使得服务设备200可以自适应环境噪声。
在一些实施例中,如图2所示,输入/输出接口255被配置为,可进行控制器250与外部其他设备或其他控制器250之间的数据传输。如接收外部设备的视频信号数据和音频信号数据、或命令指令数据等。
在一些实施例中,外部装置接口240可以包括,但不限于如下:可以高清多媒体接口HDMI接口、模拟或数据高清分量输入接口、复合视频输入接口、USB输入接口、RGB端口等任一个或多个接口。也可以是上述多个接口形成复合性的输入/输出接口。
在一些实施例中,如图2所示,调谐解调器210被配置为,通过有线或无线接收方式接收广播电视信号,可以进行放大、混频和谐振等调制解调处理,从多多个无线或有线广播电视信号中解调出音视频信号,该音视频信号可以包括用户所选择电视频道频率中所携带的电视音视频信号,以及EPG数据信号。
在一些实施例中,调谐解调器210解调的频点受到控制器250的控制,控制器250可根据用户选择发出控制信号,以使的调制解调器响应用户选择的电视信号频率以及调制解调该频率所携带的电视信号。
在一些实施例中,广播电视信号可根据电视信号广播制式不同区分为地面广播信号、有线广播信号、卫星广播信号或互联网广播信号等。或者根据调制类型不同可以区分为数字调制信号,模拟调制信号等。或者根据信号种类不同区分为数字信号、模拟信号等。
在一些实施例中,控制器250和调谐解调器210可以位于不同的分体设备中,即调谐解调器210也可在控制器250所在的主体设备的外置设备中,如外置机顶盒等。这样,机顶盒将接收到的广播电视信号调制解调后的电视音视频信号输出给主体设备,主体设备经过第一输入/输出接口接收音视频信号。
在一些实施例中,控制器250,通过存储在存储器上中各种软件控制程序,来控制服务设备的工作和响应用户的操作。控制器250可以控制服务设备200的整体操作。例如:响应于接收到用于选择在显示器275上显示UI对象的用户命令,控制器250便可以执行与由用户命令选择的对象有关的操作。
在一些实施例中,所述对象可以是可选对象中的任何一个,例如超链接或图标。与所选择的对象有关操作,例如:显示连接到超链接页面、文档、图像等操作,或者执行与所述图标相对应程序的操作。用于选择UI对象用户命令,可以是通过连接到服务设备200的各种输入装置(例如,鼠标、键盘、触摸板等)输入命令或者与由用户说出语音相对应的语音命令。
如图2所示,控制器250包括随机存取存储器251(Random Access Memory,RAM)、只读存储器252(Read-Only Memory,ROM)、视频处理器270、音频处理器280、其他处理器253(例如:图形处理器(Graphics Processing Unit,GPU)、中央处理器254(CentralProcessing Unit,CPU)、通信接口(Communication Interface),以及通信总线256(Bus)中的至少一种。其中,通信总线连接各个部件。
在一些实施例中,RAM 251用于存储操作系统或其他正在运行中的程序的临时数据。
在一些实施例中,ROM 252用于存储各种系统启动的指令。
在一些实施例中,ROM 252用于存储一个基本输入输出系统,称为基本输入输出系统(Basic Input Output System,BIOS)。用于完成对系统的加电自检、系统中各功能模块的初始化、系统的基本输入/输出的驱动程序及引导操作系统。
在一些实施例中,在收到开机信号时,服务设备200电源开始启动,CPU运行ROM252中系统启动指令,将存储在存储器的操作系统的临时数据拷贝至RAM 251中,以便于启动或运行操作系统。当操作系统启动完成后,CPU再将存储器中各种应用程序的临时数据拷贝至RAM 251中,然后,以便于启动或运行各种应用程序。
在一些实施例中,CPU处理器254,用于执行存储在存储器中操作系统和应用程序指令。以及根据接收外部输入的各种交互指令,来执行各种应用程序、数据和内容,以便最终显示和播放各种音视频内容。
在一些示例性实施例中,CPU处理器254,可以包括多个处理器。多个处理器可包括一个主处理器以及一个或多个子处理器。主处理器,用于在预加电模式中执行服务设备200一些操作,和/或在正常模式下显示画面的操作。一个或多个子处理器,用于在待机模式等状态下一种操作。
在一些实施例中,图形处理器253,用于产生各种图形对象,如:图标、操作菜单、以及用户输入指令显示图形等。包括运算器,通过接收用户输入各种交互指令进行运算,根据显示属性显示各种对象。以及包括渲染器,对基于运算器得到的各种对象,进行渲染,上述渲染后的对象用于显示在显示器上。
在一些实施例中,视频处理器270被配置为将接收外部视频信号,根据输入信号的标准编解码协议,进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等等视频处理,可得到直接可服务设备200上显示或播放的信号。
在一些实施例中,视频处理器270,包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等。
其中,解复用模块,用于对输入音视频数据流进行解复用处理,如输入MPEG-2,则解复用模块进行解复用成视频信号和音频信号等。
视频解码模块,则用于对解复用后的视频信号进行处理,包括解码和缩放处理等。
图像合成模块,如图像合成器,其用于将图形生成器根据用户输入或自身生成的GUI信号,与缩放处理后视频图像进行叠加混合处理,以生成可供显示的图像信号。
帧率转换模块,用于对转换输入视频帧率,如将60Hz帧率转换为120Hz帧率或240Hz帧率,通常的格式采用如插帧方式实现。
显示格式化模块,则用于将接收帧率转换后视频输出信号,改变信号以符合显示格式的信号,如输出RGB数据信号。
在一些实施例中,图形处理器253可以和视频处理器可以集成设置,也可以分开设置,集成设置的时候可以执行输出给显示器的图形信号的处理,分离设置的时候可以分别执行不同的功能,例如GPU+FRC(Frame Rate Conversion))架构。
在一些实施例中,音频处理器280,用于接收外部的音频信号,根据输入信号的标准编解码协议,进行解压缩和解码,以及降噪、数模转换、和放大处理等处理,得到可以在扬声器中播放的声音信号。
在一些实施例中,视频处理器270可以包括一颗或多颗芯片组成。音频处理器,也可以包括一颗或多颗芯片组成。
在一些实施例中,视频处理器270和音频处理器280,可以集成在单独的芯片中,也可以与控制器一起集成在一颗或多颗芯片中。
在一些实施例中,音频输出,在控制器250的控制下接收音频处理器280输出的声音信号,如:扬声器286,以及除了服务设备200自身携带的扬声器之外,可以输出至外接设备的发生装置的外接音响输出端子,如:外接音响接口或耳机接口等,还可以包括通信接口中的近距离通信模块,例如:用于进行蓝牙扬声器声音输出的蓝牙模块。
供电电源290,在控制器250控制下,将外部电源输入的电力为服务设备200提供电源供电支持。供电电源290可以包括安装服务设备200内部的内置电源电路,也可以是安装在服务设备200的外部电源,在服务设备200中提供外接电源的电源接口。
用户接口265,用于接收用户的输入信号,然后,将接收用户输入信号发送给控制器250。用户输入信号可以是通过红外接收器接收的遥控器信号,可以通过网络通信模块接收各种用户控制信号。
在一些实施例中,用户通过控制装置100输入用户命令,用户输入接口则根据用户的输入,服务设备200则通过控制器250响应用户的输入。
在一些实施例中,用户可在显示器275上显示的图形用户界面(GUI)输入用户命令,则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者,用户可通过输入特定的声音或手势进行输入用户命令,则用户输入接口通过传感器识别出声音或手势,来接收用户输入命令。
在一些实施例中,″用户界面″,是应用程序或操作系统与用户之间进行交互和信息交换的介质接口,它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(Graphic User Interface,GUI),是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素,其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素。
存储器260,包括存储用于驱动服务设备200的各种软件模块。如:第一存储器中存储的各种软件模块,包括:基础模块、检测模块、通信模块、显示控制模块、浏览器模块、和各种服务模块等中的至少一种。
基础模块用于服务设备200中各个硬件之间信号通信、并向上层模块发送处理和控制信号的底层软件模块。检测模块用于从各种传感器或用户输入接口中收集各种信息,并进行数模转换以及分析管理的管理模块。
例如,语音识别模块中包括语音解析模块和语音指令数据库模块。显示控制模块用于控制显示器进行显示图像内容的模块,可以用于播放多媒体图像内容和UI界面等信息。通信模块,用于与外部设备之间进行控制和数据通信的模块。浏览器模块,用于执行浏览服务器之间数据通信的模块。服务模块,用于提供各种服务以及各类应用程序在内的模块。同时,存储器260还用存储接收外部数据和用户数据、各种用户界面中各个项目的图像以及焦点对象的视觉效果图等。
图3示例性示出了根据示例性实施例中控制装置100的配置框图。如图3所示,控制装置100包括控制器110、通信接口130、用户输入/输出接口、存储器、供电电源。
控制装置100被配置为控制服务设备200,以及可接收用户的输入操作指令,且将操作指令转换为服务设备200可识别和响应的指令,起到用户与服务设备200之间交互中介作用。如:用户通过操作控制装置100上频道加减键,服务设备200响应频道加减的操作。
在一些实施例中,控制装置100可是一种智能设备。如:控制装置100可根据用户需求安装控制服务设备200的各种应用。
在一些实施例中,如图1所示,智能设备1002或其他智能电子设备,可在安装操控服务设备200的应用之后,可以起到遥控器1001类似功能。如:用户可以通过安装应用,在智能设备1002或其他智能电子设备上可提供的图形用户界面的各种功能键或虚拟按钮,以实现遥控器1001实体按键的功能。
控制器110包括处理器112和RAM 113和ROM 114、通信接口130以及通信总线。控制器用于控制控制装置100的运行和操作,以及内部各部件之间通信协作以及外部和内部的数据处理功能。
通信接口130在控制器110的控制下,实现与服务设备200之间控制信号和数据信号的通信。如:将接收到的用户输入信号发送至服务设备200上。通信接口130可包括WiFi芯片131、蓝牙模块132、NFC模块133等其他近场通信模块中至少之一种。
用户输入/输出接口140,其中,输入接口包括麦克风141、触摸板142、传感器143、按键144等其他输入接口中至少一者。如:用户可以通过语音、触摸、手势、按压等动作实现用户指令输入功能,输入接口通过将接收的模拟信号转换为数字信号,以及数字信号转换为相应指令信号,发送至服务设备200。
输出接口包括将接收的用户指令发送至服务设备200的接口。在一些实施例中,可以是红外接口,也可以是射频接口。如:红外信号接口时,需要将用户输入指令按照红外控制协议转化为红外控制信号,经红外发送模块发送至服务设备200。再如:射频信号接口时,需将用户输入指令转化为数字信号,然后按照射频控制信号调制协议进行调制后,由射频发送端子发送至服务设备200。
在一些实施例中,控制装置100包括通信接口130和输入输出接口140中至少一者。控制装置100中配置通信接口130,如:WiFi、蓝牙、NFC等模块,可将用户输入指令通过WiFi协议、或蓝牙协议、或NFC协议编码,发送至服务设备200。
存储器190,用于在控制器的控制下存储驱动和控制控制装置100的各种运行程序、数据和应用。存储器190,可以存储用户输入的各类控制信号指令。
供电电源180,用于在控制器的控制下为控制装置100各元件提供运行电力支持。可以电池及相关控制电路。
在一些实施例中,系统可以包括内核(Kernel)、命令解析器(shell)、文件系统和应用程序。内核、shell和文件系统一起组成了基本的操作系统结构,它们让用户可以管理文件、运行程序并使用系统。上电后,内核启动,激活内核空间,抽象硬件、初始化硬件参数等,运行并维护虚拟内存、调度器、信号及进程间通信(IPC)。内核启动后,再加载Shell和用户应用程序。应用程序在启动后被编译成机器码,形成一个进程。
参见图4,在一些实施例中,将系统分为四层,从上至下分别为应用程序(Applications)层(简称″应用层″),应用程序框架(Application Framework)层(简称″框架层″),安卓运行时(Android runtime)和系统库层(简称″系统运行库层″),以及内核层。
在一些实施例中,应用程序层中运行有至少一个应用程序,这些应用程序可以是操作系统自带的窗口(Window)程序、系统设置程序、时钟程序、相机应用等;也可以是第三方开发者所开发的应用程序,比如嗨见程序、K歌程序、魔镜程序等。在具体实施时,应用程序层中的应用程序包不限于以上举例,实际还可以包括其它应用程序包,本申请实施例对此不做限制。
框架层为应用程序层的应用程序提供应用编程接口(application programminginterface,API)和编程框架。应用程序框架层包括一些预先定义的函数。应用程序框架层相当于一个处理中心,这个中心决定让应用层中的应用程序做出动作。应用程序通过API接口,可在执行中访问系统中的资源和取得系统的服务
如图4所示,本申请实施例中应用程序框架层包括管理器(Managers),内容提供者(Content Provider)等,其中管理器包括以下模块中的至少一个:活动管理器(ActivityManager)用与和系统中正在运行的所有活动进行交互;位置管理器(Location Manager)用于给系统服务或应用提供了系统位置服务的访问;文件包管理器(Package Manager)用于检索当前安装在设备上的应用程序包相关的各种信息;通知管理器(NotificationManager)用于控制通知消息的显示和清除;窗口管理器(Window Manager)用于管理用户界面上的括图标、窗口、工具栏、壁纸和桌面部件。
在一些实施例中,活动管理器用于:管理各个应用程序的生命周期以及通常的导航回退功能,比如控制应用程序的退出(包括将显示窗口中当前显示的用户界面切换到系统桌面)、打开、后退(包括将显示窗口中当前显示的用户界面切换到当前显示的用户界面的上一级用户界面)等。
在一些实施例中,窗口管理器用于管理所有的窗口程序,比如获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕,控制显示窗口变化(例如将显示窗口缩小显示、抖动显示、扭曲变形显示等)等。
在一些实施例中,系统运行库层为上层即框架层提供支撑,当框架层被使用时,安卓操作系统会运行系统运行库层中包含的C/C++库以实现框架层要实现的功能。
在一些实施例中,内核层是硬件和软件之间的层。如图4所示,内核层至少包含以下驱动中的至少一种:音频驱动、显示驱动、蓝牙驱动、摄像头驱动、WIFI驱动、USB驱动、HDMI驱动、传感器驱动(如指纹传感器,温度传感器,触摸传感器、压力传感器等)等。
在一些实施例中,内核层还包括用于进行电源管理的电源驱动模块。
在一些实施例中,图4中的软件架构对应的软件程序和/或模块存储在图2或图3所示的第一存储器或第二存储器中。
在一些实施例中,以魔镜应用(拍照应用)为例,当遥控接收装置接收到遥控器输入操作,相应的硬件中断被发给内核层。内核层将输入操作加工成原始输入事件(包括输入操作的值,输入操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件,根据焦点当前的位置识别该输入事件所对应的控件以及以该输入操作是确认操作,该确认操作所对应的控件为魔镜应用图标的控件,魔镜应用调用应用框架层的接口,启动魔镜应用,进而通过调用内核层启动摄像头驱动,实现通过摄像头捕获静态图像或视频。
在一些实施例中,对于具备触控功能的服务设备,以分屏操作为例,服务设备接收用户作用于显示屏上的输入操作(如分屏操作),内核层可以根据输入操作产生相应的输入事件,并向应用程序框架层上报该事件。由应用程序框架层的活动管理器设置与该输入操作对应的窗口模式(如多窗口模式)以及窗口位置和大小等。应用程序框架层的窗口管理根据活动管理器的设置绘制窗口,然后将绘制的窗口数据发送给内核层的显示驱动,由显示驱动在显示屏的不同显示区域显示与之对应的应用界面。
在一些实施例中,如图5中所示,应用程序层包含至少一个应用程序可以在显示器中显示对应的图标控件,如:直播电视应用程序图标控件、视频点播应用程序图标控件、媒体中心应用程序图标控件、应用程序中心图标控件、游戏应用图标控件等。
在一些实施例中,直播电视应用程序,可以通过不同的信号源提供直播电视。例如,直播电视应用程可以使用来自有线电视、无线广播、卫星服务或其他类型的直播电视服务的输入提供电视信号。以及,直播电视应用程序可在服务设备200上显示直播电视信号的视频。
在一些实施例中,视频点播应用程序,可以提供来自不同存储源的视频。不同于直播电视应用程序,视频点播提供来自某些存储源的视频显示。例如,视频点播可以来自云存储的服务器端、来自包含已存视频节目的本地硬盘储存器。
在一些实施例中,媒体中心应用程序,可以提供各种多媒体内容播放的应用程序。例如,媒体中心,可以为不同于直播电视或视频点播,用户可通过媒体中心应用程序访问各种图像或音频所提供服务。
在一些实施例中,应用程序中心,可以提供储存各种应用程序。应用程序可以是一种游戏、应用程序,或某些和计算机系统或其他设备相关但可以在智能电视中运行的其他应用程序。应用程序中心可从不同来源获得这些应用程序,将它们储存在本地储存器中,然后在服务设备200上可运行。
更为具体地,在一些实施例中,本申请前述的任一服务设备200,均可具有语音交互的功能,来提高服务设备200的智能化程度,并提高服务设备200的用户体验。
在一些实施例中,图6为服务设备在语音交互场景的一种应用示意图,其中,用户1可以通过声音说出希望服务设备200执行的指令,则对于服务设备200可以实时采集语音数据,并对语音数据中包括的用户1的指令进行识别,并在识别出用户1的指令后,直接执行该指令,在整个过程中,用户1没有实际对服务设备200或者其他设备进行操作,只是简单地说出了指令。
在一些实施例中,当如图2所示的服务设备200应用在如图6所示的场景中,服务设备200可以通过其声音采集器231实时采集语音数据,随后,声音采集器231将采集得到的语音数据发送给控制器250,最终由控制器250对语音数据中包括的指令进行识别。
在一些实施例中,图7为服务设备应用在语音交互场景的流程示意图,可以由如图6所示场景中的设备执行,具体地,在S11中,服务设备200内的声音采集器231实时采集服务设备200所在周围环境中的语音数据,并将所采集到的语音数据发送给控制器250进行识别。
在一些实施例中,在如图7所示的S12中,控制器250在接收到语音数据后,对语音数据中包括的指令进行识别。例如,语音数据中包括用户1所出的″增大亮度″的指令,则控制器250并在识别到语音数据中包括的指令后,可以由该控制器250执行所识别出的指令,控制显示器275增加亮度。可以理解的是,这种情况下控制器250对每个接收到的语音数据进行识别,可能出现识别语音数据中没有指令情况。
而在另一些实施例中,基于指令识别的模型较大、运算效率较低,还可以规定用户1在说出指令前加入关键词,例如″ABCD″,则用户需要说出″ABCD,增大亮度″的指令,使得在如图7所示的S12中,控制器250在接收到语音数据后,首先对每个语音数据中是否有″ABCD″的关键词进行识别,在识别到有关键词之后,再使用指令识别模型对语音数据中的″增大亮度″对应的具体指令进行识别。
在一些实施例中,控制器250在接收到语音数据后,还可以对语音数据进行去噪,包括去除回声和环境噪声,处理为干净的语音数据,并将处理后的语音数据进行识别。
在一些实施例中,图7为服务设备在语音交互场景的另一种应用示意图,其中,服务设备200可以通过互联网与服务器400连接,则当服务设备200采集到语音数据后,可以将语音数据通过互联网发送给服务器400,由服务器400对语音数据中包括的指令进行识别,并将识别后的指令发送回服务设备200,使得服务设备200可以直接执行所接收到的指令。这种场景与如图6所示的场景相比,减少了对服务设备200运算能力的要求,能够在服务器400上设置更大的识别模型,来进一步提高对语音数据中指令识别的准确率。
在一些实施例中,当如图2所示的服务设备200应用在如图6所示的场景中,服务设备200可以通过其声音采集器231实时采集语音数据,随后,声音采集器231将采集得到的语音数据发送给控制器250,控制器250通过通信器220将语音数据发送给服务器400,由服务器400对语音数据中包括的指令进行识别后,服务设备200再通过通信器220接收服务器400发送的指令,并最终由控制器250执行所接收到的指令。
在一些实施例中,图9为服务设备应用在语音交互场景的另一流程示意图,可以由如图8所示的场景中的设备执行,其中,在S21中,显示服务设备200内的声音采集器231实时采集服务设备200所在周围环境中的语音数据,并将所采集到的语音数据发送给控制器250,控制器250在S22中将语音数据进一步通过通信器220发送给服务器400,由服务器在S23中识别语音数据中包括的指令,随后,服务器400将识别得到的指令在S24中发送回服务设备200,对应地服务设备200通过通信器220接收指令后发送给控制器250,最终控制器250可以直接执行所接收到的指令。
在一些实施例中,如图7所示的S23中,服务器400在接收到语音数据后,对语音数据中包括的指令进行识别。例如,语音数据中包括用户1所出的″增大亮度″的指令。而由于指令识别的模型较大,且服务器400对每个接收到的语音数据进行识别,可能出现识别语音数据中没有指令情况,因此为了降低服务器400进行无效的识别、以及减少服务设备200和服务器400之间的通信交互数据量,在具体实现时,还可以规定用户1在说出指令前加入关键词,例如″ABCD″,则用户需要说出″ABCD,增大亮度″的指令,随后,由服务设备200的控制器250在S22中,首先通过模型较小、运算量较低的关键词识别模型,对语音数据中是否存在关键词″ABCD″进行识别,若当前控制器250正在处理的语音数据中没有识别出关键词,则控制器250不会将该语音数据发送给服务器400;若当前控制器250正在处理的语音数据中识别出关键词,则控制器250再将该语音数据全部,或者语音数据中关键词之后的部分发送给服务器400,由服务器400对所接收到的语音数据进行识别。由于此时控制器250所接收到的语音数据中包括关键词,发送给服务器400所识别的语音数据中也更有可能包括用户的指令,因此能够减少服务器400的无效识别计算,也能够减少服务设备200和服务器400之间的无效通信。
在一些实施例中,为了让服务设备200能够具有如图6所示的一种具体场景中,对语音数据中指令的识别功能,或者,让服务设备200能够具有如图6或图8所示的一种具体场景中,对语音数据中关键词的识别功能,作为服务设备200的语音交互功能的供应商,还需要制作可用于识别指令或者识别关键词的机器学习模型,例如textcnn、transform等深度学习模型。并将这些模型存储在服务设备200中,由服务设备200在进行识别时使用。
在一些实施例中,图10为识别模型的供应商下发识别模型的示意图,其中,供应商所设置的服务器400得到识别模型(可以是指令识别模型,也可以是关键词识别模型)后,可以将识别模型发送给各个服务设备200。其中,如图10所示的过程可以是服务设备200在生产时进行,由服务器400将服务器发送给每个服务设备200;或者,还可以在服务设备200开始使用后,服务器400通过互联网将识别模型发送给服务设备200。
在一些实施例中,服务器400可以具体通过采集语音数据,并基于机器学习模型进行学习的方式,得到识别模型。例如,图11为服务器400得到识别模型的一种流程示意图,其中,在S31中,各服务设备(以服务设备1-服务设备N,共N个为例)采集语音数据1-N,并在S32中将采集到的语音数据1-N发送给服务器400。随后,在S33中,供应商的工作人员可以通过人工标注的方式,将每个语音数据以及语音数据中包括的指令或者关键词进行标注后,将语音数据本身,以及语音数据对应的标注信息作为数据送入机器学习模型中,由服务器进行学习,学习得到的识别模型在后续使用时,当输入一个待识别的语音数据后,识别模型将该语音数据与已经学习的语音数据进行比对,并输出每个标注信息的概率,最终最大概率对应的标注信息可以作为待识别的语音数据的识别结果。在S34中,服务器400可以将计算得到的识别模型发送各服务设备。
在一些实施例中,服务器400也可以不使用如图11所示实施例中由服务设备1-N实际采集的语音数据计算识别模型,而是可以直接由工作人员输入不同的语音数据,以及每个语音数据的标注信息,并在计算得到识别模型后发送给各服务设备。
在一些实施例中,如图11所示的采集语音数据并发送给服务器的服务设备1-N,与服务器计算得到识别模型后,发送给服务设备1-N中可以是两个独立的过程,也就是说,S32中服务器接收到N个服务设备采集的语音数据,S34中服务器可以向另外N个服务设备发送所训练得到的识别模型。这两个过程中N个服务设备可以相同或不同,或者也可以部分相同。
在一些实施例中,由于在得到识别模型时,所使用的样本数量有限,使得服务设备200所设置的识别模型不可能做到完全百分百准确的识别,因此供应商还可以通过服务器400随时收集各服务设备200在实际使用过程中所采集的语音数据,并根据所采集的语音数据对已经识别得到的识别模型进行更新,来进一步提高识别模型的识别准确性。
例如,图12为服务器对识别模型进行更新的一种流程示意图,可以理解的是,在执行如图12所示的实施例之前,每个服务设备中按照如图10所示的方式,设置了识别模型。则在如图12所示S31中,各服务设备(以服务设备1-服务设备N,共N个为例)采集语音数据1-N,并在S32中将采集到的语音数据1-N发送给服务器400。随后,在S33中,供应商的工作人员可以通过人工标注的方式,将每个语音数据以及语音数据中包括的指令或者关键词进行标注后,将语音数据本身,以及语音数据对应的标注信息作为数据送入机器学习模型中,由服务器根据接收到的新的语音数据,对已经计算得到的识别模型进行更新,并在S34中,服务器400可以将更新后的识别模型重新发送各服务设备200,使得每个服务设备200可以使用更新后的识别模型进行更新。其中,对于这N个服务设备中的任一个服务设备而言,由于新的学习模型采用了这个服务设备200所采集的语音数据,因此可以有效地提高后续对这个服务设备200对所采集的语音数据进行识别的准确性。
在一些实施例中,如图12所示的每个服务设备,可以在接收到语音数据后就发送给服务器,或者,在固定的时间段结束后将在这个时间段内采集到的语音数据发送给服务器,又或者,当采集到的一定数量的语音数据后统一发送给服务器,又或者,可以根据服务设备的用户的指示、或者根据服务器的工作人员的指示将已经接收到的语音发送给服务器。
在一些实施例中,如图12所示的N个服务设备可以在同一个约定的时刻同时将语音数据发送给服务器,由服务器根据接收到的N个语音数据对识别模型进行更新;或者,N个服务设备还可以分别将语音数据发送给服务器,服务器在接收到语音数据的数量大于N个之后,即可开始根据接收到的语音数据对识别模型进行更新。
为了准确筛选出响应唤醒信号的设备,本申请实施例提供一种设备响应的方法,能够在获取各待唤醒设备的唤醒信号的信号质量参数后,筛选出一个待唤醒设备作为响应唤醒信号的设备。其中,针对任一待唤醒设备,若待唤醒设备内置噪声源,则待唤醒设备的信号质量参数是根据待唤醒设备的信噪比补偿值对待唤醒设备的唤醒信号的信噪比进行补偿处理后得到的,若待唤醒设备未内置噪声源,则待唤醒设备的信号质量参数为唤醒信号的信噪比。
下面对本申请实施例提供的设备响应的方法进行描述。在一个实施例中,该方法可应用于智能设备如智能电视、智能音箱、智能手机等。
鉴于相关技术中采用信噪比筛选待唤醒设备时,容易出现多个智能设备均进行响应的情况,或者出现其他智能设备进行响应而目标设备并没有进行响应的情况。发明人对此进行研究分析,发现相关技术中在基于信噪比筛选智能设备时,对于内置噪声源的待唤醒设备,容易受内置噪声源噪声的影响,导致其信噪比不能反映采集到的唤醒信号的真实信号质量。故此,本申请实施例中提出一种筛选设备的方法及服务设备,本申请实施例中能够对内置噪声源的智能设备的信噪比进行补偿处理,使得内置噪声源的智能设备针对唤醒信号的信号质量能够尽可能不受其噪声源的影响,从而能够筛选出合适的智能设备和用户进行交互。本申请中的设备响应的方法可包括以下几部分内容:
一、信噪比的计算
待唤醒设备接收到唤醒信号后,在待唤醒设备中可以确定其对应的唤醒信号的频谱能量值与噪声能量值,将唤醒信号的频谱能量值与噪声能量值相除后取其对数值,并将对数值的预设倍数值确定为待唤醒设备的唤醒信号的信噪比。
示例性地,如图13所示,假设唤醒信号为″你好″的语音信号,则通过采集该语音信号,确定信号部分的时长,即t1到t2的时间,将信号部分的时长进行傅里叶变换,得到唤醒信号的频谱能量值Ps,将t1之前的预设时间段作为噪声时间,即t0到t1的时间为噪声时间,在一些实施例中,噪声时间可以是1秒,也可以是500毫秒,在此不限定具体的噪声时长,可根据实际应用进行调整。将噪声部分的时长进行傅里叶变换,得到噪声能量值Pn,通过以下公式(1)计算得到待唤醒设备的唤醒信号的信噪比SNR:
SNR=10lg(Ps/Pn) (1)
二、对信噪比的补偿处理
当环境中存在多个待唤醒设备时,本申请实施例中,用于筛选设备的参数为信号质量参数,对于未内置噪声源的待唤醒设备,其信号质量参数为唤醒信号的信噪比。对应内置噪声源的待唤醒设备内置噪声源,其信号质量参数是根据待唤醒设备的信噪比补偿值对唤醒信号的信噪比进行补偿处理后得到的。实施时,针对内置噪声源的待唤醒设备,可分别确定关闭噪声源和启动噪声源两种环境下的信噪比,然后根据这两种环境下的信噪比来确定信噪比补偿值,例如可测量预设信号的信噪比来确定待唤醒设备的信噪比补偿值:
一方面,在待唤醒设备启动之后,可以单独关闭噪声源而让其他模块正常运行,例如对于智能冰箱而言,可以在上电启动智能冰箱之后,关闭智能冰箱的电机,使智能冰箱处理关闭噪声源的状态。再例如,对应智能电视、电脑可以关闭散热模块。简言之,通过单独关闭能够产生较大噪声的配件,使得智能设备处于关闭噪声源的状态。在关闭噪声源的状态下,播放预设信号,获取待唤醒设备针对该预设信号的第一信噪比;示例性地,预设信号可以是待唤醒设备自带的喇叭进行声音播放的信号,比如″嘀嘀″声,也可以通过标准的正弦波进行播放信号,还可以录制一段音频信号,例如″你好,世界″再通过音频设备播放出来作为预设信号。
另一方面,在开启噪声源的状态下,同样播放预设信号,并获取待唤醒设备针对预设信号的第二信噪比;然后将第一信噪比与第二信噪比的差值,确定为待唤醒设备的信噪比补偿值。
在一些实施例中,为了能够准确的反映唤醒信号的信号质量,本申请实施例中对信噪比的补偿处理可实施为将该待唤醒设备的信噪比补偿值与待唤醒设备的唤醒信号的信噪比之和确定为待唤醒设备的信号质量参数。
在一些实施例中,可以按照不同的预设频段确定多个预设信号,通过以下方法分别测量每个预设信号的信噪比来确定待唤醒设备的信噪比补偿值:
在关闭噪声源的状态下,获取待唤醒设备的多个预设信号各自的信噪比;在开启噪声源的状态下,获取待唤醒设备的多个预设信号的各自的信噪比;确定每个预设信号在关闭噪声源的状态下和在开启所述噪声源的状态下分别得到的信噪比的差值;确定各预设信号的信噪比的差值的加权平均值作为待唤醒设备的信噪比补偿值。
具体地,在关闭噪声源的状态下,获取待唤醒设备的第一预设信号的第三信噪比、第二预设信号的第四信噪比、以及第三预设信号的第五信噪比;其中第一预设信号、第二预设信号、以及第三预设信号为根据预设频段划分规则划分后的信号;
在开启噪声源的状态下,获取待唤醒设备的第一预设信号的第六信噪比、第二预设信号的第七信噪比、以及第三预设信号的第八信噪比;
将第三信噪比与第六信噪比的差值,确定为待唤醒设备的第一信噪比补偿值;以及将第四信噪比与第七信噪比的差值,确定为待唤醒设备的第二信噪比补偿值;以及将第五信噪比与第八信噪比的差值,确定为待唤醒设备的第三信噪比补偿值;
将第一信噪比补偿值、第二信噪比补偿值、第三信噪比补偿值的加权平均值,确定为待唤醒设备的信噪比补偿值。
示例性的,多个预设信号可以是100Hz、1K Hz、3K Hz。
在一些实施例中,各待唤醒设备的信号质量参数可以由待唤醒设备根据自己采集的唤醒信号进行计算后,上报给服务设备来决策出与用户交互的待唤醒设备。
当然,在另一些实施例中,各待唤醒设备也可以发送各自的唤醒信号的频谱能量值、以及各自的噪声能量值至服务设备,由服务设备基于各待唤醒设备的各自的唤醒信号的频谱能量值、以及各自的噪声能量值,确定各待唤醒设备的信号质量参数。服务设备确定信噪比和进行补偿处理的方式与前文所述的相同,在此不再赘述。
三、筛选设备
在获取各待唤醒设备的唤醒信号的信号质量参数后,基于信号质量参数,筛选出一个待唤醒设备作为响应唤醒信号的设备。本申请实施例中,可采用分布式管理方式来决策出与用户交互的待唤醒设备,也可以采用集中式管理方式决策出有用户交互的待唤醒设备。如图14(a)和图14(b)所示,为集中式网络架构示意图,如图14(c)所示为分布式网络架构。
在图14(a)中,智能冰箱和智能空调作为待唤醒设备,服务器作为服务设备用于决策出与用户交互的待唤醒设备。
与图14(a)不同的是,图14(b)中的服务设备为所有待唤醒设备的之一。即如图14(b)所示,智能冰箱、智能空调和智能电视均为待唤醒设备,均可以与用户进行语音交互,其中,智能电视作为所有待唤醒设备中的″大脑″集中管理各个待唤醒设备,用于决策哪个待唤醒设备与用户进行语音交互。
在一些实施例中,针对集中式网络架构,若服务设备与各待唤醒设备中的任一设备均不同时(如图14(a)所示场景),在筛选出一个待唤醒设备之后,服务设备发送指令至筛选出的待唤醒设备,以指示筛选出的待唤醒设备响应唤醒信号。
若服务设备为待唤醒设备中的任一设备时(如图14(b)所示场景),服务设备在筛选出一个待唤醒设备之后,若筛选的设备是服务设备自身,则由服务设备响应用户的唤醒信号,与用户交互。若筛选出的设备为其它待唤醒设备,则服务设备发送指令至筛选出的待唤醒设备,以指示筛选出的待唤醒设备响应唤醒信号。示例性的,如图14(b)所示,假设待唤醒设备包括:智能电视、智能冰箱、智能空调,服务设备为待唤醒设备中的智能电视,则当筛选出的待唤醒设备为智能电视时,智能电视响应唤醒信号;当筛选出的待唤醒设备为智能冰箱时,智能电视处于休眠状态。智能冰箱会根据筛选结果响应唤醒信号。
在分布式网络架构中,各个待唤醒设备可以将自己的信号质量参数通知给集群内的其他待唤醒设备。也即任一待唤醒设备,不仅确定自己的信号质量参数,还会接收到集群中其他待唤醒设备上报的信号质量参数,然后根据自己和其他待唤醒设备的信号质量参数筛选出一个待唤醒设备。其中,当筛选出的待唤醒设备为自身时,则响应唤醒信号与用户交互,若筛选出的待唤醒设备不为自身时,则继续保持休眠状态监听待唤醒信号。
示例性地,如图14(c)所示,假设待唤醒设备包括:智能电视、智能冰箱、智能空调,这三个设备均为智能设备,各自进行决策以筛选出响应唤醒信号的设备。以智能空调为例当筛选出的待唤醒设备为智能空调时,智能空调响应唤醒信号;当筛选出的待唤醒设备为智能冰箱时,智能空调继续保持休眠状态。
在一些实施例中,可筛选信号质量参数最大的待唤醒设备作为响应唤醒信号的设备。当然,信号质量参数也可以作为所有供参考的参数之一,以结合其他参数来决策出一个智能设备。
在一些实施例中,如图15所示,包括A、B、C三个房间,其中,A房间包括第一待唤醒设备,B房间包括第二待唤醒设备,C房间包括第三唤醒设备,每个待唤醒设备的位置如图15所示,基于信号质量参数并结合用户与每个待唤醒设备之间的距离,筛选出一个待唤醒设备作为响应唤醒信号的设备。示例性地,若确定三个待唤醒设备的信号质量参数后,得到信号质量参数从高到低的排序为:第二待唤醒设备的信号质量参数、第三待唤醒设备的信号质量参数、第一待唤醒设备的信号质量参数,但是第三待唤醒设备与用户处于同一房间,第一待唤醒设备与第二待唤醒设备均与用户存在于不同房间,因此将第三待唤醒设备作为响应唤醒信号的设备。
为便于理解本申请实施例提供的筛选设备的方法,下面结合图16,对该方法的整体流程进行说明。如图16中所示,假设待唤醒设备包括智能冰箱1和智能冰箱2,当用户发出唤醒信号之后,各冰箱执行的操作可包括以下步骤,需要说明的是,以下步骤序号仅用于区分不同的步骤,并不限定步骤的先后顺序:
S1001,智能冰箱1获取的唤醒信号信噪比,并根据存储的信噪比补偿值对信噪比进行补偿处理得到信号质量参数1;
S1002,智能冰箱1将信号质量参数1发送给智能冰箱2;
S1003,智能冰箱2获取的唤醒信号信噪比,并根据存储的信噪比补偿值对信噪比进行补偿处理得到信号质量参数2;
S1004,将智能冰箱2的唤醒信号的信号质量参数发送至智能冰箱1;
S1005,由于信号质量参数1大于信号质量参数2,智能冰箱1和智能冰箱2均筛选智能冰箱1作为响应唤醒信号的设备;
S1006,基于筛选结果,智能冰箱1进入唤醒状态响应用户的唤醒信号;
S1007,智能冰箱2继续保持休眠状态。
本申请实施例中,服务设备获取各待唤醒设备的唤醒信号的信号质量参数后,筛选出一个待唤醒设备作为响应唤醒信号的设备。其中,针对任一待唤醒设备,若待唤醒设备内置噪声源,则待唤醒设备的信号质量参数是根据待唤醒设备的信噪比补偿值对待唤醒设备的唤醒信号的信噪比进行补偿处理后得到的,若待唤醒设备未内置噪声源,则待唤醒设备的信号质量参数为唤醒信号的信噪比。从而可以准确筛选出响应唤醒信号的设备,便于用户与设备进行语音交互。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机程序指令,当所述指令在计算机上运行时,使得所述计算机执行上述设备响应的方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种服务设备,其特征在于,包括:存储器和控制器;
所述存储器,用于存储计算机程序;
所述控制器与所述存储器连接,被配置为基于所述计算机程序执行:
获取各待唤醒设备的唤醒信号的信号质量参数,其中,内置噪声源的待唤醒设备的信号质量参数是根据所述待唤醒设备的所述噪声源的噪声情况确定的;
基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备。
2.根据权利要求1所述的服务设备,其特征在于,针对内置噪声源的所述待唤醒设备,所述待唤醒设备的所述信号质量参数是根据所述待唤醒设备的信噪比补偿值对所述待唤醒设备的唤醒信号的信噪比进行补偿处理后得到的;
针对未内置噪声源的待唤醒设备,所述信号质量参数为所述待唤醒设备的唤醒信号的信噪比。
3.根据权利要求2所述的服务设备,其特征在于,针对任一内置噪声源的待唤醒设备,所述控制器还被配置为:
在关闭所述噪声源的状态下,获取所述待唤醒设备的预设信号的第一信噪比;
在开启所述噪声源的状态下,获取所述待唤醒设备的所述预设信号的第二信噪比;
将所述第一信噪比与所述第二信噪比的差值,确定为所述待唤醒设备的所述信噪比补偿值。
4.根据权利要求2所述的服务设备,其特征在于,针对任一内置噪声源的待唤醒设备,所述控制器还被配置为:
在关闭所述噪声源的状态下,获取所述待唤醒设备的多个预设信号各自的信噪比,其中所述多个预设信号属于不同的预设频段;
在开启所述噪声源的状态下,获取所述待唤醒设备的所述多个预设信号的各自的信噪比;
确定每个所述预设信号在关闭所述噪声源的状态下和在开启所述噪声源的状态下分别得到的信噪比的差值;
确定各所述预设信号的信噪比的差值的加权平均值作为所述待唤醒设备的所述信噪比补偿值。
5.根据权利要求2所述的服务设备,其特征在于,由所述控制器执行所述补偿处理时,所述控制器还被配置为:
针对任一内置噪声源的待唤醒设备,将所述待唤醒设备的信噪比补偿值与所述待唤醒设备的唤醒信号的信噪比之和确定为所述待唤醒设备的信号质量参数。
6.根据权利要求1所述的服务设备,其特征在于,若所述服务设备与各所述待唤醒设备中的任一设备均不同,则执行基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备之后,所述控制器还被配置为:
发送响应所述唤醒信号的指令至筛选出的待唤醒设备,以指示筛选出的待唤醒设备响应所述唤醒信号。
7.根据权利要求1所述的服务设备,其特征在于,若所述服务设备为所述待唤醒设备中的设备,则执行基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备之后,所述控制器还被配置为:
若筛选出的待唤醒设备为所述服务设备,则响应所述唤醒信号;
若筛选出的待唤醒设备为所述除所述服务设备之外的其他待唤醒设备,则发送响应所述唤醒信号的指令至筛选出的待唤醒设备,以指示筛选出的待唤醒设备响应所述唤醒信号。
8.一种筛选设备的方法,其特征在于,包括:
获取各待唤醒设备的唤醒信号的信号质量参数,其中,内置噪声源的待唤醒设备的信号质量参数是根据所述待唤醒设备的所述噪声源的噪声情况确定的;
基于所述信号质量参数,筛选出一个待唤醒设备作为响应所述唤醒信号的设备。
9.根据权利要求8所述的方法,其特征在于,针对任一内置噪声源的待唤醒设备,所述方法还包括:
在关闭所述噪声源的状态下,获取所述待唤醒设备的预设信号的第一信噪比;
在开启所述噪声源的状态下,获取所述待唤醒设备的所述预设信号的第二信噪比;
将所述第一信噪比与所述第二信噪比的差值,确定为所述待唤醒设备的信噪比补偿值。
10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序指令,当所述指令在计算机上运行时,使得所述计算机执行如权利要求8至9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011371765.8A CN112562666B (zh) | 2020-11-30 | 2020-11-30 | 一种筛选设备的方法及服务设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011371765.8A CN112562666B (zh) | 2020-11-30 | 2020-11-30 | 一种筛选设备的方法及服务设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112562666A true CN112562666A (zh) | 2021-03-26 |
CN112562666B CN112562666B (zh) | 2022-11-04 |
Family
ID=75045265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011371765.8A Active CN112562666B (zh) | 2020-11-30 | 2020-11-30 | 一种筛选设备的方法及服务设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112562666B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113744735A (zh) * | 2021-09-01 | 2021-12-03 | 青岛海尔科技有限公司 | 一种分布式唤醒方法及系统 |
CN116347495A (zh) * | 2021-12-24 | 2023-06-27 | 中国电信国际有限公司 | 测算天线方位角方法、装置、设备及存储介质 |
CN117176507A (zh) * | 2023-11-02 | 2023-12-05 | 上海鉴智其迹科技有限公司 | 数据分析方法、装置、电子设备及存储介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130238262A1 (en) * | 2012-03-09 | 2013-09-12 | Advantest Corporation | Measurement apparatus, measurement method, and program |
CN105448294A (zh) * | 2015-12-09 | 2016-03-30 | 江苏天安智联科技股份有限公司 | 一种应用于车载设备的智能语音识别系统 |
CN108023650A (zh) * | 2016-10-28 | 2018-05-11 | 三星电子株式会社 | 用于信噪比估计的方法和设备 |
CN109461456A (zh) * | 2018-12-03 | 2019-03-12 | 北京云知声信息技术有限公司 | 一种提升语音唤醒成功率的方法 |
WO2019078576A1 (ko) * | 2017-10-17 | 2019-04-25 | 삼성전자주식회사 | 음성 신호를 제어하기 위한 전자 장치 및 방법 |
CN109949810A (zh) * | 2019-03-28 | 2019-06-28 | 华为技术有限公司 | 一种语音唤醒方法、装置、设备及介质 |
CN110223684A (zh) * | 2019-05-16 | 2019-09-10 | 华为技术有限公司 | 一种语音唤醒方法及设备 |
US20200075044A1 (en) * | 2018-08-31 | 2020-03-05 | CloudMinds Technology, Inc. | System and method for performing multi-model automatic speech recognition in challenging acoustic environments |
CN111009255A (zh) * | 2019-11-29 | 2020-04-14 | 深圳市无限动力发展有限公司 | 消除内部噪音干扰的方法、装置、计算机设备及存储介质 |
CN111179931A (zh) * | 2020-01-03 | 2020-05-19 | 青岛海尔科技有限公司 | 用于语音交互的方法、装置及家用电器 |
CN111223497A (zh) * | 2020-01-06 | 2020-06-02 | 苏州思必驰信息科技有限公司 | 一种终端的就近唤醒方法、装置、计算设备及存储介质 |
CN111417053A (zh) * | 2020-03-10 | 2020-07-14 | 北京小米松果电子有限公司 | 拾音音量控制方法、装置以及存储介质 |
WO2020196955A1 (ko) * | 2019-03-27 | 2020-10-01 | 엘지전자 주식회사 | 인공 지능 기기 및 인공 지능 기기의 동작 방법 |
CN111916068A (zh) * | 2019-05-07 | 2020-11-10 | 北京地平线机器人技术研发有限公司 | 音频检测方法和装置 |
-
2020
- 2020-11-30 CN CN202011371765.8A patent/CN112562666B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130238262A1 (en) * | 2012-03-09 | 2013-09-12 | Advantest Corporation | Measurement apparatus, measurement method, and program |
CN105448294A (zh) * | 2015-12-09 | 2016-03-30 | 江苏天安智联科技股份有限公司 | 一种应用于车载设备的智能语音识别系统 |
CN108023650A (zh) * | 2016-10-28 | 2018-05-11 | 三星电子株式会社 | 用于信噪比估计的方法和设备 |
WO2019078576A1 (ko) * | 2017-10-17 | 2019-04-25 | 삼성전자주식회사 | 음성 신호를 제어하기 위한 전자 장치 및 방법 |
US20200075044A1 (en) * | 2018-08-31 | 2020-03-05 | CloudMinds Technology, Inc. | System and method for performing multi-model automatic speech recognition in challenging acoustic environments |
CN109461456A (zh) * | 2018-12-03 | 2019-03-12 | 北京云知声信息技术有限公司 | 一种提升语音唤醒成功率的方法 |
WO2020196955A1 (ko) * | 2019-03-27 | 2020-10-01 | 엘지전자 주식회사 | 인공 지능 기기 및 인공 지능 기기의 동작 방법 |
CN109949810A (zh) * | 2019-03-28 | 2019-06-28 | 华为技术有限公司 | 一种语音唤醒方法、装置、设备及介质 |
WO2020192721A1 (zh) * | 2019-03-28 | 2020-10-01 | 华为技术有限公司 | 一种语音唤醒方法、装置、设备及介质 |
CN111916068A (zh) * | 2019-05-07 | 2020-11-10 | 北京地平线机器人技术研发有限公司 | 音频检测方法和装置 |
CN110223684A (zh) * | 2019-05-16 | 2019-09-10 | 华为技术有限公司 | 一种语音唤醒方法及设备 |
CN111009255A (zh) * | 2019-11-29 | 2020-04-14 | 深圳市无限动力发展有限公司 | 消除内部噪音干扰的方法、装置、计算机设备及存储介质 |
CN111179931A (zh) * | 2020-01-03 | 2020-05-19 | 青岛海尔科技有限公司 | 用于语音交互的方法、装置及家用电器 |
CN111223497A (zh) * | 2020-01-06 | 2020-06-02 | 苏州思必驰信息科技有限公司 | 一种终端的就近唤醒方法、装置、计算设备及存储介质 |
CN111417053A (zh) * | 2020-03-10 | 2020-07-14 | 北京小米松果电子有限公司 | 拾音音量控制方法、装置以及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113744735A (zh) * | 2021-09-01 | 2021-12-03 | 青岛海尔科技有限公司 | 一种分布式唤醒方法及系统 |
CN116347495A (zh) * | 2021-12-24 | 2023-06-27 | 中国电信国际有限公司 | 测算天线方位角方法、装置、设备及存储介质 |
CN117176507A (zh) * | 2023-11-02 | 2023-12-05 | 上海鉴智其迹科技有限公司 | 数据分析方法、装置、电子设备及存储介质 |
CN117176507B (zh) * | 2023-11-02 | 2024-02-23 | 上海鉴智其迹科技有限公司 | 数据分析方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112562666B (zh) | 2022-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111935518B (zh) | 一种视频投屏方法及显示设备 | |
CN112562666B (zh) | 一种筛选设备的方法及服务设备 | |
CN112511882B (zh) | 一种显示设备及语音唤起方法 | |
CN112163086B (zh) | 多意图的识别方法、显示设备 | |
CN112153447B (zh) | 一种显示设备及音画同步控制方法 | |
CN112019782B (zh) | 增强型音频回传通道的控制方法及显示设备 | |
CN111836083B (zh) | 显示设备及屏幕发声方法 | |
CN112565862A (zh) | 一种显示设备及其设备参数的记忆方法、恢复方法 | |
CN112153440A (zh) | 一种显示设备及显示系统 | |
CN112289271B (zh) | 显示设备及调光方式切换方法 | |
CN112399217B (zh) | 显示设备及与功放设备建立通信连接的方法 | |
CN112214190A (zh) | 显示设备资源播放方法及显示设备 | |
CN112040535A (zh) | 一种Wifi处理方法及显示设备 | |
CN113438553B (zh) | 一种显示设备被唤醒方法及显示设备 | |
CN111901649B (zh) | 视频播放方法和显示设备 | |
CN114302197A (zh) | 一种语音分离控制方法及显示设备 | |
CN115185392A (zh) | 显示设备、图像处理方法及装置 | |
CN111931692A (zh) | 显示设备及图像识别方法 | |
CN112118476A (zh) | 一种快速显示节目预约图标的方法及显示设备 | |
CN113542878A (zh) | 一种基于人脸识别与手势检测的唤醒方法及显示设备 | |
CN111918056A (zh) | 一种摄像头状态检测方法及显示设备 | |
CN112259096B (zh) | 语音数据处理方法及装置 | |
CN112329475B (zh) | 语句处理方法及装置 | |
CN111970554B (zh) | 一种图片显示方法和显示设备 | |
CN113973221B (zh) | 一种视频信号显示方法及显示设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |