WO2021027892A1

WO2021027892A1 - 接收装置

Info

Publication number: WO2021027892A1
Application number: PCT/CN2020/108978
Authority: WO
Inventors: 山下丈次
Original assignee: 海信视像科技股份有限公司; 东芝视频解决方案株式会社
Priority date: 2019-08-13
Filing date: 2020-08-13
Publication date: 2021-02-18
Also published as: CN112930686A; JP7206167B2; CN112930686B; JP2021032906A

Abstract

本申请涉及接收装置。本申请的目的在于，减少在不需要声音识别服务的场合下开始声音识别服务这样的状况。实施方式的接收装置具备声音输入部、选择部和声音识别部。声音输入部输入用户的声音。选择部基于规定的条件来选择声音识别的有效状态和无效状态中的任一个。在选择了有效状态的情况下，声音识别部执行针对输入到声音输入部中的声音的声音识别处理，在选择了无效状态的情况下，声音识别部不执行声音识别处理。

Description

接收装置

本申请要求在2019年8月13日提交日本专利局、申请号为2019-148384、发明名称为“接收装置”的日本专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请的实施方式涉及接收装置。

背景技术

近年来，针对能够供用户利用声音来进行设备的操作的声音识别服务的需求日益高涨。例如，已知有具备声音识别功能的电视装置等设备。在这样的电视装置等中，例如，在检测出用户发出的唤醒词(Wake Word)的情况下启动声音识别服务，例如，进行某种回应或者降低播放中的内容的音量以便于容易识别用户的声音。

然而，在这样的电视装置等中，存在因唤醒词的误检测等而在用户不想要的时机启动了声音识别服务的情况。这种情况下，可能会由于妨碍用户对内容的收看而让用户感到烦恼。

在先技术文献

专利文献

专利文献1：日本特开2013-235032号公报

发明内容

应减少在不需要声音识别服务的情况下开始声音识别服务这样的状况。

实施方式的接收装置具备声音输入部、选择部和声音识别部。声音输入部输入用户的声音。选择部基于规定的条件来选择声音识别的有效状态和无效状态中的任一个。在选择了有效状态的情况下，声音识别部执行针对输入到声音输入部的声音的声音识别处理，在选择了无效状态的情况下，声音识别部不执行声音识别处理。

附图说明

图1是表示第一实施方式的电视装置的硬件结构的一例的图；

图2是表示第一实施方式的电视装置的功能结构的一例的图；

图3是表示第一实施方式的声音识别的有效状态与无效状态的选择处理的流程的一例的流程图；

图4是表示第二实施方式的电视装置的功能结构的一例的图；

图5是表示第三实施方式的电视装置的功能结构的一例的图；

图6是表示第四实施方式的电视装置的功能结构的一例的图；

图7是表示第五实施方式的电视装置的功能结构的一例的图。

附图标记说明

10…电视装置，11、1011、2011…获取部，12…唤醒词检测部，13…声音识别部，14…显示控制部，15、1015、2015、3015…选择部，16…设备控制部，17…应用执行部，18…学习部，19…节目表生成部，110…显示面板，111…操作部，112…受光部，115…内存，116…存储器，117…麦克风，119…遥控器，300…网络。

具体实施方式

(第一实施方式)

图1是表示本实施方式的电视装置10的硬件结构的一例的图。如图1所示，电视装置10具备天线101、输入端子102a、调谐器103、解调器104、解复用器105、输入端子102b及输入端子102c、A/D(模拟/数字)转换器106、选择器107、信号处理部108、扬声器109、显示面板110、操作部111、受光部112、IP通信部113、CPU(Central Processing Unit)114、内存(memory) 115、存储器(storage)116、麦克风(microphone)117和音频I/F(接口)118。电视装置10是本实施方式中的接收装置的一例。

天线101接收数字广播的广播信号，并将接收到的广播信号经由输入端子102a向调谐器103供给。调谐器103从天线101供给来的广播信号中选择所期望的频道的广播信号，并将选择出的广播信号向解调器104供给。广播信号也称作广播波。

解调器104对从调谐器103供给来的广播信号进行解调，并将解调后的广播信号向解复用器105供给。解复用器105对从解调器104供给来的广播信号进行分离来生成图像信号及声音信号，并将生成的图像信号及声音信号向选择器107供给。

选择器107构成为，从自解复用器105、A/D转换器106及输入端子102c供给的多个信号中选择一个，并将选择出的一个信号向信号处理部108供给。

信号处理部108构成为，对从选择器107供给的图像信号实施规定的信号处理，并将处理后的图像信号向显示面板110供给。另外，信号处理部108构成为，对从选择器107供给的声音信号实施规定的信号处理，并将处理后的声音信号向扬声器109供给。

扬声器109构成为，基于从信号处理部108供给的声音信号来输出语音或者各种声音。另外，扬声器109基于由CPU114进行的控制来对输出的语音或各种声音的音量进行变更。

显示面板110构成为，基于从信号处理部108供给的图像信号或由CPU114进行的控制来显示静止图像、动态图像等图像。显示面板110是显示部的一例。

输入端子102b接收从外部输入的模拟信号(图像信号及声音信号)。另外，输入端子102c构成为接收从外部输入的数字信号(图像信号及声音信号)。例如，输入端子102c设计成，能够从搭载有驱动BD(Blu-ray Disc)(注册商标)等录像播放用的存储介质来进行录像及播放的驱动装置的录像机(BD录像机)等向该输入端子102c输入数字信号。A/D转换器106将通过对从输入端子102b供给的模拟信号实施A/D转换而生成的数字信号向选择器107供给。

操作部111接收用户的操作输入。另外，受光部112接收来自遥控器119的红外线。IP通信部113是用于经由网络300来进行IP(互联网协议)通信的通信接口。

CPU114是控制电视装置10整体的控制部。内存115是保存有供CPU114执行的各种计算机程序的ROM(Read Only Memory)、向CPU114提供工作分区的RAM(Random Access Memory)等。另外，存储器116是HDD(Hard Disk Drive)、SSD(Solid State Drive)等。存储器116例如将由选择器107选择出的信号作为录像数据来存储。

麦克风117获取用户讲话的声音并将其向音频I/F118发送。麦克风117是声音输入部的一例。麦克风117在设为“打开状态”的情况下能够进行声音的输入，在设为“关闭状态”的情况下不能进行声音的输入。在本实施方式中，麦克风117在电视装置10启动的情况下自动成为打开状态。例如，麦克风117在通过由CPU114进行的控制而选择将声音识别设为有效状态的情况下，保持打开状态。另外，例如，麦克风117在通过由CPU114进行的控制而选择将声音识别设为无效状态的情况下，切换为关闭状态。关于声音识别的有效状态和无效状态的选择的详细情况，将会作为选择部15的处理而在后进行叙述。

音频I/F118对麦克风117获取到的声音进行模拟/数字转换并将其作为声音信号向CPU114发送。

接着，对本实施方式的电视装置10的功能进行说明。

图2是表示本实施方式的电视装置10的功能结构的一例的图。如图2所示，电视装置10具备获取部11、唤醒词检测部12、声音识别部13、显示控制部14、选择部15和设备控制部16。

由本实施方式的电视装置10执行的程序成为包含上述的各部(获取部、唤醒词检测部、声音识别部、显示控制部、选择部、设备控制部)的模块结构，通过作为实际的硬件的CPU114从ROM等中读取程序并执行该程序，由此将上述各部加载到RAM等主存储装置上，在主存储装置上生成获取部、唤醒词检测部、声音识别部、显示控制部、选择部、设备控制部。

由本实施方式的电视装置10执行的程序例如通过预先装入ROM等来提供。另外，由本实施方式的电视装置10执行的程序也可以通过如下方式来提供：以可安装或可执行的文件的形式存储在CD-ROM、闪存(FD)、CD-R、DVD(Digital Versatile Disk)等由计算机可读取的存储介质中。

还可以将由本实施方式的电视装置10执行的程序保存在连接到互联网等网络的计算机上，通过经由网络下载来提供。另外，还可以将由本实施方式的电视装置10执行的程序经由互联网等网络来提供或分配。另外，在本实施方式中，记载的是通过一台CPU来实现各功能部，但也可以通过多个CPU或各种电路来实现各功能部。

获取部11经由音频I/F118来获取输入到麦克风117中的用户的声音。获取部11将获取到的声音向唤醒词检测部12和声音识别部13发送。需要说明的是，获取部11所获取的“声音”是由音频I/F118转换后的数字声音信号，但以下简单记载为“声音”。

另外，获取部11从与CPU114连接的操作部111、受光部112、IP通信部113、选择器107、信号处理部108等获取各种信号。例如，获取部11基于受光部112接收的来自遥控器119的红外线或输入到操作部111中的操作，接收用户的操作。获取部11将接收到的用户的操作的内容向显示控制部14和设备控制部16发送。

唤醒词检测部12从由获取部11获取到的声音中检测唤醒词(Wake Word)。唤醒词是成为声音识别服务启动的触发的规定的声音指令。唤醒词是被预先设定的词语。另外，判断声音信号是否包含唤醒词的方法可以采用已知的声音识别技术。

在本实施方式中，虽然唤醒词检测部12的设定自身不会根据由后述的选择部15对声音识别的有效状态和无效状态中的任一个进行的选择而发生变化，但在选择了无效状态的情况下，麦克风117会变为关闭状态，无法进行声音的输入，因此无法获取声音。因此，唤醒词检测部12在选择了声音识别的无效状态的情况下不执行唤醒词的检测处理。另外，在选择了声音识别的有效状态的情况下，麦克风117为打开状态，能够进行声音的输入。因此，唤醒词检测部12在选择了声音识别的有效状态的情况下，执行针对输入到麦克风117中的声音进行的唤醒词的检测处理。

唤醒词检测部12在从由获取部11获取的声音中检测出唤醒词的情况下，通知显示控制部14及设备控制部16检测出唤醒词。另外，唤醒词检测部12在唤醒词之后接着输入了用户的声音的情况下，将接在唤醒词之后的声音向声音识别部13发送。

声音识别部13执行针对输入到麦克风117中的声音进行的声音识别处理。在本实施方式中，虽然声音识别部13的设定自身不会根据由后述的选择部15对声音识别的有效状态和无效状态中的任一个进行的选择而发生变化，但在选择了无效状态的情况下，麦克风117无法进行声音的输入，因此无法获取声音。因此，声音识别部13在选择了声音识别的无效状态的情况下，不执行声音识别处理。另外，在选择了声音识别的有效状态的情况下，麦克风117能够进行声音的输入。因此，声音识别部13在选择了声音识别的有效状态的情况下，执行针对输入到麦克风117中的声音进行的声音识别处理。

更详细而言，声音识别部13在由唤醒词检测部12检测出唤醒词的情况下，通过对接在唤醒词之后的声音进行声音识别处理来确定用户的声音的内容。声音识别处理可以适用已知的技术。例如，声音识别部13使用已知的技术来将用户的声音内容转换为文本数据。声音识别部13将声音识别结果向显示控制部14和设备控制部16发送。在本实施方式中，通过显示控制部14或设备控制部16等各功能部基于声音识别部13对用户的声音进行声音识别而得到的结果来执行处理，由此实现声音识别服务。

显示控制部14控制显示面板110上的各种显示。例如，显示控制部14在获取部11获取了输入到遥控器119等中的用户的操作的情况下，将与该操作相应的操作画面显示于显示面板110。更具体而言，在用户进行了将用于开始录像预约的设定的按钮按下等操作的情况下，显示控制部14将能够接收该用户的操作的操作画面显示于显示面板110。操作画面的显示形态例如可以是重叠在播放中的内容的画面上来显示的OSD(On Screen Display)，也可以是在显示面板110的整体上显示的全画面显示。需要说明的是，在本实施方式中，“内容”包括电视节目、录制在DVD等中的动态图像或者利用应用来播放的动态图像等。

另外，显示控制部14将各种通知画面显示于显示面板110。例如，显示控制部14将包含向用户提供信息、向用户发出警告或者唤起用户注意等消息在内的通知画面重叠在播放中的内容的画面上而作为OSD来显示。

另外，显示控制部14在由唤醒词检测部12检测出唤醒词的情况下，将针对声音进行应答的消息或图标等显示于显示面板110。针对声音进行应答的消息或图标等例如可以是催促用户讲话的内容，也可以是将用户的声音的识别结果作为文字数据来显示这样的形式。通过该消息或图标等的显示，用户能够容易地识别出唤醒词被识别以及讲话的声音成为对电视装置10的指示这些情况。

另外，例如，显示控制部14在将操作画面或通知画面显示于显示面板110的情况下，将表示正在显示操作画面的操作画面显示标志或正在显示通知画面的通知画面显示标志设定在内存115中。另外，显示控制部14在结束了操作画面或通知画面的显示的情况下，从内存115中删除操作画面显示标志或通知画面显示标志。需要说明的是，表示在显示面板110上显示有操作画面或通知画面的方法并不限定于此。例如，显示控制部14也可以向选择部15通知表示在显示面板110上显示有操作画面或通知画面的消息或者表示结束了操作画面或通知画面的显示的消息。

另外，显示控制部14基于由声音识别部13识别出的用户的声音中包含的命令，来控制显示面板110的显示。例如，显示控制部14基于用户的声音中包含的命令来控制调谐器103，选取正在播出用户用声音指定的节目的频道，并将该节目显示于显示面板110。另外，显示控制部14也可以基于用户的声音中包含的命令，来播放保存在存储器116或外部的存储装置中的节目的录像数据并将其显示于显示面板110。

选择部15基于规定的条件来选择声音识别的有效状态和无效状态中的任一个。

本实施方式中的规定的条件是“操作画面或通知画面中的至少任一个正显示于显示面板110”。本实施方式的选择部15在电视装置10的显示面板110的状态满足规定的条件的情况下，选择无效状态。另外，选择部15在电视装置10的显示面板110的状态不满足规定的条件的情况下，选择有效状态。

例如，选择部15在内存115中设立有操作画面显示标志的情况下，判断为正在显示操作画面，在内存115中设立有通知画面显示标志的情况下，判断为正在显示通知画面。选择部15在判断为操作画面或通知画面中的至少任一个正显示于显示面板110的情况下，判定为电视装置10满足规定的条件。这种情况下，选择部15选择无效状态。

需要说明的是，判断操作画面或通知画面有无显示的方法并不限定于此，例如，选择部15也可以基于从显示控制部14获取到的、操作画面或通知画面有无显示，来判断操作画面和通知画面中的至少任一个是否正显示于显示面板110。

另外，选择部15在判断为操作画面及通知画面中的任一个都没有显示于显示面板110的情况下，判断为电视装置10不满足规定的条件。这种情况下，选择部15选择有效状态。

选择部15将声音识别的有效状态和无效状态的选择结果向设备控制部16发送。

设备控制部16对电视装置10所包括的各种设备进行控制。例如，设备控制部16在由选择部15选择了声音识别的无效状态的情况下，将麦克风117设为关闭状态。另外，例如，设备控制部16在由选择部15选择了声音识别的有效状态的情况下，将麦克风117设为打开状态。

另外，设备控制部16在由唤醒词检测部12检测出唤醒词的情况下，控制扬声器109来降低音量。这是为了减少用户在唤醒词之后讲话的声音的输入受到内容的声音干扰的情况。

另外，设备控制部16基于由声音识别部13识别出的用户的声音中包含的命令来控制电视装置10所包括的各种设备。例如，设备控制部16在用户的声音中包含“提高音量”这样的命令的情况下，控制扬声器109来提高音量。需要说明的是，设备控制部16也可以基于由声音识别部13识别出的用户的声音中包含的命令来从互联网检索信息。

接着，对由如上那样构成的电视装置10执行的声音识别的有效状态和无效状态的选择处理的流程进行说明。

图3是表示本实施方式中的声音识别的有效状态和无效状态的选择处理的流程的一例的流程图。设该流程图的处理在电视装置10运行期间被持续执行。另外，设在该流程图的开始时刻下声音识别为有效状态且麦克风117为打开状态。

首先，选择部15例如基于是否在内存115中设立有操作画面显示标志或通知画面显示标志来判定电视装置10是否满足规定的条件(S1)。

选择部15在内存115中设立有操作画面显示标志或通知画面显示标志的情况下，判定为电视装置10满足规定的条件(在S1中为“是”)。这种情况下，选择部15选择声音识别的无效状态(S2)。选择部15将选择了声音识别的无效状态这一情况向设备控制部16发送。

接着，设备控制部16将麦克风117设为“关闭状态”(S3)。由此，麦克风117成为不接收声音的输入的状态。在由设备控制部16将麦克风117设为“关闭状态”之后，返回到S1的处理，反复进行处理。

另外，选择部15在内存115中没有设立有操作画面显示标志及通知画面显示标志中的任一个的情况下，判定为电视装置10不满足规定的条件(在S1中为“否”)。这种情况下，选择部15选择声音识别的有效状态(S4)。例如，在声音识别成为无效状态之后结束了操作画面或通知画面的显示并删除了标志的情况下，选择部15选择有效状态，由此声音识别从无效状态切换为有效状态。选择部15将选择了声音识别的有效状态这一情况向设备控制部16发送。

接着，设备控制部16将麦克风117设为打开状态(S5)。由此，麦克风117成为能够接收声音的输入的状态。需要说明的是，在麦克风117已经是打开状态的情况下，设备控制部16不执行任何处理。

接着，唤醒词检测部12经由音频I/F118来获取输入到麦克风117中的用户的声音(S6)。获取部11将获取到的声音向唤醒词检测部12和声音识别部13发送。

然后，唤醒词检测部12判断由获取部11获取到的声音中是否包含唤醒词(S7)。唤醒词检测部12在从获取到的声音中检测出唤醒词的情况下(在S7中为“是”)，通知显示控制部14及设备控制部16检测出唤醒词。另外，唤醒词检测部12在唤醒词之后接着输入了用户的声音的情况下，将接在唤醒词之后的声音向声音识别部13发送。

接着，设备控制部16控制扬声器109来降低播放中的内容的音量(S8)。另外，显示控制部14将针对用户的应答消息或图标显示于显示面板110(S9)。这样的基于设备控制部16或显示控制部14的处理是声音识别服务开始时的处理的一例。

然后，声音识别部13执行针对在唤醒词之后输入到麦克风117中的声音的声音识别处理(S10)。声音识别部13将声音识别处理的声音识别结果向显示控制部14和设备控制部16发送。然后，显示控制部14或设备控制部16通过执行基于声音识别结果的处理，来实现声音识别服务(S11)。之后，返回到S1的处理，反复进行该流程图的处理直至电视装置10的电源切断为止。

这样，本实施方式的电视装置10基于规定的条件来选择声音识别的有效状态和无效状态中的任一个，在选择了有效状态的情况下执行针对输入到麦克风117中的声音的声音识别处理，在选择了无效状态的情况下不执行声音识别处理。因此，根据本实施方式的电视装置10，能够减少在不需要声音识别服务的场合下开始声音识别服务这样的状况。

例如，存在尽管用户讲话的声音不是唤醒词但却被误识别为唤醒词的情况。通常，在用户正在操作遥控器等的场合下，大多不需要基于声音识别服务进行的操作。然而，在现有技术中，在用户一边看着显示面板上的操作画面一边操作遥控器等的场合下，若是用户讲话的声音被误识别为唤醒词，则开始声音识别服务，在显示面板上显示针对用户的应答消息或图标，使得操作画面消失或变得不容易看到。

另外，在显示面板上显示通知画面的情况下，用户会阅读显示在通知画面上的消息等，因此直至该通知画面的显示结束之前都不希望该通知画面被其他画面遮挡。然而，在现有技术中，即便用户正在观看显示面板上的通知画面，若用户讲话的声音被误识别为唤醒词，则也会开始声音识别服务，在显示面板上显示针对用户的应答消息或图标，使得通知画面消失或变得不容易看到。在这样的情况下，有时会让用户感到烦恼，会妨碍向用户提供信息。

相对于此，本实施方式的电视装置10在显示面板110上显示有操作画面和通知画面中的至少任一个的情况下，判断为电视装置10满足规定的条件，选择无效状态。因此，根据本实施方式的电视装置10，能够减少在显示面板110上显示有操作画面或通知画面的情况下开始声音识别服务这样的状况。因此，根据本实施方式的电视装置10，能够减少在用户正使用操作画面或通知画面时在显示面板110上显示针对用户的应答消息或图标而使得用户难以看到操作画面或通知画面这样的状况。

另外，本实施方式的电视装置10在选择了有效状态的情况下将麦克风117设为打开状态，在选择了无效状态的情况下将麦克风117设为关闭状态。因此，根据本实施方式的电视装置10，在无效状态下在物理上无法进行用户的声音的输入，能够减少开始声音识别服务的状况。

需要说明的是，在本实施方式中，将作为硬件的麦克风117设为声音输入部的一例，但也可以将通过程序来实现的获取部11设为声音输入部的一例。另外，麦克风117也可以不设置于电视装置10主体而设置于遥控器119。另外，声音输入部还可以通过电视装置10外部的声音识别设备来实现。

另外，在本实施方式中，将“操作画面和通知画面中的至少任一个正显示于显示面板110”作为规定的条件，但也可以将“操作画面正显示于显示面板110”或“通知画面正显示于显示面板110”作为规定的条件。例如，在将“操作画面正显示于显示面板110”作为规定的条件的情况下，选择部15在操作画面正显示于显示面板110的情况下，无论通知画面有无显示都判定为满足规定的条件。另外，选择部15在操作画面没有显示于显示面板110的情况下，无论通知画面有无显示都判定为不满足规定的条件。

另外，在本实施方式中，将唤醒词检测部12和声音识别部13设为不同的功能部，但也可以设计成声音识别部13具备唤醒词检测部12的功能。另外，还可以将声音识别部13和唤醒词检测部12统称为声音识别部。需要说明的是，在本实施方式中例示的声音识别服务的内容仅是一例，声音识别服务的内容并不限定于例示的内容。

另外，本实施方式中的音量的降低、应答消息等向显示面板110的显示是声音识别服务开始时的处理的一例，声音识别服务开始时的处理并不限定于此。例如，电视装置10也可以在声音识别服务开始时将应答消息以声音的形式输出。

另外，在本实施方式中，选择部15在判定为满足规定的条件的情况下选择声音识别的无效状态，在判定为不满足规定的条件的情况下选择声音识别的有效状态，但选择基准并不局限于此。

例如，在声音识别设为无效状态是通常的状态的情况下，选择部15也可以在判定为满足规定的条件的情况下选择声音识别的有效状态，在判定为不满足规定的条件的情况下选择声音识别的无效状态。举具体的例子的话，在规定的条件为“操作画面及通知画面中的任一个都没有显示于显示面板110”的情况下，选择部15可以在判断为操作画面及通知画面中的任一个都没有显示于显示面板110的情况下，判定为满足规定的条件并选择声音识别的有效状态。另外，选择部15也可以在判断为操作画面和通知画面中的任一个正显示于显示面板110的情况下，判定为不满足规定的条件并选择声音识别的无效状态。

(第二实施方式)

在上述的第一实施方式中，选择声音识别的无效状态的规定的条件是“操作画面和通知画面中的至少任一个正显示于显示面板110”。相对于此，在该第二实施方式中，选择声音识别的无效状态的规定的条件是“规定的应用处于执行中”。

本实施方式的电视装置10的硬件结构与第一实施方式同样。

接着，对本实施方式的电视装置10的功能进行说明。

图4是表示本实施方式的电视装置10的功能结构的一例的图。如图4所示，电视装置10具备获取部11、唤醒词检测部12、声音识别部13、显示控制部14、选择部1015、设备控制部16和应用执行部17。应用执行部17也与其他的功能部同样通过CPU114执行程序来实现。获取部11、唤醒词检测部12、声音识别部13、显示控制部14和设备控制部16具备与第一实施方式同样的功能。

应用执行部17执行内容发布的应用，将通过该应用发布的内容的动态图像显示于显示面板110。

由应用执行部17执行的内容发布的应用是本实施方式中的规定的应用的一例。内容发布的应用例如设为是经由网络300从外部的服务器接收电视剧、电影等内容动态图像的发布的应用，但也可以是包含其他的功能的应用。

应用执行部17例如在内容发布的应用正在执行的期间，在内存115中设定表示内容发布的应用处于执行中的应用执行标志。

本实施方式的选择部1015与第一实施方式同样地基于规定的条件来选择声音识别的有效状态和无效状态中的任一个，但在本实施方式中，使用与第一实施方式不同的条件来选择有效状态和无效状态中的任一个。

更详细而言，本实施方式中的规定的条件是“规定的应用(内容发布的应用)处于执行中”。本实施方式的选择部1015获取内容发布的应用的执行状态，在内容发布的应用处于执行中的情况下，判定为满足规定的条件，选择声音识别的无效状态。另外，选择部1015在内容发布的应用没有处于执行中的情况下，判定为不满足规定的条件，选择声音识别的有效状态。

选择部1015例如基于内存115中有无应用执行标志来判定规定的应用是否处于执行中，但也可以通过其他的方法来获取规定的应用的执行状态。

另外，本实施方式中的声音识别的有效状态和无效状态的选择处理的流程与图3所示的第一实施方式同样。

这样，本实施方式的电视装置10在内容发布的应用没有处于执行中的情况下选择有效状态，在内容发布的应用处于执行中的情况下选择无效状态。因此，根据本实施方式的电视装置10，除了第一实施方式的效果以外，还能起到如下效果：能够减少在正通过内容发布的应用将动态图像内容等显示于显示面板110的情况下开始声音识别服务这样的状况。

即，根据本实施方式的电视装置10，能够减少由于声音识别服务的开始而使得显示在显示面板110上的内容的动态图像消失、在内容的动态图像上显示应答消息等而将内容的动态图像遮挡这样的事态的发生。另外，由于在声音识别服务开始时会降低扬声器109的音量，因此，存在播放中的内容的动态图像的收看受到妨碍的情况。根据本实施方式的电视装置10，能够减少在正通过内容发布的应用将视频内容等显示于显示面板110的情况下开始声音识别服务这样的状况，因此，能够减少妨碍用户收看播放中的内容的动态图像这样的状况。

另外，即便实际上没有开始声音识别服务，但用户也会防备着声音识别服务的开始，从而导致有时无法集中注意力在动态图像内容等的收看中，但本实施方式的电视装置10能够减少这样的事态。

需要说明的是，在本实施方式中，规定的应用为内容发布的应用，但能够由电视装置10执行的应用中的哪个应用会成为“规定的应用”可以预先设定在电视装置10中，也可以设计成能够由用户来设定。

(第三实施方式)

在该第三实施方式中，选择声音识别的无效状态的规定的条件是“当前时刻处于无效期间内”。

本实施方式的电视装置10的硬件结构与第一实施方式同样。

接着，对本实施方式的电视装置10的功能进行说明。

图5是表示本实施方式的电视装置10的功能结构的一例的图。如图5所示，电视装置10具备获取部1011、唤醒词检测部12、声音识别部13、显示控制部14、选择部2015和设备控制部16。唤醒词检测部12、声音识别部13、显示控制部14和设备控制部16具备与第一实施方式同样的功能。

本实施方式的电视装置10具有将声音识别设为无效状态的无效期间的设定。无效期间是声音识别成为无效状态的期间。无效期间的设定例如保存于存储器116。在本实施方式中，通过用户的操作来对该无效期间的设定进行登记或变更。无效期间的设定例如是与无效期间的开始时刻及结束时刻有关的设定。

更详细而言，本实施方式的获取部1011在具备第一实施方式的功能的基础上，还接收由用户进行的无效期间的开始时刻及结束时刻的输入操作。例如，获取部1011基于受光部112接收的来自遥控器119的红外线或输入到操作部111中的操作，接收由用户进行的无效期间的开始时刻及结束时刻的输入操作，将接收到的表示无效期间的开始时刻及结束时刻的无效期间信息保存于存储器116等。需要说明的是，无效期间信息的保存场所并不局限于此。

例如，用户也可以将“PM23：00～AM06：00”设定为无效期间，以防在就寝中启动声音识别服务。另外，用户还可以将“AM09：00～PM17：00”设定为无效期间，以防在外出的期间启动声音识别服务。

另外，在本实施方式中，设计成没有被设定为无效期间的期间全部是有效期间。需要说明的是，在本实施方式中，与第一实施方式同样地设计成在通常的状态下声音识别为有效状态且麦克风117为打开状态。

本实施方式的选择部2015与第一实施方式同样地基于规定的条件来选择声音识别的有效状态和无效状态中的任一个，但在本实施方式中，使用与第一实施方式不同的条件来选择有效状态和无效状态中的任一个。

更详细而言，本实施方式中的规定的条件是“当前时刻处于无效期间内”。本实施方式的选择部2015在当前时刻处于无效期间内的情况下，判定为满足规定的条件，选择声音识别的无效状态。另外，选择部2015在当前时刻处于有效期间内的情况下，判定为不满足规定的条件，选择声音识别的有效状态。

另外，本实施方式中的声音识别的状态选择处理的流程与图3所示的第一实施方式同样。

这样，根据本实施方式的电视装置10，在当前时刻处于有效期间内的情况下选择有效状态，在当前时刻处于无效期间内的情况下选择无效状态，由此，除了第一实施方式的效果以外，还能减少在用户不期望声音识别服务的开始的时段开始声音识别服务这样的状况。

需要说明的是，在本实施方式中，接收由用户进行的无效期间的设定，但也可以接收有效期间的设定。例如，在电视装置10中声音识别为无效状态是通常的状态的情况下，仅在设定好的有效期间内使声音识别成为有效状态。这种情况下，规定的条件例如可以是“当前时刻处于有效期间内”。另外，在采用该结构的情况下，选择部2015也可以在判定为满足规定的条件的情况下选择声音识别的有效状态，在判定为不满足规定的条件的情况下选择声音识别的无效状态。

需要说明的是，在本实施方式中，无效期间仅是由开始时刻和结束时刻来定义，但也可以利用星期或节日等日历信息来更详细地定义。

(第四实施方式)

在该第四实施方式中，选择声音识别的无效状态的规定的条件与第三实施方式同样是“当前时刻处于无效期间内”。但是，在第三实施方式中，用户设定的是无效期间，相对于此，在该第四实施方式中，电视装置10基于学习结果来设定无效期间。

本实施方式的电视装置10的硬件结构与第一实施方式同样。

接着，对本实施方式的电视装置10的功能进行说明。

图6是表示本实施方式的电视装置10的功能结构的一例的图。如图6所示，电视装置10具备获取部11、唤醒词检测部12、声音识别部13、显示控制部14、选择部2015、设备控制部16和学习部18。学习部18也与其他的功能部同样地通过CPU114执行程序来实现。获取部11、唤醒词检测部12、声音识别部13、显示控制部14和设备控制部16具备与第一实施方式同样的功能。另外，选择部2015具备与第三实施方式同样的功能。

学习部18学习由用户进行的操作的模式，生成学习完成模型。本实施方式中的学习完成模型作为一例是将时刻与在该时刻下是否需要声音识别服务建立了对应关系的信息。学习部18进行学习的方法例如可以适用公知的机器学习或深度学习中的无教师学习的技术。学习完成模型例如保存于存储器116等，但保存场所并不局限于此。

学习部18的输入数据是用户的操作内容和时刻，例如是用户进行了声音识别服务的取消操作的时刻、用户利用声音识别服务的时刻等。例如，在用户不利用开始了的声音识别服务而用遥控器119等结束了声音识别服务的情况下，对该时刻和用户进行了声音识别服务的取消操作这一行为进行学习。

学习部18基于学习结果来输出不需要声音识别服务的时刻。学习部18将该输出的结果作为表示无效期间的开始时刻及结束时刻的无效期间信息而保存于存储器116等。

另外，学习部18在生成过一次的学习完成模型之后，仍继续学习由用户进行的操作的模式，来提高学习完成模型的精度。

这样，本实施方式的电视装置10基于对用户的操作的模式进行学习而得到的结果来设定声音识别的无效期间，在当前时刻处于有效期间内的情况下选择有效状态，在当前时刻处于无效期间内的情况下选择无效状态。因此，根据本实施方式的电视装置10，除了第一实施方式、第三实施方式的效果以外，还能够减少用户进行无效期间的设定操作所耗费的时间和精力。

需要说明的是，在本实施方式中例示的向学习部18输入的输入数据及从学习部18输出的输出结果仅是一例，并不限定于此。另外，学习部18不仅可以设定根据时刻而不同的无效期间，还可以设定根据星期或节日等日历信息而不同的无效期间。

需要说明的是，在本实施方式中，电视装置10基于对用户的操作的模式进行学习而得到的结果来设定声音识别的无效期间，但也可以基于学习的结果来设定声音识别的有效期间。

(第五实施方式)

在该第五实施方式中，选择声音识别的无效状态的规定的条件是“当前时刻处于特定节目的从开始时刻到结束时刻为止的期间内”。

本实施方式的电视装置10的硬件结构与第一实施方式同样。

接着，对本实施方式的电视装置10的功能进行说明。

图7是表示本实施方式的电视装置10的功能结构的一例的图。如图7所示，电视装置10具备获取部2011、唤醒词检测部12、声音识别部13、显示控制部14、选择部3015、设备控制部16和节目表生成部19。唤醒词检测部12、声音识别部13、显示控制部14和设备控制部16具备与第一实施方式同样的功能。

本实施方式的获取部2011在具备第一实施方式的功能的基础上，还从广播信号所包含的服务信息SI(Service Information)中获取与节目有关的信息。获取部2011将获取的与节目有关的信息向节目表生成部19发送。

另外，本实施方式的获取部2011接收由用户进行的用于指定特定节目的操作。例如，获取部2011基于受光部112接收的来自遥控器119的红外线或输入到操作部111中的操作，来接收由用户进行的用于指定特定节目的操作。另外，获取部2011从保存于存储器116的节目表中获取由用户指定的特定节目的开始时刻及结束时刻。获取部2011将接收到的表示特定节目的开始时刻及结束时刻的节目时刻信息保存于存储器116等。需要说明的是，节目时刻信息的保存场所并不局限于此。

节目表生成部19基于由获取部2011获取的与节目有关的信息来生成节目表。节目表生成部19将生成的节目表例如保存于存储器116。

另外，也可以设计成用户输入特定节目的开始时刻及结束时刻。

本实施方式的选择部3015与第一实施方式同样地基于规定的条件来选择声音识别的有效状态和无效状态中的任一个，但在本实施方式中，使用与第一实施方式不同的条件来选择有效状态和无效状态中的任一个。

更详细而言，本实施方式中的规定的条件是“当前时刻处于特定节目的从开始时刻到结束时刻为止的期间内”。“特定节目的从开始时刻到结束时刻为止的期间”是本实施方式中的无效期间的一例。

本实施方式的选择部3015基于当前时刻是否处于特定节目的从开始时刻到结束时刻为止的期间内，来选择有效状态和无效状态中的任一个。例如，选择部3015在当前时刻处于特定节目的从开始时刻到结束时刻为止的期间内的情况下，判定为满足规定的条件，选择声音识别的无效状态。另外，选择部3015在当前时刻没有处于特定节目的从开始时刻到结束时刻为止的期间内的情况下，判定为不满足规定的条件，选择声音识别的有效状态。

这样，本实施方式的电视装置10基于当前时刻是否处于特定节目的从开始时刻到结束时刻为止的期间内来选择有效状态和无效状态中的任一个。因此，根据本实施方式的电视装置10，除了第一实施方式的效果以外，还能够防止在用户正收看特定节目时声音识别服务开始这样的状况。因此，根据本实施方式的电视装置10，能够减少用户在正收看喜爱的节目的期间由于不需要的声音识别服务的开始而受到妨碍的状况。另外，根据本实施方式的电视装置10，能够减少在用户正收看特定节目的期间由于声音识别服务而意外地切换为其他的节目或者切断电视装置10的电源这样的误操作的发生，另外，能够减少由于该误操作的发生而导致用户错过节目这样的状况。

需要说明的是，在本实施方式中，由用户来设定特定节目，但也可以是电视装置10基于对用户的收看历史进行学习而得到的学习结果来设定特定节目。

另外，在本实施方式中，作为接收装置的一例的电视装置10从广播信号中获取与节目有关的信息，但也可以是接收装置经由IP通信部113及网络300来从外部获取节目表数据。

(变形例1)

在上述的第一实施方式至第五实施方式中，在声音识别为有效状态和无效状态的情况下切换麦克风117的打开状态与关闭状态，但也可以在麦克风117维持着打开状态的情况下切换声音识别功能的有效状态与无效状态。

例如，在选择了声音识别的无效状态的情况下，唤醒词检测部12及声音识别部13不执行针对输入到麦克风117中的声音进行的唤醒词的检测处理及声音识别处理。因此，在选择了声音识别的无效状态的情况下，即便麦克风117处于能够输入声音的状态，也不会开始声音识别服务。

另外，在选择了声音识别的有效状态的情况下，唤醒词检测部12及声音识别部13与第一实施方式～第五实施方式同样地执行针对输入到麦克风117中的声音进行的唤醒词的检测处理或声音识别处理。

(变形例2)

在上述的第一实施方式至第五实施方式中，基于彼此不同的规定的条件来选择声音识别的有效状态和无效状态，但也可以组合不同的实施方式中的规定的条件。例如，选择声音识别的无效状态的规定的条件可以是将第一实施方式至第五实施方式中的规定的条件作为或条件(OR条件)组合而得到的“操作画面和通知画面中的至少任一个正显示于显示面板110、规定的应用处于执行中、当前时刻处于无效期间内、或者当前时刻处于特定节目的从开始时刻到结束时刻为止的期间内”，也可以是将上述的规定的条件的一部分组合而得到的条件。

(变形例3)

在上述的第一实施方式至第五实施方式中，将电视装置10作为接收装置的一例，但接收装置并不限定于此。例如，接收装置也可以是机顶盒或带电视功能的PC(Personal Computer)等，还可以是BD(Blu-ray Disc)(注册商标)录像机或DVD录像机等录像播放装置。

如以上所说明的那样，根据第一实施方式至第五实施方式，能够减少在不需要声音识别服务的场合下开始声音识别服务这样的状况。

对本申请的几个实施方式进行了说明，但这些实施方式仅是作为示例来提示的，并不意在限定申请的范围。这些新的实施方式可以以其他各种各样的形态来实施，可以在不脱离申请的主旨的范围内进行各种省略、置换、变更。这些实施方式及其变形包含在申请的范围、主旨内，并且包含在权利要求书所记载的发明及与其等同的范围内。

Claims

一种接收装置，其具备：

声音输入部，其输入用户的声音；

选择部，其基于规定的条件，选择声音识别的有效状态和无效状态中的任一个；以及

声音识别部，在选择了所述有效状态的情况下，所述声音识别部执行针对输入到所述声音输入部的所述声音的声音识别处理，在选择了所述无效状态的情况下，所述声音识别部不执行所述声音识别处理。
根据权利要求1所述的接收装置，其中，

所述规定的条件是通知画面或能够接收所述用户的操作的操作画面中的至少任一个画面正显示于显示部，

所述选择部在所述显示部显示有所述操作画面或所述通知画面中的至少任一个画面的情况下选择所述无效状态，在所述操作画面或所述通知画面中的任一个画面都没有显示于所述显示部的情况下选择所述有效状态。
根据权利要求1所述的接收装置，其中，

所述规定的条件是规定的应用处于执行中，

所述选择部获取所述规定的应用的执行状态，在所述规定的应用没有处于执行中的情况下选择所述有效状态，在所述规定的应用处于执行中的情况下选择所述无效状态。
根据权利要求1所述的接收装置，其中，

所述规定的条件是当前时刻处于无效期间内或有效期间内，

所述选择部在当前时刻处于所述有效期间内的情况下选择所述有效状态，在当前时刻处于所述无效期间内的情况下选择所述无效状态。
根据权利要求1～4中任一项所述的接收装置，其中，

所述声音输入部是麦克风，

所述接收装置还具备设备控制部，所述设备控制部在由所述选择部选择了所述有效状态的情况下将所述麦克风设为打开状态，在由所述选择部选择了所述无效状态的情况下将所述麦克风设为关闭状态。