WO2021109839A1

WO2021109839A1 - 指令控制装置、控制方法及非易失性存储介质

Info

Publication number: WO2021109839A1
Application number: PCT/CN2020/128811
Authority: WO
Inventors: 浜田知; 高橋大
Original assignee: 海信视像科技股份有限公司; 东芝视频解决方案株式会社
Priority date: 2019-12-06
Filing date: 2020-11-13
Publication date: 2021-06-10
Also published as: CN113228166A; CN113228166B; JP2021092612A; JP7229906B2

Abstract

一种指令控制装置、控制方法及非易失性存储介质。指令控制装置辅助针对声音指令的声音识别。指令控制装置基于输入的声音来生成包含针对控制对象设备的控制命令在内的执行指令，其中，生成包含第1控制命令和与所述第1控制命令不同的第2控制命令中的任一者在内的执行指令，其中，所述第1控制命令是对所述声音进行声音识别而获取的识别指令中包含的控制命令。

Description

指令控制装置、控制方法及非易失性存储介质

本申请要求在2019年12月6日提交日本专利局、申请号为2019-221573、发明名称为“指令控制装置、控制方法及控制程序”的日本专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施方式涉及指令控制装置、控制方法及非易失性存储介质。

背景技术

近年来，研究了使用声音识别以声音来控制设备的声音控制技术。例如，声音控制技术能够用于代替电视机的遥控器，若用户发出了作为控制命令的指令，则叠加有指令的声音(以下，称为声音指令)由附属于电视机的麦克风等接收声波，并通过声音识别将指令作为数据进行取出。取出来的指令数据成为在电视机中执行的指令。在该技术中，在周围的噪音等的影响下，用户所发出的声音指令有时会通过声音识别被识别为错误的指令，正在研究声音识别的性能提高。

在先技术文献

专利文献

专利文献1：日本特开2017－167247号公报

发明内容

然而，根据周围的噪音的大小的不同，有时声音识别无法良好地起作用，能够应用声音控制技术的范围受到限定。另外，在平时动作的基于声音控制技术的控制有可能在地震等紧急时因噪音变大而变得不正常地动作。

本申请要解决的问题是提供对声音指令的声音识别进行辅助的指令控制装置、控制方法及非易失性存储介质。

本申请的一个实施方式的指令控制装置基于输入的声音来生成包含针对控制对象设备的控制命令在内的执行指令，其中，所述指令控制装置生成包含第1控制命令和与所述第1控制命令不同的第2控制命令中的任一者在内的执行指令，所述第1控制命令是对所述声音进行声音识别而获取的识别指令所包含的第1控制命令。

附图说明

图1是示出第1实施方式的系统整体的构成例的图；

图2是示出该实施方式的接收装置的功能结构的一个例子的框图；

图3是示出该实施方式的指令控制部的功能结构的一个例子的框图；

图4是示出在该实施方式中能够利用声音指令进行控制的控制对象部位和控制对象部位的状态的一个例子的图；

图5是示出在该实施方式中能够利用的辅助信息的一个例子的图；

图6是示出在该实施方式中用于指令控制部接收声音指令并发送执行指令的处理动作例的流程图；

图7是示出在该实施方式中为了控制主电源而在指令控制部中设定的执行指令生成条件的一个例子的图；

图8是示出在第2实施方式中为了控制音量而在指令控制部中设定的执行指令生成条件的一个例子的图；

图9是示出在第3实施方式中为了控制数字内容接收而在指令控制部中设定的执行指令生成条件的一个例子的图；

图10是示出第4实施方式的系统整体的构成例的图。

附图标记说明

1…指令控制部、2…指令控制装置、10…接收装置、11…指令生成部、12…声音检测部、13…指令识别部、14…用户接口部、15…接口部、16…辅助信息获取部、17…状态信息获取部、18…指令发送部、19…控制部、20…广播信号接收处理部、21…辅助信息输出部、30…内容处理部、31…辅助信息输出部、40…录像播放部、41…辅助信息输出部、50…设备数据生成部、51…辅助信息输出部、60…输出控制部、62…状态切换部、70…传感器部、71…辅助信息输出部、80…主电源部、82…状态切换部、90…控制部、91…辅助信息管理部、92…状态信息管理部、93…时刻管理部、100…遥控器、101…天线、102…通信部、103…显示部、104…扬声器部、105…接口部、111…存储部、121…声音分析部、200…内容服务器装置、300…收看解析装置、400…声音识别装置、500…网络。

具体实施方式

以下，参照附图说明实施方式。

图1是示出实施方式的系统整体的构成例的图。

接收装置10是收看数字内容的设备，例如是能够接收并收看2K或4K/8K这样的地面波广播、卫星广播等数字广播的电视机接收装置(也称为电视机装置、电视接收机、广播信号接收装置)。另外，接收装置10例如具备用于与互联网等网络500连接的外部接口，能够收看与网络500连接的内容服务器装置200(也可以是云服务器)提供的数字内容。另外，接收装置10也可以具有录像播放功能，能够利用录像播放功能来收看在接收装置10中录像到的数字内容。另外，也可以通过在接收装置10上连接未图示的录像播放装置，从而能够收看未图示的录像播放装置录像到的数字内容。此外，在图1中，示出了1个接收装置10，但是，可也进一步连接多个接收装置10。但是，接收装置10只要是能够接收数字内容的设备，则不需要全部具有相同的功能。具体而言，也可以是不具有能够进行收看的监视器的仅能录像的录像机(Recorder)、能够接收广播信号的机顶盒(Set Top Box：STB)等。将电视机装置、录像机、STB等统称为接收装置10。

在本实施方式中，特别示出电视机装置的例子，但是，也可以将电视机装置替换为录像机、STB等接收装置10。另外，作为具有同样的接收功能的装置，接收装置10也可以是个人计算机、智能手机等移动设备。

本实施方式的接收装置10是能够进行使用声音识别的基于声音的控制。指令控制部1例如对用户所发音的声音指令进行声音识别，使用利用声音识别取得的指令(以下，称为识别指令)来控制接收装置10内的各功能。另外，遥控器100是对接收装置10进行遥控控制的遥控器。

另外，接收装置10能够对由接收装置10收看过的数字内容的收看历史(以下，称为收看数据)进行收集并存储。另外，能够在接收装置10中存储固有的数据(以下，称为设备个别数据)。包含收看数据和设备个别数据在内称为收看设备数据。接收装置10能够将收看设备数据等保存数据向与网络500连接的收看解析装置300输出，并且能够接收收看解析装置300实施的针对收看设备数据的解析结果。

本实施方式中的所谓“收看”，包含即使用户实际上虽未正在收看但以能够收看的状态接收数字内容或已接收到的状态、或者已录像到的状态。因此，本实施方式中的“收看历史”例如包含：STB等接收装置仅进行接收但不论是否收看的“接收历史”；在接收装置为录像机的情况下由接收装置接收并被录像预约的、或被录像到的“录像历史”等。另外，同样地，本实施方式中的“收看时间”例如包含：STB等接收装置接收了数字内容的时间；在接收装置为录像机的情况下，录像了数字内容的时间等。

因此，在将接收装置10替换为录像机、STB等接收装置的情况下，在收看设备数据中也包含录像机、STB等接收装置生成的接收日志数据、下载历史数据、录像数据等。

设备个别数据例如既可以由用户使用接收装置10的遥控器100登记到接收装置10中，有的情况下也如接收装置10的固定编号那样由生产商设定。设备个别数据例如包含接收装置10的IP地址、识别编号、以及预先由所有者等登记的人口统计数据(以下，称为人口统计)等。所谓人口统计，是将收看接收装置10的用户分类的数据，例如是用户的年龄、性别、家族构成、居住地区等信息。识别编号是识别不同的接收装置10的编号、字符串等，例如由数字、字母的组合构成。

内容服务器装置200是提供数字内容的网络上或者云服务器。内容服务器装置200例如由内容服务提供商(CSP)、通信运营商、以及其他被称为过顶传输(Over The Top：OTT)的数字内容的服务运营商等提供。内容服务器装置200也包含提供视频点播(Video On Demand)这样的服务的服务器。

收看解析装置300是如下装置：存在于网络上或者云上，对由接收装置10存储的收看设备数据进行收集并存储，进而对存储的数据进行解析以进行各种收看解析，并向例如请求了解析的接收装置10输出解析结果。收看解析装置300例如被构筑在具有CPU、存储器等的计算机中。收看解析装置300既可以是个人计算机，也可以是由服务器、数据库等进行的云服务。

另外，收看解析装置300也可以能够根据接收装置10个别地具有的识别编号来识别各个接收装置10，从而进行个别的接收装置10收看解析。

声音识别装置400被设置在网络500上。声音识别装置400例如被构筑在具有CPU、存储器等的计算机中。声音识别装置400既可以是个人计算机，也可以是云服务器。声音识别装置400经由网络500接收与由麦克风等接收到的用户的声音相对应的声音波形的数字数据(以下，称为声音数据)，推定或者识别用户发出的指令，将识别出的指令(识别指令)作为文本数据进行输出。在声音识别装置400中，也可以将用户向控制对象发出的指令预先作为文本数据进行列表化，对根据接收到的声音数据而取得的文本数据与列表的文本数据进行比较，选择列表中的最接近的指令，将选择出的指令的文本数据输出。但是，声音识别装置400中的声音识别的方法不限定于该方法。

另外，声音识别装置400也可以由语言转成文字(Speech To Text)服务器(以下，称为STT服务器)和遥控识别服务器构成，其中，该语言转成文字服务器生成将声音数据文本化(文字化、语言化等)而得到的声音文本，该遥控识别服务器从列表化了的指令之中将与生成了的声音文本最接近的指令作为识别指令来生成。具体而言，遥控识别服务器也可以参照预先登记在未图示的存储部等中的指令表，将与STT服务器生成了的声音文本一致的指令或者表中最接近的指令作为识别指令进行输出。

网络500是连接有接收装置10、内容服务器装置200、收看解析装置300、声音识别装置400从而使各装置能够通信的网络，例如是互联网。另外，网络500不仅限于互联网，如果各装置能够通信，则也可以是包含多个不同网络的网络。

图2是示出实施方式的接收装置10的功能结构的一个例子的框图。

接收装置10是对叠加有数字内容的信号进行接收处理以获取数字内容并收看的设备。

广播信号接收处理部20对从天线101接收到的数字广播等广播信号按照数字广播的规范进行处理，获取视像、声音、文字等内容数据并输出。数字广播的规范例如可以是在2K数字广播中采用的MPEG2TS方式、在4K/8K数字广播中采用的MPEG媒体传输(MPEG Media Tranport)方式(MMT方式)等，也可以利用多个调谐器对应双方。作为与数字广播的规范相应的处理，包含将数字数据流分离成视像、声音、文字等内容数据的数字数据流的解复用处理、错误订正码解码处理、对加密后数据进行解码的加密解码处理、针对已对各内容数据实施了的编码化(视像编码化、声音编码化、文字编码化等)的解码处理等。

辅助信息输出部21从广播信号中提取由控制部90请求的信息，并向控制部90输出。辅助信息输出部21尤其是从广播信号中包含的控制信息、节目关联信息等中提取被请求的信息，并向控制部90输出。对输出到控制部90的信息，根据需要而实施加工，作为辅助信息在指令控制部1中使用。

内容处理部30对于从通信部102输入的数字数据，针对由内容服务器装置200实施了的编码处理实施解码处理等，并输出视像、声音、文字等内容数据。具体而言，作为解码处理，内容处理部30例如实施解复用处理(分离处理)、错误订正码解码处理、针对编码了的内容数据(视像、文字、声音等)的解码处理等。

辅助信息输出部31从由内容服务器装置200输出的数据中提取由控制部90请求的信息，并输出到控制部90。辅助信息输出部31尤其是从由内容服务器装置200输出的控制信息等中提取内容节目的发布运营商等关联属性信息等，并输出到控制部90。对于被输出到控制部90中的信息，根据需要而实施加工，并作为辅助信息在指令控制部1中使用。

录像播放部40例如是光盘播放器(Disc player)、HDD录像机等，存储广播信号接收处理部20、内容处理部30输出的内容数据等，并按照播放请求，将存储了的内容数据向输出控制部60输出，作为视像、文字、声音从显示部103、扬声器部104输出。用户通过收看显示部103、扬声器部104输出的视像、文字、声音，从而收看在录像播放部40中存储了的数字内容等。此外，在本实施方式中，录像播放部40设置为接收装置10的一个功能，但是，例如也可以是经由了接口部105的外置装置。另外，在接收装置10具备多个调谐器(相当于广播信号接收处理部20)的情况下，录像播放部40也可以设置成，能够一边收看利用广播信号接收处理部20进行了接收处理后的内容A，一边通过录像播放部40对由其它广播信号接收处理部20进行了接收处理后的内容B进行录像。

设备数据生成部50从接收装置10的各功能部(尤其是广播信号接收处理部20、内容处理部30、录像播放部40)收集数据，并生成收看设备数据。收看设备数据包含设备个别数据和收看数据。设备个别数据是接收装置10所固有的数据，例如也可以在设置接收装置10时，由用户从遥控器100等设定到接收装置10中。另外，对于在收看解析中使用的识别编号，例如也可以在接收装置10的购买时等预先分配，并设定在设备个别数据等中。

收看数据例如是收看历史，也可以由接收装置10在进行了某些收看的情况下逐次生成。具体而言，例如，与广播信号接收处理部20、内容处理部30、录像播放部40被起动的时刻相应地，在各功能部中，对提供数字内容的频道、节目名(或以该节目名为基准的节目id)、收看了节目的日期等进行存储，与各功能部被停止的时刻相应地，各功能部将存储了的数据作为收看数据输出到设备数据生成部50。设备数据生成部50根据需要而对收看数据进行加工，并存储到接收装置10的未图示的存储部中。另外，也可以设置成：各功能部(尤其是广播信号接收处理部20、内容处理部30、录像播放部40)分别存储收看数据，在从外部装置存在收看数据的发送请求时，各功能部将收看数据输出到设备数据生成部50，设备数据生成部50根据需要而对收看数据实施加工，作为收看设备数据向外部装置输出。

设备数据生成部50根据来自外部装置(尤其是收看解析装置300)的请求，将生成了的收看设备数据向通信部102输出。将收看设备数据从通信部102经由网络500而向进行了请求的收看解析装置300发送。另外，也可以是，在接收装置10中，在检测到收看设备数据的变化的情况下，在任意的时刻将收看设备数据向收看解析装置300发送。

辅助信息输出部51接收设备数据生成部50生成了的收看设备数据、从接收装置10的各功能部收集到的收看数据、以及收看解析装置300输出的各种解析结果数据，并输出到控制部90。对于输出到控制部90的信息，根据需要而实施加工，并作为辅助信息在指令控制部1中使用。

输出控制部60对于广播信号接收处理部20、内容处理部30、录像播放部40输出了的内容数据，调整输出时刻、显示方法等，并向显示部103、扬声器部104输出。

状态切换部62按照来自控制部90的控制来切换显示部103的当前的显示状态(开状态或者关状态、正在显示的状态或者未显示的状态等)、扬声器部104的当前的输出状态(开状态或者关状态、声音输出状态或者正在将声音设置成静音的状态等)。控制部90管理显示部103的显示状态、扬声器104的输出状态，控制部90按照来自遥控器100、指令控制部1的控制命令来控制状态切换部62。

传感器部70是设置于电视机正面的例如照相机，可以用照相机拍摄电视机装置的正面，并使用图像识别等根据拍摄到的图像来推测例如在电视机装置的前方的用户。

辅助信息输出部71将传感器部70推测出的用户信息输出到控制部90。对于输出到控制部90中的信息，根据需要而实施加工，并作为辅助信息在指令控制部1中使用。

主电源部80是接收装置10的主功能的电源，例如，是在向电视机装置的显示部103、扬声器部104输出数字内容、或停止输出(将该操作称为电视机装置的开－关操作)时使用的电源。

状态切换部82按照来自控制部90的控制来切换主电源部80的当前的状态，即电视机装置的开－关的状态。控制部90管理主电源部80的当前的状态，控制部90按照来自遥控器100、指令控制部1的控制命令来控制状态切换部82。

控制部90控制接收装置10的各功能。具体而言，控制部90从接口部105接收各种控制信号，并控制接收装置10的各功能。例如，在用户从遥控器100指定了是收看基于广播信号的内容、还是收看来自内容服务器装置200的内容的情况下，控制部90经由接口部105接收来自遥控器的控制信号，控制接收装置10的功能，使其进行用户指定的动作。此外，也可以是，在图2中，与控制部90之间并未特别连线的功能模块之间也进行数据的交互。

另外，本实施方式中的控制部90经由接口部105接收来自指令控制部1的执行指令，并按照执行指令来实施接收装置10内的各功能的控制。

辅助信息管理部91接收各功能部内的辅助信息输出部(辅助信息输出部21、辅助信息输出部31、辅助信息输出部41、辅助信息输出部51、辅助信息输出部71等)输出的辅助信息，并存储到未图示的存储部中。辅助信息管理部91将已存储的各功能部的辅助信息从接口105发送到指令控制部1。

也可以设置为：对于在辅助信息管理部91中存储的信息，将预先确定的项目设定在各功能部内的辅助信息输出部中，在各功能部中更新了辅助信息的时刻由辅助信息输出部自动地输出到辅助信息管理部91。另外，也可以设置为：辅助信息管理部91根据需要而向各功能的辅助信息输出部请求辅助信息。

状态信息管理部92将各功能部内的状态切换部(状态切换部62、状态切换部82等)的状态信息存储到未图示的存储部。状态信息管理部92经由接口105而将存储了的各功能的状态信息发送到指令控制部1。在本实施方式中，控制部90为了控制各功能部的状态，而将状态信息管理部92的状态信息始终保持为最新的状态。此外，关于状态信息管理部92存储的信息，也可以设置为：将预先确定的项目设定在各功能部内的未图示的状态信息输出部中，在各功能部中更新了状态信息的时刻由状态信息输出部自动地输出到状态信息管理部92。另外，也可以设置为，状态信息管理部92根据需要而向各功能部的状态信息输出部请求状态信息。

时刻管理部93管理接收装置10的时刻。既可以在接收装置10的内部具有时钟，也可以从广播信号等提取时刻来得到。

通信部102按照例如TCP/IP、UDP/IP这样的预先确定的通信协议等，与连接于网络500的各种装置之间进行数据的收发处理。

显示部103是显示视像、文字的例如监视器。扬声器部104是输出声音的例如扬声器。显示部103、扬声器部104将输出控制部60输出的内容数据作为视像、文字、声音进行输出。用户通过收看显示部103、扬声器部104输出的视像、文字、声音，从而收看由广播信号、内容服务器装置200、其它录像播放部40提供的数字内容。

接口部105是用于从遥控器100等外部对接收装置10进行控制的接口，例如，从遥控器100、附属于接收装置10的未图示的开关等接收控制信号，并向接收装置10的控制部90输出。也可以具有代替遥控器100而接收来自未图示的智能手机等终端的控制信号的接口。另外，接口部105也可以具有用于与外部装置连接的接口。例如，也可以是用于将接收装置10与未图示的外置的HDD录像机连接的接口。在此情况下，用户能够利用显示部103、扬声器部104来收看未图示的外置的HDD录像机输出的数字内容。

另外，本实施方式中的接口105具有能够与指令控制部1的接口部15进行通信的接口，例如接口也可以是各种串行总线。另外，接口105接收指令控制部1输出的执行指令，并向控制部90输出执行指令。

图3是示出该实施方式的指令控制部的功能结构的一个例子的框图。

在指令控制部1中，指令生成部11基于指令识别部13通过声音识别而生成的识别指令、以及辅助信息获取部16、状态获取部17获取的追加信息(辅助信息和状态信息)来生成执行指令，并从指令发送部18输出到指令控制部1的外部。以下，说明各功能模块。

指令生成部11在存储部111中存储有识别指令、追加信息、以及执行指令的组合(以下，称为条件组合表)。条件组合表(list)能够由用户预先设定。条件组合表既可以被装入在指令生成部11的计算机程序中，也可以例如经由网络500从外部的服务器下载。若向指令生成部11输入了识别指令和追加信息，则指令生成部11参照条件组合表来生成执行指令并输出。

声音检测部12例如是麦克风，接收用户发出的声音，通过采样(sampling)等来取得接收到的声音波形的声音数据，并输出。

指令识别部13根据声音检测部12输出的声音数据来实施声音识别，推定或者识别用户发出的指令，将识别指令作为文本数据进行输出。指令识别部13可以在其内部具备执行声音识别的声音数据处理部(声音识别引擎)，但也可以将声音数据发送到具备声音识别引擎(engine)的网络500上的声音识别装置400，从而取得识别指令。通过利用声音识别装置400，能够降低指令识别部13的制造成本等。另外，声音识别装置400通过从多个接收装置10取得声音数据并实施声音识别，从而声音识别装置400还具有取得学习效果从而能够实现声音识别的性能提高等好处。但是，因为为了使用声音识别装置400而经由网络500，所以具有声音识别的处理延迟较大这样的缺点，在这一点上，在利用指令识别部13的内部的声音识别引擎的情况下，具有声音识别的处理延迟较小的优点。另外，在图3中，示出了内置声音检测部12(扬声器)的例子，但是，也可以使用智能扬声器等。例如，将智能扬声器连接于接口105来使用。具体而言，也可以是，搭载有声音识别引擎的智能扬声器生成识别指令，指令控制部1(或者指令生成部11)例如经由接口105获取智能扬声器生成的识别指令。获取到的识别指令也可以在指令生成部11中用于生成执行指令。

用户接口部14例如是如个人电脑的键盘等那样能够进行文字输入的接口。具体而言，用户从用户接口部14将条件组合表设定在存储部111中。此外，也可以使用遥控器100、智能手机等将条件组合表设定在存储部111中。另外，也可以是，指令生成部11从设置于接收装置10的外部的未图示的提供条件组合表的服务器将条件组合表下载到存储部111。

接口部15与接口部105进行各种数据通信。具体而言，接口部15从接口部105接收辅助信息、状态信息。另外，接口部15对接口部105发送指令生成部11生成的执行指令。

辅助信息获取部16从辅助信息管理部91经由接口部15获取辅助信息。辅助信息获取部16例如也可以根据从指令识别部13输出识别指令的时刻，对辅助信息管理部91输出辅助信息的获取请求，从辅助信息管理部91获取辅助信息。

状态获取部17从状态信息管理部92经由接口部15获取状态信息。例如也可以是，根据指令识别部13输出识别指令的时刻或者指令生成部11接收识别指令的时刻，状态信息获取部17对状态信息管理部92输出状态信息的获取请求，并从状态信息管理部92获取状态信息。

指令发送部18将指令生成部11生成并输出的执行指令从接口部15向控制部90发送。另外，还能够经由通信部102发送到网络500上的装置、设备。

控制部19对指令控制部1内的各功能模块进行控制。此外，也可以设置为：在图3中，在与控制部19之间没有特别连线的功能模块之间也进行数据的交互(控制)。

声音分析部121对从声音检测部12输出的声音数据，例如实施频率分析(声波纹分析)，推测大人儿童、年龄、性别等声音源的属性从而得到声音源推测结果。声音分析部121对声音源推测结果实施所需的加工并作为辅助信息输出到辅助信息获取部16。另外，由声音分析部121取得的声音源推测结果也能够利用于是否启动指令生成部11、指令识别部13、指令发送部18等。也可以是，根据声音源推测结果，例如在发出了声音的用户是儿童的情况下，为了使得不输出执行指令，而若声音分析部121将声音源推测结果输出到控制部19，则控制部19将指令生成部11、指令识别部13、指令发送部18的功能设为有效或设为无效。

图4是示出在该实施方式中能够通过声音指令控制的控制对象部位和控制对象部位的状态的一个例子的图。

从左侧的列起示出了“编号”、“控制对象部位”、“可取的状态值”、“声音指令”。“控制对象部位”是能够通过声音指令控制的接收装置10的部位。“可取的状态值”是“控制对象部位”的可取的状态。“声音指令”是在对“控制对象部位”切换状态值时用户发出的控制命令。

“编号”＝1表示作为接收装置10的“控制对象部位”的主电源部80的“可取的状态值”为开和关这2个状态。在此情况下，用于切换状态值的“声音指令”在使状态值成为开的情况下是“开电源”，在使状态值成为关的情况下是“关电源”。即，为了开电视机装置的电源，用户发音“开电源”，为了关电视机装置的电源，用户发音“关电源”。

“编号”＝2表示作为接收装置10的“控制对象部位”的输出控制部60的状态切换部62的“可取的状态值”为开和关这2个状态。即，为了开电视机装置的音量以便从扬声器部104输出声音，用户发音“开音量”，为了关电视机装置的音量以便不从扬声器部104输出声音(静音)，用户发音“关音量”。

“编号”＝3是处于正在将数字内容输出到显示部103、扬声器部104的状态的内容输出装置。内容输出装置是广播信号接收处理部20、内容处理部30、录像播放部40的总称。具体而言，“可取的状态值”的列中的“调谐器”相当于广播信号接收处理部20，“网络”相当于内容处理部30，“录像机”相当于录像播放部40。例如，为了使广播信号接收处理部20成为接收状态以便使显示部103、扬声器部104输出基于广播信号的内容，用户发音“调谐器”。为了使内容处理部30成为接收状态以便使显示部103、扬声器部104输出来自内容服务器装置200的内容，用户发音“网络”。为了使录像播放部40成为播放状态以便使显示部103、扬声器部104输出，用户发音“录像机”。

“编号”＝4是处于正在将数字内容输出到显示部103、扬声器部104的状态的调谐器。“可取的状态值”的BS、CS、地面数字分别表示BS数字广播、CS数字广播、地面数字电视广播(地面数字广播)的调谐器。例如，为了使BS数字广播成为接收状态以便使显示部103、扬声器部104输出BS数字广播的内容，用户发音“BS”。为了使CS数字广播成为接收状态以便使显示部103、扬声器部104输出CS数字广播的内容，用户发音“CS”。为了使地面数字广播成为接收状态以便使显示部103、扬声器部104输出地面数字广播的内容，用户发音“地面数字”。

“编号”＝5是内容输出装置正在向显示部103、扬声器部104输出的频道(节目)。“可取的状态值”的1ch、2ch、3ch表示频道编号。例如，在使1ch成为接收状态以便使显示部103、扬声器部104输出1ch的节目的情况下，用户发音“1ch”。对于其它频道也是同样的。此外，通常，也可以针对每个内容输出装置且针对每个调谐器定义频道。例如，在将内容输出装置设为广播信号接收处理部20的情况下，也可以针对调谐器“BS”、“CS”、“地面数字”的每一个分配频道编号。另外，也可以对内容输出装置的所有频道统一地分配固有的频道编号。在此情况下，能够根据该频道编号来确定内容输出装置的种类、调谐器的种类。

另外，作为“可取的状态值”，也可以具有“回归(home)(返回场所)”这种状态。“回归”是用户能够设定的状态值。

例如，在编号3的例子中，说明将“调谐器”设定为作为控制对象部位的内容输出装置的“回归”状态值的情况。例如，在用户收看内容输出装置“网络”的节目的途中，即内容输出装置的当前状态为“网络”时，用户作为声音指令进行“网络”的发音等，在指令识别部13中识别并生成“网络”作为识别指令。若将识别指令输入到指令生成部11，则指令生成部11生成用于将状态向作为“回归”的“调谐器”进行切换的执行指令“调谐器”并发送，将内容输出装置切换到“调谐器”。

例如，在编号4的例子中，说明将“地面数字”设定为作为控制对象部位的调谐器的“回归”状态值的情况。例如，在用户收看“BS”的调谐器的途中，即调谐器的当前状态为“BS” 时，用户作为声音指令进行“BS”发音等，在指令识别部13中识别并生成“BS”作为识别指令。若将识别指令输入到指令生成部11，则指令生成部11生成用于将状态向作为“回归”的“地面数字”进行切换的执行指令“地面数字”并发送，将调谐器切换到“地面数字”。

在编号5的例子中，说明将“1ch”设定为作为控制对象部位的频道的“回归”状态值的情况。例如，在用户收看“2ch”的频道的途中，即频道的当前状态为“2ch”时，用户作为声音指令进行“2ch”的发音等，在指令识别部13中识别并生成“2ch”作为识别指令。若将识别指令输入到指令生成部11，则指令生成部11生成用于将状态向作为“回归”的“1ch”进行切换的执行指令“1ch”并发送，将频道切换到“1ch”。

此外，上述的对“回归”状态值的设定既可以由用户设定，也可以自动设定为前次使电视机装置的电源成为关之前的状态值。另外，作为声音指令，也可以有“回归”。例如，也可以是，若用户将声音指令发音为“回归”，且作为识别指令生成“回归”，则状态转移到被设定为“回归”的状态值。

图5是示出在该实施方式中能够利用的辅助信息的一个例子的图。

从左侧的列起示出“编号”、“信息源”、“辅助信息”、“信息值”。“信息源”是“辅助信息”的发送源或者“辅助信息”的提取源(进行了提取的部位)。“辅助信息”是在本实施方式中指令控制部1制作执行指令的情况下利用的信息。“信息值”是“辅助信息”的值。

“编号”＝1表示作为“信息源”的接收装置10的时刻管理部93在辅助信息中包含时刻。

“编号”＝2表示根据声波纹来确定声音的发送源的属性，并在辅助信息中包含声音的发送源的属性，其中，通过作为“信息源”的接收装置10的声音分析部121实施声音分析而得到该声波纹。声音的发送源的属性例如是发送源的年龄、按年龄定义的大人儿童的分类、以及按年龄定义的婴儿、幼儿园儿童、小学生、中学生、高中生、大学生、社会人等分类即用户识别信息。

“编号”＝3表示根据声音识别结果来确定用户识别信息，并在辅助信息中包含用户识别信息的属性，其中，通过作为“信息源”的接收装置10的指令识别部13实施声音识别而得到该声音识别结果。

“编号”＝4、5、6分别表示根据声音的强度、声音的高度、声音的速度，来分别提供声音的强度的强弱、声音的高度的高低、声音的速度的快慢作为辅助信息，其中，通过作为“信息源”的接收装置10的声音分析部121实施声音分析而分别得到上述的声音的强度、声音的高度、声音的速度。

“编号”＝7表示作为“信息源”的接收装置10的传感器部70(例如照相机)根据用照相机获取到的图像识别结果来确定用户识别信息，在辅助信息中包含用户识别信息的属性。

“编号”＝8至11分别表示在辅助信息中包含作为“信息源”的接收装置10的广播信号接收处理部20从广播信号中提取出的“广播运营商”、“节目广播时间段”、“节目种类”、“节目名”。在“广播运营商”的情况下，例如将运营商A、运营商B、运营商C等运营商的名称作为辅助信息的值。在“节目广播时间段”的情况下，将广播时间段作为辅助信息的值。在“节目种类”的情况下，例如将戏剧、体育、音乐、新闻、教育、紧急信息等节目的种类作为辅助信息的值。在“节目名”的情况下，例如将节目A、节目B、节目C等节目的名称作为辅助信息的值。

“编号”＝12，在辅助信息中包含从作为“信息源”的收看解析装置300提供的解析结果取得的人口统计。

“编号”＝13至16分别表示在辅助信息中包含作为“信息源”的接收装置10的录像播放部40(可以还包含外置的录像机等)录像了节目时从广播波中提取出的“广播运营商”、“节目广播时间段”、“节目种类”、“节目名”。

“编号”＝17至20分别表示在辅助信息中包含从作为“信息源”的接收装置10的内容服务器装置200发送的内容中附带的信息中提取出的“发布运营商”、“节目广播时间段”、“节目种类”、“节目名”。另外，可以在辅助信息中包含录像了数字内容的用户(特别地称为录像管理者)。

(第1实施方式)

在本实施方式中，示出基于用户发出的声音指令和追加信息来控制接收装置的主电源的开-关的情况下的动作例。

图6是示出在该实施方式中用于指令控制部接收声音指令并发送执行指令的处理动作例的流程图。

用户为了控制接收装置10的主电源的开-关，而发出了声音指令“开电源”或者“关电源”。声音检测部检测声音(步骤S11中的是)。在声音检测部未检测到声音的情况下，等待到检测到声音(步骤S11的否)。声音检测部是检测到声音或未检测到的判断例如也可以是：对输入的声音的强度设定阈值，如果为阈值以上，则判断为检测到声音，如果小于阈值，则判断为未检测到声音。

声音检测部12将接收到的声音的声音数据输出到声音分析部121，声音分析部121对接收到的声音数据进行声音分析处理(步骤S12)。具体而言，声音分析部121对声音数据进行频率分析(声波纹分析)，推测声音的发送源的属性。

若声音分析部121将推测结果输出到控制部19，则控制部19根据推测结果来判断是否生成识别指令(步骤S13)。关于识别指令的生成可否的判断规则，也可以是用户从用户接口部14例如设定在存储部111中。控制部19访问存储部111来参照识别指令的生成的判断规则。控制部19在判断为实施识别指令的生成的情况下，使指令识别部13执行针对声音数据的声音识别(步骤S13中的是)。控制部19在判断为不实施识别指令的生成的情况下，进行控制，以使得使指令识别部13不进行针对声音数据的声音识别，将指令识别部13设置为等待状态直至检测下次的声音为止(步骤S13的否、S11)。也可以是，控制部19在判断为不实施识别指令的生成的情况下，例如使显示部103、扬声器部104输出“未进行识别指令的生成”等消息，通知用户。

若从控制部19对指令识别部13命令了识别指令的生成，则指令识别部13通过声音识别来取得作为文本数据的识别指令。指令识别部13将识别指令输出到指令生成部11(步骤S14)。在步骤S14中，也可以设置为：指令识别部13首先尝试用指令识别部13内具备的声音识别引擎来获取识别指令，在声音识别失败而未能获取到的情况下，利用声音识别的识别率更高的外部的声音识别装置400来获取识别指令。

指令生成部11若从指令识别部13接收到识别指令，则参照存储部111的条件组合表。

图7是示出在该实施方式中为了控制主电源而在指令控制部中设定的执行指令生成条件(组合条件表)的一个例子的图。

对于组合条件表的例子，从左侧的列起示出“编号”、“执行指令”、“识别指令”、“状态信息”、“辅助信息”。示出了以按各行中每一个记载的“识别指令”、“状态信息”、以及“辅助信息”作为条件，确定同一行中记载的“执行指令”。“识别指令”是指令识别部13生成并输出的识别指令。组合条件表例如也可以由用户从用户接口部14设定在存储部111中。图7所示的组合条件表是一个例子，还能够进一步追加辅助信息的数量(列的数量)。

返回到图6，说明指令控制部1的处理动作。若从指令识别部13向指令生成部11输入了例如“开电源”作为“识别指令”，则指令生成部11参照组合条件表，分别向辅助信息获取部16和状态信息获取部17命令获取作为表的列项目的“辅助信息”、“状态信息”。辅助信息获取部16向辅助信息管理部91请求并获取作为组合条件表的辅助信息的项目的“时刻”、“声音的强度”、“用户识别信息”，并输出到指令生成部11(步骤S15)。状态信息获取部17根据“识别指令”为“开电源”的情况而掌握控制对象为主电源80的情况，针对状态信息管理部92获取主电源80的状态信息，并输出到指令生成部11(步骤S16)。

指令生成部11参照组合条件表，查找获取到的辅助信息、状态信息、以及识别指令与组合条件表的条件的组合一致的行。在条件的组合一致的行中“执行指令”的项目中存在指令的情况下，将“执行指令”的项目中记载的指令作为执行指令来生成，并向指令发送部18输出(步骤S17、S18中的是，S19)。另一方面，例如，在如图7的编号8那样，条件的组合一致的“执行指令”的项目为“不发送”的情况下，不生成执行指令，指令控制部1等待下次检测到声音(步骤S17、S18的否)。在执行指令为“不发送”的情况下，指令控制部1也可以将包含“执行指令未发送或未生成”这种意思的消息发送到控制部90。接收到消息的控制部90也可以在显示部103显示消息、或者从扬声器部104输出包含消息内容的声音，以通知用户。

另外，在条件的组合一致的“执行指令”的项目为“不发送”的情况下，指令控制部1也可以生成并发送“用于维持当前状态的执行指令”。例如，也可以是，在由声音分析部121对声音指令进行声波纹分析的结果是，作为用户识别信息将声音的发送源为“儿童”的辅助信息输入到指令生成部11的情况下，不使用识别指令，而仅用辅助信息来生成“用于维持当前状态的执行指令”并发送。在此情况下，指令生成部11也可以将包含“无法进行该操作”等这种意思的消息发送到控制部90。此时，接收到消息的控制部90也可以在显示部103显示消息、或者从扬声器部104输出包含消息内容的声音，以通知用户。

如果输入执行指令，则指令发送部18经由接口部15将执行指令发送到控制部90(步骤S101)。控制部90按照接收到的执行指令来对控制对象的功能进行控制。

也可以是，指令控制部1在生成或者发送了执行指令的情况下，将包含“发送了执行指令”这种内容的消息发送到控制部90。另外，也可以是，指令控制部1在识别指令与生成的执行指令不同的情况下，将包含“执行指令与识别指令不同”这一内容的消息发送到控制部90。也可以是，在指令控制部1中，使显示部103显示消息、或者从扬声器部104输出包含消息内容的声音，以通知用户。通过如上设置，用户能够确认自己发出的声音指令是否被正确地执行。

再次使用图7来说明组合条件表的细节。

在“编号”＝1的情况下，辅助信息均为“－”，这表示不使用辅助信息，是指令生成部11仅用状态信息和识别指令来生成执行指令的例子。在“编号”＝1的例子中，在“识别指令”为“开电源”、“状态信息”为“开”时，执行指令为“关电源”。对于“编号”＝2至4也是同样的，因此省略说明。

在“编号”＝5的情况下，为如下例子：在“识别指令”为“开电源”、“状态信息”为“开”、第1个“辅助信息”即“时刻”为“昼”、第2个“辅助信息”即“声音的强度”为“强”时，执行指令为“不发送(或者不生成)”。在此，作为“辅助信息”的“时刻”的值设为“昼”，但是，例如也可以是，辅助信息获取部16具有时刻与时刻分类值(朝、昼、夜)的对应关系，辅助信息获取部16根据获取到的“时刻”来判定对应的时刻分类值，并将时刻分类值(在编号＝5的情况下，昼)输出到指令生成部11。对于第2个“辅助信息”即“声音的强度”也是同样的。例如也可以是，辅助信息获取部16具有从声音分析部121输入的“声音的强度”与强度分类(强、弱)的对应关系，辅助信息获取部16根据接收到的“声音的强度”来判定对应的强度分类值，并将强度分类值(在编号＝5的情况下，强)输出到指令生成部11。对于“编号”＝6至12也是同样的，因此省略说明。如“编号”＝5至12那样，通过将“时刻”和“声音的强度”利用为辅助信息，从而能够将因在“昼”的时间段中周围的噪音变大导致声音识别引擎的精度会劣化而识别指令与用户的声音指令不同这种状况考虑在内地，生成执行指令。

在“编号”＝13的情况下，是如下的例子：在“识别指令”为“开电源”、“状态信息”为“开”、第1个“辅助信息”即“时刻”为“夜”、第2个“辅助信息”即“用户识别信息”为“大人”时，执行指令为“关电源”。与“编号”＝5同样地，例如也可以是，在声音分析部121将通过声波纹分析取得的声音指令的发送源的年龄输入到辅助信息获取部16的情况下，按照年龄与年龄分类值(大人、儿童)的对应关系，根据辅助信息获取部16接收到的“年龄”来判定对应的年龄分类值，并将年龄分类值(在编号＝13的情况下，大人)输出到指令生成部11。对于“编号”＝14至20也是同样的，因此省略说明。如“编号”＝13至20那样，通过利用“时刻”和“用户识别信息”作为辅助信息，从而在“夜”的时间段中因为周围的噪音较小而声音识别引擎的精度不会劣化，但是，能够在“夜”里用户想要限制执行指令的生成、发送这种场合下利用。

以上，按照图6的流程图的顺序，能够使用图7的条件组合表来生成执行指令。

在适用了图7中的条件组合表的“编号”＝1的条件的情况下，主电源的当前状态(相当于“状态信息”)为“开”。通常认为，在这样的状况下，用户发出“开电源”这种声音指令的可能性较小，反而，发出与当前状态“开”相反的“关电源”的声音指令的可能性更高。但是，若因周围的噪音等导致“关电源”的声音指令由指令识别部13的声音识别引擎识别为“开电源”，则会发生尽管用户发音了“关电源”却无法将接收装置10的主电源设为关的事态，用户的压力变大。但是，根据本实施方式，在指令控制部1中，通过使用条件组合表的“编号”＝1的条件，基于接收装置10的状态信息来解释识别指令，从而能够防止这样的事态。同样，在指令控制部1中适用了条件组合表的“编号”＝2至4的情况下，在识别指令为切换主电源的当前状态(“状态信息”)这样的控制命令的情况下，使识别指令与执行指令的控制命令一致。相反，在识别指令为与“状态信息”相同状态的控制命令的情况下，执行指令的控制命令成为与识别指令相反的或者不同的控制命令。这样使其动作的原因在于，声音识别引擎尤其有较高可能性弄错开和关的声音的识别。在本实施方式中，考虑到用户为了使控制对象的当前状态与控制后的状态成为相同而发出声音指令的情况几乎不会存在这一点，使得能够辅助通过声音识别进行的对声音指令的解释。

在本实施方式中的图7的条件组合表中，在编号1至编号20中示出了用于确定执行指令的条件组合，但是，还能够对它们赋予优先权，使指令生成部11考虑优先权地参照条件组合表。也可以如图7那样按照编号1至编号20的行顺序来给予优先权。在此情况下，指令生成部11即使获取到了辅助信息，也因为编号1至编号4具有优先权，所以不使用辅助信息。另外，也可以设置为：在图7的表中另行追加示出优先顺序的列项目，使得用户能够在各行的条件组合中设定优先权。

另外，在“辅助信息”存在多个的情况下，也可以在“辅助信息”内给予优先权。例如，在图7的组合条件表中，对于辅助信息，例如按照“时刻”、“声音的强度”、“用户识别信息”的顺序赋予较高的优先权。在此情况下，指令生成部11例如在组合条件表中从放入有优先权较高的辅助信息的条件组合起进行参照。具体而言，用户也可以如下这样设定：辅助信息对仅有“时刻”的条件组合给予最高的优先权，接下来，对仅有“时刻”和“声音的强度”的条件组合给予优先权，接下来，对仅有“时刻”和“用户识别信息”的条件组合给予优先权。

另外，也可以是，通过用户对“时刻”、“声音的强度”、“用户识别信息”设定表示优先度的分数，从而使指令生成部11计算对“时刻”、“声音的强度”、“用户识别信息”赋予的分数的总和，从分数的总和的较高者起另行进行优先顺序设置为高等从而对各组合条件表给予优先权。在此情况下，指令生成部11能够计算优先顺序，因此，用户只要对“时刻”、“声音的强度”、“用户识别信息”设定表示优先度的分数即可。

另外，希望将组合条件表所示的条件组合设定为基本上没有成为相同条件的组合。在存在成为相同条件的组合的情况下，也可以预先确定使指令生成部11按表顺序进行选择等规则。

(第2实施方式)

在本实施方式中，示出利用用户发出的声音指令、状态信息、以及作为辅助信息的节目种类和用户识别信息，对接收装置10的扬声器部104输出的音量的开-关进行控制的情况下的指令控制部1的动作例。此外，在本实施方式中，设置为主电源为开的状态。

图8是示出在第2实施方式中为了控制音量而在指令控制部中设定的执行指令生成条件的一个例子的图。此外，使用图6来说明用于本实施方式中的指令控制部1接收声音指令并发送执行指令的处理动作的例子，但是，对于与第1实施方式同样的部分省略说明。

用户为了控制接收装置10的扬声器部104的音量输出的开-关，而发出了声音指令“开音量”或者“关音量”。声音检测部检测声音(步骤S11中的是)。声音分析处理的结果，控制部19判断为生成识别指令，使指令识别部13执行针对声音数据的声音识别(步骤S13中的是)。指令识别部13通过声音识别取得作为文本数据的识别指令，将识别指令输出到指令生成部11(步骤S14)。

指令生成部11若从指令识别部13接收到识别指令，则参照存储部111的条件组合表。若从指令识别部13输入了“开音量”作为“识别指令”，则指令生成部11参照组合条件表，命令辅助信息获取部16和状态信息获取部17分别获取作为表的列项目的“辅助信息”、“状态信息”。辅助信息获取部16向辅助信息管理部91请求并获取组合条件表中的作为辅助信息的项目的“节目种类”、“用户识别信息”，并输出到指令生成部11(步骤S15)。状态信息获取部17根据“识别指令”为“开音量”的情况而掌握控制对象为主电源80的情况，从状态信息管理部92获取扬声器部104的状态信息，并输出到指令生成部11(步骤S16)。

指令生成部11参照组合条件表，在获取到的辅助信息、状态信息、以及识别指令的组合一致的行的“执行指令”的项目中存在指令的情况下，将“执行指令”的项目中记载的指令作为执行指令来生成，并向指令发送部18输出(步骤S17、S18中的是，S19)。另一方面，在“执行指令”的项目为“不发送”的情况下，不进行执行指令的生成，指令控制部1等待检测下次的声音(步骤S17、S18的否)。若输入执行指令，则指令发送部18将执行指令从接口部15发送到控制部90(步骤S101)。

使用图8来说明组合条件表的细节。

在“编号”＝1的情况下，由于“状态信息”为“开”，所以表示当前“音量”为输出状态。“编号”＝1的条件组合是如下例子：“识别指令”为“开音量”，第1个“辅助信息”即“节目种类”为“紧急信息”，第2个“辅助信息”即“用户识别信息”为“－”(无条件)时，指令生成部11生成“不发送(或者不生成)”作为执行指令。关于“编号”＝2至4，也是同样的，因此省略说明。如“编号”＝1至4那样，作为辅助信息，利用“节目种类”，在“节目种类”为“紧急信息”的情况下，能够考虑在所有的状况下想要使音量成为开(ON)这种请求。例如，在广播信号接收处理部20接收广播信号中发生了地震等的情况下，在偶尔已将音量设为了关时，用户为了使音量成为开而敏捷地输出“开音量”的声音指令。但是，设想在地震等紧急时周围的噪音变大，用户发出的声音指令被错误地识别的可能性较高。在这样的情况下，作为辅助信息获取部16获取到的辅助信息的“节目种类”，若获取了“紧急信息”，则指令生成部11与接收到的“识别指令”、控制对象的“状态信息”无关地，始终使音量成为开。

“编号”＝5至12是使用“用户识别信息”作为辅助信息的例子。例如，在昼间的时间段等中想要避免儿童用接收装置10收看数字内容这种情况下，能够利用“编号”＝5至12那样的条件组合。

以上，如本实施方式这样，用户通过设定组合条件表，从而设想各种各样的用例，能够对声音指令进行指令控制。

(第3实施方式)

在本实施方式中，示出接收装置10利用用户发出的声音指令、状态信息、以及作为辅助信息的用户识别信息和时刻，对向显示部103、扬声器部104输出的数字内容进行控制的情况下的指令控制部1的动作例。此外，在本实施方式中，设想了主电源为开的状态。另外，在本实施方式中，示出对于1个声音指令，输出2个执行指令的例子。

图9是示出在第3实施方式中为了控制数字内容接收而在指令控制部中设定的执行指令生成条件的一个例子的图。

此外，使用图6的流程图说明本实施方式中的用于指令控制部1接收声音指令并发送执行指令的处理动作例，但是，对于与第1实施方式同样的部分省略说明。

假设用户为了控制数字内容向接收装置10的显示部103、扬声器部104的输出，而发出了声音指令“网络”、“调谐器”或者“录像机”的任意一个。声音检测部检测声音(步骤S11中的是)。经过步骤S12、S13，指令识别部13通过声音识别而取得作为文本数据的识别指令，并将识别指令输出到指令生成部11(步骤S14)。

若从指令识别部13输入“识别指令”，则指令生成部11参照存储部111的条件组合表，命令辅助信息获取部16和状态信息获取部17分别获取作为表的列项目的“辅助信息”、“状态信息”。辅助信息获取部16向辅助信息管理部91请求并获取作为组合条件表的辅助信息的项目的“用户识别信息”、“时刻”，并输出到指令生成部11(步骤S15)。状态信息获取部17根据“识别指令”来掌握控制对象为内容输出装置的情况，从状态信息管理部92获取扬声器部104的状态信息，并输出到指令生成部11(步骤S16)。

指令生成部11经过步骤17至S19而生成执行指令，并向指令发送部18输出。从指令发送部18将执行指令发送到控制部90(步骤S101)。在本实施方式中，生成2个执行指令。是针对内容输出装置的第1执行指令和针对节目种类的第2执行指令。

使用图9来说明组合条件表的细节。

在“编号”＝1的情况下，由于内容输出装置的“状态信息”为“调谐器”，所以表示当前“调谐器”正在向显示部103、扬声器部104进行输出。“编号”＝1的条件组合是如下例子：在指令生成部11接收到的识别指令为“网络”、第1个辅助信息即用户识别信息为“大人”时，指令生成部11生成用于从作为内容输出装置之一的“网络”向显示部103、扬声器部104进行输出的执行指令。关于“编号”＝2、3也是同样的，因此省略说明。

在“编号”＝4的情况下，由于内容输出装置的“状态信息”为“调谐器”，所以表示当前“调谐器”正在向显示部103、扬声器部104进行输出。“编号”＝4的条件组合是如下例子：在指令生成部11接收到的识别指令为“网络”、第1个辅助信息即用户识别信息为“儿童”、第2个辅助信息即时刻为“昼”时，指令生成部11为了不从作为内容输出装置之一的“网络”向显示部103、扬声器部104进行输出，而不生成或者发送执行指令。“编号”＝4的状况例如能够利用于如下场合：在昼间的时间段等中想要避免儿童用接收装置10收看来自“网络”的数字内容。

另外，在“编号”＝9的情况下，由于内容输出装置的“状态信息”为“录像机”，所以表示当前“录像机”正在向显示部103、扬声器部104进行输出。“编号”＝9的条件组合中，在指令生成部11接收到的识别指令为“网络”、第1个辅助信息即用户识别信息为“儿童”、第2个辅助信息即时刻为“夜”时，指令生成部11生成“网络”和作为针对节目种类的执行指令的“教育”这2个，作为执行指令。将生成的2个执行指令从指令发送部18发送到控制部90，使由“网络”进行发布服务的关于“教育”的节目向显示部103、扬声器部104输出。“编号”＝9的状况例如能够利用于如下场合：在夜间的时间段中儿童想要用接收装置10观看“网络”的情况下，想要设置为收看节目种类为“教育”的数字内容。

另外，例如，假设在用户收看BS中，即，控制对象部位“调谐器”的状态信息为“BS”时，用户进行了“BS”的发音等作为声音指令，指令识别部13生成“BS”作为识别指令，并输出到指令生成部11。若输入识别指令，则指令生成部11生成并发送向控制对象部位“调谐器”的“回归”中设定的状态值(假设是“地面数字”)切换的执行指令“地面数字”。控制部90接收执行指令“地面数字”，并将调谐器切换到“地面数字”。此时，也可以设置为：对于向显示部103、扬声器104输出的频道(节目)，选择作为控制对象部位的“频道(节目)”中设定的“回归”的状态值。即，在该例子的情况下，指令生成部11对于用户发出的1个针对控制对象部位的声音指令(或者识别该声音指令而取得的识别指令)，针对“调谐器”和“频道(节目)”这些多个控制对象部位生成执行指令。对“频道(节目)”设定的“回归”例如既可以设为在前次使电视机装置的电源成为关之前正在收看的频道，也可以设为用户预先设定的频道。另外，也可以不区分针对不同的控制对象部位的执行指令，而设为1个执行指令。

以上，如本实施方式这样，用户通过设定组合条件表，从而能够从1个声音指令生成多个执行指令并发送和执行。

(第4实施方式)

在本实施方式中，示出将指令控制部1作为一个独立的装置来利用的情况下的系统的例子。

图10是示出第3实施方式的系统整体的构成例的图。

在网络500上连接有指令控制装置2、以及IoT设备600A、IoT设备600B。IoT设备600A和IoT设备600B具备同样的功能，在不特别区别两者的情况下，将IoT设备600A和IoT设备600B称为IoT设备600。IoT设备600在图10中仅示出了2个，但可以设置有多个。

指令控制装置2例如被构筑在具有CPU、存储器等的计算机中。指令控制装置2既可以是个人计算机，也可以是包含服务器、数据库等的云服务。指令控制装置2包含指令控制部1和通信部102A。指令控制部1、通信部102A分别相当于图3中的指令识别部1、通信部102的功能。

IoT设备600是所有种类的IoT设备，与网络500连接，与网络500上的装置实施数据通信。IoT设备600例如既可以是温度检测传感器、漏水检测传感器、门开闭传感器等传感器类，也可以是使用了这些传感器的检测装置。另外，IoT设备600也可以是空调、电视机装置、照明、照相机等家电。另外，如果与网络500连接，则也可以是智能手机那样的移动终端。本实施方式中的IoT设备600对指令控制装置2提供辅助信息和状态信息，接收指令控制装置2输出的执行指令，并根据接收到的执行指令来控制IoT设备600的功能。

具体而言，IoT设备600包含辅助信息输出部21A、状态切换部22A、控制部90A、辅助信息管理部91A、状态信息管理部92A、通信部102A、接口部105A。各自的功能相当于图2中的辅助信息输出部21、状态切换部82、控制部90、辅助信息管理部91、状态信息管理部92、通信部102、接口部105的功能。

即，也可以说将图2的各功能分配给指令控制装置2和IoT设备600A。第1实施方式中示出的接收装置10与本实施方式中示出的IoT设备600的较大差异在于，在接收装置10中在内部具备指令控制部1，但是，在IoT设备600中不具备指令控制部1。在本实施方式中，指令控制部1被配备于指令控制装置2，IoT设备600经由网络500从指令控制装置2接收执行指令。

指令控制装置2能够控制的IoT设备600的控制对象部位例如既可以是第1至第3实施方式中示出的电源(开-关)，此外，还可以是其他的对功能部位的起动和停止进行控制。

指令控制装置2对IoT设备600发送执行指令的顺序能够利用图6的流程图。对于与第1实施方式、第2实施方式同样的顺序省略详细说明。

用户在指令控制装置2的附近，经由网络500对IoT设备600A远程地进行控制。用户对指令控制装置2的指令控制部1设定针对IoT设备600A的执行指令生成条件(组合条件表)。

用户为了控制IoT设备600A的功能，而对指令控制装置2的声音检测部12发出了声音指令。声音检测部12检测声音，经过由声音分析部121进行的声音分析处理，指令识别部13生成识别指令，并将识别指令输出到指令生成部11(步骤S11中的是、S12、S13中的是、S14)。

若从指令识别部13输入识别指令，则指令生成部11参照组合条件表，命令辅助信息获取部16和状态信息获取部17分别获取作为表的列项目的“辅助信息”、“状态信息”。辅助信息获取部16向辅助信息管理部91A请求并获取组合条件表的辅助信息的各个项目，并输出到指令生成部11(步骤S15)。详细说明本实施方式中的步骤S15。

辅助信息获取部16经由通信部102A向IoT设备600A请求辅助信息。在IoT设备600A中，控制部90A经由通信部102A2接收辅助信息的请求。控制部90A从辅助信息管理部91A获取辅助信息，并将获取到的辅助信息经由通信部102A2发送到指令控制装置2。

状态信息获取部17根据识别指令掌握控制对象，经由通信部102A向IoT设备600A请求控制对象的状态信息。在IoT设备600A中，控制部90A经由通信部102A2接收状态信息的请求。控制部90A从状态信息管理部92A获取状态信息，并将获取到的状态信息经由通信部102A2发送到指令控制装置2。在指令控制装置2中，指令生成部11经由通信部102A接收状态信息(步骤S16)。

指令生成部11参照组合条件表，在与获取到的辅助信息、状态信息以及识别指令的组合一致的条件的“执行指令”的项目中存在指令的情况下，生成“执行指令”的项目中记载的指令作为执行指令，并向指令发送部18输出(步骤S17、S18中的是，S19)。另一方面，在“执行指令”的项目为“不发送”的情况下，不进行执行指令的生成，指令控制部1等待下一次的声音的检测(步骤S17、S18中的否)。在此情况下，也可以是，指令控制部1对于包含“不发送指令”等“未发送执行指令或未生成”这种意思的消息，使消息在指令控制装置2的未图示的显示部上显示，或者使包含消息内容的声音从指令控制装置2的未图示的扬声器部输出，从而通知用户。

指令发送部18将输入的执行指令经由通信部102A发送到IoT设备600A(步骤S101)。在IoT设备600A中，按照接收到的执行指令来对控制的功能进行控制。也可以是，指令控制部1在生成或者发送了执行指令的情况下，对于包含“发送了执行指令”这种意思的消息，使消息在指令控制装置2的未图示的显示部上显示，或者使包含消息内容的声音从指令控制装置2的未图示的扬声器部输出，从而通知用户。另外，也可以是，指令控制装置2在识别指令与生成的执行指令不同的情况下，对于包含“执行指令与识别指令不同”这种内容的消息，使消息在指令控制装置2的未图示的显示部上显示，或者使包含消息内容的声音从指令控制装置2的未图示的扬声器部输出，从而通知用户。通过如上设置，用户能够确认自己发出的声音指令的意图是否被准确地执行。

用户若按照以上的顺序对连接于网络500的指令控制装置2发出了声音指令，则能够利用执行指令来控制连接于网络500的IoT设备600。

根据以上所述的至少1个实施方式，能够提供辅助针对声音指令的声音识别的指令生成装置、生成方法及生成程序。

在以上的实施方式中，示出了在作为控制对象装置的接收装置10、IoT设备600上设置控制部90(包含辅助信息管理部91、状态信息管理部92)的功能的例子，但是，也可以将控制部90的功能的全部或一部分设置为控制对象的外部的控制装置等。在此情况下，控制装置也连接于网络500。对于指令控制装置也同样，关于装置内的功能和执行该功能的硬件可以想到各种构成、组合，并不限定于以上示出的实施方式的例子。

(变形例)

在本变形例中，例如示出如下例子：通过使用图5的“用户识别信息”、“时间段”作为辅助信息，从而使得儿童的收看限制、操作限制等家长控制(Parental Control)成为可能。设置成操作电视机装置的遥控器等由大人管理。

具体而言，在儿童发出了声音指令的情况下，利用声音分析部121进行声波纹分析，在辅助信息获取部16中获取“儿童”作为用户识别信息，并输入到指令生成部11。同时，将该声音指令输入到指令识别部13，生成了识别指令，并输入到指令生成部11。指令生成部11例如基于识别指令“关电源”、辅助信息“儿童”来生成“关电源”作为执行指令，并输出到控制部90。另一方面，指令生成部11从辅助信息获取部16获取了“儿童”作为用户识别信息，并获取了“深夜”作为时间段。在此情况下，也可以是，指令生成部11仅根据“儿童”和“深夜”这种辅助信息，例如生成“用于维持当前状态的执行指令”。

虽然图5中未图示，但是，也可以通过将“节目收看对象”等也一并用作辅助信息，从而能够进行家长控制。例如，指令识别部13根据儿童发出的声音指令来识别出控制对象部位为“频道(节目)”。若指令识别部13将包含识别出的控制对象部位在内的识别信息输出到辅助信息获取部16，则辅助信息获取部16从广播信号接收处理部20等获取识别信息中包含的针对控制对象部位“频道(节目)”的辅助信息即“节目收看对象”，并输出到指令生成部11。指令生成部11基于从声音分析部121取得的用户识别信息即“儿童”和“节目收看对象”这2个辅助信息来生成执行指令。例如，在节目收看对象中包含“儿童”的情况下，将识别指令直接生成为执行指令。另外，在节目收看对象中不包含“儿童”的情况下，例如生成“用于维持当前状态的执行指令”。

以上，根据本变形例，能够进行针对声音指令的家长控制。另外，根据本变形例，在识别指令、状态信息、辅助信息中，能够不使用识别指令而是仅根据基于声音指令获取到的辅助信息来生成执行指令。

根据以上所述的至少1个实施方式、变形例，能够提供辅助针对声音指令的声音识别的指令控制装置、控制方法及控制程序。

上述的本装置还能够如下这样记载。

(A－1)

一种电子装置(指令控制部1或者指令控制装置2)，其具备动作控制机构(指令生成部11)，该动作控制机构根据输入的声音(声音指令)获取动作控制信息(识别指令)，并将控制对象装置(接收装置10)的动作状态设置为第1模式、或与第1模式不同的第2模式中的任一个动作状态，

在所述控制对象装置的动作状态为第1模式、且所述动作控制信息为与所述第1模式下的动作状态相关的信息时，将所述动作状态设置为所述第2模式。

(A－2)

根据(A－1)所述的电子装置，获取与所述控制对象装置的控制对象部位的状态相关的动作状态信息(状态信息)。

(A－3)

根据(A－1)或(A－2)所述的电子装置，获取与所述动作控制信息及所述动作状态信息不同的控制条件信息(辅助信息)。

(A－4)

根据(A－3)所述的电子装置，所述控制条件信息是基于时间段、用户识别信息、用户属性、接收内容信息、广播运营商、发布运营商及录像内容管理者的组中的至少任意一者设定的信息。

(A－5)

一种程序，用于使计算机执行从输入的声音(声音指令)获取动作控制信息(识别指令)、并将控制对象装置(接收装置10)的动作状态设置为第1模式或与第1模式不同的第2模式的任一个动作状态的操作，

说明了本申请的几个实施方式，但是，这些实施方式是作为例子而示出的，并不意图限定申请的范围。这些新的实施方式能够以其它的各种各样的形态来实施，在不脱离申请的主旨的范围内，能够进行各种省略、替换、变更。这些实施方式、其变形包含在申请的范围、主旨中，并且包含在权利要求书中记载的发明及与其等同的范围中。进一步，另外，在技术方案的各构成要素中，即使在将构成要素分割而表述的情况、或者将多个合并而表述的情况、或者将它们组合而表述的情况下，也属于本申请的范畴。另外，也可以将多个实施方式组合，通过该组合构成的实施例也属于申请的范畴。

另外，附图为了使得说明更清楚，而有的情况下，与实际的形态相比，对于各部的宽度、厚度、形状等示意性表示。在框图中，对于未连线的模块间或者即使连线而未示出箭头的方向，有的情况下也进行数据、信号的交互。框图中所示的各功能、流程图、序列图所示的处理也可以通过硬件(IC芯片等)或者软件(程序等)或者硬件和软件的组合来实现。另外，在将技术方案表述为控制逻辑的情况、表述为包含使计算机执行的指令在内的程序的情况、以及表述为记载有上述指令的计算机可读取的存储介质的情况下，也是应用了本申请的装置的技术方案。另外，对于使用的名称、用语，没有限定，即使是其它表述，只要实质上是相同内容、相同主旨，则也包含在本申请中。

Claims

一种指令控制装置，基于输入的声音来生成包含针对控制对象的控制命令在内的执行指令，

所述指令控制装置，生成包含第1控制命令和与所述第1控制命令不同的第2控制命令中的任一者在内的执行指令，其中，所述第1控制命令是对所述声音进行声音识别而获取的识别指令中所包含的控制命令。
根据权利要求1所述的指令控制装置，其中，

所述指令控制装置，基于所述识别指令和追加信息来生成所述执行指令。
根据权利要求2所述的指令控制装置，其中，

所述指令控制装置，基于所述识别指令和所述追加信息来确定是否生成所述执行指令。
根据权利要求2所述的指令控制装置，其中，

所述指令控制装置，基于所述识别指令和所述追加信息来确定是否发送所述执行指令。
根据权利要求2至4中任一项所述的指令控制装置，其中，

所述追加信息包含状态信息，所述状态信息是由所述执行指令控制的所述控制对象的控制状态。
根据权利要求2至4中任一项所述的指令控制装置，其中，

所述追加信息包含辅助信息，所述辅助信息并非所述控制对象的控制状态。
根据权利要求2至4中任一项所述的指令控制装置，其中，

所述追加信息包含状态信息和辅助信息，所述状态信息是由所述执行指令控制的所述控制对象的控制状态，所述辅助信息并非所述控制对象的控制状态。
根据权利要求2所述的指令控制装置，其中，

所述指令控制装置具备：

声音识别部，其识别所述声音，获取所述识别指令；

追加信息获取机构，其获取所述追加信息；

存储机构，其存储所述识别指令、所述追加信息、以及所述执行指令的对应关系；以及

执行指令生成机构，其根据所述对应关系生成所述执行指令。
一种指令控制方法，基于输入的声音来生成包含针对控制对象设备的控制命令在内的执行指令，

生成包含第1控制命令和与所述第1控制命令不同的第2控制命令中的任一者在内的执行指令，其中，所述第1控制命令是对所述声音进行识别而获取的识别指令中所包含的控制命令。
一种非易失性存储介质，其存储有控制程序，所述控制程序使计算机基于输入的声音而生成包含针对控制对象设备的控制命令在内的执行指令，其中，

生成包含第1控制命令和与所述第1控制命令不同的第2控制命令中的任一者在内的执行指令，其中，所述第1控制命令是对所述声音进行识别而获取的识别指令所包含的控制命令。