CN111327780A

CN111327780A - 图像处理系统、图像形成装置、判定方法以及程序

Info

Publication number: CN111327780A
Application number: CN201911279651.8A
Authority: CN
Inventors: 斋藤秀太
Original assignee: Konica Minolta Inc
Current assignee: Konica Minolta Inc
Priority date: 2018-12-17
Filing date: 2019-12-13
Publication date: 2020-06-23
Also published as: JP7230482B2; US20200193991A1; JP2020098229A; EP3671350A1

Abstract

本发明涉及图像处理系统、图像形成装置、声音输入禁止判定方法以及程序。防止在操作者的周围的他人的说话等被误识别为语音命令，基于该误识别而执行操作者意外的处理。本发明的一侧面的图像处理系统(100)具备：操作输入部，被输入操作者进行的手动操作；语音输入部(2)，被输入语音，将输入的语音转换成语音数据并输出；语音识别部(300)，输出对从语音输入部(2)输入的语音数据进行语音识别处理而得到的识别结果；控制部，执行与从语音识别部(300)输入的识别结果预先进行了关联的处理；以及语音输入禁止判定部，在判定为是操作者进行的手动操作中的情况下，使被输入至语音输入部(2)的语音无效。

Description

图像处理系统、图像形成装置、判定方法以及程序

技术领域

本发明涉及图像处理系统、图像形成装置、声音输入禁止判定方法以及程序。

背景技术

以往，存在能够对具备复印功能、打印机功能等的复合机(图像形成装置)进行基于语音输入的操作的图像处理系统。

在专利文献1中公开了如下技术：在具有语音识别功能的图像形成装置中，使用户能够对复制模式等功能自由地设定成为语音识别对象词汇的名称，从而使用户通过语音说话来调用功能。此外，在专利文献2中公开了如下技术：在能够通过语音来输入操作指示的装置中，在进行了在语音输入禁止信息列表中注册的语音输入时，将操作模式切换到手动操作，从而防止密码等机密信息泄漏。

现有技术文献

专利文献

专利文献1：日本特开2007-114297号公报

专利文献2：日本特开2007-79852号公报

发明内容

发明要解决的课题

在能够进行基于语音输入的操作的图像处理系统中利用的图像形成装置中，也进行如以往那样的对操作面板的操作输入。也就是说，在这样的系统中，存在基于操作操作面板的手动操作、以及基于向语音输入装置输入语音的语音操作这两种操作系统。

在存在手动操作和语音操作这两种操作系统的状况下，当对操作面板输入操作时，执行基于语音输入的处理是非优选的。然而，例如，在图像形成装置的周围的他人发出语音的情况下，语音输入装置会对该语音作出反应，从而语音输入装置有时会将他人的说话语音误识别为语音命令。在这种情况下，在图像形成装置中会执行与语音输入装置对他人的说话语音进行语音识别而得到的结果相应的处理。根据状况，会发生以操作者意外的设定来执行任务、或者数据被发送至意外的收件地址等问题。在专利文献1、2中，均没有公开用于防止发生这样的状况的技术。

本发明是鉴于这样的状况而提出的。本发明的目的在于，防止当操作者进行手动操作时，基于在周围的他人的说话等而执行操作者意外的处理。

用于解决课题的手段

为了解决上述课题，反映了本发明的一侧面的图像处理系统具备操作输入部、语音输入部、语音识别部、控制部、以及语音输入禁止判定部。操作输入部被输入操作者进行的手动操作。语音输入部被输入语音，将输入的语音转换成语音数据并输出。语音识别部对从语音输入部输入的语音数据进行语音识别处理，输出识别结果。控制部执行与从语音识别部输入的识别结果预先进行了关联的处理。语音输入禁止判定部判定是否是操作者进行的手动操作中，在判定为是手动操作中的情况下，使被输入至语音输入部的语音无效。

发明效果

在本发明中，在操作者进行的手动操作中，使输入语音输入部的语音无效。因此，根据本发明，能够防止基于在操作者的周围的他人的说话等而执行操作者意外的处理。另外，通过以下的实施方式的说明，使除了上述的以外的课题、结构以及效果得以明确。

附图说明

图1是本发明的一实施方式的图像处理系统的概略结构图。

图2是示出本发明的一实施方式的图像形成装置的控制系统的结构例的框图。

图3是示出本发明的一实施方式的语音输入装置的控制系统的结构例的框图。

图4是示出本发明的一实施方式的任务执行关联画面的例子的图。

图5是示出本发明的一实施方式的第二例外命令列表的结构例的图。

图6是示出本发明的一实施方式的用户设定菜单画面的例子的图。

图7是示出本发明的一实施方式的第三例外命令列表的结构例的图。

图8是示出本发明的一实施方式的语音输入禁止判定部进行的语音输入禁止判定处理的流程的流程图。

图9是示出在本发明的一实施方式的语音输入禁止判定部进行的语音输入禁止判定处理中执行的手动操作判定处理的流程的流程图。

标号说明

1…图像形成装置，2…语音输入装置，3…云端，10…操作显示部，11…控制部，12…非易失性存储器，13…RAM，14…HDD，15…自动原稿输送部，16…图像读取部，17…图像处理部，18…打印机部，19…有线通信部，20…无线通信部，21…传真通信部，30…麦克风，31…控制部，32…非易失性存储器，33…RAM，34…有线通信部，35…无线通信部，36…语音输出部，100…图像处理系统，110…语音输入禁止判定部，120…例外命令保存部，300…语音识别部，L1…第一例外命令列表，L2…第二例外命令列表，L3…第三例外命令列表

具体实施方式

以下，参照附图，对用于实施本发明的方式例进行说明。在本说明书以及附图中，对具有实质上相同的功能或结构的构成要素标记相同的标号，并省略对构成要素的重复说明。

<图像处理系统的结构>

首先，参照图1，对本发明的一实施方式的图像处理系统的结构进行说明。图1是本发明的一实施方式的图像处理系统100的概要结构图。

图1所示的图像处理系统100具备图像形成装置1、语音输入装置2(语音输入部的一例)、以及设于云端3上的语音识别部300。图像形成装置1与语音输入装置2经由网络N连接。图像形成装置1与语音识别部300、语音输入装置2与语音识别部300分别经由与网络N连接的未图示的公共线路等连接。

图像形成装置1例如由具有复印功能、打印机功能、扫描仪功能等的MFP(多功能复合一体机(Multi-Functional Peripherals))构成。图像形成装置1基于从未图示的打印机控制器等发送的图像数据，在纸张(记录材料的一例)上进行图像形成，将形成了该图像的纸张作为印刷物而输出。本实施方式的图像形成装置1具有对操作显示部10(参照图2)的手动操作、以及通过向语音输入装置2输入语音而进行的语音操作这两种操作系统。

语音输入装置2具备麦克风30(参照图3)，将该麦克风30所采集的语音、例如由操作者(用户)说出的语音命令等转换成语音数据，并将通过转换而得到的语音数据发送(输出)至云端3上的语音识别部300。

语音识别部300对从语音输入装置2发送(输入)的语音数据进行语音识别处理。此外，语音识别部300生成与通过语音识别处理而得到的识别语音对应的图像形成装置1用的命令(识别结果的一例)，并将该命令发送至图像形成装置1。

另外，在本实施方式中，举出了云端3上的语音识别部300生成与语音数据的识别语音相应的命令的例子，但本发明并不限定于此。也可以设为如下的结构，即，语音识别部300仅将用于表示识别语音的内容的文本(识别结果的一例)发送至图像形成装置1，而与文本相应的命令的生成则在图像形成装置1侧进行。

此外，在本实施方式中，举出了将语音识别部300设于云端3上的例子，但本发明并不限定于此。语音识别部300也可以设于图像形成装置1内，还可以设于未图示的本地服务器(On-premises server)内。

<构成图像处理系统的图像形成装置以及语音输入装置的控制系统的结构>

以下，参照图2和图3，对构成图像处理系统100的图像形成装置1和语音输入装置2的控制系统的结构例进行说明。图2是示出图像形成装置1的控制系统的结构例的框图，图3是示出语音输入装置2的控制系统的结构例的框图。

[图像形成装置的控制系统的结构]

首先，参照图2，对图像形成装置1的控制系统的结构进行说明。如图2所示，图像形成装置1具备操作显示部10、控制部11、非易失性存储器12、RAM(随机存取存储器，RandomAccess Memory)13、以及HDD(硬盘驱动器，Hard Disc Drive)14。此外，图像形成装置1具备自动原稿输送部15、图像读取部16、图像处理部17、打印机部18(图像形成部的一例)、有线通信部19、无线通信部20、以及传真通信部21。

操作显示部10例如由操作面板等构成，该操作面板由LCD(液晶显示器(LiquidCrystal Display))、有机EL(电致发光(Electroluminescence))等构成的显示面板(显示部的一例)、以及触摸传感器等构成的操作输入部一体地形成。在操作显示部10的画面中显示例如与对操作显示部10的手动操作的内容相应的信息、或与通过向语音输入装置2(参照图1)输入语音而进行的语音操作的内容相应的信息。此外，向操作显示部10的操作输入部输入操作者进行的手动操作。然后，操作表示部10生成与由操作者输入的操作的内容相应的操作信号，并将该操作信号供给至控制部11。在操作信号中包含例如在操作显示部10的显示面板上显示中的画面(以下，也称为“活动画面”)的种类以及层级的信息等。

另外，在本实施方式中，举出了操作输入部和显示部作为操作显示部10而一体地形成的例子，但本发明并不限定于此。由显示面板构成的显示部和由键盘、鼠标等构成的操作输入部也可以分别分开地构成。或者，还可以设为如下的结构，即，除了操作输入部以及显示部一体地形成的操作显示部10以外，还具有由键盘、鼠标等构成的操作输入部。

控制部11包含例如CPU(中央处理器(Central Processing Unit))等，并对构成图像形成装置1的各部分的动作进行控制。具体而言，控制部11进行如下的控制，即，使构成图像形成装置1的各部分执行与从云端3上的语音识别部300输入的命令预先进行了关联的、包括图像形成处理等的各种处理。

此外，控制部11具备语音输入禁止判定部110。语音输入禁止判定部110进行语音输入禁止判定处理。具体而言，语音输入禁止判定部110判定是否是操作者进行的手动操作中，在判定为是手动操作中的情况下，使输入语音输入装置2的语音(以下，也称为“语音输入”)无效。从语音输入装置2输入的语音的无效例如能够通过以下的方法来实现。

·不使控制部11执行基于从语音识别部300发送的识别结果(用于表示识别语音的内容的文本、或与文本对应的命令等)的各种控制。

·不使语音识别部300的识别结果从语音识别部300发送至图像形成装置1。

·不使语音识别部300识别从语音输入装置2输入的语音数据。

·不从语音输入装置2对语音识别部300发送语音数据。

语音输入禁止判定部110通过判定进行了语音输入的区间是否是语音输入禁止区间，来进行是否是操作者进行的手动操作中的判定。在判定为进行了语音输入的区间是语音输入禁止区间的情况下，语音输入禁止判定部110判定为是操作者进行的手动操作中。进行了语音输入的区间是否是语音输入禁止区间的判定是基于与活动画面(在操作显示部10上显示中的画面)有关的信息(以下，也称为“活动画面信息”)进行的。活动画面信息例如有在活动画面上显示中的画面的种类的信息、从操作者对活动画面的显示内容向操作显示部10输入的操作的每规定时间的操作次数的信息、在活动画面上显示中的画面的层级的信息等。

具体而言，在活动画面是用于受理与输入至图像处理系统100的任务的执行有关的操作的画面(以下，称为“任务执行关联画面”)的情况下，语音输入禁止判定部110判定为进行了语音输入的区间是语音输入禁止区间。

此外，在从操作者对活动画面上显示的内容向操作显示部10输入的操作的每规定时间的操作量超过预先确定的规定的操作量阈值的情况下，语音输入禁止判定部110判定为进行了语音输入的区间是语音输入禁止区间。进一步地，在活动画面的层级超过预先确定的规定的层级数阈值的情况下，语音输入禁止判定部110判定为进行了语音输入的区间是语音输入禁止区间。

此外，即使在判定为是操作者进行的手动操作中的情况下，当由操作者输入(说出)了第一例外命令时，语音输入禁止判定部110也使语音输入有效。第一例外命令是用于指示基于语音输入的操作的开始(使语音输入有效)的被称为“唤醒词”(wakeup word)的起动命令。作为第一例外命令的唤醒词例如有“使语音输入有效”等语音命令，第一例外命令通过规定第一例外命令的表格即第一例外命令列表L1进行管理。

此外，即使在判定为是操作者进行的手动操作中的情况下，当在活动画面上显示了与第二例外命令关联的画面的状态下输入了第二例外命令时，语音输入禁止判定部110也进行如下的控制，即，使负责进行处理的部分执行对第二例外命令设定的处理。第二例外命令是与活动画面的操作有关的命令，按在操作显示部10上显示的画面的每个种类而设定。第二例外命令通过规定第二例外命令的表格即第二例外命令列表L2进行管理。关于第二例外命令列表L2，参照后述的图5进行详述。

进一步地，即使在判定为是操作者进行的手动操作中的情况下，当输入了第三例外命令时，语音输入禁止判定部110也进行如下的控制，即，使负责进行处理的部分执行与所输入的第三例外命令对应的处理。第三例外命令是用于询问图像处理系统100的状态的状态应答命令。状态应答命令例如有用于询问图像形成装置1所使用的规定的颜色的调色剂的余量的命令、用于询问被设定给图像形成装置1的IP地址的命令等。第三例外命令通过规定第三例外命令的表格即第三例外命令列表L3进行管理。关于第三例外命令列表L3，参照后述的图7进行详述。

非易失性存储器12是用于存储控制部11所执行的程序等各种数据的存储部。非易失性存储器12中设有例外命令保存部120。在例外命令保存部120中保存第一例外命令列表L1、第二例外命令列表L2、以及第三例外命令列表L3等。此外，在非易失性存储器12中，还保存在语音输入禁止判定部110判定进行了语音输入的区间是否是语音输入禁止区间时利用的操作量阈值、层级数阈值等。

另外，在本实施方式中，举出了将例外命令保存部120、各种阈值设于非易失性存储器12内的例子，但本发明并不限定于此。例外命令保存部120以及各种阈值也可以设于HDD 14内。

RAM 13被作为控制部11执行程序时的工作区域而使用。在HDD 14中存储从未图示的打印机控制器等发送的图像数据、由打印机部18完成了图像形成的图像数据等。

自动原稿输送部15将未图示的原稿托盘中载置的原稿逐页自动给送至未图示的扫描仪部。图像读取部16对从未图示的扫描仪部输入的模拟图像信号进行模拟信号处理、A/D转换处理、浓淡校正处理等各种处理，并将施加了各种信号处理的数字图像数据输出至图像处理部17。

图像处理部17对由图像读取部16生成的数字图像数据、从未图示的打印机控制器发送的图像数据施加各种图像处理。

打印机部18基于由图像处理部17施加了图像处理的图像数据，在纸张上形成图像，并将形成了图像的纸张作为印刷物而输出。具体而言，打印机部18具备未图示的带电装置、感光鼓、曝光装置、转印带、以及定影装置。而且，打印机部18首先从曝光装置对通过带电装置而带电了的感光鼓照射与图像相应的光，从而在感光鼓的外周形成静电潜像。接着，打印机部18通过从显影装置向感光体供给调色剂，使调色剂附着于带电的静电潜像上从而使调色剂像显影。接着，打印机部18使调色剂像一次转印至转印带，并且使被转印至转印带的调色剂像二次转印至纸张，进一步地，通过定影装置使被转印至纸张上的调色剂像在纸张上定影。

另外，此处，举出了打印机部18用电子照相方式来进行图像形成的例子，但本发明并不限定于此。在本发明的图像处理系统、图像形成装置中，也可以利用以喷墨方式等其他方式进行图像形成的打印机部。

有线通信部19包含例如NIC(网络接口卡(Network Interface Card))、调制解调器等，并与网络N连接。有线通信部19接收从经由网络N连接的未图示的打印机控制器发送的图像数据等。此外，有线通信部19控制在与经由网络N连接的云端3内的语音识别部300之间进行的各种数据的发送接收动作。有线通信部19还控制在与经由网络N连接的语音输入装置2之间进行的各种数据的发送接收动作。

无线通信部20控制在与经由无线通信连接的未图示的各种装置、终端等之间进行的各种数据的发送接收动作。另外，也可以设为如下的结构，即，由无线通信部20来进行由线通信部19进行的、在与语音识别部300之间进行的各种数据的发送接收动作的控制和/或在与语音输入装置2之间进行的各种数据的发送接收动作的控制。

传真通信部21与未图示的公共交换电话网或IP通信网等连接，并控制在与经由这些线路连接的具备传真功能的未图示的装置之间进行的各种数据的发送接收动作。

[语音输入装置的控制系统的结构]

以下，参照图3，对语音输入装置2的控制系统的结构进行说明。如图3所示，语音输入装置2具备麦克风30、控制部31、非易失性存储器32、RAM33、有线通信部34、无线通信部35、以及语音输出部36。

麦克风30采集周围的语音，并将所采集到的语音转换成语音数据。麦克风30所收集的周围的语音包括例如由操作者说出的语音命令、在操作者的周围存在的他人的说话声等。由麦克风30转换的语音数据经由无线通信部35被发送(输出)至云端3上的语音识别部300(参照图2)。

控制部31包含例如CPU等，并对构成语音输入装置2的各部分的动作进行控制。例如，控制部31进行如下的控制，即，使麦克风30所得到的语音数据经由无线通信部35发送至云端3上的语音识别部300。此外，控制部31进行如下的控制，即，从语音输出部36播放例如从经由网络N连接的图像形成装置1发送的对状态应答命令的回答(语音数据)。

非易失性存储器32是用于存储控制部31所执行的程序等各种数据的存储部。RAM33作为当控制部31执行程序时的工作区域而被使用。

有线通信部34包含例如NIC等，并与网络N连接。有线通信部34接收从例如经由网络N连接的图像形成装置1发送的对状态应答命令的回答等。

无线通信部35与未图示的公共线路等连接，并控制在与经由该公共线路等连接的云端3内的语音识别部300之间进行的各种数据的发送接收动作。另外，也可以由有线通信部34进行由无线通信部35进行的、在与语音识别部300之间进行的各种数据的发送接收动作的控制。

语音输出部36例如由扬声器构成，并将从控制部31输入的语音数据转换成语音向外部播放。

[任务执行关联画面的例子]

以下，参照图4，对作为图像形成装置1的语音输入禁止判定部110进行语音输入禁止判定处理时的判断材料之一的任务执行关联画面的例子进行说明。图4是示出任务执行关联画面的例子的图。

任务执行关联画面是用于受理与输入至图像处理系统100的任务的执行有关的操作的画面，例如有印刷设定画面、复印画面、传真画面、扫描画面等。在图4中，作为任务执行关联画面的一例，示出复印画面为例。

在图4所示的复印画面Sc1的下方，用于设定与复印功能有关的设定项目即“原稿画质”、“颜色”、“浓度”、“纸张”、“倍率”、“画面/页面汇总”、“加工”的各设定项目的各图标沿横向排成一列而显示。在活动画面是如图4所示的复印画面Sc1那样的任务执行关联画面的情况下，语音输入禁止判定部110判定为进行了语音输入的区间是语音输入禁止区间。

[第二例外命令列表的例]

以下，参照图5，对语音输入禁止判定部110在进行语音输入禁止判定处理时参照的第二例外命令列表L2的结构例进行说明。图5是示出第二例外命令列表L2的结构例的图。如图5所示，第二例外命令列表L2具有“画面编号”、“画面名称”、“识别语音”、以及“处理”的各项目。

在“画面编号”的项目中，保存作为对在操作显示部10上显示的各画面赋予的识别编号的画面编号。在“画面名称”的项目中保存在操作显示部10上显示的各画面的名称。在“识别语音”的项目中保存以文本来表示第二例外命令的内容的内容。在“处理”的项目中保存在由操作者输入了第二例外命令的情况下被执行的处理的内容。

而且，在第二例外命令列表L2中，将以画面编号(画面名称)来识别的画面、在“识别语音”中保存的第二例外命令、以及“处理”中保存的处理关联而进行管理。例如，在第二例外命令列表L2的第一行中，将画面编号是“画面0100”且画面名称是“用户设定菜单画面”的画面、“按下环境设定按钮”这样的第二例外命令、以及“环境设定按钮按下处理”这样的处理内容关联而进行管理。在第二例外命令列表L2的第二行中，将画面编号是“画面0100”且画面名称是“用户设定菜单画面”的画面、“按下画面自定义设定”这样的第二例外命令、以及“画面自定义按钮按下处理”这样的处理内容关联而进行管理。

例如，设为，在画面编号是“画面0100”且画面名称是“用户设定菜单画面”的画面是活动画面的状况下，由操作者说出(向语音输入装置2输入)“按下环境设定按钮”这样的语音命令。在这种情况下，即使在之前的时间点判定为是手动操作中的(已使语音输入无效)情况下，语音输入禁止判定部110也进行如下的控制，即，使控制部11执行与第二例外命令即“环境设定按钮按下”关联的“环境设定按钮按下处理”。

图6是示出画面编号是“画面0100”的用户设定菜单画面Sc2的例子的图。在图6所示的用户设定菜单画面Sc2的左侧，用于表示用户设定菜单的项目的“书签显示”、“数字键盘显示”、以及“设定菜单”的各按钮沿纵向排成一列显示。此外，示出在“设定菜单”的项目中“用户设定”项目被选择。

在图6所示的用户设定菜单画面Sc2中的、菜单项目的显示位置的右侧，作为用于表示“用户设定”的各设定项目的图标，各按钮“1环境设定”、“2画面自定义设定”、“3复印设定”、“4扫描设定”、以及“5打印机设定”沿纵向排成一列而被显示。

设为，在图6所示的用户设定菜单画面Sc2显示于操作显示部10(是活动画面)的状况下，由操作者向语音输入装置2输入了“按下环境设定按钮”这样的语音命令。在这种情况下，语音输入禁止判定部110进行如下的控制，即，基于在第二例外命令列表L2中记载的内容，使控制部11按下用户设定菜单画面中的“环境设定”的按钮。通过由语音输入禁止判定部110进行如上所述的控制，从而即使在语音输入被无效化的状况下，操作者也能够通过说出与活动画面的操作有关的第二例外命令，来操作活动画面。

[第三例外命令列表的例]

以下，参照图7，对语音输入禁止判定部110在进行语音输入禁止判定处理时参照的第三例外命令列表L3的结构例进行说明。图7是示出第三例外命令列表L3的结构例的图。

如图7所示，第三例外命令列表L3具有“识别语音”以及“处理”的各项目。在“识别语音”的项目中保存以文本表示第三例外命令的内容的内容。在“处理”的项目中保存在由操作者输入了第三例外命令的情况下执行的处理的内容。而且，在第三例外命令列表L3中将“识别语音”和”处理”关联而进行管理。

在第三例外命令列表L3的第一行中，将“告诉我K的调色剂余量”这样的第三例外命令与“以语音应答K调色剂余量”这样的处理的内容关联而进行管理。此外，在第三例外命令列表L3的第二行中，将“告诉我IP地址”这样的第三例外命令与“以语音应答IP地址”这样的处理的内容关联而进行管理。

例如，在由操作者向语音输入装置2输入了“告诉我K的调色剂余量”这样的语音命令的情况下，语音输入禁止判定部110进行如下的控制，即，使从语音输入装置2的语音输出部36(参照图3)以语音应答K(黑色)的调色剂的余量。此外，例如，在由操作者向语音输入装置2输入了“告诉我IP地址”这样的语音命令的情况下，语音输入禁止判定部110进行如下的控制，即，使从语音输入装置2的语音输出部36以语音应答图像形成装置1的IP地址。

通过由语音输入禁止判定部110进行这样的控制，即使在语音输入被无效化的状况下，操作者也能够通过说出“告诉我IP地址”等作为状态应答命令的第二例外命令，从而容易地掌握图像处理系统100的状态(status)。

[语音输入禁止判定部进行的语音输入禁止判定处理]

以下，参照图8和图9，对语音输入禁止判定部110进行的语音输入禁止判定处理的步骤进行说明。图8是示出语音输入禁止判定部110进行的语音输入禁止判定处理的步骤的流程图。图9是示出在语音输入禁止判定部110进行的语音输入禁止判定处理中执行的手动操作判定处理的步骤的流程图。

首先，语音输入禁止判定部110判定是否由操作者对语音输入装置2输入了语音(步骤S1)。在本实施方式中，在由操作者对语音输入装置2输入了语音的情况下，由语音输入装置2将语音转换成语音数据，并将该语音数据输入至云端3上的语音识别部300。然后，将与语音识别部300进行的识别语音对应的命令输入至图像形成装置1。因此，语音输入禁止判定部110通过判定是否从语音识别部300输入了命令，能够判定是否有操作者进行的语音的输入。

在步骤S1中判定为没有操作者进行的语音输入的情况(在步骤S1中判定为否(NO)的情况)下，语音输入禁止判定部110反复进行步骤S1的判定。另一方面，在步骤S1中判定为有操作者进行的语音输入的情况(在步骤S1中判定为是(YES)的情况)下，语音输入禁止判定部110进行手动操作判定处理(步骤S2)。关于手动操作判定处理的步骤，参照下面的图9进行详述。通过由语音输入禁止判定部110进行步骤S2的手动操作判定处理，来判定是否是操作者进行的手动操作中。

接着，语音输入禁止判定部110判定是否是手动操作中(步骤S3)。也就是说，语音输入禁止判定部110判定步骤S2中的手动操作判定处理的判定已得出的结果是否是“手动操作中”。

在步骤S3中判定为不是手动操作中的情况(在步骤S3中判定为否(NO)的情况)下，语音输入禁止判定部110进行如下的控制，即，使语音输入有效，并且使负责进行处理的部分执行与在步骤S1中输入的语音对应的处理(步骤S4)。在步骤S4的处理后，语音输入禁止判定部110进行步骤S1的判定。

另一方面，在步骤S3中判定为是手动操作中的情况(在步骤S3中判定为是(YES)的情况)下，语音输入禁止判定部110判定在步骤S1中输入的语音是否是第一例外命令(步骤S5)。也就是说，语音输入禁止判定部110判定在步骤S1中输入的语音是否是“使语音输入有效”等唤醒词。

在步骤S5中判定为所输入的语音是第一例外命令的情况(在步骤S5中判定为是(YES)的情况)下，语音输入禁止判定部110进行步骤S4的处理。即，进行如下的控制：使语音输入有效，并且使负责进行处理的部分执行与在步骤S1中输入的语音对应的处理。

另一方面，在步骤S5中判定为所输入的语音不是第一例外命令的情况(在步骤S5中判定为否(NO)的情况)下，语音输入禁止判定部110判定在步骤S1中输入的语音是否是活动画面中设定的第二例外命令(步骤S6)。也就是说，语音输入禁止判定部110判定在步骤S1中输入的语音是否是在第二例外命令列表L2(参照图5)中与活动画面关联的第二例外命令。

在步骤S6中判定为所输入的语音是活动画面中设定的第二例外命令的情况(在步骤S6中判定为是(YES)的情况)下，语音输入禁止判定部110进行如下的控制，即，使负责进行处理的部分仅执行被分配给命令(第二例外命令)的处理(步骤S7)。例如，在活动画面是图6所示的用户设定菜单画面Sc2且在步骤S1中输入的语音是“按下环境设定按钮”这样的语音的情况下，语音输入禁止判定部110进行如下的控制，即，使控制部11按下用户设定菜单画面中的“环境设定”按钮。在步骤S7的处理后，语音输入禁止判定部110进行步骤S1的判定。

另一方面，在步骤S6中判定为在步骤S1中输入的语音不是活动画面中设定的第二例外命令的情况(在步骤S6中判定为否(NO)的情况)下，语音输入禁止判定部110判定在步骤S1中输入的语音是否是第三例外命令(步骤S8)。也就是说，语音输入禁止判定部110判定在步骤S1中输入的语音是否是“告诉我IP地址”等状态应答命令。

在步骤S8中判定为所输入的语音是第三例外命令的情况(在步骤S8中判定为是(YES)的情况)下，语音输入禁止判定部110进行步骤S7的处理。即，进行如下的控制：使负责进行处理的部分执行被分配给命令(第三例外命令)的处理。

另一方面，在步骤S8中判定为在步骤S1中输入的语音不是第三例外命令的情况(在步骤S8中判定为否(NO)的情况)下，语音输入禁止判定部110使在步骤S1中输入的语音无效(步骤S9)。在步骤S9的处理后，语音输入禁止判定部110进行步骤S1的判定。

以下，参照图9，对在图8的步骤S2中进行的手动操作判定处理的流程进行说明。

首先，语音输入禁止判定部110判定活动画面是否是任务执行关联画面(步骤S11)。也就是说，语音输入禁止判定部110判定在图8的步骤S1中进行了语音输入时显示于操作显示部10的画面是否是印刷设定画面、复印画面等任务执行关联画面。在步骤S11中判定为活动画面是任务执行关联画面的情况(在步骤S11中判定为是(YES)的情况)下，语音输入禁止判定部110判定为进行了语音输入的区间是语音输入禁止区间，并视为操作者进行的手动操作中(步骤S12)。在步骤S12的处理后，语音输入禁止判定部110结束手动操作判定处理，并进行图8的步骤S3的判定。

另一方面，在步骤S11中判定为活动画面不是任务执行关联画面的情况(在步骤S11中判定为否(NO)的情况)下，语音输入禁止判定部110判定操作者每一定时间对活动画面的显示内容进行的操作量是否超过预先确定的操作量阈值(步骤S13)。“操作量”例如有触摸操作表示部10的画面的次数、画面上的按钮或与画面另行设置的按钮的按下次数等。对于用于与“每一定时间的操作量”进行对比的操作量阈值，设定能够判定操作者是否是有意地对该画面进行操作的值。例如，对于操作量阈值，能够设定“10秒钟内2次”等值。操作量阈值的值不限于本例，也可以取其他各种各样的值。

在步骤S13中判定为操作者每一定时间对活动画面的显示内容进行的操作量超过操作量阈值的情况(在步骤S13中判定为是(YES)的情况)下，语音输入禁止判定部110进行步骤S12的处理。即，判定为进行了语音输入的区间是语音输入禁止区间，并视为操作者进行的手动操作中。

另一方面，在步骤S13中判定为操作者每一定时间对活动画面的显示内容进行的操作量没有超过操作量阈值的情况(在步骤S13中判定为否(NO)的情况)下，语音输入禁止判定部110判定活动画面的层级是否超过预先确定的层级数阈值(步骤S14)。对于层级数阈值，能够设定为与设想操作者通过进行手动操作而达到的画面的转移的数目相当的层级数。

在步骤S14中判定为活动画面的层级超过层级数阈值的情况下(在步骤S14中判定为是(YES)的情况)，语音输入禁止判定部110进行步骤S12的处理。即，判定为进行了语音输入的区间是语音输入禁止区间，并视为操作者进行的手动操作中。

另一方面，在步骤S14中判定为活动画面的层级没有超过层级数阈值的情况(在步骤S14中判定为否(NO)的情况)下，语音输入禁止判定部110判定为进行了语音输入的区间不是语音输入禁止区间，并不视为操作者进行的手动操作中(步骤S15)。在步骤S15的处理后，语音输入禁止判定部110结束手动操作判定处理，进行图8的步骤S3的判定。

另外，在图9所示的例子中，在步骤14中判定为否(NO)的情况下，语音输入禁止判定部110进行如下的步骤S15的处理，即，判定为不是语音输入禁止区间，并不视为操作者进行的手动操作中，但本发明并不限定于此。例如，在步骤S14判定为否(ON)的情况下，语音输入禁止判定部110也可以不进行任何处理就使手动操作判定处理结束。在这种情况下，在语音输入禁止判定部110中仅保持在步骤S12中进行判定而得到的如下的判定结果，即，是操作者进行的手动操作中。

此外，在图9所示的例子中举出了如下的例子，即，在步骤S11、步骤S13、以及步骤S14中的任一个步骤的判定是判定为是(YES)的情况下，语音输入禁止判定部110判定为是语音输入禁止区间，并视为操作者进行的手动操作中，但本发明并不限定于此。也可以是，在步骤S11、步骤S13、以及步骤S14中的多个或全部步骤中进行的判定是判定为是(YES)的情况下，语音输入禁止判定部110判定为是语音输入禁止区间，并视为操作者进行的手动操作中。

在上述的实施方式中，在由语音输入禁止判定部110判定为是操作者进行的手动操作中的情况下，使从语音输入装置2向语音识别部300的语音数据的输入无效。也就是说，根据本实施方式，即使在由操作者进行手动操作时周围的他人说话的情况下，图像形成装置1也不会执行基于说话的内容的处理。因此，根据本实施方式，能够防止基于在周围的他人的说话等而执行操作者意外的处理。

此外，在上述的实施方式中，语音输入禁止判定部110基于与操作显示部10中显示中的活动画面有关的信息，判定进行了语音输入的区间是否是语音输入禁止区间。而且，在判定为是语音输入禁止区间的情况下，判定为是操作者进行的手动操作中。因此，根据本实施方式，基于包括在活动画面中显示中的内容、层级等与活动画面有关的信息，适当地判定是否由操作者正在进行手动操作。

此外，在上述的实施方式中，在活动画面是用于受理与输入至图像处理系统100的任务的执行有关的操作的任务执行关联画面的情况下，语音输入禁止判定部110判定为进行了语音输入的区间是语音输入禁止区间。因此，根据本实施方式，在当操作者进行了语音输入时显示于操作显示部10上的画面是印刷设定画面、复印画面、传真画面、扫描画面等任务执行关联画面的情况下，视为操作者进行的手动操作中，使语音输入无效。因此，根据本实施方式，能够防止以操作者意外的设定来执行任务、或者数据被发送至意外的收件地址等问题的发生。

此外，在上述的实施方式中，在从操作者对活动画面上显示的内容向操作显示部10输入的操作的每规定时间的操作量超过了预先确定的规定的操作量阈值的情况下，语音输入禁止判定部110判定为进行了语音输入的区间是语音输入禁止区间。因此，在本实施方式中，在能够判断为操作者正在对操作显示部10进行手动操作的状况下，使语音输入无效。因此，根据本实施方式，能够防止当操作者正进行手动操作时基于在周围的他人的说话等而执行操作者意外的处理。

此外，在上述的实施方式中，在活动画面的层级超过预先确定的规定的层级数阈值的情况下，语音输入禁止判定部110判定为进行了语音输入的区间是语音输入禁止区间。因此，在本实施方式中，在能够判断为操作者正在对操作显示部10进行手动操作的状况下，使语音输入无效。因此，根据本实施方式，能够防止当操作者正进行手动操作时基于在周围的他人的说话等而执行操作者意外的处理。

此外，在上述的实施方式中，即使在判定为是操作者进行的手动操作中的情况下，当从语音输入装置2输入至语音识别部300的语音数据是用于指示基于语音的操作输入的开始的第一例外命令的语音数据时，语音输入禁止判定部110使输入至语音输入装置2的语音有效。也就是说，在本实施方式中，在由操作者输入了唤醒词作为第一例外命令的情况下，使语音输入有效。因此，根据本实施方式，在操作者有意地想要使语音输入有效的状况下，操作者就必然可以进行语音操作。

此外，在上述的实施方式中，即使在判定为是操作者进行的手动操作中的情况下，当从语音输入装置2输入至语音识别部300的语音数据是与活动画面的操作有关的第二例外命令的语音数据时，语音输入禁止判定部110也使输入至语音输入装置2的语音有效。因此，在本实施方式中，在输入了“在活动画面上显示的按钮的按下”等第二例外命令的情况下，使语音输入有效，操作者变得能够进行语音操作。因此，根据本实施方式，在通过语音操作使得基于手动操作的工作变得更简便的情形下，操作者能够进行语音操作。

此外，在上述的实施方式中，即使在判定为是操作者进行的手动操作中的情况下，当从语音输入装置2输入至语音识别部300的语音数据是用于询问图像处理系统100的状态的第三例外命令的语音数据时，语音输入禁止判定部110也使输入至语音输入装置2的语音有效。因此，在本实施方式中，在询问图像处理系统100的状态等不会妨碍操作者的手动工作的情形下，操作者能够进行语音操作。

<各种变形例>

另外，本发明不限于上述的实施方式，只要不脱离权利要求书中记载的本发明的要旨，就可以采用其他各种各样的应用例、变形例。

在上述的实施方式中，举出了将语音输入禁止判定部110设于图像形成装置1内的例子，但本发明并不限定于此。也可以将语音输入禁止判定部110设于云端3上，从而使语音输入禁止判定处理在云端3侧执行。在这种情况下，设于云端3上的语音输入禁止判定部110获取图像形成装置1的状态(活动画面信息等)，并基于所获取的内容来进行语音输入禁止判定处理。而且，设于云端3上的语音输入禁止判定部110仅在判定为不是手动操作中的情况下，才生成与语音识别出的识别语音对应的命令，并将该命令发送至图像形成装置1。

或者，也可以使设于云端3上的语音输入禁止判定部110仅执行语音输入禁止判定部110所执行的语音输入禁止判定处理中的手动操作判定处理(参照图9)。

此外，在上述的实施的方式中，举出了语音输入装置2的语音输出部36(参照图3)对状态应答命令进行应答的例子，但本发明并不限定于此。也可以使对状态应答命令的应答从设于图像形成装置1内的未图示的扬声器播放。

Claims

1.一种图像处理系统，具备：

操作输入部，被输入操作者进行的手动操作；

语音输入部，被输入语音，将所输入的所述语音转换成语音数据并输出；

语音识别部，对从所述语音输入部输入的所述语音数据进行语音识别处理，输出识别结果；

控制部，执行与从所述语音识别部输入的所述识别结果预先进行了关联的处理；以及

语音输入禁止判定部，判定是否是所述操作者进行的手动操作中，在判定为是所述手动操作中的情况下，使被输入至所述语音输入部的语音无效。

2.如权利要求1所述的图像处理系统，

还具备显示部，

所述语音输入禁止判定部基于与向所述语音输入部进行语音输入时显示于所述显示部的画面有关的信息，判定向所述语音输入部进行了语音输入的区间是否是语音输入禁止区间，在判定为是所述语音输入禁止区间的情况下，判定为是所述手动操作中。

3.如权利要求2所述的图像处理系统，

在向所述语音输入部进行语音输入时显示于所述显示部的画面是用于受理与输入至图像处理系统的任务的执行有关的操作的任务执行关联画面的情况下，所述语音输入禁止判定部判定为向所述语音输入部进行了语音输入的区间是所述语音输入禁止区间。

4.如权利要求2或3所述的图像处理系统，

在从所述操作者针对在所述显示部上显示中的画面中所显示的内容而向所述操作输入部输入的操作的每规定时间的操作量超过了预先确定的规定的操作量阈值的情况下，所述语音输入禁止判定部判定为向所述语音输入部进行了语音输入的区间是所述语音输入禁止区间。

5.如权利要求2至4中任一项所述的图像处理系统，

在所述显示部上显示中的画面的层级超过预先确定的规定的层级数阈值的情况下，所述语音输入禁止判定部判定为向所述语音输入部进行了语音输入的区间是所述语音输入禁止区间。

6.如权利要求2至5中任一项所述的图像处理系统，

即使在判定为是所述手动操作中的情况下，在从所述语音输入部输入至所述语音识别部的语音数据是用于指示基于语音的操作输入的开始的第一例外命令的语音数据的情况下，所述语音输入禁止判定部也使被输入至所述语音输入部的语音有效。

7.如权利要求2至6中任一项所述的图像处理系统，

即使在判定为是所述手动操作中的情况下，在从所述语音输入部输入至所述语音识别部的语音数据是与在所述显示部上显示中的画面的操作有关的第二例外命令的语音数据的情况下，所述语音输入禁止判定部也使被输入至所述语音输入部的语音有效。

8.如权利要求2至7中任一项所述的图像处理系统，

即使在判定为是所述手动操作中的情况下，在从所述语音输入部输入至所述语音识别部的语音数据是用于询问图像处理系统的状态的第三例外命令的语音数据的情况下，所述语音输入禁止判定部也使被输入至所述语音输入部的语音有效。

9.一种图像形成装置，具备：

操作输入部，被输入操作者进行的手动操作；

图像形成部，在记录材料上形成图像；

控制部，执行与语音识别部对语音数据进行语音识别处理而得到的识别结果预先进行了关联且包括所述图像形成部进行的图像形成处理的处理，其中所述语音数据是语音输入部对被输入的语音进行转换后的语音数据；以及

10.一种语音输入禁止判定方法，包括：

受理操作者进行的操作的步骤；

输入语音，将输入的所述语音转换成语音数据并输出的步骤；

对被输入的所述语音数据进行语音识别处理，输出识别结果的步骤；

执行与被输入的所述识别结果预先进行了关联的处理的步骤；以及

判定是否是所述操作者进行的手动操作中，在判定为是所述手动操作中的情况下，使输入的所述语音无效的步骤。

11.如权利要求10所述的语音输入禁止判定方法，

还包括在显示部上进行显示的步骤，

在判定是否是所述操作者进行的手动操作中，在判定为是所述手动操作中的情况下，使输入的所述语音无效的步骤中，基于与在进行了语音输入时显示于所述显示部的画面有关的信息，判定进行了语音输入的区间是否是语音输入禁止区间，在判定为是所述语音输入禁止区间的情况下，判定为是所述手动操作中。

12.如权利要求11所述的语音输入禁止判定方法，

在判定是否是所述操作者进行的手动操作中，在判定为是所述手动操作中的情况下，使输入的所述语音无效的步骤中，在进行了语音输入时显示于所述显示部的画面是用于受理与输入至图像处理系统的任务的执行有关的操作的任务执行关联画面的情况下，判定为进行了语音输入的区间是所述语音输入禁止区间。

13.如权利要求11或12所述的语音输入禁止判定方法，

在判定是否是所述操作者进行的手动操作中，在判定为是所述手动操作中的情况下，使输入的所述语音无效的步骤中，当针对在所述显示部上显示中的画面中所显示的内容而从所述操作者受理的操作的每规定时间的操作量超过了预先确定的规定的操作量阈值的情况下，判定为进行了语音输入的区间是所述语音输入禁止区间。

14.如权利要求11至13中任一项所述的语音输入禁止判定方法，

在判定是否是所述操作者进行的手动操作中，在判定为是所述手动操作中的情况下，使输入的所述语音无效的步骤中，在所述显示部上显示中的画面的层级超过预先确定的规定的层级数阈值的情况下，判定为进行了语音输入的区间是所述语音输入禁止区间。

15.如权利要求11至14中任一项所述的语音输入禁止判定方法，

在判定是否是所述操作者进行的手动操作中，在判定为是所述手动操作中的情况下，使输入的所述语音无效的步骤中，即使在判定为是所述手动操作中的情况下，在所输入的语音数据是用于指示基于语音的操作输入的开始的第一例外命令的语音数据的情况下，也使所输入的语音有效。

16.如权利要求11至15中任一项所述的语音输入禁止判定方法，

在判定是否是所述操作者进行的手动操作中，在判定为是所述手动操作中的情况下，使输入的所述语音无效的步骤中，即使在判定为是所述手动操作中的情况下，在所输入的语音数据是与在所述显示部上显示中的画面的操作有关的第二例外命令的语音数据的情况下，也使所输入的语音有效。

17.如权利要求11至16中任一项所述的语音输入禁止判定方法，

在判定是否是所述操作者进行的手动操作中，在判定为是所述手动操作中的情况下，使输入的所述语音无效的步骤中，即使在判定为是所述手动操作中的情况下，在所输入的语音数据是用于询问图像处理系统的状态的第三例外命令的语音数据的情况下，也使所输入的语音有效。

18.一种存储了程序的计算机可读取的记录介质，所述程序用于使计算机执行：

受理操作者进行的操作的步骤；

执行与被输入的所述识别结果预先进行了关联且包括在记录材料上形成图像的图像形成处理的处理的步骤；以及

19.如权利要求18所述的存储了程序的计算机可读取的记录介质，

所述程序还用于使计算机执行在显示部上进行显示的步骤，

20.如权利要求19所述的存储了程序的计算机可读取的记录介质，

21.如权利要求19或20所述的存储了程序的计算机可读取的记录介质，

22.如权利要求19至21中任一项所述的存储了程序的计算机可读取的记录介质，

23.如权利要求19至22中任一项所述的存储了程序的计算机可读取的记录介质，

24.如权利要求19至23中任一项所述的存储了程序的计算机可读取的记录介质，

25.如权利要求19至24中任一项所述的存储了程序的计算机可读取的记录介质，

在判定是否是所述操作者进行的手动操作中，在判定为是所述手动操作中的情况下，使输入的所述语音无效的步骤中，即使在判定是为所述手动操作中的情况下，在所输入的语音数据是用于询问图像处理系统的状态的第三例外命令的语音数据的情况下，也使所输入的语音有效。