CN117935804A - 语音命令系统和语音命令方法 - Google Patents

语音命令系统和语音命令方法 Download PDF

Info

Publication number
CN117935804A
CN117935804A CN202410180704.5A CN202410180704A CN117935804A CN 117935804 A CN117935804 A CN 117935804A CN 202410180704 A CN202410180704 A CN 202410180704A CN 117935804 A CN117935804 A CN 117935804A
Authority
CN
China
Prior art keywords
voice command
speaker
voice
received
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410180704.5A
Other languages
English (en)
Inventor
山本愉美子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Publication of CN117935804A publication Critical patent/CN117935804A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/50Maintenance of biometric data or enrolment thereof
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/227Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)

Abstract

语音命令系统包括:网关装置,具有配置成接收语音命令的接口;以及控制器,配置成执行登记处理,所述登记处理登记说话者,所述说话者的语音命令被允许接收。所述控制器配置成执行认证处理,其中当所述语音命令的说话者未登记时,拒绝接收所述语音命令,以及当所述语音命令的说话者已登记时,允许接收所述语音命令。所述控制器配置成针对每个语音命令执行所述认证处理。

Description

语音命令系统和语音命令方法
本申请是申请日为2018年9月26日、申请号为201880062699.0的中国发明专利申请“语音命令系统和语音命令方法”的分案申请。
技术领域
本发明涉及语音命令系统和语音命令方法。
背景技术
已经提出了一种导航系统,其在设备维护时在移动终端上显示各种指导信息(例如,专利文献1)。
引用列表
专利文献
专利文献1:日本申请公开No.2012-256276
发明内容
根据第一公开的语音命令系统包括网关装置,该网关装置具有配置成接收语音命令的接口。该语音命令系统包括配置成执行登记处理的控制器,该登记处理登记说话者,该说话者的语音命令被允许接收。该控制器配置成执行认证处理,其中当语音命令的说话者未登记时,拒绝接收语音命令,以及当语音命令的说话者已登记时,允许接收语音命令。该控制器配置成针对每个语音命令执行认证处理。
根据第二公开的语音命令方法包括:步骤A,接收语音命令;步骤B,执行登记处理,该登记处理登记说话者,该说话者的语音命令被允许接收;以及步骤C,执行认证处理,其中当语音命令的说话者未登记时,拒绝接收语音命令,以及当语音命令的说话者已登记时,允许接收语音命令。步骤C针对每个语音命令执行。
附图说明
图1是示出根据实施例的语音命令系统100的图。
图2是示出根据实施例的设备管理装置200的图。
图3是示出根据实施例在第一DB 211中存储的信息示例的图。
图4是示出根据实施例在第二DB 212中存储的信息示例的图。
图5是示出根据实施例在第三DB 213中存储的信息示例的图。
图6是示出根据实施例的网关装置330的图。
图7是示出根据实施例的语音命令方法的图。
图8是示出根据实施例的语音命令方法的图。
图9是示出根据实施例的语音命令方法的图。
具体实施方式
近年来,一种配备有诸如语音输入接口之类的用户接口的网关装置引起了人们的注意。使用这种网关装置,可以想到通过支持设备的安装、检查和使用来提高用户的便利性。然而,由于网关装置接收存在于网关装置附近的多个说话者的语音命令,因此可能无法适当地支持设备的安装、检查和使用。
本公开提供了一种语音命令系统和语音命令方法,其能够适当地支持设备的安装、检查、使用等等。
下面将参考附图来描述实施例。在下面对附图的描述中,相同或类似部分用相同或类似的符号表示。
然而,应当注意,附图是示意性的,其尺寸比例等不同于实际情况。因此,具体尺寸等应根据下面的描述来确定。当然,附图包括相互之间的尺寸关系或比例各不相同的部分。
【实施例】
(语音命令系统)
下面将描述根据实施例的语音命令系统。如图1所示,语音命令系统100具有设备管理装置200、设施300、合约商终端400和外部服务器500。在图1中,示出了设施300A到设施300C,作为设施300的示例。设备管理装置200、设施300、合约商终端400和外部服务器500连接到网络120。网络120只需要提供设备管理装置200和设施300之间的线路、设备管理装置200和合约商终端400之间的线路、以及设施300和外部服务器500之间的线路。例如,网络120是互联网。网络120可以提供诸如虚拟私有网络(VPN)之类的专有线路。
设备管理装置200管理在设施300处设置的设备。稍后将描述设备管理装置200的细节(参见图2)。
设施300具有设备310、能量管理系统(EMS)320和网关装置330。设备310连接到电力网110。设备310可以是发电设备。发电设备可以是利用诸如太阳光、风能或地热能等自然能源发电的设备。发电设备可以是燃料电池装置。设备310可以是蓄电池装置。设备310可以是消耗电力的负荷设备。负荷设备可以是空调设备或照明设备。设施300可以有两种或更多种类型的设备310。
EMS 320是一种装置(EMS:能量管理系统),其管理指示设施300中的电力的电力信息。设施300中的电力是设施300内流动的电力,是设施300购买的电力,或者设施300出售的电力。
网关装置330具有接口,其接收语音命令以操作设备310。接口包括声音输入接口。接口可以包括声音输出接口。接口可以包括按钮输入接口。接口可以包括触摸板输入接口。接口可以包括手势输入接口。手势例如是诸如向接口所具有的摄像头挥动手的动作。接口可以包括图像输出接口。网关装置330具有人工智能(AI)功能,AI功能具有分析语音命令以及基于对语音命令的分析结果来执行各种动作的功能。各种动作可以包括从经由网络120连接的服务器获取信息的动作,还可以包括输出从经由网络120连接的服务器获取的信息的动作。服务器可以是设备管理装置200,也可以是外部服务器500。各种动作可以包括发送基于语音命令的控制命令的动作,也可以包括接收对控制命令的响应命令的动作。网关装置330可以经由EMS 320将控制命令发送给设备310,也可以在没有EMS 320介入的情况下将控制命令发送给设备310。网关装置330可以称为智能扬声器或AI。
在此,网关装置330可以将网关装置330所收集的信息发送到外部服务器500。网关装置330所收集的信息可以是对语音命令的分析结果,也可以是从设备管理装置200获取的信息。
合约商终端400可以是属于对设备310进行维护的合约商的终端。维护的示例包括:检查,查看设备的劣化状态;保养,在检查期间执行简单服务;维修,修复设备问题以将设备的功能和性能恢复到原始安装状态;以及替换,将现有设备更换为新设备。
这里,语音命令系统100可以具有电力管理服务器。例如,电力管理服务器向设施300发送:请求控制从电力网110到设施300的潮流量的潮流控制消息,请求控制从设施300到电力网110的反向潮流量的反向潮流控制消息,请求控制设施300中设置的设备310(分布式电源)的电源控制消息等。
外部服务器500可以是提供搜索引擎以基于对语音命令的分析结果来搜索所需信息的服务器。外部服务器500可以是由提供网关装置330的实体运行的服务器。外部服务器500可以将网关装置330所收集的信息作为大数据进行管理,并将管理的大数据作为改善用户便利性的信息加以利用。
(设备管理装置)
下面将描述根据实施例的设备管理装置。如图2所示,设备管理装置200具有管理器210、通信器220和控制器230。
管理器210包括诸如非易失性存储器或/和HDD之类的存储介质(媒介),并且管理有关多个设施300的信息。管理器210具有第一数据库(DB)211、第二数据库(DB)212和第三数据库(DB)213。
第一DB 211是存储第一信息的第一数据库的示例,第一信息允许网关装置330的访问。第一信息包括关于设备的操作方法的指导信息。例如,指导信息包括以下至少一项:设备名称、安装信息、检查信息和使用信息,如图3所示。
设备名称是设备310的名称。设备名称可以是唯一标识设备310的信息(例如,产品型号、制造商代码等),或者可以是指示设备310的类型(例如,太阳能电池装置、空调设备等)的信息。
安装信息是设备310在设施300中安装时需要的信息。例如,安装信息是指示设备310的安装过程的信息,是诸如“将电缆xx连接到端子oo”或“打开电源”之类的信息。例如,安装信息可以由设备310的安装合约商使用。
检查信息是对设备310进行检查时需要的信息。例如,检查信息是指示设备310的检查过程的信息,是诸如“电缆xx是否连接到端子oo?”或“电源灯是否被点亮?”之类的信息。例如,检查信息可以由设备310的检查合约商使用。设备310的检查可以是在设备310安装后进行的检查,也可以是作为对设备310的保养进行的检查。
使用信息是设备310使用时需要的信息。例如,使用信息是指示设备310的使用过程的信息,诸如“打开电源”或“按下按钮oo”之类的信息。使用信息可以是指示设备310的功能的信息,也可以是指示设备310的故障排除的信息。使用信息可以是由设备310的用户使用的信息。
在实施例中,第一DB 211可以存储将指导信息、设备信息和用户信息相互关联的索引信息,如图3所示。索引信息包含任意字符和数字的组合,本身不需要有意义。
第二DB 212是存储第二信息的第二数据库的示例,第二信息禁止网关装置330的访问。第二信息包括关于设备310的设备信息。设备信息是由控制设备310的EMS 320收集的信息。例如,设备信息包括以下至少一项:设备名称、感测数据、错误代码、统计数据、参考数据和运行历史,如图4所示。
设备名称是设备310的名称。设备名称可以是唯一标识设备310的信息(例如,制造商代码),或者可以是指示设备310的类型(例如,太阳能电池装置、空调设备等)的信息。
感测数据是包括代表设备310运行状态的数值数据的数据。感测数据由设置在设施300处的传感器来测量。备选地,感测数据可以由设置在设备310处的传感器测量,也可以由设置在EMS 320处的传感器测量。感测数据从EMS 320发送给设备管理装置200。例如,感测数据可以是设备310的输出功率数据、设备310的功耗数据、设备310的温度数据、设备310的环境温度数据、设备310的环境湿度数据,等等。
错误代码是标识设备310的错误的代码。错误可以被设备310检测到,也可以被EMS320检测到。错误代码从EMS 320发送给设备管理装置200。例如,错误代码可以是指示设备310的温度异常的代码、指示设置在设备310中的部件的异常的代码、指示设备310的输出功率异常的代码、指示设备310的功耗异常的代码。
统计数据是对数值数据进行统计处理后得到的数据。统计数据可以由设备管理装置200生成。备选地,统计数据可以由设备310生成,也可以由EMS 320生成。例如,统计数据可以是为特定目的分组或排序的数值数据。例如,统计数据可以是指示设备310在预定时间(例如1天、1周或1个月)内的输出功率转变(分布)的数据,也可以是指示设备310在预定时间内的功耗转变的数据。
参考数据是包含与数值数据相比较的阈值的数据。参考数据是由设备310的制造商等设置的值。阈值是用来确定设备310的错误的值。
运行历史是关于设备310的运转的历史。运行历史可以是运转模式在预定时间(例如1天、1周或1个月)内的转变,可以是预定运转模式的执行次数,也可以是设备310停止运转的次数。例如,如果设备310是燃料电池装置,则运行历史可以是燃料电池装置正常停止的次数,也可以是燃料电池装置紧急停止的次数。如果设备310是蓄电池装置,则运行历史可以是蓄电池装置的充电次数,可以是蓄电池装置的充电时间,可以是蓄电池装置的放电次数,可以是蓄电池装置的放电时间,也可以是蓄电池装置的充电/放电循环数量。
在实施例中,第二DB 212可以存储将指导信息、设备信息和用户信息相互关联的索引信息,如图4所示。索引信息包含任意字符和数字的组合,本身不需要有意义。
第三DB 213存储关于用户的用户信息。用户可以是法人或自然人(个人)。例如,用户信息包括以下至少一项:用户的姓名或名称、用户的地址和用户的联系信息(邮件地址和电话号码),如图5所示。用户信息是要保护的信息。此外,用户信息可以包括合约商信息和维护信息中至少一项,如图5所示。
合约商信息是关于与用户进行交易的合约商的信息。合约商可以是进行维护的合约商。合约商可以是设备310的制造商。合约商可以是诸如发电公司、输配电公司、零售公司或资源整合商之类的公司。
维护信息是关于设备310的维护的信息。维护信息可以是维护历史,也可以是维护计划。维护信息可以通过从合约商终端400发送的维护信息来积累,也可以通过操作员输入的维护信息来积累。维护信息可以包括维护执行日期、计划维护日期和维护内容。如上所述,维护例如包括:检查,查看设备的劣化状态;保养,在检查期间执行简单服务;维修,修复设备问题以将设备的功能和性能恢复到原始安装状态;以及替换,将现有设备更换为新设备。
在实施例中,第三DB 213可以存储将指导信息、设备信息和用户信息相互关联的索引信息,如图5所示。索引信息包含任意字符和数字的组合,本身不需要有意义。
通信器220包括通信模块并经由网络120与设施300和合约商终端400通信。例如,通信器220从EMS 320接收诸如感测数据和错误代码之类的设备信息。通信器220从合约商终端400接收维护信息。通信器220从网关装置330接收对语音命令的分析结果。
控制器230例如包括存储器和CPU,并控制设置在设备管理装置200中的各个配置。在实施例中,控制器230执行如下所示的控制。
控制器230从控制设备310的EMS 320收集设备信息。控制器230可以主动收集从EMS 320发送的设备信息,或可以响应于对EMS 320的请求来收集从EMS 320发送的设备信息。如上所述,设备信息存储在第二DB 212中。
控制器230允许EMS 320访问第二DB 212。另一方面,控制器230禁止EMS 320访问第三DB 213。换言之,控制器230配置成禁止EMS 320访问第三DB 213,即使EMS 320被允许访问第二DB 212。
类似地,控制器230可以允许合约商终端400访问第二DB 212。另一方面,控制器230可以禁止合约商终端400访问第三DB 213。换言之,控制器230可以配置成禁止合约商终端400访问第三DB 213,即使合约商终端400被允许访问第二DB 212。
控制器230可以向第三方提供设备信息。在这种情况下,控制器230至少删除索引信息。根据这样的配置,可以降低用户信息可能泄露给第三方的风险。第三方并不是特别限定的,其可以是诸如发电公司、输配电公司、零售公司或资源聚合商之类的公司。
控制器230允许网关装置330访问第一DB 211。另一方面,控制器230禁止网关装置330访问第二DB 212。换言之,控制器230配置成禁止网关装置330访问第二DB 212,即使网关装置330被允许访问第一DB 211。这里,控制器230可以允许网关装置330访问第三DB213,或者可以禁止网关装置330访问第三DB 213。如果允许访问第三DB 213的用户向网关装置330输入了语音命令,则控制器230可以允许网关装置330访问第三DB 213。
这里,向网关装置330输入语音命令的用户可以认为是设备310的用户。因此,向网关装置330输入语音命令的用户可以认为具有访问存储在第二DB 212中的第二信息(设备信息)的权限。例如,该用户有权经由EMS 320来访问第二信息。
然而,即使访问是基于从有权访问第二信息的用户得到的语音命令的,控制器230也禁止网关装置330访问第二DB 212。换言之,控制器230禁止网关装置330访问第二DB212,而允许EMS 320访问第二DB 212。
(网关装置)
下面将描述根据实施例的网关装置。如图6所示,网关装置330包括接口331、通信器332和控制器333。
接口331包括接收语音命令的语音输入接口。接口331可以包括语音输出接口。
通信器332由通信模块构成,并且经由网络120与设备管理装置200和外部服务器500通信。例如,通信器332从设备管理装置200接收指导信息。通信器332向外部服务器500发送由网关装置330收集的信息。
控制器333包括存储器、CPU等,其控制设置在网关装置330中的每个组件。在实施例中,控制器333执行下列控制。
控制器333执行登记处理,该登记处理登记说话者,该说话者的语音命令被允许接收。例如,控制器333在诸如存储器之类的存储介质中登记说话者。控制器333可以与待登记的说话者相关联地登记说话者说出的主要语言、方言等。控制器333执行认证处理,其中当语音命令的说话者未被登记时,拒绝接收语音命令,以及当语音命令的说话者已被登记时,允许接收语音命令。控制器333针对每个语音命令执行认证处理。控制器333通过确定说话者的声纹来执行认证处理。声纹确定是确定输入语音是否匹配被登记语音的处理。
这里,当允许接收语音命令时,控制器333基于语音命令访问外部数据库,并且从外部数据库获取对应于语音命令的信息(上述指导信息)。外部数据库是上面描述的第一DB211。
首先,控制器333在设备310的安装操作时段期间执行登记处理和认证处理。例如,在这种情况下,在登记处理中登记的说话者是安装者。控制器333可以取消通过安装操作时段期间执行的登记处理对说话者的登记,作为安装操作时段结束的结果。也即,在安装操作时段期间,控制器333可以接收安装者的语音。在安装操作时段期间,反复进行用于请求安装过程的下一作业项目的语音输入和基于安装信息的安装过程的一个作业项目的语音输出。而且,在安装操作时段期间,当执行具有相对较高重要性的作业项目的语音输出时,该语音输出可以以比具有较低重要性的作业项目的语音输出的音量更高的音量执行,或者可以执行多次语音输出。用于请求下一作业项目的语音输入可以是指示前一作业项目已完成的语音输入。因此,在安装操作时段期间,通过语音输入和语音输出对作业项目进行核对。
其次,控制器333在设备310的检查时段期间执行登记处理和认证处理。例如,在这种情况下,在登记处理中登记的说话者是检查者。控制器333可以取消通过检查时段期间执行的登记处理对说话者的登记,作为检查操作时段结束的结果。也即,在检查时段期间,控制器333可以接收检查者的语音。在检查时段期间,反复进行用于请求检查过程的下一检查项目的语音输入和基于检查信息的检查过程的一个检查项目的语音输出。用于请求下一检查项目的语音输入可以是对前一检查项目的回答(例如,是或否)的语音输入。如上所述,在检查时段期间,通过语音输入和语音输出对检查项目进行核对。
在这种检查时段中,控制器333基于检查时段期间说话者的语音输入来执行签名处理。在通过语音输入对最后一个检查项目的回答之后,执行签名处理。换言之,控制器333通过签名处理来结束检查时段。
再次,控制器333在设备310的使用时段期间执行登记处理和认证处理。例如,在这种情况下,在登记处理中登记的说话者是设备310的用户。当从执行登记处理起过去预定时段时,控制器333可以取消通过检查时段期间执行的登记处理对说话者的登记。在使用时段期间,执行用于请求使用过程的操作项目的语音输入和基于使用信息的操作项目的语音输出。
在使用时段期间,当通过认证处理接收到语音命令时,控制器333可以在一定时段内或一定次数内省略认证处理。也即,当接收到已登记说话者的语音命令时,控制器333可以在一定时段内或一定次数内接收未登记的说话者的语音命令。
(语音命令方法)
下面将描述根据实施例的语音命令方法。
首先,将参考图7描述安装操作时段。如图7所示,在步骤S11中,向网关装置330输入被登记语音。
在步骤S12中,网关装置330执行登记处理,该登记处理登记说话者,该说话者的语音命令被允许接收。
在步骤S13A中,向网关装置330输入请求安装过程的下一作业项目的语音命令。在步骤S14A中,网关装置330执行认证处理,其中确定语音命令的说话者是否已登记。这里,在假设语音命令的说话者已登记的情况下继续描述。在步骤S15A中,网关装置330访问第一DB211。在步骤S16A中,网关装置330从第一DB 211接收安装信息。网关装置330通过语音来输出基于安装信息的作业项目。在步骤S17A中,向网关装置330输入指示该作业项目已完成的语音。
如步骤S13X到S17X所示,重复这种处理直到设备310的安装完成。如上所述,用于请求下一作业项目的语音输入可以是指示前一作业项目已完成的语音输入。也即,步骤S17A中的语音输入也可以用作步骤S13X中的语音输入。
在步骤S18中,向网关装置330输入指示设备310的安装完成的语音命令。在步骤S19中,网关装置330执行认证处理,其中确定语音命令的说话者是否已登记。这里,在假设语音命令的说话者已登记的情况下继续描述。在步骤S20中,网关装置330取消在步骤S12中执行的对说话者的登记。
其次,将参考图8描述检查时段。如图8所示,在步骤S31中,向网关装置330输入被登记语音。
在步骤S32中,网关装置330执行登记处理,该登记处理登记说话者,该说话者的语音命令被允许接收。
在步骤S33A中,向网关装置330输入请求检查过程的下一检查项目的语音命令。在步骤S34A中,网关装置330执行认证处理,其中确定语音命令的说话者是否已登记。这里,在假设语音命令的说话者已登记的情况下继续描述。在步骤S35A中,网关装置330访问第一DB211。在步骤S36A中,网关装置330从第一DB 211接收检查信息。网关装置330通过语音来输出基于检查信息的检查项目。在步骤S37A中,向网关装置330输入对检查项目的回答的语音。
如步骤S33X到S37X所示,重复这种处理直到设备310的检查完成。如上所述,用于请求下一检查项目的语音输入可以是对前一检查项目的回答的语音输入。也即,步骤S37A中的语音输入也可以用作步骤S33X中的语音输入。
在步骤S38中,向网关装置330输入指示设备310的检查完成的语音命令。在步骤S39中,网关装置330执行认证处理,其中确定语音命令的说话者是否已登记。这里,在假设语音命令的说话者已登记的情况下继续描述。在步骤S40中,网关装置330基于说话者的语音输入执行签名处理。在步骤S41中,网关装置330取消在步骤S32中执行的对说话者的登记。
再次,将参考图9描述使用时段。如图9所示,在步骤S51中,向网关装置330输入被登记语音。
在步骤S52中,网关装置330执行登记处理,该登记处理登记说话者,该说话者的语音命令被允许接收。
在步骤S53中,向网关装置330输入请求使用过程的操作项目的语音命令。在步骤S54中,网关装置330执行认证处理,其中确定语音命令的说话者是否已登记。这里,在假设语音命令的说话者已登记的情况下继续描述。在步骤S55中,网关装置330访问第一DB 211。在步骤S56中,网关装置330从第一DB 211接收使用信息。网关装置330通过语音来输出基于使用信息的操作项目。
在步骤S57中,基于操作项目向网关装置330输入对设备310的语音命令。在步骤S58中,网关装置330执行认证处理,其中确定语音命令的说话者是否已登记。这里,在假设语音命令的说话者已登记的情况下继续描述。在步骤S59中,网关装置330向EMS 320发送基于语音命令的控制命令。
(作用和效果)
在实施例中,网关装置330针对每个语音命令执行认证处理。根据这种配置,抑制了接收到网关装置330附近多个说话者的语音命令的情形,这种情形可能无法正确地支持设备310的安装、检查、使用等。
在实施例中,设备管理装置200配置成禁止网关装置330访问第二DB 212。根据这种配置,由于可能向外部服务器500发送各种信息的网关装置330被禁止访问第二DB 212,因此可以减小第二信息可能泄露给另一实体的风险,该第二信息属于运行设备管理装置200的实体的专门知识。
在实施例中,设备管理装置200配置成允许网关装置330访问第一DB 211。根据这种配置,由于提供了存储在设备管理装置200中的部分信息,所以可以改善用户便利性。
【其他实施例】
本发明通过上述实施例进行了描述。然而,构成本公开一部分的附图和讨论不应被解释为限制本发明。根据本公开,各种备选实施例、示例和运行技术对于本领域技术人员而言将是明显的。
虽然实施例中未特别提及,但可以请求预先登记到网关装置330的密码的语音输入以启动登记处理。在登记处理中,可以登记两个或更多个说话者。当在预定时间内输入了两个或更多个语音命令时,在登记了多个说话者的情况下,网关装置330可以接收具有最大音量的语音命令。网关装置330不需要接收音量低于预定音量的语音命令。
如实施例中所描述的,当在使用期间通过认证处理接收到语音命令时,网关装置330可以在一定时段内或一定次数内省略认证处理。在这种情况下,该一定时段或一定次数可以根据语音命令的重要性来确定。进一步地,对于特定语音命令(具有高重要性的语音命令),网关装置330可以针对每个语音命令执行认证处理,而不省略认证处理。
虽然实施例中未特别提及,但网关装置330可以通过远程控制来取消说话者的登记,以防网关装置330被盗等。
在实施例中,第一DB 211、第二DB 212和第三DB 213是物理上不同的数据库。然而,实施例不限于此。第一DB 211、第二DB 212和第三DB 213可以由一个数据库形成,并且通过设置访问权限相互虚拟地隔离开。
在实施例中,第一DB 211、第二DB 212和第三DB 213设置在设备管理装置200中。然而,实施例不限于此。第一DB 211、第二DB 212和第三DB 213中的至少任一个可以设置在经由网络120连接到设备管理装置200的服务器中。
虽然实施例中未特别提及,但设备管理装置200的功能可以由云服务来提供。
在实施例中,禁止网关装置330访问第二DB 212的访问控制器设置在设备管理装置200中。然而,实施例不限于此。禁止网关装置330访问第二信息的访问控制器可以设置在网关装置330中。换言之,网关装置330可以自主禁止自身访问第二DB 212。
在实施例中,控制设备310的控制装置是EMS 320。然而,实施例不限于此。控制装置可以是设备310本身。控制装置可以是向设备310发送控制命令的远程控制器。
虽然实施例中未特别提及,但设备管理装置200(控制器230)可以针对访问设备信息的每个实体,设置对包括在设备信息中的信元的访问权限。例如,设备管理装置200可以允许EMS 320访问感测数据,但禁止合约商终端400访问感测数据。备选地,设备管理装置200可以允许合约商终端400访问运行历史,但禁止EMS 320访问统计数据。
在实施例中,访问设备信息的实体是EMS 320和合约商终端400。然而,实施例不限于此。实体可以是属于设备310的用户的用户终端。在这种情况下,设备管理装置200可以允许该用户终端访问运行历史,但禁止该用户终端访问感测数据。
虽然实施例中未特别提及,但设备信息可以包括诸如安装日期、预定使用年限和额定功耗之类的基本信息。
虽然实施例中未特别提及,但由上述网关装置330(控制器333)执行的至少部分处理可以由EMS 320(包括在EMS 320中的控制器)或设备管理装置200(控制器230)来执行。例如,由网关装置330(控制器333)执行的上述登记处理和认证处理由EMS 320(包括在EMS320中的控制器)或设备管理装置200(控制器221)来执行。EMS 320(包括在EMS 320中的控制器)或设备管理装置200(控制器221)从网关装置330获取关于说话者的语音的必要信息,并且可以基于这些信息来执行登记处理和认证处理。

Claims (15)

1.一种语音命令系统,包括:
网关装置,具有配置成接收语音命令的接口,
所述网关装置具有:控制器,配置成执行登记处理,所述登记处理登记说话者,所述说话者的语音命令被允许接收,其中
所述控制器配置成执行认证处理,其中当所述语音命令的说话者未登记时,拒绝接收所述语音命令,以及当所述语音命令的说话者已登记时,允许接收所述语音命令,并且
所述控制器配置成针对每个语音命令执行所述认证处理,
其中所述控制器配置成在设备的安装操作时段期间执行所述登记处理和所述认证处理,
所述安装操作时段是接收安装者的语音输入的时段,
所述说话者是所述安装者,
所述控制器配置成当允许接收所述语音命令时,基于所述语音命令访问第一外部数据库,并且从所述第一外部数据库获取对应于所述语音命令的安装信息,并对所述安装信息进行语音输出,
所述安装信息包括指示所述设备的安装过程的信息,
允许所述网关装置访问所述第一外部数据库,但禁止所述网关装置访问存储有所述设备的设备信息的第二外部数据库。
2.根据权利要求1所述的语音命令系统,其中所述网关装置包括所述控制器。
3.根据权利要求1所述的语音命令系统,其中所述控制器配置成在所述安装操作时段结束的情况下,取消通过所述安装操作时段中的所述登记处理执行的对说话者的登记。
4.根据权利要求1或2所述的语音命令系统,其中所述控制器配置成通过确定说话者的声纹来执行所述认证处理。
5.根据权利要求1所述的语音命令系统,还包括:
第一数据库,配置成存储允许从所述网关装置访问的第一信息;
第二数据库,配置成存储禁止从所述网关装置访问的第二信息;以及
访问控制器,配置成允许从所述网关装置访问所述第一数据库和禁止从所述网关装置访问所述第二数据库,其中
所述外部数据库是所述第一数据库,并且
所述第二信息包括从控制所述设备的控制装置收集的设备信息。
6.根据权利要求5所述的语音命令系统,其中所述第一数据库和所述第二数据库是物理上不同的数据库。
7.根据权利要求5或6所述的语音命令系统,其中所述设备信息包括以下至少一项:感测数据,包括指示所述设备的运行状态的数值数据;错误代码,用于标识所述设备的错误;统计数据,通过对所述数值数据进行统计处理而获得;参考数据,包括与所述数值数据进行比较的阈值;以及所述设备的运行历史。
8.一种语音命令系统,包括:
网关装置,具有配置成接收语音命令的接口,
所述网关装置具有:控制器,配置成执行登记处理,所述登记处理登记说话者,所述说话者的语音命令被允许接收,其中
所述控制器配置成执行认证处理,其中当所述语音命令的说话者未登记时,拒绝接收所述语音命令,以及当所述语音命令的说话者已登记时,允许接收所述语音命令,并且
所述控制器配置成针对每个语音命令执行所述认证处理,
其中所述控制器配置成在设备的检查时段期间执行所述登记处理和所述认证处理,
所述检查时段是接收检查者的语音输入的时段,
所述说话者是所述检查者,
所述控制器配置成当允许接收所述语音命令时,基于所述语音命令访问第一外部数据库,并且从所述第一外部数据库获取对应于所述语音命令的检查信息,并对所述检查信息进行语音输出,
所述检查信息包括指示所述设备的检查过程的信息,
允许所述网关装置访问所述第一外部数据库,但禁止所述网关装置访问存储有所述设备的设备信息的第二外部数据库。
9.根据权利要求8所述的语音命令系统,其中所述控制器配置成在所述检查时段结束的情况下,取消通过所述检查时段中的所述登记处理执行的对说话者的登记。
10.根据权利要求8所述的语音命令系统,其中所述控制器配置成在所述检查时段期间,基于说话者的语音输入来执行签名处理。
11.根据权利要求10所述的语音命令系统,其中所述控制器配置成通过所述签名处理来结束所述检查时段。
12.一种语音命令系统,包括:
网关装置,具有配置成接收语音命令的接口,
所述网关装置具有:控制器,配置成执行登记处理,所述登记处理登记说话者,所述说话者的语音命令被允许接收,其中
所述控制器配置成执行认证处理,其中当所述语音命令的说话者未登记时,拒绝接收所述语音命令,以及当所述语音命令的说话者已登记时,允许接收所述语音命令,并且
所述控制器配置成针对每个语音命令执行所述认证处理,
其中所述控制器配置成在设备的使用时段期间执行所述登记处理和所述认证处理,
所述使用时段是接收设备的用户的语音输入的时段,
所述说话者是所述设备的所述用户,
所述控制器配置成当允许接收所述语音命令时,基于所述语音命令访问第一外部数据库,并且从所述第一外部数据库获取对应于所述语音命令的使用信息,并对所述使用信息进行语音输出,
所述使用信息包括指示所述设备的使用过程的信息,
允许所述网关装置访问所述第一外部数据库,但禁止所述网关装置访问存储有所述设备的设备信息的第二外部数据库。
13.一种语音命令方法,包括以下步骤:
(A)接收语音命令;
(B)执行登记处理,所述登记处理登记说话者,所述说话者的语音命令被允许接收;以及
(C)执行认证处理,其中当所述语音命令的说话者未登记时,拒绝接收所述语音命令,以及当所述语音命令的说话者已登记时,允许接收所述语音命令,其中
所述步骤(C)针对每个语音命令执行,
其中在设备的安装操作时段期间执行所述步骤(B)和所述步骤(C),
所述安装操作时段是接收安装者的语音输入的时段,
所述说话者是所述安装者,
当允许接收所述语音命令时,基于所述语音命令访问第一外部数据库,并且从所述第一外部数据库获取对应于所述语音命令的安装信息,并对所述安装信息进行语音输出,
所述安装信息包括指示所述设备的安装过程的信息,
允许访问所述第一外部数据库,但禁止访问存储有所述设备的设备信息的第二外部数据库。
14.一种语音命令方法,包括以下步骤:
(A)接收语音命令;
(B)执行登记处理,所述登记处理登记说话者,所述说话者的语音命令被允许接收;以及
(C)执行认证处理,其中当所述语音命令的说话者未登记时,拒绝接收所述语音命令,以及当所述语音命令的说话者已登记时,允许接收所述语音命令,其中
所述步骤(C)针对每个语音命令执行,
其中在设备的检查时段期间执行所述步骤(B)和所述步骤(C),
所述检查时段是接收检查者的语音输入的时段,
所述说话者是所述检查者,
当允许接收所述语音命令时,基于所述语音命令访问第一外部数据库,并且从所述第一外部数据库获取对应于所述语音命令的检查信息,并对所述检查信息进行语音输出,
所述检查信息包括指示所述设备的检查过程的信息,
允许访问所述第一外部数据库,但禁止访问存储有所述设备的设备信息的第二外部数据库。
15.一种语音命令方法,包括以下步骤:
(A)接收语音命令;
(B)执行登记处理,所述登记处理登记说话者,所述说话者的语音命令被允许接收;以及
(C)执行认证处理,其中当所述语音命令的说话者未登记时,拒绝接收所述语音命令,以及当所述语音命令的说话者已登记时,允许接收所述语音命令,其中
所述步骤(C)针对每个语音命令执行,
其中在设备的使用时段期间执行所述步骤(B)和所述步骤(C),
所述使用时段是接收设备的用户的语音输入的时段,
所述说话者是所述设备的所述用户,
当允许接收所述语音命令时,基于所述语音命令访问第一外部数据库,并且从所述第一外部数据库获取对应于所述语音命令的使用信息,并对所述使用信息进行语音输出,
所述使用信息包括指示所述设备的使用过程的信息,
允许访问所述第一外部数据库,但禁止访问存储有所述设备的设备信息的第二外部数据库。
CN202410180704.5A 2017-09-28 2018-09-26 语音命令系统和语音命令方法 Pending CN117935804A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2017-188264 2017-09-28
JP2017188264 2017-09-28
PCT/JP2018/035687 WO2019065733A1 (ja) 2017-09-28 2018-09-26 音声命令システム及び音声命令方法
CN201880062699.0A CN111149152A (zh) 2017-09-28 2018-09-26 语音命令系统和语音命令方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201880062699.0A Division CN111149152A (zh) 2017-09-28 2018-09-26 语音命令系统和语音命令方法

Publications (1)

Publication Number Publication Date
CN117935804A true CN117935804A (zh) 2024-04-26

Family

ID=65902455

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201880062699.0A Pending CN111149152A (zh) 2017-09-28 2018-09-26 语音命令系统和语音命令方法
CN202410180704.5A Pending CN117935804A (zh) 2017-09-28 2018-09-26 语音命令系统和语音命令方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201880062699.0A Pending CN111149152A (zh) 2017-09-28 2018-09-26 语音命令系统和语音命令方法

Country Status (5)

Country Link
US (2) US11521609B2 (zh)
EP (1) EP3690878A4 (zh)
JP (1) JP6972149B2 (zh)
CN (2) CN111149152A (zh)
WO (1) WO2019065733A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6972149B2 (ja) * 2017-09-28 2021-11-24 京セラ株式会社 音声命令システム及び音声命令方法
RU2744063C1 (ru) * 2018-12-18 2021-03-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и система определения говорящего пользователя управляемого голосом устройства
US11017773B2 (en) * 2019-07-09 2021-05-25 Bank Of America Corporation Voice-based time-sensitive task processing over a high generation cellular network
CN112447177B (zh) * 2019-09-04 2022-08-23 思必驰科技股份有限公司 全双工语音对话方法及系统
JP6841948B1 (ja) * 2020-02-04 2021-03-10 東芝エレベータ株式会社 検査データ入力装置および検査データ入力方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS596209U (ja) * 1982-07-02 1984-01-14 株式会社日立製作所 プラント監視装置の音声入力装置
JPS61138999A (ja) * 1984-12-12 1986-06-26 株式会社神戸製鋼所 音声認識装置
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
JP2002251199A (ja) * 2001-02-27 2002-09-06 Ricoh Co Ltd 音声入力情報処理装置
JP2003271565A (ja) * 2002-03-15 2003-09-26 Matsushita Electric Ind Co Ltd 本人認証システム、本人認証端末、読取装置および本人認証方法
JP2005248542A (ja) * 2004-03-03 2005-09-15 Toshiba Corp 認証システム及び認証方法
US7917949B2 (en) * 2005-12-21 2011-03-29 Sandisk Corporation Voice controlled portable memory storage device
CN101192925A (zh) * 2006-11-20 2008-06-04 华为技术有限公司 说话人验证方法和系统及媒体资源控制实体和处理实体
JP5469589B2 (ja) * 2010-12-07 2014-04-16 株式会社日立製作所 プラント設備管理保守支援システム及び管理保守方法
KR101800887B1 (ko) * 2010-12-16 2017-11-23 엘지전자 주식회사 네트워크 시스템
US9262612B2 (en) * 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
JP2012256276A (ja) 2011-06-10 2012-12-27 Hitachi Systems Ltd データセンタナビゲーションシステム
US8818810B2 (en) * 2011-12-29 2014-08-26 Robert Bosch Gmbh Speaker verification in a health monitoring system
US9881616B2 (en) * 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
EP3043348B1 (en) 2013-09-03 2017-10-04 Panasonic Intellectual Property Corporation of America Voice interaction control method
US9343068B2 (en) * 2013-09-16 2016-05-17 Qualcomm Incorporated Method and apparatus for controlling access to applications having different security levels
US20150162004A1 (en) * 2013-12-09 2015-06-11 Erwin Goesnar Media content consumption with acoustic user identification
US9900177B2 (en) * 2013-12-11 2018-02-20 Echostar Technologies International Corporation Maintaining up-to-date home automation models
JP2015215433A (ja) * 2014-05-09 2015-12-03 株式会社ナビタイムジャパン 情報提供システム、端末装置、情報提供サーバ、情報提供方法、および、プログラム
WO2016128475A1 (en) * 2015-02-11 2016-08-18 Bang & Olufsen A/S Speaker recognition in multimedia system
US10798548B2 (en) * 2016-08-22 2020-10-06 Lg Electronics Inc. Method for controlling device by using Bluetooth technology, and apparatus
US20190043509A1 (en) * 2017-08-04 2019-02-07 Cirrus Logic International Semiconductor Ltd. Audio privacy based on user identification
JP6972149B2 (ja) * 2017-09-28 2021-11-24 京セラ株式会社 音声命令システム及び音声命令方法

Also Published As

Publication number Publication date
JP6972149B2 (ja) 2021-11-24
JPWO2019065733A1 (ja) 2020-10-22
US20230162734A1 (en) 2023-05-25
EP3690878A4 (en) 2021-06-09
US12002467B2 (en) 2024-06-04
CN111149152A (zh) 2020-05-12
WO2019065733A1 (ja) 2019-04-04
US11521609B2 (en) 2022-12-06
US20200273457A1 (en) 2020-08-27
EP3690878A1 (en) 2020-08-05

Similar Documents

Publication Publication Date Title
CN117935804A (zh) 语音命令系统和语音命令方法
US12033119B2 (en) Integrated home scoring system
US10080149B2 (en) Coverage solution recommendation tool
US20160353488A1 (en) Freeing up mobile network for important phone calls in case of disaster
EP2994828A1 (en) Apps store with integrated test support
EP3777082A1 (en) Trusted platform module-based prepaid access token for commercial iot online services
KR101746646B1 (ko) 사물인터넷 어플리케이션의 사용 중 품질 관리 방법, 이를 수행하기 위한 기록매체 및 장치
JP7534457B2 (ja) 設備管理システム及び設備管理方法
US20200302352A1 (en) Cognitive system for automatic risk assessment, solution identification, and action enablement
KR20200048929A (ko) 순찰 관리 장치 및 방법
KR102231648B1 (ko) 소방시설의 점검 이력 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록 매체
US20150140957A1 (en) Prepaid phone card charging
CN116048589A (zh) 配置变更的校验方法、装置、计算机设备以及存储介质
CN115098326A (zh) 一种系统异常检测方法及装置、存储介质及电子设备
US11537743B2 (en) Equipment management system and equipment management method
US20240184873A1 (en) Verification method, verification device, and program
JP6475812B1 (ja) 供給地点登録チェック方法、コンピュータおよびプログラム
JP2023003310A (ja) 電力制御システム、情報処理モジュール、及び、情報処理方法
KR101656789B1 (ko) 활용도 기반 건물 자산관리를 통한 우선순위 의사결정 지원방법
CA3239610A1 (en) Operational intelligence platform
CN112565030A (zh) 基于消息队列遥测传输的边缘网关代理方法、装置
CA3088080A1 (en) Integrated home scoring system
CN113535780A (zh) 用户请求处理方法、装置、计算机设备和存储介质
CN110716963A (zh) 提供自适应配置的用户数据的方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination