WO2019107224A1 - 機器制御システム、機器制御方法、及びプログラム - Google Patents

機器制御システム、機器制御方法、及びプログラム Download PDF

Info

Publication number
WO2019107224A1
WO2019107224A1 PCT/JP2018/042864 JP2018042864W WO2019107224A1 WO 2019107224 A1 WO2019107224 A1 WO 2019107224A1 JP 2018042864 W JP2018042864 W JP 2018042864W WO 2019107224 A1 WO2019107224 A1 WO 2019107224A1
Authority
WO
WIPO (PCT)
Prior art keywords
phrase
user
unit
command
registration
Prior art date
Application number
PCT/JP2018/042864
Other languages
English (en)
French (fr)
Inventor
須山 明彦
和也 虫壁
啓介 塚田
Original Assignee
ヤマハ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヤマハ株式会社 filed Critical ヤマハ株式会社
Priority to CN201880077883.2A priority Critical patent/CN111433736B/zh
Priority to EP18884611.7A priority patent/EP3719630A4/en
Publication of WO2019107224A1 publication Critical patent/WO2019107224A1/ja
Priority to US16/888,279 priority patent/US11574631B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C17/00Arrangements for transmitting signals characterised by the use of a wireless electrical link
    • G08C17/02Arrangements for transmitting signals characterised by the use of a wireless electrical link using a radio link
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C2201/00Transmission systems of control signals via wireless link
    • G08C2201/20Binding and programming of remote control devices
    • G08C2201/21Programming remote control devices via third means
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C2201/00Transmission systems of control signals via wireless link
    • G08C2201/30User interface
    • G08C2201/31Voice input
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Definitions

  • the present invention relates to an apparatus control system, an apparatus control method, and a program.
  • the present invention has been made in view of the above problems, and an object thereof is to provide a technology that allows a user to easily and reliably obtain a phrase acceptable for voice input.
  • a device control system concerning the present invention generates a phrase which can control the device based on setting acquisition means which acquires user setting about a device, and the acquired user setting acquired.
  • a phrase generation unit and a display data output unit that outputs data for displaying the generated phrase.
  • a step of acquiring a user setting regarding a device a step of generating a phrase capable of controlling the device based on the acquired user setting, and the generated phrase Outputting the data for displaying.
  • a program includes: a setting acquisition unit configured to acquire a user setting regarding a device; a phrase generation unit configured to generate a phrase capable of controlling the device based on the acquired user setting;
  • the computer functions as display data output means for outputting data for displaying the phrase.
  • FIG. 1 shows a configuration of a device control system according to an embodiment of the present invention.
  • the device control system 1 includes a first device 20-1, a second device 20-2, a third device 20-3, a voice input device 30, a voice recognition device 40, and a command processing system 50.
  • the first device 20-1, the second device 20-2, and the third device 20-3 may be collectively referred to as "device 20".
  • the device 20 and the voice input device 30 are installed in the local area and connected to the LAN 2.
  • the LAN 2 may be a wired LAN or a wireless LAN.
  • the LAN 2 is connected to the Internet 6 via the router 4.
  • the speech recognition device 40 and the command processing system 50 are installed outside the local area. That is, as viewed from the device 20 and the voice input device 30, the voice recognition device 40 and the command processing system 50 are installed on the Internet 6 side.
  • the “local area” is an area of a limited range in which communication via the LAN 2 is possible.
  • the device 20 is a device to be controlled by the device control system 1. Although three devices 20 are shown in FIG. 1, four or more devices 20 may be included, or only two or less devices 20 may be included.
  • device 20 is an audio device or an audiovisual device.
  • the device 20 is an AV receiver, an AV amplifier, a speaker, an optical disk reproducing device (such as a Blu-ray Disc (registered trademark) player or a DVD (registered trademark) player), or a television receiver.
  • the device 20 may be a musical instrument (such as an electronic musical instrument or an electric musical instrument).
  • the device 20 may be any other device.
  • the first device 20-1 is an AV receiver
  • the second device 20-2 is a television receiver
  • the third device 20-3 is a Blu-ray Disc player.
  • the second device 20-2 is connected to the first HDMI terminal (HDMI 1) of the first device 20-1 via an HDMI (High-Definition Multimedia Interface (registered trademark) cable), and the third device 20-3 is an HDMI cable , And is connected to the second HDMI terminal (HDMI 2) of the first device 20-1.
  • HDMI High-Definition Multimedia Interface
  • HDMI 2 High-Definition Multimedia Interface
  • the private IP addresses “192.168.0.2”, “192.168.0.3”, and “192.168.0.4” are the first device 20-1 and the second device 20-2, respectively. It is set for the third device 20-3.
  • the first device 20-1 includes a control unit 21, a storage unit 22, and a communication unit 23.
  • the control unit 21 includes at least one microprocessor (CPU), and executes processing in accordance with a program stored in the storage unit 22.
  • the storage unit 22 includes a main storage unit (for example, a RAM) and an auxiliary storage unit (for example, a non-volatile semiconductor memory or a hard disk drive).
  • the storage unit 22 is for storing programs and data.
  • the communication unit 23 is for transmitting and receiving data to and from another device.
  • the second device 20-2 and the third device 20-3 also include the control unit 21, the storage unit 22, and the communication unit 23.
  • the device 20 may have a configuration (for example, an optical disk drive or a memory card slot) for reading a program or data stored in an information storage medium (for example, an optical disk or a memory card). Then, the program may be supplied to the device 20 via the information storage medium. The program may be supplied to the device 20 via the Internet 6.
  • a configuration for example, an optical disk drive or a memory card slot
  • an information storage medium for example, an optical disk or a memory card
  • the voice input device 30 includes a microphone and receives voice input.
  • the voice input device 30 is used to allow the user to voice input an operation instruction to the device 20.
  • the user can input "AAA ask MC to turn on the Living Room” etc.
  • “AAA” is a word (Wake word) for starting voice input to the voice input device 30 and is, for example, the name of the voice input device 30, and “MC” is a name of the command processing system 50. is there.
  • the voice data indicating the voice (phrase) input to the voice input device 30 is transmitted to the voice recognition device 40 via the Internet 6 together with the user ID.
  • the speech recognition device 40 is realized by, for example, a server computer.
  • the speech recognition apparatus 40 may be realized by a plurality of servers by so-called cloud computing.
  • the voice recognition device 40 performs voice recognition processing to convert voice data into data in a format that can be easily understood by a program (command processing system 50).
  • the speech recognition apparatus 40 generates, from speech data of a phrase, an operation instruction of a predetermined format including a character string indicating the type of instruction of the user and the target of the instruction. Then, the operation instruction is transmitted to the command processing system 50 together with the user ID.
  • the user ID may be assigned by any Internet-side device (process) until the voice data is transmitted to the command processing system 50.
  • the voice recognition device 40 transmits an operation instruction to the command processing system 50 capable of processing the content of the phrase according to the content of the voice transmitted from the user, for example, a specific word group in the phrase. Can.
  • the user registers in advance the command processing system 50 to be used in the speech recognition apparatus 40.
  • the voice recognition device 40 selects one of the registered command processing systems 50 based on the words in the phrase input by the user, and transmits an operation instruction to the selected command processing system 50.
  • the voice recognition device 40 may receive a plurality of types of phrases for a specific device 20 and control the device 20 via the command data transmission device 10 according to the type. For example, depending on the type of phrase, the format of the wording of the instruction in the phrase is different.
  • the phrase activating the device 20 whose name is "Living Room” is "AAA ask MC to turn on the Living Room”
  • the device The phrase for activating 20 is "AAA turn on the Living Room”.
  • the phrase includes "MC" which is a name identifying the command processing system 50
  • the phrase does not include the name. It is set by the user as to whether the voice recognition device 40 receives the first type of phrase and transmits the operation instruction or receives the second type of phrase and transmits the operation instruction. Details of this setting will be described later.
  • the command processing system 50 that becomes the transmission destination when the speech recognition device 40 receives the first type of phrase may be different from that of the second type.
  • the user terminal 60 receives a physical operation such as a touch operation by the user and controls the device 20. Further, the user terminal 60 sets the command processing system 50 and the voice recognition device 40 based on the user's operation.
  • the user terminal 60 is, for example, a smartphone or a personal computer.
  • the user terminal 60 includes a control unit 61, a storage unit 62, and a communication unit 63.
  • the control unit 61, the storage unit 62, and the communication unit 63 are similar to the control unit 21, the storage unit 22, and the communication unit 23.
  • the command processing system 50 includes a command data transmitting device 10, a database 52, and a Message Queuing Telemetry Transport (MQTT) server 53.
  • the database 52 stores various data.
  • the database 52 stores information on the devices 20 owned by each user.
  • FIG. 2 shows an example of the device table stored in the database 52.
  • the device table T1 is stored for each user (in association with the user ID).
  • the user ID used by the command processing system 50 (database 52), the user terminal 60 and the device 20 may be different from or the same as the user ID used by the voice input device 30 and the voice recognition device 40. It may be.
  • correspondence data for converting the user IDs is stored in the command processing system 50 or the voice recognition device 40.
  • the device table T1 includes “ID”, “name”, “device ID”, “IP address”, “command type”, “terminal”, “connection destination”, “reception availability”, “reception Contains the Possible Command field.
  • the “ID” field indicates information that uniquely identifies each device 20 owned by the user.
  • the first device 20-1 corresponds to the device ID "1”
  • the second device 20-2 corresponds to the device ID "2”.
  • the "name” field indicates the name of the device 20. This name is used by the user to designate the device 20 that is the target of the operation instruction. As the name, any name set by the user may be used, or an initial name set by, for example, the manufacturer of the device 20 may be used, and correction may be made possible by the user.
  • the “device ID” field is a device ID that uniquely identifies the device 20 only by this.
  • the device ID may be the MAC address of the device 20 or may be an ID generated based on the MAC address.
  • the “IP address” field indicates an IP address set for a wired or wireless network interface card provided in the device 20.
  • the “command type” field indicates the type (system) of command used in the device 20.
  • the “terminal” field indicates a list of input terminals provided in the device 20. In the “connection destination” field, when the device 20 is connected to the input terminal of another device 20 and the sound output from the device 20 is input to the other device 20, the other device to which the device 20 is connected Show 20 input terminals.
  • the “Receivable” field indicates whether or not the message including the command can be received via the Internet 6.
  • the messages will be described later. For example, “0” or “1” is registered in the “reception availability” field. “0” indicates that the message can not be received via the Internet 6, and “1” indicates that the message can be received via the Internet 6.
  • the “acceptable command” field indicates a list of commands that can be accepted by the device 20. If "Power” is set in the list of "Available commands” field, it indicates that the device can be started from the standby state by an external command, and if not set, from the standby state Indicates that it can not be started. Also, if “Volume” is set in the list of "Available commands” field, this indicates that the device can control the volume by an external command, and if not set, the volume is set. Indicates that it can not be controlled.
  • the data of the device table T1 is registered by each user.
  • the user accesses the command data transmission apparatus 10 from the user terminal 60 to register information of the device 20 owned by the user in the device table T1. Details of the registration will be described later.
  • the database 52 also stores data other than the device table T1.
  • the database 52 stores a user and data indicating types of phrases that can be input by the user for the device 20 in association with each other.
  • data indicating the correspondence between the operation instruction and the command (in other words, data for converting the operation instruction into a command) may be stored in the database 52.
  • the command data transmission device 10 is realized by, for example, a server computer. As shown in FIG. 1, the command data transmission device 10 includes a control unit 11, a storage unit 12, and a communication unit 13. The control unit 11, the storage unit 12, and the communication unit 13 are similar to the control unit 21, the storage unit 22, and the communication unit 23.
  • the command data transmitting apparatus 10 may be provided with a component (for example, an optical disk drive or a memory card slot or the like) for reading a program or data stored in an information storage medium (for example, an optical disk or a memory card). Then, the program may be supplied to the command data transmitting apparatus 10 via the information storage medium. The program may be supplied to the command data transmitter 10 via the Internet 6.
  • the command data transmitter 10 can access the database 52.
  • the command data transmission device 10 and the database 52 may be realized by one server computer or may be realized by another server computer.
  • the command data transmission device 10 receives an operation instruction for the device 20 transmitted from the voice recognition device 40, generates a message including a command based on the operation instruction, and transmits the message to the device 20. More specifically, the message is sent to the device 20 via the MQTT server 53.
  • the MQTT server 53 is for transmitting and receiving data using the MQTT protocol.
  • the command data transmission device 10 and the MQTT server 53 may be realized by one server computer or may be realized by another server computer.
  • FIG. 3 is a block diagram showing functions implemented by command data transmitting device 10, device 20 and user terminal 60. Referring to FIG. 3
  • the command data transmitting apparatus 10 includes an operation instruction receiving unit 110, a message generating unit 120, a message transmitting unit 130, a device information acquisition unit 140, a voice usage registration unit 150, a device registration unit 160, and a registration result transmission. Part 170 is included.
  • Control unit 11 stores operation command reception unit 110, message generation unit 120, message transmission unit 130, device information acquisition unit 140, voice usage registration unit 150, device registration unit 160, and registration result transmission unit 170 in storage unit 12. It is realized by executing the program of each function.
  • the device 20 includes a message receiving unit 210, a command execution unit 220, a device information transmitting unit 230, and a setting unit 260.
  • the message reception unit 210, the command execution unit 220, the device information transmission unit 230, and the setting unit 260 are realized by the control unit 21 executing programs of the respective functions stored in the storage unit 22.
  • the user terminal 60 includes a registration control unit 610, a setting acquisition unit 620, a phrase generation unit 630, and a phrase output unit 640.
  • the registration control unit 610, the setting acquisition unit 620, the phrase generation unit 630, and the phrase output unit 640 are realized by the control unit 61 executing a program of each function stored in the storage unit 62.
  • the operation instruction accepting unit 110 accepts an operation instruction to the device 20.
  • the operation instruction receiving unit 110 receives, from the speech recognition device 40, an operation instruction converted by the speech recognition device 40 into data of a format that can be understood by a program such as text data.
  • the message generation unit 120 When the operation instruction receiving unit 110 receives an operation instruction to the device 20, the message generation unit 120 generates a message including a user ID and a command.
  • the user ID identifies the user involved in the operation instruction.
  • the command is data such as text for performing an operation according to the operation instruction.
  • FIG. 4 shows an example of the message D1.
  • the message D1 shown in FIG. 4 is an example of a message generated when an operation instruction to start the first device 20-1 from the standby state is accepted.
  • the message D1 includes the items “uid”, “type”, “id”, and "command”.
  • the item “uid” indicates the user ID of the user who instructed the operation. In the example shown in FIG. 4, the user ID “U1” is set to the item “uid”.
  • the item “type” indicates the type of data. In the example shown in FIG. 4, “cmd” is set to the item “type”. This indicates that the message contains a command.
  • the item “id” indicates identification information that uniquely identifies the message.
  • the data set in the item “command” indicates the content of the command.
  • the item “command” includes the items “ip", “path” and “method”.
  • the item “ip” indicates the destination of the command. In the example of FIG. 4, the IP address of the first device 20-1 is set to the item “ip”.
  • the item "path” corresponds to the command body.
  • the item “method” indicates the HTTP protocol method to be used.
  • the message transmission unit 130 transmits the message generated by the message generation unit 120 to the device 20.
  • the message transmission unit 130 transmits the other device 20.
  • the message may be sent to another device 20 to transfer the content of the message to the target device 20.
  • the message is sent to the device 20 using the MQTT protocol.
  • the message transmission unit 130 transmits a message to the device 20 via the MQTT server 53.
  • the MQTT server 53 has a plurality of topics. Identification information of each topic is set based on the device ID of the device 20.
  • the command data transmission device 10 publishes a message to a request-side topic having identification information corresponding to the device ID, and the device 20 has the identification information Get the messages published to the topic of. Communication between the command processing system 50 and the device 20 may be performed by a protocol different from the MQTT protocol.
  • the message receiving unit 210 receives the message via the Internet 6.
  • the command execution unit 220 executes a command based on the command included in the message.
  • the command execution unit 220 may directly interpret the command included in the message to directly control the device 20.
  • the command execution unit 220 also converts an internal execution unit that executes a command received via the LAN 2 from the user terminal 60 or the like in the local area, and a command included in the received message to the internal execution unit. And a converter for internally transmitting the converted command.
  • the device 20 may activate an HTTP daemon, and the internal execution unit may receive a command from the conversion unit via the HTTP protocol.
  • the registration control unit 610 enables the voice recognition device 40 to receive, for the user, a phrase of at least one of the first type and the second type, and transmit an operation instruction to the command processing system 50. More specifically, the registration control unit 610 causes the speech recognition device 40 and the command processing system 50 to execute processing of use registration for this user. Further, the registration control unit 610 registers the device 20 that is the target of an instruction by voice input in the command processing system 50 based on the user's operation.
  • the setting acquisition unit 620 detects the device 20 connected to the local area, and acquires device information including the name of the device 20 in the voice input of the device 20 from the detected device 20. Further, the setting acquisition unit 620 acquires, from the registration control unit 610 or the command processing system 50, information indicating the types of phrases that can be accepted by the voice recognition device 40. The device information and the information indicating the type of phrase are collectively described as user setting below. This is because the name of the device 20 in voice input and the type of available phrase are items that can be set by the user.
  • the registration control unit 610 targets one or more devices 20 designated by the user among the detected devices 20 as instructions for voice input. The device 20 is registered.
  • the voice use registration unit 150 receives a request (use registration request) for the user to register use of the command processing system 50 by voice input from the registration control unit 610 of the user terminal 60, and the command data transmitting device 10 and the voice recognition device 40 cooperates with each other to execute processing for enabling voice input by the user.
  • the device registration unit 160 receives, from the registration control unit 610 of the user terminal 60, a request (device registration request) for registering the device 20 to be an instruction target by voice input, and registers the device 20 as a voice input target. .
  • the registration result transmission unit 170 transmits the result of registration of the device 20 (device registration result) and the template of the sample phrase.
  • the setting unit 260 receives a user ID registration instruction from the registration control unit 610 of the user terminal 60, and writes the user ID included in the user ID registration instruction in the non-volatile memory. In addition, the setting unit 260 receives a connection start instruction from the registration control unit 610 of the user terminal 60, makes connection with the MQTT server 53 included in the command processing system 50, and enables reception from the command processing system 50.
  • the phrase generation unit 630 generates a phrase capable of controlling the device 20 based on the user setting acquired by the setting acquisition unit 620.
  • the phrase output unit 640 outputs data for displaying the generated phrase. As the phrase output unit 640 outputs the data, the generated phrase is displayed on a device that can be viewed by the user, such as the display screen of the user terminal 60.
  • the device information acquisition unit 140 acquires device information of the device 20.
  • the device information acquisition unit 140 generates a message (hereinafter referred to as “device information request”), and transmits the message to the device 20 via the Internet 6.
  • the device information request includes a command for causing the device 20 of the device 20 to transmit the device information of the device 20 to the device information acquisition unit 140 and the user ID. More specifically, the device information acquisition unit 140 transmits a device information request to the device 20 via the MQTT server 53.
  • the generation and transmission of the device information request may also be performed by the message generation unit 120 and the message transmission unit 130.
  • the device information transmission unit 230 sends the device information of the device 20 back to the command data transmission device 10 via the Internet 6.
  • the device information includes, for example, model information of the device 20, a name by which the user specifies the device 20, a device ID, and an IP address.
  • the device information may also include current information indicating the current state of the device 20.
  • the device information transmission unit 230 transmits the device information to the command data transmission device via the MQTT server 53.
  • the device information acquisition unit 140 receives device information. Then, the device information acquisition unit 140 extracts necessary items from the received device information, and registers the items in the device table T1.
  • the process of use registration of voice input is a process of enabling the speech recognition device 40 to receive one or more types of phrases for the user and transmit an operation instruction, and the command processing system 50 receives the operation instruction. And a process of registering information to enable. This process needs to be performed before the user uses the command processing system 50 by voice input.
  • FIG. 5 is a flowchart showing an example of voice input usage registration processing.
  • the processing performed by the voice usage registration unit 150 described below is executed by the control unit 11 executing a program of that function.
  • the processing performed by the registration control unit 610 is executed by the control unit 61 executing a program of that function.
  • the registration control unit 610 of the user terminal 60 transmits a usage registration request to the command processing system 50 when the start of the usage registration process is instructed by the user (step S111). Also, the voice usage registration unit 150 of the command data transmission device 10 receives the usage registration request via the communication unit 13 (step S121).
  • the usage registration request includes information indicating a voice recognition device 40 that receives a voice input and a command processing system 50 that processes an operation instruction, which is specified directly or indirectly by the user.
  • the registration control unit 610 transmits the authentication information of the user (step S112), and the voice usage registration unit 150 receives the authentication information of the user via the communication unit 13 (step S122).
  • the authentication information transmitted from the user terminal 60 may be, for example, a user ID and a password.
  • the registration control unit 610 acquires the user identification information and password inputted by the user to the authentication server and acquired from the authentication server.
  • the registration control unit 610 may transmit access permission information (a type of token) as authentication information.
  • the registration control unit 610 may obtain the user ID from the authentication server using the access permission information.
  • the user ID input here may be different from the user ID used by the command processing system 50 and the device 20.
  • the voice usage registration unit 150 may generate the hash value of the user ID included in the authentication information as a user ID used in the subsequent process.
  • the voice use registration unit 150 sets that the voice recognition device 40 receives voice input according to the first type of phrase from the user, and the voice recognition device 40 uses the first type of phrase.
  • the operation instruction is set to be transmitted to the command processing system 50 (step S123).
  • FIG. 6 is a diagram showing an example of the voice input usage table.
  • the voice input usage table includes "user ID”, “first type registration", and “second type registration” fields.
  • the "user ID” is a key that uniquely identifies the record of the table.
  • the “first type registration” indicates whether or not the use registration process for accepting the first type of phrase is performed for the user in the “user ID” field.
  • the “second type registration” indicates whether or not the use registration process for accepting the second type of phrase is performed for the user in the “user ID” field.
  • the voice usage registration unit 150 transmits a response indicating whether the usage registration of the voice input is successful (step S125), and the registration control unit 610 registers the usage registration. A response is received (step S113).
  • FIG. 7 is a sequence diagram for explaining the device registration process.
  • FIG. 8 is a flowchart showing an example of processing of the user terminal 60 in device registration.
  • FIG. 9 is a flowchart showing an example of processing of the device 20 in device registration.
  • FIG. 10 is a flowchart showing an example of processing of the command data transmitting apparatus 10 in device registration.
  • the processing of the device registration unit 160, the registration result transmission unit 170, and the device information acquisition unit 140 is performed by the control unit 11 executing a program of the function.
  • the processing of the registration control unit 610, the setting acquisition unit 620, the phrase generation unit 630, and the phrase output unit 640 is performed by the control unit 61 executing a program of the function.
  • the processing of the device information transmission unit 230 and the setting unit 260 is performed by the control unit 21 executing a program of the function.
  • the registration control unit 610 of the user terminal 60 transmits a usage registration confirmation request to the command processing system 50 via the communication unit 63 when acquiring an instruction to start device registration from the user (step S211). More specifically, the usage registration confirmation request is information for inquiring whether the voice recognition device 40 has been registered for usage of one or more types of phrases.
  • the device registration unit 160 of the command data transmission device 10 receives the usage registration confirmation request, and transmits a usage registration confirmation response indicating the status of usage registration of voice recognition (step S251). More specifically, the device registration unit 160 acquires a record stored in the voice input usage table for the user who instructed the device registration start, and based on the values of the first type registration and second type registration fields, It responds with information indicating the type of phrase registered for use.
  • the usage registration confirmation response may include information indicating the user ID of the user operating the user terminal 60.
  • the registration control unit 610 of the user terminal 60 receives the use registration confirmation response, and stores information indicating the type of the phrase registered for use in the storage unit 62 (step S212).
  • an error message is transmitted as a use registration confirmation response, and the registration control unit 610 performs use registration for the user.
  • the setting acquisition unit 620 When receiving the usage registration confirmation response, the setting acquisition unit 620 detects one or more devices 20 connected to the local area (LAN 2), and transmits a device information request to the detected one or more devices 20 (see FIG. Step S213).
  • the device information transmission unit 230 of the device 20 receives the device information request, and transmits the device information to the user terminal 60 (step S221).
  • the device information includes the device name and device ID set by the user.
  • the setting acquisition unit 620 of the user terminal 60 receives the transmitted device information (step S214).
  • the registration control unit 610 transmits a user ID registration instruction to the searched device 20 (step S215).
  • the setting unit 260 of the device 20 receives the user ID registration instruction (step S222).
  • the user ID registration instruction includes information of a user ID to be registered in the device 20.
  • the setting unit 260 writes the user ID in the non-volatile memory (step S223).
  • the registration control unit 610 of the user terminal 60 transmits a connection start instruction to the MQTT server to the searched device (step S216).
  • the setting unit 260 of the device 20 receives the connection start instruction to the MQTT server 53 (step S224). Then, the setting unit 260 connects to the MQTT server 53 (step S 225), and makes the state capable of receiving an operation instruction from the MQTT server 53.
  • the registration control unit 610 of the user terminal 60 transmits a device registration request to the command processing system 50 (command data transmission device 10) (step S217).
  • the device registration request includes the user ID and the device ID of the device 20 to be registered.
  • the command data transmitting apparatus 10 receives a device registration request from the user terminal 60 (step S252).
  • the device registration request may include access permission information to the authentication server instead of the user ID.
  • the command data transmitting apparatus 10 may obtain the user ID or the information that is the source of the user ID from the authentication server using the access permission information.
  • the device registration unit 160 transmits a device information request to the device 20 having the device ID included in the device registration request (step S253).
  • the device information transmission unit 230 receives the device information request from the command processing system 50 (MQTT server 53), and transmits the device information to the command processing system 50 (step S226).
  • the device registration unit 160 receives the device information (step S254).
  • the device information includes information indicating a system of commands, information on an input terminal, information on another device 20 connected to the input terminal, information indicating whether a message can be received via the Internet 6, and the device 20 accepts Contains a list of possible commands.
  • the device registration unit 160 associates at least a part of the received device information (including the device ID) with the user ID, and stores it in the device table T1 of the database (step S255). Note that the device registration unit 160 may select and shape the information included in the device information and store the information in the device table T1.
  • the registration result transmission unit 170 uses the voice input usage registration condition, in other words, based on the types of phrases that the voice recognition device 40 can receive for the user.
  • a template for the phrase is selected (step S256). Further, the device registration unit 160 transmits, to the user terminal 60, a device registration result indicating whether the device registration has been completed and a template of the selected sample phrase (step S257).
  • FIG. 11 is a diagram showing an example of a sample phrase template.
  • the sample phrase is a phrase that can control the device 20 by the user's voice input.
  • FIG. 11 shows an example in which usage registration is performed for the first type and the second type of phrases.
  • the first template TP1 includes a template of a sample of a first type of phrase
  • the second template TP2 includes a template of a sample of a second type of phrase.
  • the sample text is a string set in the "sentence" item. Since the name of the device can be set by the user and can not be prepared in advance, a temporary character string "% s" is embedded in the sample text.
  • the character string set in the item “feature” indicates a command that the device 20 to be operated needs to have.
  • the phrase generation unit 630 receives the result of processing for the device registration request and the template of the sample phrase from the command processing system 50 (command data transmission device 10) (step S218).
  • the phrase generation unit 630 generates a sample phrase based on the received template, the user registration setting and the device name, and the phrase output unit 640 outputs the generated sample phrase (step S219). .
  • FIG. 12 is a flowchart showing an example of processing of the phrase generation unit 630 and the phrase output unit 640.
  • the phrase generation unit 630 selects the device 20 capable of executing the command required by the sample phrase, and acquires the name of the selected device 20 (step S311).
  • the phrase generation unit 630 collects, for example, the commands set in the item of the “feature” of the template, and all the collected in the field of the acceptable command among the records related to a certain user stored in the device table T1. Select the record in which the command exists, and obtain the device name included in the record.
  • the phrase generation unit 630 performs processing according to user setting (information indicating the type of the phrase registered for use and the name of the device). More specifically, the following processing is performed.
  • the phrase generation unit 630 determines whether the information indicating the type of the phrase registered for use indicates that the first type of phrase can be received (step S312).
  • the phrase generation unit 630 replaces the location of the device name in the wording of the first template TP1 with the selected device name Thus, a sample phrase is generated (step S313).
  • the phrase output unit 640 outputs the data of the sample phrase such that the generated sample phrase is displayed on the screen of the user terminal 60 (step S314).
  • the information indicating the type of the phrase registered for use does not indicate a state in which the first type of phrase can be received (N in step S312)
  • the processes in steps S313 and S314 are skipped.
  • FIG. 13 is a diagram showing an example of the displayed sample phrase.
  • the example of FIG. 13 is an example of a screen displayed based on the first template TP1 when the first type of phrase is set to be receivable.
  • the device 20 with the name "Living room” can process a volume operation command, and is output as a sample phrase.
  • the phrase generation unit 630 determines whether the information indicating the type of the phrase registered for use indicates that the second type of phrase can be received (step S315).
  • the phrase generation unit 630 replaces the position of the device name in the wording of the second template TP2 with the name of the selected device Thus, a sample phrase is generated (step S316).
  • the phrase output unit 640 outputs data of the sample phrase such that the generated sample phrase is displayed on the screen of the user terminal 60 (step S317).
  • the information indicating the type of the phrase registered for use does not indicate the state in which the second type of phrase can be received (N in step S315), the processes in steps S316 and S317 are skipped.
  • FIG. 14 is a diagram showing another example of the displayed sample phrases.
  • the example of FIG. 14 is an example of a screen displayed based on the second template TP2 when the second type of phrase is set to be receivable.
  • sample phrases shown as an example of command input it is possible to easily and reliably obtain sample phrases that can be accepted by the user in voice input. Further, by using the user setting for generating the sample phrase, even if the accepted phrase changes according to the user, the user does not have to read the text of the sample phrase. This allows the user to easily recognize the correct sample phrase to be accepted.
  • FIG. 15 is a flowchart showing an example of processing of the operation instruction receiving unit 110, the message generating unit 120, the message transmitting unit 130, the message receiving unit 210, and the command execution unit 220.
  • the processing of the operation instruction receiving unit 110, the message generation unit 120, and the message transmission unit 130 described below is executed by the control unit 11 executing a program of the function.
  • the processes of the message reception unit 210 and the command execution unit 220 are executed by the control unit 21 executing a program of the function.
  • the operation instruction receiving unit 110 acquires an operation instruction from the voice recognition device 40 (step S511). Then, the message generation unit 120 acquires the user ID of the user who is the target of the operation instruction based on the acquired operation instruction, and associates the user ID with the user ID based on the device name and the device table T1 included in the operation instruction. The device ID of the device 20 that is the target device ID of the operation instruction is acquired (step S512). Then, the message generation unit 120 generates a message including the command corresponding to the operation instruction and the acquired user ID (step S513), and the message transmission unit 130 is generated for the device 20 that is the target of the operation instruction. A message is sent (step S514).
  • the message reception unit 210 of the device 20 that is the target of the operation instruction receives the message (step S 521).
  • the message reception unit 210 compares the user ID included in the message with the user ID written to the non-volatile memory of the device 20 (step S522). If these user IDs are the same (Y of step S522), the command execution unit 220 executes the command included in the message (step S523). On the other hand, if these user IDs are different (N in step S522), the message is discarded and the command in the message is not executed.
  • the message reception unit 210 controls whether to execute a command according to the comparison result of the user ID. This can prevent unexpected operation of the device 20.
  • the device registration is not canceled on the command processing system 50 side while the device 20 is transferred, the device 20 conventionally receives a voice input of a command for the device 20 by mistake. There was a risk of malfunctioning due to commands.
  • the device 20 discards the message including the command no matter what command the transferred user inputs, and thus unexpected operation Can reduce the possibility of
  • the device control system comprises: setting acquisition means for acquiring a user setting regarding a device; phrase generation means for generating a phrase capable of controlling the device based on the acquired user setting; Display data output means for outputting data for displaying the selected phrase.
  • a device control method comprises the steps of acquiring a user setting regarding a device, generating a phrase capable of controlling the device based on the acquired user setting, and displaying the generated phrase. Outputting data to be output.
  • a program according to the present invention comprises a setting acquisition unit for acquiring a user setting relating to a device, a phrase generation unit for generating a phrase capable of controlling the device based on the acquired user setting, and the generated phrase And causes the computer to function as display data output means for outputting data to be displayed.
  • the setting acquisition unit acquires a name specifying the device in voice input
  • the phrase generation unit generates a phrase capable of controlling the device based on the acquired name.
  • the setting acquisition unit acquires a command that can be executed by each of a plurality of devices in voice input, and the phrase generation unit can execute the phrase based on a command that each of the plurality of devices can execute.
  • a frame may be generated that includes any of the names of multiple devices.
  • the setting acquisition unit acquires information indicating types of phrases acceptable as an instruction to the device by a recognition unit that recognizes a user's instruction voice, and the phrase generation unit generates the phrase
  • the means may generate a phrase capable of controlling the device based on the acquired information.
  • the recognition unit includes a first type of phrase including an identification name for identifying a system that acquires an operation instruction generated by the recognition unit and controls the device, and the identification name.
  • the phrase generation means is based on whether each of the first and second types of phrases is acceptable or not , And may generate a phrase capable of controlling the device.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Selective Calling Equipment (AREA)
  • Telephonic Communication Services (AREA)

Abstract

ユーザが音声入力において受付可能なフレーズを容易に得ること。 機器制御システムは、デバイスに関するユーザ設定を取得し、前記取得された前記ユーザ設定に基づいて、前記デバイスを制御可能なフレーズを生成し、前記生成されたフレーズを表示させるデータを出力する。

Description

機器制御システム、機器制御方法、及びプログラム
 本発明は機器制御システム、機器制御方法、及びプログラムに関する。
 近年は、例えばスマートフォンやスマートスピーカなど、音声認識を用いた音声入力により物理的な操作をしなくても手軽に操作できる機器が増加している。
 音声入力においては、指示として何らかのフレーズを入力することになる。ここで入力されるフレーズの文は本来的に自由度が高いため、ユーザは、音声入力としてどんなフレーズが受け付けられるかわからない。そこで、受け付け可能なフレーズを説明するマニュアルを整備する方法が考えられるが、定型フレーズしか案内することができない、そのため、全ユーザに共通するフレーズを案内することはできても、ユーザにより変化するフレーズを案内できないという問題があった。
 本発明は上記課題を鑑みてなされたものであって、その目的は、ユーザが音声入力において受付可能なフレーズを容易かつ確実に得ることが可能な技術を提供することにある。
 上記課題を解決するために、本発明に係る機器制御システムは、デバイスに関するユーザ設定を取得する設定取得手段と、前記取得された前記ユーザ設定に基づいて、前記デバイスを制御可能なフレーズを生成するフレーズ生成手段と、前記生成されたフレーズを表示させるデータを出力する表示データ出力手段と、を含む。
 また、本発明に係る機器制御方法は、デバイスに関するユーザ設定を取得するステップと、前記取得された前記ユーザ設定に基づいて、前記デバイスを制御可能なフレーズを生成するステップと、前記生成されたフレーズを表示させるデータを出力するステップと、を含む。
 また、本発明に係るプログラムは、デバイスに関するユーザ設定を取得する設定取得手段、前記取得された前記ユーザ設定に基づいて、前記デバイスを制御可能なフレーズを生成するフレーズ生成手段、および、前記生成されたフレーズを表示させるデータを出力する表示データ出力手段、としてコンピュータを機能させる。
 本発明によれば、ユーザが音声入力において受付可能なフレーズを容易に得ることが可能になる。
本発明の実施形態にかかる機器制御システムの構成を示す図である。 機器テーブルの一例を示す図である。 音声認識装置、コマンドデータ送信装置、機器およびユーザ端末により実現される機能を示すブロック図である。 メッセージの一例を示す図である。 音声入力の利用登録の処理の一例を示すフロー図である。 音声入力利用テーブルの一例を示す図である。 機器登録の処理を説明するシーケンス図である。 機器登録におけるユーザ端末の処理の例を示すフロー図である。 機器登録における機器の処理の例を示すフロー図である。 機器登録におけるコマンドデータ送信装置の処理の例を示すフロー図である。 サンプルフレーズのテンプレートの一例を示す図である。 フレーズ生成部およびフレーズ出力部の処理の例を示すフロー図である。 表示されるサンプルフレーズの一例を示す図である。 表示されるサンプルフレーズの他の一例を示す図である。 動作指示受付部、メッセージ生成部、メッセージ送信部、メッセージ受信部、コマンド実行部の処理の一例を示すフロー図である。
 以下、本発明の実施形態の例を図面に基づいて説明する。
 [1.システム構成]図1は、本発明の実施形態に係る機器制御システムの構成を示す。図1に示すように、機器制御システム1は、第1機器20-1、第2機器20-2、第3機器20-3、音声入力装置30、音声認識装置40、及びコマンド処理システム50を含む。以下では、第1機器20-1、第2機器20-2、および第3機器20-3を総称して「機器20」と記載する場合がある。
 機器20及び音声入力装置30はローカルエリアに設置され、LAN2に接続される。LAN2は有線LANであってもよいし、無線LANであってもよい。LAN2はルータ4を介してインターネット6に接続される。音声認識装置40及びコマンド処理システム50はローカルエリア外に設置される。すなわち、機器20及び音声入力装置30から見て、音声認識装置40及びコマンド処理システム50はインターネット6側に設置される。なお、「ローカルエリア」とは、LAN2を介した通信が可能な限られた範囲のエリアである。
 機器20は機器制御システム1による制御の対象となる機器である。図1では、3台の機器20が示されているが、4台以上の機器20が含まれていてもよいし、2台以下の機器20のみが含まれていてもよい。
 例えば、機器20はオーディオ機器又はオーディオビジュアル機器である。具体的には、機器20は、AVレシーバ、AVアンプ、スピーカ、光ディスク再生機器(ブルーレイディスク(登録商標)プレーヤ又はDVD(登録商標)プレーヤ等)、又はテレビジョン受像機である。また例えば、機器20は楽器(電子楽器又は電気楽器等)であってもよい。なお、機器20はこれら以外の機器であってもよい。
 以下では、第1機器20-1がAVレシーバであり、第2機器20-2がテレビジョン受像機であり、第3機器20-3がブルーレイディスクプレーヤである例を想定する。第2機器20-2はHDMI(High-Definition Multimedia Interface:登録商標)ケーブルを介して第1機器20-1の第1のHDMI端子(HDMI1)に接続され、第3機器20-3はHDMIケーブルを介して第1機器20-1の第2のHDMI端子(HDMI2)に接続されている。また、プライベートIPアドレス「192.168.0.2」、「192.168.0.3」、「192.168.0.4」がそれぞれ第1機器20-1、第2機器20-2、第3機器20-3に対して設定されている。
 図1に示すように、第1機器20-1は制御部21、記憶部22、及び通信部23を含む。制御部21は少なくとも一つのマイクロプロセッサ(CPU)を含み、記憶部22に記憶されたプログラムに従って処理を実行する。記憶部22は、主記憶部(例えばRAM)及び補助記憶部(例えば、不揮発性の半導体メモリ、またはハードディスクドライブ)を含む。記憶部22はプログラムやデータを記憶するためのものである。通信部23は他の装置との間でデータを送受信するためのものである。図1では省略されているが、第2機器20-2、および第3機器20-3も制御部21、記憶部22、及び通信部23を含む。
 なお、機器20は、情報記憶媒体(例えば光ディスク又はメモリカード等)に記憶されたプログラムやデータを読み取るための構成(例えば光ディスクドライブ又はメモリーカードスロット等)を備えてもよい。そして、プログラムが情報記憶媒体を介して機器20に供給されてもよい。プログラムはインターネット6を介して機器20に供給されてもよい。
 音声入力装置30はマイクロフォンを含み、音声入力を受け付ける。本実施形態では、ユーザが機器20への動作指示を音声入力するために音声入力装置30が使用される。例えば、X社が提供するコマンド処理システム50を介して、居間に設置された機器20をスタンバイ状態から起動させたい場合、ユーザは「AAA ask MC to turn on the Living Room」等を音声入力装置30に入力する。ここで、「AAA」は音声入力装置30に対する音声入力を開始させるための言葉(Wake word)であって、例えば音声入力装置30の名称であり、「MC」は、コマンド処理システム50の名称である。
 音声入力装置30に入力された音声(フレーズ)を示す音声データはユーザIDとともにインターネット6を介して音声認識装置40に送信される。音声認識装置40は例えばサーバコンピュータによって実現される。音声認識装置40はいわゆるクラウドコンピューティングにより、複数のサーバによって実現されてもよい。音声認識装置40は音声認識処理を実行することによって、音声データを、プログラム(コマンド処理システム50)によって理解しやすい形式のデータに変換する。例えば、音声認識装置40は、フレーズの音声データから、そのユーザの指示の種類と指示の対象とを示す文字列を含む所定形式の動作指示を生成する。そして、動作指示はユーザIDとともにコマンド処理システム50に送信される。なお、ユーザIDは、音声データがコマンド処理システム50に送信されるまでの間に、いずれかのインターネット側の装置(処理)によって付与されてもよい。
 ここで、音声認識装置40は、ユーザから送信される音声の内容、例えばフレーズ中の特定の単語群に応じて、そのフレーズの内容を処理できるコマンド処理システム50に対して動作指示を送信することができる。ユーザは、利用したいコマンド処理システム50を事前に音声認識装置40に登録する。音声認識装置40はユーザから入力されたフレーズ中の言葉に基づいて、登録されたコマンド処理システム50のうちいずれかを選択し、選択されたコマンド処理システム50へ動作指示を送信する。また、音声認識装置40は、特定の機器20に対して複数の種類のフレーズを受け付け、種類に応じたコマンドデータ送信装置10を介して機器20を制御してもよい。例えば、フレーズの種類により、フレーズにおける指示の文言のフォーマットが異なっている。
 例えば、フレーズの第1の種類では、名称が「Living Room」である機器20を起動させるフレーズは、「AAA ask MC to turn on the Living Room」であり、フレーズの第2の種類では、その機器20を起動させるフレーズは、「AAA turn on the Living Room」である。第1の種類では、フレーズはコマンド処理システム50を識別する名称である「MC」を含むが、第2の種類では、フレーズがその名称を含まない。音声認識装置40が第1の種類のフレーズを受け付けて動作指示を送信するか、第2の種類のフレーズを受け付けて動作指示を送信するかについては、ユーザにより設定される。この設定の詳細については後述する。音声認識装置40が第1の種類のフレーズを受け付けた際に送信先となるコマンド処理システム50が、第2の種類のものと異なっていてもよい。
 ユーザ端末60は、ユーザによるタッチ操作などの物理的操作を受け付け、機器20を制御する。また、ユーザ端末60は、ユーザの操作に基づいてコマンド処理システム50や音声認識装置40の設定を行う。ユーザ端末60は例えばスマートフォンやパーソナルコンピュータである。ユーザ端末60は制御部61、記憶部62、及び通信部63を含む。制御部61、記憶部62、通信部63は制御部21、記憶部22、及び通信部23と同様である。
 図1に示すように、コマンド処理システム50は、コマンドデータ送信装置10、データベース52、及びMQTT(Message Queueing Telemetry Transport)サーバ53を含む。
 データベース52は各種データを記憶する。例えば、データベース52は各ユーザの所有している機器20の情報を記憶する。図2はデータベース52に記憶される機器テーブルの一例を示す。機器テーブルT1はユーザごとに(ユーザIDと関連付けて)記憶される。なお、コマンド処理システム50(データベース52)、ユーザ端末60および機器20で使用されるユーザIDは、音声入力装置30及び音声認識装置40で使用されるユーザIDと異なっていてもよいし、同じであってもよい。これらのユーザIDが異なる場合には、それらのユーザIDを変換するための対応関係データがコマンド処理システム50または音声認識装置40に記憶されている。
 図2に示すように、機器テーブルT1は「ID」、「名称」、「機器ID」、「IPアドレス」、「コマンド種類」、「端子」、「接続先」、「受信可否」、「受付可能コマンド」フィールドを含む。
 「ID」フィールドは、ユーザの所有している各機器20を一意に識別する情報を示す。図2では、第1機器20-1が機器ID「1」に相当し、第2機器20-2が機器ID「2」に相当する。
 「名称」フィールドは機器20の名称を示す。この名称はユーザが動作指示の対象の機器20を指定するために使用される。名称としては、ユーザによって設定された任意の名称が使用されてよいし、例えば機器20の製造元等によって設定された初期名称が使用され、ユーザにより修正が可能になっていてもよい。
 「機器ID」フィールドは、これのみで機器20を一意に特定する機器IDである。機器IDは、機器20のMACアドレスであってもよいし、MACアドレスに基づいて生成されたIDであってもよい。「IPアドレス」フィールドは、機器20が備えている有線又は無線ネットワークインタフェースカードに対して設定されたIPアドレスを示す。「コマンド種類」フィールドは、機器20で使用されているコマンドの種類(体系)を示す。「端子」フィールドは、機器20が備えている入力端子のリストを示す。「接続先」フィールドは、機器20が他の機器20の入力端子に接続されて、機器20から出力される音声が他の機器20に入力される場合に、機器20が接続された他の機器20の入力端子を示す。
 「受信可否」フィールドは、インターネット6を介してコマンドを含むメッセージを受信可能であるか否かを示す。メッセージについては後述する。例えば、「0」又は「1」が「受信可否」フィールドに登録される。「0」は、インターネット6を介してメッセージを受信できないことを示し、「1」は、インターネット6を介してメッセージを受信できることを示す。
 「受付可能コマンド」フィールドは、機器20が受付可能なコマンドのリストを示す。「受付可能コマンド」フィールドのリスト中に「Power」が設定されていれば、その機器は外部からのコマンドによりスタンバイ状態から起動することが可能であることを示し、設定されていなければスタンバイ状態から起動することができないことを示す。また、「受付可能コマンド」フィールドのリスト中に「Volume」が設定されていれば、その機器は外部からのコマンドにより音量を制御することが可能であることを示し、設定されていなければ音量を制御することができないことを示す。
 機器テーブルT1のデータは各ユーザによって登録される。ユーザはユーザ端末60からコマンドデータ送信装置10にアクセスすることによって、自らの所有する機器20の情報を機器テーブルT1に登録できる。登録の詳細については後述する。
 なお、データベース52には機器テーブルT1以外のデータも記憶される。例えば、データベース52にはユーザと、機器20のためにそのユーザが入力可能なフレーズの種類を示すデータとが関連付けて記憶されている。他にも、動作指示とコマンドとの対応関係を示すデータ(言い換えれば、動作指示をコマンドに変換するためのデータ)がデータベース52に記憶されてもよい。
 コマンドデータ送信装置10は例えばサーバコンピュータによって実現される。図1に示すように、コマンドデータ送信装置10は制御部11、記憶部12、及び通信部13を含む。制御部11、記憶部12、及び通信部13は制御部21、記憶部22、及び通信部23と同様である。なお、コマンドデータ送信装置10は、情報記憶媒体(例えば光ディスク又はメモリカード等)に記憶されたプログラムやデータを読み取るための構成要素(例えば光ディスクドライブ又はメモリーカードスロット等)を備えてもよい。そして、プログラムが情報記憶媒体を介してコマンドデータ送信装置10に供給されてもよい。プログラムはインターネット6を介してコマンドデータ送信装置10に供給されてもよい。
 コマンドデータ送信装置10はデータベース52にアクセス可能である。コマンドデータ送信装置10とデータベース52とは一つのサーバコンピュータによって実現されてもよいし、別のサーバコンピュータによって実現されてもよい。
 コマンドデータ送信装置10は、音声認識装置40から送信される、機器20に対する動作指示を受け付け、当該動作指示に基づいてコマンドを含むメッセージを生成し、当該メッセージを当該機器20へ向けて送信する。より具体的には、メッセージはMQTTサーバ53を介して機器20へ向けて送信される。MQTTサーバ53は、MQTTプロトコルを使用してデータを送受信するためのものである。コマンドデータ送信装置10とMQTTサーバ53とは一つのサーバコンピュータによって実現されてもよいし、別のサーバコンピュータによって実現されてもよい。
 [2.機能ブロック]図3は、コマンドデータ送信装置10、機器20およびユーザ端末60により実現される機能を示すブロック図である。
 図3に示すように、コマンドデータ送信装置10は動作指示受付部110、メッセージ生成部120、メッセージ送信部130、機器情報取得部140、音声利用登録部150、機器登録部160、及び登録結果送信部170を含む。動作指示受付部110、メッセージ生成部120、メッセージ送信部130、機器情報取得部140、音声利用登録部150、機器登録部160、及び登録結果送信部170は、制御部11が記憶部12に格納された各機能のプログラムを実行することによって実現される。
 また図3に示すように、機器20はメッセージ受信部210、コマンド実行部220、機器情報送信部230および設定部260を含む。メッセージ受信部210、コマンド実行部220、機器情報送信部230および設定部260は制御部21が記憶部22に格納された各機能のプログラムを実行することによって実現される。
 また図3に示すように、ユーザ端末60は登録制御部610、設定取得部620、フレーズ生成部630、フレーズ出力部640を含む。登録制御部610、設定取得部620、フレーズ生成部630、フレーズ出力部640は制御部61が記憶部62に格納された各機能のプログラムを実行することによって実現される。
 [2-1]まず、動作指示受付部110、メッセージ生成部120、メッセージ送信部130、メッセージ受信部210、及びコマンド実行部220について説明する。
 動作指示受付部110は、機器20に対する動作指示を受け付ける。例えば、動作指示受付部110は、音声認識装置40によってテキストデータ等のプログラムにとって理解可能な形式のデータに変換された動作指示を音声認識装置40から受信する。
 メッセージ生成部120は、動作指示受付部110が機器20に対する動作指示を受信した場合に、ユーザIDと、コマンドとを含むメッセージを生成する。このユーザIDは、動作指示にかかるユーザを特定する。コマンドは、動作指示に応じた動作を行わせるためのテキスト等のデータである。
 図4はメッセージD1の一例を示す図である。図4に示されるメッセージD1は、第1機器20-1をスタンバイ状態から起動する旨の動作指示が受け付けられた場合に生成されるメッセージの一例である。
 メッセージD1は項目「uid」,「type」,「id」,「command」を含む。項目「uid」は動作指示をしたユーザのユーザIDを示す。図4に示す例では、ユーザID「U1」が項目「uid」に設定されている。項目「type」はデータの種別を示す。図4に示す例では「cmd」が項目「type」に設定されている。これはメッセージ中にコマンドが含まれることを示している。項目「id」はメッセージを一意に識別する識別情報を示す。項目「command」に設定されるデータはコマンドの内容を示す。項目「command」は項目「ip」,「path」,「method」を含む。項目「ip」はコマンドの宛先を示す。図4の例では第1機器20-1のIPアドレスが項目「ip」に設定されている。項目「path」はコマンド本体に相当する。項目「method」は、使用されるHTTPプロトコルのメソッドを示す。
 メッセージ送信部130は、メッセージ生成部120によって生成されたメッセージを機器20へ向けて送信する。なお、メッセージ送信部130は、動作指示の対象となる機器20がインターネット6経由でメッセージを受信できない場合(「受信可否」フィールドに「0」が設定されている場合)には、他の機器20へメッセージを送信し、その他の機器20に対象の機器20へメッセージの内容を転送させてもよい。
 メッセージはMQTTプロトコルを使用して機器20へ送信される。言い換えると、メッセージ送信部130はMQTTサーバ53を介してメッセージを機器20へ送信する。MQTTサーバ53には、複数のトピックが存在している。トピックのそれぞれの識別情報は、機器20の機器IDに基づいて設定されている。コマンドデータ送信装置10から機器20へ送信する際には、コマンドデータ送信装置10は機器IDに応じた識別情報を有する要求側のトピックへメッセージをパブリッシュし、機器20はその識別情報を有する要求側のトピックにパブリッシュされたメッセージを取得する。なお、MQTTプロトコルと異なるプロトコルでコマンド処理システム50と機器20との間の通信が行われてもよい。
 メッセージ受信部210はメッセージをインターネット6を介して受信する。コマンド実行部220は、メッセージに含まれるコマンドに基づいて、コマンドを実行する。コマンド実行部220は、メッセージに含まれるコマンドを直接解釈して機器20を直接制御してもよい。またコマンド実行部220は、ローカルエリアにあるユーザ端末60等から、LAN2を介して受信されるコマンドを実行する内部実行部と、受信されたメッセージに含まれるコマンドを変換し、その内部実行部へ変換されたコマンドを内部的に送信する変換部とを有していてもよい。例えば、機器20はHTTPデーモンを起動させ、内部実行部は、変換部からHTTPプロトコルを介してコマンドを受け付けてよい。
 [2-2]次に、登録制御部610、設定取得部620、フレーズ生成部630、フレーズ出力部640、音声利用登録部150、機器登録部160、登録結果送信部170、設定部260の概要について説明する。
 登録制御部610は、ユーザについて、第1の種類および第2の種類のうち少なくとも一方のフレーズを音声認識装置40が受け付け、コマンド処理システム50へ動作指示を送信することを可能にする。より具体的には、登録制御部610は音声認識装置40およびコマンド処理システム50に、このユーザについて利用登録の処理を実行させる。また、登録制御部610は、ユーザの操作に基づいて、コマンド処理システム50に音声入力による指示の対象となる機器20を登録する。
 設定取得部620は、ローカルエリアに接続される機器20を検出し、検出された機器20から機器20の音声入力における機器20の名称を含む機器情報を取得する。また、設定取得部620は、登録制御部610またはコマンド処理システム50から、音声認識装置40が受付可能なフレーズの種類を示す情報を取得する。機器情報やフレーズの種類を示す情報をまとめて、以下ではユーザ設定と記載する。音声入力における機器20の名称や、利用可能なフレーズの種類は、ユーザにより設定可能な項目であるからである。なお、登録制御部610は、設定取得部620により複数の機器20が検出された場合、例えば検出された機器20のうちユーザが指定する1または複数の機器20を音声入力による指示の対象となる機器20として登録する。
 音声利用登録部150は、ユーザ端末60の登録制御部610から、ユーザが音声入力によるコマンド処理システム50の利用を登録する要求(利用登録要求)を受信し、コマンドデータ送信装置10と音声認識装置40とが連携してそのユーザによる音声入力を可能にするための処理を実行する。
 機器登録部160は、ユーザ端末60の登録制御部610から、音声入力による指示の対象となる機器20を登録する要求(機器登録要求)を受信し、その機器20を音声入力の対象として登録する。登録結果送信部170は、機器20の登録の結果(機器登録結果)と、サンプルフレーズのテンプレートとを送信する。
 設定部260は、ユーザ端末60の登録制御部610から、ユーザID登録指示を受信し、そのユーザID登録指示に含まれるユーザIDを不揮発性メモリに書き込む。また設定部260は、ユーザ端末60の登録制御部610から、接続開始指示を受信し、コマンド処理システム50に含まれるMQTTサーバ53と接続させ、コマンド処理システム50からの受信を可能にする。
 フレーズ生成部630は、設定取得部620により取得されるユーザ設定に基づいて、機器20を制御可能なフレーズを生成する。フレーズ出力部640は、生成されたフレーズを表示させるデータを出力する。フレーズ出力部640がそのデータを出力することにより、ユーザ端末60の表示画面など、ユーザが視認可能なデバイスに、生成されたフレーズが表示される。
 [2-3]次に、機器情報取得部140及び機器情報送信部230について説明する。
 機器情報取得部140は機器20の機器情報を取得する。機器情報取得部140は、メッセージ(以下では「機器情報要求」と記載する)を生成し、当該メッセージをインターネット6を介して機器20へ送信する。機器情報要求は、機器20に対して当該機器20の機器情報を機器情報取得部140へ向けて送信させるためのコマンドと、ユーザIDとを含む。より具体的には、機器情報取得部140は機器情報要求をMQTTサーバ53を介して機器20へ送信する。なお、機器情報要求の生成及び送信もメッセージ生成部120及びメッセージ送信部130により実行されてもよい。
 機器情報送信部230は、機器情報要求が受信されると、機器20の機器情報をインターネット6を介してコマンドデータ送信装置10に返信する。機器情報は、例えば、機器20の機種情報、ユーザが機器20を特定する名称、機器ID、IPアドレスを含む。また、機器情報は、機器20の現在の状態を示す現在情報を含んでもよい。なお、機器情報送信部230は機器情報をMQTTサーバ53を介してコマンドデータ送信装置へ送信する。機器情報取得部140は機器情報を受信する。そして、機器情報取得部140は、受信した機器情報のうち必要な項目を抽出し、それらの項目を機器テーブルT1に登録する。
 [3.処理]機器制御システム1で実行される処理について説明する。
 [3-1]はじめに、音声入力の利用登録の処理について説明する。音声入力の利用登録の処理は、音声認識装置40がユーザについて1または複数の種類のフレーズを受け付けて動作指示を送信することを可能にする処理と、コマンド処理システム50がその動作指示を受け付けることを可能にする情報を登録する処理とを含む。ユーザが音声入力によるコマンド処理システム50の利用をする前にこの処理が行われる必要がある。
 以下では、第1の種類のフレーズについて利用登録の処理を行う例について説明する。なお、第2の種類のフレーズについても以下と同様の処理で登録されてよい。図5は、音声入力の利用登録の処理の一例を示すフロー図である。以下に記載される、音声利用登録部150が行う処理は、制御部11がその機能のプログラムを実行することにより実行される。登録制御部610が行う処理は、制御部61がその機能のプログラムを実行することにより実行される。
 はじめに、ユーザ端末60の登録制御部610はユーザにより利用登録の処理の開始が指示された場合に、コマンド処理システム50へ利用登録要求を送信する(ステップS111)。またコマンドデータ送信装置10の音声利用登録部150は、通信部13を介して利用登録要求を受信する(ステップS121)。利用登録要求は、ユーザにより直接的または間接的に指定される、音声入力を受け付ける音声認識装置40と動作指示を処理するコマンド処理システム50とを示す情報を含む。また、登録制御部610はユーザの認証情報を送信し(ステップS112)、音声利用登録部150は通信部13を介してユーザの認証情報を受信する(ステップS122)。ユーザ端末60から送信される認証情報は、例えばユーザIDおよびパスワードであってよい。また、コマンド処理システム50とは別の認証サーバが存在する場合には、登録制御部610が認証サーバに対してユーザにより入力されたユーザの識別情報とパスワードを入力することにより認証サーバから取得したアクセス許可情報(トークンの一種)を、登録制御部610が認証情報として送信してもよい。この場合、登録制御部610はアクセス許可情報を用いて認証サーバからユーザIDを取得してよい。なお、ここで入力されるユーザIDと、コマンド処理システム50と機器20とで利用されるユーザIDとが異なっていてもよい。例えば、音声利用登録部150は、認証情報に含まれるユーザIDのハッシュ値を後続の処理で利用するユーザIDとして生成してもよい。
 認証情報が取得されると、音声利用登録部150は、ユーザからの第1の種類のフレーズによる音声入力を、音声認識装置40が受け付ける設定と、音声認識装置40が第1の種類のフレーズについて動作指示をコマンド処理システム50へ送信する設定をする(ステップS123)。
 そして、音声利用登録部150は、音声入力の利用登録状況をデータベースに格納する(ステップS124)。図6は、音声入力利用テーブルの一例を示す図である。音声入力利用テーブルは、「ユーザID」、「第1種類登録」、「第2種類登録」フィールドを含む。「ユーザID」は、テーブルのレコードを一意に識別するキーとなる。「第1種類登録」は、「ユーザID」フィールドのユーザについて、第1の種類のフレーズを受け付けるための利用登録の処理がされているか否かを示す。「第2種類登録」は、「ユーザID」フィールドのユーザについて、第2の種類のフレーズを受け付けるための利用登録の処理がされているか否かを示す。
 音声入力の利用登録状況がデータベースに格納されると、音声利用登録部150は、音声入力の利用登録が成功したか否かを示す応答を送信し(ステップS125)、登録制御部610は利用登録応答を受信する(ステップS113)。
 [3-2]次に、ユーザの操作に基づいて、コマンド処理システム50に音声入力による指示の対象となる機器20を登録する処理(登録処理)について説明する。図7は、機器登録の処理を説明するシーケンス図である。図8は、機器登録におけるユーザ端末60の処理の例を示すフロー図である。図9は、機器登録における機器20の処理の例を示すフロー図である。図10は、機器登録におけるコマンドデータ送信装置10の処理の例を示すフロー図である。
 機器登録部160、登録結果送信部170および機器情報取得部140の処理は、制御部11がその機能のプログラムを実行することにより行われる。登録制御部610、設定取得部620、フレーズ生成部630およびフレーズ出力部640の処理は、制御部61がその機能のプログラムを実行することにより行われる。機器情報送信部230、設定部260の処理は、制御部21がその機能のプログラムを実行することにより行われる。
 以下では、ユーザ端末60、コマンドデータ送信装置10、機器20が実行する登録処理を、図7のシーケンス図に従った順序で説明する。
 はじめに、ユーザ端末60の登録制御部610は、ユーザから機器登録開始の指示を取得した場合に、通信部63を介して、コマンド処理システム50へ利用登録確認要求を送信する(ステップS211)。利用登録確認要求は、より具体的には、音声認識装置40が、1または複数の種類のフレーズについて利用登録がされているか否かを問い合わせる情報である。次に、コマンドデータ送信装置10の機器登録部160は、利用登録確認要求を受信し、音声認識の利用登録の状況を示す利用登録確認応答を送信する(ステップS251)。より具体的には、機器登録部160は機器登録開始の指示をしたユーザについて音声入力利用テーブルに格納されたレコードを取得し、第1種類登録および第2種類登録のフィールドの値に基づいて、利用登録されたフレーズの種類を示す情報を応答する。なお、利用登録確認応答に、ユーザ端末60を操作しているユーザのユーザIDを示す情報が含まれてもよい。ユーザ端末60の登録制御部610は、利用登録確認応答を受信し、利用登録されたフレーズの種類を示す情報などを記憶部62に格納する(ステップS212)。なお、ユーザについて、機器20を操作するためのどの種類のフレーズについても利用登録がされていない場合には、利用登録確認応答としてエラーメッセージが送信され、登録制御部610はユーザに利用登録を行わせるための画面を出力する。
 設定取得部620は、利用登録確認応答を受信すると、ローカルエリア(LAN2)に接続された1または複数の機器20を検出し、検出された1または複数の機器20へ機器情報要求を送信する(ステップS213)。機器20の機器情報送信部230は、機器情報要求を受信し、ユーザ端末60へ向けて機器情報を送信する(ステップS221)。機器情報は、ユーザにより設定された機器の名称および機器IDを含む。ユーザ端末60の設定取得部620は、送信された機器情報を受信する(ステップS214)。
 機器情報を受信すると、登録制御部610は検索された機器20に、ユーザID登録指示を送信する(ステップS215)。機器20の設定部260は、ユーザID登録指示を受信する(ステップS222)。ユーザID登録指示は、機器20に登録すべきユーザIDの情報を含む。また、ユーザID登録指示が受信されると、設定部260は、不揮発性メモリにユーザIDを書き込む(ステップS223)。
 ユーザIDが書き込まれると、ユーザ端末60の登録制御部610は、検索された機器に、MQTTサーバへの接続開始指示を送信する(ステップS216)。機器20の設定部260は、MQTTサーバ53への接続開始指示を受信する(ステップS224)。そして、設定部260は、MQTTサーバ53へ接続し(ステップS225)、MQTTサーバ53から動作指示を受信できる状態にする。
 機器20がMQTTサーバ53へ接続すると、ユーザ端末60の登録制御部610は、コマンド処理システム50(コマンドデータ送信装置10)へ、機器登録要求を送信する(ステップS217)。機器登録要求は、ユーザIDと、登録する機器20の機器IDとを含む。コマンドデータ送信装置10は、ユーザ端末60から機器登録要求を受信する(ステップS252)。なお、機器登録要求に、ユーザIDの代わりに認証サーバへのアクセス許可情報を含んでもよい。この場合は、コマンドデータ送信装置10はアクセス許可情報を用いて認証サーバからユーザIDまたはユーザIDの元となる情報を取得してもよい。
 そして、機器登録部160は、機器登録要求に含まれる機器IDを有する機器20に向けて、機器情報要求を送信する(ステップS253)。機器情報送信部230は、コマンド処理システム50(MQTTサーバ53)から機器情報要求を受信し、コマンド処理システム50へ機器情報を送信する(ステップS226)。機器登録部160は、機器情報を受信する(ステップS254)。機器情報は、コマンドの体系を示す情報、有する入力端子の情報、入力端子に接続される他の機器20の情報、インターネット6を介してメッセージを受信できるか否かを示す情報、機器20が受付可能なコマンドのリストを含む。機器登録部160は、受信した機器情報のうち少なくとも一部(機器IDを含む)をユーザIDと関連付けてデータベースの機器テーブルT1に格納する(ステップS255)。なお、機器登録部160は、機器情報に含まれる情報を取捨選択、および整形して機器テーブルT1に格納してもよい。
 機器登録部160がステップS255までの処理を完了すると、登録結果送信部170は、音声入力の利用登録状況、言い換えると、音声認識装置40がユーザについて受け付けることのできるフレーズの種類に基づいて、サンプルフレーズのテンプレートを選択する(ステップS256)。また機器登録部160はユーザ端末60へ、機器の登録ができたか否かを示す機器登録結果と、選択されたサンプルフレーズのテンプレートとを送信する(ステップS257)。
 図11は、サンプルフレーズのテンプレートの一例を示す図である。サンプルフレーズは、ユーザが音声入力することにより機器20を制御可能なフレーズである。図11は、第1の種類および第2の種類のフレーズについて利用登録がされている場合の例を示している。第1のテンプレートTP1は第1の種類のフレーズのサンプルのテンプレートを含み、第2のテンプレートTP2は、第2の種類のフレーズのサンプルのテンプレートを含む。サンプルの文面は、「sentence」の項目に設定された文字列である。機器の名称はユーザが設定することが可能であり事前に準備することができないため、仮の文字列「%s」がサンプルの文面に埋め込まれている。「feature」の項目に設定された文字列は、操作対象となる機器20が備える必要のあるコマンドを示している。
 フレーズ生成部630はコマンド処理システム50(コマンドデータ送信装置10)から、機器登録要求に対する処理の結果と、サンプルフレーズのテンプレートを受信する(ステップS218)。フレーズ生成部630は受信されたテンプレートと、ユーザ設定である利用登録の状況および機器の名称に基づいて、サンプルフレーズを生成し、フレーズ出力部640は生成されたサンプルフレーズを出力する(ステップS219)。
 以下では、フレーズ生成部630およびフレーズ出力部640の処理についてさらに詳細に説明する。図12は、フレーズ生成部630およびフレーズ出力部640の処理の例を示すフロー図である。
 はじめに、フレーズ生成部630は、サンプルフレーズが必要とするコマンドを実行可能な機器20を選択し、選択された機器20の名称を取得する(ステップS311)。フレーズ生成部630は、例えば、テンプレートの「feature」の項目に設定されたコマンドを収集し、また、機器テーブルT1に格納されたあるユーザに関するレコードのうち、受付可能コマンドのフィールドに収集されたすべてのコマンドが存在するレコードを選択し、そのレコードに含まれる機器の名称を取得する。
 次に、フレーズ生成部630は、ユーザ設定(利用登録されたフレーズの種類を示す情報および機器の名称)に応じた処理を行う。より具体的には以下の処理を行う。まずフレーズ生成部630は、利用登録されたフレーズの種類を示す情報が、第1の種類のフレーズを受付可能な状態を示すかを判定する(ステップS312)。第1の種類のフレーズを受付可能な状態を示す場合には(ステップS312のY)、フレーズ生成部630は第1のテンプレートTP1の文言のうち機器名の箇所を選択された機器の名称で置き換えることにより、サンプルフレーズを生成する(ステップS313)。そして、フレーズ出力部640は、生成されたサンプルフレーズがユーザ端末60の画面に表示されるように、サンプルフレーズのデータを出力する(ステップS314)。ここで、利用登録されたフレーズの種類を示す情報が、第1の種類のフレーズを受付可能な状態を示さない場合には(ステップS312のN)、ステップS313およびS314の処理はスキップされる。
 図13は、表示されるサンプルフレーズの一例を示す図である。図13の例は、第1の種類のフレーズが受付可能に設定されている場合に、第1のテンプレートTP1に基づいて表示される画面の一例である。名称「Living room」の機器20は、ボリューム操作のコマンドを処理可能であるため、サンプルフレーズとして出力されている。
 次にフレーズ生成部630は、利用登録されたフレーズの種類を示す情報が、第2の種類のフレーズを受付可能な状態を示すかを判定する(ステップS315)。第2の種類のフレーズを受付可能な状態を示す場合には(ステップS315のY)、フレーズ生成部630は第2のテンプレートTP2の文言のうち機器名の箇所を選択された機器の名称で置き換えることにより、サンプルフレーズを生成する(ステップS316)。そして、フレーズ出力部640は、生成されたサンプルフレーズがユーザ端末60の画面に表示されるように、サンプルフレーズのデータを出力する(ステップS317)。ここで、利用登録されたフレーズの種類を示す情報が、第2の種類のフレーズを受付可能な状態を示さない場合には(ステップS315のN)、ステップS316およびS317の処理はスキップされる。
 図14は、表示されるサンプルフレーズの他の一例を示す図である。図14の例は、第2の種類のフレーズが受付可能に設定されている場合に、第2のテンプレートTP2に基づいて表示される画面の一例である。
 このように、コマンドの入力例として示されるサンプルフレーズを動的に制御することで、ユーザが音声入力において受付可能なサンプルフレーズを容易かつ確実に得ることができる。また、サンプルフレーズの生成にユーザ設定も用いることで、ユーザに応じて受け付けられるフレーズが変化する場合であっても、ユーザはサンプルフレーズの文面を読み替える必要がない。これにより、ユーザが、受け付けられる正しいサンプルフレーズを容易に認識することができる。
 [3-3]以下では、動作指示をコマンド処理システム50が受け付け、機器20を制御する処理について説明する。図15は、動作指示受付部110、メッセージ生成部120、メッセージ送信部130、メッセージ受信部210、コマンド実行部220の処理の一例を示すフロー図である。以下に記載される、動作指示受付部110、メッセージ生成部120、メッセージ送信部130の処理は、制御部11がその機能のプログラムを実行することにより実行される。メッセージ受信部210、コマンド実行部220の処理は、制御部21がその機能のプログラムを実行することにより実行される。
 はじめに、動作指示受付部110は、音声認識装置40から動作指示を取得する(ステップS511)。そして、メッセージ生成部120は、取得した動作指示に基づいて、動作指示の対象となるユーザのユーザIDを取得し、動作指示に含まれる機器の名称と機器テーブルT1に基づいて、ユーザIDと関連付けられた機器IDであって、かつ動作指示の対象となる機器20の機器IDを取得する(ステップS512)。そして、メッセージ生成部120は、動作指示に対応するコマンドと、取得されたユーザIDとを含むメッセージを生成し(ステップS513)、メッセージ送信部130は動作指示の対象となる機器20へ生成されたメッセージを送信する(ステップS514)。
 動作指示の対象となる機器20のメッセージ受信部210は、メッセージを受信する(ステップS521)。次に、メッセージ受信部210は、メッセージに含まれるユーザIDと、機器20の不揮発性メモリに書き込まれたユーザIDとを比較する(ステップS522)。これらのユーザIDが同じ場合には(ステップS522のY)、コマンド実行部220はメッセージに含まれるコマンドを実行する(ステップS523)。一方、これらのユーザIDが異なる場合には(ステップS522のN)、そのメッセージは破棄され、メッセージ中のコマンドは実行されない。
 上述のように、メッセージ受信部210はユーザIDの比較結果に応じてコマンドを実行するか否かを制御する。これにより、機器20の予期せぬ動作を防止することができる。特に、機器20が譲渡された一方、コマンド処理システム50側で機器登録が解除されていない場合には、譲渡したユーザが誤って機器20に対するコマンドを音声入力した場合に、従来は機器20がそのコマンドにより誤動作してしまう恐れがあった。一方、本実施形態では、譲渡されたユーザが機器登録を行っていれば、譲渡したユーザがどんなコマンドを入力しても、機器20側でそのコマンドを含むメッセージを破棄するので、予期せぬ動作をする可能性を抑えることができる。
 [付記]以上に説明した実施形態についての記載から把握されるように、本明細書では以下に記載の発明を含む多様な技術的思想が開示されている。
 本発明にかかる機器制御システムは、デバイスに関するユーザ設定を取得する設定取得手段と、前記取得された前記ユーザ設定に基づいて、前記デバイスを制御可能なフレーズを生成するフレーズ生成手段と、前記生成されたフレーズを表示させるデータを出力する表示データ出力手段と、を含む。
 本発明にかかる機器制御方法は、デバイスに関するユーザ設定を取得するステップと、前記取得された前記ユーザ設定に基づいて、前記デバイスを制御可能なフレーズを生成するステップと、前記生成されたフレーズを表示させるデータを出力するステップと、を含む。
 本発明にかかるプログラムは、デバイスに関するユーザ設定を取得する設定取得手段、前記取得された前記ユーザ設定に基づいて、前記デバイスを制御可能なフレーズを生成するフレーズ生成手段、および、前記生成されたフレーズを表示させるデータを出力する表示データ出力手段、としてコンピュータを機能させる。
 上記発明の一形態では、前記設定取得手段は、音声入力において前記デバイスを特定する名称を取得し、前記フレーズ生成手段は、前記取得された名称に基づいて、前記デバイスを制御可能なフレーズを生成してもよい。
 上記発明の一形態では、前記設定取得手段は、音声入力において複数のデバイスのそれぞれが実行できるコマンドを取得し、前記フレーズ生成手段は、前記複数のデバイスのそれぞれが実行できるコマンドに基づいて、前記複数のデバイスの名称のうちいずれかを含むフレームを生成してもよい。
 上記発明の一形態では、前記設定取得手段は、ユーザの指示音声を認識する認識部が前記デバイスに対する指示として受付可能なフレーズの種類を示す情報を取得し、前記フレーズ生成手段は、前記フレーズ生成手段は、前記取得された情報に基づいて、前記デバイスを制御可能なフレーズを生成してもよい。
 上記発明の一形態では、前記認識部は、当該認識部により生成された動作指示を取得し前記デバイスを制御するシステムを識別する識別名称を含む第1の種類のフレーズと、前記識別名称を含まない第2の種類のフレーズとのいずれかを受付可能となるようユーザにより設定され、前記フレーズ生成手段は、第1の種別および第2の種別のフレーズのそれぞれが受付可能か否かに基づいて、前記デバイスを制御可能なフレーズを生成してもよい。

 

Claims (7)

  1.  デバイスに関するユーザ設定を取得する設定取得手段と、
     前記取得された前記ユーザ設定に基づいて、前記デバイスを制御可能なフレーズを生成するフレーズ生成手段と、
     前記生成されたフレーズを表示させるデータを出力する表示データ出力手段と、
     を含む機器制御システム。
  2.  請求項1に記載の機器制御システムにおいて、
     前記設定取得手段は、音声入力において前記デバイスを特定する名称を取得し、
     前記フレーズ生成手段は、前記取得された名称に基づいて、前記デバイスを制御可能なフレーズを生成する、
     機器制御システム。
  3.  請求項2に記載の機器制御システムにおいて、
     前記設定取得手段は、音声入力において複数のデバイスのそれぞれが実行できるコマンドを取得し、
     前記フレーズ生成手段は、前記複数のデバイスのそれぞれが実行できるコマンドに基づいて、前記複数のデバイスの名称のうちいずれかを含むフレームを生成する、
     機器制御システム。
  4.  請求項1に記載の機器制御システムにおいて、
     前記設定取得手段は、ユーザの指示音声を認識する認識部が前記デバイスに対する指示として受付可能なフレーズの種類を示す情報を取得し、
     前記フレーズ生成手段は、前記フレーズ生成手段は、前記取得された情報に基づいて、前記デバイスを制御可能なフレーズを生成する、
     機器制御システム。
  5.  請求項4に記載の機器制御システムにおいて、
     前記認識部は、当該認識部により生成された動作指示を取得し前記デバイスを制御するシステムを識別する識別名称を含む第1の種類のフレーズと、前記識別名称を含まない第2の種類のフレーズとのいずれかを受付可能となるようユーザにより設定され、
     前記フレーズ生成手段は、第1の種別および第2の種別のフレーズのそれぞれが受付可能か否かに基づいて、前記デバイスを制御可能なフレーズを生成する、
     機器制御システム。
  6.  デバイスに関するユーザ設定を取得するステップと、
     前記取得された前記ユーザ設定に基づいて、前記デバイスを制御可能なフレーズを生成するステップと、
     前記生成されたフレーズを表示させるデータを出力するステップと、
     を含む機器制御方法。
  7.  デバイスに関するユーザ設定を取得する設定取得手段、
     前記取得された前記ユーザ設定に基づいて、前記デバイスを制御可能なフレーズを生成するフレーズ生成手段、および、
     前記生成されたフレーズを表示させるデータを出力する表示データ出力手段、
     としてコンピュータを機能させるためのプログラム。

     
PCT/JP2018/042864 2017-12-01 2018-11-20 機器制御システム、機器制御方法、及びプログラム WO2019107224A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201880077883.2A CN111433736B (zh) 2017-12-01 2018-11-20 机器控制系统以及机器控制方法
EP18884611.7A EP3719630A4 (en) 2017-12-01 2018-11-20 DEVICE CONTROL SYSTEM, DEVICE CONTROL PROCEDURE AND PROGRAM
US16/888,279 US11574631B2 (en) 2017-12-01 2020-05-29 Device control system, device control method, and terminal device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017231631A JP6962158B2 (ja) 2017-12-01 2017-12-01 機器制御システム、機器制御方法、及びプログラム
JP2017-231631 2017-12-01

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/888,279 Continuation US11574631B2 (en) 2017-12-01 2020-05-29 Device control system, device control method, and terminal device

Publications (1)

Publication Number Publication Date
WO2019107224A1 true WO2019107224A1 (ja) 2019-06-06

Family

ID=66665578

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/042864 WO2019107224A1 (ja) 2017-12-01 2018-11-20 機器制御システム、機器制御方法、及びプログラム

Country Status (5)

Country Link
US (1) US11574631B2 (ja)
EP (1) EP3719630A4 (ja)
JP (1) JP6962158B2 (ja)
CN (1) CN111433736B (ja)
WO (1) WO2019107224A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
BR112015018905B1 (pt) 2013-02-07 2022-02-22 Apple Inc Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002259114A (ja) * 2001-03-05 2002-09-13 Nec Corp 音声認識コンピュータシステム
JP2004507936A (ja) * 2000-08-21 2004-03-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ダウンロード可能な音声命令の集合による音声制御型遠隔制御装置

Family Cites Families (104)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5903871A (en) 1996-04-22 1999-05-11 Olympus Optical Co., Ltd. Voice recording and/or reproducing apparatus
JPH09288500A (ja) 1996-04-22 1997-11-04 Olympus Optical Co Ltd 音声記録再生装置
JPH1138995A (ja) * 1997-07-16 1999-02-12 Denso Corp 音声認識装置及びナビゲーションシステム
US20020193989A1 (en) * 1999-05-21 2002-12-19 Michael Geilhufe Method and apparatus for identifying voice controlled devices
JP2001128262A (ja) 1999-10-28 2001-05-11 Yokogawa Electric Corp リモートコントロールシステム
JP2002202826A (ja) 2000-12-28 2002-07-19 Canon Inc 情報処理システムと該情報処理システムにおける課金方法、及びネットワークデバイス、情報処理装置、並びに記憶媒体
EP1322111B1 (en) * 2001-12-18 2007-10-10 Matsushita Electric Industrial Co., Ltd. Television apparatus having speech recognition function
JP2004015627A (ja) 2002-06-10 2004-01-15 Sharp Corp Av機器の遠隔制御システム
CN1472977A (zh) 2002-07-16 2004-02-04 ���µ�����ҵ��ʽ���� 网络终端设定信息管理方法及信息终端装置
US7234115B1 (en) 2002-09-26 2007-06-19 Home Director, Inc. Home entertainment system and method
US20040088535A1 (en) * 2002-10-31 2004-05-06 International Business Machines Corporation Method, apparatus and computer program product for selecting computer system settings for various operating circumstances
KR100606760B1 (ko) 2003-07-07 2006-07-31 엘지전자 주식회사 사용자 예약에 따른 홈 네트워크 시스템 및 그 제어방법
JP3885792B2 (ja) 2003-09-29 2007-02-28 日本電気株式会社 ネットワークシステム,wol装置,ネットワークtvチューナ,及び情報装置起動方法
DE10360655A1 (de) * 2003-12-23 2005-07-21 Daimlerchrysler Ag Bediensystem für ein Fahrzeug
US8249071B2 (en) * 2004-03-26 2012-08-21 Harman International Industries, Incorporated Audio related system communication protocol
CN101272384A (zh) 2004-05-21 2008-09-24 语音移动有限公司 远程访问系统和方法以及其智能代理
US7385960B2 (en) 2005-02-28 2008-06-10 Microsoft Corporation Measurement based mechanism to enable two wireless devices to directly communicate with each other to support traffic prioritization
US8135395B2 (en) 2005-03-18 2012-03-13 Qualcomm Incorporated Methods and apparatus for monitoring configurable performance levels in a wireless device
US20070091168A1 (en) 2005-10-25 2007-04-26 Hyun Lee Method to support simultaneous wireless connection of multiple media components
US8079074B2 (en) 2007-04-17 2011-12-13 Microsoft Corporation Dynamic security shielding through a network resource
ATE456490T1 (de) * 2007-10-01 2010-02-15 Harman Becker Automotive Sys Sprachgesteuerte einstellung von fahrzeugteilen
KR101424718B1 (ko) 2007-10-17 2014-08-04 삼성전자 주식회사 원격 접속 환경에서 접속 가능한 홈 네트워크 정보를제공하는 장치 및 그 방법
JP5161599B2 (ja) 2008-01-31 2013-03-13 シャープ株式会社 電子機器、遠隔制御システム、信号処理方法、制御プログラムおよび記録媒体
US8099289B2 (en) * 2008-02-13 2012-01-17 Sensory, Inc. Voice interface and search for electronic devices including bluetooth headsets and remote systems
JP2010130223A (ja) * 2008-11-26 2010-06-10 Fujitsu Ten Ltd 音声操作システムおよび音声操作方法
KR20120032644A (ko) 2010-09-29 2012-04-06 주식회사 팬택 이동 단말기 및 이동 단말기를 이용한 제어 방법
US8595319B2 (en) 2010-10-13 2013-11-26 Verizon Patent And Licensing Inc. Home network video peer-to-peer for mobile devices
JP2012165918A (ja) 2011-02-15 2012-09-06 Fujifilm Corp 放射線画像撮影装置、及び通信モード設定装置
US9451320B2 (en) 2011-05-23 2016-09-20 Broadcom Corporation Utilizing multi-dimensional resource allocation metrics for concurrent decoding of time-sensitive and non-time-sensitive content
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US9201859B2 (en) * 2011-12-15 2015-12-01 Microsoft Technology Licensing, Llc Suggesting intent frame(s) for user request(s)
US10156455B2 (en) 2012-06-05 2018-12-18 Apple Inc. Context-aware voice guidance
US8520807B1 (en) 2012-08-10 2013-08-27 Google Inc. Phonetically unique communication identifiers
JP6126610B2 (ja) * 2012-09-28 2017-05-10 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 情報通知方法、情報通知システム及びサーバ装置
US20140149118A1 (en) * 2012-11-28 2014-05-29 Lg Electronics Inc. Apparatus and method for driving electric device using speech recognition
CN104956436B (zh) * 2012-12-28 2018-05-29 株式会社索思未来 带有语音识别功能的设备以及语音识别方法
JP6029985B2 (ja) * 2013-01-11 2016-11-24 クラリオン株式会社 情報処理装置、操作システム、および、情報処理装置の操作方法
US9220012B1 (en) 2013-01-15 2015-12-22 Marvell International Ltd. Systems and methods for provisioning devices
US9330169B2 (en) * 2013-03-15 2016-05-03 Bose Corporation Audio systems and related devices and methods
KR20140121179A (ko) 2013-04-05 2014-10-15 한국전자통신연구원 홈 네트워크 상호 연동 서비스 제공 방법
US9390716B2 (en) * 2013-04-19 2016-07-12 Panasonic Intellectual Property Corporation Of America Control method for household electrical appliance, household electrical appliance control system, and gateway
US9472205B2 (en) 2013-05-06 2016-10-18 Honeywell International Inc. Device voice recognition systems and methods
US9384751B2 (en) 2013-05-06 2016-07-05 Honeywell International Inc. User authentication of voice controlled devices
JP6223713B2 (ja) 2013-05-27 2017-11-01 株式会社東芝 電子機器、方法及びプログラム
KR101380608B1 (ko) 2013-07-26 2014-04-10 (주) 코콤 스마트기기 기반 가정 주변기기 제어시스템 및 그 제어방법
EP3036594B1 (en) * 2013-08-21 2021-05-26 Ademco Inc. Devices and methods for interacting with an hvac controller
JP6213181B2 (ja) 2013-11-20 2017-10-18 ヤマハ株式会社 同期再生システム及び同期再生方法
JP6054283B2 (ja) * 2013-11-27 2016-12-27 シャープ株式会社 音声認識端末、サーバ、サーバの制御方法、音声認識システム、音声認識端末の制御プログラム、サーバの制御プログラムおよび音声認識端末の制御方法
JP2015106358A (ja) 2013-12-02 2015-06-08 日立アプライアンス株式会社 リモートアクセスシステムおよび宅内機器制御装置
US9348559B2 (en) 2013-12-23 2016-05-24 International Business Machines Corporation Interconnecting portal components with dialog state transitions
KR102210433B1 (ko) * 2014-01-21 2021-02-01 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
US9544310B2 (en) 2014-01-27 2017-01-10 Microsoft Technology Licensing, Llc Discovering and disambiguating identity providers
US9489171B2 (en) * 2014-03-04 2016-11-08 Microsoft Technology Licensing, Llc Voice-command suggestions based on user identity
JP6256116B2 (ja) 2014-03-10 2018-01-10 富士通株式会社 通信端末、セキュアログイン方法、及びプログラム
US9860076B2 (en) * 2014-05-07 2018-01-02 Vivint, Inc. Home automation via voice control
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
KR102261552B1 (ko) 2014-06-30 2021-06-07 삼성전자주식회사 음성 명령어 제공 방법 및 이를 지원하는 전자 장치
JP5871088B1 (ja) * 2014-07-29 2016-03-01 ヤマハ株式会社 端末装置、情報提供システム、情報提供方法およびプログラム
CN105490890A (zh) 2014-09-16 2016-04-13 中兴通讯股份有限公司 智能家庭终端及其控制方法
US9094363B1 (en) 2014-11-17 2015-07-28 Microsoft Technology Licensing, Llc Relevant communication mode selection
US9812126B2 (en) * 2014-11-28 2017-11-07 Microsoft Technology Licensing, Llc Device arbitration for listening devices
JP6348831B2 (ja) * 2014-12-12 2018-06-27 クラリオン株式会社 音声入力補助装置、音声入力補助システムおよび音声入力方法
US9701135B2 (en) 2015-01-30 2017-07-11 S-Printing Solution Co., Ltd. Image forming apparatus, recording medium, terminal, server, note printing method, and storage medium
EP3067884B1 (en) 2015-03-13 2019-05-08 Samsung Electronics Co., Ltd. Speech recognition system and speech recognition method thereof
WO2016157658A1 (ja) 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、制御方法、およびプログラム
CN106252749B (zh) 2015-06-04 2020-12-29 松下知识产权经营株式会社 蓄电池包的控制方法以及蓄电池包
KR101572111B1 (ko) 2015-07-01 2015-11-27 주식회사 이노스코리아 랜덤하면서 유일한 코드를 생성하는 전자 장치 및 방법
JP6461738B2 (ja) 2015-07-24 2019-01-30 シャープ株式会社 連携システムおよび機器制御サーバ
US10018977B2 (en) 2015-10-05 2018-07-10 Savant Systems, Llc History-based key phrase suggestions for voice control of a home automation system
US10999345B2 (en) 2015-10-19 2021-05-04 At&T Intellectual Property I, L.P. Real-time video delivery for connected home applications
CN105242556A (zh) 2015-10-28 2016-01-13 小米科技有限责任公司 智能设备的语音控制方法、装置、控制设备及智能设备
EP3378003A1 (en) 2015-11-17 2018-09-26 Idee Limited Security systems and methods with identity management for access to restricted access locations
DE112015007147T5 (de) 2015-11-25 2018-08-09 Mitsubishi Electric Corporation Sprachdialogvorrichtung und Sprachdialogverfahren
US10038941B2 (en) 2015-12-07 2018-07-31 Caavo Inc Network-based control of a media device
US9912977B2 (en) 2016-02-04 2018-03-06 The Directv Group, Inc. Method and system for controlling a user receiving device using voice commands
JP6610356B2 (ja) 2016-03-14 2019-11-27 コニカミノルタ株式会社 ジョブ実行システム、ジョブ実行方法、画像処理装置及びジョブ実行プログラム
US10021731B2 (en) 2016-03-24 2018-07-10 Panasonic Intellectual Property Management Co., Ltd. Home interior monitoring system and communication control method
US20170331807A1 (en) 2016-05-13 2017-11-16 Soundhound, Inc. Hands-free user authentication
US10204215B2 (en) 2016-05-24 2019-02-12 Mastercard International Incorporated System and method for processing a transaction with secured authentication
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10044869B2 (en) 2016-06-29 2018-08-07 Paypal, Inc. Voice-controlled audio communication system
WO2018013964A1 (en) 2016-07-15 2018-01-18 Rain Bird Corporation Wireless remote irrigation control
CN107734213A (zh) 2016-08-11 2018-02-23 漳州立达信光电子科技有限公司 智能家用电子装置与系统
US10026403B2 (en) 2016-08-12 2018-07-17 Paypal, Inc. Location based voice association system
US9892732B1 (en) 2016-08-12 2018-02-13 Paypal, Inc. Location based voice recognition system
CN106218557B (zh) * 2016-08-31 2020-01-07 北京兴科迪科技有限公司 一种带语音识别控制的车载麦克风
KR102481881B1 (ko) 2016-09-07 2022-12-27 삼성전자주식회사 외부 디바이스를 제어하는 서버 및 그 방법
US10157613B2 (en) 2016-11-17 2018-12-18 BrainofT Inc. Controlling connected devices using a relationship graph
WO2018100743A1 (ja) 2016-12-02 2018-06-07 ヤマハ株式会社 制御装置および機器制御システム
US20180170242A1 (en) * 2016-12-19 2018-06-21 Pilot, Inc. Bluetooth-enabled vehicle lighting control hub
US20180174581A1 (en) * 2016-12-19 2018-06-21 Pilot, Inc. Voice-activated vehicle lighting control hub
JP6725008B2 (ja) 2016-12-29 2020-07-15 ヤマハ株式会社 コマンドデータ送信装置、ローカルエリア装置、機器制御システム、コマンドデータ送信装置の制御方法、ローカルエリア装置の制御方法、機器制御方法、及びプログラム
US10679608B2 (en) 2016-12-30 2020-06-09 Google Llc Conversation-aware proactive notifications for a voice interface device
CN108322365A (zh) 2017-01-14 2018-07-24 富士康(昆山)电脑接插件有限公司 语音控制系统
JP6522679B2 (ja) * 2017-03-13 2019-05-29 シャープ株式会社 発話制御装置、方法、発話システム、及びプログラム
US10887125B2 (en) 2017-09-15 2021-01-05 Kohler Co. Bathroom speaker
KR102417524B1 (ko) 2017-10-13 2022-07-07 현대자동차주식회사 음성 인식 기반의 자동차 제어 방법
US10574451B2 (en) 2017-10-19 2020-02-25 Bank Of America Corporation Method and apparatus for perfect forward secrecy using deterministic hierarchy
JP7192208B2 (ja) 2017-12-01 2022-12-20 ヤマハ株式会社 機器制御システム、デバイス、プログラム、及び機器制御方法
JP7067082B2 (ja) 2018-01-24 2022-05-16 ヤマハ株式会社 機器制御システム、機器制御方法、及びプログラム
US11276396B2 (en) 2018-05-01 2022-03-15 Dell Products, L.P. Handling responses from voice services
US10803864B2 (en) 2018-05-07 2020-10-13 Spotify Ab Voice recognition system for use with a personal media streaming appliance
US11308947B2 (en) 2018-05-07 2022-04-19 Spotify Ab Voice recognition system for use with a personal media streaming appliance
US11119725B2 (en) 2018-09-27 2021-09-14 Abl Ip Holding Llc Customizable embedded vocal command sets for a lighting and/or other environmental controller

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004507936A (ja) * 2000-08-21 2004-03-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ダウンロード可能な音声命令の集合による音声制御型遠隔制御装置
JP2002259114A (ja) * 2001-03-05 2002-09-13 Nec Corp 音声認識コンピュータシステム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3719630A4 *

Also Published As

Publication number Publication date
US11574631B2 (en) 2023-02-07
JP6962158B2 (ja) 2021-11-05
US20200294494A1 (en) 2020-09-17
JP2019101730A (ja) 2019-06-24
EP3719630A4 (en) 2021-08-25
CN111433736A (zh) 2020-07-17
CN111433736B (zh) 2024-05-07
EP3719630A1 (en) 2020-10-07

Similar Documents

Publication Publication Date Title
WO2019107224A1 (ja) 機器制御システム、機器制御方法、及びプログラム
WO2019223351A1 (zh) 基于视图的语音交互方法、装置、服务器、终端和介质
US11557291B2 (en) Method for location inference of IoT device, server, and electronic device supporting the same
WO2016206494A1 (zh) 语音控制方法、装置和移动终端
US10938595B2 (en) Device control system, device control method, and non-transitory computer readable storage medium
WO2014171144A1 (ja) 家電機器の制御方法、家電機器制御システム、及びゲートウェイ
CN111464402B (zh) 一种智能家居设备的控制方法、终端设备及介质
WO2020078300A1 (zh) 一种终端投屏的控制方法和终端
JP2014071449A (ja) 電子装置、サーバー及びその制御方法
WO2015165257A1 (zh) 语音识别方法、装置、系统及计算机存储介质
JP7192208B2 (ja) 機器制御システム、デバイス、プログラム、及び機器制御方法
WO2018133307A1 (zh) 一种实现语音控制的方法和终端
US20230335137A1 (en) Hub device, multi-device system including the hub device and plurality of devices, and method of operating the same
JP5370432B2 (ja) 管理装置、カラオケシステム及び管理方法
US8928553B2 (en) Method and apparatus for accessing device based on intuitive selection
EP2157761A2 (en) Information processing apparatus, information processing method and information processing system for the cooperative operation of several appliances interconnected via a home network
CN111539217B (zh) 一种用于自然语言内容标题消歧的方法、设备和系统
US20210082401A1 (en) Electronic apparatus and method for controlling voice recognition thereof
JP6220420B2 (ja) サウンドを利用したソーシャルネットワークサービス提供装置、その方法、及びプログラム
JP6715307B2 (ja) 設備の発見方法、装置、設備及びプログラム
TW202232915A (zh) 終端裝置、機器管理伺服器、資訊處理系統、資訊處理方法以及資訊處理程式
WO2019239738A1 (ja) 情報処理装置、情報処理方法
KR101835091B1 (ko) 언어 학습을 위한 채팅 방법 및 채팅 시스템
US20030101057A1 (en) Method for serving user requests with respect to a network of devices
JP2019036811A (ja) 管理サーバ、機器制御システム、機器、端末装置、管理サーバの制御方法、および制御プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18884611

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2018884611

Country of ref document: EP

Effective date: 20200701