WO2022215280A1 - 発話機器の発話テスト方法、発話テストサーバ、発話テストシステム、および発話テストサーバと通信する端末で使用されるプログラム - Google Patents

発話機器の発話テスト方法、発話テストサーバ、発話テストシステム、および発話テストサーバと通信する端末で使用されるプログラム Download PDF

Info

Publication number
WO2022215280A1
WO2022215280A1 PCT/JP2021/026410 JP2021026410W WO2022215280A1 WO 2022215280 A1 WO2022215280 A1 WO 2022215280A1 JP 2021026410 W JP2021026410 W JP 2021026410W WO 2022215280 A1 WO2022215280 A1 WO 2022215280A1
Authority
WO
WIPO (PCT)
Prior art keywords
test
speech
utterance
server
terminal device
Prior art date
Application number
PCT/JP2021/026410
Other languages
English (en)
French (fr)
Inventor
裕樹 占部
健太郎 中井
悟 松永
由暉 大橋
Original Assignee
パナソニックIpマネジメント株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニックIpマネジメント株式会社 filed Critical パナソニックIpマネジメント株式会社
Priority to EP21870523.4A priority Critical patent/EP4321989A4/en
Priority to JP2022519354A priority patent/JP7482417B2/ja
Priority to US17/765,589 priority patent/US20240111645A1/en
Priority to CN202180005786.4A priority patent/CN115989477A/zh
Publication of WO2022215280A1 publication Critical patent/WO2022215280A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test input/output devices or peripheral units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2294Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by remote test
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities

Definitions

  • the present invention relates to speech devices, and more particularly to speech device speech test methods, speech test servers, speech test systems, and programs.
  • Home appliances are an abbreviation for home appliances, such as televisions, refrigerators, air conditioners, washing machines, cleaning robots, audio equipment, lighting, water heaters, intercoms, and other electrical appliances used in the home.
  • a beep sound or buzzer sound is used to notify the user of the operating status of the home appliance. For example, when a washing machine finishes washing, when an air conditioner is turned on, or when a refrigerator door is not completely closed for more than a predetermined period of time, these appliances beep to attract the user's attention. emitted.
  • home appliances have been developed as speech devices that can speak using voice including human language.
  • Such home appliances are called talking home appliances, and instead of beeping, they say, for example, "The laundry is finished” or "The refrigerator door is not closed.” Communicate information to users.
  • Patent Document 1 relates to an audio system that provides audio data to a plurality of electronic devices (household appliances) that have a function of speaking.
  • the audio system determines which electronic device should speak according to whether the plurality of electronic devices are installed in the same area or in different areas.
  • the audio system sets the volume or tone quality for speaking.
  • the user cannot confirm how the home appliance speaks based on the speech function set by the user until the user actually speaks. Therefore, unless the user has a way to confirm whether the setting has really succeeded, the user cannot know how the home appliance will speak and cannot prepare for it.
  • An object of the present invention is to provide an utterance test technology that allows users to check the utterance setting of the utterance device and allow the user to experience the utterance.
  • the present invention provides an utterance test method for utterance devices, an utterance test server, an utterance test system, and a program.
  • an utterance test method for utterance devices comprising the steps of: receiving a utterance test start command from a terminal device; a step of setting the test equipment, a step of setting the test contents of the speech test using audio data or video data determined based on the set test equipment, and a step of causing the test equipment to utter the test contents and including.
  • a speech test server for a speech device includes a server storage section for storing audio data or video data, and a server control section.
  • the server control unit receives an utterance test start command from the terminal device, and sets the test device so that at least one utterance device is the test device to be subjected to the utterance test based on the utterance test start command.
  • the test contents of the speech test are set, and the test contents are spoken by the test equipment.
  • a speech test system includes at least one speech device capable of speaking, a terminal device, and a speech test server.
  • a program according to another aspect of the present invention is a program used in a terminal that communicates with a speech test server.
  • the user can confirm the settings for speech, and can experience speaking.
  • FIG. 1 is a block diagram showing a schematic configuration of an utterance test system according to Embodiment 1;
  • FIG. Flowchart of an example of an utterance test method for a utterance device according to Embodiment 1 1 is a sequence diagram of an example of an utterance test method for a utterance device according to Embodiment 1.
  • FIG. 1 is a block diagram showing a schematic configuration of an utterance test system according to Embodiment 1;
  • FIG. Flowchart of an example of an utterance test method for a utterance device according to Embodiment 1 1 is a sequence diagram of an example of an utterance test method for a utterance device according to Embodiment 1.
  • Embodiment 1 Block diagram showing a schematic configuration of an utterance test system according to Embodiment 2 Sequence diagram of an example of an utterance test method for a utterance device according to Embodiment 2 Flowchart of an example of step S400 in Embodiment 3 Sequence diagram of an example of an utterance test method for a utterance device according to Embodiment 3 An example of the user interface of the terminal device in Embodiment 3 Flowchart of an example of an utterance test method for a utterance device according to Embodiment 4 Sequence diagram of an example of an utterance test method for a utterance device according to Embodiment 4 An example of the user interface of the terminal device in Embodiment 4 Flowchart of an example of an utterance test method for a utterance device according to Embodiment 5 Sequence diagram of an example of an utterance test method for a utterance device according to Embodiment 5 An example of a
  • a speech test method for a speech device includes the steps of receiving a speech test start command from a terminal device, and subjecting at least one speech device to a speech test based on the speech test start command.
  • the speech test start command may include input information for selecting the test device.
  • the speech test start command may include input information for selecting the test device.
  • at least one speech device specified in the speech test start command, all speech devices specified in the speech test start command, or the closest speech device to the user of the terminal device are selected based on the input information of the speech test start command.
  • a test device may be configured to be a test device.
  • an utterance test method for an utterance device for an utterance device according to the first or second aspect, wherein the test contents include utterance text of audio data, utterance text of video data, volume of utterance, frequency component of utterance, and rate of speech.
  • an utterance test method for utterance devices for utterance devices according to any one of the first to third aspects, wherein a plurality of test devices are set in the utterance test start command, and the plurality of test devices are set. Contains information about the order in which to perform an utterance test against.
  • the test content may be spoken to each of the plurality of test devices in the order specified by the order information of the speech test start command.
  • an utterance test method for an utterance device in which, in the step of causing the test device to utter test content, after receiving a test completion notification from the test device that caused the utterance, The test content may be spoken to each of a plurality of test devices as is spoken by the next test device in the information.
  • an utterance test method for a utterance device comprising the step of determining whether or not the utterance test fails; and sending a test failure notification corresponding to the cause of failure to the terminal device for display on the terminal device.
  • an utterance test method for a speech device comprising: displaying a setting change user interface on the terminal device; When receiving, the step of changing the contents of the test based on the setting change command and causing the test equipment to utter the changed contents of the test may be further included.
  • an utterance test method for a utterance device comprising: setting additional information based on information that the utterance device can utter; along with the test content, or causing the terminal device to display additional information.
  • an utterance test method for a speech device according to any one of the first to eighth aspects, wherein before the step of receiving the utterance test start command from the terminal device, the utterance wording of the test content is may further include a step of displaying on the terminal device.
  • a speech test server for speech equipment comprises a server storage unit for storing audio data or video data, and a server control unit.
  • the server control unit receives an utterance test start command from the terminal device, and sets the test device so that at least one utterance device is the test device to be subjected to the utterance test based on the utterance test start command.
  • the test contents of the speech test are set, and the test contents are spoken by the test equipment.
  • the speech test start command may include input information for selecting the test device.
  • the server control unit based on the input information of the speech test start command, selects at least one speech device specified in the speech test start command, all speech devices specified in the speech test start command, or the device closest to the user of the terminal device. may be further configured to configure the test device such that the speech device is the test device.
  • the test contents are speech data speech text, video data speech text, speech volume, speech frequency component, and rate of speech.
  • the utterance test server for speech equipment is such that a plurality of test equipment are set in the speech test start command, and the plurality of test equipment It contains information on the order in which an utterance test is performed for
  • the server control unit may be further configured to cause each of the plurality of test devices to utter the test content in the order specified by the order information of the speech test start command when making the test device utter the test content.
  • the server control unit receives a test completion notice from the test device that caused the test device to utter the test content. Then, it may be further configured to cause each of the plurality of test devices to speak the test content so as to make the next test device in the order information speak.
  • the server control unit determines whether or not the speech test fails, It may further be configured to transmit a test failure notification corresponding to the cause of failure to the terminal device and display it on the terminal device when the test fails.
  • an utterance test server for speech equipment according to any one of the tenth to fifteenth aspects, wherein the server control unit causes the terminal device to display a setting change user interface, and sets from the terminal device. It may further be configured to change the test content based on the setting change command and cause the test device to utter the changed test content when the change command is received.
  • the server control unit sets the additional information based on the information that the speech equipment can speak.
  • the additional information may be further configured to be uttered by the test equipment together with the test content, or the additional information may be displayed on the terminal device.
  • the server control unit before receiving the speech test start command from the terminal device, may be further configured to cause the terminal device to display the utterance wording of .
  • a speech device speech test system includes at least one speech device capable of speaking, a terminal device, and the speech test server of any one of the tenth to eighteenth aspects.
  • a program according to a twentieth aspect of the present invention is a program used in a terminal that communicates with the speech test server according to claims 10-18.
  • Embodiment 1 described below shows an example of the present invention. Numerical values, shapes, configurations, steps, order of steps, and the like shown in Embodiment 1 below are examples and do not limit the present invention. Among the constituent elements in Embodiment 1 below, those constituent elements that are not described in the independent claims representing the highest concept will be described as optional constituent elements.
  • Embodiment 1 which will be described below, there are cases where modifications are shown for specific elements, and for other elements, arbitrary combinations of configurations are included as appropriate. It plays. By combining the configurations of the respective modifications in Embodiment 1, the effects of the respective modifications can be obtained.
  • first, second, etc. are used for descriptive purposes only and are intended to indicate or imply relative importance or order of technical features. should not be understood.
  • a feature that is qualified as “first” and “second” expressly or implicitly includes one or more of such features.
  • FIG. 1 is a block diagram showing a schematic configuration of an utterance test system according to Embodiment 1.
  • the speech device speech test system includes a speech test server 10 , at least one speech device 20 capable of speaking, and a terminal device 30 associated with the speech device 20 .
  • the speech test server 10 may receive information from at least one information source device 40 or at least one external information source 50 and cause the speech device 20 to speak based on the received information. These source devices 40 and external sources 50 may or may not be included in the speech test system. An outline of each component will be described below.
  • the utterance device 20 is a device having a utterance function.
  • the utterance device 20 of the present embodiment includes a home appliance (speech home appliance) having a utterance function.
  • Household appliances is an abbreviation for home appliances.
  • the utterance device 20 may be any type of electronic device used at home. ), lighting, water heaters, intercoms, and other electric appliances.
  • the speech device 20 may also be referred to as a "consumer speech device" or a "speech appliance.”
  • the utterance function is defined as a function of uttering sounds including human language using a speaker.
  • Speech functions can convey more information to the user using human language, unlike functions that only speak sounds such as beeps, buzzes, alarms, etc., which do not contain human language.
  • the utterance device 20 as a utterance home appliance is configured to exhibit each home appliance function.
  • the speech device 20, which is an air conditioner includes a compressor, a heat exchanger, and an indoor temperature sensor, and is configured to perform cooling, heating, and dehumidifying functions in a controlled space.
  • the utterance device 20, which is a cleaning robot includes a battery, a dust collection mechanism, a movement mechanism, and an object detection sensor, and is configured to clean while moving within a movable range.
  • the utterance device 20 includes a device storage unit 21 (household appliance storage unit) that stores information for exhibiting functions, and a device control unit 22 (household appliance control unit) that controls the entire utterance device 20. , a device communication unit 23 (home appliance communication unit) capable of communicating with the speech test server 10 or the terminal device 30, and a speaker 24 for speaking.
  • Speaking device 20 may include a display 25 for displaying visual information to the user.
  • Talking device 20 may also include at least one of various sensors 26 to perform functionality.
  • the exemplary speech device 20 will be described, but other speech devices 20 may have a similar configuration.
  • the device storage unit 21 is a recording medium for recording various information and control programs, and may be a memory functioning as a work area for the device control unit 22 .
  • the device storage unit 21 is implemented by, for example, flash memory, RAM, other storage devices, or an appropriate combination thereof.
  • the device storage unit 21 may store audio data or video data for speech.
  • the audio data or video data for speech may be stored before shipment of the speech device 20, or may be read from another storage medium based on instructions from the seller or the user at home. , may be downloaded via the Internet at the direction of the seller or user.
  • the device control unit 22 is a controller that controls the entire speech device 20 .
  • the device control unit 22 includes general-purpose processors such as a CPU, MPU, FPGA, DSP, and ASIC that implement predetermined functions by executing programs.
  • the device control section 22 can implement various controls in the utterance device 20 by calling and executing the control program stored in the device storage section 21 .
  • the device control section 22 can cooperate with the device storage section 21 to read/write data stored in the device storage section 21 .
  • the device control unit 22 is not limited to one that realizes a predetermined function through cooperation of hardware and software, and may be a hardware circuit designed exclusively for realizing a predetermined function.
  • the device control unit 22 can receive various setting values (for example, the set temperature of the air conditioner, the display channel of the television, the cleaning time of the cleaning robot) by the user via the setting user interface.
  • the device control unit 22 controls each component of the speech device 20 so that the function of the speech device 20 is exhibited based on these set values and detection values received from various sensors (for example, room temperature, presence or absence of objects). to control.
  • the device control section 22 may receive a command from the speech test server 10 or the terminal device 30 and control the speech device 20 according to the command.
  • the device control unit 22 performs a speech test according to a command from the speech test server 10 based on a speech test method to be described later.
  • the device communication unit 23 can also communicate with the speech test server 10, the user's terminal device 30, etc., and can transmit and receive Internet packets, for example.
  • the device control unit 22 cooperates with the speech test server 10 via the device communication unit 23, it can receive parameter values or instructions regarding the speech test from the speech test server 10 via the Internet.
  • the speaker 24 uses audio data specified by the device control unit 22 to convert an electrical signal into an acoustic signal and radiate it into space as a sound wave.
  • Device controller 22 may communicate with speaker 24 via an audio interface.
  • the speaker 24 may be appropriately provided based on the type of the utterance device 20 or the like. For example, in a speaking device 20 that is a television, speakers 24 may be provided on either side of the front of the television. In speaking device 20 that is a cleaning robot, speaker 24 may be provided within the housing of the cleaning robot.
  • the speaker 24 of each speech device 20 may have different standards and speech capabilities. For example, a television speaker 24 may have a relatively high speech/speech capability, while a washing machine speaker 24 may have a relatively low speech/speech capability. This disclosure does not limit the speaking/voicing capabilities of speaker 24 .
  • the display 25 is for displaying visual information to the user.
  • the display 25, for example, may have a high resolution in order to display clear images like a television screen, and displays a user interface (UI) for setting settings in washing machines and microwave ovens. It may be a panel display with a low resolution for the purpose. This disclosure does not limit the display capabilities of display 25 .
  • the display 25 may be a touch panel having a display function.
  • the sensor 26 is for acquiring various information from the outside of the utterance device 20 in order for the utterance device 20 to exhibit its functions.
  • the sensor 26 includes an indoor temperature sensor that detects the temperature inside the room in which the air conditioner is installed, an outdoor temperature sensor that detects the temperature outside the room in which the air conditioner is installed, and an object in front of the cleaning robot.
  • An object sensor that detects presence or absence, an open/close sensor that detects whether the refrigerator door is completely closed, or the like may be used.
  • Information detected by the sensor 26 is input and stored in the device storage section 21, and later used by the device control section 22 or transmitted to the terminal device 30 or server.
  • the terminal device 30 is a device associated with the speech device 20 .
  • it may be a controller of the utterance device 20, or a controller capable of simultaneously managing and controlling a plurality of types of home appliances.
  • the terminal device 30 is an information terminal capable of performing data communication with the utterance device 20, such as a smart phone, a mobile phone, a mobile phone, a tablet, a wearable device, a computer, etc., in which a dedicated related application 32 is installed.
  • the speech test server 10 or the device control unit 22 can acquire settings or instructions input by the user via the terminal device 30 .
  • terminal device 30 includes a display for displaying a graphical user interface (GUI).
  • GUI graphical user interface
  • the terminal device 30 may include a speaker and a microphone when interacting with the user via a voice User Interface (VUI).
  • VUI voice User Interface
  • the information source device 40 is a source of information related to the content uttered by the utterance device 20 .
  • the information source device 40 may be another device (household appliance) in the home in which the utterance device 20 is provided. If the source device 40 is another device, the source device 40 is also referred to as source device (source appliance) in this disclosure.
  • the information source device may be the utterance device 20, or may be a device without a utterance function.
  • the information source device may transmit device information (home appliance information) such as its operating state to the utterance test server 10, and the utterance test server 10 may set the test contents of the utterance test based on the received device information.
  • the information source device transmits the device information to the utterance test server 10 or another server, and the utterance test server 10 or the other server receives the device information.
  • the speech device 20 may be caused to speak based on the information. Examples of the device information include the activation state, operation mode, and abnormality information of the information source device.
  • the external information source 50 is an information source that provides information related to services that are not directly related to the speech device, such as weather information and information related to delivery status of parcel delivery services.
  • the utterance test server 10 may set the test contents of the utterance test based on information acquired from the external information source 50 . After the speech test, the utterance test server 10, the terminal device 30, or another server causes the utterance device 20 to speak based on the information obtained from the external information source 50 during normal use of the utterance device 20. good too.
  • the utterance test server 10 is a server that performs an utterance test on at least one utterance device 20 using audio data or video data containing human language.
  • the speech test server 10 can connect to at least one speech device 20 via the Internet to control the speech test. For multiple speech devices 20 located in the same home or the same store, the speech test server 10 can test these multiple speech devices at once.
  • the utterance test server 10 may be used for purposes other than executing the utterance test method described later.
  • the speech test server 10 may be a management server of a manufacturer of speech devices 20 for managing at least one speech device 20 or collecting data.
  • the speech test server 10 may be an application server.
  • the utterance test server 10 includes a server storage section 12 and a server control section 14 .
  • the speech test server 10 may further include a server communication unit 16 for communicating with the speech device 20 , the terminal device 30 , the information source device 40 , or the external information source 50 .
  • the server storage unit 12 is a recording medium for recording various information and control programs, and may be a memory functioning as a work area for the server control unit 14 .
  • the server storage unit 12 is realized by, for example, flash memory, SSD (Solid State Device), hard disk, RAM, other storage devices, or an appropriate combination thereof.
  • the server storage unit 12 may be a memory inside the utterance test server 10, or may be a storage device connected to the utterance test server 10 via wireless or wired communication.
  • the server storage unit 12 stores audio data or video data for the speech test.
  • Various audio data or video data for the speech test can be generated according to the type of test equipment (test home appliance) subject to the speech test, the type of the information source device 40, the type of the external information source 50, and the like.
  • the utterance test server 10 generates voice data or video data for the utterance test in advance and stores it in the server storage unit 12 before the utterance test.
  • the utterance test server 10 dynamically (at the time of execution) generates voice data or video data for the utterance test during execution of the utterance test, and stores the generated data in the server storage unit 12 .
  • the server storage unit 12 may store material data for generating these audio data or video data, or intermediate data. Further, the server storage unit 12 of the utterance test server 10 may store audio data or video data used when the utterance device 20 is made to utter during normal use of the utterance device 20 after the test.
  • the server storage unit 12 also stores setting information for the utterance test (for example, test content such as volume, which will be described later). After the utterance test is finished, when the utterance test server 10 causes the utterance device 20 to utter based on the device information or the like during normal use of the utterance device 20, settings and information for utterance are stored.
  • setting information for the utterance test for example, test content such as volume, which will be described later.
  • the server control unit 14 of the speech test server 10 is a controller that controls the entire speech test server 10 .
  • the server control unit 14 includes general-purpose processors such as a CPU, MPU, GPU, FPGA, DSP, and ASIC that implement predetermined functions by executing programs.
  • the server control unit 14 can implement various controls in the speech test server 10 by calling and executing control programs stored in the server storage unit 12 .
  • the server control unit 14 can cooperate with the server storage unit 12 to read/write data stored in the server storage unit 12 .
  • the server control unit 14 is not limited to one that realizes a predetermined function through the cooperation of hardware and software, and may be a hardware circuit designed exclusively for realizing a predetermined function.
  • the server communication unit 16 can cooperate with the server control unit 14 to transmit and receive Internet packets, that is, to communicate with the speaking device 20, the terminal device 30, the information source device 40, the external information source 50, and the like.
  • the speech test server 10 may receive instructions from the terminal device 30 via the server communication unit 16, may send instructions to the speech device 20, and may receive information from The server communication unit 16 or the device communication unit 23 enables Wi-Fi (registered trademark), Data may be transmitted and received by performing communication according to standards such as IEEE802.2, IEEE802.3, 3G, and LTE.
  • intranet In addition to the Internet, intranet, extranet, LAN, ISDN, VAN, CATV communication network, virtual private network, telephone line network, mobile communication network, satellite communication network, etc., infrared rays, Bluetooth (registered trademark) may be used for communication. .
  • FIG. 2 is a flowchart of the utterance test method for the utterance device according to the first embodiment, and the utterance test method for the utterance device includes the following steps S100 to S400.
  • FIG. 3 is a sequence diagram of an example of an utterance test method for a utterance device according to Embodiment 1, and corresponds to the flowchart of FIG.
  • the user can start the speech test via the UI of the terminal device 30.
  • the server control unit 14 receives a speech test start command from the terminal device 30 associated with the speech device 20 via the server communication unit 16 (step S100).
  • FIG. 4 is an example of the UI of the terminal device 30 according to Embodiment 1, showing a screen 60 of the terminal device 30. As shown in FIG. The UI displays information related to the utterance device and the content of utterance.
  • a button 62 labeled "Notification Trial” is provided. When the user presses this button, the terminal device 30 generates input information based on the user input, and converts the input information into an utterance test start command.
  • the terminal device 30 transmits an utterance test start command to the utterance test server 10, and the utterance test is started.
  • Instructions and information communication between the utterance test server 10 and the terminal device 30 may be performed indirectly via another server or the like.
  • the server control unit 14 sets the test device so that at least one speech device 20 is the test device to be subjected to the speech test, based on the input information of the speech test start command (step S200).
  • the test device 20 may refer to the speech device 20 set as the target of the speech test. If there are a plurality of utterance devices 20 that can be subject to the utterance test in the home, the server control unit 14 selects at least one of them as the test device. More specifically, based on the speech test start command, the server control unit 14 controls at least one speech device 20 specified by the input information of the speech test start command, all of the speech devices 20, or all of the terminal devices.
  • the test device may be set so that the speaking device 20 closest to the user is the test device.
  • the user can select the speech device 20 to be tested via the UI of the terminal device 30 .
  • the speech test start command includes input information for selecting test equipment.
  • the input information may include, for example, the identifier of the selected speech device 20 .
  • the server control unit 14 sets the designated speech device 20 as a test device based on the identifier included in the input information of the speech test start command.
  • the server control unit 14 sets all of the speech devices 20 that can be the targets of the speech test as test devices.
  • the server control unit 14 sets the closest utterance device 20 to the user of the terminal device 30 as the test device.
  • the speech device 20 includes a human sensor
  • the human sensor can be used to detect whether the user is within a predetermined range or the distance to the user.
  • the utterance device 20 can obtain the location of the terminal device 30 using Bluetooth (registered trademark) or GPS technology and estimate the location of the terminal device 30 as the location of the user.
  • the speech device 20 transmits the detected or estimated results to the speech test server 10 .
  • the server control unit 14 identifies the nearest speech device 20 to the user among the speech devices 20 that can be the targets of the speech test, and sets the nearest speech device 20 as the test device.
  • the server control unit 14 may set a plurality of speaking devices 20 closest to the user as test devices.
  • the server control unit 14 uses audio data or video data to set the test content of the speech test determined based on the set test equipment (step S300).
  • audio data or video data is data containing human language.
  • an example of performing an utterance test using audio data will be mainly described, but based on the same method, an utterance test can be performed using video data instead of or in addition to audio data. can be done.
  • the test equipment includes a display
  • speech tests may be performed on video data.
  • audio data may be abbreviated as "sound source”.
  • the “sound source” described in the present disclosure refers to audio data stored in the server storage unit 12 or the device storage unit 21, audio data for an utterance test generated by the utterance test server 10, or generated by the utterance test server 10. It refers to audio data used during normal use of the speech device 20 after the speech test is completed.
  • the test content that can be set in the server control unit 14 is the content of the audio data or video data used for the speech test, and specifically, may include speech phrases (text) or speech specifications. More specifically, the utterance text may include the utterance text of audio data or the utterance text of video data.
  • the speech specification may include at least one of speech volume, speech frequency content, and speech rate.
  • the sound in the audio or video data may be synthetic speech or pre-recorded human speech.
  • the utterance wording is words to be uttered, for example, "This is a test utterance. I will let you know by voice like this.”
  • the server control unit 14 may set the utterance wording based on the type of test equipment.
  • the utterance text may be set to "This is a test utterance for a robot cleaner.”
  • the utterance wording may include the language of words, gender, age, voice quality, type of words, and the like.
  • the user can specify at least one test content item via the UI of the terminal device 30 .
  • the speech test start command may include the specified item and its content.
  • the speech test start command may include items and contents of "Language: Japanese”, “Gender: Female", and "Volume: Medium”.
  • the server control unit 14 sets test contents based on the items and contents included in the speech test start command.
  • Setting the test content includes determining at least one item for the above test content, selecting audio data stored in the server storage unit 12 corresponding to the determined test content, and/or , generating audio data (sound source) based on the determined test content.
  • the server control unit 14 transmits an utterance instruction to the test equipment, and causes the test equipment to utter the contents of the test (step S400).
  • audio data sound source
  • the server control unit 14 transmits the URL (uniform resource locator) of the audio data to the test device.
  • the speech instruction includes a URL for download.
  • the test device downloads the specified URL corresponding sound source data and speaks.
  • the server controller 14 transmits the audio data to the test equipment, and the test equipment speaks using the received audio data.
  • the device storage unit 21 is already stored with audio data corresponding to various test content, and the server control unit 14 sends the test content or related information to be set to the test device.
  • the test equipment selects and speaks corresponding audio data based on the received test content or related information.
  • a terminal that communicates with the speech test server 10, such as the speech device 20 or the terminal device 30, has a program used to perform the speech test as described above.
  • the speech test server 10 may perform a test based on device information for a particular speech device 20 , device information for other speech devices 20 , or information from an external information source 50 . Then, the speech device 20 can be made to speak with the same settings as during the test. For example, as in the test, the domestic speech device 20 is made to speak with the settings of "language: Japanese”, “sex: female", and "volume: medium”. In this way, the user can confirm the setting of the speech, and can later experience the speech according to the confirmed setting.
  • FIG. 5 is a block diagram showing a schematic configuration of an utterance test system according to the second embodiment.
  • the speech test server 10 includes a speech instruction server 10a and a sound source server 10b.
  • the speech instruction server 10a includes a server storage section 12a, a server control section 14a, and a server communication section 16a.
  • the speech instruction server 10b includes a server storage section 12b, a server control section 14b, and a server communication section 16b.
  • the sound source server 10b performs operations related to generation, storage, and download of speech data (sound source) for the speech test in the speech test method.
  • the speech instruction server 10 a performs the remaining operations, for example, communication between the speech device 20 and the terminal device 30 .
  • FIG. 6 is a sequence diagram of an example of an utterance test method for a utterance device according to the second embodiment.
  • the speech instruction server 10a receives the speech test start command from the terminal device 30, sets the test equipment and test contents based on the speech test start command, and transmits the speech instruction to the test equipment.
  • the sound source to be used for the speech test is stored in the server storage unit 12b of the sound source server 10b, and the speech instruction includes a URL for downloading the sound source ("URL for DL").
  • the test device downloads the sound source from the sound source server 10b based on the DL URL, and utters with the sound source so as to perform a utterance test.
  • each of the speech test servers 10 only needs to have a configuration for performing the operations for which it is responsible.
  • the speech instruction server 10a does not need to include hardware for sound source generation. This configuration facilitates maintenance and maintenance of the entire speech test server 10 .
  • the function of the utterance test server 10 may be shared by a plurality of servers from a different point of view from that of FIG.
  • the speech test server 10 may include a speech instruction server, a sound source generation server, and a sound source distribution server.
  • the sound source generated by the sound source generation server is stored in the server storage section of the sound source distribution server and downloaded to the test device.
  • FIG. 7 is a flow chart of an example of step S400 in the third embodiment
  • FIG. 8 is a sequence diagram of an example of a speech test method for speech devices in the third embodiment.
  • the utterance test server 10 performs step S100 as in the first embodiment.
  • step S200 the speech test server 10 sets up a plurality of test devices based on the speech test start command.
  • the speech device 20a, the speech device 20b, and the speech device 20c are provided in the home, and the speech test server 10 may set all of these as test devices.
  • a plurality of speaking devices 20 selected by the user via the UI of the terminal device 30 are set as test devices.
  • FIG. 9 is an example of the UI of the terminal device 30 according to Embodiment 3, showing a screen 70 of the terminal device 30.
  • the user can set the utterance device 20a, the utterance device 20b, and the utterance device 20c to "on" via the UI.
  • a button 72 for "execute notification test" is provided in the UI of FIG. 9, a button 72 for "execute notification test" is provided.
  • a test start command is sent to the speech test server 10 .
  • the user may specify the speaking order via the UI of the terminal device 30.
  • the terminal device 30 generates order information based on the order specified by the user, puts it in the speech test start command, and transmits it to the speech test server 10 . Therefore, in the speech test start command, a plurality of test devices are set, and the order information for performing the speech test on the plurality of test devices is included. If the user does not specify a speech test start command, the terminal device 30 sets the speech device 20 to be set to "on" in the order from top to bottom displayed on the UI (in FIG. 9, the speech device 20a, speech test The device 20b, then the utterance device 20c) may be arranged in the utterance order, and the utterance test start command including this order information may be transmitted to the utterance test server 10.
  • FIG. 9 the speech device 20a, speech test The device 20b, then the utterance device 20c
  • the speech test server 10 may set the same test content for a plurality of test devices, or may set different test content for at least one test device.
  • a plurality of test devices can be made to speak at once, but a plurality of test devices may be made to speak in order so that the user can hear the speech test well.
  • each test device sends a test completion notification to the speech test server 10 after completing the speech test.
  • the utterance test server 10 receives the test completion notification from the test equipment that made the utterance, and then makes each of the plurality of test equipment utter the test contents so as to make the next test equipment utter the utterance.
  • the utterance test server 10 causes one test device (for example, the test device 20a) to utter the test content (step S410). Then, the utterance test server 10 determines whether or not a test completion notification has been received from the test device that was caused to speak first (step S420). When the test completion notification is received from the test device that was caused to speak first, the speech test server 10 causes the next test device (for example, the test device 20b) to speak (step S430).
  • the next test device for example, the test device 20b
  • the utterance test server 10 may cause each of the plurality of test devices to utter the test content in the order specified in the utterance test start command order information. If there is no order information in the speech test start command, the speech test server 10 sorts the test device identifiers in ascending or descending order, or in ascending or descending order of the distance between the test device and the user. can be made to speak.
  • the test equipment does not send a test completion notification.
  • the utterance test server 10 transmits the utterance instruction to the next test apparatus after a predetermined period of time has passed since the utterance instruction was transmitted to one test apparatus.
  • the test content may be set such that the next test device to be spoken is presented to the test device other than the test device that is to be spoken last (for example, the test device 20c). good.
  • the speech test is performed in order of test device 20a (television), test device 20b (cleaning robot), and test device 20c (refrigerator).
  • the utterance test server 10 utters "The cleaning robot will speak next.” when testing the test device 20a, and utters "The refrigerator will speak next.” when testing the test device 20b.
  • the utterance test server 10 completes the process of causing multiple test devices to utter.
  • the user can confirm the settings for speech with respect to the plurality of speech devices 20, and later can experience the speech according to the confirmed settings.
  • the server control unit 14 can notify the user of the test failure. Further, the server control unit 14 may attempt to identify the cause of failure and notify the user of the identified cause of failure.
  • FIG. 10 is a flow chart of an example of an utterance test method for speech devices according to the fourth embodiment
  • FIG. 11 is a sequence diagram of an example of an utterance test method for speech devices according to the fourth embodiment.
  • test equipment when the test equipment detects that it is not obtaining or recognizing speech instructions, cannot download sound sources, or cannot speak on speaker 24, it sends a test failure notification (and information related to its cause). ) to the speech test server 10 .
  • server control unit 14 receives the test failure notification via the server communication unit 16, it determines that the speech test has failed.
  • FIG. 12 is an example of the UI of the terminal device 30 according to Embodiment 4, showing a screen 80 of the terminal device 30.
  • the server control unit 14 may classify the possible causes of failure described above so that the user can easily handle them, and display them on the terminal device 30 . For example, when a network connection failure is considered to be the cause of the failure, a test failure notification saying "Test notification failed. Please check network connection.” may be displayed. When a failure in the test equipment itself is considered to be the cause of the failure, a test failure notification saying "Test notification failed. Please check the status or settings of the test equipment.” may be displayed. Also, when the download seems to have failed due to a problem with the server, a test failure notification saying "Test notification failed. Download of test sound source failed.” may be displayed.
  • the server control unit 14 completes the processing when the test fails. In this way, even if the speech test fails, feedback can be given to the user using the test failure notification, and the user can be relieved. Further, by displaying information related to the cause of failure, it is possible to prompt the user to eliminate the cause and perform the utterance test again.
  • Embodiment 5 >> ⁇ In the case of retesting after changing settings>
  • the user can receive the results of the speech test, change the speech settings, and then perform the test again.
  • FIG. 13 is a flow chart of an example of an utterance test method for speech devices according to Embodiment 5
  • FIG. 14 is a sequence diagram of an example of an utterance test method for speech devices according to Embodiment 5.
  • FIG. The server control unit 14 causes the test device to utter the contents of the test, and then causes the terminal device 30 to display the setting change UI (step S610).
  • FIG. 15 is an example of a setting change UI according to Embodiment 5, showing a screen 90 of the terminal device 30. As shown in FIG. The user can change the volume at the time of speaking using this setting change UI.
  • the terminal device 30 receives an input to change, for example, when the button "increase volume" in FIG.
  • the server control unit 14 determines whether or not a setting change command has been received from the terminal device 30 (step S620). If received, the server control unit 14 changes the test content based on the setting change command, and causes the test equipment to utter the changed test content (step S630). For example, when receiving a setting change command to "increase the volume", the server control unit 14 transmits an utterance command with changed test content to the test device. If multiple test instruments are present, the user may be allowed to specify at least one test instrument to which the changes apply via the change settings UI. Also, in the embodiment of FIG. 15, the volume setting is changed, but any item of the above-described test contents, such as language or voice quality, may be changed.
  • a button "OK with the current volume” may be displayed on the setting change UI so as to obtain user's confirmation.
  • the terminal device 30 may notify the utterance test server 10 that the confirmation button has been pressed.
  • a button 92 "Retest” when the user presses this button, the terminal device 30 issues a speech test start command so that the speech test is performed again with the changed speech settings.
  • Send to the speech test server 10 server control unit 14 transmits speech command 100A to test device 20 in step S400 during another speech test.
  • the test device 20 downloads the sound source 100C using the “DL URL 100B” specified by the speech command 100A, speaks using the sound source 100C, and transmits a test completion notice to the speech test server 10.
  • the server control unit 14 When the server control unit 14 receives a setting change command (for example, a setting change command to "increase the volume") in step S620, it resets the test contents based on the setting change command.
  • the server control unit 14 may generate a sound source with increased volume, and may identify a sound source stored in the server storage unit 12 that corresponds to the increased volume. Then, the server control unit 14 transmits the speech instruction 200A including the URL (“DL URL 200B”) for downloading the sound source corresponding to the raised volume to the test device 20 .
  • the test device 20 uses the “DL URL 200B” to download the sound source 200C whose volume has been raised, and speaks again using the sound source 200C.
  • the UI of the screen 90 does not have a button 92 for "retest".
  • the terminal device 30 transmits to the speech test server 10 both a corresponding setting change command and a speech test start command.
  • the server control unit 14 receives the setting change command and the speech test start command, it resets the test content based on the setting change command, similarly to the embodiment in which the button 92 is provided, and the reset test content is displayed. Have the test device speak.
  • speech test server 10 causes speech device 20 to speak with the changed settings (e.g., at an increased volume), unless the speech settings are further changed.
  • the server control unit 14 changes the test contents based on the setting change command, but does not perform the test again with the changed settings.
  • the server control unit 14 completes the setting change process. In this way, the user can easily change the utterance setting according to his/her preference and obtain a better experience.
  • Additional information can be spoken by the test device or displayed on the terminal device 30 during the speech test to provide the user with more information about the speech capabilities of the speech device 20 .
  • FIG. 16 is a flow chart of an example of an utterance test method for a speech device according to the sixth embodiment
  • FIG. 17 is a sequence diagram of an example of an utterance test method for a speech device according to the sixth embodiment.
  • the server control unit 14 sets additional information based on the information that the speech device 20 can speak (step S710). Then, the server control unit 14 causes the test equipment to utter the additional information, or causes the terminal device 30 to display the additional information (step S720).
  • “Additional information” refers to information that can be uttered by the utterance device 20 and that can be provided to the user in addition to the utterance experience. For example, it may be information about the information source device 40 or the external information source 50 that may be the information source during normal use of the speech device 20 after the test. As described above, the utterance device 20 can be caused to speak based on the device information acquired from the information source device 40 or information unrelated to the utterance device 20 acquired from the external information source 50 . In Embodiment 6, the user's understanding of the speech function is assisted by notifying the types or names of these information sources as additional information. In this way, even if the number of sources of information increases, it becomes easier for the user to understand what is notified.
  • a plurality of speech devices 20 are installed in a home, but only some of them may be specified by the user as test devices.
  • the server control unit 14 may use the type or name of the other utterance device 20 or the types or names of all the utterance devices 20 as additional information so as to present the existence of the other utterance device 20 to the user. good.
  • the server control unit 14 may use the type or name of the utterance device 20 or the information source device 40 that is set not to utter (not notify) the device information as the additional information.
  • the server control unit 14 may be able to notify the user of information on a specific service (for example, weather information or information on the delivery status of parcel delivery service) based on the external information source 50 .
  • the server control unit 14 may use the type or name of the service as additional information so as to present the existence of the service or information to the user.
  • the server control unit 14 dynamically sets and generates audio data (sound source) corresponding to the additional information, or the audio data stored in the server storage unit 12 corresponds to the additional information. You can choose what to do.
  • the speech test server 10 includes a speech instruction server 10a, a sound source server 10b that stores generated sound sources, and a sound source generation server 10c.
  • the speech instruction server 10a transmits a sound source generation instruction including the test content and additional information to the sound source generation server 10c.
  • the sound source generation server 10c dynamically generates appropriate sound source data, stores the data in the sound source server 10b, and arranges the sound source data.
  • the sound source server 10b notifies the speech instruction server 10a of the URL for downloading the sound source.
  • the speech instruction server 10a transmits the speech instruction including the URL to the test device in step S400 and/or step S720.
  • the test device uses the received URL to download and speak a dynamically generated sound source.
  • step S710 may be merged with step S300.
  • Step S720 may be merged with step S400 to cause additional information to be spoken to the test equipment along with the test content. If multiple test devices are present, only the first test device to speak may be made to speak additional information.
  • the server control unit 14 can, for example, notify the user of additional information regarding the information source device 40 or the external information source 50 together with the speech test. Therefore, the user can deepen his/her understanding of the speech function of the speech device 20 .
  • Embodiment 7 ⁇ When the utterance wording is displayed on the terminal device> In Embodiment 7, it is possible to display the utterance wording (text) of the test content on the terminal device 30 before speaking. Thus, the user can more easily understand what sentences are to be spoken and be prepared for the speech test before actually performing the test.
  • FIG. 18A is an example of display of utterance wordings of test content in the seventh embodiment
  • FIG. 18B is a sequence diagram of an example of an utterance test method for speech equipment in the seventh embodiment.
  • the server control unit 14 transmits in advance to the terminal device 30 an utterance wording that the test device is to utter in the utterance test, and displays the utterance wording on the terminal device 30.
  • the terminal device 30 inquires of the utterance instruction server 10a of the utterance test server 10 about the utterance wording. This inquiry is made before the terminal device 30 transmits the speech test start command, that is, before step S100 (FIG. 1, etc.). Next, the utterance instruction server 10a responds to the inquiry and transmits utterance text (for example, "This is a voice notification test") to the terminal device 30 (step (1) in FIG. 18B).
  • the terminal device 30 When the terminal device 30 receives the utterance wording, it displays the wording on the UI of the related application 32 (step (2) in FIG. 18B). As shown in FIG. 18A, on the screen 100 of the UI of the terminal device 30, an utterance word display 104 of the utterance test is displayed in addition to the button 102 of "test notification".
  • the utterance test server 10 acquires the sound source (speech data) corresponding to the utterance wording and performs an utterance test, as in the first to sixth embodiments described above. For example, when the user presses button 102, steps (3)-(9) of FIG. 18B are performed as described in connection with steps (1)-(7) of FIG. 6 in the second embodiment.
  • step (1) in FIG. 18B can be omitted.
  • the utterance wording or the sound source corresponding to it can be updated, in the subsequent utterance test, the inquiry about the utterance wording, the transmission of the utterance wording, and the acquisition of the sound source for the utterance test may be performed again.
  • FIG. 19A is another example of display of the utterance wording of the test content in Embodiment 7, and FIG. 19B is a sequence diagram of another example of the utterance test method of the utterance device in Embodiment 7.
  • the server control unit 14 causes the terminal device 30 to display a plurality of candidate wordings, sets the candidate wording selected by the user as an utterance wording, and Make the test home appliance utter the candidate wording.
  • the server control unit 14 responds to an inquiry about the utterance wording from the terminal device 30, and transmits in advance to the terminal device 30 a plurality of candidate wordings that can be uttered in the utterance test (step of FIG. 19B). (1)). For example, the server control unit 14 transmits to the terminal device 30 three candidate phrases: "Voice notification test", “Voice sounds like this", and "Can you hear me?” good too. The timing of querying and sending candidate phrases may be the same as the example shown in FIG. 18B.
  • the terminal device 30 When the terminal device 30 receives the candidate wording, it displays the display 114 of the uttered wording on the UI screen 110 (step (2) in FIG. 19B). The user may select one of the candidate phrases in the speech phrase display 114 via the UI of the terminal device 30 and then press the button 112 to start the speech test. When the button 112 is pressed, the terminal device 30 transmits information that can identify the selected candidate wording (for example, the candidate wording itself or the corresponding identification number) to the utterance instruction server 10a of the utterance test server 10 (FIG. 19B). step (3)). The terminal device 30 may transmit this information as part of the speech test start command, may transmit it together with the speech test start command, or may transmit it separately from the speech test start command.
  • the selected candidate wording for example, the candidate wording itself or the corresponding identification number
  • one of the candidate wordings can be set as a default.
  • the terminal device 30 transmits information for specifying the default candidate wording and a speech test start command to the speech instruction server 10a of the speech test server 10.
  • the utterance test server 10 When the utterance test server 10 receives the information that can identify the selected candidate wording and the utterance test start command, it acquires the sound source corresponding to the selected candidate wording and causes the test device to utter the sound source. For example, upon receiving information that can identify the selected candidate wording and an utterance test initiation command, steps (4) to (9) of FIG. Performed as described with respect to steps (2)-(7).
  • FIG. 20A is another example of displaying the utterance wording of the test content in the seventh embodiment
  • FIG. 20B is a sequence diagram of another example of the utterance test method of the speech device in the seventh embodiment.
  • the server control unit 14 asks the user to input a sentence via the UI of the terminal device 30, and tests the input sentence as an utterance sentence in the utterance test. Make the home appliance speak.
  • the terminal device 30 displays on the UI a text box 124 in which the user can input, instead of receiving and displaying the utterance wording from the utterance instruction server 10a of the utterance test server 10 in advance.
  • the terminal device 30 displays on the UI a text box 124 for inputting the speech phrase (step (1) in FIG. 20B).
  • the user enters a phrase that the test device should speak into the text box 124 via the screen 120 of the UI of the terminal device 30 (step (2) in FIG. 20B), and then presses the button 122 to start the speech test.
  • You may The text entered by the user can be displayed in the text box 124 as is.
  • the terminal device 30 transmits information including the input utterance wording to the utterance instruction server 10a of the utterance test server 10 (step (3) in FIG. 20B).
  • the form of transmission of the information containing the speech phrase and the speech test initiation command may be the same as the example shown in FIG. 19B.
  • the utterance test server 10 Upon receiving the input utterance wording, the utterance test server 10 generates a sound source corresponding to the input utterance wording and causes the test device to utter the sound source, as described in the sixth embodiment. For example, upon receiving the information including the input candidate wording and the command to start the speech test, steps (4) to (13) of FIG. (2) to (11) are performed as described in connection with (11).
  • the server control unit 14 may set the default wording and the corresponding sound source, transmit the default wording to the terminal device 30 in advance, and cause the terminal device 30 to display it in the text box 124 .
  • the terminal device 30 transmits information that can specify the default wording and a speech test start command to the speech test server 10 .
  • the utterance test server 10 or the terminal device 30 determines that a word inappropriate for the utterance test, such as an obscene word, has been input, the utterance test server 10 or the terminal device 30 displays a message requesting re-input, or automatically displays the inappropriate word. , or the utterance test may be performed with the default wording.
  • the degree of freedom in the speech test can be further increased.
  • the program When a program for executing an utterance test is used in the utterance device 20, the program is stored in the device storage unit 21.
  • the device control unit 22 implements the speech test function by executing the program. For example, by executing the program, the device control unit 22 receives an utterance instruction from the utterance test server 10, downloads a test sound source using the URL included in the utterance designation, and speaks with the downloaded sound source. .
  • the program When a program for executing an utterance test is used in the terminal device 30, the program is stored in the storage unit of the terminal device 30.
  • the terminal device 30 implements the speech test function by executing the program. For example, by executing the program, the terminal device 30 presents to the user a UI for receiving an input for starting the speech test, a setting change UI, and the like, and an instruction to start the speech test based on the user's input. Alternatively, it transmits a setting change command to the speech test server 10 . Also, the terminal device 30 can display a test failure notification corresponding to the cause of failure and/or additional information by executing the program.
  • the program for functioning as the speech test server 10, the speech device 20, or the terminal device 30 can be stored in a computer-readable storage medium.
  • these control units for example, CPU or MPU
  • the function can be exhibited.
  • a computer-readable storage medium a ROM, a floppy (registered trademark) disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a magnetic tape, a nonvolatile memory card, or the like can be used.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

発話機器の発話テスト方法、発話テストサーバ、発話テストシステム、およびプログラムは、発話機器(20)に対して発話テストを行う。発話テストシステムは、少なくとも1つの発話可能な発話機器(20)と、端末装置(30)と、発話テストサーバ(10)とを含む。発話テストサーバ(10)は、端末装置(30)から発話テスト開始指令を受信し、少なくとも1つの発話機器(20)を発話テストの対象であるテスト機器(20)として設定し、発話テストのテスト内容を設定し、テスト内容をテスト機器(20)に発話させる。

Description

[規則37.2に基づきISAが決定した発明の名称] 発話機器の発話テスト方法、発話テストサーバ、発話テストシステム、および発話テストサーバと通信する端末で使用されるプログラム
 本発明は、発話機器に関し、特に発話機器の発話テスト方法、発話テストサーバ、発話テストシステム、およびプログラムに関する。
 家電とは、家庭用電化製品の略称であり、例えば、家庭で使うテレビ、冷蔵庫、空気調和機、洗濯機、掃除ロボット、音響機器、照明、給湯器、インターホンなどの電気器具である。従来では、ビープ音やブザー音を用いて、家電の運転状況をユーザに知らせる。例えば、洗濯機の洗濯が終了するとき、空気調和機が起動されるとき、または冷蔵庫の扉が所定時間以上に完全に閉じていないときには、これらの家電はユーザの注意力を引くようにビープ音を発する。
 現在、ビープ音などに代えて、より多くの情報を家電のユーザに伝達するために、人間の言語を含む音声を用いて発話することができる発話機器としての家電が開発されてきた。このような家電は発話家電と呼ばれ、ビープ音の代わりに、例えば、「洗濯が終わりました。」や、「冷蔵庫の扉が閉じていませんよ。」のように発話して、家電に関する情報をユーザに知らせる。
特開2015-164251号公報
 特許文献1において開示された技術は、発話を行う機能を有する複数の電子機器(家電)に対して音声データを提供する音声システムに関する。音声システムは、当該複数の電子機器の設置場所が同じエリアであるか異なるエリアであるかに応じて、発話すべき電子機器を決定する。ユーザの操作を受け付けると、音声システムは発話時の音量または音質の設定を行う。
 しかしながら、ユーザが設定した発話機能に基づいて家電がどのように発話するのかは、実際に発話するまでユーザは確認できない。そのため、ユーザは設定が本当に成功したかを確認する術がなければ、家電がどのように発話するかが分からずに心構えもできない。
 本発明は、発話機器の発話についての設定が確認でき、ユーザに発話を体験させ得る発話テスト技術の提供を課題とする。
 前述した課題を解決するために、本発明は、発話機器の発話テスト方法、発話テストサーバ、発話テストシステム、およびプログラムを提供するものである。
 本発明に係る一態様の発話機器の発話テスト方法は、端末装置から発話テスト開始指令を受信するステップと、発話テスト開始指令に基づいて、少なくとも1つの発話機器を発話テストの対象であるテスト機器とするように、テスト機器を設定するステップと、設定したテスト機器に基づいて定める音声データまたは映像データを用いて、発話テストのテスト内容を設定するステップと、テスト内容をテスト機器に発話させるステップと、を含む。
 また、本発明に係る他の態様の発話機器の発話テストサーバは音声データまたは映像データを記憶するサーバ記憶部と、サーバ制御部と、を備える。サーバ制御部は、端末装置から発話テスト開始指令を受信し、発話テスト開始指令に基づいて、少なくとも1つの発話機器を発話テストの対象であるテスト機器とするように、テスト機器を設定し、設定したテスト機器に基づいて定める音声データまたは映像データを用いて、発話テストのテスト内容を設定し、テスト内容をテスト機器に発話させるように構成されている。
 また、本発明に係る他の態様の発話テストシステムは、少なくとも1つの発話可能な発話機器と、端末装置と、発話テストサーバとを含む。
 また、本発明に係る他の態様のプログラムは、発話テストサーバと通信する端末で使用されるプログラムである。
 本発明においては、ユーザは発話についての設定を確認することができ、発話の体験が得られる。
実施の形態1における発話テストシステムの概略構成を示すブロック図 実施の形態1における発話機器の発話テスト方法の一例のフローチャート 実施の形態1における発話機器の発話テスト方法の一例のシーケンス図 実施の形態1における端末装置のユーザインタフェースの一例 実施の形態2における発話テストシステムの概略構成を示すブロック図 実施の形態2における発話機器の発話テスト方法の一例のシーケンス図 実施の形態3におけるステップS400の一例のフローチャート 実施の形態3における発話機器の発話テスト方法の一例のシーケンス図 実施の形態3における端末装置のユーザインタフェースの一例 実施の形態4における発話機器の発話テスト方法の一例のフローチャート 実施の形態4における発話機器の発話テスト方法の一例のシーケンス図 実施の形態4における端末装置のユーザインタフェースの一例 実施の形態5における発話機器の発話テスト方法の一例のフローチャート 実施の形態5における発話機器の発話テスト方法の一例のシーケンス図 実施の形態5における設定変更ユーザインタフェースの一例 実施の形態6における発話機器の発話テスト方法の一例のフローチャート 実施の形態6における発話機器の発話テスト方法の一例のシーケンス図 実施の形態7におけるテスト内容の発話文言の表示の一例 実施の形態7における発話機器の発話テスト方法の一例のシーケンス図 実施の形態7におけるテスト内容の発話文言の表示の別例 実施の形態7における発話機器の発話テスト方法の別例のシーケンス図 実施の形態7におけるテスト内容の発話文言の表示のまた別例 実施の形態7における発話機器の発話テスト方法のまた別例のシーケンス図
 先ず始めに、発話機器の発話テスト方法、発話テストサーバおよび発話テストシステムの各種態様について説明する。
 本発明に係る第1の態様の発話機器の発話テスト方法は、端末装置から発話テスト開始指令を受信するステップと、発話テスト開始指令に基づいて、少なくとも1つの発話機器を発話テストの対象であるテスト機器とするように、テスト機器を設定するステップと、設定したテスト機器に基づいて定める音声データまたは映像データを用いて、発話テストのテスト内容を設定するステップと、テスト内容をテスト機器に発話させるステップと、を含む。
 本発明に係る第2の態様の発話機器の発話テスト方法は、第1の態様において、発話テスト開始指令は、テスト機器を選択する入力情報を含んでもよい。テスト機器を設定するステップでは、発話テスト開始指令の入力情報に基づいて、発話テスト開始指令に指定される少なくとも1つの発話機器、すべての発話機器、または、端末装置のユーザに最寄りの発話機器をテスト機器とするように、テスト機器を設定してもよい。
 本発明に係る第3の態様の発話機器の発話テスト方法は、第1または2の態様において、テスト内容は、音声データの発話文言、映像データの発話文言、発話の音量、発話の周波数成分、および発話の速さのうちの少なくとも1つを含んでもよい。
 本発明に係る第4の態様の発話機器の発話テスト方法は、第1~3の態様のいずれか1つにおいて、発話テスト開始指令には、テスト機器が複数設定されるとともに、複数のテスト機器に対して発話テストを行う順番情報が含まれて。テスト内容をテスト機器に発話させるステップにおいて、発話テスト開始指令の順番情報に指定される順に、テスト内容を当該複数のテスト機器のそれぞれに発話させてもよい。
 本発明に係る第5の態様の発話機器の発話テスト方法は、第4の態様において、テスト内容をテスト機器に発話させるステップにおいて、発話させたテスト機器からテスト完了通知を受信してから、順番情報における次のテスト機器に発話させるように、テスト内容を複数のテスト機器のそれぞれに発話させてもよい。
 本発明に係る第6の態様の発話機器の発話テスト方法は、第1~5の態様のいずれか1つにおいて、発話テストが失敗したか否かを判断するステップと、発話テストが失敗した場合、失敗原因に対応するテスト失敗通知を端末装置に送信して端末装置に表示させるステップと、をさらに含んでもよい。
 本発明に係る第7の態様の発話機器の発話テスト方法は、第1~6の態様のいずれか1つにおいて、設定変更ユーザインタフェースを端末装置に表示させるステップと、端末装置から設定変更指令を受信する場合、設定変更指令に基づいて、テスト内容を変更し、変更したテスト内容をテスト機器に発話させるステップと、をさらに含んでもよい。
 本発明に係る第8の態様の発話機器の発話テスト方法は、第1~7の態様のいずれか1つにおいて、発話機器が発話可能な情報に基づいて追加情報を設定するステップと、追加情報をテスト内容とともにテスト機器に発話させる、または、追加情報を端末装置に表示させるステップと、をさらに含んでもよい。
 本発明に係る第9の態様の発話機器の発話テスト方法は、第1~8の態様のいずれか1つにおいて、端末装置から発話テスト開始指令を受信するステップの前に、テスト内容の発話文言を端末装置に表示させるステップをさらに含んでもよい。
 本発明に係る第10の態様の発話機器の発話テストサーバは、音声データまたは映像データを記憶するサーバ記憶部と、サーバ制御部と、を備える。サーバ制御部は、端末装置から発話テスト開始指令を受信し、発話テスト開始指令に基づいて、少なくとも1つの発話機器を発話テストの対象であるテスト機器とするように、テスト機器を設定し、設定したテスト機器に基づいて定める音声データまたは映像データを用いて、発話テストのテスト内容を設定し、テスト内容をテスト機器に発話させるように構成されている。
 本発明に係る第11の態様の発話機器の発話テストサーバは、第10の態様において、発話テスト開始指令は、前記テスト機器を選択する入力情報を含んでもよい。サーバ制御部は、テスト機器を設定するとき、発話テスト開始指令の入力情報に基づいて、発話テスト開始指令に指定される少なくとも1つの発話機器、すべての発話機器、または、端末装置のユーザに最寄りの発話機器をテスト機器とするように、テスト機器を設定するようにさらに構成されていてもよい。
 本発明に係る第12の態様の発話機器の発話テストサーバは、第10または11の態様において、テスト内容は、音声データの発話文言、映像データの発話文言、発話の音量、発話の周波数成分、および発話の速さのうちの少なくとも1つを含んでもよい。
 本発明に係る第13の態様の発話機器の発話テストサーバは、第10~12の態様のいずれか1つにおいて、発話テスト開始指令に、テスト機器が複数設定されるとともに、複数の前記テスト機器に対して発話テストを行う順番情報が含まれている。サーバ制御部は、テスト内容をテスト機器に発話させるとき、発話テスト開始指令の順番情報に指定される順に、テスト内容を当該複数のテスト機器のそれぞれに発話させるようにさらに構成されていてもよい。
 本発明に係る第14の態様の発話機器の発話テストサーバは、第13の態様において、サーバ制御部は、テスト内容をテスト機器に発話させるとき、発話させたテスト機器からテスト完了通知を受信してから、順番情報における次のテスト機器に発話させるように、テスト内容を複数のテスト機器のそれぞれに発話させるようにさらに構成されていてもよい。
 本発明に係る第15の態様の発話機器の発話テストサーバは、第10~14の態様のいずれか1つにおいて、サーバ制御部は、発話テストが失敗したか否かを判断し、発話テストが失敗した場合、失敗原因に対応するテスト失敗通知を端末装置に送信して端末装置に表示されるようにさらに構成されていてもよい。
 本発明に係る第16の態様の発話機器の発話テストサーバは、第10~15の態様のいずれか1つにおいて、サーバ制御部は、設定変更ユーザインタフェースを端末装置に表示させ、端末装置から設定変更指令を受信するとき、設定変更指令に基づいて、テスト内容を変更し、変更したテスト内容をテスト機器に発話させるようにさらに構成されていてもよい。
 本発明に係る第17の態様の発話機器の発話テストサーバは、第10~16の態様のいずれか1つにおいて、サーバ制御部は、発話機器が発話可能な情報に基づいて追加情報を設定し、追加情報をテスト内容とともにテスト機器に発話させる、または、追加情報を端末装置に表示させるようにさらに構成されていてもよい。
 本発明に係る第18の態様の発話機器の発話テストサーバは、第10~17の態様のいずれか1つにおいて、サーバ制御部は、端末装置から発話テスト開始指令を受信する前に、テスト内容の発話文言を端末装置に表示させるようにさらに構成されていてもよい。
 本発明に係る第19の態様の発話機器の発話テストシステムは、少なくとも1つの発話可能な発話機器と、端末装置と、第10~18の態様のいずれか1つの発話テストサーバとを含む。
 本発明に係る第20の態様のプログラムは、請求項10~18に記載の発話テストサーバと通信する端末で使用されるプログラムである。
 《実施の形態1》
 以下、本発明に係る発話機器の発話テスト方法、発話テストサーバおよび発話テストシステムの実施の形態1について、適宜図面を参照しながら詳細に説明する。
 以下で説明する実施の形態1は、本発明の一例を示すものである。以下の実施の形態1において示される数値、形状、構成、ステップ、およびステップの順序などは、一例を示すものであり、本発明を限定するものではない。以下の実施の形態1における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
 以下に述べる実施の形態1において、特定の要素に関しては変形例を示す場合があり、その他の要素に関しては任意の構成を適宜組み合わせることを含むものであり、組み合わされた構成においてはそれぞれの効果を奏するものである。実施の形態1において、それぞれの変形例の構成をそれぞれ組み合わせることにより、それぞれの変形例における効果を奏するものとなる。
 以下の詳細な説明において、「第1」、「第2」などの用語は、説明のためだけに用いられるものであり、相対的な重要性または技術的特徴の順位を明示または暗示するものとして理解されるべきではない。「第1」と「第2」と限定されている特徴は、1つまたはさらに多くの当該特徴を含むことを明示または暗示するものである。
 図1は、実施の形態1における発話テストシステムの概略構成を示すブロック図である。発話機器の発話テストシステムは、発話テストサーバ10と、少なくとも1つの発話可能な発話機器20と、発話機器20に関連する端末装置30と、を含む。発話テストサーバ10は、少なくとも1つの情報元装置40または少なくとも1つの外部情報源50から情報を受信し、受診した情報に基づいて発話機器20に発話させてもよい。これらの情報元装置40および外部情報源50は、発話テストシステムに含まれてよく、発話テストシステムに含まれなくてもよい。以下、各構成要素の概略を説明する。
<発話機器20>
 発話機器20は、発話機能を有する機器である。本実施形態の発話機器20は、発話機能を有する家電(発話家電)を含む。家電とは、家庭用電化製品の略称である。発話機器20は、家庭で用いられる電子機器であれば任意の種類の機器であってもよく、例えば、家庭で使うテレビ、冷蔵庫、空気調和機、洗濯機、掃除ロボット、音響機器(スマートスピーカを含む。)、照明、給湯器、インターホンなどの電気器具が含まれる。発話機器20は、「民生用発話機器」、「発話家電」と称してもよい。発話機能とは、スピーカを用いて人間の言語を含む音声を発する機能という。発話機能は、人間の言語を含まない、ビープ音、ブザー音、アラーム等の音のみを発声する機能とは異なり、人間の言語を用いてより多くの情報をユーザに伝達することができる。発話家電としての発話機器20はそれぞれの家電機能を発揮するように構成されている。例えば、空気調和機である発話機器20は、圧縮機と熱交換器と室内温度センサとを含み、制御空間において冷房、暖房、および除湿の機能を発揮するように構成されている。また、例えば、掃除ロボットである発話機器20は、バッテリと集塵機構と移動機構と物体検知センサとを含み、移動可能な範囲内で移動しながら掃除するように構成されている。
 図1の実施例において、発話機器20は、機能を発揮するための情報を記憶する機器記憶部21(家電記憶部)と、発話機器20全体を制御する機器制御部22(家電制御部)と、発話テストサーバ10または端末装置30と通信可能な機器通信部23(家電通信部)と、発話するためのスピーカ24とを含む。発話機器20は視覚的な情報をユーザに表示するためのディスプレイ25を含んでもよい。また、発話機器20は機能を発揮するために様々なセンサ26を少なくとも1つ含んでもよい。なお、本開示においては、この例示の発話機器20について説明するが、他の発話機器20において同様の構成としてもよい。
 機器記憶部21は、種々の情報や制御プログラムを記録する記録媒体であり、機器制御部22の作業領域として機能するメモリであってもよい。機器記憶部21は、例えば、フラッシュメモリ、RAM、その他の記憶デバイス又はそれらを適宜組み合わせて実現される。機器記憶部21は発話用の音声データまたは映像データを記憶してもよい。発話用の音声データまたは映像データは、発話機器20の出荷前に記憶させるものであってもよく、販売者または家庭内のユーザの指令に基づいて他の記憶媒体から読み込むものであってもよく、販売者またはユーザの指令に基づいてインターネットを介してダウンロードするものであってもよい。
 機器制御部22は、発話機器20全体の制御を司るコントローラである。機器制御部22は、プログラムを実行することにより所定の機能を実現するCPU、MPU、FPGA、DSP、ASICのような汎用プロセッサを含む。機器制御部22は、機器記憶部21に格納された制御プログラムを呼び出して実行することにより、発話機器20における各種の制御を実現することができる。また、機器制御部22は機器記憶部21と協働して機器記憶部21に記憶されたデータを読み取り/書き込みを行うことができる。機器制御部22は、ハードウェアとソフトウェアの協働により所定の機能を実現するものに限定されず、所定の機能を実現する専用に設計されたハードウェア回路でもよい。
 機器制御部22は、設定ユーザインタフェースを介してユーザによる様々な設定値(例えば、空気調和機の設定温度、テレビの表示チャネル、掃除ロボットの掃除時間)を受信することができる。機器制御部22は、これらの設定値および様々なセンサから受信した検出値(例えば、室内温度、物体の有無)などに基づいて、発話機器20の機能を発揮するように発話機器20の各部品を制御する。機器制御部22は、発話テストサーバ10または端末装置30から指令を受信して当該指令にしたがって発話機器20を制御してもよい。また、機器制御部22は、後述する発話テスト方法に基づいて、発話テストサーバ10からの指令にしたがって発話テストを行う。
 機器通信部23は、発話テストサーバ10やユーザの端末装置30等と通信することもでき、例えば、インターネットパケットを送受信することもできる。機器制御部22は、機器通信部23を介して発話テストサーバ10と協働するとき、インターネットを介して発話テストサーバ10から発話テストに関するパラメータ値または指令を受信することできる。
 スピーカ24は、機器制御部22が指定する音声データを用いて、電気信号を音響信号に変換し、音波として空間に放射するものである。機器制御部22は音声インタフェースを介してスピーカ24と通信してもよい。スピーカ24は、発話機器20の種類等に基づいて適宜に設けられ得る。例えば、テレビである発話機器20において、スピーカ24はテレビの正面の両側に設けられ得る。掃除ロボットである発話機器20において、スピーカ24は掃除ロボットのハウジング内に設けられ得る。それぞれの発話機器20のスピーカ24は異なる規格や発話能・発声力を有してもよい。例えば、テレビのスピーカ24は比較的に高い発話・発声能力を有するが、洗濯機のスピーカ24は比較的に低い発話・発声能力を有してもよい。本開示はスピーカ24の発話・発声能力について制限しない。
 ディスプレイ25は、視覚的な情報をユーザに表示するためのものである。ディスプレイ25は、例えば、テレビのスクリーンのように綺麗な映像を表示するために解像度が高いものであってもよく、洗濯機や電子レンジにおいて設定用のユーザインタフェース(user interface、UI)を表示するための、解像度が低いパネルディスプレイであってもよい。本開示はディスプレイ25の表示能力について制限しない。また、ディスプレイ25は表示機能を有するタッチパネルであってもよい。
 センサ26は、発話機器20の機能を発揮するために発話機器20の外部から様々な情報を取得するためのものである。例えば、センサ26は、空気調和機が設けられた部屋内部の温度を検出する室内温度センサ、空気調和機が設けられた部屋の外の温度を検出する室外温度センサ、掃除ロボットの前方に物体の有無を検出する物体センサ、冷蔵庫の扉が完全に閉じているか否かを検出する開閉センサなどであってもよい。センサ26にて検出された情報は、機器記憶部21に入力されて記憶され、後に機器制御部22が利用したり、端末装置30またはサーバに送信されたりする。
<端末装置30>
 端末装置30は、発話機器20に関連する装置である。例えば、発話機器20のコントローラであってもよく、複数種類の家電製品を同時に管理・制御できるコントローラであってもよい。また、端末装置30は、発話機器20との間でデータ通信を行うことができる情報端末、例えば、専用の関連アプリケーション32が組み込まれたスマートフォン、携帯電話、モバイルフォン、タブレット、ウェアラブル装置、コンピュータなどであってもよい。発話テストサーバ10または機器制御部22は、端末装置30を介してユーザが入力した設定または指令を取得することができる。一般的には、端末装置30はグラフィックユーザインタフェース(graphical user interface、GUI)を表示するためのディスプレイを含む。ただ、音声ユーザインタフェース(voice User Interface、VUI)を介してユーザと相互作用する場合、ディスプレイの代わりに、またはディスプレイに加えて、端末装置30はスピーカとマイクとを含んでもよい。
<情報元装置40>
 情報元装置40は、発話機器20が発話する内容に関連する情報源である。情報元装置40は、発話機器20が設けられた家庭内の別の機器(家電)であってもよい。情報元装置40が別の機器である場合、本開示では、情報元装置40は情報元機器(情報元家電)とも呼ばれている。情報元機器は発話機器20であってもよく、発話機能を有しない機器であってもよい。情報元機器は、その運転状態などの機器情報(家電情報)を発話テストサーバ10に送信し、発話テストサーバ10は、受信した機器情報に基づいて発話テストのテスト内容を設定してもよい。また、発話テストの終了後、発話機器20の通常の使用中に、情報元機器は機器情報を発話テストサーバ10または別のサーバに送信し、発話テストサーバ10または当該別のサーバは受信した機器情報に基づいて発話機器20に発話させてもよい。機器情報の例としては、例えば、情報元機器の起動状態、運転モード、異常情報などが挙げられる。
<外部情報源50>
 外部情報源50は、発話機器と直接的に関わらないサービスに関する情報、例えば、気象情報や、宅配便の配送状況に関する情報を提供する情報源である。発話テストサーバ10は、外部情報源50から取得する情報に基づいて、発話テストのテスト内容を設定してもよい。発話テストサーバ10、端末装置30、または他のサーバは、発話テストの終了後、発話機器20の通常の使用中に、外部情報源50から取得する情報に基づいて、発話機器20に発話させてもよい。
<発話テストサーバ10>
 発話テストサーバ10は、少なくとも1つの発話機器20に対して、人間の言語を含む音声データまたは映像データを用いて、発話テストを行うサーバである。1つの実施例において、発話テストサーバ10は、インターネットを経由して少なくとも1つの発話機器20に接続して、発話テストについて制御することができる。同じ家庭または同じ売り場に設けられた複数の発話機器20に対して、発話テストサーバ10は一度にこれらの複数の発話機器をテストすることができる。
 発話テストサーバ10は、後述する発話テスト方法の実行以外、他の目的に用いられてもよい。例えば、発話テストサーバ10は、少なくとも1つの発話機器20を管理するため、またはデータを収集するための発話機器20の製造会社の管理サーバであってもよい。または、発話テストサーバ10は、アプリケーションサーバであってもよい。実施の形態1において、発話テストサーバ10は、サーバ記憶部12と、サーバ制御部14とを含む。発話テストサーバ10は、発話機器20、端末装置30、情報元装置40、または外部情報源50と通信するためのサーバ通信部16をさらに含んでもよい。
<サーバ記憶部12>
 サーバ記憶部12は、種々の情報や制御プログラムを記録する記録媒体であり、サーバ制御部14の作業領域として機能するメモリであってもよい。サーバ記憶部12は、例えば、フラッシュメモリ、SSD(Solid State Device)、ハードディスク、RAM、その他の記憶デバイス又はそれらを適宜組み合わせて実現される。サーバ記憶部12は、発話テストサーバ10内部のメモリであってもよく、発話テストサーバ10と無線通信または有線通信にて接続されているストレージ装置であってもよい。
 サーバ記憶部12は、発話テスト用の音声データまたは映像データを記憶する。様々な発話テスト用の音声データまたは映像データは、発話テストの対象となるテスト機器(テスト家電)の種類や、情報元装置40の種類、外部情報源50の種類などに応じて生成され得る。1つの実施例において、発話テストサーバ10は、発話テスト前に、発話テスト用の音声データまたは映像データを事前に生成してサーバ記憶部12に記憶させる。別の実施例において、発話テストサーバ10は、発話テストの実行中に発話テスト用の音声データまたは映像データを動的(実行時)に生成してサーバ記憶部12に記憶させる。サーバ記憶部12は、これらの音声データもしくは映像データを生成するための素材データ、または途中のデータを記憶してもよい。また、発話テストサーバ10のサーバ記憶部12は、テスト終了後、発話機器20の通常の使用中に、発話機器20に発話させるときに用いられる音声データまたは映像データを記憶してもよい。
 サーバ記憶部12は、発話テスト用の設定情報(例えば、後述する音量等のテスト内容)も記憶する。発話テストの終了後、発話機器20の通常の使用中に、発話テストサーバ10が機器情報等に基づいて発話機器20に発話させる場合、発話のための設定や情報を記憶する。
<サーバ制御部14>
 発話テストサーバ10のサーバ制御部14は、発話テストサーバ10全体の制御を司るコントローラである。サーバ制御部14は、プログラムを実行することにより所定の機能を実現するCPU、MPU、GPU、FPGA、DSP、ASICのような汎用プロセッサを含む。サーバ制御部14は、サーバ記憶部12に格納された制御プログラムを呼び出して実行することにより、発話テストサーバ10における各種の制御を実現することができる。また、サーバ制御部14は、サーバ記憶部12と協働してサーバ記憶部12に記憶されたデータを読み取り/書き込みを行うことができる。サーバ制御部14は、ハードウェアとソフトウェアの協働により所定の機能を実現するものに限定されず、所定の機能を実現する専用に設計されたハードウェア回路でもよい。
<サーバ通信部16>
 サーバ通信部16は、サーバ制御部14と協働して、発話機器20や、端末装置30、情報元装置40、外部情報源50等とインターネットパケットを送受信する、すなわち、通信することもできる。例えば、発話テストサーバ10は、サーバ通信部16を介して端末装置30から指令を受信してもよく、発話機器20に対して指示を送信してもよく、情報元装置40または外部情報源50から情報を受信してもよい。サーバ通信部16または機器通信部23は、発話テストサーバ10と、発話機器20と、端末装置30と、情報元装置40と、外部情報源50との間において、Wi-Fi(登録商標)、IEEE802.2、IEEE802.3、3G、LTE等の規格にしたがい通信を行い、データの送受信を行ってもよい。インターネットの他、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網、電話回線網、移動体通信網、衛星通信網等、赤外線、ブルートゥース(登録商標)と通信してもよい。
<発話機器の発話テスト方法>
 発話テストサーバ10は、サーバ記憶部12およびサーバ制御部14を用いて、発話機器の発話テスト方法を実行する。図2は、実施の形態1における発話機器の発話テスト方法のフローチャートであり、発話機器の発話テスト方法は以下のステップS100~ステップS400を含む。図3は、実施の形態1における発話機器の発話テスト方法の一例のシーケンス図であり、図2のフローチャートに対応する。
 まず、ユーザは端末装置30のUIを介して、発話テストを開始させることができる。サーバ制御部14は、サーバ通信部16を介して、発話機器20に関連する端末装置30から発話テスト開始指令を受信する(ステップS100)。例えば、図4は、実施の形態1における端末装置30のUIの一例であり、端末装置30の画面60を示している。当該UIでは発話機器や発話する内容に関連する情報が表示される。図4のUIにおいて、「通知のお試し」というボタン62が設けられ、ユーザがこのボタンを押すと、端末装置30は、ユーザ入力に基づいて入力情報を生成し、入力情報を発話テスト開始指令に入れる。そして、端末装置30が発話テスト開始指令を発話テストサーバ10に送信し、発話テストが開始する。なお、発話テストサーバ10と端末装置30と間の指示や情報の通信は、別のサーバ等を介して間接的に行ってもよい。
 次に、サーバ制御部14は、発話テスト開始指令の入力情報に基づいて、少なくとも1つの発話機器20を発話テストの対象であるテスト機器とするように、テスト機器を設定する(ステップS200)。以下、発話テストの対象として設定される発話機器20をテスト機器20で指すことがある。家庭内に発話テストの対象になり得る発話機器20が複数ある場合、サーバ制御部14はそのうちの少なくとも1つを選択してテスト機器にする。さらに具体的にいうと、サーバ制御部14は、発話テスト開始指令に基づいて、発話テスト開始指令の入力情報によって指定される少なくとも1つの発話機器20、すべての発話機器20、または、端末装置のユーザに最寄りの発話機器20をテスト機器とするように、テスト機器を設定してもよい。
 1つの実施例において、ユーザは端末装置30のUIを介してテストしようとする発話機器20を選択することができる。この場合、発話テスト開始指令は、テスト機器を選択する入力情報を含む。入力情報は、例えば、当該選択された発話機器20の識別子を含んでもよい。サーバ制御部14は発話テスト開始指令の入力情報に含まれた識別子に基づいて、指定された発話機器20をテスト機器として設定する。
 別の実施例において、サーバ制御部14は、発話テストの対象になり得る発話機器20のすべてをテスト機器として設定する。
 さらに別の実施例において、サーバ制御部14は、端末装置30のユーザに最寄りの発話機器20をテスト機器として設定する。例えば、発話機器20が人感センサを含む場合、人感センサを用いて、所定範囲内にユーザがいるか否か、またはユーザとの距離を検出することができる。あるいは、発話機器20は、ブルートゥース(登録商標)またはGPSの技術を用いて端末装置30の位置を取得して、端末装置30の位置をユーザの位置として推定することができる。発話機器20は検出または推定した結果を発話テストサーバ10に送信する。サーバ制御部14は、受信した情報に基づいて、発話テストの対象になり得る発話機器20のうちユーザに最寄りの発話機器20を特定し、当該最寄りの発話機器20をテスト機器として設定する。なお、サーバ制御部14はユーザに最寄りの複数の発話機器20をテスト機器として設定してもよい。
 サーバ制御部14は、音声データまたは映像データを用いて、設定したテスト機器に基づいて定める発話テストのテスト内容を設定する(ステップS300)。本開示では、音声データまたは映像データは人間の言語を含むデータである。また、主には音声データを用いて発話テストを行う例示について説明するが、同様の方法に基づいて、音声データの代わりに、または音声データに加えて、映像データを用いて発話テストを行うことができる。例えば、テスト機器がディスプレイを含む場合、映像データで発話テストを行ってもよい。また、以下の説明では、音声データを「音源」に略称することがある。本開示に記載の「音源」とは、サーバ記憶部12もしくは機器記憶部21に記憶された音声データ、発話テストサーバ10が生成する発話テスト用の音声データ、または、発話テストサーバ10が生成する発話テスト終了後、発話機器20の通常の使用中に用いられる音声データを指す。
 サーバ制御部14に設定され得るテスト内容は、発話テストに用いられる音声データまたは映像データの内容であり、具体的には、発話文言(テキスト)または発話仕様を含んでもよい。さらに具体的には、発話文言は音声データの発話文言、または映像データの発話文言を含んでもよい。発話仕様は、発話の音量、発話の周波数成分、および発話の速さのうちの少なくとも1つを含んでもよい。音声データまたは映像データ内の音声は、合成音声であってもよく、事前に録音された人間の音声であってもよい。発話文言は、発話する言葉、例えば、「テスト発話です。このように音声でお知らせします。」という言葉である。サーバ制御部14はテスト機器の種類に基づいて発話文言を設定してもよい。例えば、テスト機器が掃除ロボットである場合、発話文言を「ロボット掃除機のテスト発話です。」と設定してもよい。また、発話文言について、言葉の言語、性別、年齢、声質、言葉の種類などを含んでもよい。
 1つの実施例において、ユーザは端末装置30のUIを介して少なくとも1つのテスト内容の項目を指定することができる。この場合、発話テスト開始指令は当該指定された項目およびその内容を含んでもよい。例えば、発話テスト開始指令は「言語:日本語」と「性別:女性」と「音量:中」との項目および内容を含んでもよい。サーバ制御部14は発話テスト開始指令に含まれた項目および内容に基づいて、テスト内容設定する。
 テスト内容を設定することは、上記のテスト内容に対する少なくとも1つの事項を決定すること、サーバ記憶部12に記憶された音声データにおい決定したてテスト内容に対応するものを選択すること、および/または、決定したテスト内容に基づいて音声データ(音源)を生成することを含む。
 次に、サーバ制御部14は、発話指示をテスト機器に送信し、テスト内容をテスト機器に発話させる(ステップS400)。1つの実施例において、設定されるテスト内容に対応する音声データ(音源)は、サーバ記憶部12に記憶され、テスト機器にダウンロードされ得る。この場合、サーバ制御部14は当該音声データのURL(uniform resource locator、統一資源位置指定子)をテスト機器に送信する。発話指示は、ダウンロード用のURLを含む。テスト機器は、指定されるURL当該音源データをダウンロードして発話する。別の実施例において、サーバ制御部14は当該音声データをテスト機器に送信し、テスト機器は受信する音声データを用いて発話する。さらに別の実施例において、機器記憶部21には様々なテスト内容に対応する音声データがすでに記憶され、サーバ制御部14は設定するテスト内容または関連情報をテスト機器に送信する。テスト機器は受信するテスト内容または関連情報に基づいて対応する音声データを選択して発話する。
 1つの実施例において、発話テストサーバ10と通信する端末、例えば、発話機器20または端末装置30は、上述したような発話テストを実行するために使用されるプログラムを有する。
 これにより、発話テストの制御が完了する。発話テストの終了後、発話機器20の通常の使用中に、発話テストサーバ10は、特定の発話機器20に関する機器情報、他の発話機器20の機器情報、または外部情報源50からの情報に基づいて、テスト時と同じ設定で当該発話機器20に発話させることができる。例えば、テスト時と同じく、「言語:日本語」と「性別:女性」と「音量:中」との設定で、家庭内の発話機器20に発話させる。このようにすれば、ユーザは発話についての設定を確認することができ、後には確認した設定通りの発話の体験が得られる。
 《実施の形態2》
<発話テストサーバ10が複数のサーバによって構成されている場合>
 実施の形態2において、発話テストサーバ10は、異なる役割を持つ複数のサーバによって構成されている。
 図5は、実施の形態2における発話テストシステムの概略構成を示すブロック図である。実施の形態2において、発話テストサーバ10は発話指示サーバ10aと音源サーバ10bとを含む。発話指示サーバ10aはサーバ記憶部12aとサーバ制御部14aとサーバ通信部16aとを含む。発話指示サーバ10bはサーバ記憶部12bとサーバ制御部14bとサーバ通信部16bとを含む。音源サーバ10bは、発話テスト方法において、発話テスト用の音声データ(音源)の生成、記憶およびダウンロードに関する動作を行う。一方、発話指示サーバ10aは残る動作、例えば、発話機器20と端末装置30との通信を行う。
 図6は、実施の形態2における発話機器の発話テスト方法の一例のシーケンス図である。発話指示サーバ10aは、端末装置30から発話テスト開始指令を受信し、発話テスト開始指令に基づいてテスト機器およびテスト内容を設定し、テスト機器に発話指示を送信する。図6の実施例において、発話テストに用いられるべき音源は音源サーバ10bのサーバ記憶部12bに記憶されており、発話指示は当該音源をダウンロードするためのURL(「DL用URL」)を含む。テスト機器は発話指示を受信すると、DL用URLに基づいて音源サーバ10bから音源をダウンロードし、発話テストを行うように当該音源で発話する。
 これにより、発話テストサーバ10におけるそれぞれのサーバの処理負担を低減することができる。また、発話テストサーバ10におけるそれぞれは担当分の動作を行うための構成だけがあればよく、例えば、発話指示サーバ10aは音源生成のためのハードウェアを含まなくてもよい。この構成によって、発話テストサーバ10全体の維持および保守が容易になる。
 なお、図6と別の観点で発話テストサーバ10の機能を複数のサーバに分担させてもよい。例えば、発話テストサーバ10は、発話指示サーバと音源生成サーバと音源配信サーバとを含んでもよい。この場合、音源生成サーバが生成する音源は音源配信サーバのサーバ記憶部に記憶され、テスト機器にダウンロードされる。
 《実施の形態3》
<テスト機器が複数である場合>
 実施の形態3において、テスト機器が複数に設定され、発話テストサーバ10は複数のテスト機器に順に発話テストをさせる。
  図7は、実施の形態3におけるステップS400の一例のフローチャートであり、図8は、実施の形態3における発話機器の発話テスト方法の一例のシーケンス図である。発話テストサーバ10は実施の形態1と同様にステップS100を行う。
 ステップS200において、発話テストサーバ10は発話テスト開始指令に基づいて複数のテスト機器を設定する。例えば、家庭内に発話機器20aと発話機器20bと発話機器20cとが設けられており、発話テストサーバ10はこれらの全部をテスト機器として設定してもよい。
 1つの実施例において、ユーザが端末装置30のUIを介して選択した複数の発話機器20をテスト機器として設定する。図9は、実施の形態3における端末装置30のUIの一例であり、端末装置30の画面70を示している。例えば、ユーザはUIを介して発話機器20aと発話機器20bと発話機器20cとを「オン」に設定することができる。図9のUIにおいて、「通知テストを実施」というボタン72が設けられ、ユーザがこのボタンを押すと、端末装置30は、「オン」に設定されたこれらの発話機器20の識別子を含んだ発話テスト開始指令を発話テストサーバ10に送信する。
 1つの実施例において、ユーザは端末装置30のUIを介して発話順を指定してもよい。この場合、端末装置30はユーザが指定した順番に基づいて、順番情報を生成し、発話テスト開始指令に入れて、発話テストサーバ10に送信する。よって、発話テスト開始指令において、テスト機器が複数設定されるとともに、複数のテスト機器に対して発話テストを行う順番情報が含まれる。発話テスト開始指令をユーザが特に指定していない場合、端末装置30は、「オン」に設定される発話機器20がUIに表示された上から下への順番(図9では発話機器20a、発話機器20b、発話機器20cの順)を発話順にして、この順番情報を含む発話テスト開始指令を発話テストサーバ10に送信してもよい。
 ステップS300において、発話テストサーバ10は複数のテスト機器に対して同様なテスト内容を設定してもよく、少なくとも1つのテスト機器に対して異なるテスト内容を設定してもよい。
 ステップS400において、複数のテスト機器を一斉に発声させることもできるが、ユーザに発話テストをよく聞こえるように、複数のテスト機器を順に発話させてもよい。図7および図8の実施例において、それぞれのテスト機器は、発話テストを完了したら、テスト完了通知を発話テストサーバ10に送信する。発話テストサーバ10は、発話させたテスト機器からテスト完了通知を受信してから、次のテスト機器に発話させるように、テスト内容を複数のテスト機器のそれぞれに発話させる。
 さらに具体的にいうと、発話テストサーバ10はテスト内容を1つのテスト機器(例えば、テスト機器20a)に発話させる(ステップS410)。そして、発話テストサーバ10は、先に発話させたテスト機器からテスト完了通知を受信したか否かを判断する(ステップS420)。先に発話させたテスト機器からテスト完了通知を受信すると、発話テストサーバ10は次のテスト機器(例えば、テスト機器20b)に発話させる(ステップS430)。
 ステップS400において、発話テストサーバ10は、発話テスト開始指令順番情報に指定される順に、テスト内容を当該複数のテスト機器のそれぞれに発話させてもよい。なお、発話テスト開始指令に順番情報がない場合、発話テストサーバ10は、テスト機器の識別子の番号の小さい順もしくは大きい順、または、テスト機器とユーザとの距離の小さい順もしくは大きい順に、テスト機器に発話させてもよい。
 1つの実施例において、テスト機器はテスト完了通知を送信しない。発話テストサーバ10は、1つのテスト機器に発話指示を送信してから所定時間が経過したら、次のテスト機器に発話指示を送信する。
 なお、発話の順番がテスト開始前に決まる場合、最後に発話させるテスト機器(例えば、テスト機器20c)以外のテスト機器に、次に発話するテスト機器を提示するようにテスト内容を設定してもよい。例えば、図8および図9の実施例において、テスト機器20a(テレビ)、テスト機器20b(掃除ロボット)、およびテスト機器20c(冷蔵庫)の順に発話テストを行う。この場合、発話テストサーバ10は、テスト機器20aのテスト時に「次は掃除ロボットが発話します。」に発話させ、テスト機器20bのテスト時に「次は冷蔵庫が発話します。」に発話させる。
 これにより、発話テストサーバ10は、複数のテスト機器に発話させる処理が完了する。このようにすれば、ユーザは複数の発話機器20に対して発話についての設定を確認することができ、後には、確認した設定通りの発話の体験が得られる。
 《実施の形態4》
<テスト失敗の場合>
 実施の形態4において、例えば発話テストに障害が発生することによってテストが失敗する場合、サーバ制御部14はテスト失敗したことをユーザに通知することができる。また、サーバ制御部14は、失敗原因を特定しようとし、特定できた失敗原因をユーザに通知してもよい。
 まず、可能な失敗原因について説明する。(失敗原因1)発話指示がテスト機器に受信されていないまたは認識されていない。例えば、インターネット障害、またはサーバ通信部16もしくは機器通信部23の不具合によって、発話指示の受信されないことが生じ得る。例えば、発話指示の生成時または送信時にその形式に何らかの不備または破損が生じる場合、機器制御部22は受信した発話指示の内容を認識できなくなる。(失敗原因2)テスト機器はテストに用いられるべき音源を取得できない。例えば、インターネット障害、サーバ通信部16もしくは機器通信部23の不具合、機器記憶部21に記憶スペース不足、ダウンロード用のURLの指定間違いなどによって、音源をダウンロードできないこと生じ得る。(失敗原因3)テスト機器のスピーカ24などの部品の不具合によって、発話できないことが生じ得る。
 続いて、サーバ制御部14が行う処理を説明する。図10は、実施の形態4における発話機器の発話テスト方法の一例のフローチャートであり、図11は、実施の形態4における発話機器の発話テスト方法の一例のシーケンス図である。サーバ制御部14は、テスト内容をテスト機器に発話させたあと、発話テストが失敗したか否かを判断する(ステップS510)。1つの実施例において、テスト機器に発話指示を送信してから所定時間内に当該テスト機器からテスト終了通知を受信していない場合、サーバ制御部14はテスト失敗と判断する。別の実施例において、テスト機器は、発話指示を取得もしくは認識していないこと、音源をダウンロードできないこと、またはスピーカ24で発話できないことを検出するとき、テスト失敗通知(およびその原因に関連する情報)を発話テストサーバ10に送信する。サーバ制御部14がサーバ通信部16を介してテスト失敗通知を受信すると、発話テストが失敗したと判断する。
 発話テストが失敗した場合、サーバ制御部14は失敗原因に対応するテスト失敗通知を端末装置30に送信して端末装置30のUIに表示させる(ステップS520)。図12は、実施の形態4における端末装置30のUIの一例であり、端末装置30の画面80を示している。サーバ制御部14は、上述した可能な失敗原因をユーザに対応しやすいように分類して端末装置30に表示させてもよい。例えば、ネット接続障害が失敗原因と見られるとき、「テスト通知に失敗しました。ネット接続をご確認ください。」とのテスト失敗通知を表示してもよい。テスト機器自体の不具合が失敗原因と見られるとき、「テスト通知に失敗しました。テスト機器の状態または設定をご確認ください。」とのテスト失敗通知を表示してもよい。また、サーバの不具合でダウンロードが失敗したと見られるとき、「テスト通知に失敗しました。テスト音源のダウンロードが失敗しました。」とのテスト失敗通知を表示してもよい。
 これにより、サーバ制御部14はテスト失敗時の処理が完了する。このようにすれば、発話テストが失敗してもテスト失敗通知を用いてユーザにフィードバックを与えることができ、ユーザに安心させることができる。また、失敗原因に関連する情報を表示させることによって、当該原因を排除して発話テストを再度行うようにユーザを促すことができる。
 《実施の形態5》
<設定変更で再テストの場合>
 実施の形態5において、ユーザは発話テストの結果を受け、発話設定を変更してからテストを再度行うことができる。
 図13は、実施の形態5における発話機器の発話テスト方法の一例のフローチャートであり、図14は、実施の形態5における発話機器の発話テスト方法の一例のシーケンス図である。サーバ制御部14は、テスト内容をテスト機器に発話させたあと、設定変更UIを端末装置30に表示させる(ステップS610)。図15は、実施の形態5における設定変更UIの一例であり、端末装置30の画面90を示している。ユーザはこの設定変更UIによって発話時の音量を変更することができる。端末装置30は、変更する入力を受けると、例えば、図15における「音量を上げる」とのボタンが押されると、当該入力に対応する設定変更指令を発話テストサーバ10に送信する。
 サーバ制御部14は、端末装置30から設定変更指令を受信したか否かを判断する(ステップS620)。受信した場合、サーバ制御部14は設定変更指令に基づいて、テスト内容を変更し、変更したテスト内容をテスト機器に発話させる(ステップS630)。例えば、「音量を上げる」との設定変更指令を受信した場合、サーバ制御部14はテスト内容を変更した発話指令をテスト機器に送信する。複数のテスト機器が存在する場合、設定変更UIを介してユーザに変更が適用される少なくとも1つのテスト機器を指定させてもよい。また、図15の実施例においては音量について設定を変更するが、上述した任意のテスト内容の項目、例えば、言語や声質を変更してもよい。また、ユーザの確認を取得するように、「今の音量でOK」とのボタンを設定変更UI表示してもよい。このような確認ボタンが押されても発話設定が変更されないが、端末装置30は確認ボタンが押されたことを発話テストサーバ10に通知してもよい。
 図15のUIにおいて、「再テストを実施」というボタン92が設けられ、ユーザがこのボタンを押すと、変更された発話設定で発話テストを再度行うように、端末装置30が発話テスト開始指令を発話テストサーバ10に送信する。図14に示された実施例において、サーバ制御部14は再度の発話テスト中にステップS400で発話指令100Aをテスト機器20に送信する。テスト機器20は、発話指令100Aで指定される「DL用URL100B」を用いて、音源100Cをダウンロードし、音源100Cを用いて発話し、テスト完了通知を発話テストサーバ10に送信する。サーバ制御部14はステップS620において設定変更指令(例えば、「音量を上げる」との設定変更指令)を受信すると、設定変更指令に基づいてテスト内容を再設定する。サーバ制御部14は、音量が上げられた音源を生成してもよく、サーバ記憶部12に記憶された音源のうちに上げられた音量に対応するものを特定してもよい。そして、サーバ制御部14は、上げられた音量に対応する音源をダウンロードするためのURL(「DL用URL200B」)を含む発話指示200Aをテスト機器20に送信する。テスト機器20は、「DL用URL200B」を用いて、音量が上げられた音源200Cをダウンロードし、音源200Cを用いて再度発話する。
 1つの実施例において、画面90のUIには「再テストを実施」というボタン92が設けられていない。この場合において、ユーザが「音量を上げる」などのボタンを押すと、端末装置30は対応する設定変更指令と発話テスト開始指令ともに発話テストサーバ10に送信する。サーバ制御部14は、設定変更指令と発話テスト開始指令とを受信すると、ボタン92が設けられた実施例と同様に、設定変更指令に基づいてテスト内容を再設定し、再設定したテスト内容をテスト機器に発話させる。
 発話設定がさらに変更されない限り、発話テストの終了後、発話機器20の通常の使用中に、発話テストサーバ10は、当該変更された設定で(例えば、上げられた音量で)発話機器20に発話させることができる。1つの実施例において、サーバ制御部14は設定変更指令に基づいてテスト内容を変更するが、変更した設定で再テストを行わない。
 これにより、サーバ制御部14は設定変更の処理が完了する。このようにすれば、ユーザは容易に自分の好みに応じて発話設定を変更することができ、よりよい体験が得られる。
 《実施の形態6》
<発話テスト中に追加情報を発話させる場合>
 実施の形態6において、発話機器20の発話機能についての情報をより多くユーザに提供するように、発話テスト中に追加情報をテスト機器に発話させるまたは端末装置30に表示させることができる。
 図16は、実施の形態6における発話機器の発話テスト方法の一例のフローチャートであり、図17は、実施の形態6における発話機器の発話テスト方法の一例のシーケンス図である。発話テスト方法において、サーバ制御部14は、発話機器20が発話可能な情報に基づいて追加情報を設定する(ステップS710)。そして、サーバ制御部14は、追加情報をテスト機器に発話させ、または、追加情報を端末装置30に表示させる(ステップS720)。
 追加情報とは、発話機器20が発話可能な情報であり、かつ、発話の体験の他、ユーザに提供可能な情報を指す。例えば、テスト終了後、発話機器20の通常の使用中に情報元となり得る情報元装置40または外部情報源50に関する情報であってもよい。上述したように、情報元装置40から取得した機器情報または外部情報源50から取得した発話機器20とは無関係の情報に基づいて発話機器20に発話させることができる。実施の形態6において、これらの情報元の種類または名称を追加情報として知らせることによって、発話機能へのユーザの理解を支援する。このようにすれば、情報元が増えても、ユーザはどのようなことが通知されるかについて、分かりやすくなる。
 具体的にいうと、例えば、家庭内に複数の発話機器20が設けられているが、その一部のみテスト機器としてユーザに指定されている場合がある。この場合に、他の発話機器20の存在をユーザに提示するように、サーバ制御部14は当該他の発話機器20の種類もしくは名称、または全部の発話機器20の種類もしくは名称を追加情報としてもよい。同様に、サーバ制御部14は機器情報を発話しない(知らせない)ように設定されている発話機器20または情報元装置40の種類または名称を追加情報としてもよい。また、サーバ制御部14は、外部情報源50に基づいて、特定のサービスに関する情報(例えば、気象情報や、宅配便の配送状況に関する情報)をユーザに知らせることができる場合がある。この場合に、当該サービスまたは情報の存在をユーザに提示するように、サーバ制御部14は当該サービスの種類または名称を追加情報としてもよい。
 ステップS300について前述したように、サーバ制御部14は追加情報に対応する音声データ(音源)を動的に設定・生成すること、または、サーバ記憶部12に記憶された音声データにおい追加情報に対応するものを選択することができる。図17の実施例において、発話テストサーバ10は、発話指示サーバ10aと、生成した音源を保存する音源サーバ10bと、音源生成サーバ10cとを含む。発話指示サーバ10aは、ステップS300およびステップS710でテスト内容および追加情報を設定してから、当該テスト内容および追加情報を含む音源生成指示を音源生成サーバ10cに送信する。音源生成サーバ10cは音源生成指示に基づいて、動的に適した音源のデータを生成して音源サーバ10bに記憶させ、音源のデータを配置する。音源サーバ10bは当該音源をダウンロードするためのURLを発話指示サーバ10aに通知する。発話指示サーバ10aはステップS400および/またはステップS720で当該URLを含む発話指示をテスト機器に送信する。テスト機器は受信したURLを用いて動的に生成された音源をダウンロードして発話する。
 なお、ステップS710はステップS300に合併されてもよい。ステップS720はステップS400に合併され、追加情報をテスト内容とともにテスト機器に発話させてもよい。複数のテスト機器が存在する場合、最初に発話させるテスト機器のみに追加情報を発話させてもよい。
 これにより、サーバ制御部14は、例えば、情報元装置40または外部情報源50に関する追加情報を、発話テストとともにユーザに通知することができる。よって、ユーザは発話機器20の発話機能についての理解を深めることができる。
 《実施の形態7》
<発話文言を端末装置に表示させる場合>
 実施の形態7において、発話前に、テスト内容の発話文言(テキスト)を端末装置30に表示させることができる。よって、テストを実際に行う前に、ユーザはどんな文言が発話されるかをより容易に理解でき、発話テストに心構えできる。
 図18Aは、実施の形態7におけるテスト内容の発話文言の表示の一例であり、図18Bは、実施の形態7における発話機器の発話テスト方法の一例のシーケンス図である。図18Aおよび図18Bに示された実施例において、サーバ制御部14は、テスト機器に発話テストで発話させようとする発話文言を事前に端末装置30に送信し、発話文言を端末装置30に表示させる。
 具体的には、例えば、関連アプリケーション32が起動されるとき、または関連アプリケーション32のUIが画面100に遷移する前に、端末装置30は発話文言について発話テストサーバ10の発話指示サーバ10aに問い合わせる。この問い合わせは、端末装置30が発話テスト開始指令を送信する前、すなわち、ステップS100(図1等)の前に行われる。次に、発話指示サーバ10aは問い合わせに応答して発話文言(例えば、「音声通知のテストです。」)を端末装置30に送信する(図18Bのステップ(1))。
 端末装置30は、発話文言を受信すると、当該文言を関連アプリケーション32のUIに表示する(図18Bのステップ(2))。図18Aに示されているように、端末装置30のUIの画面100には、「通知のお試し」のボタン102の他、発話テストの発話文言表示104も表示されている。
 ユーザが画面100におけるボタン102を押すと、発話テストサーバ10は、前述した実施の形態1~6のように、発話文言に対応する音源(音声データ)を取得して発話テストを行う。例えば、ユーザがボタン102を押すと、図18Bのステップ(3)~(9)が、実施の形態2において図6のステップ(1)~(7)に関連する説明のように行われる。
 発話文言が固定であり、かつ、当該発話文言がすでに端末装置30に送信したことがある場合、以降の発話テストにおいて再度の送信は省略できる。すなわち、図18Bのステップ(1)は省略可能である。一方、発話文言またはそれに対応する音源が更新可能な場合、以降の発話テストにおいて、発話文言についての問い合わせ、発話文言の送信、発話テスト用の音源の取得は再度に行ってもよい。
 図19Aは、実施の形態7におけるテスト内容の発話文言の表示の別例であり、図19Bは、実施の形態7における発話機器の発話テスト方法の別例のシーケンス図である。図19Aおよび図19Bに示された実施例において、サーバ制御部14は、複数の候補文言を端末装置30に表示させ、ユーザに選択された候補文言を発話文言とし、発話テストにおいて当該選択された候補文言をテスト家電に発話させる。
 具体的には、サーバ制御部14は、端末装置30からの発話文言についての問い合わせに応答して、発話テストで発話可能な複数の候補文言を事前に端末装置30に送信する(図19Bのステップ(1))。例えば、サーバ制御部14は、「音声通知のテストです。」、「このように音声が流れます。」、および、「聞こえていますか?」という3つの候補文言を端末装置30に送信してもよい。候補文言の問い合わせおよび送信のタイミングは、図18Bに示された実施例と同じであってもよい。
 端末装置30は候補文言を受信すると、そのUIの画面110に発話文言の表示114を表示する(図19Bのステップ(2))。ユーザは、端末装置30のUIを介して、発話文言の表示114内の候補文言から1つを選択してから、ボタン112を押して発話テストを開始してもよい。ボタン112が押されると、端末装置30は、選択された候補文言を特定できる情報(例えば、候補文言そのもの、または対応する識別番号)を発話テストサーバ10の発話指示サーバ10aに送信する(図19Bのステップ(3))。なお、端末装置30はこの情報を、発話テスト開始指令の一部として送信してもよく、発話テスト開始指令とともに送信してもよく、発話テスト開始指令と別で送信してもよい。
 また、候補文言のうちの1つ(例えば、図19Aにおいてチェックマークが付いた1番目の候補文言)はデフォルトとして設定され得る。ユーザが候補文言を選択せずにボタン112を押すと、端末装置30は、デフォルトの候補文言を特定できる情報および発話テスト開始指令を発話テストサーバ10の発話指示サーバ10aに送信する。
 発話テストサーバ10は、選択された候補文言を特定できる情報および発話テスト開始指令を受信すると、選択された候補文言に対応する音源を取得し、テスト機器に当該音源を発話させる。例えば、選択された候補文言を特定できる情報および発話テスト開始指令を受信すると、図19Bのステップ(4)~(9)が、受信した情報および指令に基づいて、実施の形態2において図6のステップ(2)~(7)に関連する説明のように行われる。
 複数の候補文言を提供してユーザに選択してもらうことによって、発話テストの自由度を高めることができる。また、複数の候補文言から選択可能なので、例えば、売り場など複数の発話家電による複数の発話テストが実行可能な場合においても、ユーザが聞き間違えて発話テストをやり直すことが回避できる。また、ユーザは自分にとって聞きやすい文言を選択可能なので、発話テストがよりスムーズに実行でき、発話機器20の発話機能がより受け入れやすくなる。
 図20Aは、実施の形態7におけるテスト内容の発話文言の表示のまた別例であり、図20Bは、実施の形態7における発話機器の発話テスト方法のまた別例のシーケンス図である。図20Aおよび図20Bに示された実施例において、サーバ制御部14は、端末装置30のUIを介してユーザに文言を入力してもらい、発話テストにおいては当該入力された文言を発話文言としてテスト家電に発話させる。この実施例において、端末装置30は、事前に発話テストサーバ10の発話指示サーバ10aから発話文言の文言を受信して表示する代わりに、ユーザが入力可能なテキストボックス124をUIに表示する。
 具体的には、端末装置30は発話文言の入力のためのテキストボックス124をUIに表示する(図20Bのステップ(1))。ユーザは、端末装置30のUIの画面120を介して、テスト機器に発話してほしい文言をテキストボックス124に入力してから(図20Bのステップ(2))、ボタン122を押して発話テストを開始してもよい。ユーザが入力した文言は、そのままテキストボックス124内に表示され得る。ボタン122が押されると、端末装置30は、入力された発話文言を含む情報を発話テストサーバ10の発話指示サーバ10aに送信する(図20Bのステップ(3))。発話文言を含む情報および発話テスト開始指令の送信の形式は、図19Bに示された実施例と同じであってもよい。
 発話テストサーバ10は、入力された発話文言を受信すると、上述した実施の形態6で説明したように、当該入力された発話文言に対応する音源を生成し、テスト機器に当該音源を発話させる。例えば、入力された候補文言を含む情報および発話テスト開始指令を受信すると、図20Bのステップ(4)~(13)が、受信した情報および指令に基づいて、実施の形態6において図17のステップ(2)~(11)に関連する説明のように行われる。
 また、サーバ制御部14は、デフォルト文言および対応する音源を設定し、事前にデフォルト文言を端末装置30に送信し、端末装置30にテキストボックス124に表示させてもよい。この場合、ユーザが文言を入力せずにボタン122を押すと、端末装置30は、デフォルト文言を特定できる情報および発話テスト開始指令を発話テストサーバ10に送信する。
 なお、発話テストサーバ10または端末装置30は、発話テストに適切でない言葉、例えば、卑猥な言葉が入力されたと判断した場合、再度の入力を求めるメッセージを表示したり、不適切な言葉を自動的に書き換えてから発話テストを行ったたり、デフォルト文言で発話テストを行ったりしてもよい。
 発話テストで発話する文言をユーザが自由に入力することによって、発話テストの自由度をより高めることができる。また、売り場などで複数の発話テストが同時に実行可能な場合においても、より聞き分けやすくなって、発話テストがよりスムーズに実行できる。
 <発話テストサーバ10と通信する端末で使用されるプログラム>
 発話テストサーバ10と通信する端末、例えば、発話機器20または端末装置30は、上述したような発話テストを実行するために使用されるプログラムを有する。
 発話テストを実行するためのプログラムが発話機器20に使用される場合、当該プログラムは、機器記憶部21に記憶される。機器制御部22は当該プログラムを実行することによって発話テストの機能を実現する。例えば、機器制御部22は当該プログラムを実行することによって、発話テストサーバ10から発話指示を受信し、発話指定に含まれたURLを用いてテスト用の音源をダウンロードし、ダウンロードした音源で発話する。
 発話テストを実行するためのプログラムが端末装置30に使用される場合、当該プログラムは、端末装置30の記憶部に記憶される。端末装置30は当該プログラムを実行することによって発話テストの機能を実現する。例えば、端末装置30は当該プログラムを実行することによって、発話テストを開始させる入力を受信するためのUIや、設定変更UIなどのUIをユーザに提示し、ユーザの入力に基づいて発話テスト開始指令または設定変更指令を発話テストサーバ10に送信する。また、端末装置30は当該プログラムを実行することによって、失敗原因に対応するテスト失敗通知、および/または追加情報を表示することができる。
 上述したように、発話テストサーバ10、発話機器20、または端末装置30として機能させるためのプログラムは、コンピュータ読み取り可能なコンピュータ可読記憶媒体に記憶され得る。プログラムを記憶したコンピュータ可読記憶媒体を、発話テストサーバ10、発話機器20、または端末装置30に供給すると、これらの制御部(例えば、CPUまたはMPU等)はコンピュータ可読記憶媒体に格納されたプログラムを読みだして実行することによって、その機能を発揮することができる。コンピュータ可読記憶媒体としては、ROM、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD―ROM、CD―R、磁気テープ、不揮発性のメモリカード等を用いることができる。
 以上は本発明の具体的な実施の形態に過ぎず、本発明の保護範囲はこれに限定されるものではない。本発明は図面および前述した具体的な実施の形態において前述された内容を含むが、本発明がそれらの内容に限定されるものではない。本発明の範囲または趣旨から逸脱することなく、開示された様々の実施の形態または実施例を組み合わせることができる。本発明の機能および構造原理から逸脱しない変更は特許請求の範囲内のものである。
10   発話テストサーバ
10a  発話指示サーバ
10b  音源サーバ
12、12a、12b   サーバ記憶部
14、14a、14b   サーバ制御部
16   サーバ通信部
20   発話機器(テスト機器)
21   機器記憶部
22   機器制御部
23   機器通信部
24   スピーカ
25   ディスプレイ
26   センサ
30   端末装置
32   関連アプリケーション
40   情報元装置
50   外部情報源
60、70、80、90、100、110、120  画面
62、72、92、102、112、122   ボタン
104、114  発話文言の表示
124  テキストボックス

Claims (20)

  1.  端末装置から発話テスト開始指令を受信するステップと、
     前記発話テスト開始指令に基づいて、少なくとも1つの発話機器を発話テストの対象であるテスト機器とするように、前記テスト機器を設定するステップと、
     設定した前記テスト機器に基づいて定める音声データまたは映像データを用いて、発話テストのテスト内容を設定するステップと、
     前記テスト内容を前記テスト機器に発話させるステップと、
     を含む、発話機器の発話テスト方法。
  2.  前記発話テスト開始指令は、前記テスト機器を選択する入力情報を含み、
     前記テスト機器を設定するステップにおいて、
       前記発話テスト開始指令に基づいて、前記発話テスト開始指令の前記入力情報に指定される少なくとも1つの前記発話機器、すべての前記発話機器、または、前記端末装置のユーザに最寄りの前記発話機器を前記テスト機器とするように、前記テスト機器を設定する、
     請求項1に記載の発話機器の発話テスト方法。
  3.  前記テスト内容は、前記音声データの発話文言、前記映像データの発話文言、発話の音量、発話の周波数成分、および発話の速さのうちの少なくとも1つを含む、
     請求項1または2に記載の発話機器の発話テスト方法。
  4.  前記発話テスト開始指令において、前記テスト機器が複数設定されるとともに、複数の前記テスト機器に対して発話テストを行う順番情報が含まれており、
     前記テスト内容を前記テスト機器に発話させるステップにおいて、前記発話テスト開始指令の前記順番情報に指定される順に、前記テスト内容を当該複数のテスト機器のそれぞれに発話させる、
     請求項1~3のいずれか1項に記載の発話機器の発話テスト方法。
  5.  前記テスト内容を前記テスト機器に前記発話させるステップにおいて、発話させたテスト機器からテスト完了通知を受信してから、前記順番情報における次の前記テスト機器に発話させるように、前記テスト内容を前記複数のテスト機器のそれぞれに発話させる、
     請求項4に記載の発話機器の発話テスト方法。
  6.  発話テストが失敗したか否かを判断するステップと、
     発話テストが失敗したと判断した場合、失敗原因に対応するテスト失敗通知を前記端末装置に送信して前記端末装置に表示させるステップと、
     をさらに含む、
     請求項1~5のいずれか1項に記載の発話機器の発話テスト方法。
  7.  設定変更ユーザインタフェースを前記端末装置に表示させるステップと、
     前記端末装置から設定変更指令を受信する場合、前記設定変更指令に基づいて、前記テスト内容を変更し、変更した前記テスト内容を前記テスト機器に発話させるステップと、
     をさらに含む、
     請求項1~6のいずれか1項に記載の発話機器の発話テスト方法。
  8.  前記発話機器が発話可能な情報に基づいて追加情報を設定するステップと、
     前記追加情報を前記テスト内容とともに前記テスト機器に発話させる、または、前記追加情報を前記端末装置に表示させるステップと、
     をさらに含む、
     請求項1~7のいずれか1項に記載の発話機器の発話テスト方法。
  9.  前記端末装置から前記発話テスト開始指令を受信するステップの前に、
     前記テスト内容の発話文言を前記端末装置に表示させるステップ
     をさらに含む、
     請求項1~8のいずれか1項に記載の発話機器の発話テスト方法。
  10.  発話テストサーバであって、
     音声データまたは映像データを記憶するサーバ記憶部と、
     サーバ制御部と、を備え、
     前記サーバ制御部は、
       端末装置から発話テスト開始指令を受信し、
       前記発話テスト開始指令に基づいて、少なくとも1つの発話機器を発話テストの対象であるテスト機器とするように、前記テスト機器を設定し、
       設定した前記テスト機器に基づいて定める前記音声データまたは映像データを用いて、発話テストのテスト内容を設定し、
       前記テスト内容を前記テスト機器に発話させる、
     ように構成されている、
     発話テストサーバ。
  11.  発話テスト開始指令は、前記テスト機器を選択する入力情報を含み、
     前記サーバ制御部は、
       前記テスト機器を設定するとき、前記発話テスト開始指令に基づいて、前記発話テスト開始指令の前記入力情報に指定される少なくとも1つの前記発話機器、すべての前記発話機器、または、前記端末装置のユーザに最寄りの前記発話機器を前記テスト機器とするように、前記テスト機器を設定する
     ようにさらに構成されている、
     請求項10に記載の発話テストサーバ。
  12.  前記テスト内容は、前記音声データの発話文言、前記映像データの発話文言、発話の音量、発話の周波数成分、および発話の速さのうちの少なくとも1つを含む、
     請求項10または11に記載の発話テストサーバ。
  13.  前記発話テスト開始指令において、前記テスト機器が複数設定されるとともに、複数の前記テスト機器に対して発話テストを行う順番情報が含まれており、
     前記サーバ制御部は、
       前記テスト内容を前記テスト機器に発話させるとき、前記発話テスト開始指令の前記順番情報に指定される順に、前記テスト内容を当該複数のテスト機器のそれぞれに発話させる
     ようにさらに構成されている、
     請求項10~12のいずれか1項に記載の発話テストサーバ。
  14.  前記サーバ制御部は、
       前記テスト内容を前記テスト機器に発話させるとき、発話させたテスト機器からテスト完了通知を受信してから、前記順番情報における次の前記テスト機器に発話させるように、前記テスト内容を前記複数のテスト機器のそれぞれに発話させる
     ようにさらに構成されている、
     請求項13に記載の発話テストサーバ。
  15.  前記サーバ制御部は、
       発話テストが失敗したか否かを判断し、
       発話テストが失敗した場合、失敗原因に対応するテスト失敗通知を前記端末装置に送信して前記端末装置に表示される
     ようにさらに構成されている、
     請求項10~14のいずれか1項に記載の発話テストサーバ。
  16.  前記サーバ制御部は、
       設定変更ユーザインタフェースを前記端末装置に表示させ、
       前記端末装置から設定変更指令を受信するとき、前記設定変更指令に基づいて、前記テスト内容を変更し、変更した前記テスト内容を前記テスト機器に発話させる
     ようにさらに構成されている、
     請求項10~15のいずれか1項に記載の発話テストサーバ。
  17.  前記サーバ制御部は、
       前記発話機器が発話可能な情報に基づいて追加情報を設定し、
       前記追加情報を前記テスト内容とともに前記テスト機器に発話させる、または、前記追加情報を前記端末装置に表示させる
     ようにさらに構成されている、
     請求項10~16のいずれか1項に記載の発話テストサーバ。
  18.  前記サーバ制御部は、
       前記端末装置から前記発話テスト開始指令を受信する前に、前記テスト内容の発話文言を前記端末装置に表示させる
     ようにさらに構成されている、
     請求項10~17のいずれか1項に記載の発話テストサーバ。
  19.  少なくとも1つの発話可能な発話機器と、
     前記発話機器に関連し、発話テスト開始指令を送信可能な端末装置と、
     請求項10~18のいずれか1項に記載の発話テストサーバと、
     を含む、
     発話テストシステム。
  20.  請求項10~18のいずれか1項に記載の発話テストサーバと通信する端末で使用されるプログラム。
PCT/JP2021/026410 2021-04-06 2021-07-14 発話機器の発話テスト方法、発話テストサーバ、発話テストシステム、および発話テストサーバと通信する端末で使用されるプログラム WO2022215280A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP21870523.4A EP4321989A4 (en) 2021-04-06 2021-07-14 SPEECH TEST PROCEDURE FOR SPEECH DEVICE, SPEECH TEST SERVER, SPEECH TEST SYSTEM AND PROGRAM FOR A TERMINAL DEVICE FOR COMMUNICATION WITH THE SPEECH TEST SERVER
JP2022519354A JP7482417B2 (ja) 2021-04-06 2021-07-14 発話機器の発話テスト方法、発話テストサーバ、発話テストシステム、および発話テストサーバと通信する端末で使用されるプログラム
US17/765,589 US20240111645A1 (en) 2021-04-06 2021-07-14 Utterance test method for utterance device, utterance test server, utterance test system, and program
CN202180005786.4A CN115989477A (zh) 2021-04-06 2021-07-14 发话设备的发话测试方法、发话测试服务器、发话测试系统以及用于与发话测试服务器进行通信的终端的程序

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021-064959 2021-04-06
JP2021064959 2021-04-06

Publications (1)

Publication Number Publication Date
WO2022215280A1 true WO2022215280A1 (ja) 2022-10-13

Family

ID=83545812

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/026410 WO2022215280A1 (ja) 2021-04-06 2021-07-14 発話機器の発話テスト方法、発話テストサーバ、発話テストシステム、および発話テストサーバと通信する端末で使用されるプログラム

Country Status (5)

Country Link
US (1) US20240111645A1 (ja)
EP (1) EP4321989A4 (ja)
JP (1) JP7482417B2 (ja)
CN (1) CN115989477A (ja)
WO (1) WO2022215280A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015102851A (ja) * 2013-11-28 2015-06-04 パイオニア株式会社 音声出力装置、音声出力装置の制御方法、プログラム
JP2015164251A (ja) 2014-02-28 2015-09-10 シャープ株式会社 音声サーバ
JP2018506213A (ja) * 2014-12-30 2018-03-01 スポティファイ アーベー 接続されたメディア環境内で使用するためにメディア機器のテスト及び認証を行うシステム及び方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2762915B2 (ja) * 1994-02-04 1998-06-11 日本電気株式会社 障害処理方法
JP2002016558A (ja) 2000-06-29 2002-01-18 Yamatake Building Systems Co Ltd 音声情報送信機能確認システム
US20030093513A1 (en) * 2001-09-11 2003-05-15 Hicks Jeffrey Todd Methods, systems and computer program products for packetized voice network evaluation
US7224776B2 (en) * 2003-12-15 2007-05-29 International Business Machines Corporation Method, system, and apparatus for testing a voice response system
US7711562B1 (en) * 2005-09-27 2010-05-04 At&T Intellectual Property Ii, L.P. System and method for testing a TTS voice
US7742921B1 (en) * 2005-09-27 2010-06-22 At&T Intellectual Property Ii, L.P. System and method for correcting errors when generating a TTS voice
KR20140087717A (ko) * 2012-12-31 2014-07-09 삼성전자주식회사 디스플레이 장치 및 제어 방법
JP2015184563A (ja) * 2014-03-25 2015-10-22 シャープ株式会社 対話型家電システム、サーバ装置、対話型家電機器、家電システムが対話を行なうための方法、当該方法をコンピュータに実現させるためのプログラム
JP2016076799A (ja) * 2014-10-03 2016-05-12 シャープ株式会社 家電管理システム、家電、リモコン装置、ロボット
WO2016186791A1 (en) * 2015-05-20 2016-11-24 Google Inc. Systems and methods for testing smart home devices
US10931999B1 (en) * 2016-06-27 2021-02-23 Amazon Technologies, Inc. Systems and methods for routing content to an associated output device
JP6890494B2 (ja) 2017-07-24 2021-06-18 ホーチキ株式会社 警報システム
KR102701868B1 (ko) * 2018-12-03 2024-09-03 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
CN111212143A (zh) * 2020-01-06 2020-05-29 杭州涂鸦信息技术有限公司 自动化测试方法及系统、可读存储介质、计算机设备
WO2022180882A1 (ja) * 2021-02-25 2022-09-01 パナソニックIpマネジメント株式会社 音声制御方法、サーバ装置、及び、発話体
JP7392125B2 (ja) * 2021-04-08 2023-12-05 パナソニックIpマネジメント株式会社 発話機器の発話を制御する方法、発話機器の発話を制御するサーバ、発話機器、およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015102851A (ja) * 2013-11-28 2015-06-04 パイオニア株式会社 音声出力装置、音声出力装置の制御方法、プログラム
JP2015164251A (ja) 2014-02-28 2015-09-10 シャープ株式会社 音声サーバ
JP2018506213A (ja) * 2014-12-30 2018-03-01 スポティファイ アーベー 接続されたメディア環境内で使用するためにメディア機器のテスト及び認証を行うシステム及び方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP4321989A4

Also Published As

Publication number Publication date
US20240111645A1 (en) 2024-04-04
EP4321989A1 (en) 2024-02-14
CN115989477A (zh) 2023-04-18
EP4321989A4 (en) 2024-08-21
JP7482417B2 (ja) 2024-05-14
JPWO2022215280A1 (ja) 2022-10-13

Similar Documents

Publication Publication Date Title
CN111989741B (zh) 具有动态可切换端点的基于语音的用户接口
CN106257355B (zh) 设备控制方法和控制器
WO2016052018A1 (ja) 家電管理システム、家電、リモコン装置、ロボット
JP6819672B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US10303428B2 (en) Electronic device with a function of smart voice service and method of adjusting output sound
JP6660808B2 (ja) 音声出力制御装置、電子機器、および音声出力制御装置の制御方法
JP2005311864A (ja) 家電機器、アダプタ装置および家電機器システム
KR20200074680A (ko) 단말 장치 및 이의 제어 방법
US20220366908A1 (en) Information processing apparatus and information processing method
US20220122600A1 (en) Information processing device and information processing method
WO2022215280A1 (ja) 発話機器の発話テスト方法、発話テストサーバ、発話テストシステム、および発話テストサーバと通信する端末で使用されるプログラム
US11227423B2 (en) Image and sound pickup device, sound pickup control system, method of controlling image and sound pickup device, and method of controlling sound pickup control system
WO2023049866A2 (en) Concurrency rules for network microphone devices having multiple voice assistant services
WO2022215284A1 (ja) 発話機器を制御する方法、サーバ、発話機器、およびプログラム
CN111183416B (zh) 家电系统
JP2020200968A (ja) 電気機器
JP2017003608A (ja) サーバ装置、システム、音声認識機能を管理するための方法、および、情報通信端末を制御するためのプログラム
JP7074596B2 (ja) ネットワークシステム、サーバおよび情報処理方法
JP7349642B2 (ja) 通知のオフを受け付ける提示システム
JP2021086516A (ja) 発話記録作成支援システム
JP2021110768A (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
JP2021071682A (ja) 機器操作システム、機器操作方法、情報処理装置及びコンピュータプログラム

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2022519354

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 17765589

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21870523

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2021870523

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021870523

Country of ref document: EP

Effective date: 20231106