WO2020194915A1 - Control data generation device, user device, and information processing system - Google Patents

Control data generation device, user device, and information processing system Download PDF

Info

Publication number
WO2020194915A1
WO2020194915A1 PCT/JP2019/049097 JP2019049097W WO2020194915A1 WO 2020194915 A1 WO2020194915 A1 WO 2020194915A1 JP 2019049097 W JP2019049097 W JP 2019049097W WO 2020194915 A1 WO2020194915 A1 WO 2020194915A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
unit
user
time zone
voice
Prior art date
Application number
PCT/JP2019/049097
Other languages
French (fr)
Japanese (ja)
Inventor
田中 彰
翔 七尾
充弘 小形
誠 村▲崎▼
昇悟 池田
広樹 石塚
Original Assignee
株式会社Nttドコモ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Nttドコモ filed Critical 株式会社Nttドコモ
Priority to JP2021508743A priority Critical patent/JP7369181B2/en
Publication of WO2020194915A1 publication Critical patent/WO2020194915A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3231Monitoring the presence, absence or movement of users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephonic Communication Services (AREA)
  • Debugging And Monitoring (AREA)

Abstract

In the present invention, a server device 100A comprises: an acquisition unit 120A that acquires log data in which a time is associated with operation content including an operation performed using the voice of a user at a user device 200A; an estimation unit 122A that, on the basis of log data LG, estimates a non-operated time slot during which no operations using voice are performed, from among a plurality of time slots obtained by dividing up one day; and a control data generation unit 124 that generates control data for instructing that a sound input device 252 which receives voice input be turned off during the non-operated time slot.

Description

制御データ生成装置、ユーザ装置及び情報処理システムControl data generator, user device and information processing system
 本発明は、ユーザ装置における消費電力の削減に関する。 The present invention relates to reduction of power consumption in a user device.
 従来より、ユーザの音声を認識して、認識結果に基づいて装置を制御する技術が知られている。ユーザの音声は音入力装置を用いて入力されるため、音声による操作を実行するためには、音入力装置に電力を供給する必要がある。特許文献1には、音入力装置に電力を供給してユーザの音声を待ち受ける通常モードと音入力装置に電力を供給しない省電力モードとを備える装置が開示されている。2つのモードを備える装置は、通常モードと省電力モードとを時間帯ごとに指定するテーブルを参照して、モードを選択する。 Conventionally, a technique of recognizing a user's voice and controlling a device based on the recognition result has been known. Since the user's voice is input using the sound input device, it is necessary to supply electric power to the sound input device in order to perform the operation by voice. Patent Document 1 discloses a device including a normal mode in which power is supplied to the sound input device to wait for a user's voice and a power saving mode in which power is not supplied to the sound input device. A device having two modes selects a mode by referring to a table that specifies a normal mode and a power saving mode for each time zone.
特開2014-212641号公報Japanese Unexamined Patent Publication No. 2014-212641
 しかし、従来の技術では、どの時間帯に省電力モードを選択するかが予め定められているため、ユーザごとに、省電力モードを選択する時間を設定することができなかった。即ち、従来の技術では、音声による操作の傾向をユーザごとに把握して、音入力装置をオフ状態に制御することによって、ユーザ装置の消費電力を削減することができなかった。 However, in the conventional technology, since the time zone for selecting the power saving mode is predetermined, it is not possible to set the time for selecting the power saving mode for each user. That is, in the conventional technique, it has not been possible to reduce the power consumption of the user device by grasping the tendency of the operation by voice for each user and controlling the sound input device to the off state.
 以上の課題を解決するために、本発明の好適な態様に係る制御データ生成装置は、ユーザ装置におけるユーザの音声による操作を含む動作内容と時間を対応付けたログデータを取得する取得部と、前記ログデータに基づいて、1日を区分した複数の時間帯のうち前記音声による操作がなされない未操作時間帯を推定する推定部と、前記未操作時間帯に前記音声の入力を受け付ける音入力装置をオフ状態にすることを指示する制御データを生成する制御データ生成部と、を備える。 In order to solve the above problems, the control data generation device according to the preferred embodiment of the present invention includes an acquisition unit that acquires log data in which the operation content including the operation by the user's voice in the user device and the time are associated with each other. Based on the log data, an estimation unit that estimates an unoperated time zone in which the voice operation is not performed out of a plurality of time zones that divide the day, and a sound input that accepts the voice input in the non-operation time zone. It includes a control data generation unit that generates control data instructing the device to be turned off.
 また、本発明の好適な態様に係る情報処理システムは、ユーザが管理するユーザ装置と、前記ユーザ装置と通信可能なサーバ装置とを備える情報処理システムであって、前記ユーザ装置は、ユーザの音声の入力を受け付ける音入力装置と、制御データに基づいて前記音入力装置をオフ状態にさせる制御部と、前記ユーザ装置における前記ユーザの音声による操作を含む動作内容と時間を対応付けたログデータを前記サーバ装置に送信し、前記サーバ装置から送信される前記制御データを受信する第1通信装置と、を備え、前記サーバ装置は、前記ユーザ装置から送信される前記ログデータを受信し、前記制御データを前記ユーザ装置に送信する第2通信装置と、前記ログデータに基づいて、1日を区分した複数の時間帯のうち前記音声による操作がなされない未操作時間帯を推定する推定部と、前記未操作時間帯に前記音声の入力を受け付ける音入力装置をオフ状態にすることを指示する前記制御データを生成する制御データ生成部と、を備える。 Further, the information processing system according to a preferred embodiment of the present invention is an information processing system including a user device managed by the user and a server device capable of communicating with the user device, and the user device is a user's voice. A sound input device that accepts the input of, a control unit that turns off the sound input device based on the control data, and log data in which the operation content including the operation by the user's voice in the user device and the time are associated with each other. A first communication device that transmits to the server device and receives the control data transmitted from the server device is provided, and the server device receives the log data transmitted from the user device and controls the control. A second communication device that transmits data to the user device, an estimation unit that estimates an unoperated time zone in which the voice operation is not performed among a plurality of time zones that divide the day based on the log data, and an estimation unit. It includes a control data generation unit that generates the control data instructing the sound input device that receives the input of the voice to be turned off during the non-operation time zone.
 本発明によれば、音声による操作の傾向をユーザごとに把握して、音入力装置をオフ状態に制御することによって、ユーザ装置の消費電力を削減することができる。 According to the present invention, it is possible to reduce the power consumption of the user device by grasping the tendency of the operation by voice for each user and controlling the sound input device to the off state.
本発明の第1実施形態に係る情報処理システムの全体構成を示すブロック図である。It is a block diagram which shows the whole structure of the information processing system which concerns on 1st Embodiment of this invention. ログデータの一例を示す説明図である。It is explanatory drawing which shows an example of log data. 学習部が教師データを生成する過程を示す説明図である。It is explanatory drawing which shows the process which a learning part generates teacher data. 第1実施形態に係る情報処理システムの動作例を示すフローチャートである。It is a flowchart which shows the operation example of the information processing system which concerns on 1st Embodiment. 第2実施形態に係るサーバ装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of the server apparatus which concerns on 2nd Embodiment. 行動データの一例を示す説明図である。It is explanatory drawing which shows an example of the behavior data. 第2実施形態に係る情報処理システムの動作例を示すフローチャートである。It is a flowchart which shows the operation example of the information processing system which concerns on 2nd Embodiment. 第3実施形態に係るユーザ装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of the user apparatus which concerns on 3rd Embodiment. 第4実施形態に係る情報処理システムの全体構成を示すブロック図である。It is a block diagram which shows the whole structure of the information processing system which concerns on 4th Embodiment. 第4実施形態に係る情報処理システムの動作例を示すフローチャートである。It is a flowchart which shows the operation example of the information processing system which concerns on 4th Embodiment.
[1.第1実施形態]
 図1は、第1実施形態に係る情報処理システム10の全体構成を示すブロック図である。図1に例示するように、情報処理システム10は、サーバ装置100Aと、ユーザが所持するユーザ装置200Aとを備える。以下の説明では、ユーザ装置200Aとしてスマートフォンを想定する。但し、ユーザ装置200Aとしては、任意の情報処理装置を採用することができる。例えば、ユーザ装置200Aは、ノートパソコン、ウェアラブル機器及びタブレット端末等の可搬型の情報端末であってもよい。
 また、ユーザ装置200Aは、ユーザの音声によって動作を制御可能な音声操作の機能を有する。
[1. First Embodiment]
FIG. 1 is a block diagram showing an overall configuration of the information processing system 10 according to the first embodiment. As illustrated in FIG. 1, the information processing system 10 includes a server device 100A and a user device 200A owned by the user. In the following description, a smartphone is assumed as the user device 200A. However, any information processing device can be adopted as the user device 200A. For example, the user device 200A may be a portable information terminal such as a notebook computer, a wearable device, or a tablet terminal.
Further, the user device 200A has a voice operation function capable of controlling the operation by the voice of the user.
[1-1.サーバ装置]
 サーバ装置100Aは、処理装置110、記憶装置130、及び通信装置140を備える。サーバ装置100Aの各要素は、情報を通信するための単体又は複数のバスで相互に接続される。なお、本明細書における「装置」という用語は、回路、デバイス又はユニット等の他の用語に読替えてもよい。また、サーバ装置100A及びユーザ装置200Aの各要素は、単数又は複数の機器で構成されていてもよい。サーバ装置100A及びユーザ装置200Aの一部の要素は省略されてもよい。
[1-1. Server device]
The server device 100A includes a processing device 110, a storage device 130, and a communication device 140. Each element of the server device 100A is connected to each other by a single bus or a plurality of buses for communicating information. The term "device" in the present specification may be read as another term such as a circuit, a device or a unit. Further, each element of the server device 100A and the user device 200A may be composed of a single device or a plurality of devices. Some elements of the server device 100A and the user device 200A may be omitted.
 処理装置110は、ユーザ装置200Aの全体を制御するプロセッサであり、例えば、単数又は複数のチップで構成される。処理装置110は、例えば、周辺装置とのインタフェース、演算装置及びレジスタ等を含む中央処理装置(CPU:Central Processing Unit)で構成される。なお、処理装置110の機能の一部又は全部を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)等のハードウェアによって実現してもよい。処理装置110は、各種の処理を並列的又は逐次的に実行する。 The processing device 110 is a processor that controls the entire user device 200A, and is composed of, for example, a single or a plurality of chips. The processing device 110 is composed of, for example, a central processing unit (CPU: Central Processing Unit) including an interface with peripheral devices, an arithmetic unit, registers, and the like. A part or all of the functions of the processing device 110 are realized by hardware such as DSP (Digital Signal Processor), ASIC (Application Specific Integrated Circuit), PLD (Programmable Logic Device), FPGA (Field Programmable Gate Array). You may. The processing device 110 executes various processes in parallel or sequentially.
 記憶装置130は、処理装置110が読取可能な記録媒体であり、処理装置110が実行する制御プログラムP1を含む複数のプログラム、並びに処理装置110が使用する学習モデルM1及びログデータLGなどの各種のデータを記憶する。 The storage device 130 is a recording medium that can be read by the processing device 110, is a plurality of programs including the control program P1 executed by the processing device 110, and various types such as the learning model M1 and the log data LG used by the processing device 110. Store data.
 ログデータLGは、ユーザ装置200Aによって生成され、サーバ装置100Aに送信される。ログデータLGは、ユーザ装置200Aにおける動作内容と時間を対応付けたデータである。動作内容にはユーザの音声による操作が含まれる。ユーザの音声による操作は、常に実行されるわけではない。
 以下の説明では、1日を区分した複数の時間帯Tzのうち音声による操作がなされない時間帯Tzを未操作時間帯Txと称する。本実施形態では、1日を72個の時間帯Tz1~Tz72に区分する(図3参照)。72個の時間帯Tz1~Tz72の各々において時間幅は20分である。なお、各時間帯Tz1~Tz72を区別しない場合は、任意の時間帯を単に時間帯Tzと表記する。また、時間帯Tzの数は72に限定されず、2以上であればよい。また、各時間帯Tzの時間幅は異なっていてもよい。例えば、ユーザが就寝している可能性の高い2時から5時までの3時間を一つの時間帯Tzに割り当ててもよい。
The log data LG is generated by the user device 200A and transmitted to the server device 100A. The log data LG is data in which the operation content and the time in the user device 200A are associated with each other. The operation content includes the operation by the user's voice. The user's voice operation is not always performed.
In the following description, of the plurality of time zones Tz in which one day is divided, the time zone Tz in which no voice operation is performed is referred to as an unoperated time zone Tx. In the present embodiment, one day is divided into 72 time zones Tz1 to Tz72 (see FIG. 3). The time width is 20 minutes in each of the 72 time zones Tz1 to Tz72. When each time zone Tz1 to Tz72 is not distinguished, any time zone is simply referred to as a time zone Tz. Further, the number of time zones Tz is not limited to 72, and may be 2 or more. Further, the time width of each time zone Tz may be different. For example, 3 hours from 2:00 to 5:00, when the user is likely to be sleeping, may be assigned to one time zone Tz.
 記憶装置130は、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)、フラッシュメモリ等の少なくとも1つによって構成されてもよい。記憶装置130は、レジスタ、キャッシュ、メインメモリ(主記憶装置)等と呼ばれてもよい。 The storage device 130 may be composed of at least one such as a ROM (Read Only Memory), an EPROM (Erasable Programmable ROM), an EPROM (Electrically Erasable Programmable ROM), a RAM (Random Access Memory), and a flash memory. The storage device 130 may be called a register, a cache, a main memory (main storage device), or the like.
 通信装置140は、他の装置と通信を行うためのハードウェア(送受信デバイス)である。通信装置140は、例えば、ネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュール等とも呼ばれる。 The communication device 140 is hardware (transmission / reception device) for communicating with other devices. The communication device 140 is also called, for example, a network device, a network controller, a network card, a communication module, or the like.
 処理装置110は、記憶装置130から制御プログラムP1を読み出して当該プログラムを実行することによって、取得部120A、推定部122A、制御データ生成部124、及び送信制御部126として機能する。なお、制御プログラムP1は、ネットワークを介して他の装置から送信されてもよい。 The processing device 110 functions as an acquisition unit 120A, an estimation unit 122A, a control data generation unit 124, and a transmission control unit 126 by reading the control program P1 from the storage device 130 and executing the program. The control program P1 may be transmitted from another device via the network.
 取得部120Aは、通信装置140を用いて、ログデータLGを取得する。図2にログデータLGの一例を示す。図2に示すログデータLGは、2019年3月11日におけるユーザ装置200Aの動作内容のうち、午前8時から午前8時40分までの時間帯におけるユーザ装置200Aの動作内容を示す。この例において、ログデータLGはレコードr1~r14を含む。例えば、レコードr1は、8:00にユーザ装置200Aのロック解除がなされたことを示している。また、レコードr5は、8:12に音声による操作がなされたことを示している。なお、レコードr1~r8は、時間帯Tz24に属し、レコードr9~r14は時間帯Tz25に属する。このように、図2の例において、ログデータLGは、各時間帯において、ユーザ装置200Aにおける動作内容と時間との複数組(複数レコード)を有するデータである。 The acquisition unit 120A acquires the log data LG by using the communication device 140. FIG. 2 shows an example of log data LG. The log data LG shown in FIG. 2 shows the operation contents of the user device 200A in the time zone from 8:00 am to 8:40 am among the operation contents of the user device 200A on March 11, 2019. In this example, the log data LG includes records r1 to r14. For example, record r1 indicates that the user device 200A was unlocked at 8:00. The record r5 also shows that the voice operation was performed at 8:12. The records r1 to r8 belong to the time zone Tz24, and the records r9 to r14 belong to the time zone Tz25. As described above, in the example of FIG. 2, the log data LG is data having a plurality of sets (plural records) of the operation content and the time in the user device 200A in each time zone.
 推定部122Aは、ログデータLGに基づいて、1日を区分した複数の時間帯Tzのうち音声による操作がなされない未操作時間帯Txを推定する。推定部122Aは、学習部1221と予測部1222とを備える。
 学習部1221は、ログデータLGと未操作時間帯Txとの関係を学習モデルM1に機械学習させる。学習部1221が用いる未操作時間帯Txは、実際に、音声による操作がなされなかった時間帯を表す。予測部1222は、学習モデルM1を用いて、将来の時間帯における音声による操作の有無を示す予測データDpを生成する。予測データDpは1以上の時間帯Tzについて音声による操作の有無を示す。例えば、予測データDpは、1日単位で72個の時間帯Tz1~Tz72の各々について、音声による操作の有無を示す。また、現在の日時が3月11日午前8時15分である場合、予測データDpは、3月11日午前8時20分から3月12日午前8時20分までの各時間帯Tzについて、音声による操作の有無を示してもよい。そして、予測データDpが音声操作無しを示す時間帯Tzが上記の未操作時間帯Txであると推定される時間帯Tzである。
Based on the log data LG, the estimation unit 122A estimates the unoperated time zone Tx in which no voice operation is performed among the plurality of time zone Tz that divide the day. The estimation unit 122A includes a learning unit 1221 and a prediction unit 1222.
The learning unit 1221 causes the learning model M1 to machine learn the relationship between the log data LG and the unoperated time zone Tx. The unoperated time zone Tx used by the learning unit 1221 represents a time zone in which no voice operation is actually performed. The prediction unit 1222 uses the learning model M1 to generate prediction data Dp indicating the presence or absence of voice operation in a future time zone. The prediction data Dp indicates the presence or absence of voice operation for a time zone Tz of 1 or more. For example, the prediction data Dp indicates the presence or absence of voice operation for each of the 72 time zones Tz1 to Tz72 on a daily basis. If the current date and time is 8:15 am on March 11, the forecast data Dp is for each time zone Tz from 8:20 am on March 11 to 8:20 am on March 12. The presence or absence of voice operation may be indicated. Then, the time zone Tz in which the predicted data Dp indicates that there is no voice operation is the time zone Tz estimated to be the above-mentioned unoperated time zone Tx.
 より、具体的には、学習部1221は、ログデータLGを基に予測データDpの正誤を示すラベルデータDlを生成する。予測データDpが複数の時間帯Tzについて音声の操作の有無を示す場合には、ラベルデータDlは複数の時間帯Tzについて正誤を示す。即ち、ラベルデータDlは、予測データDpに対応する時間帯Tzに対して正誤を示す。学習部1221は、予測データDpに対応する時間帯Tzについて、当該時間帯のログデータLGを参照することによって正誤を判定し、判定結果を示すラベルデータDlを生成する。
 また、学習部1221は、ラベルデータDlと予測データDpに対応する時間帯Tzより前のログデータLGとの組を教師データDtとして生成し、教師データDtを学習モデルM1に学習させる。
More specifically, the learning unit 1221 generates label data Dl indicating the correctness of the prediction data Dp based on the log data LG. When the prediction data Dp indicates the presence or absence of voice operation for a plurality of time zones Tz, the label data Dl indicates correctness for the plurality of time zones Tz. That is, the label data Dl indicates correctness with respect to the time zone Tz corresponding to the prediction data Dp. The learning unit 1221 determines the correctness of the time zone Tz corresponding to the prediction data Dp by referring to the log data LG of the time zone, and generates label data Dl indicating the determination result.
Further, the learning unit 1221 generates a pair of the label data Dl and the log data LG before the time zone Tz corresponding to the prediction data Dp as the teacher data Dt, and causes the learning model M1 to learn the teacher data Dt.
 図3は、学習部1221が教師データDtを生成する過程を示す説明図である。例えば、予測日が3月11日である場合、予測部1222が予測データDpを生成するのは、3月11日より前である。この例では、3月10日に予測データDpが生成されることとする。学習部1221は、3月11日に当日のログデータLGに基づいて、予測日の各時間帯Tzにおいて、音声操作の有無を示す音声操作データDrを生成する。音声操作データDrにおいて、「1」は音声操作がなされなかったことを示し、「0」は音声操作がなされたことを示す。 FIG. 3 is an explanatory diagram showing a process in which the learning unit 1221 generates teacher data Dt. For example, when the forecast date is March 11, the forecast unit 1222 generates the forecast data Dp before March 11. In this example, it is assumed that the forecast data Dp is generated on March 10. The learning unit 1221 generates voice operation data Dr indicating the presence or absence of voice operation in each time zone Tz of the predicted day based on the log data LG of the day on March 11. In the voice operation data Dr, "1" indicates that the voice operation was not performed, and "0" indicates that the voice operation was performed.
 図3に示す例では、音声操作データDrは、時間帯Tz24(08:00~08:20)及び時間帯Tz25(08:20~08:40)において、音声操作有り(音声操作がなされたこと)を示す。一方、予測データDpは、時間帯Tz24(08:00~08:20)では音声操作有り(音声操作がなされると予測されたこと)を示し及び時間帯Tz25(08:20~08:40)では音声操作無し(音声操作がなされないと予測されたこと)を示す。従って、学習モデルM1を用いた未操作時間帯Txの予測は、時間帯Tz25において誤っていたことになる。学習部1221は、ラベルデータDlを生成する。ラベルデータDlは、予測が正しい時間帯Tzでは「1」となり、予測が誤った時間帯Tzでは「0」となる。図3に示す例では、学習部1221は、時間帯Tz25において誤りを示すラベルデータDlを生成する。 In the example shown in FIG. 3, the voice operation data Dr has voice operation (voice operation has been performed) in the time zone Tz24 (08: 00-08: 20) and the time zone Tz25 (08: 20-08: 40). ) Is shown. On the other hand, the prediction data Dp indicates that there is voice operation (it was predicted that voice operation will be performed) in the time zone Tz24 (08: 00-08: 20) and time zone Tz25 (08: 20-08: 40). Indicates that there is no voice operation (it was predicted that no voice operation would be performed). Therefore, the prediction of the unoperated time zone Tx using the learning model M1 is incorrect in the time zone Tz25. The learning unit 1221 generates label data Dl. The label data Dl is "1" in the time zone Tz where the prediction is correct, and is "0" in the time zone Tz where the prediction is incorrect. In the example shown in FIG. 3, the learning unit 1221 generates label data Dl indicating an error in the time zone Tz25.
 また、図3に示す例では、学習部1221は、予測日である3月11日より前の3月10日のログデータLGとラベルデータDlの組を教師データDtとして生成する。この教師データDtを学習モデルM1に機械学習させることによって、未操作時間帯Txの推定の精度が向上する。 Further, in the example shown in FIG. 3, the learning unit 1221 generates a pair of log data LG and label data Dl on March 10 before the predicted date of March 11 as teacher data Dt. By making the learning model M1 machine-learn the teacher data Dt, the accuracy of estimating the unoperated time zone Tx is improved.
 説明を図1に戻す。制御データ生成部124は、推定部122Aによって推定された予測データDpの音声操作無しを示す時間帯Tz、即ち、予測データDpの示す未操作時間帯Txにおいて音声の入力を受け付ける音入力装置252をオフ状態にすることを指示する制御データDcを生成する。制御データDcは、予測データDpと同じであってもよいし、或いは、音入力装置252がオフ状態となる期間の開始時刻と終了時刻を示してもよい。例えば、予測データDpが図3に示される例である場合、制御データDcは予測データDpと同じ72ビットのデータであってもよいし、或いは、開始時刻08:20と終了時刻08:40とを示してもよい。 Return the explanation to Fig. 1. The control data generation unit 124 uses a sound input device 252 that receives voice input in the time zone Tz indicating that the predicted data Dp estimated by the estimation unit 122A has no voice operation, that is, in the unoperated time zone Tx indicated by the predicted data Dp. Generates control data Dc instructing to turn it off. The control data Dc may be the same as the prediction data Dp, or may indicate the start time and end time of the period during which the sound input device 252 is in the off state. For example, when the predicted data Dp is an example shown in FIG. 3, the control data Dc may be the same 72-bit data as the predicted data Dp, or the start time is 08:20 and the end time is 08:40. May be indicated.
 次に、送信制御部126は、通信装置140を制御して、通信装置140に制御データDcをユーザ装置200Aへ送信させる。 Next, the transmission control unit 126 controls the communication device 140 to cause the communication device 140 to transmit the control data Dc to the user device 200A.
[1-2.ユーザ装置]
 次に、ユーザ装置200Aは、処理装置210、記憶装置230、通信装置240、入力装置250、出力装置260、動き検出装置270、及びGPS装置280を備える。処理装置210は、ユーザ装置200Aの全体を制御するプロセッサであり、処理装置110と同様に構成される。
[1-2. User device]
Next, the user device 200A includes a processing device 210, a storage device 230, a communication device 240, an input device 250, an output device 260, a motion detection device 270, and a GPS device 280. The processing device 210 is a processor that controls the entire user device 200A, and is configured in the same manner as the processing device 110.
 記憶装置230は、処理装置210が読取可能な記録媒体であり、処理装置210が実行する制御プログラムP2を含む複数のプログラム、及び処理装置210が使用する各種のデータを記憶する。記憶装置230は、例えば、ROM、EPROM、EEPROM、RAM等の少なくとも1つによって構成されてもよい。 The storage device 230 is a recording medium that can be read by the processing device 210, and stores a plurality of programs including the control program P2 executed by the processing device 210 and various data used by the processing device 210. The storage device 230 may be composed of, for example, at least one of ROM, EPROM, EEPROM, RAM and the like.
 通信装置240は、他の装置と通信を行うためのハードウェア(送受信デバイス)である。通信装置240は、通信装置140と同様に構成されてもよい。通信装置240は、第1通信装置の一例である。 The communication device 240 is hardware (transmission / reception device) for communicating with other devices. The communication device 240 may be configured in the same manner as the communication device 140. The communication device 240 is an example of the first communication device.
 入力装置250は、外部からの入力を受け付ける入力デバイスである。例えば、入力装置250は、数字及び文字等の符号を処理装置210に入力するための操作を受け付ける。入力操作は、ユーザのタッチ操作とユーザの音声による操作を含む。タッチ操作については、例えば、表示装置261の表示面に対するユーザの指の接触を検出するタッチパネルが入力装置250として好適である。なお、ユーザが操作可能な複数の操作子を入力装置250が含んでもよい。 The input device 250 is an input device that accepts input from the outside. For example, the input device 250 accepts an operation for inputting a code such as a number and a character into the processing device 210. Input operations include user touch operations and user voice operations. Regarding the touch operation, for example, a touch panel that detects the contact of the user's finger with the display surface of the display device 261 is suitable as the input device 250. The input device 250 may include a plurality of controls that can be operated by the user.
 また、ユーザの音声による操作は音入力装置252が受け付ける。音入力装置252は、音を電気信号に変換するマイクロフォンとマイクロフォンの出力信号を増幅するアンプと、アンプの出力信号をデジタル信号に変換するAD変換器とを有する。更に、音入力装置252は、アンプ及びAD変換器と電源を供給する電源ラインとの間に設けられたスイッチを備える。スイッチがオン状態になると、音入力装置252に電源が供給され、音入力装置252がオン状態となる。音入力装置252は、オン状態では、ユーザの音声を音データに変換して出力可能となる。一方、スイッチがオフ状態になると、音入力装置252に電源が供給されない。この場合、音入力装置252がオフ状態となる。オフ状態の音入力装置252は、ユーザの音声を音データに変換することが不能になる。スイッチは処理装置210によって制御される。本明細書において、音入力装置252がオン状態とは、音を音データに変換可能な動作状態を意味する。また、音入力装置252がオフ状態とは、音を音データに変換不能な動作状態を意味する。このため、オフ状態は、オン状態に遷移するまでの時間が短いスリープ状態を含む。スリープ状態では、オン状態と比較して小さな電力を消費する。スリープ状態は、ユーザ装置200Aの電力が全く消費されない完全なオフ状態と相違する。 In addition, the sound input device 252 accepts the user's voice operation. The sound input device 252 includes a microphone that converts sound into an electric signal, an amplifier that amplifies the output signal of the microphone, and an AD converter that converts the output signal of the amplifier into a digital signal. Further, the sound input device 252 includes a switch provided between the amplifier and the AD converter and the power supply line for supplying power. When the switch is turned on, power is supplied to the sound input device 252, and the sound input device 252 is turned on. When the sound input device 252 is on, the user's voice can be converted into sound data and output. On the other hand, when the switch is turned off, power is not supplied to the sound input device 252. In this case, the sound input device 252 is turned off. The sound input device 252 in the off state cannot convert the user's voice into sound data. The switch is controlled by the processing device 210. In the present specification, the on state of the sound input device 252 means an operating state capable of converting sound into sound data. Further, the off state of the sound input device 252 means an operating state in which sound cannot be converted into sound data. Therefore, the off state includes a sleep state in which the time until the transition to the on state is short is short. The sleep state consumes less power than the on state. The sleep state is different from the completely off state in which the power of the user device 200A is not consumed at all.
 出力装置260は、ユーザ装置200Aの外部への出力を実施するデバイスである。出力装置260は、例えば、画像を表示する表示装置261、音を出力する音出力装置262を含む。表示装置261は、処理装置210による制御のもとで各種の画像を表示する。例えば、液晶表示パネル及び有機EL(Electro Luminescence)表示パネル等の各種の表示パネルが表示装置261として好適に利用される。 The output device 260 is a device that outputs the user device 200A to the outside. The output device 260 includes, for example, a display device 261 for displaying an image and a sound output device 262 for outputting sound. The display device 261 displays various images under the control of the processing device 210. For example, various display panels such as a liquid crystal display panel and an organic EL (Electro Luminescence) display panel are preferably used as the display device 261.
 動き検出装置270は、ユーザ装置200Aの動きを検出して、動きデータを出力する。動き検出装置270としては、角加速度を検出するジャイロセンサー及び加速度を検出する加速度センサーなどの慣性センサーが該当する。動き検出装置270によって、所定値より大きな加速度が検出される場合は、ユーザが乗り物(例えば、電車又は車)に乗って高速で移動中であることがわかる。反対に、動き検出装置270によって、所定値より小さな加速度が検出される場合は、ユーザが歩行している、或いは、ランニング中であることが検出できる。 The motion detection device 270 detects the motion of the user device 200A and outputs motion data. The motion detection device 270 corresponds to an inertial sensor such as a gyro sensor that detects angular acceleration and an acceleration sensor that detects acceleration. When the motion detection device 270 detects an acceleration larger than a predetermined value, it means that the user is moving at high speed in a vehicle (for example, a train or a car). On the contrary, when the motion detection device 270 detects an acceleration smaller than a predetermined value, it can be detected that the user is walking or running.
 GPS装置280は、複数の衛星からの電波を受信し、受信した電波を用いて位置データを生成する。位置データは、ユーザ装置200Aの位置を示す。位置データは、位置を特定できるのであれば、どのような形式であってもよい。位置データは、例えば、ユーザ装置200Aの緯度と経度とを示す。この例では、位置データはGPS装置280から得られることを例示するが、ユーザ装置200Aは、どのような方法で位置データを取得してもよい。例えば、ユーザ装置200Aの通信先となる基地局に割り当てられたセルIDを用いて位置データを取得してもよい。さらに、ユーザ装置200Aが無線LAN(Local Area Network)のアクセスポイントと通信する場合には、ユーザ装置200Aは、アクセスポイントに割り当てられたネットワーク上の識別アドレス(MAC(Media Access Control)アドレス)と実際の住所(位置)とを互いに対応付けたデータベースを参照して位置データを取得してもよい。さらに、ユーザ装置200Aは、BLE(Bluetooth Low Energy)規格に準拠したアドバタイズメント・パケットに含まれるID情報を受信し、ID情報に基づいて位置データを取得してもよい。 The GPS device 280 receives radio waves from a plurality of satellites and generates position data using the received radio waves. The position data indicates the position of the user device 200A. The position data may be in any format as long as the position can be specified. The position data indicates, for example, the latitude and longitude of the user device 200A. In this example, it is illustrated that the position data is obtained from the GPS device 280, but the user device 200A may acquire the position data by any method. For example, the position data may be acquired using the cell ID assigned to the base station that is the communication destination of the user device 200A. Further, when the user device 200A communicates with the access point of the wireless LAN (Local Area Network), the user device 200A actually has an identification address (MAC (Media Access Control) address) on the network assigned to the access point. The location data may be acquired by referring to a database in which the addresses (locations) of the above are associated with each other. Further, the user device 200A may receive the ID information included in the advertisement packet conforming to the BLE (Bluetooth Low Energy) standard, and may acquire the position data based on the ID information.
 処理装置210は、記憶装置230から制御プログラムP2を読み出して当該プログラムを実行することによって、制御データ取得部220、制御部222、音声エージェント部224、及び送信制御部226として機能する。なお、制御プログラムP2はネットワークを介して他の装置から送信されてもよい。 The processing device 210 functions as a control data acquisition unit 220, a control unit 222, a voice agent unit 224, and a transmission control unit 226 by reading the control program P2 from the storage device 230 and executing the program. The control program P2 may be transmitted from another device via the network.
 制御データ取得部220は、通信装置240を用いて、サーバ装置100Aから制御データDcを取得する。
 制御部222は、制御データDcに基づいて音入力装置252をオフ状態にさせる。制御データDcが未操作時間帯Txの開始時刻と終了時刻とを示す場合には、制御部222は、現在時刻と開始時刻が一致するとスイッチをオフ状態にさせる。一方、現在時刻と終了時刻とが一致すると、制御部222は、スイッチをオン状態にさせる。
 また、制御部222は、ユーザ装置200Aの動作内容と時間とを対応付けたログデータLGを生成し、記憶装置230に記憶する。
The control data acquisition unit 220 acquires the control data Dc from the server device 100A by using the communication device 240.
The control unit 222 turns off the sound input device 252 based on the control data Dc. When the control data Dc indicates the start time and the end time of the non-operation time zone Tx, the control unit 222 turns off the switch when the current time and the start time match. On the other hand, when the current time and the end time match, the control unit 222 turns on the switch.
Further, the control unit 222 generates the log data LG in which the operation content of the user device 200A and the time are associated with each other, and stores the log data LG in the storage device 230.
 音声エージェント部224は音入力装置252から出力される音データに基づいて、音声を認識し、ユーザの音声による操作指示を解釈して、ユーザ装置200Aを制御する。例えば、ユーザの音声が「今日の天気は?」を示すのであれば、音声エージェント部224は、天気予報のサイトにアクセスして、今日の天気予報を取得し、ユーザに音声又は画像を用いて今日の天気を知らせる。 The voice agent unit 224 recognizes the voice based on the sound data output from the sound input device 252, interprets the operation instruction by the user's voice, and controls the user device 200A. For example, if the user's voice indicates "What is the weather today?", The voice agent unit 224 accesses the weather forecast site, obtains the weather forecast for today, and uses the voice or image to the user. Let me know the weather today.
 送信制御部226は、通信装置240を用いて、通信装置240に、記憶装置230に記憶されているログデータLGをサーバ装置100Aへ送信させる。 The transmission control unit 226 causes the communication device 240 to transmit the log data LG stored in the storage device 230 to the server device 100A by using the communication device 240.
[1-3.情報処理システムの動作]
 次に、情報処理システム10の動作について説明する。図4は情報処理システムの動作を示すフローチャートである。
[1-3. Information processing system operation]
Next, the operation of the information processing system 10 will be described. FIG. 4 is a flowchart showing the operation of the information processing system.
 まず、ユーザ装置200Aの処理装置210は、制御部222として機能し、ログデータLGを生成して、ログデータLGを記憶装置230に記憶させる(S200)。 First, the processing device 210 of the user device 200A functions as the control unit 222, generates the log data LG, and stores the log data LG in the storage device 230 (S200).
 次に、処理装置210は、送信制御部226として機能し、通信装置240を制御して、通信装置240にログデータLGをサーバ装置100Aへ送信させる(S210)。ログデータLGの送信は、例えば、1日1回など定期的な送信であってもよい。或いは、ログデータLGは、新たなログデータLGが所定数発生するたびに、送信されてもよい。 Next, the processing device 210 functions as a transmission control unit 226, controls the communication device 240, and causes the communication device 240 to transmit the log data LG to the server device 100A (S210). The transmission of the log data LG may be a periodic transmission such as once a day. Alternatively, the log data LG may be transmitted every time a predetermined number of new log data LGs are generated.
 次に、サーバ装置100Aの処理装置110は、取得部120Aとして機能し、ユーザ装置200Aから送信されるログデータLGを取得する(S100)。具合的には、取得部120Aは、通信装置140にユーザ装置200Aから送信されるログデータLGを受信させる。この受信によって、取得部120Aは、ログデータLGを取得する。 Next, the processing device 110 of the server device 100A functions as the acquisition unit 120A and acquires the log data LG transmitted from the user device 200A (S100). Specifically, the acquisition unit 120A causes the communication device 140 to receive the log data LG transmitted from the user device 200A. Upon this reception, the acquisition unit 120A acquires the log data LG.
 ステップS110において、処理装置110は、学習部1221として機能し、1日のログデータLGに基づいて、音声操作データDrを生成する。音声操作データDrは、時間帯Tzごとに音声操作の有無を示す。 In step S110, the processing device 110 functions as a learning unit 1221 and generates voice operation data Dr based on the daily log data LG. The voice operation data Dr indicates the presence or absence of voice operation for each time zone Tz.
 ステップS120において、処理装置110は、学習部1221として機能し、ラベルデータDlを生成する。この例では、処理装置110は、1日単位でラベルデータDlを生成する。具体的には、処理装置110は、音声操作データDrに対応する予測日の予測データDpと音声操作データDrとを、時間帯Tzごとに比較して、予測の正誤を示すラベルデータDlを生成する。 In step S120, the processing device 110 functions as a learning unit 1221 and generates label data Dl. In this example, the processing device 110 generates label data Dl on a daily basis. Specifically, the processing device 110 compares the prediction data Dp of the prediction date corresponding to the voice operation data Dr and the voice operation data Dr for each time zone Tz, and generates label data Dl indicating the correctness of the prediction. To do.
 ステップS130において、処理装置110は、学習部1221として機能し、ラベルデータDlと予測日のログデータLGとの組みを教師データDtとして生成し、教師データDtを学習モデルM1に学習させる。 In step S130, the processing device 110 functions as a learning unit 1221, generates a set of label data Dl and log data LG of the predicted date as teacher data Dt, and trains the teacher data Dt in the learning model M1.
 ステップS140において、処理装置110は、予測部1222として機能し、学習モデルM1に、予測日より前のログデータLGを入力し、予測日にける未操作時間帯Txを示す予測データDpを生成する。予測日より前とは、例えば、予測日の前日である。例えば、予測日が翌日であれば、予測日より前のログデータLGは、当日のログデータLGである。 In step S140, the processing device 110 functions as the prediction unit 1222, inputs the log data LG before the prediction date to the learning model M1, and generates the prediction data Dp indicating the unoperated time zone Tx on the prediction date. .. The term before the forecast date is, for example, the day before the forecast date. For example, if the forecast date is the next day, the log data LG before the forecast date is the log data LG of the current day.
 ステップS150において、処理装置110は、制御データ生成部124として機能し、未操作時間帯Txに音入力装置252をオフ状態にすることを指示する制御データDcを生成する。 In step S150, the processing device 110 functions as the control data generation unit 124 and generates the control data Dc instructing the sound input device 252 to be turned off during the non-operation time zone Tx.
 ステップS160において、処理装置110は、送信制御部126として機能し、通信装置140を用いて、制御データDcをユーザ装置200Aへ送信させる。 In step S160, the processing device 110 functions as a transmission control unit 126, and the communication device 140 is used to transmit the control data Dc to the user device 200A.
 次に、ユーザ装置200Aの処理装置210は、ステップS220において、制御データ取得部220として機能し、通信装置240を用いて、通信装置240にサーバ装置100Aから送信される制御データDcを受信させる。 Next, the processing device 210 of the user device 200A functions as the control data acquisition unit 220 in step S220, and causes the communication device 240 to receive the control data Dc transmitted from the server device 100A by using the communication device 240.
 ステップS230において、処理装置210は、制御部222として機能し、制御データDcに基づいて、未操作時間帯Txにおいて音入力装置252をオフ状態に制御する。 In step S230, the processing device 210 functions as the control unit 222, and controls the sound input device 252 to the off state in the non-operation time zone Tx based on the control data Dc.
 以上説明したように本実施形態によれば、サーバ装置100Aは、ユーザ装置200Aにおけるユーザの音声による操作を含む動作内容と時間を対応付けたログデータLGを取得する取得部120Aと、ログデータLGに基づいて、1日を区分した複数の時間帯Tzのうち音声による操作がなされない未操作時間帯Txを推定する推定部122Aとを備える。推定部122Aにおける未操作時間帯Txの推定は、ユーザ装置200Aの動作内容に基づくものであるため、ユーザがユーザ装置200Aをどのように操作したかを考慮した推定となっている。従って、音声による操作の傾向をユーザごとに把握して、未操作時間帯Txを推定することができる。また、サーバ装置100Aは、未操作時間帯Txに、音声の入力を受け付ける音入力装置252をオフ状態にすることを指示する制御データDcを生成する制御データ生成部124を備える。制御データDcをユーザ装置200Aが用いることにより、推定された未操作時間帯Txに音入力装置252がオフ状態に制御される。この制御によって、ユーザ装置200Aの消費電力を削減することが可能となる。 As described above, according to the present embodiment, the server device 100A has the acquisition unit 120A for acquiring the log data LG in which the operation content including the operation by the user's voice in the user device 200A is associated with the time, and the log data LG. Based on the above, the estimation unit 122A is provided to estimate the unoperated time zone Tx in which the operation by voice is not performed among the plurality of time zones Tz that divide the day. Since the estimation of the non-operated time zone Tx in the estimation unit 122A is based on the operation content of the user device 200A, it is an estimation considering how the user operates the user device 200A. Therefore, it is possible to grasp the tendency of the operation by voice for each user and estimate the non-operation time zone Tx. Further, the server device 100A includes a control data generation unit 124 that generates control data Dc instructing the sound input device 252 that accepts voice input to be turned off during the non-operation time zone Tx. By using the control data Dc by the user device 200A, the sound input device 252 is controlled to be in the off state during the estimated non-operation time zone Tx. This control makes it possible to reduce the power consumption of the user device 200A.
 また、推定部122Aは、ログデータLGと未操作時間帯Txとの関係を学習モデルM1に学習させる学習部1221と、学習モデルM1を用いて、将来の時間帯Tzにおける音声による操作の有無を示す予測データDpを生成する予測部1222とを備える。学習モデルM1によってログデータLGと未操作時間帯Txとの関係が機械学習されるので、学習モデルM1を用いた未操作時間帯Txの予測精度を、機械学習の程度が進むにつれ、次第に向上させることができる。この場合、制御データ生成部124は、予測データDpの示す未操作時間帯Txに音入力装置252をオフ状態にすることを指示する制御データDcを生成する。制御データDcをユーザ装置200Aが用いることにより、予測データDpの示す未操作時間帯Txに音入力装置252をオフ状態に制御することができる。この結果、ユーザ装置200Aの消費電力を削減することが可能となる。 Further, the estimation unit 122A uses the learning unit 1221 that causes the learning model M1 to learn the relationship between the log data LG and the unoperated time zone Tx, and the learning model M1 to determine whether or not there is an operation by voice in the future time zone Tz. It is provided with a prediction unit 1222 that generates the prediction data Dp shown. Since the relationship between the log data LG and the unoperated time zone Tx is machine-learned by the learning model M1, the prediction accuracy of the unoperated time zone Tx using the learning model M1 is gradually improved as the degree of machine learning progresses. be able to. In this case, the control data generation unit 124 generates the control data Dc instructing the sound input device 252 to be turned off during the non-operation time zone Tx indicated by the prediction data Dp. By using the control data Dc by the user device 200A, the sound input device 252 can be controlled to be in the off state during the non-operation time zone Tx indicated by the predicted data Dp. As a result, it is possible to reduce the power consumption of the user device 200A.
 また、学習部1221は、ログデータLGを基に予測データDpの正誤を示すラベルデータDlを生成し、ラベルデータDlと予測データDpに対応する時間帯Tzより前のログデータLGとの組を教師データDtとして学習モデルM1に学習させる。
 即ち、学習部1221は、教師データDtを用いて学習モデルM1に機械学習させる。このため、教師データ無しで学習モデルM1を構築する場合と比較して、短い期間で学習モデルM1による学習が可能となる。
Further, the learning unit 1221 generates label data Dl indicating the correctness of the predicted data Dp based on the log data LG, and sets the label data Dl and the log data LG before the time zone Tz corresponding to the predicted data Dp. The learning model M1 is trained as the teacher data Dt.
That is, the learning unit 1221 causes the learning model M1 to perform machine learning using the teacher data Dt. Therefore, learning by the learning model M1 becomes possible in a short period of time as compared with the case where the learning model M1 is constructed without the teacher data.
 なお、第1実施形態のサーバ装置100Aに含まれる、取得部120A、推定部122A、及び制御データ生成部124は、制御データを生成する制御データ生成装置の一例である。 The acquisition unit 120A, the estimation unit 122A, and the control data generation unit 124 included in the server device 100A of the first embodiment are examples of the control data generation device that generates control data.
[2.第2実施形態]
 第2実施形態に係る情報処理システム10は、サーバ装置100Aの替わりにサーバ装置100Bが備えられている点を除いて、図1に示す第1実施形態の情報処理システム10と同様に構成されている。
[2. Second Embodiment]
The information processing system 10 according to the second embodiment is configured in the same manner as the information processing system 10 of the first embodiment shown in FIG. 1, except that the server device 100B is provided instead of the server device 100A. There is.
 図5は、サーバ装置100Bの構成例を示すブロック図である。サーバ装置100Bは、推定部122Aの替わりに推定部122Bが用いられる点、記憶装置130が制御プログラムP1の替わりに制御プログラムP3を記憶する点、記憶装置130が学習モデルM1の替わりに学習モデルM2を記憶する点、及び記憶装置130が行動データDaを記憶する点を除いて、第1実施形態のサーバ装置100Aと同様に構成されている。サーバ装置100Aでは、ログデータLGとラベルデータDlの組を教師データDtとしたが、サーバ装置100Bでは、行動データDaとラベルデータDlの組を教師データDtとする。
 処理装置110は、記憶装置130から制御プログラムP3を読み出して当該プログラムを実行することによって、取得部120A、推定部122B、制御データ生成部124、及び送信制御部126として機能する。
FIG. 5 is a block diagram showing a configuration example of the server device 100B. In the server device 100B, the estimation unit 122B is used instead of the estimation unit 122A, the storage device 130 stores the control program P3 instead of the control program P1, and the storage device 130 stores the control program P3 instead of the learning model M1. It is configured in the same manner as the server device 100A of the first embodiment except that the storage device 130 stores the action data Da. In the server device 100A, the set of the log data LG and the label data Dl is used as the teacher data Dt, but in the server device 100B, the set of the action data Da and the label data Dl is used as the teacher data Dt.
The processing device 110 functions as an acquisition unit 120A, an estimation unit 122B, a control data generation unit 124, and a transmission control unit 126 by reading the control program P3 from the storage device 130 and executing the program.
 推定部122Bは、学習部1223及び予測部1222を備える。学習部1223は、取得部120Aが、ユーザ装置200Aから取得したログデータLGに基づいてユーザの行動内容と行動がなされた時間とを対応付けた行動データDaを生成する。行動データDaは、ログデータLGそのものではなく、ログデータLGを解釈してユーザの行動内容にあてはめたものである。 The estimation unit 122B includes a learning unit 1223 and a prediction unit 1222. The learning unit 1223 generates the action data Da in which the action content of the user and the time when the action is taken are associated with each other based on the log data LG acquired from the user device 200A by the acquisition unit 120A. The action data Da is not the log data LG itself, but is an interpretation of the log data LG and applied to the action content of the user.
 ユーザの行動内容を例示すれば、アプリケーションの実行に関して、動画再生、音楽再生、ゲーム実行、メール、web検索などがある。これらの行動内容は、ログデータLGに記録されているアプリケーションから特定される。また、ユーザの所在する場所も行動内容に含まれる。例えば、自宅、会社、カフェが該当する。これらの場所は、ログデータLGに含まれる位置データに基づいて特定される。また、ユーザの移動に関する行動内容には、歩行、ランニング、電車で移動などが含まれる。これらの行動内容は、ログデータLGに含まれる加速度データから生成される。 To give an example of user behavior, there are video playback, music playback, game execution, email, web search, etc. regarding application execution. These action contents are specified from the application recorded in the log data LG. In addition, the location of the user is also included in the action content. For example, home, office, cafe. These locations are identified based on the location data contained in the log data LG. In addition, the action contents related to the movement of the user include walking, running, moving by train, and the like. These action contents are generated from the acceleration data included in the log data LG.
 例えば、図2に示される午前8時から午前8時40分までの時間帯におけるユーザ装置200Aの動作内容を示すログデータLGに基づいて、図6に示す行動データDaが生成される。この例では、図2に示されるログデータLGのレコードr1~r14が、行動データDaのレコードR1~R10に圧縮されている。また、行動データDaのレコードR4とレコードR8には、行動内容として「通勤経路」が割り当てられている。このように、図6の例において、行動データDaは、各時間帯において、ユーザの行動内容と時間との複数組(複数レコード)を有するデータである。 For example, the action data Da shown in FIG. 6 is generated based on the log data LG showing the operation content of the user device 200A in the time zone from 8:00 am to 8:40 am shown in FIG. In this example, the records r1 to r14 of the log data LG shown in FIG. 2 are compressed into the records R1 to R10 of the action data Da. Further, a "commuting route" is assigned as an action content to the record R4 and the record R8 of the action data Da. As described above, in the example of FIG. 6, the behavior data Da is data having a plurality of sets (plural records) of the user's behavior content and time in each time zone.
 学習部1223は、行動データDaとラベルデータDlとの組を教師データDtとして生成し、教師データDtを学習モデルM2に学習させる。なお、ラベルデータDlは、第1実施形態の学習部1221と同様に生成される。行動データDaでは、ユーザの行動内容の観点からログデータLGの内容が抽象化されているので、学習効率を向上させることができる。 The learning unit 1223 generates a set of behavior data Da and label data Dl as teacher data Dt, and causes the learning model M2 to learn the teacher data Dt. The label data Dl is generated in the same manner as the learning unit 1221 of the first embodiment. In the behavior data Da, since the content of the log data LG is abstracted from the viewpoint of the behavior content of the user, the learning efficiency can be improved.
 次に、第2実施形態に係る情報処理システム10の動作を説明する。図7は第2実施形態に係る情報処理システム10の動作を示すフローチャートである。図7に示すフローチャートが図4に示すフローチャートと相違するのは、ステップS130の替わりにステップS131を採用した点、及びステップ120とステップS131との間にステップS122を設けた点である。 Next, the operation of the information processing system 10 according to the second embodiment will be described. FIG. 7 is a flowchart showing the operation of the information processing system 10 according to the second embodiment. The flowchart shown in FIG. 7 differs from the flowchart shown in FIG. 4 in that step S131 is adopted instead of step S130, and step S122 is provided between step 120 and step S131.
 ステップS122において処理装置110は、学習部1223として機能し、ログデータLGに基づいて行動データDaを生成する。更に、ステップS131において、処理装置110は、学習部1223として機能し、行動データDaとラベルデータDlの組みを教師データDtとして生成し、教師データDtを学習モデルM2に学習させる。 In step S122, the processing device 110 functions as a learning unit 1223 and generates action data Da based on the log data LG. Further, in step S131, the processing device 110 functions as a learning unit 1223, generates a set of action data Da and label data Dl as teacher data Dt, and causes the learning model M2 to learn the teacher data Dt.
 以上説明したように第2実施形態によれば、学習部1223は、ログデータLGを基に予測データDpの正誤を示すラベルデータDlを生成し、予測データDpに対応する時間帯Tzより前のログデータLGを基にユーザの行動内容と行動がなされた時間とを対応付けた行動データDaを生成し、ラベルデータDlと行動データDaの組を教師データDtとして学習モデルM2に学習させる。行動データDaではユーザの行動の観点からログデータLGの内容が抽象化されているので、学習モデルM2の学習効率を向上させることができる。 As described above, according to the second embodiment, the learning unit 1223 generates label data Dl indicating the correctness of the predicted data Dp based on the log data LG, and is before the time zone Tz corresponding to the predicted data Dp. Based on the log data LG, the action data Da in which the action content of the user and the time when the action is performed is associated with each other is generated, and the pair of the label data Dl and the action data Da is trained by the learning model M2 as the teacher data Dt. Since the content of the log data LG is abstracted from the viewpoint of the user's behavior in the behavior data Da, the learning efficiency of the learning model M2 can be improved.
 なお、第2実施形態のサーバ装置100Bに含まれる、取得部120A、推定部122B、及び制御データ生成部124は、制御データを生成する制御データ生成装置の一例である。 The acquisition unit 120A, the estimation unit 122B, and the control data generation unit 124 included in the server device 100B of the second embodiment are examples of the control data generation device that generates control data.
[3.第3実施形態]
 図8は、第3実施形態に係るユーザ装置200Bの構成例を示すブロック図である。ユーザ装置200Bは、推定部122Aが備えられている点、取得部120Bが備えられている点、記憶装置230に制御プログラムP1の替わりに制御プログラムP4が記憶される点、及び記憶装置230に学習モデルM1が備えられている点で図1に示す第1実施形態のユーザ装置200Aと相違する。
[3. Third Embodiment]
FIG. 8 is a block diagram showing a configuration example of the user device 200B according to the third embodiment. The user device 200B has a point that the estimation unit 122A is provided, a point that the acquisition unit 120B is provided, a point that the control program P4 is stored in the storage device 230 instead of the control program P1, and a point that the storage device 230 learns. It differs from the user apparatus 200A of the first embodiment shown in FIG. 1 in that the model M1 is provided.
 即ち、第1実施形態では、ユーザ装置200Aがサーバ装置100AにログデータLGを送信し、サーバ装置100Aが学習モデルM1を構築したが、第3実施形態ではユーザ装置200BがログデータLGに基づいて学習モデルM1を構築し、これを用いて予測される未操作時間帯Txにおいてユーザ装置200Bが音入力装置252をオフ状態にさせる。 That is, in the first embodiment, the user device 200A transmits the log data LG to the server device 100A, and the server device 100A constructs the learning model M1, but in the third embodiment, the user device 200B is based on the log data LG. The learning model M1 is constructed, and the user device 200B turns off the sound input device 252 in the unoperated time zone Tx predicted by using the learning model M1.
 処理装置210は、記憶装置230から制御プログラムP4を読み出して当該プログラムを実行することによって、取得部120B、推定部122A、制御データ生成部124、制御部222、及び音声エージェント部224として機能する。 The processing device 210 functions as an acquisition unit 120B, an estimation unit 122A, a control data generation unit 124, a control unit 222, and a voice agent unit 224 by reading the control program P4 from the storage device 230 and executing the program.
 取得部120Bは、記憶装置230からログデータLGを読み出して当該ログデータを取得する。この点で、ユーザ装置200AからログデータLGを取得する第1実施形態の取得部120Aと相違する。推定部122Aは、ログデータLGに基づいて未操作時間帯Txを推定する。具体的には、予測部1222が学習モデルM1を用いて予測データDpを生成する。制御部222は、制御データDcに基づいて未操作時間帯Txに音入力装置252をオフ状態に制御する。 The acquisition unit 120B reads the log data LG from the storage device 230 and acquires the log data. In this respect, it differs from the acquisition unit 120A of the first embodiment in which the log data LG is acquired from the user device 200A. The estimation unit 122A estimates the non-operation time zone Tx based on the log data LG. Specifically, the prediction unit 1222 generates prediction data Dp using the learning model M1. The control unit 222 controls the sound input device 252 to the off state during the non-operation time zone Tx based on the control data Dc.
 第3実施形態のユーザ装置200Bは、ログデータLGをサーバ装置100Aに送信しないので、通信資源を節約することができる。また、ログデータLGには、個人情報が含まれるので、ユーザ装置200Bは、個人情報を保護する観点からセキュリティを高めることができる。 Since the user device 200B of the third embodiment does not transmit the log data LG to the server device 100A, communication resources can be saved. Further, since the log data LG includes personal information, the user device 200B can enhance the security from the viewpoint of protecting the personal information.
 第3実施形態のユーザ装置200Bに含まれる、取得部120B、推定部122A、及び制御データ生成部124は、制御データを生成する制御データ生成装置の一例である。
 また、上述したユーザ装置200Bにおいて、推定部122Aの替わりに第2実施形態で説明した推定部122Bを用いてもよい。推定部122Bを用いる場合は、推定部122Aを用いる場合と比較して、学習モデルM2の学習効率を高めることができる。
The acquisition unit 120B, the estimation unit 122A, and the control data generation unit 124 included in the user device 200B of the third embodiment are examples of the control data generation device that generates control data.
Further, in the user device 200B described above, the estimation unit 122B described in the second embodiment may be used instead of the estimation unit 122A. When the estimation unit 122B is used, the learning efficiency of the learning model M2 can be improved as compared with the case where the estimation unit 122A is used.
[4.第4実施形態]
 上述した第1実施形態、第2実施形態、及び第3実施形態では、未操作時間帯Txが学習モデルM1又はM2を用いて推定された。これに対して、第4実施形態では、機械学習を用いることなくログデータLGを分析して、未操作時間帯Txが特定される。
[4. Fourth Embodiment]
In the first embodiment, the second embodiment, and the third embodiment described above, the unoperated time zone Tx was estimated using the learning model M1 or M2. On the other hand, in the fourth embodiment, the log data LG is analyzed without using machine learning, and the non-operation time zone Tx is specified.
 図9は、第4実施形態に係る情報処理システム10の構成例を示すブロック図である。第4実施形態に係る情報処理システム10は、サーバ装置100Aの替わりにサーバ装置100Cを用いる点を除いて、第1実施形態の情報処理システム10と同様に構成されている。 FIG. 9 is a block diagram showing a configuration example of the information processing system 10 according to the fourth embodiment. The information processing system 10 according to the fourth embodiment is configured in the same manner as the information processing system 10 according to the first embodiment, except that the server device 100C is used instead of the server device 100A.
 サーバ装置100Cは、推定部122Aの替わりに推定部122Cを用いる点、記憶装置130が制御プログラムP1に替わりに制御プログラムP5を記憶する点、及び記憶装置130が学習モデルM1を記憶しない点で、第1実施形態のサーバ装置100Aと相違する。 The server device 100C uses the estimation unit 122C instead of the estimation unit 122A, the storage device 130 stores the control program P5 instead of the control program P1, and the storage device 130 does not store the learning model M1. It is different from the server device 100A of the first embodiment.
 以下、相違点を中心に説明する。推定部122Cは、ログデータLGに基づいて、未操作時間帯Txを推定する。推定部122Cは、算出部1224及び特定部1225を備える。算出部1224は、ログデータLGに基づいて、複数の時間帯Tzの各々について音声による操作がなされない可能性の程度を示す評価値を算出する。例えば、評価値が小さい場合と比較して評価値が大きい場合、音声による操作がなされない可能性が高くなる。逆に、評価値が大きい場合と比較して評価値が小さい場合、音声による操作がなされない可能性が高くなってもよい。例えば、評価値には、時間帯Tzごとに音声による操作がなされた回数が用いられる。評価値に音声による操作がなされた回数が用いられる場合、評価値が大きい場合と比較して評価値が小さい場合、音声による操作がなされない可能性が高くなる。 The differences will be mainly explained below. The estimation unit 122C estimates the non-operation time zone Tx based on the log data LG. The estimation unit 122C includes a calculation unit 1224 and a specific unit 1225. Based on the log data LG, the calculation unit 1224 calculates an evaluation value indicating the degree of possibility that the operation by voice is not performed for each of the plurality of time zones Tz. For example, when the evaluation value is large as compared with the case where the evaluation value is small, there is a high possibility that the operation by voice is not performed. On the contrary, when the evaluation value is small as compared with the case where the evaluation value is large, there is a high possibility that the operation by voice is not performed. For example, as the evaluation value, the number of times the voice operation is performed for each time zone Tz is used. When the number of times the voice operation is performed is used as the evaluation value, when the evaluation value is smaller than when the evaluation value is large, there is a high possibility that the voice operation is not performed.
 特定部1225は、評価値を所定値と比較した比較結果に基づいて、未操作時間帯Txを特定する。所定値より小さい評価値を持つ時間帯Tzが未操作時間帯Txとして特定される。 The identification unit 1225 specifies the non-operation time zone Tx based on the comparison result of comparing the evaluation value with the predetermined value. A time zone Tz having an evaluation value smaller than a predetermined value is specified as an unoperated time zone Tx.
 制御データ生成部124は、特定部1225で特定された未操作時間帯Txにおいて音入力装置252をオフ状態にすることを指示する制御データDcを生成し、制御部222は制御データDcに従って音入力装置252をオフ状態に制御する。 The control data generation unit 124 generates control data Dc instructing the sound input device 252 to be turned off in the unoperated time zone Tx specified by the specific unit 1225, and the control unit 222 inputs sound according to the control data Dc. The device 252 is controlled to the off state.
 図10は、第4実施形態に係る情報処理システム10の動作を説明するためのフローチャートである。図10に示すフローチャートが図4に示すフローチャートと相違するのは、ステップS120、ステップS130及びステップS140の替わりに、ステップS102及びステップS104を設けた点である。相違点について説明する。 FIG. 10 is a flowchart for explaining the operation of the information processing system 10 according to the fourth embodiment. The flowchart shown in FIG. 10 is different from the flowchart shown in FIG. 4 in that steps S102 and S104 are provided instead of steps S120, S130 and S140. The differences will be described.
 ステップS102において、処理装置110は算出部1224として機能し、ログデータLGに基づいて、複数の時間帯Tzの各々について評価値を算出する。具体的には、算出部1224は、例えば、現在から所定期間(例えば、1ヶ月)だけ過去のログデータLGを抽出し、時間帯Tzごとに音声による操作がなされた回数を算出し、回数を評価値とする。例えば、8:20~8:40の時間帯Tz25に50回、10:00~10:20の時間帯Tz26に2回、といった具合である。 In step S102, the processing device 110 functions as the calculation unit 1224, and calculates the evaluation value for each of the plurality of time zones Tz based on the log data LG. Specifically, the calculation unit 1224 extracts the past log data LG for a predetermined period (for example, one month) from the present, calculates the number of times the voice operation is performed for each time zone Tz, and calculates the number of times. Use as an evaluation value. For example, 50 times in the time zone Tz25 from 8:20 to 8:40, twice in the time zone Tz26 from 10:00 to 10:20, and so on.
 ステップS104において、処理装置110は特定部1225として機能し、評価値を所定値と比較した比較結果に基づいて、未操作時間帯Txを特定する。上述した例において、所定値が「3」であれば、所定値より小さい評価値「2」を持つ時間帯Tz26が未操作時間帯Txとして特定される。 In step S104, the processing device 110 functions as a specific unit 1225, and specifies the non-operation time zone Tx based on the comparison result of comparing the evaluation value with the predetermined value. In the above example, if the predetermined value is "3", the time zone Tz26 having an evaluation value "2" smaller than the predetermined value is specified as the unoperated time zone Tx.
 本実施形態のサーバ装置100Cは、ログデータLGに基づいて、複数の時間帯Tzの各々について音声による操作がなされない可能性の程度を示す評価値を算出する算出部1224と、評価値を所定値と比較した比較結果に基づいて、未操作時間帯Txを特定する特定部1225とを備える。このため、学習モデルM1又はM2を用いる場合と比較して、簡易に未操作時間帯Txを推定することができる。 The server device 100C of the present embodiment determines the evaluation value and the calculation unit 1224 that calculates the evaluation value indicating the degree of possibility that the operation by voice is not performed for each of the plurality of time zones Tz based on the log data LG. A specific unit 1225 for specifying the non-operation time zone Tx based on the comparison result compared with the value is provided. Therefore, the unoperated time zone Tx can be easily estimated as compared with the case where the learning model M1 or M2 is used.
 なお、第4実施形態のサーバ装置100Cに含まれる、取得部120A、推定部122C、及び制御データ生成部124は、制御データを生成する制御データ生成装置の一例である。 The acquisition unit 120A, the estimation unit 122C, and the control data generation unit 124 included in the server device 100C of the fourth embodiment are examples of the control data generation device that generates control data.
 また、第3実施形態のユーザ装置200Bにおいて、推定部122Aの替わりに推定部122Cを用い、記憶装置230から学習モデルM1を設けなくてもよい。 Further, in the user device 200B of the third embodiment, the estimation unit 122C may be used instead of the estimation unit 122A, and the learning model M1 may not be provided from the storage device 230.
[5.変形例]
 本発明は、以上に例示した実施形態に限定されない。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を併合してもよい。
[5. Modification example]
The present invention is not limited to the embodiments exemplified above. A specific mode of modification is illustrated below. Two or more aspects arbitrarily selected from the following examples may be merged.
[第1変形例]
 上述した第2実施形態において、取得部120Aは、ログデータLGの他に、ユーザの行動に関するスケジュールを示すスケジュールデータを取得してもよい。スケジュールデータはユーザ装置200Aから取得されてもよいし、他のサーバ装置から取得されてもよい。例えば、ユーザがクラウド上にスケジュールデータを保存しているのであれば、スケジュールデータは、当該スケジュールデータを管理するサーバ装置から取得されてもよい。
 学習部1223は、予測データDpに対応する時間帯より前のログデータLGとスケジュールデータとに基づいて、行動データDaを生成すればよい。
 第1変形例によれば、ログデータLGのみならずスケジュールデータを考慮して、行動データDaが生成されるので、より正確な行動データDaに基づいて予測日における未操作時間帯Txを推定することできる。この結果、未操作時間帯Txの推定精度を向上させることができ、ひいては、ユーザ装置200Aの消費電力を削減できる。
[First modification]
In the second embodiment described above, the acquisition unit 120A may acquire schedule data indicating a schedule related to the user's behavior in addition to the log data LG. The schedule data may be acquired from the user apparatus 200A or may be acquired from another server apparatus. For example, if the user stores the schedule data on the cloud, the schedule data may be acquired from the server device that manages the schedule data.
The learning unit 1223 may generate the action data Da based on the log data LG and the schedule data before the time zone corresponding to the prediction data Dp.
According to the first modification, since the action data Da is generated in consideration of not only the log data LG but also the schedule data, the unoperated time zone Tx on the predicted date is estimated based on the more accurate action data Da. Can be done. As a result, the estimation accuracy of the non-operating time zone Tx can be improved, and the power consumption of the user device 200A can be reduced.
[第2変形例]
 上述した各実施形態において、ユーザ装置200A又は200Bは、ユーザ装置200A又は200Bが使用される状態を検出する検出装置を備えてもよい。検出装置は、例えば、近接センサーである。制御部222は、制御データDcが音入力装置252をオフ状態にすることを指定しない時間帯Tzにおいて、検出装置の検出結果が所定の状態である場合、音入力装置252をオフ状態にさせる。例えば、制御部222は、近接センサーの出力データによって、表示装置261の表示面が物体(例えば、テーブル)に近接していると判定した場合、音入力装置252をオフ状態にさせる。或いは、制御部222は、音入力装置252から出力される音データに基づいて検出装置を用いてSN比を検出し、検出されたSN比が所定値より低い場合、音入力装置252をオフ状態にさせる。SN比は人の声の帯域のエネルギー成分を信号成分Sに適用し、それ以外の帯域のエネルギー成分をノイズ成分Nに適用することで算出されてもよい。SN比が所定値より低い場合には、音声認識が不能になる可能性が高い。このため、音入力装置252がオフ状態であっても、ユーザ装置200A又は200Bの操作性を大きく損なうことなく、これらユーザ装置の消費電力を削減することができる。
[Second modification]
In each of the above embodiments, the user device 200A or 200B may include a detection device that detects a state in which the user device 200A or 200B is in use. The detection device is, for example, a proximity sensor. The control unit 222 turns off the sound input device 252 when the detection result of the detection device is in a predetermined state in the time zone Tz in which the control data Dc does not specify that the sound input device 252 is turned off. For example, when the control unit 222 determines based on the output data of the proximity sensor that the display surface of the display device 261 is close to an object (for example, a table), the control unit 222 turns off the sound input device 252. Alternatively, the control unit 222 detects the SN ratio using the detection device based on the sound data output from the sound input device 252, and when the detected SN ratio is lower than the predetermined value, the sound input device 252 is turned off. Let me. The signal-to-noise ratio may be calculated by applying the energy component of the human voice band to the signal component S and applying the energy component of the other band to the noise component N. When the SN ratio is lower than the predetermined value, there is a high possibility that voice recognition becomes impossible. Therefore, even when the sound input device 252 is in the off state, the power consumption of the user devices 200A or 200B can be reduced without significantly impairing the operability of the user devices 200A or 200B.
[第3変形例]
 上述した第1実施形態、第2実施形態及び第4実施形態では、制御データDcがサーバ装置100A又は100Cからユーザ装置200Aに送信されたが、ユーザ装置200Aのユーザが所持する他の装置に制御データDcが送信されてもよい。他の装置としては、例えば、ウェアラブル機器が該当する。この場合、ユーザ装置200AのログデータLGから生成される制御データDcをウェアラブル機器に適用できる。ウェアラブル機器はログデータLGをサーバ装置100A又は100Cに送信しなくてもよいので、ウェアラブル機器の消費電力を削減することができる。なお、ユーザが所持する他の装置は、いわゆるAIスピーカーであってもよい。
[Third variant]
In the first embodiment, the second embodiment, and the fourth embodiment described above, the control data Dc is transmitted from the server device 100A or 100C to the user device 200A, but is controlled by another device owned by the user of the user device 200A. Data Dc may be transmitted. As another device, for example, a wearable device is applicable. In this case, the control data Dc generated from the log data LG of the user device 200A can be applied to the wearable device. Since the wearable device does not have to transmit the log data LG to the server device 100A or 100C, the power consumption of the wearable device can be reduced. The other device owned by the user may be a so-called AI speaker.
[6.その他]
(1)上述した実施形態では、記憶装置130及び230は、処理装置110又は210が読取可能な記録媒体であり、ROM及びRAMなどを例示したが、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリデバイス(例えば、カード、スティック、キードライブ)、CD-ROM(Compact Disc-ROM)、レジスタ、リムーバブルディスク、ハードディスク、フロッピー(登録商標)ディスク、磁気ストリップ、データベース、サーバその他の適切な記憶媒体である。また、プログラムは、電気通信回線を介してネットワークから送信されてもよい。また、プログラムは、電気通信回線を介して通信網から送信されてもよい。
[6. Others]
(1) In the above-described embodiment, the storage devices 130 and 230 are recording media that can be read by the processing device 110 or 210, and examples thereof include a ROM and a RAM, but a flexible disk, a magneto-optical disk (for example, a compact disk) , Digital versatile discs, Blu-ray® discs), smart cards, flash memory devices (eg cards, sticks, key drives), CD-ROMs (Compact Disc-ROMs), registers, removable disks, hard disks, Floppy® disks, magnetic strips, databases, servers and other suitable storage media. The program may also be transmitted from the network via a telecommunication line. The program may also be transmitted from the communication network via a telecommunication line.
(2)上述した実施形態において、説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。 (2) In the above-described embodiment, the described information, signals, and the like may be represented using any of a variety of different techniques. For example, data, instructions, commands, information, signals, bits, symbols, chips, etc. that may be referred to throughout the above description may be voltage, current, electromagnetic waves, magnetic fields or magnetic particles, light fields or photons, or any of these. It may be represented by a combination of.
(3)上述した実施形態において、入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。 (3) In the above-described embodiment, the input / output information and the like may be stored in a specific place (for example, a memory) or may be managed by using a management table. Input / output information and the like can be overwritten, updated, or added. The output information and the like may be deleted. The input information or the like may be transmitted to another device.
(4)上述した実施形態において、判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。 (4) In the above-described embodiment, the determination may be made by a value represented by 1 bit (0 or 1) or by a boolean value (Boolean: true or false). , May be done by numerical comparison (eg, comparison with a given value).
(5)上述した実施形態において例示した処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。 (5) The order of the processing procedures, sequences, flowcharts, etc. exemplified in the above-described embodiment may be changed as long as there is no contradiction. For example, the methods described in the present disclosure present elements of various steps using exemplary order, and are not limited to the particular order presented.
(6)図1、図5、図8及び図9に例示された各機能は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。 (6) Each of the functions illustrated in FIGS. 1, 5, 8 and 9 is realized by any combination of at least one of hardware and software. Further, the method of realizing each functional block is not particularly limited. That is, each functional block may be realized by using one physically or logically connected device, or directly or indirectly (for example, two or more physically or logically separated devices). , Wired, wireless, etc.) and may be realized using these plurality of devices. The functional block may be realized by combining the software with the one device or the plurality of devices.
(7)上述した実施形態で例示したプログラムは、ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。 (7) In the program illustrated in the above-described embodiment, the software is an instruction, an instruction set, a code, regardless of whether the software is called software, firmware, middleware, microcode, hardware description language, or another name. It should be broadly interpreted to mean code segments, program code, programs, subprograms, software modules, applications, software applications, software packages, routines, subroutines, objects, executable files, execution threads, procedures, features, etc. ..
 また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。 In addition, software, instructions, information, etc. may be transmitted and received via a transmission medium. For example, a website that uses at least one of wired technology (coaxial cable, fiber optic cable, twisted pair, digital subscriber line (DSL: Digital Subscriber Line), etc.) and wireless technology (infrared, microwave, etc.) When transmitted from a server, or other remote source, at least one of these wired and wireless technologies is included within the definition of transmission medium.
(8)上述した実施形態において、「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。 (8) In the embodiments described above, the terms "connected", "coupled", or any variation thereof, are direct or indirect between two or more elements. It means any connection or connection and can include the presence of one or more intermediate elements between two elements that are "connected" or "connected" to each other. The connection or connection between the elements may be physical, logical, or a combination thereof. For example, "connection" may be read as "access". As used in the present disclosure, the two elements use at least one of one or more wires, cables and printed electrical connections, and, as some non-limiting and non-comprehensive examples, the radio frequency domain. Can be considered to be "connected" or "coupled" to each other using electromagnetic energy having wavelengths in the microwave and light (both visible and invisible) regions.
(9)上述した実施形態において、「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。 (9) In the above embodiments, the statement "based on" does not mean "based on" unless otherwise stated. In other words, the statement "based on" means both "based only" and "at least based on".
(10)上述した実施形態において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。更に、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。 (10) When "include", "including" and variants thereof are used in the above-described embodiments, these terms are similar to the term "comprising". , Intended to be comprehensive. Furthermore, the term "or" used in the present disclosure is intended not to be an exclusive OR.
(11)本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。 (11) In the present disclosure, when articles are added by translation, for example, a, an and the in English, the disclosure also includes the plural nouns following these articles. Good.
(12)本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」等の用語も、「異なる」と同様に解釈されてもよい。 (12) In the present disclosure, the term "A and B are different" may mean "A and B are different from each other". The term may mean that "A and B are different from C". Terms such as "separate" and "combined" may be interpreted in the same way as "different".
(13)本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。 (13) Each aspect / embodiment described in the present disclosure may be used alone, in combination, or may be switched according to the execution. Further, the notification of predetermined information (for example, the notification of "being X") is not limited to the explicit notification, but is performed implicitly (for example, the notification of the predetermined information is not performed). May be good.
 以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。従って、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。 Although the present disclosure has been described in detail above, it is clear to those skilled in the art that the present disclosure is not limited to the embodiments described in the present disclosure. The present disclosure may be implemented as an amendment or modification mode without departing from the purpose and scope of the present disclosure, which is determined by the description of the claims. Therefore, the description of this disclosure is for the purpose of exemplary explanation and does not have any restrictive meaning to this disclosure.
 10…情報処理システム、100A,100B,100C…サーバ装置、110,210…処理装置、120A,120B…取得部、122A,122B,122C…推定部、124…制御データ生成部、200A,200B…ユーザ装置、222…制御部、252…音入力装置、1221,1223…学習部、1222…予測部、1224…算出部、1225…特定部、Da…行動データ、Dc…制御データ、Dl…ラベルデータ、Dp…予測データ、Dt…教師データ、LG…ログデータ、M1,M2…学習モデル、Tx…未操作時間帯。 10 ... Information processing system, 100A, 100B, 100C ... Server device, 110, 210 ... Processing device, 120A, 120B ... Acquisition unit, 122A, 122B, 122C ... Estimating unit, 124 ... Control data generation unit, 200A, 200B ... User Device, 222 ... Control unit, 252 ... Sound input device, 1221, 1223 ... Learning unit, 1222 ... Prediction unit, 1224 ... Calculation unit, 1225 ... Specific unit, Da ... Behavior data, Dc ... Control data, Dl ... Label data, Dp ... Prediction data, Dt ... Teacher data, LG ... Log data, M1, M2 ... Learning model, Tx ... Unoperated time zone.

Claims (9)

  1.  ユーザ装置におけるユーザの音声による操作を含む動作内容と時間を対応付けたログデータを取得する取得部と、
     前記ログデータに基づいて、1日を区分した複数の時間帯のうち前記音声による操作がなされない未操作時間帯を推定する推定部と、
     前記未操作時間帯に前記音声の入力を受け付ける音入力装置をオフ状態にすることを指示する制御データを生成する制御データ生成部と、
     を備える制御データ生成装置。
    An acquisition unit that acquires log data that associates time with operation content including user voice operations on the user device.
    Based on the log data, an estimation unit that estimates an unoperated time zone in which the voice operation is not performed among a plurality of time zones in which one day is divided,
    A control data generation unit that generates control data instructing the sound input device that accepts the voice input to be turned off during the non-operation time zone.
    A control data generator comprising.
  2.  前記推定部は、
     前記ログデータと前記音声による操作がなされなかった時間帯との関係を学習モデルに学習させる学習部と、
     前記学習モデルを用いて、将来の時間帯における前記音声による操作の有無を示す予測データを生成する予測部とを備え、
     前記制御データは、前記予測データの示す前記未操作時間帯に前記音入力装置をオフ状態にすることを指示するデータである、
     請求項1に記載の制御データ生成装置。
    The estimation unit
    A learning unit that causes the learning model to learn the relationship between the log data and the time zone in which the voice operation was not performed.
    It is provided with a prediction unit that generates prediction data indicating the presence or absence of the voice operation in a future time zone using the learning model.
    The control data is data instructing the sound input device to be turned off during the non-operation time zone indicated by the prediction data.
    The control data generation device according to claim 1.
  3.  前記学習部は、前記ログデータを基に前記予測データの正誤を示すラベルデータを生成し、前記ラベルデータと前記予測データに対応する時間帯より前のログデータとの組を教師データとして前記学習モデルに学習させる、
     請求項2に記載の制御データ生成装置。
    The learning unit generates label data indicating the correctness of the predicted data based on the log data, and uses the pair of the label data and the log data before the time zone corresponding to the predicted data as teacher data for the learning. Let the model learn
    The control data generation device according to claim 2.
  4.  前記学習部は、
     前記ログデータを基に前記予測データの正誤を示すラベルデータを生成し、
     前記予測データに対応する時間帯より前のログデータを基に前記ユーザの行動内容と行動がなされた時間とを対応付けた行動データを生成し、
     前記ラベルデータと前記行動データの組を教師データとして前記学習モデルに学習させる、
     請求項2に記載の制御データ生成装置。
    The learning unit
    Label data indicating the correctness of the predicted data is generated based on the log data.
    Based on the log data before the time zone corresponding to the predicted data, the action data in which the action content of the user and the time when the action was performed are associated with each other is generated.
    The training model is trained using the set of the label data and the behavior data as teacher data.
    The control data generation device according to claim 2.
  5.  前記取得部は、前記ユーザの行動に関するスケジュールを示すスケジュールデータを取得し、
     前記学習部は、前記予測データに対応する時間帯より前のログデータと前記スケジュールデータとに基づいて、前記行動データを生成する、
     請求項4に記載の制御データ生成装置。
    The acquisition unit acquires schedule data indicating a schedule related to the user's behavior, and obtains schedule data.
    The learning unit generates the action data based on the log data before the time zone corresponding to the prediction data and the schedule data.
    The control data generation device according to claim 4.
  6.  前記推定部は、
     前記ログデータに基づいて、前記複数の時間帯の各々について前記音声よる操作がなされない可能性の程度を示す評価値を算出する算出部と、
     前記評価値を所定値と比較した比較結果に基づいて、前記未操作時間帯を特定する特定部と、
     を備える請求項1に記載の制御データ生成装置。
    The estimation unit
    Based on the log data, a calculation unit that calculates an evaluation value indicating the degree of possibility that the operation by voice is not performed for each of the plurality of time zones, and a calculation unit.
    Based on the comparison result of comparing the evaluation value with the predetermined value, the specific unit for specifying the non-operation time zone and the specific unit
    The control data generation device according to claim 1.
  7.  請求項1から6までのうち、いずれか1項に記載の制御データ生成装置と、
     前記ユーザの音声の入力を受け付ける音入力装置と、
     前記制御データに基づいて前記音入力装置をオフ状態にさせる制御部と、
     を備えるユーザ装置。
     
    The control data generator according to any one of claims 1 to 6,
    A sound input device that accepts the user's voice input,
    A control unit that turns off the sound input device based on the control data,
    A user device comprising.
  8.  ユーザが管理するユーザ装置と、前記ユーザ装置と通信可能なサーバ装置とを備える情報処理システムであって、
     前記ユーザ装置は、
     ユーザの音声の入力を受け付ける音入力装置と、
     制御データに基づいて前記音入力装置をオフ状態にさせる制御部と、
     前記ユーザ装置における前記ユーザの音声による操作を含む動作内容と時間を対応付けたログデータを前記サーバ装置に送信し、前記サーバ装置から送信される前記制御データを受信する第1通信装置と、を備え、
     前記サーバ装置は、
     前記ユーザ装置から送信される前記ログデータを受信し、前記制御データを前記ユーザ装置に送信する第2通信装置と、
     前記ログデータに基づいて、1日を区分した複数の時間帯のうち前記音声による操作がなされない未操作時間帯を推定する推定部と、
     前記未操作時間帯に前記音声の入力を受け付ける音入力装置をオフ状態にすることを指示する前記制御データを生成する制御データ生成部と、を備える、
    情報処理システム。
    An information processing system including a user device managed by a user and a server device capable of communicating with the user device.
    The user device is
    A sound input device that accepts user voice input,
    A control unit that turns off the sound input device based on the control data,
    A first communication device that transmits log data associated with time and operation content including a voice operation of the user in the user device to the server device, and receives the control data transmitted from the server device. Prepare,
    The server device
    A second communication device that receives the log data transmitted from the user device and transmits the control data to the user device.
    Based on the log data, an estimation unit that estimates an unoperated time zone in which the voice operation is not performed among a plurality of time zones in which one day is divided, and an estimation unit.
    It includes a control data generation unit that generates the control data instructing the sound input device that receives the voice input to be turned off during the non-operation time zone.
    Information processing system.
  9.  前記ユーザ装置は、
     前記ユーザ装置が使用される状態を検出する検出装置を備え、
     前記制御部は、前記制御データが前記音入力装置をオフ状態にすることを指定しない時間帯において、前記検出装置の検出結果が所定の状態である場合、前記音入力装置をオフ状態にさせる、
     請求項8に記載の情報処理システム。
    The user device is
    A detection device for detecting a state in which the user device is used is provided.
    The control unit turns the sound input device off when the detection result of the detection device is a predetermined state in a time zone in which the control data does not specify that the sound input device is turned off.
    The information processing system according to claim 8.
PCT/JP2019/049097 2019-03-28 2019-12-16 Control data generation device, user device, and information processing system WO2020194915A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021508743A JP7369181B2 (en) 2019-03-28 2019-12-16 Control data generation device, user device and information processing system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-062807 2019-03-28
JP2019062807 2019-03-28

Publications (1)

Publication Number Publication Date
WO2020194915A1 true WO2020194915A1 (en) 2020-10-01

Family

ID=72608790

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/049097 WO2020194915A1 (en) 2019-03-28 2019-12-16 Control data generation device, user device, and information processing system

Country Status (2)

Country Link
JP (1) JP7369181B2 (en)
WO (1) WO2020194915A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013114023A (en) * 2011-11-29 2013-06-10 Sharp Corp Image forming device with learning function in power-saving mode and control device thereof
WO2014068737A1 (en) * 2012-10-31 2014-05-08 楽天株式会社 Portable terminal, control method for portable terminal, program and recording medium

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3956837B2 (en) 2002-11-20 2007-08-08 日本電気株式会社 Mobile terminal device
JP2005182357A (en) 2003-12-18 2005-07-07 Matsushita Electric Ind Co Ltd Dialog system
JP4325467B2 (en) 2004-03-31 2009-09-02 日本電気株式会社 Automatic power control system
JP2012049749A (en) 2010-08-25 2012-03-08 Sony Corp Information processor and information processing method
JP6701979B2 (en) 2016-06-01 2020-05-27 富士通株式会社 Learning model difference providing program, learning model difference providing method, and learning model difference providing system
JP6901871B2 (en) 2017-03-01 2021-07-14 大和ハウス工業株式会社 Interface unit
JP6577542B2 (en) 2017-09-05 2019-09-18 ファナック株式会社 Control device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013114023A (en) * 2011-11-29 2013-06-10 Sharp Corp Image forming device with learning function in power-saving mode and control device thereof
WO2014068737A1 (en) * 2012-10-31 2014-05-08 楽天株式会社 Portable terminal, control method for portable terminal, program and recording medium

Also Published As

Publication number Publication date
JPWO2020194915A1 (en) 2020-10-01
JP7369181B2 (en) 2023-10-25

Similar Documents

Publication Publication Date Title
CN107172590B (en) Mobile terminal and activity state information processing method and device based on same
US8744413B2 (en) Mobile terminal and method for displaying standby screen according to analysis result of user's behavior
CN109427333A (en) Activate the method for speech-recognition services and the electronic device for realizing the method
CN1993701B (en) Method and apparatus for accessing information on an external machine-readable tag
CN106104528A (en) Begin a project for screen and select and the method based on model of disambiguation
EP2567318A2 (en) Application state and activity transfer between devices
CN113220388A (en) Application suggestion based on detected trigger events
CN109150674A (en) Fault cues system, method and device thereof, equipment, storage medium
CN103403644A (en) Delayed shut down of computer
KR101531059B1 (en) Rfid reader, rfid tag, and controlling method thereof
KR101886058B1 (en) User terminal device and information providing method using the same
CN103488666A (en) Information processing apparatus, electronic device, information processing method and program
CN103455472A (en) Information processing apparatus, information processing method and program
CN106791120A (en) Mobile terminal puts out the control method and device of screen
CN109683728A (en) Group member adding method and device
CN106897134A (en) A kind of positioning function management method and device
WO2020194915A1 (en) Control data generation device, user device, and information processing system
US20220301004A1 (en) Click rate prediction model construction device
JP5241271B2 (en) Information providing apparatus, control method thereof, and program
CN108540651A (en) A kind of the recommendation method and mobile terminal of application program
US10685555B2 (en) Information processing apparatus, information processing method, and program
US11748424B2 (en) Visiting destination prediction device and visiting destination prediction method
CN100466585C (en) Method and apparatus for implementing leaf node proxy in network
CN113780975B (en) Intelligent schedule information reminding method, equipment, storage medium and software program product
CN116723560A (en) Network awakening method and device, electronic equipment and vehicle

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19921906

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021508743

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19921906

Country of ref document: EP

Kind code of ref document: A1