JP2020103496A - Environment control system and environment control method - Google Patents
Environment control system and environment control method Download PDFInfo
- Publication number
- JP2020103496A JP2020103496A JP2018244069A JP2018244069A JP2020103496A JP 2020103496 A JP2020103496 A JP 2020103496A JP 2018244069 A JP2018244069 A JP 2018244069A JP 2018244069 A JP2018244069 A JP 2018244069A JP 2020103496 A JP2020103496 A JP 2020103496A
- Authority
- JP
- Japan
- Prior art keywords
- control
- user
- unit
- environment
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title description 25
- 238000011156 evaluation Methods 0.000 claims abstract description 60
- 238000010801 machine learning Methods 0.000 claims abstract description 12
- 230000007958 sleep Effects 0.000 claims description 42
- 238000004364 calculation method Methods 0.000 claims description 26
- 230000007613 environmental effect Effects 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 21
- 230000002618 waking effect Effects 0.000 claims description 5
- 230000006399 behavior Effects 0.000 claims description 4
- 230000008859 change Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 22
- 230000009471 action Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 7
- 239000000470 constituent Substances 0.000 description 7
- 230000006698 induction Effects 0.000 description 5
- 230000008450 motivation Effects 0.000 description 5
- 230000002787 reinforcement Effects 0.000 description 5
- 206010041349 Somnolence Diseases 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000004622 sleep time Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000035900 sweating Effects 0.000 description 3
- 230000017531 blood circulation Effects 0.000 description 2
- 230000035622 drinking Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003860 sleep quality Effects 0.000 description 2
- 206010034972 Photosensitivity reaction Diseases 0.000 description 1
- 206010062519 Poor quality sleep Diseases 0.000 description 1
- 208000013738 Sleep Initiation and Maintenance disease Diseases 0.000 description 1
- 230000037007 arousal Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 210000001061 forehead Anatomy 0.000 description 1
- 230000004886 head movement Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 206010022437 insomnia Diseases 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 230000006996 mental state Effects 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 230000036211 photosensitivity Effects 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Images
Landscapes
- Circuit Arrangement For Electric Light Sources In General (AREA)
Abstract
Description
本発明は、ユーザを覚醒させるための環境制御機器の制御内容を決定する環境制御システム及び環境制御方法に関する。 The present invention relates to an environment control system and an environment control method for determining control contents of an environment control device for awakening a user.
従来、ユーザを覚醒させるための様々な技術が提案されている。特許文献1には、就寝者の睡眠状態に基づいて就寝者に起床を報知する目覚まし装置が開示されている。
Conventionally, various techniques for awakening a user have been proposed.
ところで、ユーザを覚醒させるために環境を制御する環境制御システムは、ユーザを効果的に覚醒させることができることが望まれている。 By the way, it is desired that the environment control system that controls the environment to wake up the user can effectively wake up the user.
そこで、本発明は、ユーザを効果的に覚醒させることができる環境制御システム及び環境制御方法を提供する。 Therefore, the present invention provides an environment control system and an environment control method that can effectively awaken a user.
本発明の一態様に係る環境制御システムは、ユーザの生理指標情報を含む入力情報を取得する第1取得部と、制御内容決定ルールに従って、前記入力情報から、前記ユーザを覚醒させるための制御内容であって、光を出力する機器を含む環境制御機器の制御内容を決定する決定部と、決定された前記制御内容に基づいて前記環境制御機器の制御を実行する制御部と、実行された前記制御に対する前記ユーザの評価を示す評価情報を取得する第2取得部と、前記評価情報に基づく値を報酬として用いる機械学習によって前記制御内容決定ルールを更新する更新部とを備える。 An environment control system according to an aspect of the present invention includes a first acquisition unit that acquires input information including user's physiological index information, and a control content for awakening the user from the input information according to a control content determination rule. The determining unit that determines the control content of the environmental control device including the device that outputs light, the control unit that controls the environmental control device based on the determined control content, and the executed control unit. A second acquisition unit that acquires evaluation information indicating the evaluation of the user with respect to control, and an updating unit that updates the control content determination rule by machine learning using a value based on the evaluation information as a reward.
本発明の一態様に係る環境制御方法は、ユーザの生理指標情報を含む入力情報を取得する第1取得ステップと、制御内容決定ルールに従って、前記入力情報から、前記ユーザを覚醒させるための制御内容であって、光を出力する機器を含む環境制御機器の制御内容を決定する決定ステップと、決定された前記制御内容に基づいて前記環境制御機器の制御を実行する制御ステップと、実行された前記制御に対する前記ユーザの評価を示す評価情報を取得する第2取得ステップと、前記評価情報に基づく値を報酬として用いる機械学習によって前記制御内容決定ルールを更新する更新ステップとを含む。 An environmental control method according to an aspect of the present invention includes a first acquisition step of acquiring input information including user's physiological index information, and a control content for awakening the user from the input information according to a control content determination rule. The determining step of determining the control content of the environmental control device including the device that outputs light, the control step of executing control of the environmental control device based on the determined control content, and the executed The method includes a second acquisition step of acquiring evaluation information indicating an evaluation of the user with respect to control, and an updating step of updating the control content determination rule by machine learning using a value based on the evaluation information as a reward.
なお、これらの包括的又は具体的な態様は、システム、方法、集積回路、コンピュータプログラム又はコンピュータ読み取り可能なCD−ROMなどの記録媒体で実現されてもよく、システム、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。 Note that these comprehensive or specific aspects may be realized by a recording medium such as a system, a method, an integrated circuit, a computer program, or a computer-readable CD-ROM, and the system, the integrated circuit, the computer program, and the recording. It may be realized by any combination of media.
本発明の一態様に係る環境制御システム及び環境制御方法は、ユーザを効果的に覚醒させることができる。 The environment control system and the environment control method according to an aspect of the present invention can effectively awaken a user.
以下、実施の形態について、図面を参照しながら説明する。なお、以下で説明する実施の形態は、いずれも包括的又は具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置、接続形態、ステップ、及び、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、独立請求項に記載されていない構成要素については、任意の構成要素として説明される。 Hereinafter, embodiments will be described with reference to the drawings. It should be noted that each of the embodiments described below shows a comprehensive or specific example. Numerical values, shapes, materials, constituent elements, arrangement positions of constituent elements, connection forms, steps, order of steps, and the like shown in the following embodiments are examples, and are not intended to limit the present invention. Further, among the constituent elements in the following embodiments, constituent elements not described in independent claims are described as arbitrary constituent elements.
なお、各図は模式図であり、必ずしも厳密に図示されたものではない。また、各図において、実質的に同一の構成に対しては同一の符号を付しており、重複する説明は省略又は簡略化される場合がある。 It should be noted that each drawing is a schematic diagram and is not necessarily strictly illustrated. Further, in each drawing, the substantially same configurations are denoted by the same reference numerals, and overlapping description may be omitted or simplified.
また、本明細書において、数値、および、数値範囲は、厳格な意味のみを表す表現ではなく、実質的に同等な範囲、例えば数%程度の差異をも含むことを意味する表現である。 Further, in the present specification, numerical values and numerical ranges are expressions that represent not only a strict meaning but also substantially equivalent ranges, for example, including a difference of about several percent.
(実施の形態1)
[概要]
以下、実施の形態1に係る環境制御システムについて説明する。図1は、実施の形態1に係る環境制御システムの機能構成を示すブロック図である。実施の形態1に係る環境制御システム10は、ユーザが睡眠中に当該ユーザを覚醒させるための覚醒支援システムである。環境制御システム10は、例えば、照明機器などの光を出力する機器を用いてユーザを覚醒させる覚醒制御を行う。図2は、覚醒制御の概要を説明するための図である。
(Embodiment 1)
[Overview]
Hereinafter, the environment control system according to the first embodiment will be described. FIG. 1 is a block diagram showing the functional configuration of the environment control system according to the first embodiment. The
図2に示されるように、覚醒制御は、例えば、対象期間の開始時刻から対象期間の終了時刻にかけて照明機器が発する光の明るさを徐々に増加させる制御である。これにより、環境制御システム10は、ユーザを快適に覚醒させることができる。
As shown in FIG. 2, the awakening control is, for example, control for gradually increasing the brightness of light emitted from the lighting device from the start time of the target period to the end time of the target period. Thereby, the
ここで、睡眠前または睡眠中のユーザの心身の状態を示す生理指標情報により、覚醒制御の制御内容(対象期間の長さ、最大明るさ、明るさの変化量、明るさの変化関数(つまり、明るさのカーブの形状)など)の最適値は異なると考えられる。したがって、覚醒制御の制御内容がユーザの心身の状態にかかわらず固定されると、ユーザ快適に覚醒させる効果が減少する可能性がある。 Here, the control content of the awakening control (the length of the target period, the maximum brightness, the amount of change in brightness, the change function of brightness (that is, the following) is defined by the physiological index information indicating the physical and mental state of the user before or during sleep. , The shape of the brightness curve) etc.) is considered to be different. Therefore, if the control content of the awakening control is fixed regardless of the state of mind and body of the user, the effect of awakening the user comfortably may decrease.
そこで、環境制御システム10は、あらかじめ機械学習によって構築された学習器100aを有する。学習器100aに生理指標情報が入力情報として与えられると、学習器100aは、最適と考えられる覚醒制御の制御内容を出力する。これにより、環境制御システム10は、ユーザを効果的に(つまり、快適に)覚醒させることができる。
Therefore, the
なお、図2に示される、環境制御システム10は、睡眠導入期間または睡眠期間に、ユーザを快適に眠らせるための睡眠制御を行うこともできる。睡眠導入期間において行われる制御は、光ゆらぎ制御とも記載される。後述のように、睡眠制御における制御内容は、学習器100aに覚醒制御の制御内容を出力させるための入力情報として使用される。
The
なお、ここでの睡眠には、仮眠が含まれる。仮眠とは、短時間の睡眠であり、例えば、作業の途中で当該作業を中断して行われる睡眠であり、日中に活動している人が夜にとる長時間の睡眠(以下、本睡眠とも記載される)より浅い睡眠である。図1に示されるように、環境制御システム10は、具体的には、制御装置100と、センサ200と、入力装置300と、環境制御機器400とを備える。以下、これらの各装置について詳細に説明する。
Note that the sleep here includes a nap. A nap is a short sleep, for example, a sleep performed by interrupting the work in the middle of a work, and a long sleep (hereinafter referred to as main sleep) taken by a person who is active during the day at night. Also described)) is a lighter sleep. As shown in FIG. 1, the
[センサ]
センサ200は、ユーザの心身の状態を検出し、検出したユーザの心身の状態を示す生理指標情報を制御装置100に出力する。このようなセンサ200は、例えば、心拍計、カメラ、体温計、脳波計、唾液センサ、発汗センサ、呼吸センサ、体動センサ、血流センサなどである。このような生理指標情報を制御装置100に出力するセンサ200のそれぞれは、ユーザに接触する接触型のセンサであってもよいし、非接触型のセンサであってもよい。
[Sensor]
The
また、センサ200には、ユーザの行動を検出し、検出したユーザの行動を直接的または間接的に示す行動指標情報を制御装置100に出力するセンサが含まれてもよい。このようなセンサ200は、例えば、ユーザのタイプスピード、または、ユーザのマウスクリック数を検出するユーザインタフェースシステム、ユーザの離席状態(離席頻度及び離席回数)を検出するためにユーザが座る椅子に設けられた圧力センサなどである。センサ200は、ユーザの会話数または状態を検出する音声認識システム、ユーザの睡眠時間、睡眠の質、または、起床時刻・就寝時刻を検出するバイタルセンサ(具体的には、睡眠計または脳波計など)であってもよい。ユーザの睡眠時間、睡眠の質、または、起床時刻・就寝時刻は、スマートフォンなどの携帯端末のアプリケーションが実行されることで検出されてもよいし、専用のウェアラブル端末によって検出されてもよい。
Further, the
また、センサ200には、ユーザの周囲の環境情報を検出し、検出した環境情報を制御装置100に出力するセンサが含まれてもよい。このようなセンサ200は、例えば、日射量センサ、受光量センサ、温度センサ、においセンサ、マイクロフォン、CO2濃度センサなどである。なお、環境制御システム10が備えるセンサ200の数は特に限定されない。
Further, the
[入力装置]
入力装置300は、ユーザが情報を制御装置100へ入力するための操作を受け付けるユーザインターフェース装置である。入力装置300は、例えば、ユーザの操作に基づいて、行動指標情報(薬の摂取履歴、飲食履歴)、主観指標情報、スケジュール情報、及び、ユーザ情報などを制御装置100に出力する。
[Input device]
The
また、入力装置300は、ユーザの操作に基づいて、実行中または実行後の覚醒制御に対するユーザの評価情報を制御装置100に出力する。評価情報は、機械学習における報酬の算出に用いられる。
In addition, the
入力装置300は、例えば、スマートフォンまたはタブレット端末などの携帯端末であるが、スマートウォッチなどのウェアラブルデバイスであってもよい。また、入力装置300は、マイクロフォン、機械式のプッシュボタン、キーボード、またはマウスなどであってもよい。なお、環境制御システム10が備える入力装置300の数は特に限定されない。
The
[環境制御機器]
環境制御機器400は、ユーザの周囲の環境(光環境、空気環境、または温度環境など)を制御するための機器であり、覚醒制御において制御装置100によって制御される機器である。環境制御機器400は、具体的には、照明機器などの光を出力する機器(つまり、光によりユーザに刺激を与える機器)である。
[Environmental control equipment]
The
なお、環境制御システム10は、複数種類の照明機器を環境制御機器400として備えてもよい。図3は、複数種類の照明機器を示す図である。図3に示されるように、複数種類の照明機器には、例えば、ダウンライトなどの直接照明を行う照明機器と、コーブ照明及びコーニス照明などの間接照明を行う照明機器と、上側覚醒照明及び下側覚醒照明とが含まれる。覚醒制御において、これら複数種類の照明機器は、個別に制御されてもよいし、グループ化されてグループ単位で制御されてもよい。
The
なお、環境制御機器400は、照明機器以外の機器であって、ユーザを覚醒させるために環境を制御する他の機器を含んでもよい。環境制御機器400は、光以外に、映像、音、香り、振動、温湿度、気流、及び、触感などによりユーザに刺激を与える機器を含んでもよい。具体的には、環境制御機器400は、さらに、空調機器、空気清浄機、換気扇、扇風機または床暖房などを含んでいてもよい。また、環境制御機器400は、窓を開閉可能に覆う遮光設備(例えばブラインド及びカーテンなど)の開閉機器を含んでもよい。また、環境制御機器400は、映像機器、音響機器または映像音響機器を含んでもよい。また、環境制御機器400は、芳香器を含んでもよい。また、環境制御機器400は、マッサージ器を含んでもよい。
The
[制御装置]
次に、制御装置100について説明する。制御装置100は、生理指標情報を入力情報として取得し、取得した入力情報に基づいて、覚醒制御における環境制御機器400の制御内容を決定する。また、制御装置100は、決定した制御内容にしたがって環境制御機器400を制御するための制御信号を環境制御機器400に出力する。制御装置100は、例えば、マイクロコンピュータによって実現されるが、プロセッサなどによって実現されてもよい。
[Control device]
Next, the
制御装置100は、具体的には、第1取得部110と、決定部120と、制御部130と、第2取得部150と、報酬算出部160と、報酬条件設定部170と、更新部180と、記憶部190とを備える。これらの構成要素のうち制御部130以外の構成要素は、学習器100aを構成する。報酬算出部160、報酬条件設定部170、更新部180、及び、記憶部190は、学習部100bを構成する。
Specifically, the
第1取得部110は、ユーザの生理指標情報を含む入力情報を取得する。
The
決定部120は、制御内容決定ルールに従って、入力情報からユーザを覚醒させるための制御内容を決定する。決定部120は、具体的には、ユーザを覚醒させるための覚醒制御において制御される環境制御機器400の制御内容を決定する。制御内容決定ルールは、記憶部190に記憶されている。
The determination unit 120 determines the control content for awakening the user from the input information according to the control content determination rule. The determination unit 120 specifically determines the control content of the
制御部130は、決定部120によって決定された制御内容に基づいて環境制御機器400を制御する。具体的には、制御部130は、制御内容に対応する制御信号を環境制御機器400に出力する。
The
第2取得部150は、覚醒制御に対するユーザの評価を示す評価情報を取得する。評価情報は、制御部130によって実行された制御に対する評価を示す情報を含み、例えば、覚醒制御後に入力装置300を介してユーザから入力された情報を含む。第2取得部150は、入力装置300によって出力される情報を評価情報として取得するが、センサ200によって出力される情報を評価情報として取得してもよい。
The
報酬算出部160は、第2取得部150が取得した評価情報に基づいて報酬を算出する。報酬を算出する処理の詳細については後述される。
The
報酬条件設定部170は、報酬算出部160における報酬の算出における条件を設定する。後述のように、条件は、例えば、重み係数である。条件は、予め記憶部190に記憶されていてもよいし、条件が固定される場合、報酬条件設定部170は、設けられなくてもよい。
The reward
更新部180は、第2取得部150が取得した評価情報に基づく値を報酬として用いる機械学習によって制御内容決定ルールを更新する。
The
記憶部190は、制御内容決定ルール、環境制御システム10の利用履歴情報、入力装置300によって出力されたユーザのスケジュール情報などが記憶される記憶装置である。記憶部190は、例えば、半導体メモリによって実現される。
The
[覚醒制御時の動作]
次に、制御装置100の覚醒制御時の動作について説明する。図4は、制御装置100の覚醒制御時の動作のフローチャートである。
[Operation during awakening control]
Next, the operation of the
まず、第1取得部110は、ユーザの生理指標情報を含む入力情報を取得する(S110)。図5は、入力情報として使用することができる生理指標情報を示す図である。図5に示されるように、生理指標情報には、心拍(脈波)、瞬目・視線、眼球運動、瞳孔変動、皮膚温度(末梢、鼻、額)、表情(感情)、脳波、唾液、頭部の動き、発汗(通常発汗、精神性発汗)、呼吸、体動、血流(脳・末梢)などが含まれる。なお、生理指標情報として使用される心拍には、心拍数だけでなく、心拍変動の周波数成分LF、HF、HF/LFなどが含まれる。生理指標情報には、これらの項目の経時変化を示す情報(時間情報)が含まれてもよい。
First, the
第1取得部110は、これらの生理指標情報のうちの少なくとも1つを入力情報として取得する。第1取得部110は、例えば、センサ200から生理指標情報を取得するが、入力装置300から生理指標情報を取得してもよいし、記憶部190に記憶された生理指標情報を取得してもよい。
The
次に、決定部120は、記憶部190に記憶された制御内容決定ルールに従って、入力情報から、ユーザを覚醒させるため覚醒制御の制御内容であって、光を出力する機器を含む環境制御機器400の制御内容を決定する(S120)。
Next, according to the control content determination rule stored in the
制御内容決定ルールは、例えば、制御内容の価値を決定する行動価値関数で表される。行動価値関数は、価値関数の一例である。決定部120は、例えば、行動価値関数を用いて、入力情報から報酬が最も高くなると推定される制御内容(例えば、覚醒効果に対する最大限の報酬が得られる制御内容)を当該入力情報に対する制御内容であると決定する。 The control content determination rule is represented by, for example, an action value function that determines the value of the control content. The action value function is an example of a value function. The determination unit 120 uses, for example, the action value function to determine the control content for which the reward is estimated to be the highest from the input information (for example, the control content for which the maximum reward for the arousal effect is obtained) as the control content for the input information. To determine that.
報酬が最も高くなる制御内容は、ユーザごとに異なる場合がある。そこで、環境制御システム10が複数のユーザによって共用される場合、決定部120は、ユーザごとに異なる制御内容決定ルールに従って、制御内容に対する当該ユーザの報酬を算出してもよい。
The control content with the highest reward may differ for each user. Therefore, when the
覚醒制御の制御内容には、図6に示されるような制御パラメータが含まれる。図6は、覚醒制御の制御パラメータを説明するための図である。図6の縦軸は、照明機器が発する光の明るさを示し、図6の横軸は、時間を示す。 The control content of the awakening control includes control parameters as shown in FIG. FIG. 6 is a diagram for explaining control parameters for awakening control. The vertical axis of FIG. 6 represents the brightness of light emitted by the lighting device, and the horizontal axis of FIG. 6 represents time.
覚醒制御は、対象期間の開始時刻から対象期間の終了時刻にかけて照明機器が発する光の明るさを徐々に増加させた後、一定にする制御である。これにより、環境制御システム10は、ユーザを快適に覚醒させることができる。このとき、決定部120によって決定される制御パラメータとしては、(a)対象期間の長さ、(b)最大明るさ、(c)最大明るさに到達するまでの所要時間、(d)最大明るさが維持される時間、及び、(e)最大明るさに到達するまでの明るさのカーブの形状、が例示される。カーブの形状には、直線状、上に凸状、下に凸状などの形状が含まれる。
The awakening control is a control in which the brightness of the light emitted from the lighting device is gradually increased from the start time of the target period to the end time of the target period and then kept constant. Thereby, the
なお、覚醒制御においては、明るさに代えて、または、明るさに加えて発光色(照明機器が発する光の色度)が変更されてもよい。発光色が変更される場合、図6の縦軸は、発光色と読み代えられる。図7は、覚醒制御における発光色の変更を説明するための色度図である。 In the awakening control, the emission color (chromaticity of light emitted by the lighting device) may be changed instead of or in addition to the brightness. When the emission color is changed, the vertical axis in FIG. 6 is replaced with the emission color. FIG. 7 is a chromaticity diagram for explaining the change of the emission color in the awakening control.
例えば、図7に示される色度図上のb点からa点まで色度を変化させる場合、決定部120によって決定される制御パラメータとしては、(a)対象期間の長さ、(b)a点の色度、(c)色度がb点からa点に到達するまでの所要時間、(d)a点の色度が維持される時間、及び、(e)a点の色度に到達するまでの色度のカーブの形状、が例示される。カーブの形状には、直線状、上に凸状、及び、下に凸状などの形状が含まれる。 For example, when changing the chromaticity from point b to point a on the chromaticity diagram shown in FIG. 7, the control parameters determined by the determination unit 120 include (a) the length of the target period and (b) a. Chromaticity of point, (c) time required for chromaticity to reach from point b to point a, (d) time to maintain chromaticity of point a, and (e) reach chromaticity of point a The shape of the chromaticity curve up to the above is exemplified. The shape of the curve includes a linear shape, an upward convex shape, and a downward convex shape.
また、覚醒制御においては、照明機器に加えて空調機器が制御されてもよい。空調機器を制御対象とした覚醒制御は、対象期間の開始時刻から対象期間の終了時刻にかけて空調機器が発する気流の強さを徐々に増加させた後一定にする制御である。つまり、図6の縦軸は、気流の強さと読み代えられる。 In the awakening control, the air conditioner may be controlled in addition to the lighting device. The awakening control targeting the air conditioner is a control in which the strength of the airflow generated by the air conditioner is gradually increased and then made constant from the start time of the target period to the end time of the target period. That is, the vertical axis in FIG. 6 is replaced with the strength of the airflow.
この場合、決定部120によって決定される制御パラメータとしては、(a)対象期間の長さ、(b)最大気流、(c)最大気流に到達するまでの所要時間、(d)最大気流が維持される時間、及び、(e)最大気流に到達するまでの気流の強さのカーブの形状、が例示される。カーブの形状には、直線状、上に凸状、下に凸状などの形状が含まれる。 In this case, (a) the length of the target period, (b) the maximum airflow, (c) the time required to reach the maximum airflow, and (d) the maximum airflow are maintained as the control parameters determined by the determination unit 120. And the shape of the curve of the strength of the airflow until reaching the maximum airflow (e). The shape of the curve includes a linear shape, an upward convex shape, a downward convex shape, and the like.
ステップS120の後、制御部130は、決定された制御内容に基づいて環境制御機器400の制御(つまり、覚醒制御)を実行する(S130)。制御部130は、具体的には、制御内容に対応する制御信号を環境制御機器400に出力する。
After step S120, the
次に、第2取得部150は、ステップS130において実行された覚醒制御に対するユーザの評価を示す評価情報を取得する(S140)。第2取得部150は、入力装置300によって出力される情報を評価情報として取得するが、センサ200によって出力される情報を評価情報として取得してもよい。
Next, the
次に、報酬算出部160は、ステップS140において取得された評価情報に基づいて報酬を算出する(S150)。報酬の算出動作の詳細については後述される。なお、ステップS150の評価情報の取得は、覚醒制御後に行われるが、覚醒制御中に行われてもよい。
Next, the
次に、更新部180は、報酬算出部160によって算出された報酬を用いて機械学習によって制御内容決定ルールを更新する(S160)。更新部180は、報酬算出部160によって算出された報酬に基づく強化学習により、ユーザに適応した制御内容(すなわち、当該ユーザにおける報酬が最も多く得られる制御内容)の決定を学習する。上述のように、実施の形態1では、更新部180は、行動価値関数を更新することで、制御内容決定ルールを更新する。
Next, the updating
以下、行動価値関数の更新方法について説明する。強化学習の代表的な手法としては、Q学習やTD学習が知られている。以下、Q学習を例に説明する。Q学習は、入力情報が示すユーザの状態sの下で、制御内容aを選択する価値Q(s、a)を学習する方法であって、ある状態sのとき、価値Q(s、a)の最も高い制御内容aを最適な制御内容として選択する。学習器100a(更新部180)は、ある状態sの下で様々な制御内容aを選択し、そのときの制御内容aに対して報酬が与えられる。それにより、学習器100aは、よりよい制御内容の選択、すなわち正しい価値Q(s、a)を学習していく。このような価値Q(s、a)の更新式は、例えば、式1により表すことができる。
Hereinafter, a method of updating the action value function will be described. Q learning and TD learning are known as typical methods of reinforcement learning. Hereinafter, Q learning will be described as an example. Q-learning is a method of learning the value Q(s, a) of selecting the control content a under the user's state s indicated by the input information, and in a certain state s, the value Q(s, a) The highest control content a is selected as the optimum control content. The
ここで、stは、時刻tにおける状態を表し、atは、時刻tにおける制御内容を表す。制御内容atにより、状態はst+1に変化する。rt+1は、その状態の変化により得られる報酬を表している。また、maxの付いた項は、状態st+1の下で、そのときに分かっている最もQ値の高い制御内容at+1を選択した場合のQ値にγを乗じたものになる。ここで、γは、0<γ≦1のパラメータで、割引率と呼ばれる。また、αは、学習係数で、0<α≦1の範囲とする。 Here, it s t represents a state at time t, a t represents the control content at time t. The state changes to s t+1 depending on the control content a t . r t+1 represents the reward obtained by changing the state. In addition, the term with max is the value obtained by multiplying γ by the Q value under the state s t+1 when the control content a t+1 having the highest Q value known at that time is selected. Here, γ is a parameter of 0<γ≦1 and is called a discount rate. Further, α is a learning coefficient, and is set in a range of 0<α≦1.
なお、上記手法は、強化学習の手法の一例である。強化学習には、ニューラルネットワークを用いた手法、強化学習にディープラーニングを組み合わせた手法など、既存のどのような手法が用いられてもよい。 The above method is an example of the method of reinforcement learning. For the reinforcement learning, any existing method such as a method using a neural network or a method combining deep learning with the reinforcement learning may be used.
[報酬の算出動作]
次に、上記ステップS150の報酬の算出動作の詳細について説明する。図8は、報酬の算出動作のフローチャートである。
[Reward calculation operation]
Next, details of the reward calculating operation in step S150 will be described. FIG. 8 is a flowchart of the reward calculation operation.
まず、報酬算出部160は、快適感に対する個別報酬Faを決定する(S210)。報酬算出部160は、例えば、入力装置300によって出力されるユーザの主観評価結果を示す主観指標情報を評価情報として個別報酬Faを決定するが、センサ200として用いられる心拍計によって検出されるユーザの心拍数を評価情報として個別報酬Faを決定してもよい。この場合、主観指標情報または心拍数が示す快適感が高いほど、個別報酬Faの値は大きくなる。
First, the
次に、報酬算出部160は、リフレッシュ感に対する個別報酬Fbを決定する(S220)。報酬算出部160は、例えば、入力装置300によって出力されるユーザの主観指標情報を評価情報として個別報酬Fbを決定する。この場合、主観指標情報が示す快適感が高いほど、個別報酬Fbの値は大きくなる。
Next, the
次に、報酬算出部160は、ユーザのモチベーションに対する個別報酬Fcを決定する(S230)。報酬算出部160は、例えば、入力装置300によって出力されるユーザの主観指標情報を評価情報として個別報酬Fcを決定するが、センサ200として用いられるユーザインタフェースシステムによって検出されるユーザのタイプスピードを評価情報として個別報酬Fcを決定してもよい。この場合、主観指標情報が示すモチベーションの向上度合いが高いほど、個別報酬Fcの値は大きくなり、タイプスピードが速いほど、個別報酬Fcの値は大きくなる。
Next, the
次に、報酬算出部160は、眠気レベルに対する個別報酬Fdを決定する(S240)。報酬算出部160は、例えば、入力装置300によって出力されるユーザの主観指標情報を評価情報として個別報酬Fdを決定するが、センサ200として用いられるカメラによって検出される、所定期間におけるユーザの瞬目の回数を評価情報として個別報酬Fdを決定してもよい。この場合、主観指標情報が示す眠気レベルの低減度合いが高いほど、個別報酬Fdの値は大きくなり、入眠前における瞬目の回数よりも覚醒後における瞬目の回数が少ないほど、個別報酬Fdの値は大きくなる。
Next, the
次に、報酬算出部160は、覚醒後の集中レベルの向上に対する個別報酬Feを決定する(S250)。報酬算出部160は、例えば、入力装置300によって出力されるユーザの主観指標情報を評価情報として個別報酬Feを決定するが、センサ200として用いられるユーザインタフェースシステムによって検出されるユーザのタイプスピードを評価情報として個別報酬Feを決定してもよい。この場合、主観指標情報が示すモチベーションの向上度合いが高いほど、個別報酬Feの値は大きくなり、タイプスピードが速いほど、個別報酬Feの値は大きくなる。
Next, the
そして、報酬算出部160は、ステップS210〜S250で決定した個別報酬Fa〜Feに基づいて、制御内容に対する報酬Fを決定する(S260)。このとき、報酬算出部160は、個別報酬Fa〜Feを重み付け加算することで報酬Fを算出してもよい。例えば、報酬算出部160は、式2に基づいて報酬Fを算出してもよい。
Then, the
F=w1×Fa+w2×Fb+w3×Fc+w4×Fd+w5×Fe ・・(式2) F=w1×Fa+w2×Fb+w3×Fc+w4×Fd+w5×Fe (Equation 2)
w1〜w5は、報酬条件設定部170が設定した項目それぞれの重みであり、報酬条件の一例である。つまり、報酬条件設定部170は、報酬算出部160が重み付け加算するときの重みw1〜w5を設定する。
w1 to w5 are weights of the items set by the reward
なお、報酬条件設定部170は、ユーザが覚醒するときの天気、季節及び時間帯の少なくとも1つに応じて、条件(例えば、重み)を変更してもよい。例えば、天気、季節及び時間帯が第1取得部110によって取得された入力情報に含まれている場合、報酬条件設定部170は、第1取得部110から天気、季節及び時間帯に関する情報を取得することができる。また、報酬条件設定部170は、制御装置100が備える、現在時刻を計測する汎用のタイマIC(タイマ回路)、又は、リアルタイムクロックICなどから季節及び時間帯に関する情報を取得してもよい。
Note that the reward
以上、報酬の算出動作について説明したが、このような報酬の算出動作は一例である。例えば、個別報酬を決定するための項目(快適感、リフレッシュ感、モチベーション、眠気レベル、及び、集中レベル)は、一例であり、報酬は、少なくとも1つの項目について個別報酬が決定されることにより算出されればよい。また、報酬の算出において、その他の項目について個別報酬が決定されてもよい。図9は、報酬の算出に用いることが可能な項目を示す図である。 Although the reward calculating operation has been described above, such a reward calculating operation is an example. For example, the items for determining individual rewards (comfort, refreshment, motivation, drowsiness level, and concentration level) are examples, and the reward is calculated by determining individual rewards for at least one item. It should be done. Further, in the calculation of the reward, the individual reward may be determined for other items. FIG. 9 is a diagram showing items that can be used to calculate a reward.
また、上記報酬の算出動作においては、個別報酬を決定するために、主観評価結果を示す情報、行動指標情報(タイプスピード)、または、生理指標情報(心拍数、及び、瞬目)が評価情報として用いられた。ここで、報酬の算出動作においては、その他の生理指標情報を用いて個別報酬が決定されてもよい。図10は、個別報酬を決定するための項目と、当該個別報酬を決定するために使用できる生理指標情報との関係を示す図である。 In the reward calculation operation, information indicating subjective evaluation results, behavior index information (type speed), or physiological index information (heart rate and blink) is used to determine individual rewards. Was used as. Here, in the operation of calculating the reward, the individual reward may be determined using other physiological index information. FIG. 10: is a figure which shows the relationship between the item for determining individual reward, and the physiological index information which can be used for determining the said individual reward.
なお、図10に示されるように、個別報酬を決定するための項目には、覚醒制御中のユーザの状態を示す項目と、覚醒後のユーザの状態を示す項目とが含まれる。また、個別報酬を決定するための項目には、入眠前及び覚醒後の生理指標情報の変化に基づいて定められる項目が含まれる。このように、個別報酬は、覚醒制御中または覚醒後のユーザの状態に基づいて絶対的に決定されてもよいし、入眠前及び覚醒後の生理指標情報の変化に基づいて相対的に決定されてもよい。 As shown in FIG. 10, the items for determining the individual reward include an item indicating the state of the user during awakening control and an item indicating the state of the user after awakening. The items for determining the individual reward include items determined based on changes in physiological index information before falling asleep and after waking up. As described above, the individual reward may be absolutely determined based on the state of the user during or after awakening control, or may be relatively determined based on changes in physiological index information before falling asleep and after awakening. May be.
[その他の入力情報1]
入力情報は、生理指標情報に限定されない。以下、上記図5を参照しながらその他の入力情報について説明する。
[Other input information 1]
The input information is not limited to the physiological index information. Hereinafter, other input information will be described with reference to FIG.
第1取得部110は、ユーザの行動を示す行動指標情報を入力情報として取得してもよい。行動指標情報には、ユーザがキーボードを操作するタイプスピード、睡眠時間・睡眠の質・起床時間・就寝時間、マウスクリック数、離席頻度・離席回数、会話数・会話の状態、休憩時間、薬の摂取履歴、飲食履歴などが含まれる。行動指標情報には、これらの項目の経時変化を示す情報(時間情報)が含まれてもよい。行動指標情報は、例えば、センサ200から取得されるが、入力装置300から取得されてもよい。
The
また、第1取得部110は、主観指標情報を入力情報として取得してもよい。主観指標情報には、眠気、やる気、体調・身体疲労、ストレス、集中力、パフォーマンス、緊張・リラックス度合、イライラ度合・怒り・悲しさなどが含まれる。主観指標情報には、これらの項目の経時変化を示す情報(時間情報)が含まれてもよい。主観指標情報は、例えば、入力装置300から取得される。
In addition, the
また、第1取得部110は、ユーザのスケジュールを示すスケジュール情報を入力情報として取得してもよい。スケジュール情報には、利用日・利用前日・翌日の活動予定(会議など)、作業状態(取り込み中、離席中、打合わせ中など)利用日が属する季節、利用時間帯などが含まれる。スケジュール情報は、例えば、入力装置300から取得される。
The
また、第1取得部110は、ユーザの環境制御システム10(覚醒制御)の利用履歴情報を入力情報として取得してもよい。利用履歴情報には、利用時間・時刻、曜日、タイミング、入力情報、出力情報、報酬などが含まれる。利用履歴情報は、例えば、記憶部190から取得される。つまり、利用履歴情報は、記憶部190に記憶される。
The
また、第1取得部110は、ユーザの周囲の環境情報を入力情報として取得してもよい。環境情報には、天気(日射量)、受光量(つまり、光環境情報)、季節・時間帯、環境温度、湿度、におい、音環境、CO2濃度などが含まれる。
In addition, the
また、第1取得部110は、ユーザ情報を入力情報として取得してもよい。ユーザ情報には、性別、年齢、人種、出身地、職種、体質(光過敏など)、病歴(不眠症等を含む)などが含まれる。ユーザ情報は、例えば、入力装置300から取得される。
The
[その他の入力情報2]
第1取得部110は、睡眠制御における制御パラメータを入力情報として取得してもよい。第1取得部110は、具体的には、これから行う覚醒制御よりも前(例えば、直前)の睡眠導入期間(または睡眠期間)に行われていた睡眠制御における制御パラメータを入力情報として取得してもよい。以下、睡眠制御の制御パラメータについて説明する。図11及び図12は、睡眠制御の制御パラメータを説明するための図である。図11及び図12の縦軸は、照明機器が発する光の明るさを示し、図11及び図12の横軸は、時間を示す。
[Other input information 2]
The
なお、以下では、リラックス期間、睡眠導入期間、及び、睡眠期間のうち、主に睡眠導入期間の制御内容(言い換えれば、光ゆらぎ制御の制御内容)について説明する。 In the following, among the relaxation period, the sleep induction period, and the sleep period, the control content of the sleep induction period (in other words, the control content of the light fluctuation control) will be described.
図11に示されるように、睡眠制御の制御パラメータには、睡眠導入期間全体の長さ、最大明るさ及び最小明るさ、明るさを上げる上昇所要時間、最大明るさが維持される時間、明るさを下げる下降所要時間、最小明るさが維持される時間、周期、明るさを上げるときの変化の仕方(例えば、傾き)を示す上昇カーブ、及び、明るさを下げるときの変化の仕方(例えば、傾き)を示す下降カーブが含まれる。なお、最大明るさ及び最小明るさは、明るさを周期的に変化させるときの明るさの最大値及び最小値を意味する。 As shown in FIG. 11, the control parameters for sleep control include the length of the entire sleep induction period, the maximum brightness and the minimum brightness, the rising time required to raise the brightness, the time for which the maximum brightness is maintained, and the brightness. Required time for lowering the brightness, time required to maintain the minimum brightness, cycle, rising curve showing how to change when increasing brightness (for example, slope), and how to change when decreasing brightness (for example, , Slope) is included. The maximum brightness and the minimum brightness mean the maximum value and the minimum value of the brightness when the brightness is changed periodically.
また、最大明るさ、最小明るさ、各種時間、及び、各種カーブの少なくとも1つは、時間の経過とともに変化してもよい。図12では、最大明るさが時間の経過とともに変化する例を示している。 Further, at least one of the maximum brightness, the minimum brightness, various times, and various curves may change with the passage of time. FIG. 12 shows an example in which the maximum brightness changes with the passage of time.
図12に示されるように、睡眠制御の制御パラメータには、さらに、最大明るさの変化を開始する変化開始時間、最大明るさの変化を終了する変化終了期間、最大明るさの変化の仕方を示す変化カーブ、及び、変化後の最大明るさを示す変化目標値が含まれてもよい。 As shown in FIG. 12, the sleep control parameters further include a change start time at which a change in maximum brightness starts, a change end period at which a change in maximum brightness ends, and a method of changing maximum brightness. A change curve shown and a change target value showing the maximum brightness after the change may be included.
なお、睡眠制御においては、明るさに代えて、または、明るさに加えて発光色(照明機器が発する光の色度)が変更される場合がある。発光色が変更される場合、睡眠制御の制御パラメータには、上記明るさに関する制御パラメータに加えて、発光色に関する制御パラメータが含まれてもよい。例えば、図7に示される色度図上のb点からa点まで発光色を変化させる場合、睡眠制御の制御パラメータには、a点の色度及びb点の色度、a点の色度に到達するまでの時間、a点の色度が維持される時間、b点の色度に到達するまでの時間、b点の色度が維持される時間、周期、a点の色度に到達するまでカーブの形状、及び、b点の色度に到達するまでのカーブの形状が含まれる。 Note that in sleep control, the emission color (chromaticity of light emitted by the lighting device) may be changed instead of or in addition to the brightness. When the emission color is changed, the control parameters for sleep control may include a control parameter for the emission color in addition to the control parameter for the brightness. For example, when changing the emission color from point b to point a on the chromaticity diagram shown in FIG. 7, the control parameters for sleep control include chromaticity at point a, chromaticity at point b, and chromaticity at point a. Time, the chromaticity at point a is maintained, the chromaticity at point b is reached, the chromaticity at point b is maintained, the cycle, the chromaticity at point a is reached. The shape of the curve until reaching the point and the shape of the curve until reaching the chromaticity at point b are included.
また、この場合も、a点の色度、b点の色度、各種期間、及び、各種カーブの少なくとも1つは、時間の経過とともに変化してもよい。例えば、a点の色度が時間の経過とともに変化する場合、睡眠制御の制御パラメータには、a点の色度が変化を開始する変化開始時間、a点の色度の変化を終了する変化終了期間、a点の色度の変化の仕方を示す変化カーブ、及び、変化後のa点の色度を示す変化目標値が含まれてもよい。 Also in this case, at least one of the chromaticity at point a, the chromaticity at point b, various periods, and various curves may change over time. For example, when the chromaticity at the point a changes with time, the sleep control parameters include a change start time at which the chromaticity at the point a starts to change, and a change end to end the change in the chromaticity at the point a. A period, a change curve indicating how the chromaticity at the point a changes, and a change target value indicating the chromaticity at the point a after the change may be included.
[変形例1]
上述のように、第2取得部150は、覚醒制御の実行中に評価情報を取得することができる。そうすると、報酬算出部160は、取得された評価情報に基づいて、覚醒制御の実行中に報酬を算出することができ、更新部180は、覚醒制御の実行中に、算出された報酬に基づいて制御内容決定ルール(行動価値関数)を更新することができる。この結果、決定部120は、覚醒制御の実行中に、制御内容を変更する(つまり、制御内容を決定しなおす)ことができる。
[Modification 1]
As described above, the
このように、覚醒制御の実行中に制御内容が決定しなおされれば、環境制御システム10は、そのときのユーザの状態に対してより適切な制御内容を決定することができるので、ユーザを効果的に覚醒させることができる。
In this way, if the control content is re-determined during the execution of the awakening control, the
[変形例2]
記憶部190は、決定部120によって過去に決定された制御内容を記憶してもよい。これにより、環境制御システム10は、何らかの原因で入力情報を取得できず制御内容の決定が不可能な場合に、記憶部190に記憶された制御内容を代替え使用することができる。なお、記憶部190に記憶される制御内容は、上述の利用履歴情報の一部として記憶されてもよいし、単独で記憶されてもよい。記憶部190は、例えば、制御内容を、当該制御内容を決定するために使用された入力情報と対応付けて記憶してもよいし、制御内容を、当該制御内容を決定するために使用された入力情報と対応付けずに記憶してもよい。
[Modification 2]
The
[効果など]
以上説明したように、環境制御システム10は、ユーザの生理指標情報を含む入力情報を取得する第1取得部110と、制御内容決定ルールに従って、入力情報から、ユーザを覚醒させるための制御内容であって、光を出力する機器を含む環境制御機器400の制御内容を決定する決定部120と、決定された制御内容に基づいて環境制御機器400の制御を実行する制御部130と、実行された制御に対するユーザの評価を示す評価情報を取得する第2取得部150と、評価情報に基づく値を報酬として用いる機械学習によって制御内容決定ルールを更新する更新部180とを備える。
[Effects]
As described above, the
このような環境制御システム10は、生理指標情報及び評価情報に関連付けて学習した制御内容決定ルールに基づいて制御内容を決定することができる。したがって、環境制御システム10は、ユーザを効果的に覚醒させることができる。
The
また、例えば、制御内容決定ルールは、制御内容の価値を定める価値関数を含み、更新部180は、価値関数を更新する。
Further, for example, the control content determination rule includes a value function that determines the value of the control content, and the updating
このような環境制御システム10は、生理指標情報及び評価情報に関連付けて学習した価値関数に基づいて制御内容を決定することができる。
Such an
また、例えば、環境制御システム10は、さらに、評価情報に基づいて報酬を算出する報酬算出部160と、報酬算出部160における報酬の算出における条件を設定する報酬条件設定部170とを備える。
In addition, for example, the
このような環境制御システム10は、報酬条件設定部170によって設定された条件に応じて報酬を算出することができる。例えば、ユーザの好みに応じて条件が設定されれば、ユーザの好みに応じた制御内容が決定されやすくなる。
Such an
また、例えば、環境制御システム10は、さらに、決定部120によって決定された制御内容を記憶する記憶部190を備える。
Further, for example, the
このような環境制御システム10は、記憶部190に記憶されている制御内容(例えば、前回の制御内容)を読み出すことで、入力情報が取得できずに制御内容が決定できない場合であってもユーザを覚醒させるための制御を行うことができる。
Such an
また、例えば、更新部180は、上記制御内容で環境制御機器400を制御中に第2取得部150が取得した評価情報に基づいて、制御内容決定ルールを更新する。決定部120は、さらに、環境制御機器400を制御中に更新された制御内容決定ルールに従って入力情報に対する制御内容を制御中に決定しなおす。
In addition, for example, the
このような環境制御システム10は、制御中のユーザの状態に応じて制御内容決定ルールを更新し、制御内容を変更することができる。つまり、環境制御システム10は、制御中に学習することで、そのときのユーザの状態に対してより適切な制御内容を決定することができるので、さらにユーザを効果的に覚醒させることができる。
Such an
また、例えば、入力情報には、さらに、ユーザの行動指標情報、ユーザのスケジュール情報、ユーザの環境制御システム10の利用履歴情報、及び、環境情報の少なくとも1つが含まれる。
Further, for example, the input information further includes at least one of user action index information, user schedule information, usage history information of the user's
このような環境制御システム10は、行動指標情報、スケジュール情報、利用履歴情報、及び、環境情報の少なくとも1つを評価情報に関連付けて学習した制御内容決定ルールに基づいて制御内容を決定することができる。
Such an
また、例えば、制御部130は、さらに、環境制御機器400を用いてユーザを眠らせるための睡眠制御を実行することが可能であり、入力情報には、さらに、睡眠制御における制御パラメータが含まれる。
Further, for example, the
このような環境制御システム10は、睡眠制御における制御パラメータを評価情報に関連付けて学習した制御内容決定ルールに基づいて制御内容を決定することができる。
Such an
また、例えば、環境制御機器400には、光を出力する機器以外の他の機器が含まれる。決定部120は、上記他の機器を含む環境制御機器400の制御内容を決定する。
Further, for example, the
このような環境制御システム10は、光を出力する機器及びそれ以外の機器のそれぞれを用いて、ユーザを覚醒させるための制御を行うことができる。
Such an
また、例えば、上記他の機器は、空調機器である。 Further, for example, the other device is an air conditioner.
このような環境制御システム10は、光を出力する機器及び空調機器のそれぞれを用いて、ユーザを覚醒させるための制御を行うことができる。
Such an
また、例えば、ユーザを覚醒させるための制御内容は、対象期間において行われる光を出力する機器によって出力される光の明るさを増加させる覚醒制御における、(a)対象期間の長さ、(b)最大明るさ、(c)最大明るさに到達するまでの所要時間、(d)最大明るさが維持される時間、及び、(e)最大明るさに到達するまでの明るさのカーブの形状の少なくとも1つを含む。 In addition, for example, the control content for waking up the user is (a) the length of the target period in the awakening control for increasing the brightness of the light output by the device that outputs light performed in the target period, (b) ) Maximum brightness, (c) time required to reach maximum brightness, (d) time when maximum brightness is maintained, and (e) shape of curve of brightness until reaching maximum brightness At least one of
このような環境制御システム10は、覚醒制御における制御パラメータを制御内容として決定することができる。
Such an
また、環境制御システム10などのコンピュータが実行する環境制御方法は、ユーザの生理指標情報を含む入力情報を取得する第1取得ステップ(S110)と、制御内容決定ルールに従って、入力情報から、ユーザを覚醒させるための制御内容であって、光を出力する機器を含む環境制御機器400の制御内容を決定する決定ステップ(S120)と、決定された制御内容に基づいて環境制御機器400の制御を実行する制御ステップ(S130)と、実行された制御に対するユーザの評価を示す評価情報を取得する第2取得ステップ(S140)と、評価情報に基づく値を報酬として用いる機械学習によって制御内容決定ルールを更新する更新ステップ(S160)とを含む。
In addition, the environment control method executed by the computer such as the
このような環境制御システム10は、生理指標情報及び評価情報に関連付けて学習した制御内容決定ルールに基づいて制御内容を決定することができる。したがって、環境制御システム10は、ユーザを効果的に覚醒させることができる。
The
(実施の形態2)
[構成]
実施の形態2では、環境制御システムの他の構成について、図13を参照しながら説明する。図13は、実施の形態2に係る環境制御システムの機能構成を示すブロック図である。
(Embodiment 2)
[Constitution]
In the second embodiment, another configuration of the environment control system will be described with reference to FIG. FIG. 13 is a block diagram showing a functional configuration of the environment control system according to the second embodiment.
図13に示されるように、実施の形態2に係る環境制御システム10bは、複数の個別環境制御システム10cと、複数の個別環境制御システム10cのそれぞれ通信可能に接続されたサーバ装置500とを備える。
As shown in FIG. 13, the
複数の個別環境制御システム10cのそれぞれは、例えば、実施の形態1の環境制御システム10と同様の構成であるが、図13では第1取得部110及び記憶部190以外の構成の図示が省略されている。環境制御システム10bが備える複数の個別環境制御システム10cの数は、特に限定されない。
Each of the plurality of individual
サーバ装置500は、複数の個別環境制御システム10cのそれぞれから、第1取得部110が取得した入力情報、及び、記憶部190に記憶された学習結果(例えば、制御内容、報酬、及び、更新された行動価値関数)の少なくとも1つを取得し、集中管理する。サーバ装置500は、取得した情報を記憶部510に格納する。これにより、複数の個別環境制御システム10cのそれぞれの学習結果等を共有することができる。
The
なお、複数の個別環境制御システム10cのそれぞれが備える複数の制御装置100のうちの少なくとも1つの制御装置100がサーバ装置として機能してもよい。つまり、環境制御システム10bは、個別環境制御システム10cとは別にサーバ装置500を備えていなくてもよい。この場合、複数の個別環境制御システム10cのそれぞれは、互いに通信可能に接続されており、入力情報、評価情報及び学習結果の少なくとも一つを相互に通信する。そして、更新部180は、他の個別環境制御システム10cから取得した入力情報、及び、学習結果の少なくとも一つに基づいて、行動価値関数を更新する。
Note that at least one
[効果など]
以上説明したように、環境制御システム10bは、第1取得部110、決定部120、制御部130、第2取得部150、及び、更新部180を有する個別環境制御システム10cを複数備える。複数の個別環境制御システム10cのそれぞれは、互いに通信可能に接続されており、入力情報及び学習結果の少なくとも一つを相互に通信する。そして、更新部180は、他の個別環境制御システム10cから取得した入力情報及び学習結果の少なくとも一つに基づいて、制御内容決定ルールを更新する。
[Effects]
As described above, the
このような環境制御システム10bにおいて、更新部180は、他の個別環境制御システム10cが取得した入力情報等に基づいて、自装置の行動価値関数を更新することができる。よって、自装置における学習の精度が向上し、より適切な行動価値関数を得ることができる。
In such an
また、環境制御システム10bは、複数の個別環境制御システム10cと、複数の個別環境制御システム10cのそれぞれと通信可能に接続されたサーバ装置500とを備える。
The
このような環境制御システム10bは、入力情報、評価情報、及び、学習結果の少なくとも1つを集中管理することができる。また、サーバ装置500が学習部を備えている場合、複数の個別環境制御システム10cのそれぞれから取得した入力情報及び評価情報等に基づいて、機械学習によって行動価値関数を更新することが可能となる。それゆえ、学習の精度が向上し、さらに適切な行動価値関数を得ることができる。なお、この場合、サーバ装置500は、制御装置100より高速で処理が行えるプロセッサ等を備えているとよい。
Such an
(その他の実施の形態)
以上、実施の形態について説明したが、本発明は、上記実施の形態に限定されるものではない。
(Other embodiments)
Although the embodiments have been described above, the present invention is not limited to the above embodiments.
例えば、上記実施の形態において、環境制御システムは複数パターンの制御内容をユーザへの推薦パターンとして決定し、ユーザは入力装置を用いて複数パターンの制御内容の中から1つを選択してもよい。この場合、環境制御システムは、選択された制御内容の制御を実行する。 For example, in the above embodiment, the environment control system may determine a plurality of patterns of control content as a recommended pattern to the user, and the user may select one of the plurality of patterns of control content using the input device. .. In this case, the environmental control system executes control of the selected control content.
また、上記実施の形態では、覚醒制御における環境制御機器の制御内容を決定するために睡眠制御の制御パラメータ(つまり、制御内容)が入力情報として用いられる例について説明された。しかしながら、これとは逆に、睡眠制御における環境制御機器の制御内容を決定するために覚醒制御の制御パラメータ(つまり、制御内容)が入力情報として用いられてもよい。 Further, in the above-described embodiment, the example in which the control parameter (that is, the control content) of the sleep control is used as the input information to determine the control content of the environmental control device in the wakeup control has been described. However, conversely, a control parameter (that is, control content) of awakening control may be used as input information to determine the control content of the environment control device in sleep control.
また、上記実施の形態において、覚醒制御が行われる場所については特に限定されない。覚醒制御は、例えば、オフィスの仮眠室で行われるが、住宅、医療施設、または、介護施設などで行われてもよい。 Further, in the above embodiment, the place where the awakening control is performed is not particularly limited. Awakening control is performed, for example, in a nap room of an office, but may be performed in a house, a medical facility, a nursing facility, or the like.
また、上記実施の形態では、環境制御システムは複数の装置によって実現されたが、単一の装置として実現されてもよい。環境制御システムが複数の装置によって実現される場合に、上記実施の形態で説明された構成要素は、複数の装置にどのように振り分けられてもよい。また、環境制御システムは、クライアントサーバシステムとして実現されてもよい。 Further, in the above embodiment, the environment control system is realized by a plurality of devices, but may be realized as a single device. When the environment control system is implemented by a plurality of devices, the components described in the above embodiments may be distributed to the plurality of devices in any way. Further, the environment control system may be realized as a client server system.
また、上記実施の形態において装置間の通信方法については特に限定されるものではない。装置間で行われる通信は、例えば、特定小電力無線、ZigBee(登録商標)、Bluetooth(登録商標)、または、Wi−Fi(登録商標)などの通信規格を用いた無線通信であるが、有線通信であってもよい。また、装置間の通信においては、図示されない中継装置が介在してもよい。 Further, the communication method between the devices in the above embodiment is not particularly limited. The communication performed between the devices is wireless communication using a communication standard such as specific low power wireless communication, ZigBee (registered trademark), Bluetooth (registered trademark), or Wi-Fi (registered trademark). It may be communication. Further, a relay device (not shown) may intervene in the communication between the devices.
また、上記実施の形態において、特定の処理部が実行する処理を別の処理部が実行してもよい。また、複数の処理の順序が変更されてもよいし、複数の処理が並行して実行されてもよい。 Further, in the above-described embodiment, the processing executed by the specific processing unit may be executed by another processing unit. Further, the order of the plurality of processes may be changed, or the plurality of processes may be executed in parallel.
また、上記実施の形態において、各構成要素は、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。 Further, in the above-described embodiment, each component may be realized by executing a software program suitable for each component. Each component may be realized by a program execution unit such as a CPU or a processor reading and executing a software program recorded in a recording medium such as a hard disk or a semiconductor memory.
また、各構成要素は、ハードウェアによって実現されてもよい。例えば、各構成要素は、回路(または集積回路)でもよい。これらの回路は、全体として1つの回路を構成してもよいし、それぞれ別々の回路でもよい。また、これらの回路は、それぞれ、汎用的な回路でもよいし、専用の回路でもよい。 Further, each component may be realized by hardware. For example, each component may be a circuit (or integrated circuit). These circuits may constitute one circuit as a whole or may be separate circuits. Further, each of these circuits may be a general-purpose circuit or a dedicated circuit.
また、本発明の全般的または具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD−ROMなどの記録媒体で実現されてもよい。また、システム、装置、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。例えば、本発明は、上記実施の形態に係る制御装置として実現されてもよい。また、本発明は、上記実施の形態に係る環境制御方法をコンピュータに実行させるためのプログラムとして実現されてもよいし、このようなプログラムが記録されたコンピュータ読み取り可能な非一時的な記録媒体として実現されてもよい。 Further, the general or specific aspects of the present invention may be realized by a recording medium such as a system, a device, a method, an integrated circuit, a computer program, or a computer-readable CD-ROM. Further, the system, the device, the method, the integrated circuit, the computer program, and the recording medium may be implemented in any combination. For example, the present invention may be realized as the control device according to the above embodiment. Further, the present invention may be realized as a program for causing a computer to execute the environment control method according to the above-described embodiment, or as a computer-readable non-transitory recording medium in which such a program is recorded. May be realized.
その他、各実施の形態に対して当業者が思いつく各種変形を施して得られる形態、または、本発明の趣旨を逸脱しない範囲で各実施の形態における構成要素及び機能を任意に組み合わせることで実現される形態も本発明に含まれる。 In addition, it is realized by making various modifications to those embodiments by those skilled in the art, or by arbitrarily combining the components and functions of the embodiments without departing from the spirit of the present invention. The present invention also includes the forms.
10、10b 環境制御システム
10c 個別環境制御システム
110 第1取得部
120 決定部
130 制御部
150 第2取得部
160 報酬算出部
170 報酬条件設定部
180 更新部
190 記憶部
400 環境制御機器
500 サーバ装置
10, 10b
Claims (13)
制御内容決定ルールに従って、前記入力情報から、前記ユーザを覚醒させるための制御内容であって、光を出力する機器を含む環境制御機器の制御内容を決定する決定部と、
決定された前記制御内容に基づいて前記環境制御機器の制御を実行する制御部と、
実行された前記制御に対する前記ユーザの評価を示す評価情報を取得する第2取得部と、
前記評価情報に基づく値を報酬として用いる機械学習によって前記制御内容決定ルールを更新する更新部とを備える
環境制御システム。 A first acquisition unit for acquiring input information including user's physiological index information;
According to a control content determination rule, from the input information, a determination unit that determines the control content of the environmental control device that is a control content for awakening the user, and that includes a device that outputs light,
A control unit that executes control of the environment control device based on the determined control content;
A second acquisition unit that acquires evaluation information indicating the evaluation of the user for the executed control;
An environment control system comprising: an updating unit that updates the control content determination rule by machine learning using a value based on the evaluation information as a reward.
前記更新部は、前記価値関数を更新する
請求項1に記載の環境制御システム。 The control content determination rule includes a value function that determines the value of the control content,
The environment control system according to claim 1, wherein the updating unit updates the value function.
前記評価情報に基づいて前記報酬を算出する報酬算出部と、
前記報酬算出部における前記報酬の算出における条件を設定する報酬条件設定部とを備える
請求項1または2に記載の環境制御システム。 further,
A reward calculation unit that calculates the reward based on the evaluation information,
The environment control system according to claim 1, further comprising: a reward condition setting unit that sets a condition for calculating the reward in the reward calculating unit.
請求項1〜3のいずれか1項に記載の環境制御システム。 The environment control system according to claim 1, further comprising a storage unit that stores the control content determined by the determination unit.
前記決定部は、さらに、前記環境制御機器を制御中に更新された前記制御内容決定ルールに従って前記入力情報に対する制御内容を前記制御中に決定しなおす
請求項1〜4のいずれか1項に記載の環境制御システム。 The update unit updates the control content determination rule based on the evaluation information acquired by the second acquisition unit while controlling the environment control device with the control content,
The determination unit further determines the control content for the input information during the control again according to the control content determination rule updated while controlling the environment control device. Environmental control system.
請求項1〜5のいずれか1項に記載の環境制御システム。 The input information further includes at least one of behavior index information of the user, schedule information of the user, usage history information of the environment control system of the user, and environment information. The environment control system according to item 1.
前記入力情報には、さらに、前記睡眠制御における制御パラメータが含まれる
請求項1〜6のいずれか1項に記載の環境制御システム。 The control unit is further capable of executing sleep control for sleeping the user using the environment control device,
The environment control system according to claim 1, wherein the input information further includes a control parameter in the sleep control.
前記決定部は、前記他の機器を含む前記環境制御機器の前記制御内容を決定する
請求項1〜7のいずれか1項に記載の環境制御システム。 The environment control device further includes a device other than the device that outputs the light,
The environment control system according to claim 1, wherein the determination unit determines the control content of the environment control device including the other device.
請求項8に記載の環境制御システム。 The environment control system according to claim 8, wherein the other device is an air conditioner.
請求項1〜9のいずれか1項に記載の環境制御システム。 The control content for waking up the user is (a) the length of the target period and (b) the maximum in the control for increasing the brightness of the light output by the device that outputs the light performed in the target period. Brightness, (c) time required to reach the maximum brightness, (d) time when the maximum brightness is maintained, and (e) a curve of brightness until the maximum brightness is reached. The environmental control system according to claim 1, comprising at least one of shapes.
複数の個別環境制御システムのそれぞれは、互いに通信可能に接続されており、前記入力情報及び学習結果の少なくとも一つを相互に通信し、
前記更新部は、他の個別環境制御システムから取得した前記入力情報及び前記学習結果の少なくとも一つに基づいて、前記制御内容決定ルールを更新する
請求項1〜10のいずれか1項に記載の環境制御システム。 A plurality of individual environment control systems having the first acquisition unit, the determination unit, the control unit, the second acquisition unit, and the update unit,
Each of the plurality of individual environment control systems are communicably connected to each other, and mutually communicate at least one of the input information and the learning result,
The update unit updates the control content determination rule based on at least one of the input information and the learning result acquired from another individual environment control system. Environmental control system.
前記複数の個別環境制御システムのそれぞれと通信可能に接続されたサーバ装置とを備える
請求項11に記載の環境制御システム。 A plurality of individual environment control systems,
The environment control system according to claim 11, comprising a server device communicatively connected to each of the plurality of individual environment control systems.
制御内容決定ルールに従って、前記入力情報から、前記ユーザを覚醒させるための制御内容であって、光を出力する機器を含む環境制御機器の制御内容を決定する決定ステップと、
決定された前記制御内容に基づいて前記環境制御機器の制御を実行する制御ステップと、
実行された前記制御に対する前記ユーザの評価を示す評価情報を取得する第2取得ステップと、
前記評価情報に基づく値を報酬として用いる機械学習によって前記制御内容決定ルールを更新する更新ステップとを含む
環境制御方法。 A first acquisition step of acquiring input information including user's physiological index information;
In accordance with a control content determination rule, a determination step of determining the control content of the environmental control device including the device that outputs light, which is the control content for awakening the user from the input information.
A control step of executing control of the environmental control device based on the determined control content;
A second acquisition step of acquiring evaluation information indicating the evaluation of the user with respect to the executed control;
An updating step of updating the control content determination rule by machine learning using a value based on the evaluation information as a reward.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018244069A JP2020103496A (en) | 2018-12-27 | 2018-12-27 | Environment control system and environment control method |
JP2023218770A JP7511167B2 (en) | 2023-12-26 | Environmental control system and environmental control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018244069A JP2020103496A (en) | 2018-12-27 | 2018-12-27 | Environment control system and environment control method |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023218770A Division JP7511167B2 (en) | 2023-12-26 | Environmental control system and environmental control method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020103496A true JP2020103496A (en) | 2020-07-09 |
Family
ID=71449959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018244069A Pending JP2020103496A (en) | 2018-12-27 | 2018-12-27 | Environment control system and environment control method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020103496A (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008086489A (en) * | 2006-09-29 | 2008-04-17 | Toshiba Lighting & Technology Corp | Illuminator |
JP2010082377A (en) * | 2008-10-02 | 2010-04-15 | Hiroshima Univ | Sleep control system |
JP2014004091A (en) * | 2012-06-22 | 2014-01-16 | Toyota Motor Corp | Sleep controller |
JP2017220111A (en) * | 2016-06-09 | 2017-12-14 | ファナック株式会社 | Mechanical learning tool for learning threshold of abnormal load detection, numerical value control device and mechanical learning method |
WO2018147455A1 (en) * | 2017-02-13 | 2018-08-16 | 株式会社モノプロダイム | Wake-up method and device using same |
JP2018138137A (en) * | 2017-02-24 | 2018-09-06 | パナソニックIpマネジメント株式会社 | Pleasant sleep support device and pleasant sleep support method |
-
2018
- 2018-12-27 JP JP2018244069A patent/JP2020103496A/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008086489A (en) * | 2006-09-29 | 2008-04-17 | Toshiba Lighting & Technology Corp | Illuminator |
JP2010082377A (en) * | 2008-10-02 | 2010-04-15 | Hiroshima Univ | Sleep control system |
JP2014004091A (en) * | 2012-06-22 | 2014-01-16 | Toyota Motor Corp | Sleep controller |
JP2017220111A (en) * | 2016-06-09 | 2017-12-14 | ファナック株式会社 | Mechanical learning tool for learning threshold of abnormal load detection, numerical value control device and mechanical learning method |
WO2018147455A1 (en) * | 2017-02-13 | 2018-08-16 | 株式会社モノプロダイム | Wake-up method and device using same |
JP2018138137A (en) * | 2017-02-24 | 2018-09-06 | パナソニックIpマネジメント株式会社 | Pleasant sleep support device and pleasant sleep support method |
Also Published As
Publication number | Publication date |
---|---|
JP2024050544A (en) | 2024-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108292173B (en) | Apparatus for controlling equipment based on biometric information and method thereof | |
JP6672096B2 (en) | Waking degree prediction method and waking degree prediction apparatus | |
CN105592777B (en) | Method and system for sleep management | |
KR101687321B1 (en) | Apparatus for inducing sleep and sleep management system comprising the same | |
US20190069839A1 (en) | Sleep management method | |
JP4192127B2 (en) | Sleep state management device and sleep state management method | |
KR20160145987A (en) | Method and Apparatus for controlling temperature adjustment device | |
JP2004254827A (en) | Sleeping state judging device | |
JP2020078728A (en) | Method for predicting arousal level and arousal level prediction apparatus | |
US20220370757A1 (en) | Personalized sleep wellness score for treatment and/or evaluation of sleep conditions | |
EP3709867A1 (en) | Method and system for monitoring and improving sleep pattern of user | |
WO2021064557A1 (en) | Systems and methods for adjusting electronic devices | |
JP7245989B2 (en) | Information processing method, information processing program and information processing system | |
US20220375572A1 (en) | Iterative generation of instructions for treating a sleep condition | |
JP7233032B2 (en) | Environment control system and environment control method | |
JP7511167B2 (en) | Environmental control system and environmental control method | |
JP2020103496A (en) | Environment control system and environment control method | |
JP2020103537A (en) | Environment control system and environment control method | |
JP2020103491A (en) | Environment control system and environment control method | |
JP7361327B2 (en) | Environmental control system and method | |
JP2020103494A (en) | System for reducing jet-lag syndrome and method for reducing jet-lag syndrome | |
US20220358372A1 (en) | Learning apparatus, inference apparatus, and environment adjustment system | |
JP7233031B2 (en) | Environment control system and environment control method | |
JP2023148754A (en) | Apparatus control system, apparatus control method, and program | |
WO2023189688A1 (en) | Environment control system, environment control method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210917 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220922 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230614 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231226 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20240116 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20240216 |