JP7048893B2 - 学習装置、学習方法及びコンピュータプログラム - Google Patents

学習装置、学習方法及びコンピュータプログラム Download PDF

Info

Publication number
JP7048893B2
JP7048893B2 JP2018140113A JP2018140113A JP7048893B2 JP 7048893 B2 JP7048893 B2 JP 7048893B2 JP 2018140113 A JP2018140113 A JP 2018140113A JP 2018140113 A JP2018140113 A JP 2018140113A JP 7048893 B2 JP7048893 B2 JP 7048893B2
Authority
JP
Japan
Prior art keywords
information
environment
learning
relationship
biological
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018140113A
Other languages
English (en)
Other versions
JP2020017104A (ja
Inventor
陽平 片山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018140113A priority Critical patent/JP7048893B2/ja
Priority to PCT/JP2019/025846 priority patent/WO2020021962A1/ja
Priority to US17/261,140 priority patent/US20210295214A1/en
Publication of JP2020017104A publication Critical patent/JP2020017104A/ja
Application granted granted Critical
Publication of JP7048893B2 publication Critical patent/JP7048893B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/01Measuring temperature of body parts ; Diagnostic temperature sensing, e.g. for malignant or inflamed tissue
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/02Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
    • A61B5/021Measuring pressure in heart or blood vessels
    • A61B5/022Measuring pressure in heart or blood vessels by applying pressure to close blood vessels, e.g. against the skin; Ophthalmodynamometers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/163Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state by tracking eye movement, gaze, or pupil change
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/165Evaluating the state of mind, e.g. depression, anxiety
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/74Details of notification to user or communication with user or patient ; user input means
    • A61B5/7475User input or interface means, e.g. keyboard, pointing device, joystick
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2560/00Constructional details of operational features of apparatus; Accessories for medical measuring apparatus
    • A61B2560/02Operational features
    • A61B2560/0242Operational features adapted to measure environmental factors, e.g. temperature, pollution
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2562/00Details of sensors; Constructional details of sensor housings or probes; Accessories for sensors
    • A61B2562/02Details of sensors specially adapted for in-vivo measurements
    • A61B2562/0247Pressure sensors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2562/00Details of sensors; Constructional details of sensor housings or probes; Accessories for sensors
    • A61B2562/02Details of sensors specially adapted for in-vivo measurements
    • A61B2562/029Humidity sensors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0059Measuring for diagnostic purposes; Identification of persons using light, e.g. diagnosis by transillumination, diascopy, fluorescence
    • A61B5/0077Devices for viewing the surface of the body, e.g. camera, magnifying lens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/02Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
    • A61B5/0205Simultaneously evaluating both cardiovascular conditions and different types of body conditions, e.g. heart and respiratory condition
    • A61B5/02055Simultaneously evaluating both cardiovascular condition and temperature
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4005Detecting, measuring or recording for evaluating the nervous system for evaluating the sensory system
    • A61B5/4017Evaluating sense of taste

Description

本発明は、学習装置、学習方法及びコンピュータプログラムに関する。
自システムが過去に選択した処理の結果を繰り返し評価することにより、評価の高い処理を選択するポリシー(以下「制御選択ポリシー」という。)を生成(学習)する枠組みとして、強化学習が考案されている(非特許文献1参照)。以下、強化学習を実行するシステムを強化学習システムという。強化学習において、制御選択ポリシーの精度を高めるためには、強化学習システムによる学習回数を増やす必要がある。なお、制御選択ポリシーの精度とは、強化学習システムにおいて評価の高い処理が選択される確率を意味する。すなわち、評価の高い処理が選択される確率が高いほど、かつ、それらの処理の結果に対する評価が高いほど、精度が高いことを意味する。
牧野貴樹、他、「これからの強化学習」、森北出版、2016年10月31日第1版第1刷発行
一般に、強化学習においては、報酬と言われる値が存在する。報酬は、強化学習システムが過去に実行した処理の結果に対する評価を示す値である。ゲームの勝ち負けのように評価基準が明確な場合、強化学習システムが報酬の値を決定することは容易であるが、嗜好品の良し悪しの判定のようにヒトの感性に近い評価基準が求められる場合には強化学習システムが報酬の値を決定することは容易でない。そのため、従来の強化学習システムでは、強化学習システムの設計者が報酬と制御選択ポリシーの精度との関係を観測し、設計者自身の感性に基づいて学習結果を評価することによって、精度の高い制御選択ポリシーを生成する。より具体的には、従来の強化学習システムでは、設計者が、精度の制御選択ポリシーによって選択された処理の結果に基づいて報酬を決める報酬関数と、制御選択ポリシーとの組み合わせを学習によって更新することで、高い制御選択ポリシーが生成されていた(図8参照)。そのため、設計者は、所望の制御選択ポリシーが生成されるまで、学習のたびに報酬と制御選択ポリシーの精度との関係を観測する必要があり、制御選択ポリシーの精度の高さに応じて、設計者の労力が増大する場合があった。
上記事情に鑑み、本発明は、ヒトの感性に近い評価基準が求められる強化学習において、制御選択ポリシーの生成に要する設計者の労力の増大を抑制することができる学習装置、学習方法及びコンピュータプログラムを提供することにある。
本発明の一態様は、所定の環境に対する被験者の生体反応を示す情報である生体情報を取得する生体情報取得部と、前記環境に対する前記被験者の感情を示す情報である感情情報を取得する感情情報取得部と、前記被験者に作用する前記環境の属性を示す情報である環境情報を取得する第1環境情報取得部と、前記生体情報、前記感情情報及び前記環境情報に基づいて、前記生体情報と、前記感情情報と、前記環境情報との間の関係性を機械学習によって学習する関係性情報学習部と、を備える学習装置である。
本発明の一態様は、所定の環境に作用する出力部と、前記出力部の動作を制御する制御部と、前記環境の属性を示す情報である環境情報を取得する第2環境情報取得部と、前記環境に対する被験者の生体反応を示す情報である生体情報と、前記生体情報と一対一の関係にある情報であって前記被験者に作用する所定の環境の属性を示す情報である環境情報と、前記生体情報と一対一の関係にある情報であって前記環境に対する前記被験者の感情を示す情報である感情情報と、の間の関係性を示す関係性情報であって、予め自装置に記憶された前記関係性情報と、前記出力部によって作用された前記環境の属性を示す環境情報とに基づいて、前記感情情報に基づいて表される前記被験者の感情の大きさを示す数値を出力する報酬出力部と、を備え、前記制御部は、前記数値に基づいて前記出力部の動作を制御するための制御パラメータの値を更新する学習装置である。
本発明の一態様は、所定の環境に対する被験者の生体反応を示す情報である生体情報を取得する生体情報取得部と、前記環境に対する前記被験者の感情を示す情報である感情情報を取得する感情情報取得部と、前記被験者に作用する所定の環境の属性を示す情報である環境情報を取得する第1環境情報取得部と、前記生体情報と、前記感情情報と、前記環境情報とに基づいて、前記生体情報と、前記感情情報と、前記環境情報との間の関係性を機械学習によって学習する関係性情報学習部と、前記出力部の動作を制御する制御部と、前記生体情報と、前記環境情報と、前記感情情報と、の間の一対一の関係性を示す情報であって、予め自装置に記憶された情報である関係性情報と、前記出力部によって作用された前記環境の属性を示す環境情報とに基づいて、前記感情情報に基づいて表される前記被験者の感情の大きさを示す数値を出力する報酬出力部と、を備え、前記制御部は、前記数値に基づいて、前記出力部の動作を制御するための制御パラメータの値を更新する学習装置である。
本発明の一態様は、上記の学習装置であって、前記関係性情報学習部は、さらに、前記感情情報との間に所定の強さ以上の相関がある前記生体情報と、前記感情情報との間の関係性を学習する。
本発明の一態様は、所定の環境に対する被験者の生体反応を示す情報である生体情報を取得する生体情報取得ステップと、前記環境に対する前記被験者の感情を示す情報である感情情報を取得する感情情報取得ステップと、前記被験者に作用する前記環境の属性を示す情報である環境情報を取得する第1環境情報取得ステップと、前記生体情報、前記感情情報及び前記環境情報に基づいて、前記生体情報と、前記感情情報と、前記環境情報との間の関係性を機械学習によって学習する関係性情報学習ステップと、を有する学習方法である。
本発明の一態様は、所定の環境に作用する出力部の動作を制御する制御ステップと、前記環境の属性を示す情報である環境情報を取得する第2環境情報取得ステップと、前記環境に対する被験者の生体反応を示す情報である生体情報と、前記生体情報と一対一の関係にある情報であって前記被験者に作用する所定の環境の属性を示す情報である環境情報と、前記生体情報と一対一の関係にある情報であって前記環境に対する前記被験者の感情を示す情報である感情情報と、の間の関係性を示す関係性情報であって、予め自装置に記憶された前記関係性情報と、前記出力部によって作用された前記環境の属性を示す環境情報とに基づいて、前記感情情報に基づいて表される前記被験者の感情の大きさを示す数値を出力する報酬出力ステップと、を有し、前記制御ステップにおいて、前記数値に基づいて前記出力部の動作を制御するための制御パラメータの値が更新される、学習方法である。
本発明の一態様は、所定の環境に対する被験者の生体反応を示す情報である生体情報を取得する生体情報取得ステップと、前記環境に対する前記被験者の感情を示す情報である感情情報を取得する感情情報取得ステップと、前記被験者に作用する所定の環境の属性を示す情報である環境情報を取得する第1環境情報取得ステップと、前記生体情報と、前記感情情報と、前記環境情報とに基づいて、前記生体情報と、前記感情情報と、前記環境情報との間の関係性を機械学習によって学習する関係性情報学習ステップと、前記環境に作用する出力部の動作を制御する制御ステップと、前記生体情報と、前記環境情報と、前記感情情報と、の間の一対一の関係性を示す情報であって、予め自装置に記憶された情報である関係性情報と、前記出力部によって作用された前記環境の属性を示す環境情報とに基づいて、前記感情情報に基づいて表される前記被験者の感情の大きさを示す数値を出力する報酬出力ステップと、を有し、前記制御ステップにおいて、前記数値に基づいて、前記出力部の動作を制御するための制御パラメータの値が更新される、学習方法である。
本発明の一態様は、上記の学習装置としてコンピュータを機能させるためのコンピュータプログラムである。
本発明により、ヒトの感性に近い評価基準が求められる場合に、制御選択ポリシーの生成に要する設計者の労力の増大を抑制することが可能となる。
第1の実施形態の学習システム1のシステム構成の具体例を示す図。 第1の実施形態における第1学習装置10の具体的な処理の流れを示すフローチャート。 第1の実施形態における第2学習装置20の具体的な処理の流れを示すフローチャート。 第1の実施形態の学習システム1を料理ロボットによる料理の学習に適用した場合の適用例を示す図。 第2の実施形態の学習システム1aのシステム構成の具体例を示す図。 第2の実施形態における第3学習装置30の具体的な処理の流れを示すフローチャート。 第2の実施形態の学習システム1aを、画像表示装置による表示画面の制御の学習に適用した場合の適用例を示す図。 従来例の学習システムの具体例を示す図。
(第1の実施形態)
図1は、第1の実施形態の学習システム1のシステム構成の具体例を示す図である。
学習システム1は、第1学習装置10及び第2学習装置20を備える。
第1学習装置10は、環境情報、生体情報及び感情情報を取得する。環境情報は、学習システム1の被験者に作用する所定の環境の属性を示す情報である。生体情報は、所定の環境に対する被験者の生体反応を示す情報である。感情情報は、環境に対する被験者の感情を示す情報である。
第1学習装置10は、取得した環境情報、生体情報及び感情情報に基づいて、環境情報と生体情報と感情情報との間の関係性を学習する。なお、環境情報と、生体情報と、感情情報とは一対一の関係にある。
なお、被験者に作用する所定の環境は、どのような環境であってもよい。被験者に作用する所定の環境は、例えば、被験者の周囲の空気であってもよい。被験者に作用する所定の環境は、例えば、料理であってもよい。感情情報は、どのような感情を示してもよい。感情情報は、例えば、好き嫌いを示す情報であってもよい。
第1学習装置10は、学習結果である、環境情報と生体情報と感情情報との間の関係性を示す情報(以下「関係性情報」という。)を第2学習装置20に出力する。なお、関係性情報は、報酬関数の一例である。
第2学習装置20は、環境に作用する。環境に作用するとは、具体的には、第2学習装置20が環境に変化を与えることを意味する。第2学習装置20は、予め、第1学習装置10が学習した関係性情報を記憶する。第2学習装置20は、強化学習データを記憶する。強化学習データは、第2学習装置20による環境に作用する動作を制御する制御パラメータの値である。強化学習データは、第2学習装置20によって所定のタイミングに更新される値である。
第2学習装置20は、環境情報を取得する。第2学習装置20は、取得した環境情報と、関係性情報と、強化学習データの現在値とに基づいて、強化学習データを更新する。第2学習装置20は、強化学習データに応じた所定の動作を実行し、環境に作用する。なお、現在値は、更新直前の値を意味する。以下、強化学習データに応じた所定の動作であって、環境に作用する所定の動作を作用動作という。
第1学習装置10は、バスで接続されたCPU(Central Processing Unit)やRAM(Random Access Memory)や第1補助記憶装置101などを備え、プログラムを実行する。第1学習装置10は、プログラムの実行によって生体情報取得部102、第1入力トランスデューサ103、感情情報取得部104及び関係性情報学習部105を備える装置として機能する。
第1補助記憶装置101は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。第1補助記憶装置101は関係性情報を記憶する。関係性情報が、例えば、数値環境情報、数値生体情報及び数値感情情報の間の関係性を表す情報であって、所定の単項式又は多項式である場合、第1補助記憶装置101は、所定の単項式又は多項式や、所定の単項式又は多項式の係数を記憶する。数値環境情報は、所定の規則によって環境情報が示す内容を表す値である。数値生体情報は、所定の規則によって生体情報が示す内容を表す値である。数値感情情報は、所定の規則によって感情情報に基づいて表される被験者の感情の大きさを示す数値である。数値感情情報は、例えば、好きを+1で表し、嫌いを(-1)で表す。
生体情報取得部102は、生体情報を取得する。生体情報取得部102は、被験者の生体反応に関する所定の情報を取得可能であればどのようなものであってもよい。生体情報取得部102は、例えば、生体反応に関する所定の情報が体温の変化を示す情報であれば、体温計であってもよい。生体情報取得部102は、例えば、生体反応に関する所定の情報が瞳孔の開き具合を示す情報であれば、カメラであってもよい。生体情報取得部102は、例えば、生体反応に関する所定の情報が味覚に関する情報であれば、味覚センサであってもよい。生体情報取得部102は、例えば、生体反応に関する所定の情報が脳波を示す情報であれば、脳波計であってもよい。生体情報取得部102は、例えば、生体反応に関する所定の情報が血圧の変化を示す情報であれば、血圧計であってもよい。生体情報取得部102は、例えば、生体反応に関する所定の情報が眼球運動に関する情報であれば、眼球運動計測器であってもよい。生体情報取得部102は、例えば、生体反応に関する所定の情報が心拍数を示す情報であれば、心拍計であってもよい。
生体情報取得部102は、取得した生体情報を示す信号を生成する。生体情報取得部102が生成する信号は、取得した生体情報を示す信号であればどのような信号であってもよく、電気信号であってもよいし、光信号であってもよい。
第1入力トランスデューサ103は、環境情報を取得する。第1入力トランスデューサ103は、被験者に作用する環境に関する所定の情報を取得可能であればどのようなものであってもよい。第1入力トランスデューサ103は、例えば、環境に関する所定の情報が気温を示す情報であれば、温度計であってもよい。第1入力トランスデューサ103は、例えば、環境に関する所定の情報が気圧を示す情報であれば、圧力計であってもよい。第1入力トランスデューサ103は、例えば、環境に関する所定の情報が湿度を示す情報であれば、湿度計であってもよい。第1入力トランスデューサ103は、例えば、環境が料理であって、環境に関する所定の情報が塩分濃度であれば、塩分濃度計であってもよい。第1入力トランスデューサ103は、例えば、環境が料理であって、環境に関する所定の情報が糖度であれば、糖度計であってもよい。
第1入力トランスデューサ103は、取得した環境情報を示す信号を生成する。第1入力トランスデューサ103が生成する信号は、取得した環境情報を示す信号であればどのような信号であってもよく、電気信号であってもよいし、光信号であってもよい。
感情情報取得部104は、感情情報を取得する。感情情報取得部104は、マウスやキーボード、タッチパネル等の入力装置を含んで構成される。感情情報取得部104は、これらの入力装置を自装置に接続するインタフェースとして構成されてもよい。感情情報取得部104は、自装置に対する感情情報の入力を受け付ける。
関係性情報学習部105は、生体情報、環境情報及び感情情報に基づいて、関係性情報を機械学習によって学習する。関係性情報学習部105が関係性情報を機械学習によって学習するとは、具体的には、関係性情報が、数値環境情報、数値生体情報及び数値感情情報の間の関係性を表す情報であって所定の単項式又は多項式である場合に、数値環境情報、数値生体情報及び数値感情情報に基づいて、関係性情報学習部105が単項式又は多項式の係数を機械学習によって決定することを意味する。
なお、数値環境情報は、環境情報に基づいてどのように取得されてもよい。数値環境情報は、例えば、第1入力トランスデューサ103によって環境情報が示す内容が所定の規則によって数値化されることで取得されてもよい。
なお、数値生体情報は、生体情報に基づいてどのように取得されてもよい。数値生体情報は、例えば、生体情報取得部102によって生体情報が示す内容が所定の規則によって数値化されることで取得されてもよい。
なお、数値感情情報は、感情情報に基づいてどのように取得されてもよい。数値感情情報は、例えば、感情情報取得部104によって感情情報が示す内容が所定の規則によって数値化されることで取得されてもよい。
第2学習装置20は、バスで接続されたCPU(Central Processing Unit)やRAM(Random Access Memory)や第2補助記憶装置201などを備え、プログラムを実行する。第2学習装置20は、プログラムの実行によって第2入力トランスデューサ202、出力トランスデューサ203、報酬出力部204及び学習制御部205を備える装置として機能する。
第2補助記憶装置201は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。第2補助記憶装置201は関係性情報、制御選択ポリシー及び強化学習データを記憶する。制御選択ポリシーは、強化学習データの現在値を用いて、強化学習データの現在値に応じた作用動作を第2学習装置20に実行させるプログラムである。制御選択ポリシーは、強化学習データの現在値に応じた作用動作を第2学習装置20に実行させるプログラムであればどのようなプログラムであってもよい。制御選択ポリシーは、例えば、強化学習データの現在値を後述する出力トランスデューサ203を制御する制御パラメータに変換する変換式であってもよい。このような場合、変換式は、例えば、強化学習データを係数とする単項式又は多項式である。
第2入力トランスデューサ202は、環境情報を取得する。第2入力トランスデューサ202は、第1入力トランスデューサ103が取得する環境情報を取得可能であればどのようなものであってもよい。例えば、第1入力トランスデューサ103が温度計である場合には、第2入力トランスデューサは気温を示す情報を取得可能であればどのようなものであってもよい。例えば、第1入力トランスデューサ103が圧力計である場合には、第2入力トランスデューサは気圧を示す情報を取得可能であればどのようなものであってもよい。例えば、第1入力トランスデューサ103が塩分濃度計である場合には、第2入力トランスデューサは塩分濃度を示す情報を取得可能であればどのようなものであってもよい。例えば、第1入力トランスデューサ103が糖度計である場合には、第2入力トランスデューサは糖度を示す情報を取得可能であればどのようなものであってもよい。
第2入力トランスデューサ202は、取得した環境情報を示す信号を生成する。第2入力トランスデューサ202が生成する信号は、取得した環境情報を示す信号であればどのような信号であってもよく、電気信号であってもよいし、光信号であってもよい。
出力トランスデューサ203は、後述する学習制御部205の制御によって、強化学習データの現在値に応じた所定の動作を実行することで環境に作用する。環境に作用するとは、具体的には、環境を変化させることを意味する。出力トランスデューサ203は、強化学習データの現在値に応じた所定の動作を実行可能であればどのようなものであってもよい。出力トランスデューサ203は、モータ等の駆動装置や、空調機や、プリンタ等のアクチュエータであってもよい。出力トランスデューサ203は、例えば、ディスプレイや照明等の発光装置や、臭気発生装置や、スピーカや、力覚発生装置や、振動発生装置等の出力インタフェースであってもよい。
報酬出力部204は、第2入力トランスデューサ202が取得した環境情報と、関係性情報とに基づいて報酬を出力する。報酬は、第2入力トランスデューサ202が取得した環境情報に対して関係性情報によって対応付けられた感情情報が表す感情の大きさを表す値(すなわち数値感情情報)である。
学習制御部205は、環境情報と、報酬と、強化学習データの現在値とに基づいて、第2補助記憶装置201に記憶された強化学習データを更新する。具体的には、学習制御部205は、更新後の強化学習データに応じた作用動作の結果、報酬が小さくならないように強化学習データを更新する。
学習制御部205は、環境情報と、報酬と、強化学習データの現在値とに基づいて更新後の強化学習データに応じた作用動作の結果、報酬が小さくならないように強化学習データを更新可能であればどのような方法で強化学習データを更新してもよい。学習制御部205は、例えば、ε-グリーディ法を用いたQ学習によって決定された値によって強化学習データを更新してもよい。
学習制御部205が強化学習データを更新することは、制御選択ポリシーの精度を下げないことを意味する。
また、学習制御部205は、制御選択ポリシーと、強化学習データの現在値とに基づいて、出力トランスデューサ203の動作を制御する。
図2は、第1の実施形態における第1学習装置10の具体的な処理の流れを示すフローチャートである。
生体情報取得部102が生体情報を取得し、第1入力トランスデューサ103が環境情報を取得し、感情情報取得部104が感情情報を取得する(ステップS101)。関係性情報学習部105が、生体情報、環境情報及び感情情報に基づいて、生体情報、環境情報及び感情情報の間の関係性を機械学習によって学習する(ステップS102)。ステップS101~ステップS102の処理が所定の回数繰り返される。
図3は、第1の実施形態における第2学習装置20の具体的な処理の流れを示すフローチャートである。
出力トランスデューサ203が、第2補助記憶装置201に記憶された強化学習データ及び制御選択ポリシーに基づいた学習制御部205による制御によって環境に作用する(ステップS201)。第2入力トランスデューサ202が環境情報を取得する(ステップS202)。報酬出力部204は、第2入力トランスデューサ202が取得した環境情報と、関係性情報とに基づいて報酬を出力する(ステップS203)。学習制御部205が、環境情報と、報酬と、ステップS201の時点における強化学習データとに基づいて、強化学習データを更新する(ステップS204)。ステップS204の後、ステップS201~ステップS204の処理が所定の回数繰り返される。
図4は、第1の実施形態の学習システム1を料理ロボットによる料理の学習に適用した場合の適用例を示す図である。図4において図1と同様の機能を有するものは、同じ符号を付す。
図4の適用例において、脳波計は生体情報取得部102の具体例である。図4の適用例において、第1学習装置における味覚センサは第1入力トランスデューサ103の具体例である。図4の適用例において、食材/料理は、食材又は料理を表し、環境の具体例である。図4の適用例において、成分情報は、環境情報の具体例である。成分情報は、塩分濃度や、糖度等の料理の成分に関する情報である。図4の適用例において、第1学習装置における味見は作用の具体例である。図4の適用例において、調理ロボットは、出力トランスデューサ203の具体例である。図4の適用例において、調理動作制御は、制御の具体例である。図4の適用例において、調理は、第2学習装置における作用の具体例である。図4の適用例において、第2学習装置における味覚センサは第2入力トランスデューサの具体例である。
図4の適用例において、第1学習装置は、食材/料理を味見した人(被験者)の味見した時の生体情報である脳波を脳波計で取得する。図4の適用例において、第1学習装置は、味覚センサによって食材/料理の成分を分析し分析結果を取得する。図4の適用例において、第1学習装置は、食材/料理を味見した人(被験者)が料理の好き嫌いを示す感情情報を感情情報取得部104によって取得する。第1学習装置は、脳波計が取得した脳波と、味覚センサが取得した塩分濃度と、感情情報取得部104が取得した好き嫌いを示す感情情報とに基づいて、食材/料理を味見した人(被験者)の味の好みに関する関係性を機械学習によって学習する。
図4の適用例において、第2学習装置は、第1学習装置が学習した関係性と、調理ロボットによる調理と、味覚センサによる味見とに基づいて、報酬が大きくなるような強化学習パラメータを機械学習によって学習する。
このように構成された第1の実施形態の学習システム1は、感情情報を含む関係性情報(すなわち報酬関数)を決定する第1学習装置10を備える。さらに、このように構成された第1の実施形態の学習システム1は、第2学習装置20が、関係性情報に基づいて第1学習装置10の設計者の手を介することなく、制御選択ポリシーの精度を向上させる。そのため、制御選択ポリシーの精度の向上に係る設計者の労力の増大を抑制することができる。
(第2の実施形態)
図5は、第2の実施形態の学習システム1aのシステム構成の具体例を示す図である。
学習システム1aは、第3学習装置30を備える。第3学習装置30は、バスで接続されたCPU(Central Processing Unit)やRAM(Random Access Memory)や第3補助記憶装置301及び第4補助記憶装置302などを備え、プログラムを実行する。第1学習装置10は、プログラムの実行によって生体情報取得部102、第1入力トランスデューサ103、感情情報取得部104、関係性情報学習部105、出力トランスデューサ203、報酬出力部204a及び学習制御部205aを備える。
以下、図1と同様の機能を有するものは、同じ符号を付すことで説明を省略する。
第3補助記憶装置301は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。第3補助記憶装置301は関係性情報を記憶する。関係性情報は、生体情報、環境情報及び感情情報の関係性を示す情報である。
第4補助記憶装置302は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。第4補助記憶装置302は強化学習データ及び制御選択ポリシーを記憶する。
報酬出力部204aは、第1入力トランスデューサ103が取得した環境情報と、関係性情報とに基づいて報酬を出力する。なお、第2実施形態における報酬は、第1入力トランスデューサ103が取得した環境情報に対して関係性情報によって対応付けられた感情情報が表す感情の大きさを表す値(すなわち数値感情情報)である。
学習制御部205aは、環境情報と、報酬と、強化学習データの現在値とに基づいて、第4補助記憶装置302に記憶された強化学習データを更新する。具体的には、学習制御部205aは、更新後の強化学習データに応じた作用動作の結果、報酬が小さくならないように強化学習データを更新する。
学習制御部205aは、環境情報と、報酬と、強化学習データの現在値とに基づいて更新後の強化学習データに応じた作用動作の結果、報酬が小さくならないように強化学習データを更新可能であればどのような方法で強化学習データを更新してもよい。学習制御部205aは、例えば、ε-グリーディ法を用いたQ学習によって決定された値によって強化学習データを更新してもよい。
学習制御部205aが強化学習データを更新することは、制御選択ポリシーの精度を下げないことを意味する。
また、学習制御部205aは、制御選択ポリシーと、強化学習データの現在値とに基づいて、出力トランスデューサ203の動作を制御する。
また、学習制御部205aは、更新後の強化学習データを関係性情報学習部105に出力する。
図6は、第2の実施形態における第3学習装置30の具体的な処理の流れを示すフローチャートである。
以下、図2及び図3と同様の処理は、同じ符号を付すことで説明を省略する。
ステップS101の次に、関係性情報学習部105が、生体情報、環境情報、感情情報及び強化学習データに基づいて、生体情報、環境情報、感情情報及び強化学習データの間の関係性を機械学習によって学習する(ステップS102a)。ステップS102aの次に、ステップS201が実行される。ステップS201の次に、第1入力トランスデューサ103が環境情報を取得する(ステップS202a)。報酬出力部204aがステップS102aにおいて取得された関係性に基づいて報酬を出力する(ステップS203a)。学習制御部205aが、環境情報と、報酬と、ステップS201の時点における強化学習データとに基づいて、強化学習データを更新する(ステップS204a)。
ステップS204の後、図6のステップS101~ステップS204aの処理が所定の回数繰り返される。
図7は、第2の実施形態の学習システム1aを、画像表示装置による表示画面の制御の学習に適用した場合の適用例を示す図である。図7において図5と同様の機能を有するものは、同じ符号を付す。
図7の適用例において、脳波計は生体情報取得部102の具体例である。図7の適用例において、第3学習装置における耳掛け式目線カメラは第1入力トランスデューサ103の具体例である。耳掛け式目線カメラは、被験者の耳に掛けて使用することで被験者の目線と同等の視覚情報を取得する。図7の適用例において、表示画像は、環境の具体例である。図7の適用例において、視覚情報は、環境情報の具体例である。図7の適用例において、光は環境から被験者への作用の具体例である。光は表示画面の光がユーザの目に入射することを表す。図7の適用例において、ディスプレイは、出力トランスデューサ203の具体例である。図7の適用例において、表示制御は、制御の具体例である。図7の適用例において、表示は出力トランスデューサ203による環境への作用の具体例である。
図7の適用例において、第3学習装置は、表示画像を見ることができる位置にいる人(被験者)の生体情報である脳波を脳波計で取得する。図7の適用例において、第3学習装置は、耳掛け式目線カメラによって被験者の視線の先にある表示画像を視覚情報として取得する。図7の適用例において、第3学習装置は、表示画像を見ることができる位置にいる人(被験者)の好き嫌いを示す感情情報を感情情報取得部104によって取得する。第3学習装置は、脳波計が取得した脳波と、耳掛け式目線カメラが取得した視覚情報と、感情情報取得部104が取得した好き嫌いを示す感情情報とに基づいて、出力画像の選択に関する制御の強化学習を行う。
このように構成された第2の実施形態の学習システム1aは、生体情報取得部102、第1入力トランスデューサ103、感情情報取得部104、関係性情報学習部105、出力トランスデューサ203、報酬出力部204及び学習制御部205aを備える。そのため、制御選択ポリシーの精度の向上に係る設計者の労力の増大を抑制することができる。
(変形例)
なお、第1の実施形態の学習システム1又は第2の実施形態の学習システム1aは、被験者の身体の各部位の硬さと脳波の状態とに合わせて、もみ方やもみ位置を強化学習によって学習する装置に適用してもよい。この場合、具体的には、出力トランスデューサ203は、マッサージチェアであって、第1入力トランスデューサ103及び第2入力トランスデューサ202は力覚センサである。
なお、学習システム1及び学習システム1aは、被験者の識別情報、被験者の特徴量、時刻、測位情報等を用いて、学習データの分類を行うなどの最適化を行ってもよい。
なお、第1学習装置10は、1つの筐体で構成される装置であってもよいし、複数の筐体に分けて構成される装置であってもよい。複数の筐体に分けて構成される場合には、上述した第1学習装置10の一部の機能が、ネットワークを介して物理的に離れた位置に実装されてもよい。
なお、第2学習装置20は、1つの筐体で構成される装置であってもよいし、複数の筐体に分けて構成される装置であってもよい。複数の筐体に分けて構成される場合には、上述した第2学習装置20の一部の機能が、ネットワークを介して物理的に離れた位置に実装されてもよい。
なお、第3学習装置30は、1つの筐体で構成される装置であってもよいし、複数の筐体に分けて構成される装置であってもよい。複数の筐体に分けて構成される場合には、上述した第3学習装置30の一部の機能が、ネットワークを介して物理的に離れた位置に実装されてもよい。
なお、第1学習装置10及び第2学習装置20は、それぞれ別々の装置として構成される必要はなく、2つが1つの筐体中に構成されてもよい。
なお、第3学習装置は、第3補助記憶装置301及び第4補助記憶装置302をそれぞれ異なる機能部として備える必要は無く、関係性情報、強化学習データ及び制御選択ポリシーを記憶するひとつの補助記憶装置として備えてもよい。
なお、第1学習装置10、第2学習装置20及び第3学習装置30の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。プログラムは、電気通信回線を介して送信されてもよい。
なお、関係性情報学習部105は、さらに、感情情報との間に所定の強さ以上の相関がある生体情報と、感情情報との間の関係性を学習してもよい。
なお、学習制御部205及び205aは、制御部の一例である。なお、第1学習装置10、第2学習装置20及び第3学習装置30は、学習装置の一例である。なお、第1入力トランスデューサ103は、第1環境情報取得部の一例である。なお、第2入力トランスデューサ202は、第2環境情報取得部の一例である。なお、出力トランスデューサ203は、出力部の一例である。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
1…学習システム、 1a…学習システム、 10…第1学習装置、 20…第2学習装置、 30…第3学習装置、 101…第1補助記憶装置、 102…生体情報取得部、 103…第1入力トランスデューサ、 104…感情情報取得部、 105…関係性情報学習部、 201…第2補助記憶装置、 202…第2入力トランスデューサ、 203…出力トランスデューサ、 204…報酬出力部、 205…学習制御部、 301…第3補助記憶装置、 302…第4補助記憶装置、 204a…報酬出力部、 205a…学習制御部

Claims (8)

  1. 所定の環境に対する被験者の生体反応を示す情報である生体情報を取得する生体情報取得部と、
    前記環境に対する前記被験者の予め定められた1種類の感情の大きさを示す数値である感情情報を取得する感情情報取得部と、
    前記被験者に作用する前記環境の属性を示す情報である環境情報を取得する第1環境情報取得部と、
    前記生体情報、前記感情情報及び前記環境情報に基づいて、前記生体情報と、前記感情情報と、前記環境情報との間の関係性を機械学習によって学習する関係性情報学習部と、
    を備える学習装置。
  2. 所定の環境に作用する出力部と、
    前記出力部の動作を制御する制御部と、
    前記環境の属性を示す情報である環境情報を取得する第2環境情報取得部と、
    前記環境に対する被験者の生体反応を示す情報である生体情報と、前記生体情報と一対一の関係にある情報であって前記被験者に作用する所定の環境の属性を示す情報である環境情報と、前記生体情報と一対一の関係にある情報であって前記環境に対する前記被験者の予め定められた1種類の感情の大きさを示す数値である感情情報と、の間の関係性を示す関係性情報であって、予め自装置に記憶された前記関係性情報と、前記出力部によって作用された前記環境の属性を示す環境情報とに基づいて、前記感情情報である数値を出力する報酬出力部と、
    を備え、
    前記制御部は、前記報酬出力部から出力された数値が小さくならない動作を選択するように、前記出力部の動作を制御するための制御パラメータの値を更新する、
    学習装置。
  3. 所定の環境に対する被験者の生体反応を示す情報である生体情報を取得する生体情報取得部と、
    前記環境に対する前記被験者の予め定められた1種類の感情の大きさを示す数値である感情情報を取得する感情情報取得部と、
    前記被験者に作用する所定の環境の属性を示す情報である環境情報を取得する第1環境情報取得部と、
    前記環境に作用する出力部と、
    前記生体情報と、前記感情情報と、前記環境情報とに基づいて、前記生体情報と、前記感情情報と、前記環境情報との間の関係性を機械学習によって学習する関係性情報学習部と、
    前記出力部の動作を制御する制御部と、
    前記生体情報と、前記環境情報と、前記感情情報と、の間の一対一の関係性を示す情報であって、予め自装置に記憶された情報である関係性情報と、前記出力部によって作用された前記環境の属性を示す環境情報とに基づいて、前記感情情報である数値を出力する報酬出力部と、
    を備え、
    前記制御部は、前記報酬出力部から出力された数値が小さくならない動作を選択するように、前記出力部の動作を制御するための制御パラメータの値を更新する、
    学習装置。
  4. 前記関係性情報学習部は、さらに、前記感情情報との間に所定の強さ以上の相関がある前記生体情報と、前記感情情報との間の関係性を学習する、
    請求項1又は3に記載の学習装置。
  5. 所定の環境に対する被験者の生体反応を示す情報である生体情報を取得する生体情報取得ステップと、
    前記環境に対する前記被験者の予め定められた1種類の感情の大きさを示す数値である感情情報を取得する感情情報取得ステップと、
    前記被験者に作用する前記環境の属性を示す情報である環境情報を取得する第1環境情報取得ステップと、
    前記生体情報、前記感情情報及び前記環境情報に基づいて、前記生体情報と、前記感情情報と、前記環境情報との間の関係性を機械学習によって学習する関係性情報学習ステップと、
    を有する学習方法。
  6. 所定の環境に作用する出力部の動作を制御する制御ステップと、
    前記環境の属性を示す情報である環境情報を取得する第2環境情報取得ステップと、
    前記環境に対する被験者の生体反応を示す情報である生体情報と、前記生体情報と一対一の関係にある情報であって前記被験者に作用する所定の環境の属性を示す情報である環境情報と、前記生体情報と一対一の関係にある情報であって前記環境に対する前記被験者の予め定められた1種類の感情の大きさを示す数値である感情情報と、の間の関係性を示す関係性情報であって、予め自装置に記憶された前記関係性情報と、前記出力部によって作用された前記環境の属性を示す環境情報とに基づいて、前記感情情報である数値を出力する報酬出力ステップと、
    を有し、
    前記制御ステップにおいて、前記報酬出力ステップにおいて出力された数値が小さくならない動作を選択するように、前記出力部の動作を制御するための制御パラメータの値が更新される、
    学習方法。
  7. 所定の環境に対する被験者の生体反応を示す情報である生体情報を取得する生体情報取得ステップと、
    前記環境に対する前記被験者の予め定められた1種類の感情の大きさを示す数値である感情情報を取得する感情情報取得ステップと、
    前記被験者に作用する所定の環境の属性を示す情報である環境情報を取得する第1環境情報取得ステップと、
    前記生体情報と、前記感情情報と、前記環境情報とに基づいて、前記生体情報と、前記感情情報と、前記環境情報との間の関係性を機械学習によって学習する関係性情報学習ステップと、
    前記環境に作用する出力部の動作を制御する制御ステップと、
    前記生体情報と、前記環境情報と、前記感情情報と、の間の一対一の関係性を示す情報であって、予め自装置に記憶された情報である関係性情報と、前記出力部によって作用された前記環境の属性を示す環境情報とに基づいて、前記感情情報である数値を出力する報酬出力ステップと、
    を有し、
    前記制御ステップにおいて、前記報酬出力ステップにおいて出力された数値が小さくならない動作を選択するように、前記出力部の動作を制御するための制御パラメータの値が更新される、
    学習方法。
  8. 請求項1~4のいずれか一項に記載の学習装置としてコンピュータを機能させるためのコンピュータプログラム。
JP2018140113A 2018-07-26 2018-07-26 学習装置、学習方法及びコンピュータプログラム Active JP7048893B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018140113A JP7048893B2 (ja) 2018-07-26 2018-07-26 学習装置、学習方法及びコンピュータプログラム
PCT/JP2019/025846 WO2020021962A1 (ja) 2018-07-26 2019-06-28 学習装置、学習方法及びコンピュータプログラム
US17/261,140 US20210295214A1 (en) 2018-07-26 2019-06-28 Learning apparatus, learning method and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018140113A JP7048893B2 (ja) 2018-07-26 2018-07-26 学習装置、学習方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2020017104A JP2020017104A (ja) 2020-01-30
JP7048893B2 true JP7048893B2 (ja) 2022-04-06

Family

ID=69181697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018140113A Active JP7048893B2 (ja) 2018-07-26 2018-07-26 学習装置、学習方法及びコンピュータプログラム

Country Status (3)

Country Link
US (1) US20210295214A1 (ja)
JP (1) JP7048893B2 (ja)
WO (1) WO2020021962A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018170059A1 (en) 2017-03-14 2018-09-20 Gojo Industries, Inc. Refilling systems, refillable containers and method for refilling containers
US11645498B2 (en) * 2019-09-25 2023-05-09 International Business Machines Corporation Semi-supervised reinforcement learning

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016004525A (ja) 2014-06-19 2016-01-12 株式会社日立製作所 データ分析システム及びデータ分析方法
JP2018072876A (ja) 2016-10-24 2018-05-10 富士ゼロックス株式会社 感情推定システム、感情推定モデル生成システム
WO2018092436A1 (ja) 2016-11-16 2018-05-24 本田技研工業株式会社 感情推定装置、および、感情推定システム
JP2018097474A (ja) 2016-12-09 2018-06-21 トヨタ自動車株式会社 情報提供システム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6477551B2 (ja) * 2016-03-11 2019-03-06 トヨタ自動車株式会社 情報提供装置及び情報提供プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016004525A (ja) 2014-06-19 2016-01-12 株式会社日立製作所 データ分析システム及びデータ分析方法
JP2018072876A (ja) 2016-10-24 2018-05-10 富士ゼロックス株式会社 感情推定システム、感情推定モデル生成システム
WO2018092436A1 (ja) 2016-11-16 2018-05-24 本田技研工業株式会社 感情推定装置、および、感情推定システム
JP2018097474A (ja) 2016-12-09 2018-06-21 トヨタ自動車株式会社 情報提供システム

Also Published As

Publication number Publication date
US20210295214A1 (en) 2021-09-23
WO2020021962A1 (ja) 2020-01-30
JP2020017104A (ja) 2020-01-30

Similar Documents

Publication Publication Date Title
RU2696307C1 (ru) Коммуникационное устройство, коммуникационный робот и машиночитаемый носитель данных
US11301775B2 (en) Data annotation method and apparatus for enhanced machine learning
JP2009521246A (ja) 精神状態の検出およびそれを用いる対話
KR102233099B1 (ko) 기계학습에 기반한 가상 현실 콘텐츠의 사이버 멀미도 예측 모델 생성 및 정량화 조절 장치 및 방법
JP7048893B2 (ja) 学習装置、学習方法及びコンピュータプログラム
KR102466438B1 (ko) 인지 기능 평가 시스템 및 인지 기능 평가 방법
CN110121696A (zh) 电子设备及其控制方法
CN108697389B (zh) 用于支持神经状态评估和神经康复的系统和方法,尤其是认知和/或言语功能障碍
JP6479708B2 (ja) 特徴量抽出装置、推定装置、それらの方法、およびプログラム
JP2020203051A (ja) コンピュータプログラム、情報処理装置、情報処理方法、学習済みモデルの生成方法及び学習済みモデル
JP2023089729A (ja) 計算機システム及び情動推定方法
JP7209200B2 (ja) 空間提案システム、及び、空間提案方法
JP6854554B1 (ja) 情報処理装置、情報処理方法、情報処理システム、及び情報処理プログラム
JP7306152B2 (ja) 感情推定装置、感情推定方法、プログラム、情報提示装置、情報提示方法及び感情推定システム
JP2018205616A (ja) 対話システム、対話システムの制御方法、及び装置
KR102468833B1 (ko) 우울증 치료를 위한 인공지능 기반의 미러 카운슬링 방법
US20230394124A1 (en) Method for configuring data acquisition settings of a computing device
JP7276433B2 (ja) フィッティング支援装置、フィッティング支援方法、及びプログラム
JP2022162548A (ja) システム1またはシステム2チャネルを介してユーザに対して選択的に通信するためのシステムおよび方法
JP2017170253A (ja) 印象評価装置及び印象評価方法
JP6226288B2 (ja) 印象評価装置及び印象評価方法
CN114052736A (zh) 认知功能的评估系统和方法及其在认知功能缺陷中的应用
JP2021105993A (ja) 処理装置、プログラム、及び方法
KR20210084443A (ko) 시공간 기억 및/또는 현출성의 자동 수동 평가를 위한 시스템 및 방법
WO2023188698A1 (ja) 評価方法、評価用装置、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220307

R150 Certificate of patent or registration of utility model

Ref document number: 7048893

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150