JP7239991B2 - ラベル付与装置、ラベル付与方法、及びプログラム - Google Patents
ラベル付与装置、ラベル付与方法、及びプログラム Download PDFInfo
- Publication number
- JP7239991B2 JP7239991B2 JP2019563982A JP2019563982A JP7239991B2 JP 7239991 B2 JP7239991 B2 JP 7239991B2 JP 2019563982 A JP2019563982 A JP 2019563982A JP 2019563982 A JP2019563982 A JP 2019563982A JP 7239991 B2 JP7239991 B2 JP 7239991B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- teacher
- keyword
- label
- action
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002372 labelling Methods 0.000 title claims description 59
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 230000009471 action Effects 0.000 claims description 123
- 238000000605 extraction Methods 0.000 claims description 95
- 239000000284 extract Substances 0.000 claims description 35
- 238000004458 analytical method Methods 0.000 claims description 34
- 238000010801 machine learning Methods 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 13
- 230000000877 morphologic effect Effects 0.000 claims description 12
- 239000013598 vector Substances 0.000 description 58
- 230000006399 behavior Effects 0.000 description 55
- 238000012937 correction Methods 0.000 description 32
- 238000009826 distribution Methods 0.000 description 26
- 239000008186 active pharmaceutical agent Substances 0.000 description 25
- 238000000034 method Methods 0.000 description 24
- 238000007781 pre-processing Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 14
- 101001080825 Homo sapiens PH and SEC7 domain-containing protein 1 Proteins 0.000 description 13
- 102100027472 PH and SEC7 domain-containing protein 1 Human genes 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 101100210353 Arabidopsis thaliana WSD1 gene Proteins 0.000 description 9
- 230000033001 locomotion Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000007613 environmental effect Effects 0.000 description 6
- 239000003814 drug Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 101100181118 Arabidopsis thaliana KIN14A gene Proteins 0.000 description 4
- 230000036528 appetite Effects 0.000 description 4
- 235000019789 appetite Nutrition 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 230000000474 nursing effect Effects 0.000 description 4
- 230000036544 posture Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 240000004270 Colocasia esculenta var. antiquorum Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101100095847 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SIZ1 gene Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願は、2018年1月5日に、日本に出願された特願2018-000806号に基づき優先権を主張し、その内容をここに援用する。
センサを始めとする時系列データを用いる行動認識には、機械学習の一分野である教師あり学習が使われる。教師あり学習では、教師データを用いて学習モデルを生成する。教師データとは、実際の行動を示す情報である教師ラベルと、センサから取得されたデータから抽出される特徴量とを組み合わせたデータである。教師あり学習では、生成された学習モデルに基づいて、センサから取得されたデータから抽出される特徴量から行動を示す教師ラベルを推定する。
以下、図面を参照しながら本発明の実施形態について詳しく説明する。図1は、本実施形態に係るラベル付与装置1を用いた機械学習による行動認識の概要を示す図である。この機械学習による行動認識では、被験者の行動の時系列を推定する。ラベル付与装置1を用いた機械学習による行動認識には、学習フェーズと、推定フェーズとがある。
時間窓TWのサイズは、秒数などに基づいて予め決められてもよいし、特徴量を抽出するのに適したサイズとして決められてもよい。時間窓TW同士の間隔は、秒数などを用いて予め決められてもよいし、特徴量を抽出するのに適した間隔として決められてもよい。
次に図2を参照しラベル付与装置1の構成について説明する。図2は、本実施形態に係るラベル付与装置1の構成の一例を示す図である。
ラベル付与装置1は、センサデータSD1から抽出される特徴量ベクトルFVに教師ラベルLLを付与する。ラベル付与装置1は、特徴量ベクトルFVに教師ラベルLLを付与することにより教師データTDを生成する。ここでラベル付与装置1は、テキストデータ供給部2が供給するテキストデータTXと、第1センサデータ供給部3が供給するセンサデータSD1とから教師データTDを生成する。ラベル付与装置1は、生成した教師データTDを行動推定装置4に供給する。
ラベル付与装置1は、キーワード抽出部10と、前処理部11と、時間窓切り出し部12と、特徴量計算部13と、選択部14と、教師データ生成部15とを備える。
選択部14は、選択用教師データ生成部140と、複数ラベル学習選択部141と、時刻補正部142とを備える。
第1センサデータ供給部3は、センサデータSD1をラベル付与装置1に供給する。第1センサデータ供給部3は、例えば、被験者の身体に取り付けられるセンサである。第1センサデータ供給部3は、センサデータSD1を記憶する記憶装置であってもよい。また、第1センサデータ供給部3が記憶装置である場合、第1センサデータ供給部3は、テキストデータ供給部2と一体となって構成されてもよい。第1センサデータ供給部3は、センサが測定したデータを加工する演算装置であってもよい。
学習部40は、ラベル付与装置1が供給する教師データTDを用いて機械学習を行う。学習部40は、機械学習により学習モデルLMを生成する。
推定部41は、学習部40が生成した学習モデルLMに基づいて、第2センサデータ供給部5が供給するセンサデータSD2から推定ラベルELを推定する。
なお、図2に示す例においては、行動推定装置4と、ラベル付与装置1とは独立して構成されているが、行動推定装置4とラベル付与装置1とは一体となって構成されてもよい。
第2センサデータ供給部5は、行動推定装置4にセンサデータSD2を供給する。
ラベル付与装置1の処理について説明する。図3は、本実施形態に係るラベル付与装置1の学習処理の一例を示す図である。
前処理部11は、第1センサデータ供給部3が供給するセンサデータSD1を取得する(ステップS10)。前処理部11は、取得したセンサデータSD1に対して前処理を行う(ステップS20)。前処理部11は、センサデータSD1に対して前処理を行った結果、前処理済みセンサデータPSD1を生成する。前処理部11は生成した前処理済みセンサデータPSD1を時間窓切り出し部12に供給する。
特徴量計算部13は、生成した特徴量ベクトルFVに対して次元削減の処理を行う(ステップS50)。ここで次元削減の処理とは、例えば、主成分分析により特徴量ベクトルFVの次元を減らす処理である。特徴量計算部13は、次元削減の処理をした特徴量ベクトルFVを、選択用教師データ生成部140及び教師データ生成部15に供給する。
行動推定装置4の学習部40は、教師データ生成部15が供給する教師データTDに基づいて学習モデルLMを生成する(ステップS70)。
キーワード抽出部10は、テキストデータ供給部2が供給するテキストデータTXを取得する(ステップS600)。
キーワード抽出部10は、取得したテキストデータTXから行動キーワードKAを選択する(ステップS601)。キーワード抽出部10は、公知の自然言語処理の手法を使って行動キーワードKAを選択する。公知の自然言語処理とは、形態素解析、係り受け解析、及び格フレーム解析などである。キーワード抽出部10は、選択した行動キーワードKAのうち、似た意味や関連をもつ行動キーワードKAを1つの集約行動キーワードKACに集約する。キーワード抽出部10は、集約した集約行動キーワードKACを教師ラベル候補LCとして抽出する。
図5は、本実施形態に係るテキストデータTXの一例を示す図である。図6は、本実施形態に係るラベル候補の一例を示す図である。テキストデータTXは、一例として、被験者である被介護者の、ある日の夕方から夜にかけての介護について記録した業務日誌の文章の抜粋である。
例えば、キーワード抽出部10は、形態素解析を用いて、テキストデータTX「担当者:○○太郎、被介護者:△△次郎、介護した日付:20XX年10月XX日 17時半、夕食をとる。普段より食欲あり。18時に錠剤Aを服用した。19時にトイレに行こうとした際にスリッパを上手く履けず、ふらついて転びそうになった。スリッパの使用の可否について被介護者と相談した。20時すぎ就寝。」から、「17時半」、「18時」、「19時」、及び「20時」を時刻キーワードTKとして選択する。
図5に示す例では、キーワード抽出部10は、時刻キーワードTK「17時半」、「18時」、「19時」、及び「20時」から、選択した開始時刻キーワードBTK「17時半」、「18時」、及び「19時」のそれぞれに対応する終了時刻キーワードETKとして「18時」、「19時」、及び「20時」を選択する。ただし、図5に示すテキストデータTXからは開始時刻キーワードBTK「20時」に対応する終了時刻キーワードETKは選択されないため、キーワード抽出部10は、開始時刻キーワードBTK「20時」に対応する終了時刻キーワードETKとして「24時」を選択する。なお、開始時刻キーワードBTK「20時」に対応する終了時刻キーワードETKは、「24時」の代わりに、翌日以降のテキストデータTXから形態素解析を用いて抽出されてよい。
キーワード抽出部10は、教師ラベル候補LCが示す行動の典型的な所要時間を予め決めておき、この教師ラベル候補LCを含むラベルセグメントLSについて、開始時刻情報BTまたは終了時刻情報ETを補正してもよい。
キーワード抽出部10は、開始時刻キーワードBTK及び終了時刻キーワードETKの選択に用いられたテキストの中から、行動キーワードKAを選択する。ここでキーワード抽出部10は、形態素解析、係り受け解析、及び格フレーム解析を用いて、行動キーワードKAを選択する。
キーワード抽出部10は、ラベルセグメントBについて、開始時刻キーワードBTK及び終了時刻キーワードETKの選択に用いられたテキスト「18時に錠剤Aを服用した」の中から行動キーワードKAとして、「錠剤A」、及び「服用」を選択する。
キーワード抽出部10は、ラベルセグメントCについて、開始時刻キーワードBTK及び終了時刻キーワードETKの選択に用いられたテキスト「19時にトイレに行こうとした際にスリッパを上手く履けず、ふらついて転びそうになった。スリッパの使用の可否について被介護者と相談した」の中から行動キーワードKAとして、「トイレ」、「行こう」、「スリッパ」、「履けず」を選択する。
キーワード抽出部10は、ラベルセグメントDについて、開始時刻キーワードBTK及び終了時刻キーワードETKの選択に用いられたテキスト「20時すぎ就寝」の中から行動キーワードKAとして、「就寝」を選択する。
図5に示す例では、キーワード抽出部10は、「夕食」、及び「食欲」を「食事」として集約する。キーワード抽出部10は、「錠剤A」、及び「服用」を「服用」として集約する。キーワード抽出部10は、「トイレ」、「行こう」、「スリッパ」、「履けず」、「ふらついて」、及び「転び」を「トイレ」として集約する。
キーワード抽出部10は、上述の処理により選択した行動キーワードKAを教師ラベル候補LCとして抽出する。
キーワード抽出部10は、生成したラベルセグメントLSを選択用教師データ生成部140及び時刻補正部142に供給する。選択用教師データ生成部140は、キーワード抽出部10が供給するラベルセグメントLSを取得する。選択用教師データ生成部140は、特徴量計算部13が供給する特徴量ベクトルFVを取得する。
なお、教師ラベル候補確率分布PAは正規化される。
選択用教師データ生成部140は、生成した選択用教師データLTDを複数ラベル学習選択部141に供給する。
複数ラベル学習選択部141は、算出した第1確率分布に基づいて第2確率分布を算出する。ここで第2確率分布とは、選択用教師データLTDに含まれる特徴量ベクトルFVが与えられたときの、この特徴量ベクトルFVに対応する時刻における教師ラベル候補LCjが示す行動の確率分布である。
複数ラベル学習選択部141は、ある時刻における複数の教師ラベル候補LC2i(i=1、2、…)を生成する。ここで、複数ラベル学習選択部141は、生成した複数の教師ラベル候補LC2i(i=1、2、…)が示す行動の割合を、算出した第2確率分布に基づいて決定する。
複数ラベル学習選択部141は、生成したある時刻における複数の教師ラベル候補LC2i(i=1、2、…)の各々と、この時刻に対応する特徴量ベクトルFVとを組にすることにより第2選択用教師データLTD2を生成する。複数ラベル学習選択部141は、生成した第2選択用教師データLTD2を、選択用教師データLTDの代わりに用いて、第1確率分布を算出する。複数ラベル学習選択部141は、第2確率分布が収束するまで上記の処理を繰り返す。
ここで、複数ラベル学習選択部141は、複数ラベル学習選択部141が選択した未補正教師ラベルULLは時刻毎に与えられている。複数ラベル学習選択部141は、未補正教師ラベルULLを時刻毎に並べたときに、互いに異なる行動を示す未補正教師ラベルULLが隣り合っている箇所を判定することにより、未補正教師ラベルULLが示す行動の開始時刻及び終了時刻を判定する。複数ラベル学習選択部141は、判定結果に基づいて行動の開始時刻及び終了時刻を選択する。
時刻補正部142は、ある時間間隔に対応する行動量を生成する。ここで、ある時間間隔に対応する行動量とは、ある時間間隔の各時刻における未補正教師ラベルULLを未補正教師ラベルULLが示す行動毎に数えた量である。時刻補正部142は、生成した行動量を尤度として用いる。ここで尤度とは、ある時間間隔が未補正セグメントDSの時間区間INの間に含まれる尤度である。
時刻補正部142は、時刻Tを、時刻C1と、ラベルセグメントLS2の時間区間IN2の中点に対応する時刻C2との間の区間において変化させたときに、行動量が最大となる時刻Tを判定する。
時刻補正部142は、時間のずれを補正した未補正セグメントDSに含まれる未補正教師ラベルULLを、この未補正セグメントDSの時間区間に含まれる各時刻における教師ラベルLLとして選択する。時刻補正部142は、選択した教師ラベルLLと、時間のずれを補正した未補正セグメントDSに含まれる行動の開始時刻及び終了時刻とを組にして補正セグメントCSを生成する。時刻補正部142は、生成した補正セグメントCSを教師データ生成部15に供給する。
教師データ生成部15は、時刻毎のサンプルSM1、サンプルSM2、…から教師データTDを生成する。教師データ生成部15は、生成した教師データTDを行動推定装置4に供給する。
図7は、本実施形態に係る行動推定装置4の推定処理の一例を示す図である。図7に示す処理は、図3に示す処理により学習モデルLMが生成された後に実行される。
なお、ステップS110、ステップS120、ステップS130、ステップS140、及びステップS150の各処理は、図3におけるステップS10、ステップS20、ステップS30、ステップS40、及びステップS50の各処理と同様であるため、説明を省略する。
以上に説明したように、本実施形態に係るラベル付与装置1は、センサが検出したデータから行動の時系列を推定するための機械学習の学習に用いられる教師データのラベル付与装置であって、キーワード抽出部10と、選択部14とを備える。
キーワード抽出部10は、行動が自然言語テキスト形式で記録されたテキストデータTXに含まれる行動を示す行動キーワードKAを教師ラベルの候補である教師ラベル候補LCとして抽出する。
選択部14は、キーワード抽出部10が抽出した教師ラベル候補LCの中から、行動が行われた時刻の候補を示す時刻情報TIに対応する教師ラベルLLを選択する。
この構成により、本実施形態に係るラベル付与装置1は、教師ラベルLLが示す行動についての開始時刻または終了時刻の精度を高めることができるため、ラベル付与装置1が生成する教師データTDを用いて学習される学習モデルLMの予測精度を高めることができる。
この構成により、本実施形態に係るラベル付与装置1は、同義語を集約して教師ラベル候補LCを抽出することができるため、テキストデータTXから教師ラベル候補LC)を抽出する際の効率を、同義語を集約しない場合に比べて高めることができる。
この構成により、本実施形態に係るラベル付与装置1は、テキストデータTXから教師ラベル候補LCを抽出する際に、形態素解析、係り受け解析、格フレーム解析を用いることができるため、ラベル付与装置1が生成する教師データTDを用いて学習される学習モデルLMの予測精度を、形態素解析、係り受け解析、格フレーム解析のいずれかの手法を用いない場合に比べて高めることができる。
この構成により、本実施形態に係るラベル付与装置1は、テキストデータTXから抽出される教師ラベル候補LCから教師ラベルLLを選択する精度を高めることができるため、ラベル付与装置1が生成する教師データTDを用いて学習される学習モデルLMの予測精度を高めることができる。
また、選択部14は、選択部14が教師ラベルの候補(教師ラベル候補LC)を選択する方法は実施形態において説明した教師あり学習(選択用学習ML14)以外の方法を用いてもよい。
例えば、選択部14は、キーワード抽出部10がテキストデータTXから抽出した教師ラベル候補LC1を、過去に教師ラベル候補LC1が抽出された頻度を示す履歴情報に基づいて選択してもよい。選択部14は、例えば、キーワード抽出部10が過去に抽出した教師ラベル候補LC1をデータベースに履歴情報として記憶させて、この履歴情報に基づいて教師ラベル候補LC1が抽出された頻度を算出する。ここでキーワード抽出部10が過去に抽出した教師ラベル候補LC1とは、キーワード抽出部10が教師ラベル候補LC1を抽出する処理を行うタイミングより以前に抽出された教師ラベル候補LC1である。また、選択部14は、データベースに記憶された履歴情報に基づく代わりに、テキストデータTXから抽出した教師ラベル候補LC1の中から、教師ラベル候補LC1が抽出された頻度を算出してもよい。
また、上述した実施形態におけるラベル付与装置1及び行動推定装置4の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。ラベル付与装置1及び行動推定装置4の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
Claims (7)
- センサが検出したデータから行動の時系列を推定するための機械学習の学習に用いられる教師データのラベル付与装置であって、
前記行動が自然言語テキスト形式で記録されたテキストデータに含まれる前記行動を示す行動キーワードを教師ラベルの候補である教師ラベル候補として抽出するキーワード抽出部と、
前記キーワード抽出部が抽出した前記教師ラベル候補の中から、前記行動が行われた時刻の候補を示す時刻情報に対応する前記教師ラベルを選択する選択部と、
を備えるラベル付与装置。 - 前記キーワード抽出部は、前記テキストデータから前記時刻情報を抽出する
請求項1に記載のラベル付与装置。 - 前記キーワード抽出部は、抽出した前記教師ラベル候補において、1つの前記行動に対して複数の前記教師ラベル候補があるときは、複数の前記教師ラベル候補よりも少ない個数の前記教師ラベル候補を抽出する
請求項1または請求項2に記載のラベル付与装置。 - 前記キーワード抽出部は、形態素解析、係り受け解析、及び格フレーム解析のいずれかの手法を使って前記教師ラベル候補を抽出する
請求項3に記載のラベル付与装置。 - 前記選択部は、前記キーワード抽出部が抽出した前記教師ラベル候補の中から前記教師ラベルを、教師あり学習を用いて選択する
請求項1から請求項4のいずれか一項に記載のラベル付与装置。 - センサが検出したデータから行動の時系列を推定するための機械学習の学習に用いられる教師データのラベル付与方法であって、
前記行動が自然言語テキスト形式で記録されたテキストデータに含まれる前記行動を示す行動キーワードを教師ラベルの候補である教師ラベル候補として抽出するキーワード抽出過程と、
前記キーワード抽出過程において抽出された前記教師ラベル候補の中から、前記行動が行われた時刻の候補を示す時刻情報に対応する前記教師ラベルを選択する選択過程と、
をコンピュータが実行するラベル付与方法。 - センサが検出したデータから行動の時系列を推定するための機械学習の学習に用いられる教師データのラベル付与を行うコンピュータに、
前記行動が自然言語テキスト形式で記録されたテキストデータに含まれる前記行動を示す行動キーワードを教師ラベルの候補である教師ラベル候補として抽出するキーワード抽出ステップと、
前記キーワード抽出ステップにおいて抽出された前記教師ラベル候補の中から、前記行動が行われた時刻の候補を示す時刻情報に対応する前記教師ラベルを選択する選択ステップと、
を実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018000806 | 2018-01-05 | ||
JP2018000806 | 2018-01-05 | ||
PCT/JP2018/048551 WO2019135403A1 (ja) | 2018-01-05 | 2018-12-28 | ラベル付与装置、ラベル付与方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019135403A1 JPWO2019135403A1 (ja) | 2020-12-17 |
JP7239991B2 true JP7239991B2 (ja) | 2023-03-15 |
Family
ID=67143710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019563982A Active JP7239991B2 (ja) | 2018-01-05 | 2018-12-28 | ラベル付与装置、ラベル付与方法、及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200387670A1 (ja) |
JP (1) | JP7239991B2 (ja) |
CN (1) | CN112020707A (ja) |
WO (1) | WO2019135403A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230061026A1 (en) * | 2020-03-13 | 2023-03-02 | Nec Corporation | Training data generation device, training data generation method, and programrecording medium |
WO2021260836A1 (ja) * | 2020-06-24 | 2021-12-30 | 日本電気株式会社 | 学習モデル生成装置、ストレス推定装置、学習モデル生成方法、ストレス推定方法、及びコンピュータ読み取り可能な記録媒体 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013246683A (ja) | 2012-05-28 | 2013-12-09 | Sony Corp | 情報処理装置、情報処理方法、および、プログラム |
JP2013254372A (ja) | 2012-06-07 | 2013-12-19 | Sony Corp | 情報処理装置、電子機器、情報処理方法、及びプログラム |
US20150318015A1 (en) | 2010-08-26 | 2015-11-05 | Blast Motion Inc. | Multi-sensor event detection system |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10275154A (ja) * | 1997-03-28 | 1998-10-13 | Sumitomo Metal Ind Ltd | 言語辞典制作支援システム及び言語辞典制作支援方法 |
JP2012003494A (ja) * | 2010-06-16 | 2012-01-05 | Sony Corp | 情報処理装置、情報処理方法及びプログラム |
WO2012061462A1 (en) * | 2010-11-05 | 2012-05-10 | Rakuten, Inc. | Systems and methods regarding keyword extraction |
JP2015087903A (ja) * | 2013-10-30 | 2015-05-07 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
US20150199965A1 (en) * | 2014-01-16 | 2015-07-16 | CloudCar Inc. | System and method for recognition and automatic correction of voice commands |
US10089580B2 (en) * | 2014-08-11 | 2018-10-02 | Microsoft Technology Licensing, Llc | Generating and using a knowledge-enhanced model |
US9812128B2 (en) * | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
JP6783443B2 (ja) * | 2015-04-06 | 2020-11-11 | 国立研究開発法人産業技術総合研究所 | 情報処理装置、情報処理システム、情報処理方法、プログラム、及び記録媒体 |
US9818414B2 (en) * | 2015-06-04 | 2017-11-14 | Intel Corporation | Dialogue system with audio watermark |
CN107092592B (zh) * | 2017-04-10 | 2020-06-05 | 浙江鸿程计算机系统有限公司 | 一种基于多情境数据和代价敏感集成模型的场所个性化语义识别方法 |
WO2019011356A1 (de) * | 2017-07-14 | 2019-01-17 | Cognigy Gmbh | Verfahren zur dialogführung zwischen mensch und computer |
JP6994874B2 (ja) * | 2017-08-31 | 2022-01-14 | リオン株式会社 | アノテーション装置および騒音測定システム |
CN116705020A (zh) * | 2017-12-08 | 2023-09-05 | 谷歌有限责任公司 | 使设备与环境中的多个设备隔离以响应口头助理调用 |
US10536287B1 (en) * | 2017-12-13 | 2020-01-14 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
CN110574105B (zh) * | 2018-03-07 | 2024-01-23 | 谷歌有限责任公司 | 用于基于语音发起定制装置动作的系统和方法 |
US10685652B1 (en) * | 2018-03-22 | 2020-06-16 | Amazon Technologies, Inc. | Determining device groups |
US10832679B2 (en) * | 2018-11-20 | 2020-11-10 | International Business Machines Corporation | Method and system for correcting speech-to-text auto-transcription using local context of talk |
US11210059B2 (en) * | 2019-06-25 | 2021-12-28 | International Business Machines Corporation | Audible command modification |
US11562735B1 (en) * | 2020-03-31 | 2023-01-24 | Amazon Technologies, Inc. | Multi-modal spoken language understanding systems |
-
2018
- 2018-12-28 WO PCT/JP2018/048551 patent/WO2019135403A1/ja active Application Filing
- 2018-12-28 CN CN201880085379.7A patent/CN112020707A/zh active Pending
- 2018-12-28 JP JP2019563982A patent/JP7239991B2/ja active Active
- 2018-12-28 US US16/959,596 patent/US20200387670A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150318015A1 (en) | 2010-08-26 | 2015-11-05 | Blast Motion Inc. | Multi-sensor event detection system |
JP2013246683A (ja) | 2012-05-28 | 2013-12-09 | Sony Corp | 情報処理装置、情報処理方法、および、プログラム |
JP2013254372A (ja) | 2012-06-07 | 2013-12-19 | Sony Corp | 情報処理装置、電子機器、情報処理方法、及びプログラム |
Non-Patent Citations (2)
Title |
---|
亀井 剛次 外5名,センサデータ解釈のための拡張可能な知識構築手法,情報処理学会研究報告,社団法人情報処理学会,2008年05月08日,第2008巻,第40号,p.47-54 |
村上 知子、外3名,トピックモデルによるセンサ情報からの看護業務の推定,一般社団法人人工知能学会 研究会 DOCMAS:データ指向構成マイニングとシミュレーション研究会 S,日本,一般社団法人人工知能学会,2017年10月18日 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2019135403A1 (ja) | 2020-12-17 |
CN112020707A (zh) | 2020-12-01 |
US20200387670A1 (en) | 2020-12-10 |
WO2019135403A1 (ja) | 2019-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11881293B2 (en) | Methods for automatic cohort selection in epidemiologic studies and clinical trials | |
Caballero Barajas et al. | Dynamically modeling patient's health state from electronic medical records: A time series approach | |
US9165116B2 (en) | Patient data mining | |
CN109426834B (zh) | 信息处理装置、信息处理方法和信息处理系统 | |
CN112204671A (zh) | 用于主动健康监测和管理的个性化设备推荐 | |
Dorfman et al. | Making the subjective objective: machine learning and rhinoplasty | |
JP6657210B2 (ja) | テキスト認識に基づくテキストイメージリンキングを伴うピクチャアーカイビングシステム | |
US8352408B2 (en) | System and methods for providing integrated wellness assessment | |
JPWO2016120955A1 (ja) | 行動予測装置、行動予測装置の制御方法、および行動予測装置の制御プログラム | |
Alsharid et al. | Captioning ultrasound images automatically | |
JP7239991B2 (ja) | ラベル付与装置、ラベル付与方法、及びプログラム | |
Gaber et al. | Classification of facial paralysis based on machine learning techniques | |
Yang et al. | Deep learning application in spinal implant identification | |
Kueper | Primer for artificial intelligence in primary care | |
CN116312926A (zh) | 健康路径推荐方法及相关装置、电子设备和存储介质 | |
WO2012121055A1 (ja) | 情報提供装置、情報提供方法、および、記憶媒体 | |
JP2022504508A (ja) | モデル支援型事象予測のためのシステム及び方法 | |
US20230015122A1 (en) | Aortic stenosis classification | |
CN112507722B (zh) | 电子病历内涵质控方法和装置 | |
JP2016133821A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP4499542B2 (ja) | 医療情報処理装置、および、プログラム | |
Haberfehlner et al. | A Novel Video-Based Methodology for Automated Classification of Dystonia and Choreoathetosis in Dyskinetic Cerebral Palsy During a Lower Extremity Task | |
JP5119821B2 (ja) | 同義疾患名選定装置 | |
JP5201290B2 (ja) | 疾患名選定装置 | |
Maeda et al. | Comparing methods for using invalid days in accelerometer data to improve physical activity measurement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20200715 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20200715 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230224 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7239991 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |