JP2016058027A - データ処理装置、データ処理方法、およびプログラム - Google Patents

データ処理装置、データ処理方法、およびプログラム Download PDF

Info

Publication number
JP2016058027A
JP2016058027A JP2014186308A JP2014186308A JP2016058027A JP 2016058027 A JP2016058027 A JP 2016058027A JP 2014186308 A JP2014186308 A JP 2014186308A JP 2014186308 A JP2014186308 A JP 2014186308A JP 2016058027 A JP2016058027 A JP 2016058027A
Authority
JP
Japan
Prior art keywords
data
series
unit
data series
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014186308A
Other languages
English (en)
Other versions
JP5936240B2 (ja
Inventor
哲郎 森村
Tetsuo Morimura
哲郎 森村
孝行 勝木
Takayuki Katsuki
孝行 勝木
佐藤 大介
Daisuke Sato
大介 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2014186308A priority Critical patent/JP5936240B2/ja
Priority to US14/849,920 priority patent/US10108296B2/en
Publication of JP2016058027A publication Critical patent/JP2016058027A/ja
Application granted granted Critical
Publication of JP5936240B2 publication Critical patent/JP5936240B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/2163Partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】発生時刻が時間的に不規則な現象を示す時系列のデータから、特徴ベクトルを生成して特徴を検出する。
【解決手段】複数のデータが配列されたデータ系列を取得する系列取得部と、データ系列を断片化して、複数の部分データ系列を得る断片化部と、複数の部分データ系列の少なくとも1つに出現する1以上のデータのパターンを複数抽出するパターン抽出部と、複数の部分データ系列のそれぞれについて、複数のパターンのそれぞれを含むか否かに応じて異なる要素値を有する特徴ベクトルを生成する生成部と、を備えるデータ処理装置、データ処理方法、およびプログラムを提供する。
【選択図】図1

Description

本発明は、データ処理装置、データ処理方法、およびプログラムに関する。
従来、ユーザの習熟度等に応じて、操作説明画像を表示する操作表示装置、および情報を提供する情報提供装置が知られている。このような装置は、ユーザの操作速度、反応時間等のユーザ特性を測定し、ユーザの習熟度を判別していた(例えば、特許文献1〜6参照)。
特許文献1 特開2010−122748号公報
特許文献2 特開2006−72666号公報
特許文献3 特開2010−185686号公報
特許文献4 特開2014−16781号公報
特許文献5 特開2013−4087号公報
特許文献6 特開2012−79200号公報
このような装置において、操作するユーザの入力から当該ユーザの状態を推定し、推定結果に応じて操作説明および情報等を提供することが望ましい。しかしながら、ユーザの入力動作等は、発生時刻が時間的に不規則(確率的)な現象なので、時系列のデータにした動作を、解析する方法が確立していなかった。特に、発生時刻が時間的に不規則な現象を示す時系列のデータから、ユーザの操作入力の特徴を検出することは困難であった。
本発明の第1の態様においては、複数のデータが配列されたデータ系列を取得する系列取得部と、データ系列を断片化して、複数の部分データ系列を得る断片化部と、複数の部分データ系列の少なくとも1つに出現する1以上のデータのパターンを複数抽出するパターン抽出部と、複数の部分データ系列のそれぞれについて、複数のパターンのそれぞれを含むか否かに応じて異なる要素値を有する特徴ベクトルを生成する生成部と、を備えるデータ処理装置、データ処理方法、およびプログラムを提供する。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
本実施形態に係るデータ処理装置100の構成例を示す。 本実施形態に係るデータ処理装置100の動作フローを示す。 本実施形態に係る系列取得部110が取得するデータ系列の一例を示す。 本実施形態に係る離散化部130が生成した離散値データの一例を示す。 本実施形態に係る断片化部140がデータ系列を断片化した部分データ系列の一例を示す。 本実施形態に係るデータ処理装置100の変形例を示す。 本実施形態に係るデータ処理装置100として機能するコンピュータ1900のハードウェア構成の一例を示す。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、本実施形態に係るデータ処理装置100の構成例を示す。データ処理装置100は、発生間隔が不規則で確率的な現象を示す時系列のデータを断片化し、断片化した部分データ系列に出現するパターンの有無または出現回数に応じて特徴ベクトルを生成し、特徴ベクトルに応じて部分データ系列を分類する。データ処理装置100は、系列取得部110と、記憶部120と、離散化部130と、断片化部140と、パターン抽出部150と、生成部160と、分類部170と、を備える。
系列取得部110は、複数のデータが配列されたデータ系列を取得する。データ系列は、携帯端末、操作表示装置、および情報提供装置等を操作するユーザの入力を、予め定められた多次元空間のデータに変換した時系列のデータである。例えば、ユーザの入力動作をイベントとした場合、データ系列に複数のイベントに応じた複数のデータが配列される。系列取得部110は、時系列のデータのうち、1以上のデータに対応する分類結果または分類すべき結果の情報を、当該データと対応付けて取得してもよい。
データ系列は、例えば、ユーザがタッチパネルを指で触れた座標、触れた時間、触れた指の本数、触れたまま移動させた移動前後の座標、移動距離、移動させた時間、触れてから離間するまでの時間、操作しない時間、操作メニューのいずれを選択したか、タップ、ダブルクリック、スワイプ、ピンチインおよびピンチアウト等のユーザの動作を、それぞれ数値に変換し、当該数値を要素とする多次元ベクトルのデータが時系列に並ぶ。系列取得部110は、少なくとも1次元の連続値を含む連続値データが配列されたデータ系列を取得する。
系列取得部110は、ユーザが操作する装置等の入力部に接続され、データ系列を取得する。ここで、データ処理装置100は、ユーザが操作する装置等の内部に組み込まれてもよい。これに代えて、系列取得部110は、予め定められた形式で記憶されたデータ系列を読み出して取得してもよい。また、系列取得部110は、ネットワーク等に接続され、当該ネットワークを介してデータ系列を取得してもよい。系列取得部110は、取得したデータ系列を記憶部120および/または離散化部130に供給する。
記憶部120は、系列取得部110に接続され、系列取得部110から受け取ったデータ系列を記憶する。また、記憶部120は、データ処理装置100がデータ系列を処理する過程における中間データ、算出結果、およびパラメータ等をそれぞれ記憶してもよい。また、記憶部120は、データ処理装置100内の各部の要求に応じて、記憶したデータを要求元に供給してよい。例えば、記憶部120は、系列取得部110に接続され、系列取得部110からデータ系列を受け取る場合、当該データ系列を記憶する。そして、記憶部120は、離散化部130の要求に応じて記憶したデータ系列を当該離散化部130に供給する。
離散化部130は、受けとった連続値データのデータ系列を離散化して、離散値データのデータ系列を生成する。離散化部130は、データ系列に含まれる連続値の要素を、予め定められた閾値と比較することで離散化させ、離散値データを生成する。これに代えて、離散化部130は、K平均法等の既知のアルゴリズムを用いて、K個のクラスタに離散化させてよい。これに代えて、離散化部130は、SAX(Symbolic Aggregate approXimation)等の、時系列データを離散化させる既知の離散化手法を用いて、離散化させてもよい。離散化部130は、離散値データのデータ系列を断片化部140に供給する。
断片化部140は、離散化部130に接続され、受けとった離散値データのデータ系列を断片化して、複数の部分データ系列を得る。断片化部140は、予め定められた基準時間である窓幅を有する時間窓を用いて、離散値データのデータ系列を断片化する。これに代えて、断片化部140は、予め定められた基準個数のデータ毎に、離散値データのデータ系列を断片化してもよい。ここで、予め定められる基準時間および基準個数は、ユーザが設定する設定パラメータであり、当該設定パラメータは記憶部120に記憶されてよい。
断片化部140は、断片化したデータ系列に含まれる一部のデータが、他の断片化したデータ系列に含まれるように断片化してよい。断片化部140は、断片化したデータ系列をパターン抽出部150に供給する。
パターン抽出部150は、断片化部140に接続され、受けとった断片化した複数の部分データ系列の少なくとも1つに出現する1以上のデータのパターンを複数抽出する。パターン抽出部150は、例えば、断片化した複数の部分データ系列のうち、予め定められた基準数以上の部分データ系列に出現するパターンを複数抽出する。ここで、予め定められる基準数は、ユーザが設定する設定パラメータである。パターン抽出部150は、抽出した複数のパターンを生成部160に供給する。
生成部160は、パターン抽出部150に接続され、複数の部分データ系列のそれぞれについて、例えば、複数のパターンのそれぞれを含むか否かに応じて異なる要素値を有する特徴ベクトルを生成する。生成部160は、複数の部分データ系列のそれぞれについて、複数のパターンのそれぞれの有無を示す要素値を有する特徴ベクトルを生成してもよい。これに代えて、生成部160は、特徴ベクトルの要素値を、パターンの個数を表す要素値として生成してよい。また、生成部160は、複数のパターンのそれぞれを予め定められた個数以上含むか否かを示す要素値を有する特徴ベクトルを生成してもよい。生成部160は、生成した特徴ベクトルを分類部170に供給する。
分類部170は、生成部160に接続され、複数の部分データ系列のそれぞれを、受けとった特徴ベクトルに基づいて分類する。また、分類部170は、系列取得部110が複数のイベントに応じた複数のデータが配列されたデータ系列を取得する場合、複数の部分データ系列のそれぞれについて、異常なイベントが発生したか否かを推定してよい。
分類部170は、例えば、部分データ系列に対応するユーザの入力が、予め想定された入力動作の範囲内であるか否かを分類する。また、分類部170は、部分データ系列に対応するユーザの状態が、操作説明および情報等を提供すべきか否かを分類してよい。分類部170は、一例として、学習データ等によって学習可能な分類モデルである。
以上の本実施形態に係るデータ処理装置100は、携帯端末等を操作するユーザの入力をデータ系列として取得し、取得したデータ系列を部分データ系列に断片化してから、ユーザの入力の特徴を検出する特徴ベクトルを生成する。そして、当該データ処理装置100は、特徴ベクトルに応じて、ユーザの入力動作の異常を検出する。データ処理装置100の検出動作について、図2を用いて説明する。
図2は、本実施形態に係るデータ処理装置100の動作フローを示す。データ処理装置100は、図2に示す動作フローを実行して、ユーザの入力動作の異常を検出する。本実施形態において、データ処理装置100は、スマートフォン等の携帯端末に搭載され、ユーザの当該携帯端末を操作する動作の異常を検出する例を説明する。
まず、系列取得部110は、データ系列を取得する(S200)。系列取得部110は、予め定められた時間毎にユーザの入力操作に応じたデータ系列を取得してよい。本実施形態のデータ処理装置100は、系列取得部110が、図3に示すデータ系列を取得する例を説明する。
図3は、本実施形態に係る系列取得部110が取得するデータ系列の一例を示す。図3の横軸は経過時間、縦軸はデータ系列のデータに含まれる1つの要素の値を示す。即ち、図3は、1つの要素を有するデータが時系列に並ぶデータ系列を示す。ここで、図3は、データ系列の概略構成を示す目的で1つの要素について示したが、データ系列のデータには、複数の要素を有する。即ち、データ系列のデータは多次元ベクトルとなるが、本実施形態の説明においては、多次元の要素のうちの1つをデータ系列のデータの例として示す。
図3に示すように、系列取得部110は、データの発生間隔が時間的に一定ではないデータ系列を取得する。即ち、ユーザの操作入力は、一定時間毎に入力される場合はほとんどなく、データ系列は、このような操作入力に応じたデータであるので、データの時間間隔は不規則なものとなる。また、図3は、系列取得部110が、連続値のデータ系列を取得する例を示す。例えば、系列取得部110は、ユーザがタッチパネルを指で触れた時間、触れたまま移動させた時間、移動させた距離、触れてから離間するまでの時間、操作しない時間等に応じたデータを、時系列に並べたデータ系列を取得する。
次に、離散化部130は、離散値データを生成する(S210)。図4は、本実施形態に係る離散化部130が生成した離散値データの一例を示す。図4は、図3と同様に、横軸は経過時間、縦軸はデータ系列の要素の値を示す。図4は、離散化部130が予め定められた閾値を用いて、離散値データを生成した例を示す。
離散化部130は、例えば、閾値th1以上の要素を有するデータをAとする。また、離散化部130は、閾値th2以上、かつ、閾値th1未満の要素を有するデータをBとする。また、離散化部130は、閾値th3以上、かつ、閾値th2未満の要素を有するデータをCとする。また、離散化部130は、閾値th3未満の要素を有するデータをDとする。以上のように、離散化部130は、「DCCABCBBB」と並ぶ離散値のデータ系列を生成する。ここで、予め定められた閾値は、設定パラメータでよい。
次に、断片化部140は、データ系列を断片化する(S220)。図5は、本実施形態に係る断片化部140がデータ系列を断片化した部分データ系列の一例を示す。図5において、横軸は経過時間を示す。図5は、断片化部140が予め定められた基準時間である窓幅を有する時間窓を用いて、データ系列を断片化した例を示す。断片化部140は、一例として、データまたはイベントが発生する時刻から基準時間前までに発生したデータを含めたデータ系列を、部分データ系列とする。図5は、基準時間を略10秒とした例を示す。
断片化部140は、一例として、ユーザの操作順に、部分データ系列を生成する例を説明する。断片化部140は、最初の入力操作に対応するデータDについて、当該Dの入力よりも前の10秒間に操作入力がなかったことに応じて、データDを含む部分データ系列Sを生成する。次に、断片化部140は、次の入力操作に対応するデータCについて、当該Cの入力よりも前の10秒間の操作入力がDであることに応じて、データCおよびDを含む部分データ系列Sを生成する。このように、断片化部140は、時系列に並ぶデータ毎にデータ系列を断片化し、部分データ系列S〜Sを生成する。
次に、パターン抽出部150は、部分データ系列に出現するデータのパターンを抽出する(S230)。ここで、パターン抽出部150が、複数の部分データ系列のうち、予め定められた基準数以上の部分データ系列に出現するパターンを複数抽出する例を説明する。パターン抽出部150は、一例として、部分データ系列に3回以上出現するパターンを抽出する。
パターン抽出部150は、例えば、部分データ系列S、S、およびSに、パターン「D」が出現することに応じて、パターン「D」を頻出パターンとして抽出する。同様に、パターン抽出部150は、パターン「A」、「B」、および「C」を頻出パターンとして抽出する。その一方、パターン抽出部150は、パターン「CC」が部分データ系列SおよびSの合計2回出現するが、他の部分データ系列には出現しないので、パターン「CC」は頻出パターンとして抽出しない。このようにして、パターン抽出部150は、ユーザの操作の特徴的なパターンを、部分データ系列に複数回出現するパターンとして抽出する。
ここで、パターン抽出部150は、少なくとも1つのパターンとして、パターンの端部のデータが特定され、パターンの端部以外の少なくとも一部においてデータが特定されていないパターンを抽出してもよい。即ち、パターン抽出部150は、少なくとも1つのパターンとして、特定したパターンの端部と、パターンの端部以外の少なくとも一部とを、パターンとして抽出してよい。例えば、パターン抽出部150は、部分データ系列SのデータBCBに応じて、パターンの端部を「B」と特定し、パターンの端部以外のデータCBからパターン「B」(およびパターン「C」)を抽出して、パターン「BB」(およびパターン「BC」)が出現したとする。即ち、パターン抽出部150は、データBCBに対して、パターン「B」、「C」、「BC」、「CB」、「BB」、および「BCB」が出現したとする。
これにより、パターン抽出部150は、部分データ系列S、S、およびSに、パターン「BB」が出現することに応じて、当該パターン「BB」を頻出パターンとして抽出する。このように、パターン抽出部150は、ユーザが「BB」と操作したい場合に、実際に「BB」と操作した結果と、操作ミス等で「BCB」等に操作した結果とを分離せずに、略同一の操作の特徴として抽出する。また、パターン抽出部150は、ユーザが入力操作に混乱、困難、および失敗等のつまずきが生じ、特徴的な操作をする場合の操作がパターン「BB」である場合でも、同様に、他の操作等が間に入力されたパターン(例えば、「BACB」)と特徴を分離せず、略同一の特徴が出現したとする。
以上のように、本実施形態に係るパターン抽出部150は、ユーザの誤入力等を含め、部分データ系列に3回以上出現するデータのパターンとして、パターン「A」、「B」、「C」、「D」、および「BB」の5つのパターンを抽出する。なお、パターン抽出部150のパターンの抽出は、部分データ系列に出現したパターンのそれぞれについて逐次的に出現数をカウントしてもよく、PrefixSpan等の頻出パターンマイニングとして既知のアルゴリズム等を用いて実行してもよい。
次に、生成部160は、パターン抽出部150が抽出したパターンに基づき、部分データ系列のそれぞれに対応する特徴ベクトルを生成する(S240)。本実施形態に係る生成部160は、一例として、特徴ベクトルの要素の個数を、抽出されたパターンの数(本例の場合、5)と同一にする。そして、生成部160は、1番目の要素をパターン「A」に対応させ、部分データ系列が当該パターン「A」を含む場合に1番目の要素を1に、含まない場合に1番目の要素を0とする。同様に、生成部160は、2から5番目の要素を順にパターン「B」、「C」、「D」、および「BB」に対応させ、部分データ系列が含むパターンに応じて、対応する要素の1および0の値を決定する。
生成部160は、例えば、部分データ系列Sが、パターン「D」を含み、その他のパターン「A」、「B」、「C」、および「BB」を含まないことに応じて、パターン「D」に対応する4番目の要素を1としたベクトル[0,0,0,1,0]を、特徴ベクトルφ(S)として生成する。ここで、φ(x)は、部分データ系列xに対する特徴ベクトルを示す。このように、生成部160は、それぞれの部分データ系列に対して、次式のように特徴ベクトルを生成する。
(数1)
φ(S)=[0,0,0,1,0]
φ(S)=[0,0,1,1,0]
φ(S)=[0,0,1,1,0]
φ(S)=[1,0,1,0,0]
φ(S)=[1,1,1,0,0]
φ(S)=[1,1,1,0,0]
φ(S)=[0,1,1,0,1]
φ(S)=[0,1,0,0,1]
φ(S)=[0,1,0,0,1]
次に、分類部170は、生成部160が生成した特徴ベクトルに応じて、部分データ系列をそれぞれ分類する。分類部170は、生成部160が部分データ系列に対応する特徴ベクトルを生成しているので、サポートベクターマシン(SVM:Support Vector Machine)、およびロジスティック回帰等の既知の分類モデルによる識別手法を用いて、部分データ系列を分類することができる。
分類部170は、分類したそれぞれのグループの特徴を、当該グループに含まれる部分データ系列の特徴としてよい。即ち、分類部170は、部分データ系列がユーザによって入力された時刻における当該ユーザの状態を、当該グループの特徴とする。当該グループの特徴は、分類された部分データ系列を解析することにより、個別に割り当てられてよい。例えば、同一の動作を繰り返し操作することのない状況において、同一の動作を繰り返している部分データ系列のグループを、ユーザがつまずいている状況とする。
また、系列取得部110が、時系列のデータのうち、1以上のデータに対応する分類結果または分類すべき結果の情報を、当該データと対応付けて取得した場合、分類部170は、分類したそれぞれのグループの特徴を、当該グループに含まれる部分データ系列に対応する分類結果の情報に基づいて判断してよい。例えば、系列取得部110は、図3において、時系列データの最初の6点(図3の白丸のデータ)を、ユーザが順調に操作している通常状態であり、次の3点(図3の黒丸のデータ)を、ユーザがつまずいている状態であることを示す情報と共に、時系列データを取得する。
この場合、分類部170は、例えば、ユーザがつまずいている状態を示すデータBが出現するパターン「B」および「BB」をより多く含む特徴ベクトル(φ(S)、φ(S)、およびφ(S))を有するグループの特徴を、ユーザがつまずいていると予め決定しておく。これによって、データ処理装置100は、当該グループに分類される他の部分データ系列を、ユーザがつまずいていると特徴付けることができ、当該部分データ系列を操作した時刻のユーザの状態を、つまずいていると判断することができる。
また、このように、系列取得部110が、時系列のデータのうち、複数のデータに対応する分類結果または分類すべき結果の情報を、当該データと対応付けて取得する場合、データ処理装置100は、設定パラメータを交差検定により定めてよい。即ち、データ処理装置100は、当該複数のデータのうちの一部を用いて特徴ベクトルを生成し、それぞれの部分データ系列が抽出したパターンを含むか否か等を確認する。データ処理装置100は、確認結果より、ユーザが設定すべき設定パラメータを調整してよい。そして、データ処理装置100は、当該複数のデータのうちの残りの一部を用いて特徴ベクトルを生成し、部分データ系列が抽出したパターンを含むか否か等を確認して、設定パラメータを調整してよい。これにより、データ処理装置100は、分類部170の分類動作を最適化することができる。
以上のように、本実施形態のデータ処理装置100は、時系列データを断片化し、断片化した部分データ系列に出現する頻出パターンを抽出するので、時系列データの各データの発生が時間的に不等間隔であっても、抽出したパターンに応じて特徴ベクトルを生成することができる。これによって、データ処理装置100は、特徴ベクトルに応じて、部分データ系列のそれぞれを特徴付けることができる。したがって、データ処理装置100は、ユーザの入力動作等といった発生時刻が時間的に不規則な現象を、時系列のデータとして表現することで、当該ユーザの状態を推定することができ、推定結果に応じて異常の検出、操作説明の提供、および情報等の提供を実行することができる。
また、本実施形態のデータ処理装置100は、生成部160が既知の識別手法および解析手法等を用いて処理することができる汎用性の高い特徴ベクトルを生成することができる。したがって、データ処理装置100は、他のアルゴリズムおよび他の装置等によって特徴付けられたパラメータ等を、特徴ベクトルの要素として追加してもよい。また、データ処理装置100は、生成した特徴ベクトルを他のアプリケーション等に供給してもよい。この場合、データ処理装置100は、分類部170を備えずに、特徴ベクトルを生成して時系列データを特徴付ける装置として機能してもよい。
以上の本実施形態のデータ処理装置100は、断片化部140が、離散値データのデータ系列を断片化して複数の部分データ系列を得、パターン抽出部150が当該複数の部分データ系列からパターンを抽出する例を説明した。これに代えて、パターン抽出部150は、離散値データの全体のデータ系列からパターンを抽出してもよい。パターン抽出部150は、例えば、データ1点毎に、予め定められた時間まで時系列にさかのぼり、さかのぼった時間の間に発生するデータ系列の中から出現するパターンを抽出する。
パターン抽出部150は、一例として、図4の離散値のデータ系列が入力された場合、まず、データDから予め定められた時間だけ時系列にさかのぼる。データD以前には操作入力がないので、パターン抽出部150は、パターン「D」が出現したとする。次に、パターン抽出部150は、データCから予め定められた時間だけ時系列にさかのぼり、データ列CDからパターン「C」および「D」が出現したとする。次に、パターン抽出部150は、データCから予め定められた時間だけ時系列にさかのぼり、データ列CCDからパターン「C」、「D」、「CC」、「CD」および「CCD」が出現したとする。このように、パターン抽出部150は、時系列に並ぶデータ毎に、パターンの出現を確認し、予め定められた基準数以上のパターンの出現に応じて、頻出パターンを抽出してよい。
また、以上の本実施形態のデータ処理装置100は、パターン抽出部150が、ユーザの誤入力等を含めて、部分データ系列に出現するデータのパターンを抽出する例を説明した。これに代えて、パターン抽出部150は、ユーザの誤入力等を含めずに、データのパターンを抽出してもよい。即ち、パターン抽出部150は、例えば、データ列BCBに対して、パターン「BB」は出現していないとする。
これに代えて、パターン抽出部150は、ユーザが操作するアプリケーションに応じて、ユーザの誤入力を含めるか否かを決定してよい。また、ユーザの誤入力を含めるか否かは、ユーザが設定する設定パラメータであってよく、この場合、パターン抽出部150は、当該設定パラメータの設定に応じて、データのパターンを抽出する。
図6は、本実施形態に係るデータ処理装置100の変形例を示す。本変形例のデータ処理装置100において、図1に示された本実施形態に係るデータ処理装置100の動作と略同一のものには同一の符号を付け、説明を省略する。本変形例のデータ処理装置100は、部分データ系列に対して分類結果を付加しつつ、特徴ベクトルを生成し、当該分類結果および特徴ベクトルを用いて分類部170を学習する。データ処理装置100は、分類生成部310と、学習処理部320とを更に備える。
分類生成部310は、学習用のデータ系列を断片化した学習用の複数の部分データ系列のそれぞれについて、当該部分データ系列に含まれる各データに付加された分類結果から、当該部分データ系列の学習用の分類結果を生成する。この場合、系列取得部110は、複数のデータのそれぞれに分類結果が予め付加された学習用のデータ系列を取得する。分類生成部310は、断片化部140に接続され、断片化部140が断片化した複数の部分データ系列の分類結果をそれぞれ生成する。分類生成部310は、部分データ系列に含まれるデータのそれぞれに付加された分類結果の数に応じて、分類結果を生成してよい。
ここで、図4に示された、時系列に並ぶ離散化されたデータ系列(DCCABCBBB)を用いて、分類生成部310の動作について説明する。データ系列の最初の6つのデータ(DCCABC)はユーザの「通常の操作入力」であり、次の3つのデータ(BBB)はユーザの「操作入力のつまずき」である分類結果が付加されているとする。
例えば、分類生成部310は、部分データ系列S〜Sのそれぞれが有するデータの分類結果が全て「通常の操作入力」であることに応じて、当該部分データ系列S〜Sの分類結果を「通常の操作入力」とする。また、分類生成部310は、部分データ系列Sが有するデータの分類結果のうち、2つが「通常の操作入力」であり、1つが「操作入力のつまずき」であることに応じて、当該部分データ系列Sの分類結果を「通常の操作入力」とする。また、分類生成部310は、部分データ系列SおよびSがそれぞれ有するデータの分類結果が全て「操作入力のつまずき」であることに応じて、当該部分データ系列SおよびSの分類結果を「操作入力のつまずき」とする。
このように、分類生成部310は、部分データ系列に含まれるデータに対応して予め付加された分類結果の数が多い方の分類結果を、当該部分データ系列の分類結果としてよい。これに代えて、または、これに加えて、分類生成部310は、学習用の複数の部分データ系列のそれぞれについて、当該部分データ系列に含まれる各データに予め定められた基準以上に異常を示す分類結果が付加されていることに応じて、当該部分データ系列に対して異常を示す分類結果を割り当てる。
分類生成部310は、一例として、2以上の「操作入力のつまずき」の分類結果が付加されたデータを含む部分データ系列の分類結果を、「操作入力のつまずき」とする。この場合においても、分類生成部310は、部分データ系列SおよびSの分類結果を「操作入力のつまずき」とする。このようにして、分類生成部310は、部分データ系列をより正確に分類結果を付加することができる。
学習処理部320は、予め分類結果が付加された学習用のデータ系列を断片化した複数の部分データ系列に対する複数の特徴ベクトルを用いて、複数の部分データ系列の分類を学習する。学習処理部320は、生成部160に接続され、生成部160が生成した特徴ベクトルおよび分類生成部310が付加した部分データ系列の分類結果を、学習用のデータとして取得する。
学習処理部320は、学習用の複数の部分データ系列のそれぞれに対する特徴ベクトルおよび学習用の分類結果に基づいて、複数の部分データ系列の分類を学習する。学習処理部320は、分類部170に接続され、特徴ベクトルに応じて分類した分類部170の分類結果を取得して、分類部170を学習する。ここで、分類部170は、既知の分類モデルでよい。
例えば、学習処理部320は、取得した学習用のデータ系列をトレーニングデータおよびテストデータのデータ系列に分割する。学習処理部320は、予め定められた割合で、データ系列をトレーニングデータおよびテストデータに分割してよい。そして、学習処理部320は、トレーニングデータを用いて分類部170を学習する。分類部170は、生成部160が生成した特徴ベクトルに応じて、部分データ系列をそれぞれ分類する。分類部170の動作は、図2で説明したので、ここでは省略する。分類部170は、分類結果を学習処理部320に供給する。
学習処理部320は、受けとった分類結果と、分類生成部310が生成した分類結果とを比較し、分類結果が一致している割合に応じて、分類部170を学習する。学習処理部320は、一例として、分類部170の分類結果が予め定められた正解率未満の場合(分類生成部310の分類結果と一致する割合が予め定められた割合よりも低い場合)に、分類部170のパラメータ等を変更して、同一のトレーニングデータを用いて分類部170の分類動作を実行させる。
また、学習処理部320は、分類部170の分類結果が予め定められた正解率以上となった場合、トレーニングデータによる学習を終了する。そして、学習処理部320は、トレーニングデータをテストデータに変更し、学習した分類部170を用いてテストデータの分類結果を予測する。学習処理部320は、一例として、テストデータを用いた予測結果の正解率が予め定められた値以上になった場合に、分類部170の学習を終了する。また、学習処理部320は、分類部170の分類結果が予め定められた正解率未満の場合に、テストデータをトレーニングデータに変更し、かつ、設定パラメータ等を変更し、トレーニングデータの学習を実行させてよい。
このように、学習処理部320は、まず、トレーニングデータを用いて、データ系列の正解率が予め定められた値以上となるように分類部170を学習する。そして、学習処理部320は、学習した分類部170を用いてテストデータの分類結果を予測し、予測結果の正解率が予め定められた値未満の場合は学習が不十分と判断して、トレーニングデータの学習に戻る。ここで、学習処理部320は、前回のトレーニングデータによる分類部170の学習に用いたパラメータとは異なるパラメータを用いてトレーニングデータを用いた分類部170の学習を実行することが好ましい。また、学習処理部320は、正解率の閾値の値を変更して、トレーニングデータを用いた分類部170の学習を実行してもよい。
以上のように、本変形例のデータ処理装置100は、予め部分データ系列の分類結果となるべき目標データが付加された学習データを用いて分類結果を評価するので、分類結果の正解率を向上させるように学習することができる。
図7は、本実施形態に係るデータ処理装置100として機能するコンピュータ1900のハードウェア構成の一例を示す。本実施形態に係るコンピュータ1900は、ホスト・コントローラ2082により相互に接続されるCPU2000、RAM2020、グラフィック・コントローラ2075、および表示装置2080を有するCPU周辺部と、入出力コントローラ2084によりホスト・コントローラ2082に接続される通信インターフェイス2030、ハードディスクドライブ2040、およびDVDドライブ2060を有する入出力部と、入出力コントローラ2084に接続されるROM2010、フレキシブルディスク・ドライブ2050、および入出力チップ2070を有するレガシー入出力部と、を備える。
ホスト・コントローラ2082は、RAM2020と、高い転送レートでRAM2020をアクセスするCPU2000およびグラフィック・コントローラ2075とを接続する。CPU2000は、ROM2010およびRAM2020に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ2075は、CPU2000等がRAM2020内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置2080上に表示させる。これに代えて、グラフィック・コントローラ2075は、CPU2000等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
入出力コントローラ2084は、ホスト・コントローラ2082と、比較的高速な入出力装置である通信インターフェイス2030、ハードディスクドライブ2040、DVDドライブ2060を接続する。通信インターフェイス2030は、ネットワークを介して他の装置と通信する。ハードディスクドライブ2040は、コンピュータ1900内のCPU2000が使用するプログラムおよびデータを格納する。DVDドライブ2060は、DVD−ROM2095からプログラムまたはデータを読み取り、RAM2020を介してハードディスクドライブ2040に提供する。
また、入出力コントローラ2084には、ROM2010と、フレキシブルディスク・ドライブ2050、および入出力チップ2070の比較的低速な入出力装置とが接続される。ROM2010は、コンピュータ1900が起動時に実行するブート・プログラム、および/または、コンピュータ1900のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ2050は、フレキシブルディスク2090からプログラムまたはデータを読み取り、RAM2020を介してハードディスクドライブ2040に提供する。入出力チップ2070は、フレキシブルディスク・ドライブ2050を入出力コントローラ2084へと接続すると共に、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を入出力コントローラ2084へと接続する。
RAM2020を介してハードディスクドライブ2040に提供されるプログラムは、フレキシブルディスク2090、DVD−ROM2095、またはICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、RAM2020を介してコンピュータ1900内のハードディスクドライブ2040にインストールされ、CPU2000において実行される。
プログラムは、コンピュータ1900にインストールされ、コンピュータ1900を系列取得部110、記憶部120、離散化部130、断片化部140、パターン抽出部150、生成部160、および分類部170として機能させる。
プログラムに記述された情報処理は、コンピュータ1900に読込まれることにより、ソフトウェアと上述した各種のハードウェア資源とが協働した具体的手段である系列取得部110、記憶部120、離散化部130、断片化部140、パターン抽出部150、生成部160、および分類部170として機能する。そして、この具体的手段によって、本実施形態におけるコンピュータ1900の使用目的に応じた情報の演算または加工を実現することにより、使用目的に応じた特有のデータ処理装置100が構築される。
一例として、コンピュータ1900と外部の装置等との間で通信を行う場合には、CPU2000は、RAM2020上にロードされた通信プログラムを実行し、通信プログラムに記述された処理内容に基づいて、通信インターフェイス2030に対して通信処理を指示する。通信インターフェイス2030は、CPU2000の制御を受けて、RAM2020、ハードディスクドライブ2040、フレキシブルディスク2090、またはDVD−ROM2095等の記憶装置上に設けた送信バッファ領域等に記憶された送信データを読み出してネットワークへと送信し、もしくは、ネットワークから受信した受信データを記憶装置上に設けた受信バッファ領域等へと書き込む。このように、通信インターフェイス2030は、DMA(ダイレクト・メモリ・アクセス)方式により記憶装置との間で送受信データを転送してもよく、これに代えて、CPU2000が転送元の記憶装置または通信インターフェイス2030からデータを読み出し、転送先の通信インターフェイス2030または記憶装置へとデータを書き込むことにより送受信データを転送してもよい。
また、CPU2000は、ハードディスクドライブ2040、DVDドライブ2060(DVD−ROM2095)、フレキシブルディスク・ドライブ2050(フレキシブルディスク2090)等の外部記憶装置に格納されたファイルまたはデータベース等の中から、全部または必要な部分をDMA転送等によりRAM2020へと読み込ませ、RAM2020上のデータに対して各種の処理を行う。そして、CPU2000は、処理を終えたデータを、DMA転送等により外部記憶装置へと書き戻す。このような処理において、RAM2020は、外部記憶装置の内容を一時的に保持するものとみなせるから、本実施形態においてはRAM2020および外部記憶装置等をメモリ、記憶部、または記憶装置等と総称する。本実施形態における各種のプログラム、データ、テーブル、データベース等の各種の情報は、このような記憶装置上に格納されて、情報処理の対象となる。なお、CPU2000は、RAM2020の一部をキャッシュメモリに保持し、キャッシュメモリ上で読み書きを行うこともできる。このような形態においても、キャッシュメモリはRAM2020の機能の一部を担うから、本実施形態においては、区別して示す場合を除き、キャッシュメモリもRAM2020、メモリ、および/または記憶装置に含まれるものとする。
また、CPU2000は、RAM2020から読み出したデータに対して、プログラムの命令列により指定された、本実施形態中に記載した各種の演算、情報の加工、条件判断、情報の検索・置換等を含む各種の処理を行い、RAM2020へと書き戻す。例えば、CPU2000は、条件判断を行う場合においては、本実施形態において示した各種の変数が、他の変数または定数と比較して、大きい、小さい、以上、以下、等しい等の条件を満たすかどうかを判断し、条件が成立した場合(または不成立であった場合)に、異なる命令列へと分岐し、またはサブルーチンを呼び出す。
また、CPU2000は、記憶装置内のファイルまたはデータベース等に格納された情報を検索することができる。例えば、第1属性の属性値に対し第2属性の属性値がそれぞれ対応付けられた複数のエントリが記憶装置に格納されている場合において、CPU2000は、記憶装置に格納されている複数のエントリの中から第1属性の属性値が指定された条件と一致するエントリを検索し、そのエントリに格納されている第2属性の属性値を読み出すことにより、所定の条件を満たす第1属性に対応付けられた第2属性の属性値を得ることができる。
以上に示したプログラムまたはモジュールは、外部の記録媒体に格納されてもよい。記録媒体としては、フレキシブルディスク2090、DVD−ROM2095の他に、DVD、Blu−ray(登録商標)、またはCD等の光学記録媒体、MO等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークまたはインターネットに接続されたサーバシステムに設けたハードディスクまたはRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ1900に提供してもよい。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
100 データ処理装置、110 系列取得部、120 記憶部、130 離散化部、140 断片化部、150 パターン抽出部、160 生成部、170 分類部、310 分類生成部、320 学習処理部、1900 コンピュータ、2000 CPU、2010 ROM、2020 RAM、2030 通信インターフェイス、2040 ハードディスクドライブ、2050 フレキシブルディスク・ドライブ、2060 DVDドライブ、2070 入出力チップ、2075 グラフィック・コントローラ、2080 表示装置、2082 ホスト・コントローラ、2084 入出力コントローラ、2090 フレキシブルディスク、2095 DVD−ROM

Claims (12)

  1. 複数のデータが配列されたデータ系列を取得する系列取得部と、
    前記データ系列を断片化して、複数の部分データ系列を得る断片化部と、
    前記複数の部分データ系列の少なくとも1つに出現する1以上のデータのパターンを複数抽出するパターン抽出部と、
    前記複数の部分データ系列のそれぞれについて、複数の前記パターンのそれぞれを含むか否かに応じて異なる要素値を有する特徴ベクトルを生成する生成部と、
    を備えるデータ処理装置。
  2. 前記パターン抽出部は、前記複数の部分データ系列のうち、予め定められた基準数以上の部分データ系列に出現するパターンを複数抽出する請求項1に記載のデータ処理装置。
  3. 前記生成部は、前記複数の部分データ系列のそれぞれについて、前記複数のパターンのそれぞれの有無を示す要素値を有する前記特徴ベクトルを生成する請求項1または2に記載のデータ処理装置。
  4. 前記系列取得部は、少なくとも1次元の連続値を含む連続値データが配列された前記データ系列を取得し、
    当該データ処理装置は、
    連続値データの前記データ系列を離散化して、離散値データの前記データ系列を生成する離散化部を更に備え、
    前記断片化部は、離散値データの前記データ系列を断片化して前記複数の部分データ系列を得る
    請求項1から3のいずれか一項に記載のデータ処理装置。
  5. 前記複数の部分データ系列のそれぞれを、前記特徴ベクトルに基づいて分類する分類部を更に備える請求項1から4のいずれか一項に記載のデータ処理装置。
  6. 予め分類結果が付加された学習用の前記データ系列を断片化した前記複数の部分データ系列に対する複数の前記特徴ベクトルを用いて前記複数の部分データ系列の分類を学習する学習処理部を更に備える請求項5に記載のデータ処理装置。
  7. 前記系列取得部は、前記複数のデータのそれぞれに分類結果が付加された学習用の前記データ系列を取得し、
    当該データ処理装置は、学習用の前記データ系列を断片化した学習用の前記複数の部分データ系列のそれぞれについて、当該部分データ系列に含まれる各データに付加された分類結果から、当該部分データ系列の学習用の分類結果を生成する分類生成部を更に備え、
    前記学習処理部は、学習用の前記複数の部分データ系列のそれぞれに対する前記特徴ベクトルおよび学習用の分類結果に基づいて、前記複数の部分データ系列の分類を学習する請求項6に記載のデータ処理装置。
  8. 前記分類生成部は、学習用の前記複数の部分データ系列のそれぞれについて、当該部分データ系列に含まれる各データに予め定められた基準以上に異常を示す分類結果が付加されていることに応じて、当該部分データ系列に対して異常を示す分類結果を割り当てる請求項7に記載のデータ処理装置。
  9. 前記系列取得部は、複数のイベントに応じた前記複数のデータが配列された前記データ系列を取得し、
    前記分類部は、前記複数の部分データ系列のそれぞれについて、異常なイベントが発生したか否かを推定する
    請求項5から8のいずれか一項に記載のデータ処理装置。
  10. 前記パターン抽出部は、少なくとも1つのパターンとして、パターンの端部のデータが特定され、パターンの端部以外の少なくとも一部においてデータが特定されていないパターンを抽出する請求項1から9のいずれか一項に記載のデータ処理装置。
  11. 複数のデータが配列されたデータ系列を取得する系列取得段階と、
    前記データ系列を断片化して、複数の部分データ系列を得る断片化段階と、
    前記複数の部分データ系列の少なくとも1つに出現する1以上のデータのパターンを複数抽出するパターン抽出段階と、
    前記複数の部分データ系列のそれぞれについて、複数の前記パターンのそれぞれを含むか否かに応じて異なる要素値を有する特徴ベクトルを生成する生成段階と、
    を備えるデータ処理方法。
  12. コンピュータに、請求項1から10のいずれか一項に記載のデータ処理装置として機能させるプログラム。
JP2014186308A 2014-09-12 2014-09-12 データ処理装置、データ処理方法、およびプログラム Active JP5936240B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014186308A JP5936240B2 (ja) 2014-09-12 2014-09-12 データ処理装置、データ処理方法、およびプログラム
US14/849,920 US10108296B2 (en) 2014-09-12 2015-09-10 Method and apparatus for data processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014186308A JP5936240B2 (ja) 2014-09-12 2014-09-12 データ処理装置、データ処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2016058027A true JP2016058027A (ja) 2016-04-21
JP5936240B2 JP5936240B2 (ja) 2016-06-22

Family

ID=55454919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014186308A Active JP5936240B2 (ja) 2014-09-12 2014-09-12 データ処理装置、データ処理方法、およびプログラム

Country Status (2)

Country Link
US (1) US10108296B2 (ja)
JP (1) JP5936240B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017213063A1 (ja) * 2016-06-08 2017-12-14 日本電気株式会社 システム分析装置、システム分析方法およびプログラム記録媒体
JP2018045403A (ja) * 2016-09-14 2018-03-22 株式会社日立製作所 異常検知システム及び異常検知方法
JP2020052518A (ja) * 2018-09-25 2020-04-02 Kddi株式会社 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム
US10878337B2 (en) 2016-07-18 2020-12-29 International Business Machines Corporation Assistance generation
JP2021033602A (ja) * 2019-08-23 2021-03-01 Kddi株式会社 情報処理装置、ベクトル生成方法及びプログラム
JP2021530067A (ja) * 2018-06-22 2021-11-04 プラチナ システムズ コーポレイションPlatina Systems Corporation データセンターハードウェアインスタンスネットワークのトレーニング
US11574210B2 (en) 2017-05-23 2023-02-07 Nec Corporation Behavior analysis system, behavior analysis method, and storage medium

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2916260A1 (en) * 2014-03-06 2015-09-09 Tata Consultancy Services Limited Time series analytics
CN107609330B (zh) * 2017-08-31 2019-12-06 中国人民解放军国防科技大学 基于门禁日志挖掘的内部威胁异常行为分析方法
US10997009B2 (en) * 2018-12-10 2021-05-04 Vmware, Inc. Methods and systems that detect and classify incidents and anomalous behavior using metric-data observations

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000137726A (ja) * 1998-10-30 2000-05-16 Sharp Corp ヘルプ機能付き情報処理装置及びヘルプ情報検索方法並びにヘルプ情報検索プログラムを記録した媒体

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4476078B2 (ja) 2004-09-01 2010-06-09 独立行政法人科学技術振興機構 時系列データ判定用プログラム
EP2141657A4 (en) * 2007-04-18 2015-04-08 Univ Tokyo METHOD FOR SELECTION OF CHARACTERISTICS, DEVICE FOR SELECTION OF CHARACTERISTICS, IMAGE CLASSIFICATION METHOD, IMAGE CLASSIFICATION DEVICE, COMPUTER PROGRAM AND RECORDING MEDIUM
US20110153601A1 (en) * 2008-09-24 2011-06-23 Satoshi Nakazawa Information analysis apparatus, information analysis method, and program
JP2010122748A (ja) 2008-11-17 2010-06-03 Ricoh Co Ltd 操作表示装置及びそれを備えた画像形成装置
JP2010185686A (ja) 2009-02-10 2010-08-26 Toyota Motor Corp 情報提供装置
JP5301310B2 (ja) * 2009-02-17 2013-09-25 株式会社日立製作所 異常検知方法及び異常検知システム
JP2011059816A (ja) * 2009-09-07 2011-03-24 Sony Corp 情報処理装置、情報処理方法、及び、プログラム
JP5511077B2 (ja) 2010-10-05 2014-06-04 Kddi株式会社 時系列データの疎密に応じてタイムスケールを変更するユーザインタフェースプログラム、システム及び方法
JP5678620B2 (ja) * 2010-12-03 2015-03-04 株式会社日立製作所 データ処理方法、データ処理システム、及びデータ処理装置
US8660978B2 (en) * 2010-12-17 2014-02-25 Microsoft Corporation Detecting and responding to unintentional contact with a computing device
JP5670928B2 (ja) * 2011-02-28 2015-02-18 リモート・ソルーション・カンパニー・リミテッド 打点の振動を用いたタッチセンサーシステム
US8635197B2 (en) * 2011-02-28 2014-01-21 International Business Machines Corporation Systems and methods for efficient development of a rule-based system using crowd-sourcing
US20120310427A1 (en) * 2011-05-31 2012-12-06 Williams B Jeffery Automatic Monitoring and Adjustment of a Solar Panel Array
US9110510B2 (en) * 2011-06-03 2015-08-18 Apple Inc. Motion pattern classification and gesture recognition
KR101824388B1 (ko) 2011-06-10 2018-02-01 삼성전자주식회사 사용자의 신체특성을 고려한 동적 사용자 인터페이스 제공 장치 및 방법
US9322667B2 (en) * 2012-04-28 2016-04-26 Hewlett Packard Enterprise Development Lp Detecting anomalies in power consumption of electrical systems
JP5959344B2 (ja) 2012-07-09 2016-08-02 株式会社Nttドコモ 情報処理装置
US20140078086A1 (en) * 2012-09-20 2014-03-20 Marvell World Trade Ltd. Augmented touch control for hand-held devices
US20140222476A1 (en) * 2013-02-06 2014-08-07 Verint Systems Ltd. Anomaly Detection in Interaction Data
US20150164377A1 (en) * 2013-03-13 2015-06-18 Vaidhi Nathan System and method of body motion analytics recognition and alerting
US9733821B2 (en) * 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
KR102026069B1 (ko) * 2013-08-05 2019-09-30 삼성전자 주식회사 반도체 설비의 센서 데이터 분할 시스템 및 그 방법
US20150378795A1 (en) * 2014-06-27 2015-12-31 Pivotal Software, Inc. Stream computing event models

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000137726A (ja) * 1998-10-30 2000-05-16 Sharp Corp ヘルプ機能付き情報処理装置及びヘルプ情報検索方法並びにヘルプ情報検索プログラムを記録した媒体

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017213063A1 (ja) * 2016-06-08 2017-12-14 日本電気株式会社 システム分析装置、システム分析方法およびプログラム記録媒体
JPWO2017213063A1 (ja) * 2016-06-08 2019-04-04 日本電気株式会社 システム分析装置、システム分析方法およびプログラム記録媒体
JP7139946B2 (ja) 2016-06-08 2022-09-21 日本電気株式会社 システム分析装置、システム分析方法及びプログラム
US10878337B2 (en) 2016-07-18 2020-12-29 International Business Machines Corporation Assistance generation
JP2018045403A (ja) * 2016-09-14 2018-03-22 株式会社日立製作所 異常検知システム及び異常検知方法
US11574210B2 (en) 2017-05-23 2023-02-07 Nec Corporation Behavior analysis system, behavior analysis method, and storage medium
JP2021530067A (ja) * 2018-06-22 2021-11-04 プラチナ システムズ コーポレイションPlatina Systems Corporation データセンターハードウェアインスタンスネットワークのトレーニング
JP2020052518A (ja) * 2018-09-25 2020-04-02 Kddi株式会社 特徴ベクトル生成装置、特徴ベクトル生成方法及び特徴ベクトル生成プログラム
JP2021033602A (ja) * 2019-08-23 2021-03-01 Kddi株式会社 情報処理装置、ベクトル生成方法及びプログラム
JP7200069B2 (ja) 2019-08-23 2023-01-06 Kddi株式会社 情報処理装置、ベクトル生成方法及びプログラム

Also Published As

Publication number Publication date
US20160078027A1 (en) 2016-03-17
JP5936240B2 (ja) 2016-06-22
US10108296B2 (en) 2018-10-23

Similar Documents

Publication Publication Date Title
JP5936240B2 (ja) データ処理装置、データ処理方法、およびプログラム
US20190251471A1 (en) Machine learning device
TWI729472B (zh) 特徵詞的確定方法、裝置和伺服器
WO2019129060A1 (zh) 自动生成机器学习样本的特征的方法及系统
CN108228861B (zh) 用于执行机器学习的特征工程的方法及系统
US8549478B2 (en) Graphical user interface input element identification
JP2018045403A (ja) 異常検知システム及び異常検知方法
JP5854274B2 (ja) 情報処理装置および方法、並びにプログラム
WO2019019628A1 (zh) 移动应用的测试方法、装置、测试设备及介质
JP6044963B2 (ja) 情報処理装置、方法及びプログラム
WO2014008450A1 (en) Generalization and/or specialization of code fragments
US9456029B2 (en) Command process load balancing system
US20150199364A1 (en) Data analyzing apparatus and program
KR20210080224A (ko) 정보 처리 장치 및 정보 처리 방법
CN109983459A (zh) 用于标识语料库中出现的n-gram的计数的方法和设备
US20100191753A1 (en) Extracting Patterns from Sequential Data
US10229212B2 (en) Identifying Abandonment Using Gesture Movement
JPWO2014034557A1 (ja) テキストマイニング装置、テキストマイニング方法及びプログラム
US20180173687A1 (en) Automatic datacenter state summarization
US9286036B2 (en) Computer-readable recording medium storing program for managing scripts, script management device, and script management method
JP5439235B2 (ja) 文書分類方法、文書分類装置、およびプログラム
US20230205883A1 (en) Integrated static and dynamic analysis for malware detection
JP2015191277A (ja) データ識別方法、データ識別プログラム及びデータ識別装置
JP2019148859A (ja) フローダイアグラムを用いたモデル開発環境におけるデザインパターンの発見を支援する装置および方法
JP2018124901A (ja) プログラム分析装置、プログラム分析方法及びプログラム分析プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160112

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20160128

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160412

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20160413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160506

R150 Certificate of patent or registration of utility model

Ref document number: 5936240

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150