JP2009009302A - ストリームデータ処理方法およびストリームデータ処理システム - Google Patents

ストリームデータ処理方法およびストリームデータ処理システム Download PDF

Info

Publication number
JP2009009302A
JP2009009302A JP2007169228A JP2007169228A JP2009009302A JP 2009009302 A JP2009009302 A JP 2009009302A JP 2007169228 A JP2007169228 A JP 2007169228A JP 2007169228 A JP2007169228 A JP 2007169228A JP 2009009302 A JP2009009302 A JP 2009009302A
Authority
JP
Japan
Prior art keywords
index
data
stream data
stream
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007169228A
Other languages
English (en)
Other versions
JP5055039B2 (ja
Inventor
Michiko Tanaka
美智子 田中
Itaru Nishizawa
格 西澤
Toshihiko Kashiyama
俊彦 樫山
Tsuneyuki Imaki
常之 今木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007169228A priority Critical patent/JP5055039B2/ja
Priority to US12/035,094 priority patent/US7949653B2/en
Publication of JP2009009302A publication Critical patent/JP2009009302A/ja
Application granted granted Critical
Publication of JP5055039B2 publication Critical patent/JP5055039B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】アプリケーションの処理内容に応じて、リアルタイム性とリスク回避に関する要件を両立する。
【解決手段】指標ID付加部130は、ストリームデータに、ストリームデータの前後のストリームを利用して計算される指標値を付加し、時々刻々と変化するストリームに応じて前記指標値を再計算し、予め定められた処理方法に従ってストリームデータを処理した結果に、ストリームデータの指標値に基づいて計算した指標値を付加して出力する。その処理結果と該処理結果の指標値を受け取ったアプリケーションは、指標値によって処理を切り替える。
【選択図】図1

Description

本発明は、ストリームデータの処理技術に関し、特に、RFID(Radio Frequency IDentification:電波方式認識)リーダやセンサなどにおけるストリームデータの処理結果の信頼度付加に有効な技術に関する。
ストレージ装置に格納されたデータに対する処理を実行するデータベース管理システム(以下、DBMSとする)に対して、時々刻々と到着するデータを、ストレージ装置に格納せずに、リアルタイム処理するデータ処理システムに対する要求が高まっている。
たとえば、店舗において、RFIDリーダを設置した商品陳列棚にRFIDタグが付加された商品を陳列し、そのRFIDリーダによってRFIDタグを継続的に読み取ることで、店頭在庫をリアルタイムに把握するシステムであるスマートシェルフシステムを利用し、時々刻々と変化する店頭在庫状況を販売促進に役立てることが、重要な課題となっている。
このような、時々刻々と到着するデータをストリームデータと定義し、該ストリームデータのリアルタイム処理に好適なデータ処理システムとして、ストリームデータ処理システムが提案されており、この種のストリームデータ処理システムとして、ストリームデータ処理システムSTREAMが知られている(たとえば、非特許文献1参照)。
たとえば、スマートシェルフシステムにおいて、ストリームデータ処理システムを利用することで、リアルタイムな店頭在庫管理を次のように実現できる。スマートシェルフから、時々刻々と変化する店頭在庫情報を、ストリームデータ処理システムが継続的に受け取る。
ストリームデータ処理システムにおいて、店頭在庫状況を受け取った各々の時点において、該時点における店頭在庫状況と、その前時点における店頭在庫状況とを比較することで、商品が顧客によって棚から取り出されたイベントを検知する。
棚に隣接し、顧客から見やすい位置にディスプレイなど商品情報表示用の端末を設置し、ストリームデータ処理システムによって、商品が棚から取り出されたことが検知されると、取り出された商品の説明や、取り出された商品に関連する情報を表示する。顧客が商品を棚から取り出した時点で前記表示を行うことで、顧客の商品購入を促進することが可能である。
このように、ストリームデータ処理システムは、RFIDリーダやセンサネットからのデータ、および株価トレンドなど金融関連情報など、逐次入力されるストリームデータをリアルタイムに処理した結果を利用するリアルタイムアプリケーションに好適である。
また、たとえば、RFIDリーダやセンサからの出力データなど、読み取りの失敗や測定誤りなどのノイズを含むデータや、不特定多数が登録したwebデータなど、必ずしも正しくないデータが含まれるようなデータ集合を対象に、処理を行う要求が高まっている。
この種の処理システムとしては、RDB(Relational Data Base)においてデータの信頼度を扱うシステムTRIOが知られている(たとえば、非特許文献2参照)。
たとえば、交通事故の目撃情報として、「事故車がAである信頼度が0.6、事故車がBである信頼度が0.4」というような情報や、「車Aを運転していた人物がaである信頼度が0.3、bである信頼度が0.7」のような情報をデータベースに保存しておく。
このような情報が保存されているデータベースに対して、事故車の目撃情報と運転者の目撃情報をつき合わせることで、事故を起こした人物の候補を信頼度付きで求めることができる。
このように、TRIOシステムでは、信頼度付きのデータに対して問い合せを行い、信頼度付きの処理結果を得ることができる。
また、所定時刻におけるセンサデータが存在しない場合の処理システムとして、他の時刻におけるセンサデータの該時刻における信頼度を計算し、センサデータと信頼度を出力するものが知られている(たとえば、特許文献1参照)。
外部機器から所定時刻におけるセンサデータの出力要求があった場合に、当該所定時刻におけるセンサデータが存在しない場合であっても、他の時刻におけるセンサデータの当該所定時刻における信頼度を算出し、算出された信頼度と、当該他の時刻におけるセンサデータを出力する。これにより、センサデータ処理側においては、当該信頼度を参照することにより、センサデータを同期データのように処理することができる。
R. Motwani, J. Widom, 22rasu, 21abcock, S. Babu, M. Datar, G. Manku, C. Olston, J. Rosenstein, and R. Varma著:"Query Processing, Resource Management, and Approximation in a Data Stream Management System",In Proc. of the 2003 Conf. on Innovative Data Systems Research (CIDR), January M.Mutsuzaki,M.Theobald,A.de Keijzer,J.Widom,P.Agrawal,O.Benjelloun,A Das Sarma,R.Murthy,and T.Sugihara著:"Trio−One:Layering Uncertainty and Lineage on a Conventional DBMS",Proceedings of the Third Biennial Conference on Innovative Data Systems Research(CIDR07),January 2007 特開2006−268369号公報
ところが、上記のようなストリームデータの処理技術では、次のような問題点があることが本発明者により見い出された。
すなわち、非特許文献1に開示された技術では、ノイズなど誤りを含むデータが継続的に到着する環境において、その処理結果に誤りが伝播され、処理結果が誤りであるか否かを判断できないという問題がある。
また、非特許文献2に開示された技術では、信頼度がリアルタイムに変化するデータを効率良く処理できない。一方、特許文献1に開示された技術では、入力データに信頼度を付加することができないため、入力データに対してリアルタイムに処理を行うと同時に、誤りデータに基づいて行った処理によるリスクを軽減することについては十分な解決手段が開示されていない。
たとえば、RFIDリーダやセンサから出力されるデータには、読み取りノイズが含まれる。この入力データに基づいた処理結果にもノイズが含まれる。この出力を受け取るアプリケーションは、受け取ったデータがノイズであるかどうか判断できず、誤った処理を引き起こす場合がある。
以下、スマートシェルフシステムを例に説明する。
スマートシェルフシステムは、商品陳列棚、RFIDリーダ、およびRFIDタグから構成される。商品陳列棚にはRFIDリーダが設置してあり、商品陳列棚に陳列された商品にはRFIDタグが付加されているものとする。
RFIDリーダは、RFIDタグの読み取りを一定(たとえば、1秒など)周期で行い、読み取ることができたRFIDタグが付加されている商品は棚の中にあり、読み取ることができなかったRFIDタグが付加されている商品は棚の外、つまり顧客によって取り出されたと判定する。
RFIDタグ、およびRFIDリーダの特性によっては、一瞬だけRFIDリーダがRFIDタグの読み取りに失敗することがある。この現象は「ゆらぎ」と呼ばれる。また、一瞬だけ、隣のRFIDリーダで読まれるべきRFIDタグを読み取ってしまうこともあり得る。この現象により、実際には商品が取り出されていないにも関わらず、商品が取り出されたとみなされることがある。
RFIDリーダのRFIDタグ読み取り情報に基づいて、顧客によって商品が手に取られた回数を集計したり、手に取られた商品と売れ筋商品との相関関係を抽出したりするなどの解析を行う場合、「ゆらぎ」が生じやすいRFIDタグが付加されている商品が、実際には顧客によって手に取られていないにも関わらず、複数回、手に取られたように集計されてしまい、誤った解析結果を出力するという問題がある。
前記のような、実世界の状況に即していない集計・解析処理を避けるためには、RFIDリーダやセンサから入力されるデータを処理する際に、該データの信頼度を考慮する方法が考えられる。
RFIDリーダやセンサから出力される時系列データの信頼度は、測定対象の特性を考慮して評価することができる。たとえば、前述したスマートシェルフシステムの例においては、顧客が商品を1秒間だけ商品陳列棚から取り出し、その後すぐに商品陳列棚に戻すことは考えにくい。
そのため、RFIDリーダによるRFIDタグの読み取り結果を出力した時系列データにおいては、商品の位置は、ある程度長時間(たとえば、3秒など)変化しないという特性を持つと考えることができる。
このような特性に基づき、1秒間だけ位置が変化した事を示すデータは、「ゆらぎ」によって生じた可能性が高いので、顧客によって商品が棚から取り出された信頼度を低く設定する。
上記のように、一般に時系列データの信頼度を求めるためには、該データの前後のデータを判定に用いる必要がある。すなわち、一般に時系列データの信頼度を求めるためには、後続のデータが到着するのを待つ必要がある。
一方で、一定時間(たとえば、5秒など)経過後に信頼度を求めた上で処理結果を出力した場合、本来リアルタイムに実行しなければならない処理ができなくなってしまう。
たとえば、スマートシェルフの例においては、顧客が商品を棚から取り出した瞬間に、スマートシェルフに設置されているディスプレイに商品情報を表示するような顧客サービスは、販売機会を拡大する上で重要なサービスである。
このサービスは、商品を取り出した瞬間に提供することが重要であり、一定時間待ってから表示するのでは販売機会の拡大効果が小さい。一方、「ゆらぎ」により、実際には顧客によって商品が棚から取り出されていないにも関わらず、商品情報を表示しても、影響は小さい。
非特許文献1のストリームデータ処理技術と非特許文献2の信頼度付きデータ処理技術を組み合わせると、信頼度付きのストリームデータを入力とし、ストリームデータに対して集計などの処理を適用した結果に、入力ストリームデータの信頼度に基づいて生成した信頼度を付加して出力することが可能であるが、入力ストリームデータの信頼度を求めるために一定時間待つ必要があるため、リアルタイム性の確保ができないという問題が生じてしまうことになる。
以上のように、リアルタイム性確保と、ノイズによる処理結果の誤りリスク回避はトレードオフの関係にある。
本発明の目的は、アプリケーションの処理内容に応じて、リアルタイム性とリスク回避に関する要件を両立し、信頼性の高いストリームデータ処理を行うことのできる技術を提供することにある。
本発明の前記ならびにそのほかの目的と新規な特徴については、本明細書の記述および添付図面から明らかになるであろう。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。
本発明は、タイムスタンプが付加された複数のデータが、該タイムスタンプの昇順に継続的に到来する時系列データの流れであるストリームを、任意に登録された問合わせに従って処理するストリームデータ処理システムであって、任意の時間内のストリームを利用し、指標関数アルゴリズムに基づいて計算した第1の指標となる指標値をストリームデータに付加し、第1の指標の指標値に基づいて得られる第2の指標の指標値を、第1の指標が付加されたストリームデータの処理結果に付加するものである。
また、本願のその他の発明の概要を簡単に示す。
本発明は、タイムスタンプが付与された複数のデータが、該タイムスタンプの昇順に到来する時系列データの流れであるストリームを、任意に登録された問合わせに従って処理するストリームデータ処理システムであって、入力されたストリームデータの指標値を第1の指標として計算し、指標IDを採番してストリームデータに指標IDを付加して出力し、任意のタイミングで指標値を再計算する指標ID付加部と、採番された指標IDと計算した指標値と指標値が計算された時刻の組、または指標IDと再計算された指標値と指標値が再計算された時刻の組とを保存する指標保存部と、登録された問合わせに従って、処理対象となる指標IDが付加されたストリームデータを管理する処理対象データ管理部と、各時点において処理対象となる指標IDが付加されたストリームデータに対して処理を実行し、その処理結果と指標IDとを利用して記述される処理結果の指標ID式を出力する指標ID付きデータ処理部と、指標ID式と指標保存部に保存されている指標値とより、処理結果の指標値を求めて、処理結果と共に出力する指標付きデータ出力部とを備えたものである。
また、本発明は、タイムスタンプが付与された複数のデータが、該タイムスタンプの昇順に到来する時系列データの流れであるストリームを、任意に登録された問合わせに従って処理するストリームデータ処理システムであって、入力されたストリームデータの第1の指標となる指標値を計算してストリームデータに付加して出力し、任意のタイミングで第1の指標を再計算してストリームデータに付加して出力する指標付加部と、任意に登録された問合わせに従って、処理対象となる指標IDが付加されたストリームデータを管理する処理対象データ管理部と、各時点において処理対象となる第1の指標が付加されたストリームデータに対して処理を実行し、その処理結果と第2の指標となる指標値を出力する指標付きデータ処理部とを備えたものである。
さらに、本願のその他の発明の概要を簡単に示す。
有限な範囲のストリームを利用して予め定義された計算式に従って計算した結果である指標をストリームデータに付加し、指標が付加されたストリームデータを処理した結果である処理結果に、指標に基づいて得られる指標を付加することを特徴とするストリームデータ処理方法において、指標がストリームデータの正しさを示す確率である信頼度とする。指標は、信頼度以外にも、モデル時系列データとの類似度、前後の時系列データより外れ値と判断される確率、前後の時系列データより変化点であると判断される確率でもよい。
また、処理結果の指標は、時々刻々と変化するストリームに対して、ストリームデータより後のタイムスタンプが付加されているストリームデータが到来した時点もしくは任意の時間間隔で再度前記ストリームデータの指標値を計算し、そして、再計算されたストリームデータの指標値に基づいて処理結果の指標値を求める。
ストリームデータの指標値は、ストリームデータの前後の有限な範囲のストリームを利用して、予め定義された計算式に従って計算するものである。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。
ストリームデータ処理における即時性と信頼性の最適なトレードオフを実現した実行制御を可能とすることができ、リアルタイム性確保、およびノイズなどによる処理結果の誤りリスク回避を両立することができる。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。
(実施の形態1)
図1は、本発明の実施の形態1によるストリームデータ処理システムの構成例を示すブロック図、図2は、図1のストリームデータ処理システムに設けられた指標ID付加部の処理例を示すフローチャート、図3は、図2に続く指標ID付加部の処理例を示すフローチャート、図4は、図3に続く指標ID付加部の処理例を示すフローチャート、図5は、ストリームデータ処理システムに設けられた処理対象データ管理部の処理例を示すフローチャート、図6は、ストリームデータ処理システムに設けられた指標ID付きデータ処理部の処理例を示すフローチャート、図7は、ストリームデータ処理システムに設けられた指標付きデータ生成部、および指標ID評価部の処理例を示すフローチャート、図8は、図7に続く指標付きデータ生成部、および指標ID評価部の処理例を示すフローチャート、図9は、ストリームデータ処理システムに設けられた指標保存部の処理例を示すフローチャート、図10は、図1のストリームデータ処理システムに用いられるストリームデータにおけるデータフォーマットの一例を模式的に示した説明図、図11は、連続して入力されたストリームデータからなる商品位置測定ストリームを例示した説明図、図12は、図1のストリームデータ処理システムに設けられた指標値計算用データ保存管理部に保存されるデータ例を模式的に示した説明図、図13は、ストリームデータに対する問い合せコマンドの一例を示した説明図、図14は、入力ストリームデータの指標値計算方法の一例を示した説明図、図15は、図1のストリームデータ処理システムに設けられた指標ID付きデータ生成部が作成する指標ID付きストリームデータを例示した説明図、図16は、図1のストリームデータ処理システムに設けられた、指標保存管理テーブルに保存されるデータを例示した説明図、図17は、処理対象データ管理部から出力される指標ID付きデータの例を示した説明図、図18は、指標ID付きデータ処理部から出力される指標ID式付き処理結果データの例を示した説明図、図19は、図1のストリームデータ処理システムに設けられた指標付きデータ出力部から出力される出力データ、および出力データの指標値の例を示した説明図、図20は、計算機上で実行されるアプリケーション処理の一例を示した説明図である。
本実施の形態1において、指標付きストリームデータ処理システム100は、図1に示すように、RFIDリーダ101、センサノード102、または計算機103で実行されるアプリケーション104からリアルタイムに送信された情報をストリームデータとして入力とする。
そして、ユーザ、または計算機109上で実行されるアプリケーション110により入力されたコマンドに基づき、該ストリームデータを有意な情報に変換して、出力データ、および出力データの指標を生成し、ユーザ、または計算機106上で実行されるアプリケーション107へ提供するストリームデータ処理を実行する。
計算機109は、ネットワーク111を介して指標付きストリームデータ処理システム100に接続されている。ネットワーク111は、イーサネット(登録商標)、光ファイバ、FDDI(Fiber Distributed Data Interface)などで接続されるLAN(Local Area Network)、若しくはLANよりも低速なインターネットを含んだWAN(Wide Area Network)でも差し支えない。
ここで、指標付きストリームデータ処理システム100、計算機103、計算機106、および計算機109は、パーソナルコンピュータ、ワークステーションなどの任意のコンピュータシステムで構成されており、同一の計算機でも異なる計算機でも構わない。
また、アプリケーション104、アプリケーション107、ならびにアプリケーション110は、同一のアプリケーションでも異なるアプリケーションでも構わない。
さらに、本実施の形態で扱うストリームデータは、映像や音声の配信で用いられるストリームとは異なり、ひとつのストリームデータが有意な情報に対応するものである。
また、RFIDリーダ101、センサノード102、または計算機103で実行されるアプリケーション104から指標付きストリームデータ処理システム100が受信するストリームデータは、連続的あるいは間欠的なデータである。
タイムスタンプは、RFIDリーダ101、センサノード102、あるいは計算機103上で実行されるアプリケーション104によって付加されても、RFIDリーダ101、センサノード102、または計算機103上で実行されるアプリケーション104以外の構成要素によって、指標付きストリームデータ処理システム100に入力する前に付加されてもよい。
指標付きストリームデータ処理システム100は、コマンド入力部119、問合わせ管理部118、指標計算法管理部120、指標ID付加部130、処理対象データ管理部140、指標ID付きデータ処理部150、指標付きデータ出力部160、および指標保存部170から構成される。
入力手段として機能するコマンド入力部119は、ユーザ、または計算機上で実行されるアプリケーション110により入力されたコマンドなどを受け付ける。コマンドの入力方法は、コマンドラインインタフェース(CLI)形式でも、グラフィックユーザインターフェース形式(GUI)でもよい。
このコマンドが指標計算法に係るコマンドの場合、コマンドを指標計算法管理部120に出力する。該コマンドがストリームデータに対する問合わせに係るコマンドの場合、コマンドを問合わせ管理部118に出力する。
問合わせ管理部118は、コマンド入力部119より受け取った問合わせに応じて、1つまたは複数の処理対象データ管理部140、および1つまたは複数の指標ID付きデータ処理部150を生成する。
指標計算法管理部120は、コマンド入力部119より受け取ったコマンドにより、保存されている指標計算方法(指標算出アルゴリズム)を選択して指標ID付加部130に通知する。また、新たに指標計算方法を登録できる。
指標ID付加部130は、指標計算法管理部120から通知された指標計算方法に従ってストリームデータの第1の指標となる指標値を計算すると共に、指標IDを生成し、指標値、指標ID、および指標値を計算した時刻の組を指標保存部170へ出力する。また、指標IDとストリームデータの組である指標ID付きストリームデータを処理対象データ管理部140へ出力する。
処理対象データ管理部140は、指標ID付加部130より指標ID付きストリームデータを受け取り、保持する。問合わせ管理部118によって処理対象データ管理部140が生成された時に指定された判定方法により、保持している1つまたは複数の指標ID付きストリームデータから、処理対象である指標ID付きデータを選択し、指標ID付きデータを指標ID付きデータ処理部150へ出力する。
保持している指標ID付きストリームデータの中に処理対象から除外される指標ID付きストリームデータがある場合は、指標ID付きストリームデータを削除すると同時に、指標保存部170へ、指標IDと処理対象から除外されると判定された時刻を通知する。
指標ID付きデータ処理部150は、処理対象データ管理部140より指標ID付きデータを受け取り、問合わせ管理部118によって指標ID付きデータ処理部150が生成された時に指定された方法により、指標ID付きデータから、1つ以上の指標IDと0個以上の演算子によって記述される指標ID式と処理結果データの組である指標ID式付き処理結果データを生成し、指標付きデータ出力部160へ出力する。
指標付きデータ出力部160は、指標ID付きデータ処理部150より、指標ID式付き処理結果データを受け取り、指標保存部170より指標ID式付き処理結果データに含まれる指標IDに対応する指標値を受け取り、指標値を用いて前記指標ID式付き処理結果データの指標ID式に対応する指標値を計算し、指標ID式付き処理結果データのデータ部である出力データと、第2の指標値である出力データの指標値をユーザ、または計算機106上で実行されるアプリケーション107に出力する。
指標保存部170は、指標ID付加部130より、指標値、指標ID、および指標値を計算した時刻の組を受け取り、保存する。また、処理対象データ管理部140より、指標IDと該指標IDを含む指標ID付きストリームデータが処理対象から除外された時刻を受け取り、記録する。
また、指標付きデータ出力部160より指標IDと時刻を受け取り、該指標IDの該時刻における指標値を返すと共に、保持不要な指標IDを判定し、該指標IDに係るデータを削除する。
ここで、指標付きストリームデータ処理システム100における構成について詳細に説明する。
指標計算法管理部120は、指標計算法選択部121、指標計算法入力部122、ならびに指標計算法保存部123から構成されており、コマンド入力部119を介して、ユーザ、または計算機109上で実行されるアプリケーション110から入力されるコマンドを受け付ける。
コマンド入力部119より入力されたコマンドが、ユーザが独自に定義した指標計算法であるユーザ定義指標計算法の登録に係るコマンドの場合、指標計算法入力部122がユーザ定義指標計算法を指標計算法保存部123に出力し、指標計算法保存部123はユーザ定義指標計算法を保存する。
コマンド入力部119より入力されたコマンドが指標計算法の選択に係るコマンドの場合、指標計算法保存部123に予め登録されている0個以上の指標計算方法、またはユーザが独自に定義した1つまたは複数の指標計算方法から1つを選択し、指標値計算部132、および指標値計算用データ保存管理部133に通知する。
指標ID付加部130は、指標ID付きデータ生成部131、指標値計算部132、指標値計算用データ保存管理部133、ならびに指標値計算用データ保存テーブル134から構成されている。
指標値計算用データ保存テーブル134は、メモリなどの高速なランダムアクセスが可能な記憶装置上に作成するのが望ましいが、ディスクなど他の記憶装置の上に作成してもよい。その場合、キャッシュ機構などを用いてアクセスの高速化を図ってもよい。
以下、図2、図3、図4に従って、指標ID付加部130の処理を説明する。
まず、指標ID付加部130はストリームデータを受け付け、指標ID付きデータ生成部131において指標IDを生成し(ステップS1302)、ストリームデータを前記生成した指標IDと共に前記指標値計算用データ保存管理部133に渡す(ステップS1303)。
指標値計算用データ保存管理部133は、前記ストリームデータを前記指標IDと共に前記指標値計算用データ保存テーブル134に保存する(ステップS1503)。また、指標ID付きデータ生成部131は、指標値計算部132へ指標IDを渡す(ステップS1304)。
続いて、指標値計算部132は、指標計算法管理部120にて指定された指標計算法に従って、指標計算に必要なデータ集合を指標値計算用データ保存管理部133に問合わせ(ステップS1402)、指標値計算用データ保存管理部133は必要なデータ集合を返す。
指標値計算用データ保存管理部133では、指標値計算用データ保存テーブル134よりデータを一行読み込み(ステップS1505)、読み込んだ行が指標計算に必要か否かを判定する(ステップS1506)。
ステップS1506の処理において、必要であればデータ集合に追加し(ステップS1508)、必要でなければ指標値計算用データ保存テーブル134より該行を削除する(ステップS1507)。
指標値計算用データ保存管理部133は、ステップS1505〜S1508の処理を指標値計算用データ保存テーブル134の全ての行について実施する(ステップS1509)。
そして、指標値計算部132は、得られたデータ集合の各要素について、前記指標計算法により指標値を計算し(ステップS1403)、指標値を指標保存部170に保存する(ステップS1404)。
指標値計算部132は、ステップS1403,S1404の処理を前記データ集合の全要素について実施する(ステップS1405)。指標値計算部132は、計算したデータの指標値と出力先の処理対象データ管理部140の数を、指標保存管理部171へ出力する(ステップS1305)。
指標計算は、ストリームデータが到着する度に行っても、それ以外のタイミングで行ってもよい。指標ID付きデータ生成部131は、図2において、ストリームデータと指標IDの組である指標ID付きストリームデータを、1つまたは複数の処理対象データ管理部140に出力する(ステップS1306)。
ここで、処理対象データ管理部140は、処理対象データ保存管理部141と処理対象データ保存テーブル142から構成される。
以下、図5に従って、処理対象データ管理部140の処理を説明する。
処理対象データ保存管理部141は、指標ID付加部130より前記指標ID付きストリームデータを受け取り、処理対象データ保存テーブル142に保存する(ステップS1602)。
また、問合わせ管理部118によって該処理対象データ管理部140が生成された時に指定された判定方法に従って、処理対象である指標ID付きデータを処理対象データ保存テーブル142より選択し、該指標ID付きデータを指標ID付きデータ処理部150へ出力する(ステップS1603)。
処理対象データ保存管理部141は、処理対象データ保存テーブル142に、前記判定方法によって処理対象から除外される指標ID付きストリームデータがある場合は(ステップS1604)、処理対象データ保存テーブル142から削除すると同時に、該指標ID付きストリームデータの指標IDと処理対象から除外されると判定された時刻を、前記指標保存部170へ通知する(ステップS1605)。
指標ID付きデータ処理部150は、データ処理部151と指標ID処理部152から構成される。
以下、図6に従って、指標ID付きデータ処理部150の処理を説明する。
指標ID付きデータ処理部150は、処理対象データ管理部140から指標ID付きデータを受け取り、問合わせ管理部118によって該指標ID付きデータ処理部150が生成された時に指定された方法により、データ処理部151において前記指標ID付きデータのデータ部を基に出力データを作成し(ステップS1702)、指標ID処理部152にておいて指標ID付きデータの指標IDを基に、1つ以上の指標IDと0個以上の演算子によって記述される指標ID式を作成し(ステップS1703)、その出力データと指標ID式の組である指標ID式付き処理結果データを生成し、指標付きデータ出力部160へ出力する(ステップS1704)。
指標付きデータ出力部160は、指標付きデータ生成部161と指標ID評価部162から構成される。
以下、図7、図8に従って、指標付きデータ生成部161と、指標ID評価部162の処理を説明する。
指標付きデータ生成部161は、指標ID付きデータ処理部150より、指標ID式付き処理結果データを受け取り、受け取った前記指標ID式付き処理結果データの時刻、および指標ID式付き処理結果データに含まれる指標ID式を指標ID評価部162に渡す(ステップS1802)。
指標ID評価部162は、指標ID式に含まれる指標ID集合を作成し(ステップS1902)、その指標ID集合の各要素について、対応する指標値を指標保存部170に問合わせる(ステップS1903)。
指標ID評価部162は、指標ID集合の全要素についてステップS1903の処理を実施する(ステップS1904)。取得した指標値を用いて、指標ID式付き処理結果データの指標ID式に対応する指標値を計算し、指標付きデータ生成部161に出力する(ステップS1905)。
指標付きデータ生成部161は、指標ID式付き処理結果データのデータ部である出力データと、指標ID評価部162より受け取った指標値である出力データの指標値を、ユーザ、または計算機106上で実行されるアプリケーション107に出力する(ステップS1803)。
指標保存部170は、指標保存管理部171と指標保存管理テーブル172から構成される。指標保存管理テーブル172は、メモリなどの高速なランダムアクセスが可能な記憶装置上に作成するのが望ましいが、ディスクなど他の記憶装置の上に作成してもよい。その場合、キャッシュ機構などを用いてアクセスの高速化を図ってもよい。
以下、図9に従って、指標保存部170の処理を説明する。
指標保存管理部171は、指標ID付きデータ生成部131から指標IDと指標値、指標値計算時刻、および該指標ID付きストリームデータを出力する先の処理対象データ管理部140の数である、処理対象データインスタンス数を受け取り、指標保存管理テーブル172に保存する(ステップS2003)。
また、処理対象データ保存テーブル142より指標IDと該指標IDを持つ指標ID付きストリームデータが処理対象から除外された時刻を受け取り、指標保存管理テーブル172より指標IDの行を検索し(ステップS2005)、該処理対象データインスタンス数が1であれば(ステップS2006)、時刻を指標保存管理テーブル172に処理対象データインスタンス消滅時刻として保持する(ステップS2007)。
処理対象データインスタンス数が1でなければ(ステップS2006)、処理対象データインスタンス数を1減らす(ステップS2008)。そして、指標ID評価部162より受け取った指標IDと時刻より、該指標IDの該時刻における指標値を検索し、その指標値を返す(ステップS2010)。
指標保存管理テーブル172に、処理対象データインスタンス消滅時刻が指標ID評価部162より受け取った時刻より前であるような指標IDがあれば、以降、指標IDは参照されないため、指標保存管理テーブル172より削除する(ステップS2011)。ステップS2011の処理は、指標ID評価部162より時刻を受け取る度に実施しても、その他のタイミングで実施してもよい。
図10は、図1の入力されるストリームデータの好適なデータフォーマットの例を模式的に表した図である。
ストリームデータはレコード形式であり、レコードを構成するタイムスタンプ201、商品ID202、商品位置203がセグメントに相当し、タイムスタンプ201、商品ID202、商品位置203の組み合わせをタプルとする。
この図10は、スマートシェルフシステムにおいて、商品の位置測定データの一例であり、該データは、RFIDリーダを搭載したスマートシェルフにRFIDタグが付加された商品を陳列し、RFIDリーダを用いて1秒間隔でRFIDタグの読み取りを行い、その結果RFIDリーダがRFIDタグを読めた場合は、RFIDタグが付加されている商品が棚の中にあると判定する。
また、RFIDリーダがRFIDタグを読めなかった場合は、RFIDタグが棚の外にあると判定して、RFIDリーダがRFIDタグの読み取りを行った時刻201、RFIDタグが付加されている商品ID202、および判定した商品の位置203を出力したものである。
図11は、連続して入力されたストリームデータからなる商品位置測定ストリーム310を例示した図である。
図11において、たとえば、行301は、タイムスタンプの値が「10:00’02」、商品IDが「商品1」、商品位置が「棚の中」であることを表している。
ここで、本実施の形態では、タイムスタンプを「10:00’02」のような時間、分、および秒の形式で表しているが、「2007/3/3 10:00’02 JST」のような日付を含めた形式に代表されるほかの形式でもよい。以下の図においても同様とする。
図12は、指標値計算用データ保存管理部133に保存するデータの例を模式的に表した図である。
この場合、ストリームデータに含まれる、RFIDリーダがRFIDタグの読み取りを行った時刻201、RFIDタグが付加されている商品ID202、前記方法によって判定した商品の位置203がカラム1001、カラム1002、カラム1003に保存され、指標ID付きデータ生成部131において生成された指標IDがカラム1004に保存されている。
図13は、ストリームデータに対する問合わせコマンドの一例を示したものである。なお、問合わせコマンドの形式は、図13の形式でもそれ以外の形式でもよい。
問合わせコマンド1101は、ユーザ、または計算機109上で実行されるアプリケーション110からコマンド入力部119を介して問合わせ管理部118に送られる。問合わせ管理部118は、問合わせコマンド1101を実現する処理対象データ管理部140、ならびに指標ID付きデータ処理部150を生成する。
問合わせコマンド1101は、商品位置測定ストリーム310(図11)より、取り出された商品の前記商品IDを求める問合わせである。つまり、商品位置測定ストリーム310に対して、同じ商品IDを持ち、(S1.product=S2.product)現在(S[now] as S1)の位置が棚の外(S1.position=棚の外)であり、その一つ前の時点では棚の中(S[rows 2] as S2、S2.position=棚の中)にあったような商品IDを出力(SELECT S.product)する問合わせである。
次に、上記した問合わせ実行の処理に沿って説明する。
図14は、指標関数アルゴリズムとなる入力ストリームデータの指標値計算方法の一例を示した図である。
本実施の形態の指標計算方法では、時系列データにおいて、同じデータが続いている場合には、前記データの信頼度を高く設定し、異なるデータが続いている場合には、データの信頼度を低く設定するものである。
図14において、di-1 、di 、di+1 は、指標値計算用データ保存テーブル134に保存してあるデータである。di は、指標値を計算する対象のデータ、di-1 、およびdi+1 はそれぞれdi の前後のデータである。
i の前、または後のデータが指標値計算対象でない場合、di-1 =null、またはdi+1 =nullとする。di は、指標計算対象のデータであるので、di ≠nullとする。
図14の指標値計算方法によると、di の前後のデータがいずれも指標値計算対象に入っている場合は、di が前後のデータと同じであれば、di の信頼度が1.0、di が前、あるいは後ろのどちらか一方のデータと同じであれば、di の信頼度が0.7、di が前後のデータと異なれば、di の信頼度が0.3となる。
i の前のデータは指標値計算対象に入っているが、後のデータが指標値計算対象に入っていない場合は、di が前のデータと同じであれば、di の信頼度が1.0、di が前のデータと異なれば、di の信頼度が0.5となる。
i の前のデータが指標値計算対象に入っておらず、後のデータが指標値計算対象に入っている場合は、di の信頼度は、その1つ前の時点で計算されたdi の信頼度と同じになる。di の前後のデータがともに指標計算対象外(di-1 =nullかつdi+1 =null)の場合は、di の信頼度は0.5となる。
図15は、指標ID付きデータ生成部131において作成された指標ID付きストリームデータを例示した図である。
図10に示したタイムスタンプ201、商品ID202、商品位置203が、タイムスタンプ501、商品ID502、商品位置503にそれぞれ対応し、それに加えて指標ID504が付加される。
図16は、指標保存管理テーブル172に保存するデータを例示したものである。指標ID601毎に、指標値計算時刻602と指標値603の組であるデータ610が保存される。
たとえば、指標ID 「p1」は、「10:00’02」の時点での指標値が「1.0」であることが保存されている。また図16の時点において、指標ID「p2」は、1つの前記処理対象データ管理部140に残っており、「p3」は他の2つの処理対象データ管理部140に残っており、指標ID「p1」は「10:00’04」に全ての前記処理対象データ管理部140から除外されている。
図17は、処理対象データ管理部140から出力された指標ID付きデータの例を示した図である。
前述した1つの処理対象データ管理部140から出力された指標ID付きデータの例が表701であり、他の1つの処理対象データ管理部140から出力された指標ID付きデータの例が表710である。
図18は、指標ID付きデータ処理部150から出力された指標ID式付き処理結果データの例を示した図である。
指標ID式付き処理結果データは、データ部であるタイムスタンプ801、商品ID802、ならびに指標ID部803からなる。指標ID部803は、生成前記指標ID付きデータ処理部へ入力された指標ID付きデータ701,702,703のうち、指標ID付きデータ702,703が指標ID部803より生成される。
本実施の形態では、指標ID部803を、指標ID付きデータ702,703の最小値としたが、他の方法で定めてもよい。
図19は、指標付きデータ出力部160から出力される出力データの例810、および出力データの指標値の例803を示した図である。
図18に示した指標ID式付き処理結果データの例の指標ID部803は、指標保存部170に保存されている指標値を用いて値が0.5と計算され、それが出力データの指標値として出力される。
図20は、計算機106上で実行されるアプリケーション107の処理の一例を示したものである。
図19に例示した出力データ、ならびに出力データの指標値を受け取ると、商品が棚から取り出された信頼度が「0.5」であるので、商品情報の検索が実行される。もし、商品が棚から取り出された信頼度が「0.6」であれば、商品情報を表示する。
また、商品の取り出し情報とその最終的な信頼度を蓄積しておき、後で蓄積された取り出し情報とその信頼度を用いて解析を行う。たとえば、商品の取り出し回数を集計し、棚から取り出された回数の多い人気商品を抽出する場合は、たとえば信頼度0.8以上など、信頼度の高いデータのみを取り出しイベントとして解析を行い、棚から取り出された回数の多い商品を抽出する。また、棚から取り出された回数の少ない、人気の低い商品を抽出する際には、たとえば信頼度0.1以下のデータは取り出しイベントではないと見なして、解析を行う。
以上において、入力ストリームの信頼度を計算し、ユーザなどによって事前に登録された問合わせに従って入力ストリームを処理することができる。
それにより、本実施の形態によれば、入力ストリームの信頼度を、時々刻々と変化する入力ストリームデータに基づいて再度評価し、出力結果の信頼度に反映することができるので、即時性と信頼性を両立したデータ処理を可能とすることができる。
(実施の形態2)
前記実施の形態1では、図1において、1つの指標ID付きストリームデータは、1つまたは複数の処理対象データ管理部140に出力されるとしたが、本実施の形態2においては、1つの指標ID付きストリームデータは、1つの前記処理対象データ管理部140にのみ出力されるものとする。
本実施の形態2では、指標ID付きデータ生成部131、指標保存管理部171、および指標保存管理テーブル172以外の構成は、前記実施の形態1の図1と同様となっている。
実施の形態1では、指標保存部170において、指標保存管理テーブル172において各指標IDを保持する必要があるか否かを判定するために、指標保存管理テーブル172に指標ID付きストリームデータインスタンス数を保存していたが、本実施の形態2においては指標ID付きストリームデータインスタンス数を保存しない。
指標ID付加部130は、ストリームデータを受け取り、指標ID付きデータ生成部131において指標IDを生成し、ストリームデータを生成した指標IDと共に指標値計算用データ保存管理部133に渡す。
指標値計算用データ保存管理部133は、ストリームデータを指標IDと共に指標値計算用データ保存テーブル134に保存する。また、指標ID付きデータ生成部131は、指標値計算部132へ指標IDを渡す。
指標値計算部132は、指標計算法管理部120にて指定された指標計算法に従って、指標計算に必要なデータ集合を指標値計算用データ保存管理部133より抽出し、指標計算法により、データ集合に含まれるそれぞれのデータの指標値を計算し、指標保存部170へ出力する。
指標計算法による指標計算に不要になった指標値計算用データ保存テーブル134内のデータは、指標値計算用データ保存管理部133により削除される。指標計算は、ストリームデータが到着する度に行っても、それ以外のタイミングで行ってもよい。
指標ID付きデータ生成部131は、ストリームデータと指標IDの組である指標ID付きストリームデータを、1つの処理対象データ管理部140に出力する。
指標保存管理部171は、指標ID付きデータ生成部131から指標IDと指標値、指標値計算時刻を受け取り、指標保存管理テーブル172に保存する。また、処理対象データ保存テーブル142より指標IDと該指標IDを持つ指標ID付きストリームデータが処理対象から除外された時刻を受け取り、時刻を指標保存管理テーブル172に処理対象データインスタンス消滅時刻として保持する。また、指標ID評価部162より受け取った指標IDと時刻より、該指標IDの該時刻における指標値を検索し、その指標値を返す。
また、指標保存管理テーブル172に、処理対象データインスタンス消滅時刻が指標ID評価部162より受け取った時刻より前であるような指標IDがあれば、以降、指標IDは参照されないため、指標保存管理テーブル172より削除する。この処理は、指標ID評価部162より前記時刻を受け取る度に実施しても、その他のタイミングで実施してもよい。
それにより、本実施の形態2によれば、1ストリームが1処理対象データ管理部にのみ入力されるような問合わせにおいて、指標保存部170におけるデータ管理に要する処理量を削減することができる。
(実施の形態3)
図21は、本発明の実施の形態3による指標付きストリームデータ処理システムの構成例を示すブロック図である。
本実施の形態3においては、処理結果の指標値ではなく、指標ID式を出力する。また、出力された指標ID式から指標値を求めるコマンドを受け付ける構成要素を持ち、指標値を求めるコマンドが入力された時点において、該指標ID式の指標値を計算する。
図21は、本実施の形態3における指標付きストリームデータ処理システム、および関連するシステム構成を示すブロック図である。
図21において、指標付きストリームデータ処理システム2100は、たとえば、計算機、またはサーバなどからなる。指標付きストリームデータ処理システム2100は、RFIDリーダ2101、センサノード2102、または計算機2103上で実行されるアプリケーション2104からリアルタイムに送信された情報をストリームデータとして入力とし、アプリケーション2110により入力されたコマンドに基づき、ストリームデータを有意な情報に変換して、処理結果である指標ID付き処理結果データを生成する。
そして、指標ID付き処理結果データをアプリケーション2107へ提供し、アプリケーション2114より入力されたコマンドに基づき、指標値を出力するストリームデータ処理を実行する。
また、アプリケーション2110は、ユーザ、または計算機2109で実行され、アプリケーション2107は、ユーザ、または計算機2106で実行され、アプリケーション2114は、ユーザ、または計算機2113で実行される。
図21において、指標付きストリームデータ処理システム2100、計算機2113、アプリケーション2114以外の構成要素は、前記実施の形態1,2と同様である。また、計算機2113、アプリケーション2114は、計算機2106、計算機2109、アプリケーション2107、またはアプリケーション2110と同じであっても異なってもよい。
図21の指標付きストリームデータ処理システム2100において、指標ID評価部2160、コマンド入力部2117以外の構成要素は、前記実施の形態1,2と同様である。
コマンド入力部2117は、計算機2113上で実行されるアプリケーション2114よりコマンドを受け付け、そのコマンドが指標ID式評価に係るコマンドの場合は、指標ID評価部2160へ、該コマンドにおいて指定された指標ID式の評価命令を出力し、指標ID評価部2160より評価結果の指標値を受け取り、ユーザ、または計算機2113上で実行されるアプリケーション2114へ出力する。また、コマンドが指標IDの削除に係るコマンドの場合は、指標保存管理部2171へ、該コマンドにおいて指定された指標IDの削除命令を出力する。
指標ID評価部2160は、コマンド入力部2117より指標ID式評価命令を受け取り、指標保存管理部2171より、指標ID式に含まれる指標IDに対応する指標値を取得し、それに基づいて指標ID式に対応する指標値を計算し、計算した指標値をコマンド入力部2117へ出力する。
それにより、本実施の形態3においては、指標IDから指標値への変換を、変換が必要となる任意のタイミングにおいて実行することで、不要な変換に要する処理量を削減することができる。
(実施の形態4)
図22は、本発明の実施の形態4による指標付きストリームデータ処理システムの構成例を示すブロック図である。
本実施形態4においては、指標IDを生成せず、ストリームデータと指標値の組を扱う技術について記載する。
図22は、本発明の一実施形態が適用された指標付きストリームデータ処理システム、および関連するシステム構成を示すブロック図である。
この図22において、指標付きストリームデータ処理システム2200以外のシステム構成要素は、前記実施の形態1(図1)と同様である。
指標付きストリームデータ処理システム2200は、コマンド入力部2219、問合わせ管理部2218、指標計算法管理部2220、指標付加部2230、処理対象データ管理部2240、および指標付きデータ処理部2250から構成される。
コマンド入力部2219、問合わせ管理部2218、指標計算法管理部2220は、前記実施の形態1の構成要素であるコマンド入力部119、問合わせ処理部118、ならびに指標計算法管理部120と同様である。
指標付加部2230は、指標付きデータ生成部2231、指標値計算部2232、指標値計算用データ保存管理部2230、指標値計算用データ保存テーブル2234から構成される。
指標付きデータ生成部2231は、RFIDリーダ2201、センサノード2202、または計算機2203上で実行されるアプリケーション2204からストリームデータを受け取り、受け取ったストリームデータを指標値計算用データ保存管理部2233へ出力する。
また、指標値計算部2232へ、指標値計算命令を出し、指標値計算部2232より、計算された指標値、及び該ストリームデータを受け取り、指標値とストリームデータの組である指標付きストリームデータを、処理対象データ管理部2240へ出力する。
指標値計算部2232は、指標付きデータ生成部2231より指標値計算命令を受け取り、指標値計算用データ保存管理部2233から指標値計算用のデータを抽出し、指標計算法管理部2220によって指定された指標値計算方法に従って、データの指標値を計算し、そのデータと指標値を指標付きデータ生成部へ出力する。
指標値計算用データ保存管理部2233は、指標付きデータ生成部2231より受け取ったストリームデータを、指標値計算用データ保存テーブル2234へ格納する。
ここで、処理対象データ管理部2240は、処理対象データ保存管理部2241、処理対象データ保存テーブル2242から構成される。処理対象データ保存管理部2241は、指標付加部2230より指標付きストリームデータを受け取り、処理対象データ保存テーブル2242に保存し、指標付きデータとして、指標付きデータ処理部2250へ出力する。
指標付きストリームデータと、ストリームデータ部分が同じで指標値が異なるような指標付きストリームデータが、既に処理対象データ保存テーブル2242に格納されている場合は、処理対象データ保存テーブル2242の該指標付きストリームデータの該指標部分を、受け取った指標付きストリームデータの該指標値に変更する。
同時に、指標付きデータ処理部2250に、指標値が変更されたことを通知する。処理対象データ保存管理部2241は、問合わせ管理部2218によって処理対象データ管理部2240が生成された時に指定された方法によって、処理対象データ保存テーブル2242から、処理対象データから除外される指標付きストリームデータを削除する。
また、指標付きデータ処理部2250は、データ処理部2251、指標処理部2252から構成される。
指標付きデータ処理部2250は、処理対象データ管理部2240から指標付きデータを受け取り、問合わせ管理部2218によって、指標付きデータ処理部2250が生成された時に指定された方法によって、データ処理部2251において、指標付きデータのデータ部から出力データを生成し、指標付きデータの指標部から出力データの指標を生成し、出力データと出力データの指標を、ユーザ、または計算機2206上で実行されるアプリケーション2207へ出力する。
指標付きデータ処理部2250は、処理対象データ管理部2240より指標値の変更通知を受け取り、指標処理部2252において、指標値の変更通知を反映して出力データの指標値を計算する。
それにより、本実施の形態4においては、指標付きストリームデータ処理システム2200のシステム構成を簡略することができ、コストを低減することができる。
(実施の形態5)
図23は、本発明の実施の形態5によるRFIDリーダの構成例を示したブロック図である。
本実施の形態5においては、複数の測定データより入力ストリームデータの信頼度を求める例を示す。本実施の形態では、システムの構成要素は前記実施の形態1と同様とするが、前記実施の形態1〜4のいずれかの構成としてもよい。
図23は、RFIDリーダ2300の構成例を示したものである。
RFIDリーダ2300には、たとえば、10個のアンテナ2301〜2310がそれぞれ接続されている。アンテナ2301〜2310は、たとえば、棚内などに設けられた各RFIDが、少なくとも1つのアンテナから読み取られるように配置される。
前述のように配置されたアンテナ2301〜2310によってRFIDタグの読み落としを防ぐことができる。図23の構成のように、RFIDリーダに比べて安価なアンテナの数を増やすことで、RFIDリーダの数を増やすよりも安価にRFIDタグの読み落としを防ぐことができる。なお、本実施の形態では、アンテナの個数を10個としたが、アンテナの個数は1個以上の任意の数でよい。
RFIDリーダ2300は、0.1秒間隔でアンテナ2301〜2310を、この順序で切り替えてRFIDタグの読み取りを行い、読み取ったRFIDタグの情報を読み取った順に、ストリームデータとして指標付きストリームデータ処理システム100(図1)に送信する。
たとえば、アンテナ2301,2302,2303によって読み取られたRFIDタグの情報は、ストリームデータ中に3回現れる。指標値計算部132においては、アンテナ2301〜2310のうち、最低1つのアンテナで読み取れたRFIDタグについて、後述の方法により、RFIDタグの読み取りデータに対する信頼度を計算する。
RFIDタグを読み取ったアンテナの数が多ければ信頼度を高くし、RFIDタグを読み取ったアンテナの数が少なければ信頼度を低くする。たとえば、RFIDタグがアンテナ2301でのみで読み取られた場合は、ゆらぎの可能性があるので信頼度を0.5とし、アンテナ2301とアンテナ2310との2つで読み取られた場合は、その信頼度を1.0とする。
RFIDリーダ2300は、アンテナ2301〜2310を、たとえば、0.1秒間隔で切り替えて読み取りを行うため、RFIDタグをアンテナ2301で読み取った時刻に対して、RFIDタグをアンテナ2310で読み取った時刻は約1.0秒程度遅延する。
そのため、前述の信頼度計算方法に従ってRFIDタグの読み取り信頼度を計算すると、まず、アンテナ2301によってRFIDタグを読み取った時点で信頼度が0.5となり、その約1.0秒後に、アンテナ2310によってRFIDタグを読み取った時点で信頼度が1.0となる。
図20に示したアプリケーションにおいて、商品情報の検索に約1秒を要すると仮定すると、アンテナ2301においてRFIDタグを読み取った時刻より1秒程度で商品情報が表示される。
本発明を利用せず、たとえば、アンテナ2301〜2310のうち、2以上のアンテナで読み取れたことが判明してから、商品情報の検索、および表示を行うシステムの場合、商品情報の表示には、アンテナ2301においてRFIDタグを読み取った時刻より約2.0秒の時間が必要となる。
それにより、本実施の形態5においては、複数の測定データからデータの信頼度を求めることが可能となる。
(実施の形態6)
図24は、本発明の実施の形態5によるセンサノードから入力されるストリームデータの好適なフォーマットの例を模式的に表した説明図、図25は図24の入力ストリームデータに対する問合わせの例を示した説明図、図26は、図25の問合わせの結果とその信頼度を受け取って処理を行うアプリケーションの一例を示す説明図である。
本実施の形態6においては、センサノードからの入力データに対する信頼度計算方法の例を示す。本実施の形態6では、システムの構成要素は前記実施の形態1と同様とするが、前記実施の形態1〜4のいずれかの構成としてもよい。また、関連するシステム構成としては、センサノード102(図1)からデータが入力されるものとする。
センサノード102は、たとえば、部屋の温度を10秒毎に継続的に計測し、その部屋のIDと計測した温度を組にして、ストリームデータとして指標付きストリームデータ処理システム100へ入力する。計測間隔は10秒でもそれ以外でもよい。
図24は、センサノード102から入力されるストリームデータの好適なフォーマットの例を模式的に表したものであり、温度測定時刻2401、部屋ID2402、測定した部屋の温度2403から構成される。
指標値計算部132において、後記の方法により、入力ストリームの信頼度を計算する。部屋の温度が10秒間で10度上昇することは、平常時には考えにくいが火災発生時などの非常時には起こりえる。
一方、10秒間で10度下降することは考えられにくい。そこで、10秒間で10度以上温度が上昇した場合は信頼度を0.5とし、その後も高い温度が継続すれば、信頼度を0.9とする。
一方、部屋の温度が10度以上上昇した後10秒間で10度以上下降すれば、信頼度を0.1に下げる。本実施の形態6では、温度上昇を10度としたが、それ以外の値でもよい。
図25は、入力ストリームデータに対する問合わせの例を示したものである。
部屋毎(GROUP BY roomID)の最新の計測温度を対象とし(FROM S[now])、温度が40度以上の(WHERE S.temperature>40)部屋IDを出力する(SELECT S.roomID)。
図26は、図25の問合わせの結果とその信頼度を受け取って処理を行うアプリケーションの例である。
部屋の温度が40度を超えており、かつその信頼度が0.5であれば、警備員に通知して警戒態勢をとる。部屋の温度が40度を超えており、かつその信頼度が0.9であれば、スプリンクラーを起動する。
部屋に火災が発生した場合はスプリンクラーを起動して消化作業を行う必要があるが、温度センサの不良などで火災でない場合にスプリンクラーを起動してしまうと損失が大きい。
このように、温度センサの不良である可能性が高い場合には、警備員への通知など、スプリンクラー起動よりもリスクの低い処理を選択することが可能である。
それにより、本実施の形態6においては、センサから入力される多値の測定データに対する信頼性を向上させることができる。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
本発明は、RFIDリーダやセンサなどのストリームデータを入力とし、入力データの処理結果に信頼度を付加して出力するストリーム処理技術に適している。
本発明の実施の形態1によるストリームデータ処理システムの構成例を示すブロック図である。 図1のストリームデータ処理システムに設けられた指標ID付加部の処理例を示すフローチャートである。 図2に続く指標ID付加部の処理例を示すフローチャートである。 図3に続く指標ID付加部の処理例を示すフローチャートである。 ストリームデータ処理システムに設けられた処理対象データ管理部の処理例を示すフローチャートである。 ストリームデータ処理システムに設けられた指標ID付きデータ処理部の処理例を示すフローチャートである。 ストリームデータ処理システムに設けられた指標付きデータ生成部、および指標ID評価部の処理例を示すフローチャートである。 図7に続く指標付きデータ生成部、および指標ID評価部の処理例を示すフローチャートである。 ストリームデータ処理システムに設けられた指標保存部の処理例を示すフローチャートである。 図1のストリームデータ処理システムに用いられるストリームデータにおけるデータフォーマットの一例を模式的に示した説明図である。 連続して入力されたストリームデータからなる商品位置測定ストリームを例示した説明図である。 図1のストリームデータ処理システムに設けられた指標値計算用データ保存管理部に保存されるデータ例を模式的に示した説明図である。 ストリームデータに対する問合わせコマンドの一例を示した説明図である。 入力ストリームデータの指標値計算方法の一例を示した説明図である。 図1のストリームデータ処理システムに設けられた指標ID付きデータ生成部が作成する指標ID付きストリームデータを例示した説明図である。 図1のストリームデータ処理システムに設けられた、指標保存管理テーブルに保存されるデータを例示した説明図である。 処理対象データ管理部から出力される指標ID付きデータの例を示した説明図である。 指標ID付きデータ処理部から出力される指標ID式付き処理結果データの例を示した説明図である。 図1のストリームデータ処理システムに設けられた指標付きデータ出力部から出力される出力データ、および出力データの指標値の例を示した説明図である。 計算機上で実行されるアプリケーション処理の一例を示した説明図である。 本発明の実施の形態3による指標付きストリームデータ処理システムの構成例を示すブロック図である。 本発明の実施の形態4による指標付きストリームデータ処理システムの構成例を示すブロック図である。 本発明の実施の形態5によるRFIDリーダの構成例を示したブロック図である。 本発明の実施の形態5によるセンサノードから入力されるストリームデータの好適なフォーマットの例を模式的に表した説明図である。 図24の入力ストリームデータに対する問合わせの例を示した説明図である。 図25の問合わせの結果とその信頼度を受け取って処理を行うアプリケーションの一例を示す説明図である。
符号の説明
100 指標付きストリームデータ処理システム
101 RFIDリーダ
102 センサノード
103 計算機
104 アプリケーション
106 計算機
107 アプリケーション
109 計算機
110 アプリケーション
111 ネットワーク
118 問合わせ管理部
119 コマンド入力部
120 指標計算法管理部
121 指標計算法選択部
122 指標計算法入力部
123 指標計算法保存部
130 指標ID付加部
131 指標ID付きデータ生成部
132 指標値計算部
133 指標値計算用データ保存管理部
134 指標値計算用データ保存テーブル
140 処理対象データ管理部
141 処理対象データ保存管理部
142 処理対象データ保存テーブル
150 指標ID付きデータ処理部
151 データ処理部
152 指標ID処理部
160 指標付きデータ出力部
161 指標付きデータ生成部
162 指標ID評価部
170 指標保存部
171 指標保存管理部
172 指標保存管理テーブル
183 指標ID付きストリームデータ
184 指標ID付きデータ
2100 指標付きストリームデータ処理システム
2101 RFIDリーダ
2102 センサノード
2103 計算機
2104 アプリケーション
2107 アプリケーション
2110 アプリケーション
2113 計算機
2114 アプリケーション
2106 計算機
2160 指標ID評価部
2171 指標保存管理部
2201 RFIDリーダ
2202 センサノード
2203 計算機
2204 アプリケーション
2206 計算機
2207 アプリケーション
2218 問合わせ管理部
2219 コマンド入力部
2280 問合わせ管理部
2220 指標計算法管理部
2230 指標付加部
2231 指標付きデータ生成部
2232 指標値計算部
2233 指標値計算用データ保存管理部
2234 指標値計算用データ保存テーブル
2240 処理対象データ管理部
2241 処理対象データ保存管理部
2242 処理対象データ保存テーブル
2250 指標付きデータ処理部
2251 データ処理部
2252 指標処理部
2283 指標付きストリームデータ
2300 RFIDリーダ
2301〜2310 アンテナ

Claims (9)

  1. タイムスタンプが付加された複数のデータが、前記タイムスタンプの昇順に継続的に到来する時系列データの流れであるストリームを、任意に登録された問合わせに従って処理するストリームデータ処理システムであって、
    任意の時間内の前記ストリームを利用し、指標関数アルゴリズムに基づいて計算した第1の指標となる指標値をストリームデータに付加し、前記第1の指標の指標値に基づいて得られる第2の指標の指標値を、前記第1の指標が付加されたストリームデータの処理結果に付加することを特徴とするストリームデータ処理方法。
  2. 請求項1記載のストリームデータ処理方法において、
    前記第1、および第2の指標は、前記ストリームデータの正しさを示す確率である信頼度であることを特徴とするストリームデータ処理方法。
  3. 請求項1記載のストリームデータ処理方法において、
    前記第2の指標は、時々刻々と変化するストリームに対して、前記ストリームデータより後のタイムスタンプが付加されているストリームデータが到来した時点、または任意の時間間隔で指標関数アルゴリズムに基づいて、前記ストリームデータの指標値を再計算し、その再計算されたストリームデータの指標値に基づいて処理結果の指標値を求めたものであることを特徴とするストリームデータ処理方法。
  4. 請求項1記載のストリームデータ処理方法において、
    前記ストリームデータにおける指標値は、
    前記ストリームデータの前後の任意の時間内のストリームを利用して、予め定義された指標関数アルゴリズムに従って計算することを特徴とするストリームデータ処理方法。
  5. 請求項1記載のストリームデータ処理方法において、
    前記ストリームデータの処理結果と前記第2の指標の指標値に基づいて、信頼度に応じたストリームデータを処理する指標別処理を行うことを特徴とするストリームデータ処理方法。
  6. タイムスタンプが付与された複数のデータが、前記タイムスタンプの昇順に到来する時系列データの流れであるストリームを、任意に登録された問合わせに従って処理するストリームデータ処理システムであって、
    入力されたストリームデータの指標値を第1の指標として計算し、指標IDを採番して前記ストリームデータに指標IDを付加して出力し、任意のタイミングで前記指標値を再計算する指標ID付加部と、
    前記採番された指標IDと計算した前記指標値と前記指標値が計算された時刻の組、または前記指標IDと再計算された前記指標値と前記指標値が再計算された時刻の組とを保存する指標保存部と、
    登録された問合わせに従って、処理対象となる前記指標IDが付加されたストリームデータを管理する処理対象データ管理部と、
    各時点において処理対象となる前記指標IDが付加されたストリームデータに対して処理を実行し、その処理結果と前記指標IDを利用して記述される前記処理結果の指標ID式を出力する指標ID付きデータ処理部と、
    前記指標ID式と前記指標保存部に保存されている前記指標値とより、前記処理結果の指標値を求めて、前記処理結果と共に出力する指標付きデータ出力部とを備えたことを特徴とするストリームデータ処理システム。
  7. 請求項6記載のストリームデータ処理システムにおいて、
    前記指標値を計算する指標関数アルゴリズムを入力する入力手段を備えたことを特徴とするストリームデータ処理システム。
  8. タイムスタンプが付与された複数のデータが、前記タイムスタンプの昇順に到来する時系列データの流れであるストリームを、任意に登録された問合わせに従って処理するストリームデータ処理システムであって、
    入力されたストリームデータの第1の指標となる指標値を計算して前記ストリームデータに付加して出力し、任意のタイミングで前記第1の指標を再計算して前記ストリームデータに付加して出力する指標付加部と、
    任意に登録された問合わせに従って、処理対象となる指標IDが付加されたストリームデータを管理する処理対象データ管理部と、
    各時点において処理対象となる前記第1の指標が付加されたストリームデータに対して処理を実行し、その処理結果と第2の指標となる指標値を出力する指標付きデータ処理部とを備えたことを特徴とするストリームデータ処理システム。
  9. 請求項8記載のストリームデータ処理システムにおいて、
    前記指標値を計算する指標関数アルゴリズムを入力する入力手段を備えたことを特徴とするストリームデータ処理システム。
JP2007169228A 2007-06-27 2007-06-27 ストリームデータ処理方法およびストリームデータ処理システム Expired - Fee Related JP5055039B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007169228A JP5055039B2 (ja) 2007-06-27 2007-06-27 ストリームデータ処理方法およびストリームデータ処理システム
US12/035,094 US7949653B2 (en) 2007-06-27 2008-02-21 Stream data processing method and stream data processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007169228A JP5055039B2 (ja) 2007-06-27 2007-06-27 ストリームデータ処理方法およびストリームデータ処理システム

Publications (2)

Publication Number Publication Date
JP2009009302A true JP2009009302A (ja) 2009-01-15
JP5055039B2 JP5055039B2 (ja) 2012-10-24

Family

ID=40161795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007169228A Expired - Fee Related JP5055039B2 (ja) 2007-06-27 2007-06-27 ストリームデータ処理方法およびストリームデータ処理システム

Country Status (2)

Country Link
US (1) US7949653B2 (ja)
JP (1) JP5055039B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL192477A0 (en) * 2008-06-26 2009-02-11 Hyperroll Israel Ltd A method and system for creation and dynamic updating of best data store system
IL195956A0 (en) 2008-12-15 2009-09-01 Hyperroll Israel Ltd Automatic data store architecture detection
IL197961A0 (en) * 2009-04-05 2009-12-24 Guy Shaked Methods for effective processing of time series
US8930352B2 (en) * 2011-06-30 2015-01-06 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Reliance oriented data stream management system
US9396157B2 (en) * 2011-08-26 2016-07-19 International Business Machines Corporation Stream application performance monitoring metrics
US10083430B2 (en) * 2012-06-08 2018-09-25 Ronny Hay Computer-controlled, unattended, automated checkout store outlet system and related method
CN108846534B (zh) * 2018-04-09 2021-12-24 绵阳伦奇机器人有限公司 基于验证辅助的气密性追溯方法和系统
CN108830339B (zh) * 2018-04-09 2021-12-24 绵阳伦奇机器人有限公司 气密检测追溯系统
CN108920516B (zh) * 2018-05-31 2022-03-22 北京字节跳动网络技术有限公司 实时分析方法、系统、装置及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024251A (ja) * 2000-07-07 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> 時系列データの分類方法及び装置並びに時系列データの分類プログラムを記録した記録媒体
JP2006268369A (ja) * 2005-03-23 2006-10-05 Nippon Telegr & Teleph Corp <Ntt> センサデータ管理装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4687253B2 (ja) * 2005-06-03 2011-05-25 株式会社日立製作所 ストリームデータ処理システムのクエリ処理方法
JP4723301B2 (ja) * 2005-07-21 2011-07-13 株式会社日立製作所 ストリームデータ処理システムおよびストリームデータ処理方法
US7552099B2 (en) * 2006-03-10 2009-06-23 International Business Machines Corporation System and method for indexing a data stream

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024251A (ja) * 2000-07-07 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> 時系列データの分類方法及び装置並びに時系列データの分類プログラムを記録した記録媒体
JP2006268369A (ja) * 2005-03-23 2006-10-05 Nippon Telegr & Teleph Corp <Ntt> センサデータ管理装置

Also Published As

Publication number Publication date
US20090006310A1 (en) 2009-01-01
JP5055039B2 (ja) 2012-10-24
US7949653B2 (en) 2011-05-24

Similar Documents

Publication Publication Date Title
JP5055039B2 (ja) ストリームデータ処理方法およびストリームデータ処理システム
US8335782B2 (en) Ranking query processing method for stream data and stream data processing system having ranking query processing mechanism
JP4992945B2 (ja) ストリームデータ生成方法、ストリームデータ生成装置及びストリームデータ生成プログラム
US20130282726A1 (en) Grouping identity records to generate candidate lists to use in an entity and relationship resolution process
US20070288459A1 (en) Stream data processing method cooperable with reference external data
US20150278355A1 (en) Temporal context aware query entity intent
US8943042B2 (en) Analyzing and representing interpersonal relations
US10067964B2 (en) System and method for analyzing popularity of one or more user defined topics among the big data
JP2012048332A (ja) データベース処理方法、データベース処理システム及びデータベースサーバ
AU2011247915B2 (en) Enhancing an inquiry for a search of a database
CN110543477B (zh) 一种标签构建系统及方法
CN109086354A (zh) 一种基于可扩展节点集群的大数据分析处理系统
JP6366529B2 (ja) 動線処理システム及び動線処理方法
US20220027252A1 (en) Systems and methods for detecting, analyzing, and evaluating interaction paths
US10719561B2 (en) System and method for analyzing popularity of one or more user defined topics among the big data
US20220180400A1 (en) Information processing apparatus, display system, and information processing method
JP2004078917A (ja) 製造最適化および同期化プロセス
Khoussainova et al. Peex: Extracting probabilistic events from RFID data
CN113641780B (zh) 搜索方法、系统、设备、存储介质和计算机程序产品
WO2016027364A1 (ja) 話題クラスタ選択装置、及び検索方法
JP5424989B2 (ja) Posデータ分析装置及び方法及びプログラム
EP4002151A1 (en) Data tagging and synchronisation system
CN113076322A (zh) 一种商品搜索处理方法及装置
JP4664847B2 (ja) 過誤発注防止方法
JP2011258097A (ja) データ処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100303

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120730

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees