JP5936765B2 - データ処理装置、データ処理システム、および、データ処理方法 - Google Patents

データ処理装置、データ処理システム、および、データ処理方法 Download PDF

Info

Publication number
JP5936765B2
JP5936765B2 JP2015504131A JP2015504131A JP5936765B2 JP 5936765 B2 JP5936765 B2 JP 5936765B2 JP 2015504131 A JP2015504131 A JP 2015504131A JP 2015504131 A JP2015504131 A JP 2015504131A JP 5936765 B2 JP5936765 B2 JP 5936765B2
Authority
JP
Japan
Prior art keywords
data
station
data processing
entry
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015504131A
Other languages
English (en)
Other versions
JPWO2014136328A1 (ja
Inventor
助田 浩子
浩子 助田
伊藤 雅一
雅一 伊藤
一博 大関
一博 大関
恵 小池
恵 小池
庸夫 永井
庸夫 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Application granted granted Critical
Publication of JP5936765B2 publication Critical patent/JP5936765B2/ja
Publication of JPWO2014136328A1 publication Critical patent/JPWO2014136328A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/04Payment circuits
    • G06Q20/045Payment circuits using payment protocols involving tickets
    • G06Q20/0457Payment circuits using payment protocols involving tickets the tickets being sent electronically
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2143Clearing memory, e.g. to prevent the data from being stolen

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Devices For Checking Fares Or Tickets At Control Points (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Finance (AREA)

Description

参照による取り込み
本出願は、平成25年(2013年)3月5日に出願された日本出願である特願2013−43027の優先権を主張し、その内容を参照することにより、本出願に取り込む。
本発明は、データ処理装置に関する。
昨今、公共交通機関向けの電子乗車券の導入が進んでいる。このような電子乗車券は、乗客が切符を買う手間を省き、電子マネーとしても利用されるため、乗客にとっての利便性を向上させることができる。さらに、電子乗車券は、不正防止および効率向上など、交通事業者にとっても大きな効果を生み出している。
電子乗車券として利用されるICカード(IC=Integrated Circuit,携帯電話等に内蔵されたICチップも含む)には、電子乗車券の各々を識別するID(Identification)コードが格納される。電子乗車家に格納されたIDコードに基づいて、各駅の改札機の通過の履歴、および、購買の履歴を収集し、収集された履歴を情報配信およびマーケティング等に役立てる方法が提供されている。
一方、個人情報保護およびプライバシー保護に関する意識が高まっているため、個人の履歴に関する情報を分析する場合、氏名、住所、および電話番号等の個人を特定できる情報を個人の履歴から削除する処理、および、個人を識別するIDを暗号化する処理等が求められるようになっている。
例えば、「個人情報および機微な情報を含む入力ファイルから、個人単位での経年変化を統計的追跡することが可能でかつ機微な情報を個人情報から分離した出力ファイルを生成し、データ処理制御装置やその一部を構成するデータベースの一部またはすべてが漏洩しても出力ファイル中の機微な情報と個人を特定することができないデータ処理制御装置」を実現するため、処理中にのみ有効な一時ファイルとして、「集計一次データベース」と「個人名寄せデータベース」を用いて、元の個人情報を含むデータファイルから、集計データファイルを生成する方法が提案されている(例えば、特許文献1参照)。
特開2007−141192号公報
電子乗車券から収集された履歴情報を分析し、その分析結果を活用する場合、履歴情報を含むデータの処理には、個人情報を保護する観点、および、データを有効に活用する観点から注意が必要である。例えば、氏名および住所など、個人を特定できる情報を履歴情報から削除しても、電子乗車券に格納されるIDをキーにして長期間の履歴を追うことができ、これによって、第三者がその電子乗車券の保有者の行動を把握できる。このため、利用者のプライバシーを十分に保護することができない。
しかし、全ての履歴情報から電子乗車券のIDを一律に削除した場合、複数の鉄道会社間の乗継情報を含む流動情報および行動傾向も、履歴情報から把握できないことになり、データの活用価値が損なわれる。
特許文献1が提案する方法によれば、個人情報を含まない集計データファイルが生成されるが、集計処理のたびに個人情報を含む元のデータを参照する必要があり、このため、集計処理のたびに個人情報に配慮した処理を行う必要がある。
データを有効に活用するために、個人情報を含む元のデータを保持する者(例えば、事業者)と、集計および分析を行う者(例えば、担当者)とが異なる場合も想定され、このような場合、前述の特許文献1が提案する方法では、元のデータを保持する者と、集計等を行う者との間で、個人情報が漏えいする可能性がある。このため、個人情報の漏えいのリスクを回避するため、集計および分析を行う者が、集計処理の際に元の個人情報を含むデータを参照しない方法が求められる。
本発明の目的は、電子乗車券の利用者のプライバシーを保護しつつ、データを最大限に活用することができるシステムを提供することである。
本発明の代表的な一例を示せば以下の通りである。すなわち、利用者の行動を示す履歴データを処理するデータ処理装置であって、前記履歴データは、前記利用者を示す第1の識別子、および、前記利用者が行動した時刻を示す時刻情報を含み、前記データ処理装置は、前記履歴データを取得する第1の通信インタフェースと、前記取得された履歴データを格納するメモリと、前記取得された履歴データを用いて、前記第1の識別子および前記時刻情報を含む第1のデータを生成し、前記生成された第1のデータを前記メモリに格納するデータ処理部と、前記時刻情報が第1の期間中である第1のデータにおいて有効な第2の識別子に、前記第1の識別子を変換することによって第2のデータを生成し、前記生成された第2のデータを前記メモリに格納するID変換処理部と、前記履歴データおよび前記第1のデータを、前記メモリから削除するメンテナンス部と、を有する。
本発明の一実施形態によると、利用者のプライバシーを十分に保護しつつ、データを最大限に活用することができる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
本実施例1のデータ管理システムの全体の構成を示す説明図である。 本実施例1の複数のシステムによる主な処理を示す説明図である。 本実施例1のサービス提供システムのハードウェア構成を示すブロック図である。 本実施例1のデータ処理基盤のソフトウェアの構成を示すブロック図である。 本実施例1の共通データを示す説明図である。 本実施例1の受信データを示す説明図である。 本実施例1の第一次ログを示す説明図である。 本実施例1の拠点情報を示す説明図である。 本実施例1の集計情報を示す説明図である。 本実施例1の第二次ログを示す説明図である。 本実施例1の初期変換処理の前半を示す説明図である。 本実施例1の初期変換処理の後半を示す説明図である。 本実施例1の初期変換処理において保持されるメモリの記憶領域を示す説明図である。 本実施例1の初期変換処理において行われる乗継判定処理と経路推定処理との詳細を示す説明図である。 本実施例1の拠点抽出処理を示す説明図である。 本実施例1のデータ集計処理(移動ログ)による流動集計データを生成する処理を示す説明図である。 本実施例1のデータ集計処理(滞在ログ)による滞在集計データを生成する処理を示す説明図である。 本実施例1のデータ集計処理(拠点情報)による拠点集計データを生成する処理を示す説明図である。 本実施例1のID再変換処理を示す説明図である。 本実施例1の同一性保持期間の算出処理を示す説明図である。 本実施例1の同一性保持期間を算出するための集計用一時メモリを示す説明図である。 本実施例1の駅レポートを生成する処理を示す説明図である。 本実施例1の駅レポートを示す説明図である。 本実施例1の個別分析処理を示す説明図である。 本実施例1の個別分析処理の結果の個別分析レポートを示す説明図である。 本実施例1の処理とデータとの関係を示す説明図である。 本実施例1の複数の処理の各々とデータとの関係を示す説明図である。 本実施例1のデータ処理基盤にカードIDを変換させるために制御用端末に表示される画面を示す説明図である。 本実施例1のデータ処理基盤に駅レポートを生成させるために制御用端末に表示される画面を示す説明図である。 本実施例2のデータ管理システムの全体の構成を示す説明図である。 本実施例2の複数のシステムによる主な処理を示す説明図である。 本実施例2のサービス提供システムのハードウェア構成を示すブロック図である。 本実施例2のデータ提供基盤のソフトウェアの構成を示すブロック図である。 本実施例2の制御用端末に表示される画面例を示す説明図である。 本実施例2のデータ可視化サービスにおける制御用端末の画面の例を示す説明図である。 本実施例2のアプローチを設定するための制御用端末に表示される画面を示す説明図である。 本実施例3のデータ管理システムの全体の構成を示す説明図である。 本実施例3の複数のシステムによる主な処理を示す説明図である。
本発明は、利用者の履歴を活用した情報サービスを提供する事業者のためのサーバ及びコンピュータプログラムに係り、特に、利用者のプライバシーに配慮しつつ、個人の行動を反映した分析およびデータの活用を可能とする、システムおよび方法である。
本発明によって実現されるデータ管理システムの実施例1を、図1から図27により説明する。
図1は、本実施例1のデータ管理システムの全体の構成を示す説明図である。
実施例1のデータ管理システムは、情報提供サービスを行う。実施例1のデータ管理システムは、データ処理システム1、データ保持システム2、および、クライアント3を含む。データ処理システム1は、利用者の電子乗車券4の利用状況に基づいて、サービスとして分析結果をクライアント3に提供するシステムである。
データ保持システム2は、電子乗車券4から収集された電子乗車券4の履歴を保持する。クライアント3は、データ処理システム1がサービスを提供するシステムであり、例えば、データ処理システム1の顧客である。
データ処理システム1は、データ処理基盤10、少なくとも一つの制御用端末17、および、内部ネットワーク16を含む。データ処理基盤10は、少なくとも一つの計算機に備わり、制御部11と情報格納部12とを有する。データ処理基盤10は、複数のサーバ群によって構成されてもよい。
制御用端末17は、オペレータ7による指示をデータ処理基盤10へ入力するための端末であり、また、データ処理基盤10による処理結果をオペレータ7に出力するための端末である。制御用端末17は、例えば、ディスプレイまたはプリンタである。制御用端末17は、内部ネットワーク16によってデータ処理基盤10に接続される。制御用端末17は、オペレータ7によるデータ処理基盤10への指示を受け付ける。
データ保持システム2は、データ収集基盤20と、少なくとも一つの改札機27と、精算端末28と、内部ネットワーク26と、を有する。データ収集基盤20は、少なくとも一つの計算機に備わり、制御部21と情報格納部22とを有する。データ収集基盤20は、複数のサーバ群によって構成されてもよい。
図2は、本実施例1の複数のシステムによる主な処理を示す説明図である。
駅構内等に設置された改札機27および精算端末28等は、利用者5が電子乗車券4を利用した場合(処理41)、電子乗車券4の履歴を収集し(処理42)、内部ネットワーク26を介してデータ収集基盤20に履歴を送信する。
データ収集基盤20の制御部21は、改札機27の各々、および、精算端末28の各々から送信される履歴を集約し、集約された履歴を情報格納部22に格納する。そして、制御部21は、情報格納部22に格納された履歴に含まれるデータ(カードID含む)を適宜変換した後(処理43)、変換後の履歴をデータ処理システム1に送信する(処理44)。
データ処理システム1が履歴を受信した場合(処理45)、データ処理基盤10の制御部11は、受信した履歴を情報格納部12に格納する。そして、制御部11は、情報格納部12に格納された履歴を変換し(処理46)、変換後のデータを集計し、さらにデータに含まれるIDを変換する(処理47)。制御部11は、集計されたデータを分析し(処理48)、分析された結果(以下、分析結果)を生成し、必要に応じてクライアント3に分析結果を提供する(処理49)。クライアント3は、分析結果を受領し(処理50)、分析結果を活用する。
なお、処理49において、データ処理システム1は、紙媒体等によってクライアント3に分析結果を提供してもよいし、ネットワークを介して分析結果をクライアント3に送信してもよい。
図3は、本実施例1のデータ処理システム1のハードウェア構成を示すブロック図である。
以下において、データ処理基盤10が単一のサーバによって構成される場合を例に、データ処理基盤10の構成を説明する。
データ処理基盤10の制御部11は、プロセッサ101と、メモリ102と、ネットワークI/F103と、ネットワークI/F106とを備える。また、情報格納部12は、プログラム記憶装置104と、少なくとも一つの外部記憶装置105とを備える。
プロセッサ101と、メモリ102と、ネットワークI/F103と、ネットワークI/F106と、プログラム記憶装置104と、少なくとも一つの外部記憶装置105とは、内部バスによって接続され、相互にデータの送受信が可能である。
プロセッサ101は、例えば、CPU(Central Processing Unit)であり、マイクロプロセッサを主体に構成される。プロセッサ101は、メモリ102およびプログラム記憶装置104に格納されるプログラムを実行することにより、コンピュータに各種の機能を実装させる。
メモリ102は、例えば、ランダムアクセスメモリ(RAM)、または、リードオンリーメモリ(ROM)等によって実装され、プロセッサ101によって実行されるプログラム、および、処理されるデータ等を格納する。
ネットワークI/F103は、内部ネットワーク16に接続するためのインタフェースである。ネットワークI/F106は、データ保持システム2と接続するためのネットワークインタフェースである。なお、データ処理基盤10の制御部11は、クライアント3に分析結果を送信するためのネットワークインタフェース(図示なし)を有してもよい。
プログラム記憶装置104は、例えば、フラッシュメモリ等の不揮発性メモリである。外部記憶装置105は、例えばハードディスクとドライブ、または、DVDとドライブとにより構成され、プロセッサ101によって実行されるプログラム、および、処理されるデータ等を格納する。
データ処理基盤10は、制御用端末17と、内部ネットワーク16を介して接続される。データ処理基盤10において生成、集計、および分析されたデータは、内部ネットワーク16を介して制御用端末17に送信される。オペレータ7は、データを抽出する指示、および分析する指示等を制御用端末17に入力する。
制御用端末17は、プロセッサ111、メモリ112、ネットワークI/F113、プログラム記憶装置114、および、外部記憶装置115を備える計算機である。プロセッサ111は、例えばCPU等の演算装置であり、メモリ112は、プログラムおよびデータを格納する記憶装置であり、ネットワークI/F113は内部ネットワーク16と接続するためのインタフェースである。また、プログラム記憶装置114、および、外部記憶装置115は、プログラム記憶装置104、および、外部記憶装置105と同じ機能の装置である。
また、制御用端末17は、オペレータ7が操作するための入力装置116と、データ処理基盤10による処理結果を表示するための表示装置117を備える。
図4は、本実施例1のデータ処理基盤10のソフトウェアの構成を示すブロック図である。
制御部11は、初期変換処理部131、拠点抽出処理部132、データ集計処理部133、入出力処理部134、ID再変換処理部135、レポート生成処理部136、個別分析処理部137、および、メンテナンス部138を、機能部として有する。図3に示す制御部11が有する機能部の各々は、ソフトウェアプログラムによって実装されるが、LSI等の集積回路等によって実装されてもよい。
初期変換処理部131は、受信した履歴を変換する。拠点抽出処理部132は、変換された履歴から拠点を抽出する。
データ集計処理部133は、拠点抽出処理部132による処理が終了したデータを集計する。ID再変換処理部135は、データに含まれるIDを再変換する。レポート生成処理部136は、分析結果を生成する。
個別分析処理部137は、集計情報146および第二次ログ145を個別に分析する。
入出力処理部134は、制御用端末17とデータを送受信する。本実施例において、オペレータ7が制御用端末17を用いて期間等の指定をする場合、入出力処理部134がオペレータ7からの指示を受け付け、受け付けた指示を各処理部に入力する。
メンテナンス部138は、情報格納部12に格納されるデータを削除する機能を有する。
情報格納部12は、共通データ141、受信データ142、第一次ログ143、拠点情報144、第二次ログ145、および、集計情報146を有する。共通データ141は、制御部11の機能部の各々の処理において必要なデータを格納する。
受信データ142は、データ保持システム2から受信したデータを格納する。第一次ログ143は、受信データ142を変換した結果を格納する。拠点情報144は、第一次ログ143から抽出される拠点情報を格納する。
第二次ログ145は、第一次ログ143を変換した結果を格納する。集計情報146は、第一次ログ143等を集計した結果を格納する。
共通データ141は、駅マスタ151、路線マスタ152、経路マスタ153、および、その他各種マスタ154を含む。駅マスタ151は、駅に関する情報を含む。路線マスタ152は、路線に関する情報を含む。経路マスタ153は、経路に関する情報を含む。その他各種マスタ154は、必要に応じてあらかじめ設定された値を含む。
受信データ142は、改札通過ログ155、属性マスタ156、および、定期券マスタ157を含む。改札通過ログ155は、電子乗車券4の利用履歴を含む。属性マスタ156は、電子乗車券4の保有者の性別と年齢とを示す。定期券マスタ157は、電子乗車券4が定期券である場合、電子乗車券4の定期券に関する情報を含む。
第一次ログ143は、移動ログ158、滞在ログ159、および、カードマスタ160を含む。移動ログ158は、改札入場と改札出場とを示すデータを関連付けることによって改札通過ログ155から抽出される、鉄道内の移動を示すデータを含む。滞在ログ159は、改札出場と改札入場とを関連付けることによって改札通過ログ155から抽出される、駅付近における滞在を示すデータを含む。カードマスタ160は、属性マスタ156と定期券マスタ157とをマージしたデータを含む。
拠点情報144は、拠点抽出結果161、および、滞在頻度データ162を含む。拠点抽出結果161は、履歴に格納されたIDごとに抽出された拠点を示す。滞在頻度データ162は、拠点を抽出するために必要な、利用者5の滞在頻度を集計したデータを含む。
集計情報146は、流動集計データ166、滞在集計データ167、および、拠点集計データ168を含む。流動集計データ166は、移動ログ158を集計した結果である。滞在集計データ167は、滞在ログ159を集計した結果である。拠点集計データ168は、拠点抽出結果161を集計した結果である。
第二次ログ145は、移動ログ163、滞在ログ164、および、カードマスタ165を含む。移動ログ163は、移動ログ158に含まれるIDを変換した結果である。滞在ログ164は、滞在ログ159のIDを変換した結果である。カードマスタ165は、カードマスタ160に拠点情報144をマージした結果である。
以下、図5〜図10に、情報格納部12のデータの代表的なデータ構造を示す。
図5は、本実施例1の共通データ141を示す説明図である。
駅マスタ151は、駅ID201、駅名202、鉄道事業者203、所在地204、および、緯度経度205等の情報を含む。駅ID201は、駅の識別子を含む。駅名202は、駅の名称を含む。鉄道事業者203は、駅ID201が示す駅を運営する事業者を示す。所在地204は、駅ID201が示す駅の所在地を示す。緯度経度205は、駅ID201が示す駅の緯度と経度とを示す。
路線マスタ152は、路線ID211、路線名212、事業者213、路線タイプ214、および、停車駅ID215等の情報を含む。路線ID211は、路線の識別子を含む。路線名212は、路線の名称を含む。事業者213は、路線ID211が示す路線を運営する事業者を示す。路線タイプ214は、例えば、普通、または、特急などの運用形態を示す。停車駅ID215は、路線ID211が示す路線に含まれる駅の識別子を示す。
経路マスタ153は、入場駅と出場駅とが指定された場合に、乗り継いだ路線を含む経路を割り当てるために用いられる。経路マスタ153には、入場駅と出場駅との一つの組(区間)に、少なくとも一種類の経路の候補が定義される。
経路マスタ153は、経路ID221、入場駅ID222、出場駅ID223、曜日224、時間帯225、乗車回数226、所要時間227、料金228、および、乗車経路229等の情報を含む。経路ID221は、経路の識別子を含む。入場駅ID222、および出場駅ID223は、駅の識別子を含む。
曜日224は、経路が用いられる曜日を示し、例えば、月曜日から金曜日までに用いられる経路には"平日"が格納される。
乗車経路229には、入場駅ID222が示す駅から出場駅ID223が示す駅に行くための、乗り継ぎ前の路線、乗り継ぎ後の路線、および、乗り継ぎに用いる駅等を示す詳細な経路情報が格納される。
経路マスタ153は、入場駅ID222と出場駅ID223との組合せが同じである、複数のエントリを含んでもよい。そして、経路マスタ153を用いて乗車経路229を選択する処理において、乗車する曜日および乗車する時間帯を含む条件が与えられた場合、入場駅ID222と出場駅ID223との組合せが同じである複数のエントリの中から、条件に該当する曜日224、および時間帯225の乗車経路229が選択される。
例えば、図5において、経路ID221が「30011」のエントリと「30012」のエントリとは、入場駅ID222と出場駅ID223との組合せが同じである。これらのエントリは、利用者5が朝に乗車した場合、乗車回数が4回であり、かつ、所要時間が42分である経路が選択され、利用者5が昼に乗車した場合、乗車回数が5回であり、かつ、所要時間が45分である経路が選択されることを示す。
その他各種マスタ154は、集計または分析に必要なマスタデータを格納し、例えば、ランドマークマスタ、曜日マスタ、および、イベントマスタ等を含む。ランドマークマスタは、ランドマークの最寄駅、および、営業時間等を示す。曜日マスタは、日付と、曜日(本実施例において、平日、休日、および、祝日)とが対応づけられて格納される。イベントマスタは、イベントの開催日、および、開催場所を示す。
図6は、本実施例1の受信データ142を示す説明図である。
受信データ142は、データ保持システム2から受信したデータである。
改札通過ログ155は、ログID231、カードID232、処理日時233、駅ID234、処理種別235、および、精算額236等の情報を含む。ログID231は、改札通過ログのエントリの各々を一意に示す。
カードID232は、電子乗車券4に格納されるIDに対応する。
なお、データ収集基盤20は、収集された履歴に含まれる電子乗車券4に格納されるIDを、逆変換できないような方法(後述)で、カードID232が示す値に変換する。これは、データ処理システム1において、悪意あるユーザが、カードID232から利用者5個人を特定することを回避するためであり、個人情報保護のためである。このため、カードID232によって、電子乗車券4の各々をオブジェクトとして区別することは可能であるが、電子乗車券4を特定することはできない。
処理日時233は、カードID232が示す電子乗車券4が、改札機27を通過した日時を示す。駅ID234は、駅の識別子を示す。
処理種別235は、「出場」または「入場」を示す。精算額236は、処理種別235が「出場」を示すエントリの処理日時233、または処理日時233の直前に行われた精算端末28における精算時の精算額を示す。
属性マスタ156は、カードID241、性別242、および、年齢243等の情報を含む。カードID241は、電子乗車券4に格納されるIDに対応するが、カードID232と同じく、電子乗車券4を特定することができない値である。
性別242は、カードID241が示す電子乗車券4を有する利用者5の性別を示す。年齢243は、カードID241が示す電子乗車券4を有する利用者5の年齢を示す。
なお、属性マスタ156の情報は、データ保持システム2が保持している段階では、電子乗車券4を有する利用者5の氏名、住所、および電話番号等の、個人を特定することが可能な情報を含む。しかし、データ収集基盤20は、データ処理基盤10に属性マスタ156を送信する前に、個人情報保護の観点から、個人を特定することが可能な情報を属性マスタ156から削除する。
定期券マスタ157は、カードID244、定期区間245、通勤通学種別246、期間247、および、開始終了情報248等の情報を含む。カードID244は、定期券機能を有する電子乗車券4に対応する識別子である。カードID244は、カードID232およびカードID241と同じく、電子乗車券4の各々を区別できるが、電子乗車券4を特定することはできない。
定期区間245は、定期券機能が利用される区間を示す。通勤通学種別246は、定期券の種別を示す。期間247は、定期券機能が利用される期間を示す。開始終了情報248は、定期券機能の利用を開始する日と利用を終了する日とを示す。
図7は、本実施例1の第一次ログ143を示す説明図である。
改札通過ログ155から、カードID232が同じエントリが抽出され、抽出されたエントリのうち処理種別235が「入場」であるエントリと「出場」であるエントリとが関連付けられ、さらに関連付けられた「入場」と「出場」とのエントリを連結することによって、一連の移動(他社線の乗継を含めて、出発から到着までの移動)を示す情報が生成される。移動ログ158には、この一連の移動を示す情報が格納される。
移動ログ158は、ログID251、カードID252、出発日時253、到着日時254、出発駅ID255、到着駅ID256、連結数257、移動経路258、経路詳細259、および、運賃700等の情報を含む。ログID251は、移動ログ158のエントリの各々の識別子を含む。移動ログ158の1エントリは、1回の移動を示す。
カードID252は、電子乗車券4の識別子に対応し、かつ、カードID232と同じく電子乗車券4を特定できない値である。出発日時253は、カードID252が示す電子乗車券4が移動を開始した時刻を示す。到着日時254は、カードID252が示す電子乗車券4が移動を終了した時刻を示す。
出発駅ID255は、移動が開始された駅の識別子を含む。到着駅ID256は、移動が終了した駅の識別子を含む。連結数257は、カードID252の移動において、改札機27への入場と改札機27からの出場との組合せが連結された数を示す。
移動経路258は、改札機27への入場と改札機27からの出場との組合せを示す。連結数257が2以上の場合、移動経路258には2以上の組合せが格納される。
経路詳細259は、経路マスタ153の経路ID221が格納され、移動した順に格納される。
滞在ログ159は、改札通過ログ155のカードID262が同じであるエントリのうち、処理種別235が出場であるエントリと、当該エントリに連続する処理種別235が入場であるエントリとを関連付けることによって生成された情報である。
このため、移動ログ158は、鉄道を使って「どこからどこへ行ったか」を示し、滞在ログ159は、改札外での「滞在」を示す。本実施例における「滞在」には、出場と、当該出場に続く入場とが同一の駅でない場合等、鉄道以外の手段(徒歩、タクシー、または、自家用車等)による移動を伴う場合も含む。
滞在ログ159は、ログID261、カードID262、出場日時263、入場日時264、出場駅ID265、入場駅ID266、滞在タイプ267、および、滞在時間268等の情報を含む。
ログID261は、滞在ログ159のエントリの各々の識別子を含む。カードID262は、電子乗車券4に対応する。出場日時263は、改札機27から出場した時刻を示す。入場日時264は、改札機27から入場した時刻を示す。
出場駅ID265は、出場した改札機27が設置される駅の識別子を示す。入場駅ID266は、入場した改札機27が設置される駅の識別子を示す。
滞在タイプ267は、想定される滞在の目的を示す。滞在時間268は、出場日時263と入場日時264との差の時間を示す。
例えば、1日(本実施例において1営業日であり、始発から終電までの時間)における最初のデータが入場を示し、当該入場の前に出場のデータがない場合、滞在タイプ267は「日の最初」を示す。また、例えば、1日における最後のデータが出場を示し、当該出場の後に入場のデータがない場合、滞在タイプ267は「日の最後」を示す。
また、例えば、出場した後のデータに、所定の条件に該当する駅および時間において入場したデータがある場合、滞在タイプ267は、「乗継」、または、「訪問(出場と入場が存在する、乗継でない滞在)」のいずれかを示す。
カードマスタ160は、年月271、カードID272、性別273、年齢274、定期券有無275、定期区間276、および、通勤通学種別277等の情報を含む。年月271は、定期券機能が有効な年と月とを示す。
カードID272は、電子乗車券4に対応し、かつ、カードID232と同じく電子乗車券4を特定できない値である。性別273および年齢274は、カードID272が示す電子乗車券4の利用者5の性別および年齢を示し、属性マスタ156の性別242および年齢243に対応する。
定期券有無275は、カードID272が示す電子乗車券4が定期券機能を有するか否かを示す。定期区間276は、定期券機能が利用される区間を示し、定期区間245に対応する。通勤通学種別277は、定期券機能の種別を示し、通勤通学種別246に対応する。
図8は、本実施例1の拠点情報144を示す説明図である。
拠点情報144は、指定された期間における指定されたカードID262の滞在ログ159に基づいて推定された、当該カードID262が示す電子乗車券4を保有する利用者5の「なわばり」に関する情報を示す。「なわばり」に関する情報とは、例えば、居住最寄駅(居住駅)、および、勤務(通学)最寄駅(勤務駅)などである。
拠点抽出結果161は、年月281、カードID282、居住駅283、勤務駅284、および、定期券有無285等の情報を含む。年月281は、「なわばり」に関する情報を推定するために指定された期間を示す。カードID282は、電子乗車券4に格納されるIDに対応し、カードID232と同じく、電子乗車券4を特定できない値である。
居住駅283は、カードID282が示す電子乗車券4を保有する利用者5が住んでいる場所の最寄駅として推定される駅の名称を示す。勤務駅284は、カードID282が示す電子乗車券4を保有する利用者5の勤務値の最寄駅、または、利用者5が通学する学校の最寄駅として推定される駅の名称を示す。
滞在頻度データ162は、拠点抽出結果161を生成するために用いた集計データであり、カードID292毎に、指定された期間(本実施例において、月単位)の駅ごとの滞在回数を示す。滞在頻度データ162は、年月291、カードID292、駅293、回数294、および、内訳295を含む。
年月291は、「なわばり」に関する情報を推定するために指定された期間を示す。カードID292は、電子乗車券4に格納されるIDに対応し、カードID232と同じく、電子乗車券4を特定できない値である。
内訳295は、滞在が行われた曜日(本実施例において、平日、または、休日等)、滞在の時間帯、滞在タイプ(滞在タイプ267に対応)、滞在時間(滞在時間268に対応)を含む。
図9は、本実施例1の集計情報149を示す説明図である。
流動集計データ166は、移動ログ158に、属性マスタ156が示す属性を付加し、さらに、付加された属性に従って件数を集計した結果である。流動集計データ166は、出発駅301、到着駅302、日付303、平日/休日フラグ304、時間帯305、移動経路306、件数307、所要時間内訳308、および、性年代属性内訳309等の情報を含む。
出発駅301は、移動を開始した駅の識別子を示す。到着駅302は、移動を終了した駅の識別子を示す。日付303は、移動した日付を示す。平日/休日フラグ304は、移動した曜日を示す。時間帯305は、移動した時間帯を示す。移動経路306は、移動した経路を示す。
件数307は、出発駅301、到着駅302、日付303、平日/休日フラグ304、時間帯305、および、移動経路306が示す移動の件数を含む。所要時間内訳308は、移動に必要な時間の内訳を、経路ごとに示す。また、所要時間内訳308は、時間の内訳の代わりに、移動に必要な時間の平均値、最頻値、または、中央値等を示してもよい。性年代属性内訳309は、移動した人の数の内訳を、性別、および年代毎に示す。
滞在集計データ167は、滞在ログ159に、属性マスタ156が示す属性を付加し、さらに、付加された属性に従って件数を集計した結果である。滞在集計データ167は、滞在駅311、日付312、平日/休日フラグ313、時間帯314、件数315、滞在タイプ内訳316、滞在時間内訳317、および、性年代属性内訳318等の情報を含む。
滞在駅311は、滞在した駅の識別子を示す。日付312は、滞在した日付を示す。平日/休日フラグ313は、滞在した曜日を示す。時間帯314は、滞在した時間帯を示す。
件数315は、滞在駅311、日付312、平日/休日フラグ313、および時間帯314が示す滞在の件数を含む。滞在タイプ内訳316は、滞在ログ159に格納された滞在タイプ267の内訳を示す。滞在時間内訳317は、滞在時間の内訳を示す。性年代属性内訳318は、滞在した人の数の内訳を、性別、および年代毎に示す。
拠点集計データ168は、拠点抽出結果161とカードマスタ160とに基づいて、指定された期間における拠点抽出結果の内訳を、属性ごとに集計したものである。拠点集計データ168は、居住駅321、勤務駅322、年月323、性年代属性324、件数325、および、定期券有無・通勤通学内訳326等の情報を含む。
居住駅321は、利用者5が居住する場所の最寄駅であると推定された駅の識別子を示す。勤務駅322は、利用者5の勤務先の最寄駅であると推定された駅の識別子、または、利用者5が通学する学校の最寄駅であると推定された駅の識別子を示す。
年月323は、拠点を推定するために指定された年月を示す。性年代属性324は、カードマスタ160の性別273および年齢274によって割り当てられた属性を示す。
件数325は、居住駅321および勤務駅322が示す駅が拠点であり、性年代属性324が示す属性の利用者5の数を示す。定期券有無・通勤通学内訳326は、カードマスタ160の定期券有無275および通勤通学種別277に基づく属性ごとの、利用者5の数の内訳を示す。
図10は、本実施例1の第二次ログ145を示す説明図である。
第二次ログ148は、第一次ログ143と同様の内容を含む。第二次ログ148と第一次ログ143との相違点は、第二次ログ148が、第一次ログ143よりも同一性保持期間が短いカードIDを有する点である。第二次ログ148が有するカードIDは、第一次ログ143のカードIDが変換された結果である。
従って、第二次ログ148の移動ログ163および滞在ログ164は、移動ログ158のカードID252および滞在ログ159のカードID262が変換された結果であり、第一次ログ143の移動ログ158のデータ構造および滞在ログ159のデータ構造と、第二次ログ148の移動ログ163のデータ構造および滞在ログ164のデータ構造とは、同じである。
カードマスタ165は、第一次ログ143のカードマスタ160に拠点抽出結果161をマージした結果である。カードマスタ165は、年月331、カードID332、性別333、年齢334、居住駅335、勤務駅336、定期券有無337、定期区間338、および、通勤通学種別339等の情報を含む。
次に、図11〜図23を用いて、各種処理の処理手順を示す。
図11、図12および図13Bは、初期変換処理(移動ログ158および滞在ログ159の生成処理)の手順を、ステップごとに表したものである。この処理は、初期変換処理部131によって実行される。
図11は、本実施例1の初期変換処理の前半を示す説明図である。
図12は、本実施例1の初期変換処理の後半を示す説明図である。
図11および図12に示す処理は、図2に示す処理46に含まれる。
初期変換処理部131は、例えば1日分のデータがデータ保持システム2から送信され、受信データ142に格納された場合、図11に示す処理を開始してもよい。また、制御部11が有するデータ受信部(図示しない)からデータの受信を通知された場合、初期変換処理部131は、図11に示す処理を開始してもよい。
以下の説明において、受信データ142は、改札通過ログ155を1日(=1営業日)単位に保持しており、初期変換処理部131は、1日分の改札通過ログ155に初期変換処理を行う。ただし、受信データ142が、1週間、または1か月等の特定の期間ごとに改札通過ログ155を保持する場合も、初期変換処理部131は、図11、および、図12に示す処理を実行する。
また、以下の説明において、初期変換処理部131は、メモリ102に一時的にデータを保存する。
図13は、本実施例1の初期変換処理において保持されるメモリ102の記憶領域、および、初期変換処理において行われる乗継判定処理421と経路推定処理422との詳細を示す説明図である。
図13Aは、本実施例1の初期変換処理において保持されるメモリ102の記憶領域を示す説明図である。
メモリ102は、初期変換処理部131による初期変換処理が実行される間、入場情報格納用メモリ709、出場情報格納用メモリ713、移動ログ生成用メモリ716、および、ログ連結用メモリ727を保持する。
入場情報格納用メモリ709は、入場情報を保持し、入場駅710、入場日時711、および、乗継フラグ712を含む。出場情報格納用メモリ713は、出場情報を保持し、出場駅714および出場日時715を含む。
移動ログ生成用メモリ716は、移動ログ158を生成する前に、改札への入場と改札からの出場との組合せを作るための情報を一時的に格納する記憶領域である。移動ログ生成用メモリ716は、カードID718、入場日時719、出場日時720、入場駅ID721、出場駅ID722、運賃723、経路ID724、および、乗継フラグ725等の情報を含む。
経路ID724は、経路マスタ153の経路ID221に対応する。また、乗継フラグ725は、乗り継いだ後の移動であるか否かを示すフラグである。乗継フラグ725が「1」であるエントリは、乗継の直前の移動における出場駅で乗り継いだ後の移動、または、当該出場駅の近隣の駅で、乗り継いだ後の移動を示す。乗継フラグ725が「0」であるエントリは、乗継ぎがなかった移動、または、乗り継ぐ前の移動を示す。
ログ連結用メモリ727は、移動ログ生成用メモリ716の移動ログを連結した結果を、出力するための情報を一時的に格納する記憶領域である。ログ連結用メモリ727は、カードID728、出発日時729、到着日時730、出発駅ID731、到着駅ID732、連結数733、移動経路734、経路詳細735、および、運賃736等の情報を含む。
初期変換処理部131は、図11に示す処理を、所定の周期において実行する。初期変換処理部131は、まず、1営業日単位に保持された改札通過ログ155のエントリを、カードID232に従って整列する。さらに、初期変換処理部131は、カードID232ごとに時系列にエントリを整列する(S400)。
S400の後、初期変換処理部131は、カードID232の値ごとに、改札通過ログ155のエントリに以下の処理を繰り返す(S401)。
初期変換処理部131は、メモリ102に保持される入場情報格納用メモリ709(入場駅710、入場日時711、乗継フラグ712)、および、出場情報格納用メモリ713(出場駅714、および出場日時715)に格納された値をクリアする(S402)。そして、初期変換処理部131は、改札通過ログ155のエントリを処理日時233が早い順に一つずつ抽出し、抽出されたエントリ(以下、エントリA)に以下の分岐処理を繰り返す(S403)。
ここで、初期変換処理部131は、エントリAの処理種別235が「入場」であるか否かを判定する。処理種別235が「入場」である場合(S404)、初期変換処理部131は、入場情報格納用メモリ709の入場駅710および入場日時711に、エントリAの駅ID234および処理日時233を格納する(S405)。
S405の後、初期変換処理部131は、出場情報格納用メモリ713に値が格納されているか否かを判定し、格納されている場合(S406)、出場情報格納用メモリ713の値と入場情報格納用メモリ709の値とから、図13Bに示す乗継判定処理421を行う。
図13Bは、本実施例1の初期変換処理において行われる乗継判定処理421と経路推定処理422との詳細を示す説明図である。
乗継判定処理421は、エントリAの直前の処理日時233のエントリ(以下、エントリB)と、エントリAとが、一連の移動を示すか否か(他社間の乗継が行われたか)を判定する処理である。
初期変換処理部131は、乗継判定処理421において所定の条件に該当したと判定した場合、入場情報格納用メモリ709の乗継フラグ712に「1」を格納する。また、所定の条件に該当しない場合、乗継フラグ712に「0」を格納する(S407)。
乗継判定処理421における所定の条件とは、エントリBの駅ID234とエントリAの駅ID234とが同じ駅グル―プであり、かつ(または)、エントリBの処理日時233とエントリAの処理日時233との差が所定の時間以内であることである。駅グループ、および、所定の時間は、管理者または運用者によってあらかじめ設定される値である。
S407の後、初期変換処理部131は、出場情報格納用メモリ713の値と入場情報格納用メモリ709の値とを組み合わせた値を、滞在ログ159の新たなエントリとして出力する(S408)。
具体的にはS408において、初期変換処理部131は、出場情報格納用メモリ713の出場駅714および出場日時715を、滞在ログ159の出場駅ID265および出場日時263に格納し、入場情報格納用メモリ709の入場駅710および入場日時711を、滞在ログ159の入場駅ID266および入場日時264に格納する。
また、初期変換処理部131は、S408において、乗継フラグ712が「1」である場合、滞在タイプ267に「乗継」を格納し、乗継フラグ712が「0」である場合、滞在タイプ267に「訪問」を格納する。また、初期変換処理部131は、出場日時263と入場日時264との差の時間を、滞在時間268に格納する。また、初期変換処理部131は、滞在ログ159において一意の値をログID261に格納し、カードID262にエントリAのカードID232を格納する。
S408の後、初期変換処理部131は、出場情報格納用メモリ713をクリアする(S409)。
S405の後、出場情報格納用メモリ713に値が格納されていないと判定された場合(S410)、エントリAは、エントリAと同じカードID232のエントリのうち、一営業日における初めての入場を示すエントリであるため(改札通過ログ155に保持されるエントリが1日単位でなく特定の期間のエントリである場合、その期間の中で初めての入場を示す)、初期変換処理部131は、乗継フラグ712に「0」を格納する(S411)。
S411の後、初期変換処理部131は、入場情報格納用メモリ709の値を、滞在ログ159の新たなエントリとして出力する(S412)。具体的には、S412において初期変換処理部131は、入場情報格納用メモリ709の入場駅710および入場日時711を、滞在ログ159の新たなエントリの入場駅ID266および入場日時264に格納し、出場日時263および出場駅ID265に「なし」を格納する。
また、S412において初期変換処理部131は、滞在ログ159の新たなエントリの滞在タイプ267に、「日の最初」を格納し、滞在時間268に「−」を格納する。また、初期変換処理部131は、ログID261に滞在ログ159において一意の値を格納し、カードID262にエントリAのカードID232を格納する(S412)。
S403の後、エントリAの処理種別235が「出場」であると判定された場合(S413)、出場情報格納用メモリ713の出場駅714および出場日時715にエントリAの駅ID234および処理日時233を格納する(S414)。
図11に示すS414の後、初期変換処理部131は、入場情報格納用メモリ709に値が格納されているか否かを判定し、格納されている場合(図12に示すS415)、入場情報格納用メモリ709の値と出場情報格納用メモリ713の値とを組合せて、図13Bに示す経路推定処理422を実行する。そして、初期変換処理部131は、入場情報格納用メモリ709の値と出場情報格納用メモリ713の値とを移動ログ生成用メモリ716に値を出力する(S416)。
経路推定処理422は、入場駅710および出場駅714の組合せ、ならびに入場日時711および出場日時715の差の時間(所要時間)と、経路マスタ153の入場駅ID222および出場駅ID223の組合せ、ならびに所要時間227とを比較し、エントリAのカードID232が示す電子乗車券4が通った経路を推定する処理である。
経路推定処理422の結果、初期変換処理部131は、エントリAのカードID232が示す電子乗車券4が通ったと推定される経路の経路ID221および料金228を取得できる。初期変換処理部131は、S416において、取得された経路ID221および料金228を、移動ログ生成用メモリ716の新たなエントリの経路ID724および運賃723に格納する。
また、初期変換処理部131は、S416において、新たなエントリのカードID718、入場駅ID721、入場日時719、乗継フラグ725、出場駅ID722、および、出場日時720に、エントリAのカードID232、入場情報格納用メモリ709の入場駅710、入場日時711および乗継フラグ712、ならびに、出場情報格納用メモリ713の出場駅714および出場日時715を格納する。
S416の後、初期変換処理部131は、エントリAが、エントリAと同じカードID232のエントリのうち、一営業日における最後のエントリである場合、滞在ログ159の新たなエントリの滞在タイプ267に「日の最後」を格納する。そして、初期変換処理部131は、出場情報格納用メモリ713の出場駅714および出場日時715を、滞在ログ159の出場駅ID265および出場日時263に格納し、滞在ログ159の入場駅ID266および入場日時264に「なし」を格納する。また、初期変換処理部131は、滞在時間268に「−」を格納し、滞在ログ159において一意の値をログID261に格納し、カードID262にエントリAのカードID232を格納する。
さらに、エントリAが、エントリAと同じカードID232のエントリのうち一営業日における最後のエントリである場合、初期変換処理部131は、出場情報格納用メモリ713をクリアする(S417)。
エントリAが、エントリAと同じカードID232のエントリのうち一営業日における最後のエントリでない場合、S416の後、出場情報格納用メモリ713に値が保持される。
S414の後、入場情報格納用メモリ709に値が格納されていないと判定した場合(S419)、無効な出場であるため、初期変換処理部131は、出場情報格納用メモリ713をクリアする(S420)。
すべての改札通過ログ155について、S401における繰り返し処理が終わった場合、初期変換処理部131は、ログ連結用メモリ727をクリアする(S701)。そして、初期変換処理部131は、移動ログ生成用メモリ716に格納されたエントリの一つを順に抽出し、抽出されたエントリ(エントリC)に下記の処理を繰り返す(S702)。
エントリCの乗継フラグ725が「1」である場合(S703)、エントリCは乗り継ぎ後の移動を示すため、初期変換処理部131は、エントリCのカードID718と同じカードID718のログ連結用メモリ727のエントリに、エントリCの値を格納する(S704)。
具体的には、初期変換処理部131は、S704において、エントリCに対応するログ連結用メモリ727のエントリにおける到着駅ID732および到着日時730を、エントリCの出場駅ID722および出場日時720によって更新する。
また、初期変換処理部131は、エントリCの「:入場駅ID721−出場駅ID722」(駅マスタ151を参照し、駅の名称に変換されてもよい)を、移動経路734に追加し、エントリCの経路ID724を経路詳細735に追加する。また、初期変換処理部131は、連結数733に1を加算し、運賃736に運賃723を加算する。
S702の後、エントリCの乗継フラグ725が「0」である場合(S705)、エントリCは乗り継ぎ前の移動、または、乗継を伴わない移動を示す。このため、S705の後においてログ連結用メモリ727に値が格納されている場合、エントリCはログ連結用メモリ727が示す移動とは異なる移動を示すため、初期変換処理部131は、ログ連結用メモリ727の値を移動ログ158の新たなエントリに出力する(S706)。
なお、ログ連結用メモリ727のカードID728、出発日時729、到着日時730、出発駅ID731、到着駅ID732、連結数733、移動経路734、経路詳細735、および運賃736は、移動ログ158のカードID252、出発日時253、到着日時254、出発駅ID255、到着駅ID256、連結数257、移動経路258、経路詳細259、および、運賃700に対応する。
S706の後、初期変換処理部131は、ログ連結用メモリ727をエントリCの値によって初期化する。具体的には、初期変換処理部131は、ログ連結用メモリ727をクリアした後、出発駅ID731としてエントリCの入場駅ID721、出発日時729としてエントリCの入場日時719、到着駅ID732としてエントリCの出場駅ID722、到着日時730としてエントリCの出場日時720、移動経路734としてエントリCの「入場駅ID721−出場駅ID722」(駅マスタ151を参照し、駅の名称に変換されてもよい)、経路詳細735としてエントリCの経路ID724、連結数733として「1」、運賃736としてエントリCの運賃723、カードID728としてエントリCのカードID718を格納する(S707)。
S702において、移動ログ生成用メモリ716のすべてのエントリにS703〜S707の処理を実行した後、初期変換処理部131は、残ったログ連結用メモリ727を移動ログ158に出力する(S708)。
S708の後、初期変換処理部131は、図11および図12に示す処理が行われた受信データ142を、情報格納部12から削除する(S790)。また、S790において、初期変換処理部131は、メンテナンス部138に指示し、図11および図12に示す処理が行われた受信データ142を、情報格納部12から削除させてもよい。
これによって、図11および図12に示す処理が行われた受信データ142は削除され、利用者5の行動を取得できる情報が、データ処理基盤10から削除される。そして、利用者5のプライバシーを秘匿することが可能になる。
図11および図12に示す処理により、改札通過ログ155から、移動ログ158および滞在ログ159が生成される。
図14は、本実施例1の拠点抽出処理を示す説明図である。
図14に示す拠点抽出処理は、図4に示す拠点抽出処理部132によって実行される。また、図14に示す処理は、図2に示す処理46に含まれる。
以下に示す例において、拠点抽出処理部132は、1か月分の滞在ログ169を用いて拠点抽出処理を行うことにより、電子乗車券4の各々の拠点を推定する。しかし、拠点抽出処理部132は、1か月よりも長い期間の滞在ログ169を用いて拠点抽出処理を行ってもよいし、1か月よりも短い期間の滞在ログ169を用いて拠点抽出処理を行ってもよい。
用いる滞在ログ169の期間が長い場合、滞在ログ169のデータ量が増えるため、拠点抽出処理により得られる結果は精度が高い。また、用いる滞在ログ169の期間が短い場合、引越し等による拠点の変化を、結果に反映させることができる。
拠点抽出処理部132は、メモリ102に一時的に保持された集計用配列をクリアし(S430)、1か月分の滞在ログ159から一つのエントリを抽出する。そして、抽出されたエントリについて以下の処理を繰り返す(S431)。拠点抽出処理部132は、抽出された滞在ログ159のエントリから、カードID262、出場日時263、入場日時264、出場駅ID265、入場駅ID266、および滞在タイプ267を取得する(S433)。
S433の後、拠点抽出処理部132は、取得された出場日時263と入場日時264とに基づいて滞在の時間帯(1時間単位、または朝、昼、夕、もしくは夜等の分類)、および、滞在が平日または休日であるかを示す値(以下、平休別と記載)を決定し、出場駅ID265と入場駅ID266とに基づいて滞在駅を決定する(S433)。
なお、抽出されたエントリには、滞在タイプ267に従って、出場情報(出場日時263および出場駅ID265)、または入場情報(入場日時264および入場駅ID266)の値が格納されていない場合がある。例えば、出場情報がない場合、時間帯を朝と類推し、滞在駅を入場駅ID266の駅に推定するなど、あらかじめ設定された方法によって時間帯および滞在駅を類推し、決定する。
S433の後、拠点抽出処理部132は、カードID262、決定された滞在駅、決定された平休別、決定された滞在の時間帯、滞在タイプ267、および、滞在時間268をキーとして、集計用配列の「件数」の値を、一つインクリメントする(S434)。
S432〜S434の処理を、拠点抽出処理部132は、滞在ログ159の1か月分のエントリに繰り返し、「件数」を算出することによって、電子乗車券4の滞在状況に従った滞在回数を算出する。滞在ログ159の1か月の全てのエントリに基づいて、滞在回数を算出した後、拠点抽出処理部132は、メモリ102の集計用配列から、カードID(カードID262に相当)と滞在駅(決定された滞在駅に相当)とが同じであるエントリグループを抽出し、抽出されたエントリグループごとにS436を繰り返す(S435)。
拠点抽出処理部132は、S436において、抽出されたエントリグループに基づいて、滞在頻度データ162に値を出力する。具体的には、拠点抽出処理部132は、S431〜S434において用いた滞在ログ159の期間(前述の例では1か月)の年と月とを、年月291に格納する。また、抽出されたエントリグループのエントリ数を、回数294に格納し、平休別、滞在の時間帯、滞在タイプ(滞在タイプ267に対応)、および、滞在時間ごとのエントリ数を、内訳295に格納する(S436)。
S435の後、拠点抽出処理部132は、メモリ102に保持された集計用配列をクリアし(S437)、S437の後、拠点抽出処理部132は、属性マスタ156および定期券マスタ157と、滞在ログ159のカードID262とに基づいてカードマスタ160を生成する。具体的には、滞在ログ159のカードID262に相当する、属性マスタ156のエントリを抽出する。
そして、拠点抽出処理部132は、抽出された属性マスタ156のエントリのカードID241、性別242および年齢243を、カードマスタ160のカードID272、性別273および年齢274に格納する。そして、拠点抽出処理部132は、カードID272に相当するカードID244のエントリが定期券マスタ157に含まれる場合、カードID272に相当する定期券マスタ157のエントリの定期区間245および通勤通学種別246を、カードマスタ160の定期区間276および通勤通学種別277に格納し、さらに定期券有無275に「あり」を格納する。そして、カードID272に相当するカードID244のエントリが定期券マスタ157に含まれない場合、拠点抽出処理部132は、当該カードID272の定期券有無275に「なし」を格納する。
そして、拠点抽出処理部132は、カードマスタ160からエントリを一つずつ抽出し、すべてのエントリに以下の処理を実行する(S438)。拠点抽出処理部132は、抽出されたエントリの定期区間276をメモリ102に格納する(S439)。
S439の後、拠点抽出処理部132は、滞在頻度データ162を参照し、カードマスタ160から抽出されたエントリのカードID272に対応する駅293および内訳295と、メモリ102に格納された定期区間276との関係から、カードID272に対応する電子乗車券4を有する利用者5の自宅の最寄駅(以下、居住駅)と、勤務先(または、通学先の学校)の最寄駅(以下、勤務駅)とを所定のルールにより推定する(S423)。
ここでは、居住駅および通勤駅(以下、拠点駅)を推定するためのルールの詳細については述べない。しかし、拠点抽出処理部132は、1日の最初の滞在と最後の滞在とが多い駅、または、朝および夜の滞在が多い駅は、居住駅である傾向が高く、平日の昼間における長時間の滞在(訪問)が多い駅は、勤務駅である傾向が高いことを利用して、最も拠点駅である可能性が高い駅を、居住駅および通勤駅に推定する。また、拠点抽出処理部132は、定期区間276に値が格納される場合、定期区間276の情報も用いて拠点駅を推定する。
そして、拠点抽出処理部132は、推定された結果(居住駅283および勤務駅284に格納)と、カードID272の値(カードID282に格納)と、定期券有無275の値(定期券有無285に格納)を、拠点抽出結果161に出力する(S424)。データが足りない等の理由で拠点駅を推定できない場合、拠点抽出処理部132は、居住駅283および勤務駅284に空白を格納してもよい。
図15は、本実施例1のデータ集計処理(移動ログ)による流動集計データ166を生成する処理を示す説明図である。
図15に示す処理は、データ集計処理部133によって実行される。図15に示す処理は、図2に示す処理47に含まれる。
データ集計処理部133は、メモリ102の集計用配列をクリアする(S737)。
S737の後、データ集計処理部133は、所定の期間分(オペレータ7の任意の期間)の移動ログ158から、一つのエントリを抽出し、以下の処理を繰り返す(S738)。データ集計処理部133は、移動ログ158の抽出されたエントリから、カードID252、出発日時253、到着日時254、出発駅ID255、到着駅ID256、および、移動経路258の値を取得する(S739)。
S739の後、データ集計処理部133は、取得されたカードID252をキーにカードマスタ160を参照し、性別273および年齢274の性年代属性情報を取得し(S740)、取得された出発日時253および到着日時254から、平休別、および移動した時間帯を決定する(S741)。そして、データ集計処理部133は、出発駅ID255、到着駅ID256、日付(出発日時253および/または到着日時254の日付)、平休別、移動した時間帯、移動経路258、所要時間(出発日時253と到着日時254との差の時間)、および、性年代属性情報をキーに、集計用配列の件数の値を一つインクリメントする(S742)。
なお、S742において、データ集計処理部133は、出発駅ID255および到着駅ID256を、駅マスタ151を参照することによって駅の名称である出発駅および到着駅に変換してもよい。
移動ログ158のエントリにステップ739〜ステップ742の処理が終わった場合、データ集計処理部133は、集計用配列の出発駅、到着駅、日付、平休別、移動した時間帯、および、移動経路が同じ値であるエントリグループごとに、S744を繰り返す(S743)。
データ集計処理部133は、エントリグループの出発駅(出発駅301)、到着駅(到着駅302)、日付(日付303)、平休別(平日/休日フラグ304)、移動した時間帯(時間帯305)、および、移動経路(移動経路306)を、流動集計データ166に出力する。さらに、データ集計処理部133は、エントリグループにおける件数の合計を件数307に出力し、エントリグループにおける、移動所要時間の内訳、および性年代属性別の内訳を、所要時間内訳308、および性年代属性内訳309に出力する(S744)。
図16は、本実施例1のデータ集計処理(滞在ログ)による滞在集計データ167を生成する処理を示す説明図である。
図16に示す処理は、データ集計処理部133によって実行される。図16に示す処理は、図2に示す処理47に含まれる。
データ集計処理部133は、メモリ102上の集計用配列をクリアし(S460)、所定の期間(オペレータ7の任意の期間)分の滞在ログ159から一つのエントリを抽出し、抽出されたエントリについて以下の処理を繰り返す(S461)。
データ集計処理部133は、抽出されたエントリのカードID262、出場日時263、入場日時264、出場駅ID265、入場駅ID266、滞在タイプ267、および、滞在時間268を取得する(S462)。
S462の後、データ集計処理部133は、S433と同様に、取得された出場日時263と入場日時264とに基づいて滞在の時間帯、および平休別を決定し、出場駅ID265と入場駅ID266とに基づいて滞在駅を決定する(S463)。さらに、データ集計処理部133は、取得されたカードID262をキーとしてカードマスタ160を検索し、性別273および年齢274の性年代属性情報を取得する(S464)。
データ集計処理部133は、S462〜S464において取得された情報を集計用配列に格納する。そして、データ集計処理部133は、集計用配列に格納される滞在駅、日付(出場日時263および/または入場日時264の日付)、平休別、時間帯、滞在タイプ267、滞在時間268、および、性年代属性をキーに、集計用配列の「件数」の値を一つインクリメントする(S465)。
S461〜S465によって滞在ログ159のすべてのエントリが処理された場合、データ集計処理部133は、集計用配列の滞在駅、日付、平休別、および時間帯が同じであるエントリグループを抽出し、抽出されたエントリグループごとに以下の処理を繰り返す(S466)。
データ集計処理部133は、抽出されたエントリグループの滞在駅(滞在駅311)、日付(日付312)、平休別(平日/休日フラグ313)、および時間帯(時間帯314)を滞在集計データ167に出力する。そして、データ集計処理部133は、抽出されたエントリグループの「件数」を件数315に出力する。また、抽出されたエントリグループの滞在タイプの内訳(滞在タイプ内訳316)、滞在時間の内訳(滞在時間内訳317)、および、性年代属性の内訳(性年代属性内訳318)を滞在集計データ167に出力する(S467)。
図17は、本実施例1のデータ集計処理(拠点情報)による拠点集計データ168を生成する処理を示す説明図である。
図17に示す処理は、データ集計処理部133によって実行される。図17に示す処理は、図2に示す処理47に含まれる。
データ集計処理部133は、メモリ102上の集計用配列をクリアする(S425)。そして、データ集計処理部133は、所定の期間(オペレータ7が指定した任意の期間)分の拠点抽出結果161から一つのエントリを抽出し、抽出されるエントリにS427〜S429の処理を行い、拠点抽出結果161のすべてのエントリに処理を繰り返す(S426)。
データ集計処理部133は、抽出されたエントリから、年月281、カードID282、居住駅283、および勤務駅284を取得する(S427)。S427の後、データ集計処理部133は、取得されたカードID282をキーにカードマスタ160を検索し、性別273および年齢274の性年代属性情報と、定期券有無275とを取得する。また、取得された定期券有無275が「あり」である場合、データ集計処理部133は、通勤通学種別277を取得する(S428)。
S428の後、データ集計処理部133は、S427およびS428において取得された情報を集計用配列に格納し、年月、居住駅、勤務駅、性年代属性、定期券有無、通勤通学種別をキーとして、「件数」の値を一つインクリメントする(S429)。
拠点抽出結果161のすべてのエントリに、S427〜S429の処理を実行した後、集計用配列の年月、居住駅、勤務駅、および性年代属性が同じエントリグループを抽出し、抽出されたエントリグループごとに、S499を繰り返す(S498)。
データ集計処理部133は、抽出されたエントリグループの居住駅(居住駅321)、勤務駅(勤務駅322)、年月(年月323)、および性年代属性(性年代属性324)を拠点集計データ168に出力する。そして、抽出されたエントリグループにおけるエントリの数(件数325)、定期券を有する数と有しない数との内訳および通勤の数と通学の数との内訳(定期券有無・通勤通学内訳326)を、拠点集計データ168に出力する(S499)。
図15から図17で説明したデータ集計処理において、データ集計処理部133は、プライバシーの観点から、集計用配列の「件数」が極端に少ない場合(所定の閾値より低い場合)、集計用配列のデータを出力せずに削除したり、いくつかのデータをまとめて出力する処理を追加したりしてもよい。このような処理を追加することによって、極めて稀な行動をする人の特定を防止することができる。
なお、図15〜図17に示す処理の後、または、あらかじめ定められた周期において、データ集計処理部133またはメンテナンス部138は、集計情報146のデータのうち、集計情報146の所定のメンテナンス期間を過ぎた時刻情報(日付303、および日付312等)を有するエントリを削除する。集計情報146のメンテナンス期間とは、オペレータ7によって定められる期間である。集計情報146にはカードIDが含まれず、プライバシーを厳しく保護する必要がないため、オペレータ7は、集計情報146のメンテナンス期間を長期に定めてもよい。
図18は、本実施例1のID再変換処理を示す説明図である。
図18に示す処理は、ID再変換処理部135によって実行される。図18に示す処理は、図2に示す処理47に含まれる。
ID再変換処理部135は、ログ生成期間およびIDの同一性保持期間のパラメータを取得する(S470)。本実施例における同一性保持期間とは、例えば、1か月単位、1週間単位、または、1日等の任意の期間であり、同一性保持期間の間、一つのカードIDが一つの電子乗車券4の履歴を示す(=同一性)ことが保証される。すなわち、同一性保持期間の間、一つのカードIDは、電子乗車券4を一意に示す識別子として有効である。
例えば、同一性保持期間に1週間が指定された場合、1週間分のデータを用いた処理において、一つのカードIDは一つの電子乗車券4を示すが、しかし、2週間分のデータを用いた処理において、複数のカードIDが一つの電子乗車券4を示す可能性がある。このため、データが1週間を超えた場合、オペレータ7は、複数のカードIDを取得しなければ一つの電子乗車券4に関するデータを取得できず、複数のカードIDの関連性を取得できなければ一つの電子乗車券4に関するデータを取得することができない。
オペレータ7が同一性保持期間に長い期間を指定した場合、一つのカードIDによって一つの電子乗車券4を有する利用者5の行動を取得することが可能になる。このため、オペレータ7は、長い同一性保持期間を指定すれば、駅の利用状況などを分析する処理の精度を上げることができる。しかし、この場合、個人を特定可能となるリスクが高まる。
オペレータ7が同一性保持期間に短い期間を指定した場合、個人を特定可能となるリスクは低くなるが、利用者5の行動を分析できる期間が短くなるため、分析の精度に問題が出たり、結果の応用範囲に制限が出る可能性がある。
同一性保持期間を指定するためのパラメータは、S470において、定数としてあらかじめメモリ102に格納されていてもよいし、オペレータ7によって都度入力されてもよい。また、同一性保持期間を指定するためのパラメータは、後述する同一性保持期間を算出する処理によって算出されてもよい。
オペレータ7は、制御用端末17を介して同一性保持期間およびログ生成期間をデータ処理基盤10に入力する。オペレータ7が同一性保持期間を指定することにより、オペレータ7は、随時同一性保持期間を変更できる。
S470の後、ID再変換処理部135は、カードIDを変換する。ID再変換処理部135によるID変換処理は、同一性を保持しつつ逆変換できないような変換を行う処理である。本実施例において、IDの変換には、各種の暗号学的ハッシュ関数を用いた匿名ID生成方法等を適用する。
S470の後、ID再変換処理部135は、暗号化ハッシュ関数の鍵を設定し(S471)、指定されたログ生成期間分の移動ログ158および滞在ログ159を用いて、S473〜S477の処理を繰り返す(S472)。
ID再変換処理部135は、移動ログ158の一つのエントリのカードID252をハッシュ関数により変換した後のIDを取得し、移動ログ158の当該エントリのカードID252を書き換える。これによって、ID再変換処理部135は、カードID変換後の移動ログ163の一つのエントリを取得する(S473)。
また、ID再変換処理部135は、滞在ログ159の一つのエントリのカードID262をハッシュ関数により変換した後のIDを取得し、滞在ログ159の当該エントリのカードIDを書き換える。これによって、ID再変換処理部135は、カードID変換後の滞在ログ164の一つのエントリを取得する(S474)。
ID再変換処理部135は、S473およびS474を、各ログの時系列に繰り返し行う。ID再変換処理部135が、同一性保持期間分の移動ログ158および滞在ログ159のカードIDを変換した場合(S475)、カードID272とカードID282とが対応するカードマスタ160と拠点抽出結果161とをマージし、同一性保持期間分のカードマスタ165を生成する(S476)。
カードマスタ165のカードID332、性別333、年齢274、定期券有無337、定期区間338、および、通勤通学種別339は、カードマスタ160のカードID272、性別273、年齢274、定期券有無275、定期区間276、および、通勤通学種別277に対応する。また、カードマスタ165のカードID332、居住駅335、および勤務駅336は、拠点抽出結果161のカードID282、居住駅283、および勤務駅284に対応する。
ID再変換処理部135は、S476において、カードマスタ165のカードID332の値を、ハッシュ関数により変換する。
S476の後、ID再変換処理部135は、新たに暗号化ハッシュ関数の鍵を設定し(S477)、S473に戻る。ログ生成期間分の全ての移動ログ158および滞在ログ159を変換し終わった場合、ID再変換処理部135は、暗号用ハッシュ関数の鍵を削除する(S478)。
S478の後、ID再変換処理部135は、第二次ログ145および集計情報146のもとになった第一次ログ143および拠点情報144を、情報格納部12から削除する(S479)。また、S479において、ID再変換処理部135は、メンテナンス部138に指示し、第一次ログ143および拠点情報144を、情報格納部12から削除させてもよい。
これによって、ID再変換処理部135による変換前のカードIDを含む第一次ログ143および拠点情報144は削除され、利用者5の行動を取得できる情報が、データ処理基盤10から削除される。そして、利用者5のプライバシーを秘匿することが可能になる。
なお、図18に示す処理の後、または、あらかじめ定められた周期において、ID再変換処理部135またはメンテナンス部138は、第二次ログ145のデータのうち、第二次ログ145の所定のメンテナンス期間を過ぎた時刻情報(出発日時253、および出場日時263等)を有するエントリを削除する。第二次ログ145のメンテナンス期間とは、オペレータ7によって定まる期間であるが、プライバシー保護のため、中期的な期間であることが望ましい。特に、集計情報146のメンテナンス期間よりも短い期間であることが望ましい。
図18に示す処理によれば、ID再変換処理部135が、カードIDから利用者5を特定することができない第二次ログ145を生成することができる。そして、第二次ログ145を用いて分析することによって、利用者5のプライバシーを保護しつつ、データを最大限に有効に活用することができる。
図18に示す処理において、同一性保持期間はパラメータとして与えられた。前述したように、同一性保持期間が長くなれば長くなるほど、少数のカードIDによって一人の利用者5の行動が把握でき、すなわち、類似の行動を取った人の数が減る。このため、同一性保持期間が長くなれば長くなるほど、個人の行動を特定されるリスクが高まることが知られている。従って、ID再変換処理部135は、ある期間において類似した行動をとる人が一定数を超えるように同一性保持期間を算出し、算出された同一性保持期間を用いて図18に示す処理を実行してもよい。
図19は、本実施例1の同一性保持期間を算出する処理に関する説明図である。
図19Aは、本実施例1の同一性保持期間の算出処理を示す説明図である。
ID再変換処理部135は、図18に示すS470において、図19Aに示す処理を実行してもよい。ID再変換処理部135は、集計対象期間と、類似する行動をとる人の人数の制限値とを取得する(S754)。ID再変換処理部135は、集計対象期間と人数の制限値とを、オペレータ7によって指定されてもよいし、あらかじめメモリ102に格納されるパラメータから取得してもよい。以下の例では、集計対象期間として1か月が指定され、人数の制限値として5人が指定された場合を示す。
S754の後、ID再変換処理部135は、集計対象期間分の滞在ログ159から一つのエントリを抽出し、抽出されたエントリにS756およびS757の処理を繰り返す(S755)。ID再変換処理部135は、抽出されたエントリから、カードID262を取得し、出場駅IDおよび/または入場駅IDに基づいて滞在駅を決定する。また、ID再変換処理部135は、出場日時263および/または入場日時264に基づいて日付を決定する(S756)。
S756の後、取得されたカードID262、決定された日付、および決定された滞在駅をメモリ102に格納する(S757)。ここで、ID再変換処理部135は、あらかじめ決められた定義により、滞在駅を市区郡等のエリアに変換するなどの処理を実行してもよい。
S756およびS757の処理を滞在ログ159のすべてのエントリに実行した後、ID再変換処理部135は、メモリ102に格納された内容について、カードID(カードID262に対応)ごとにS759を繰り返す(S758)。
S758の後、ID再変換処理部135は、あらかじめ定められた日数(例えば、1日〜1か月までのそれぞれの日数)ごとに、カードIDが示す電子乗車券4の滞在駅の組み合わせを特定する。
例えば、ID再変換処理部135は、カードIDが「001」の電子乗車券4が1月1日にA駅に滞在した場合、日数が1日である滞在駅の組合せとして、「A駅」を特定する。また、ID再変換処理部135は、カードIDが「001」の電子乗車券4が1月1日〜1月3日の3日間にA駅、B駅およびC駅に滞在した場合、日数が3日である滞在駅の組合せとして「A駅・B駅・C駅」を特定する。そして、ID再変換処理部135は、特定された滞在駅の組合せを、カードIDごと、および、日数ごとにメモリ102に格納する(S759)。
S759の処理を、メモリ102に格納されるカードID、日付および滞在駅のすべての組合せに実行した場合、ID再変換処理部135は、メモリ102に格納される日数および滞在駅の組合せごとに、カードIDの数を算出する。ID再変換処理部135は、カードIDの数を算出することによって、電子乗車券4の数、すなわち、利用者5の数を算出する。そして、ID再変換処理部135は、算出された結果を集計用一時メモリ750に格納する(S760)。
図19Bは、本実施例1の同一性保持期間を算出するための集計用一時メモリ750を示す説明図である。
集計用一時メモリ750は、日数751、滞在駅組合せ752、および、人数753を含む。日数751は、1日〜1か月までのそれぞれの日数を示し、滞在駅組合せ752は、日数751が示す日数において滞在した滞在駅の組合せを示す。人数753は、日数751が示す日数に滞在駅組合せ752が示す滞在駅に滞在した電子乗車券4の数(すなわち、利用者5の数)を示す。
S760の後、ID再変換処理部135は、人数753がS754において取得された人数の制限値(前述の例において5人)以上であり、かつ、最小値であるエントリを、集計用一時メモリ750から選択する。そして、ID再変換処理部135は、選択されたエントリの日数751を取得する(S761)。取得された日数751が、同一性保持期間のパラメータであり、S470において取得されるパラメータである。
なお、図19Aおよび図19Bにおいて用いられる方法は、行動パターンの類似性を判定するために滞在駅を用いる方法であるが、滞在駅以外の項目を用いて類似性を判定してもよい。
ID再変換処理部135が同一性保持期間を算出することによって、最新の第一次ログ143等に基づいて同一性保持期間を定めることができるため、自動的に最適な同一性保持期間を定めることができる。
図20は、本実施例1の駅レポート500を生成する処理を示す説明図である。
図20に示す処理は、レポート生成処理部136によって実行される。図20に示す処理は、図2に示す処理48に含まれる。
レポート生成処理部136は、駅レポートを生成するために分析するデータとして、集計情報146のみを利用する。以下に示す例において、レポート生成処理部136は、駅に関するレポートを定期的に(例えば、毎月)に生成する。
駅レポートは、利用者5全体の移動の傾向を把握するためのレポートである。このため、レポート生成処理部136は、駅レポートを生成するため、カードIDを用いてデータを関連づける必要がない。このため、レポート生成処理部136は、集計情報146を用いて駅レポートを生成する。
レポート生成処理部136は、レポートを生成する駅および期間として指定されたパラメータを取得する(S480)。レポート生成処理部136は、メモリ102にあらかじめ設定されるパラメータから駅および期間を取得してもよいし、オペレータ7によって入力されたパラメータ(入出力処理部134を介して受け付けられたパラメータ)から駅および期間を取得してもよい。
S480の後、レポート生成処理部136は、指定された期間の流動集計データ166にS482およびS483の処理を実行する(S481)。レポート生成処理部136は、流動集計データ166の出発駅301または到着駅302が指定された駅である流動集計データ166のエントリを抽出する。そして、レポート生成処理部136は、抽出されたエントリのうち、日付303、平日/休日フラグ304、および、時間帯305が同じであるエントリの数を算出する(S482)。
また、レポート生成処理部136は、流動集計データ166から抽出されたエントリのうち、時間帯305、到着駅302、および、出発駅301が同じであるエントリの数を算出する(S483)。レポート生成処理部136は、S482およびS483において算出された数のほか、性年代属性内訳309が同じであるエントリ、所要時間内訳308が同じであるエントリ、または、移動経路306が同じであるエントリの数を算出してもよい。移動経路306が同じであるエントリの数を算出することによって、乗換駅によるデータの集計が可能である。
S482およびS483の処理を流動集計データ166に実行した後、レポート生成処理部136は、生成S480において指定された期間の滞在集計データ167に、S485およびS486の処理を実行する(S484)。
レポート生成処理部136は、滞在集計データ167の滞在駅311が指定された駅であるエントリを抽出する。そして、抽出されたエントリのうち、日付312、平日/休日フラグ313、滞在タイプ内訳316、および、滞在時間内訳317が同じであるエントリの数を算出する(S485)。また、レポート生成処理部136は、滞在集計データ167の滞在駅311が指定された駅であるエントリのうち、性年代属性内訳318が同じであるエントリの数を算出する(S486)。
S485およびS486の処理を滞在集計データ167に実行した後、レポート生成処理部136は、S480において指定された期間分の拠点集計データ168から、居住駅321または勤務駅322が指定された駅であるエントリを抽出する。そして、抽出されたエントリのうち、性年代属性324、定期券有無・通勤通学内訳326、勤務駅322、および、居住駅321が同じであるエントリの数を算出する(S487)。
S487の後、レポート生成処理部136は、前述の処理により算出された情報を用いて、居住比率、休日に対する平日の比率、および、女性比率等のパラメータを算出する。そして、レポート生成処理部136は、算出されたパラメータと、S480において指定された駅以外の駅に関して算出されたパラメータ等との比較に基づき、指定された駅のタイプを決定する(S488)。
S488の後、レポート生成処理部136は、整形された処理結果を、駅レポート500として出力する(S489)。なお、S489におけるレポート生成処理部136は、制御用端末17に駅レポート500を出力してもよいし、図示しないネットワークインタフェースを介してクライアント3に駅レポート500を出力してもよい。
駅レポート500は、データ処理システム1の分析結果に含まれ、S489において駅レポート500をクライアント3に提供する処理は、図2に示す処理49に含まれる。
図21は、本実施例1の駅レポート500を示す説明図である。
駅レポート500は、指定された駅501と期間502とによって得られた駅レポートであり、図20に示す処理によって、流動集計データ166、滞在集計データ167および拠点集計データ168に基づいて生成される。
駅レポート500には、領域503、および、領域510〜領域521が含まれる。領域503は、居住比率504、休/平比率505、女性比率506、高齢度507、定期券通学率508、および、日々変動率509等のパラメータによって、指定された駅の駅タイプをチャート状に表示するための領域である。領域510は、指定された駅における時間帯ごとの平日発着数を示す。領域511は、指定された駅における時間帯ごとの休日発着数を示す。
領域512は、滞在タイプの内訳を示す。領域513は、滞在時間の内訳を示す。領域514は、指定された駅から午前に移動を開始した場合の出発駅および到着駅を示し、領域515は、指定された駅から午後に移動を開始した場合の出発駅および到着駅を示す。
領域516は、指定された駅が居住駅である利用者5の勤務駅を示し、領域517は、指定された駅が勤務駅である利用者5の居住駅を示す。領域518は、指定された駅において、1日の最初の滞在または最後の滞在を行う利用者5の性年代属性を示す。領域519は、指定された駅において、訪問と定義される滞在をした利用者5の性年代属性を示す。
領域520は、指定された駅が居住駅である利用者5の性年代属性を示す。領域521は、指定された駅が勤務駅である利用者5の性年代属性を示す。これらの領域に表示される項目が算出される、図20における処理を以下に示す。
・領域510および領域511:S482における集計結果
・領域512:S485における集計結果
・領域513:S485における集計結果
・領域514、および領域515:S483における集計結果
・領域516:S487における集計結果
・領域517:S487における集計結果
・領域518:S486における集計結果
・領域519:S486における集計結果
・領域520:S487における集計結果
・領域521:S487における集計結果
・領域503:上記の組合せ
レポート生成処理部136は、図21に示す駅レポート500を定期的に生成するために、集計情報146のみを用いる。集計情報146にはカードIDが含まれないため、レポート生成処理部136は、電子乗車券4に対応する情報を含まない情報から駅レポート500を生成できる。このため、レポート生成処理部136は、利用者5のプライバシーが漏えいするリスクを考慮することなく、駅レポート500を生成することができる。
図22は、本実施例1の個別分析処理を示す説明図である。
図22に示す個別分析処理は、個別分析処理部137によって実行される。図22に示す処理は、図2に示す処理48に含まれる。
個別分析処理において、個別分析処理部137は、個別分析レポート530を生成するため、集計情報146と第二次ログ145とを用いる。個別分析レポート530は、鉄道を乗り継いでどこからどこへ向かったのかを示す情報等を含み、個別分析レポート530を生成するためには、短期間の間カードIDによるデータの関連付けが必要である。このため、個別分析レポート530を生成するためには、同一性保持期間の間有効なカードIDを含む第二次ログ145を用いればよく、第一次ログ143を用いる必要がない。
図22に示す個別分析処理は、例として、改札を通過したことを示す履歴に基づいて、指定されたイベントに参加したと推定される利用者5を抽出し、抽出された利用者5の行動の傾向を分析する処理である。図22に示す個別分析処理は、例であり、イベントへの参加者を抽出する処理以外にもさまざまな処理が考えられる。
個別分析処理部137は、イベント情報として、指定されたイベントの開催日時(日付、開始時刻、および、終了時刻)および開催場所(最寄駅)等の情報を取得する(S490)。オペレータ7が制御用端末17を介してデータ処理基盤10にイベント情報を指定してもよいし、個別分析処理部137が、マスタ154にあらかじめ格納されたイベントマスタおよびランドマークマスタからイベント情報を取得してもよい。
S490の後、個別分析処理部137は、取得されたイベントの日付の滞在ログ164を参照し、イベントの開始時刻および終了時刻の前後の滞在時間268が所定時間以上である滞在ログ164のエントリを抽出する(S491)。S491における抽出処理において、より精度の高い結果を得るために、個別分析処理部137は、例えば、従来技術(例えば、特開2010−244433号公報参照)において用いられる所定の時刻における滞在を抽出する方法等を利用してもよい。
S491の後、個別分析処理部137は、指定されたイベントの日付の移動ログ163を参照し、S491において抽出された滞在ログ164のエントリと関連する移動(出場日時263の前における移動、および入場日時264の後における移動)を示す移動ログ163のエントリを抽出する。そして、個別分析処理部137は、抽出された移動ログ163のエントリから、移動の発着駅および時間帯等を集計する(S492)。
S492の後、個別分析処理部137は、S491において抽出された滞在ログ164のエントリのカードIDから、カードマスタ165のエントリを抽出し、イベントに参加したと思われる利用者5の性年代属性(性別333および年齢334)および拠点情報(居住駅335および勤務駅336)を集計する(S493)。
S493の後、個別分析処理部137は、S491において抽出された滞在ログ164のエントリのカードIDに対応する移動ログ163、滞在ログ164およびカードマスタ165に基づいて、当月(同一性保持期間が1か月である場合。同一性保持期間が1か月より短い場合、同一性保持期間と同じ期間)の立ち寄り先(出場駅および入場駅等)および移動経路等を集計する(S494)。
集計結果が得られた後、個別分析処理部137は、個別分析レポート530として結果を整形し、個別分析レポート530を出力する(S495)。個別分析処理部137は、個別分析レポート530を、入出力処理部134を介して制御用端末17に出力してもよいし、図示しないネットワークインタフェースを介してクライアント3に提供してもよい。
個別分析レポート530は、データ処理システム1の分析結果に含まれる。また、S485においてクライアント3に個別分析レポート530を提供する処理は、処理49に含まれる。
図23は、本実施例1の個別分析処理の結果の個別分析レポート530を示す説明図である。
図23は、個別分析レポート530を紙に出力した場合のイメージを示すが、電子的なレポートまたはスライドショー等の方法によって出力されてもよい。
個別分析レポート530は、領域531〜領域541を含む。領域531は、指定されたイベントの概要を示す。領域531に示される情報は、S490において取得された情報に相当する。
領域532は、S491において抽出された結果の概要を示す。領域532には、電子乗車券4の履歴(滞在ログ164)を用いて抽出されたイベントへの参加人数、イベントが複数日にまたがる場合は参加回数等の情報が表示される。ここで、個別分析レポート530を生成時のカードIDの同一性保持期間が、例えば、1日間のように短い場合、個別分析処理部137は、複数日にまたがる同一利用者5に対応するエントリ(すなわち、行動)を取得できないため、1日間におけるイベントの結果しか出力できない。
領域533は、S493において抽出された性年代属性を示す。領域533には、イベントが開催される日付ごとの参加者の性年代属性が表示され、クライアント3がイベントの開催日ごとに性年代属性を比較できる。これにより、イベントに参加した利用者5の年代および性別を把握できるため、次回のイベント企画またはプロモーション等に役立てることができる。
領域534および領域535は、S492において抽出された発着駅を示す。領域534には、イベントの開催場所に向かうために利用者5が用いた出発駅を示す。領域535は、イベント終了後の移動によって利用者5が到着した到着駅を示す。
領域536および領域537は、S493において抽出された拠点情報を示す。領域538および領域539は、S494において抽出された立ち寄り駅を示す。
領域540および領域541は、S494において抽出された移動経路を示す。領域540は、イベントに参加した利用者5が当日乗車した路線を示し、領域541は、イベントに参加した利用者5が当月乗車した路線を示す。駅および路線等に関する情報は、イベント会場の設定および車内広告等のプロモーションに役立てられる。
図5から図23の処理とデータとの関係を、図24および図25に示す。
図24は、本実施例1の処理とデータとの関係を示す説明図である。
図24のエントリ770に示す元データ変換処理は、データ保持システム2の制御部21によって実行される処理であり、改札機27から収集された電子乗車券4の履歴をデータ処理システム1に提供するデータ形式(すなわち、受信データ142のデータ形式)に変換する処理である。
具体的には、制御部21は、データ保持システム2が保持する利用者5個人を識別可能な情報を、収集された履歴から削除する。ここで、個人を識別可能な情報とは、例えば、利用者5の氏名、住所および電話番号等である。そして、制御部21は、データ保持システム2が保持するカードIDとは異なるIDに、履歴に含まれるカードIDを、同一性を保持しつつ、かつ、逆変換できないように変換する処理である(暗号学的ハッシュ関数等を適用してもよい)。
エントリ771〜エントリ776は、データ処理システム1によって実行される処理を示す。
エントリ771は、初期変換処理部131がデータ保持システム2から受信した受信データ142を第一次ログ143に変換する処理を示す(図11および図12に示す)。エントリ772は、拠点抽出処理部132が第一次ログ143を拠点情報144に変換する処理を示す(図14に示す)。
エントリ773は、データ集計処理部133が第一次ログ143と拠点情報144とを用いて集計情報146を生成する処理を示す(図15、図16および図17に示す)。エントリ774は、ID再変換処理部135が拠点情報144を用いて第一次ログ143を第二次ログ145に変換する処理を示す(図18に示す)。
エントリ775は、レポート生成処理部136が集計情報146に基づいて定期的に駅レポート500を生成する処理を示す(図20に示す)。エントリ776は、個別分析処理部137が集計情報146と第二次ログ145とを用いて個別の分析を実施し、個別分析レポート530を生成する処理を示す(図22に示す)。
図25は、本実施例1の複数の処理の各々とデータとの関係を示す説明図である。
エントリ780に示す元データは、データ保持システム2の情報格納部22に保持され、電子乗車券4の履歴を含む。電子乗車券4の履歴には、電子乗車券4を直接示すカードIDが含まれる。
エントリ781〜エントリ785は、データ処理システム1の情報格納部12に保持されるデータを示す。
エントリ781は、受信データ142を示し、データ保持システム2によって個人を識別可能な情報を削除されたデータを示す。受信データ142は、初期変換処理部131による処理が終了後削除される。受信データ142は、データ保持システム2による変換後のカードID(変換後IDa)を含む。
エントリ782は、第一次ログ143を示す。第一次ログ143は、拠点抽出処理部132、データ集計処理部133およびID再変換処理部135による処理が終了した後、削除される。第一次ログ143は、データ保持システム2による変換後のカードID(変換後IDa)を含む。
エントリ783は、拠点情報144を示す。拠点情報144は、データ集計処理部133およびID再変換処理部135による処理が終了した後削除される。拠点情報144は、データ保持システム2による変換後のカードID(変換後IDa)を含む。
エントリ784は、第二次ログ145を示す。第二次ログ145は、主に個別分析レポート530の生成に利用される。このため、第二次ログ145は、オペレータ7によって指定された期間保持され、集計情報146より短い期間(例えば、1か月等)保持される。第二次ログ145は、ID再変換処理部135による変換後のカードID(変換後IDb)を含む。
変換後IDbは、変換後IDaより同一性保持期間が短いため、長期間の第二次ログ145から、特定の利用者5の長期間の行動を取得することはできない。
エントリ785は、集計情報146を示す。集計情報146は、主に定例的な駅レポート500の生成に利用される。このため、集計情報146は、第二次ログ145より長期間(例えば数年間)保持される。集計情報146は集計済みの情報のみを含むため、カードIDを含まない。そのため、データ処理システム1は、プライバシーに関する懸念なしに保持し続けることができる。
次に、制御用端末17に表示される画面の例を示す。
図26は、本実施例1のデータ処理基盤10にカードIDを変換させるために制御用端末17に表示される画面550を示す説明図である。
図26に示す画面550は、図18に示すS470においてID再変換処理部135がログ生成期間および同一性保持期間を取得する際に、制御用端末17に表示される画面の例である。制御用端末17の表示装置117は、オペレータ7からの指示により画面550を表示する。
オペレータ7は、画面550を用いて、ログ生成期間とカードIDの同一性保持期間とを設定する。また、オペレータ7が画面550の実行ボタン549を押した場合、ID再変換処理部135は、ログ生成期間および同一性保持期間を取得し、S470以降の処理を実行する。
画面550は、領域552、領域558および実行ボタン549を含む。領域552は、ログ生成期間を設定するための領域である。領域552は、領域553〜領域557を含む。
オペレータ7は、ログ生成期間を月によって指定する場合、領域553のチェックボックスを選択し、ログ生成期間を期間によって指定する場合、領域555のチェックボックスを選択する。また、オペレータ7は、領域553を選択した場合、ログ生成期間として年と月とを領域554に入力する。また、オペレータ7は、領域555を選択した場合、ログ生成期間の開始日を領域556に入力し、ログ生成期間の終了日を領域557に入力する。
領域558は、カードIDの同一性保持期間を設定するための領域である。領域558は、領域559、領域547および領域548を含む。
オペレータ7は、カードIDの同一性保持期間を、ログ生成期間と同じ期間にする場合、領域559のチェックボックスを選択する。また、オペレータ7は、カードIDの同一性保持期間を指定する場合、領域547のチェックボックスを選択し、同一性保持期間を領域548に入力する。
図27は、本実施例1のデータ処理基盤10に駅レポート500を生成させるために制御用端末17に表示される画面560を示す説明図である。
図27に示す画面560は、図20に示すS480においてレポート生成処理部136が駅と期間とを取得する際に、制御用端末17に表示される画面の例である。制御用端末17の表示装置117は、オペレータ7からの指示により画面560を表示する。
オペレータ7は、画面560を用いて、駅レポート500を生成するための駅および期間を指定する。また、オペレータ7が画面560の実行ボタン572を押した場合、レポート生成処理部136は、駅および期間を取得し、S480以降の処理を実行する。
画面560は、領域562および領域566を含む。領域562は、駅を指定するための領域である。領域562は、領域563〜領域565を含む。
オペレータ7は、指定する駅の路線を領域563に入力し、指定する駅の駅名を領域564に入力する。また、制御用端末17が、オペレータ7によって過去に指定された駅の路線と駅名とを、例えば外部記憶装置115に保持し、オペレータ7が領域565を操作した場合、表示装置117は、過去に指定された駅の路線と駅名とを領域563および領域564に表示してもよい。
また、領域563および領域564は、路線の複数の候補および駅の複数の候補を表示してもよく、オペレータ7は、複数の候補から路線および駅を指定してもよい。
領域566は、期間を指定するための領域である。領域566は、領域567〜領域571を含む。
オペレータ7は、駅レポート500を生成するための期間を月によって指定する場合、領域567のチェックボックスを選択し、駅レポート500を生成するための期間を期間によって指定する場合、領域569のチェックボックスを選択する。オペレータ7は、領域567を選択した場合、領域568に年と月とを入力する。また、オペレータ7は、領域569を選択した場合、期間の開始月を領域570に入力し、期間の終了月を領域571に入力する。
実施例1によれば、駅および電子乗車券4等の使用状況を分析するために用いる情報(集計情報146および第二次ログ145)を生成後、カードIDに基づいて利用者5を特定できる情報(受信データ142、第一次ログ143および拠点情報144)を削除する。また、第二次ログ145には、所定の同一性保持期間のみ有効である識別子(カードID)が含まれるため、分析結果(駅レポート500、および個別分析レポート530等)から、利用者5個人の行動を特定することができない。このため、実施例1のデータ処理基盤10は、実施例1の処理後、利用者5のプライバシーを秘匿する情報のみを保持し、プライバシーの漏えいを未然に防止することができる。
また、第二次ログ145は、同一性保持期間のみに有効であるカードIDを含む。このため、実施例1のデータ処理基盤10は、第二次ログ145から、長期間における利用者5個人の行動を特定することはできない。しかし、第二次ログ145から、プライバシーを侵害しない程度に短期間の利用者5の行動を取得することはできるため、実施例1のデータ処理基盤10は、データを有効に活用することができる。
また、データ処理基盤10は、集計情報146と第二次ログ145とを保持するため、個別分析レポート530を生成しなおしたい場合も、第一次ログ143を参照することなく個別分析レポート530を生成することができる。このため、第一次ログ143を保持することなく、速やかに個別分析レポート530を生成することができ、プライバシーを十分に保護することができる。
そして、集計情報146と第二次ログ145とを生成することにより、集計情報146から全体的な流動情報を取得可能であり、第二次ログ145と集計情報146とから利用者5個人の行動傾向とを適切に取得可能であるため、データを最大限に活用できる。
本発明によって実現されるデータ管理システムの実施例2を、図28から図32により説明する。なお、実施例2における構成および機能の一部は、実施例1と重複しているため、実施例1と同じ構成および機能には同じ符号をつけ、説明を簡略化する。
図28は、本実施例2のデータ管理システムの全体の構成を示す説明図である。
実施例2のデータ管理システムは、情報提供サービスを行う。実施例2のシステムは、実施例1と同じく、データ処理システム1、およびデータ保持システム2を含む。また、実施例2のシステムは、実施例1のクライアント3に相当するクライアントシステム300を有する。
実施例2のデータ処理システム1は、実施例1のデータ処理システム1と同じく、データ処理基盤10、内部ネットワーク16、および、少なくとも一つの制御用端末17を有する。実施例1のデータ処理システム1と実施例2のデータ処理システム1との相違点は、実施例2のデータ処理システム1がデータ提供基盤13を有する点である。
データ処理基盤10とデータ提供基盤13とは、それぞれ異なるサーバに実装されてもよいし、一つのサーバに機能を分けて実装されてもよい。図28に示すデータ処理基盤10とデータ提供基盤13とは、異なるサーバに実装される。
データ提供基盤13は、制御部14および情報格納部15を有する。データ処理基盤10とデータ提供基盤13とは、内部ネットワーク16によって接続される。
実施例2のデータ保持システム2は、実施例1のデータ保持システム2と同じく、データ収集基盤20と、少なくとも一つの改札機27と、精算端末28と、内部ネットワーク26と、を有する。実施例2のデータ保持システム2と実施例1のデータ保持システム2との相違点は、実施例2のデータ保持システム2がアプローチ基盤23を有する点である。
データ収集基盤20とアプローチ基盤23とは、それぞれ異なるサーバに実装されてもよいし、一つのサーバに機能を分けて実装されてもよい。図28に示すデータ収集基盤20とアプローチ基盤23とは、異なるサーバに実装される。
アプローチ基盤23は、データ収集基盤20とは別に運用される。アプローチ基盤23は、あらかじめアプローチ基盤23に登録された会員6宛に、必要に応じてアプローチ(電子メールまたはダイレクトメール(DM)の送信等)を行う。
会員6は、データ保持システム2の管理者と、データ保持システム2からサービスを提供されるなどの契約を結んだ者である。会員6は、利用者5であってもよいし、利用者5でなくてもよい。
実施例2のクライアントシステム300は、実施例1のクライアント3と同じく、データ処理システム1からサービス(分析結果)を提供される。実施例2のクライアントシステム300と実施例1のクライアント3との相違点は、実施例1のクライアント3が分析結果(集計情報146に基づいて生成された駅レポート、集計情報146および第二次ログ145に基づいて生成された個別分析レポート)のみをサービスとして提供されるが、実施例2のクライアントシステム300が分析結果とデータとをサービスとして提供される点である。
実施例2のクライアントシステム300は、少なくとも一つの制御用端末30を有する。制御用端末30は、データ提供基盤13と外部ネットワーク18とを介して接続される。クライアントシステム300のオペレータ8は、制御用端末30を用いてデータ提供基盤13からデータを取得する(または、紙媒体のレポートを受信してもよい)。クライアントシステム300は、取得されたデータに基づき、クライアントシステム300のクライアント会員9にアプローチする。
クライアント会員9は、クライアントシステム300の管理者と、クライアントシステム300からサービスを提供されるなどの契約を結んだ者である。クライアント会員9は、利用者5であってもよいし、利用者5でなくてもよい。
図29は、本実施例2の複数のシステムによる主な処理を示す説明図である。
処理41〜処理50の処理は、図2に示す実施例1の処理41〜処理50と同じである。具体的には、データ処理システム1は、駅レポート500と個別分析レポート530とを、分析結果としてクライアントシステム300に提供する。
なお、実施例2のデータ処理システム1は、処理49において、クライアントシステム300からの要求に従い駅レポート500を生成し、クライアントシステム300に送信する。これにより、クライアントシステム300は、利用者5全体の行動を示すレポートを受信可能であり、このレポートからアプローチするクライアント会員9等の抽出条件を生成できる。
実施例2のデータ処理システム1は、実施例1のサービス提供システムと異なり、集計情報146の送信を要求された場合、集計情報146および共通データ141に含まれるデータをクライアントシステム300に提供する(処理51)。集計情報146等に含まれるデータが送信された場合、クライアントシステム300は、送信されたデータを収集し(処理52)、収集された集計情報146と、分析結果とに基づいて、利用者5の行動を分析する(処理53)。
クライアントシステム300は、処理53による分析結果に基づいて、アプローチするクライアント会員9または会員6を抽出するための抽出条件(例えば、性年代属性または拠点駅等の属性)を生成する。そして、クライアントシステム300は、生成された抽出条件を、データ処理システム1に送信し(処理54)、データ処理システム1は受信した抽出条件を、データ保持システム2に転送する(処理55)。
データ保持システム2が抽出条件を受信した場合(処理56)、アプローチ基盤23は、抽出条件に該当する会員6にアプローチする(処理57)。また、クライアントシステム300は、生成された抽出条件に該当するクライアント会員9に直接アプローチしてもよい(処理59)。
これによって、クライアントシステム300によって生成された抽出条件に従って、データ保持システム2がアプローチすることが可能である。例えば、クライアントシステム300とデータ保持システム2とが異なる事業者である場合、クライアントシステム300は、利用者5を示すカードIDを含む情報を取得することなく、データ保持システム2にアプローチする会員6の属性を提案することができる。
図30は、本実施例2のデータ処理システム1のハードウェア構成を示すブロック図である。
図30に示すデータ処理基盤10とデータ提供基盤13とは、同じサーバに実装されるが、機能が各々異なる複数のサーバによって実装されてもよい。
実施例2のデータ処理基盤10は、実施例1のデータ処理基盤10と同じハードウェアの構成である。ただし、実施例2のデータ処理基盤10は、内部ネットワーク16を介してデータ提供基盤13と接続される。
実施例2の制御用端末17は、実施例1の制御用端末17と同じハードウェアの構成である。ただし、実施例2の制御用端末17は、内部ネットワーク16を介してデータ提供基盤13と接続される。
データ提供基盤13の制御部14は、プロセッサ121、メモリ122およびネットワークI/F123を含む。データ提供基盤13の情報格納部15は、プログラム記憶装置124および外部記憶装置125を含む。
プロセッサ121と、メモリ122と、ネットワークI/F123と、プログラム記憶装置124と、少なくとも一つの外部記憶装置125とは、内部バスによって接続され、相互にデータの送受信が可能である。
プロセッサ121は、例えば、CPU(Central Processing Unit)であり、マイクロプロセッサを主体に構成される。プロセッサ121は、メモリ122およびプログラム記憶装置124に格納されるプログラムを実行することにより、コンピュータに各種の機能を実装させる。
メモリ122は、例えば、ランダムアクセスメモリ(RAM)、または、リードオンリーメモリ(ROM)等によって実装され、プロセッサ121によって実行されるプログラム、および、処理されるデータ等を格納する。ネットワークI/F123は、内部ネットワーク16に接続するためのインタフェースである。
プログラム記憶装置124は、例えば、フラッシュメモリ等の不揮発性メモリである。外部記憶装置125は、例えばハードディスクとドライブ、または、DVDとドライブとにより構成され、プロセッサ121によって実行されるプログラム、および、処理されるデータ等を格納する。
データ提供基盤13は、内部ネットワーク16を介してデータ処理基盤10および制御用端末17と接続され、外部ネットワーク18を介してクライアントシステム300の制御用端末30と接続される。
実施例1と実施例2との相違点のうち、前述に挙げたもの以外の相違点を以下に挙げる。一つ目の相違点は、実施例2のクライアントシステム300が、制御用端末30、および、外部ネットワーク18を介して、データ提供基盤13が保持するデータを取得できる点である。また、二つ目の相違点は、実施例2のデータ保持システム2が、会員6にアプローチできる点である。また、三つ目の相違点は、クライアントシステム300がクライアント会員9にアプローチできる点である。
実施例2におけるデータ処理システム1からクライアントシステム300に向けたデータ提供について以下に説明する。
図31は、本実施例2のデータ提供基盤13のソフトウェアの構成を示すブロック図である。
制御部14は、レポート生成処理部170、データ選択処理部171および入出力処理部172を、機能部として有する。図31に示す制御部14が有する機能部の各々は、ソフトウェアプログラムによって実装されるが、LSI等の集積回路によって実装されてもよい。
レポート生成処理部170は、分析レポートを生成する。データ選択処理部171は、クライアントシステム300から送信されたデータ取得要求に従い、クライアントシステム300に提供するデータを選択する。入出力処理部172は、データ処理基盤10、制御用端末17、および、クライアントシステム300の制御用端末30と通信するためのインタフェースである。
情報格納部15は、共通データ173および集計情報174を有する。共通データ173は、データ処理基盤10の共通データ141と同じく、駅マスタ151、路線マスタ152、経路マスタ153、および、その他各種マスタ154等を含む。
集計情報174は、データ処理基盤10において生成された集計情報146と同じデータを含む。具体的には、集計情報174は、流動集計データ166、滞在集計データ167および拠点集計データ168等を含む。
入出力処理部172は、データ処理基盤10の集計情報146が更新された場合、集計情報146から流動集計データ166、滞在集計データ167および拠点集計データ168を取得し、取得されたデータを集計情報174に格納する。入出力処理部172は、集計情報146が更新されたか否かを定期的に確認してもよいし、データ集計処理部133が図15〜図17に示す処理を終了した後、集計情報146の更新を入出力処理部172に通知してもよい。
実施例2のデータ提供基盤13は、データ処理基盤10に格納されるデータのうち、集計情報のみを保持する。これは、データ提供基盤13が、カードIDを含まない集計情報のみをクライアントシステム300に提供するためであり、このため、データ提供基盤13はカードIDを含む第一次ログ143等を保持しない。
データ提供基盤13は、データ処理基盤10によって生成された集計情報を保持し、クライアントシステム300の制御用端末30からの要求に従い、駅レポート500を生成したり、保持するデータを提供したりする。
レポート生成処理部170は、クライアントシステム300からの要求に従って、実施例1の図20に示す処理を、集計情報174を用いて実行する。そして、レポート生成処理部170は、図21に示すような駅レポート500を生成し、駅レポート500を分析結果としてクライアントシステム300に出力する(処理48および処理49に相当)。また、データ選択処理部171は、制御用端末30からの要求に従い、共通データ173および集計情報174から必要なデータを選択し、選択されたデータをクライアントシステム300に出力する(処理51に相当)。
次に、図32および図33を用いて、クライアントシステム300からデータ処理システム1にアクセスした制御用端末30に表示される画面例を示す。
図32は、本実施例2の制御用端末30に表示される画面例を示す説明図である。
図32に示す画面は、クライアントシステム300のオペレータ8に、データ提供サービスを提供するためのデータ提供サービスメニュー580を表示する。データ提供サービスメニュー580は、領域582〜領域586を含む。
データ提供サービスメニュー580には、図32におけるデータ処理システム1は、クライアントシステム300に「駅レポート生成サービス」、「データダウンロードサービス」および「データ可視化サービス」の3種類のサービスを提供する。このため、データ提供サービスメニュー580には、前述の3種類のサービスを選択するための領域582〜領域584が表示される。
領域582は、「駅レポート生成サービス」に対応し、領域583は、「データダウンロードサービス」に対応し、領域584は、「データ可視化サービス」に対応する。
データ提供サービスメニュー580は、制御用端末30が有するプログラムによって制御用端末30に表示されてもよいし、データ提供基盤13の入出力処理部134によってWeb経由で制御用端末30に表示されてもよい。
オペレータ8が領域582を選択した場合、制御用端末30の画面は、図27に示す実施例1の画面に遷移し、オペレータ8に駅および期間を指定させる。そして、オペレータ8が図27に示す画面を介して駅および期間が指定された場合、データ提供基盤13のレポート生成処理部170は、オペレータ8によって指定された駅および期間を用いて図20に示す処理を実行し、図21に示す駅レポート500を生成する。
オペレータ8が領域583を選択した場合、制御用端末30は、図示しない画面によって、オペレータ8に駅または項目を適宜指定させる。そして、オペレータ8によって指定された駅または項目に従って、データ選択処理部171は、共通データ173および集計情報174から、オペレータ8によって指定された駅または項目に関する情報を抽出し、抽出された情報をクライアントシステム300に出力する。
オペレータ8が領域584を選択した場合、制御用端末30は、図33に示す画面に遷移し、移動または滞在を可視化したイメージをオペレータ8に閲覧させる。
なお、図32に示す画面例において、オペレータ8が領域584を選択した場合、制御用端末30は、領域585〜領域586に、クライアントシステム300に関する企業コードおよびパスワードをオペレータ8に入力させる。これは、クライアントシステム300の管理者とデータ処理システム1の管理者との契約等に基づいて、データ処理システム1がクライアントシステム300を認証するためである。
図33は、本実施例2のデータ可視化サービスにおける制御用端末30の画面590の例を示す説明図である。
画面590は、領域592、領域593および領域595を含む。また、領域592は、領域595において指定された条件に従い、路線図上に利用者5による移動を時系列で表示することによって、移動の流れを表示する。領域593は、オペレータ8が領域592の表示を、再生、停止、早送り、および、巻き戻し等させるための領域である。
領域595は、領域596〜領域598を含む。領域596は、領域592に表示される移動の、日付または期間を指定するための領域である。領域597は、領域592に表示される移動の、出発駅、到着駅、および、その他の条件を指定するための領域である。領域598は、領域592の表示の色を編集するための領域である。
オペレータ8が領域595に条件を指定した場合、データ選択処理部171は、指定された条件に従って流動集計データ166を変換し、指定された日付または期間における移動の流れを領域592に表示する。オペレータ8は、領域593を操作することにより、任意の時間帯に戻って移動の流れを閲覧することができる。
オペレータ8は、領域595への指定を変更することによって、所望の移動の流れを閲覧可能である。領域597において指定される抽出条件には、表示される移動の出発駅、および、表示される移動の到着駅の他、移動した利用者5の性年代属性、または、移動の経路等が含まれる。
次に、クライアントシステム300が受信した分析結果およびデータに基づいて、データ保持システム2またはクライアントシステム300が会員6またはクライアント会員9にアプローチする手順を、以下に示す。
図34は、本実施例2のアプローチを設定するための制御用端末30に表示される画面600を示す説明図である。
画面600は、アプローチするクライアント会員9または会員6の属性を設定するための画面である。画面600は、領域602、領域606、領域609、および、領域610を含む。
クライアントシステム300のオペレータ8は、図21に示す駅レポート500、および、図23に示す個別分析レポート530の結果、ならびに、図32および図33に示すデータ提供サービスを利用したデータを分析した結果、電子メールまたはDM等によってアプローチするクライアント会員9または会員6の抽出条件を示す属性を決定する。決定する属性には、性年代属性、居住駅、および、勤務駅等が含まれる。
そして、オペレータ8は、図34に示す画面600を用いて、決定された抽出条件をデータ処理システム1に送信する(図30に示す処理54および処理55の処理に該当)。
画面600の領域602は、アプローチするクライアント会員9等の抽出条件を示す属性を指定するための領域であり、領域603〜領域605を含む。領域603および領域604は、アプローチするクライアント会員9等の性別および年代(性年代属性に対応)を指定するための領域であり、領域605は、居住地および勤務地(居住駅および勤務駅に対応)を指定するための領域である。
また、画面600の領域606は、アプローチの方法を指定するための領域である。図34に示す領域606は、DMを送信する方法(送信条件)を指定するための領域である。領域606は、領域607および領域608を含む。
領域607は、DMを送信する希望日を指定するための領域であり、領域608は、DMに記載される内容を指定するための領域である。
領域609および領域608は、契約時にクライアントシステム300に与えられた企業コードとパスワードとを入力するための領域である。領域611の実行ボタンをオペレータ8が操作した場合、制御用端末30は、領域602〜領域610に指定または入力された抽出条件および送信条件を、データ処理システム1に送信する(図30に示す処理56)。データ保持システム2は、データ処理システム1を介して抽出条件および送信条件を受信した場合、アプローチ基盤23によって、抽出条件に該当する会員6を抽出し、送信条件に従って抽出された会員6にアプローチする(図30に示す処理57)。
実施例2によれば、クライアントシステム300のオペレータ8による指示に従って、データ提供基盤13が駅レポート500を生成し、さらに、駅レポート500および集計情報174のデータをクライアントシステム300に送信するため、オペレータ8は、利用者5の行動を、オペレータ8の希望に沿って取得することができる。また、オペレータ8が取得を指示できるデータは、集計情報174および共通データ173のカードIDを含まない情報であるため、利用者5のプライバシーを適切に保護できる。
さらに、実施例2において、データ処理システム1において集計されるデータは、電子乗車券4の利用者5の行動に関するデータである。しかし、データ保持システム2がアプローチする会員6と、利用者5とは必ずしも一致しない(重複はあり得る)。このため、アプローチする会員6またはクライアント会員9の抽出条件を、データ提供基盤13による分析結果に基づいてオペレータ8が決定した場合、アプローチする会員6またはクライアント会員9を抽出する精度はやや落ちる。
しかし、電子乗車券4の利用者5の人数が十分大きい場合、オペレータ8は、データ提供基盤13による分析結果に基づいて、全体的な傾向を把握することが可能である。このため、データ提供基盤13による分析結果に基づいて抽出条件を決定することによって、利用者5のプライバシーを守りつつ、抽出条件に該当する会員6等に的確にアプローチすることができる。
本発明によって実現されるデータ管理システムの実施例2を、図35により説明する。なお、実施例3における構成および機能の一部は、実施例1および実施例2と重複するため、同じ構成および機能には同じ符号をつけ、説明を簡略化する。
図35は、本実施例3のデータ管理システムの全体の構成を示す説明図である。
実施例3のデータ管理システムは、データ保持システム兼サービス提供システム40、および、クライアントシステム300を含む。データ保持システム兼サービス提供システム40は、実施例2のデータ保持システム2およびデータ処理システム1の機能を有する。実施例3のクライアントシステム300は、実施例2のクライアントシステム300と同じである。
データ保持システム兼サービス提供システム40は、同一の事業者によって運用されてもよい。また、データ保持システム兼サービス提供システム40に含まれる基盤の各々は、異なるサーバに実装されてもよく、一つのサーバに機能を分けて実装されてもよい。
図36は、本実施例3の複数のシステムによる主な処理を示す説明図である。
実施例3の各システム間の処理フローは、図29に示す処理フローと同様である。具体的には、図29に示すデータ保持システム2とデータ処理システム1との処理を、データ保持システム兼サービス提供システム40が実行する。
図36に示す処理フローと図29に示す処理フローとの相違点は、実施例3において、処理44、処理45、および処理55が実行されない点である。
なお、前述の実施例は、鉄道インフラにおける電子乗車券から取得されたデータの処理を示したが、本実施例は、利用者5の行動を示すデータを処理するシステムであれば、いかなるシステムにでも適用可能である。例えば、ショッピングモール等において用いられる提携カードから、利用者5の行動を示すデータを取得するシステムにも適用可能である。
また、本発明は前述した実施例に限定されるものではなく、様々な変形例が含まれる。また、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
また、前述の各構成、機能、処理部、処理手順等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよい。また、前述の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現されてもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線および情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線および情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
以上、本発明によって実現されるシステムの実施例について説明した。システム構成や処理手順、画面の例等はあくまでも一例であり、本発明はこれら実施例の形態に限定されるものではなく、その要旨を逸脱しない範囲で変更が可能である。
公共交通機関で利用される電子乗車券の履歴情報を用いた情報提供サービスにおいて、電子乗車券利用者のプライバシーに配慮しつつ、流動に関する情報と個人の行動傾向に関する詳細な分析を可能とし、情報配信やマーケティングに広く活用することが可能となる。

Claims (12)

  1. 利用者の行動を示す履歴データを処理するデータ処理装置であって、
    前記履歴データは、前記利用者を示す第1の識別子、および、前記利用者が行動した時刻を示す時刻情報を含み、
    前記データ処理装置は、
    前記履歴データを取得する第1の通信インタフェースと、
    前記取得された履歴データを格納するメモリと、
    前記取得された履歴データを用いて、前記第1の識別子および前記時刻情報を含む第1のデータを生成し、前記生成された第1のデータを前記メモリに格納するデータ処理部と、
    前記時刻情報が第1の期間中である第1のデータにおいて有効な第2の識別子に、前記第1の識別子を変換することによって第2のデータを生成し、前記生成された第2のデータを前記メモリに格納するID変換処理部と、
    前記履歴データおよび前記第1のデータを、前記メモリから削除するメンテナンス部と、を有することを特徴とするデータ処理装置。
  2. 請求項1に記載のデータ処理装置であって、
    前記データ処理部は、
    前記第1のデータを用いて、前記第1の識別子を含まない集計情報を生成し、
    前記生成された集計情報を前記メモリに格納し、
    前記データ処理装置は、前記集計情報および前記第2のデータに基づいて、前記利用者の行動を分析するための第1の分析情報を生成し、前記第1の分析情報を出力する分析処理部を有することを特徴とするデータ処理装置。
  3. 請求項2に記載のデータ処理装置であって、
    前記ID変換処理部は、
    前記利用者の行動を分析するために指定された第2の期間、および、行動が類似する利用者の上限数を取得し、
    前記第2の期間、類似する行動をとる利用者の数と当該類似する行動をとる日数とを、前記第1のデータに基づいて算出し、
    前記取得された上限数と、前記算出された利用者の数および日数とに基づいて、前記第1の期間を決定することを特徴とするデータ処理装置。
  4. 請求項2に記載のデータ処理装置であって、
    オペレータからの指示を受け付けるための入力インタフェースを有し、
    前記入力インタフェースを介して、前記第1の期間を受け付けることを特徴とするデータ処理装置。
  5. 請求項2に記載のデータ処理装置を含むデータ処理システムであって、
    前記データ処理システムは、
    クライアントシステムに接続され、
    前記データ処理装置に接続されるデータ提供装置を有し、
    前記データ提供装置は、
    前記クライアントシステムと通信するための第2の通信インタフェースを有し、
    前記クライアントシステムからの要求に従い、前記集計情報に基づいて第2の分析情報を生成し、
    前記第2の分析情報を前記クライアントシステムに、前記第2の通信インタフェースを介して送信することを特徴とするデータ処理システム。
  6. 請求項5に記載のデータ処理システムであって、
    前記履歴データは、前記利用者の属性を含み、
    前記第1の通信インタフェースは、前記利用者から収集された前記履歴データを保持するデータ保持システムに接続され、
    前記データ提供装置は、前記クライアントシステムからの要求に従い、前記データ処理装置から取得された集計情報に基づいて、前記利用者の属性を含む前記第2の分析情報を生成し、
    前記第2の通信インタフェースが、前記クライアントシステムから前記属性の指定を含む要求を受信した場合、前記第1の通信インタフェースは、当該受信した要求を前記データ保持システムに転送することを特徴とするデータ処理システム。
  7. 利用者の行動を示す履歴データを処理するデータ処理システムによるデータ処理方法であって、
    前記データ処理システムは、前記履歴データを処理するデータ処理装置を有し、
    前記履歴データは、前記利用者を示す第1の識別子、および、前記利用者が行動した時刻を示す時刻情報を含み、
    前記データ処理装置は、
    第1のプロセッサと、前記履歴データを取得する第1の通信インタフェースと、前記取得された履歴データを格納するメモリと、を有し、
    前記方法は、
    前記第1のプロセッサが、前記取得された履歴データを用いて、前記第1の識別子および前記時刻情報を含む第1のデータを生成し、前記生成された第1のデータを前記メモリに格納するデータ処理手順と、
    前記第1のプロセッサが、前記時刻情報が第1の期間中である第1のデータにおいて有効な第2の識別子に、前記第1の識別子を変換することによって第2のデータを生成し、前記生成された第2のデータを前記メモリに格納するID変換処理手順と、
    前記第1のプロセッサが、前記履歴データおよび前記第1のデータを、前記メモリから削除するメンテナンス手順と、を含むことを特徴とするデータ処理方法。
  8. 請求項7に記載のデータ処理方法であって、
    前記データ処理手順は、
    前記第1のプロセッサが、前記第1のデータを用いて、前記第1の識別子を含まない集計情報を生成する手順と、
    前記第1のプロセッサが、前記生成された集計情報を前記メモリに格納する手順と、を含み、
    前記方法は、前記第1のプロセッサが、前記集計情報および前記第2のデータに基づいて、前記利用者の行動を分析するための第1の分析情報を生成し、前記第1の分析情報を出力する分析処理手順を含むことを特徴とするデータ処理方法。
  9. 請求項8に記載のデータ処理方法であって、
    前記ID変換処理手順は、
    前記第1のプロセッサが、前記利用者の行動を分析するために指定された第2の期間、および、行動が類似する利用者の上限数を取得する手順と、
    前記第1のプロセッサが、前記第2の期間、類似する行動をとる利用者の数と当該類似する行動をとる日数とを、前記第1のデータに基づいて算出する手順と、
    前記第1のプロセッサが、前記取得された上限数と、前記算出された利用者の数および日数とに基づいて、前記第1の期間を決定する手順と、を含むことを特徴とするデータ処理方法。
  10. 請求項8に記載のデータ処理方法であって、
    前記データ処理装置は、オペレータからの指示を受け付けるための入力インタフェースを有し、
    前記方法は、前記第1のプロセッサが、前記入力インタフェースを介して、前記第1の期間を受け付ける手順を含むことを特徴とするデータ処理方法。
  11. 請求項8に記載のデータ処理方法であって、
    前記データ処理システムは、
    クライアントシステムに接続され、
    前記データ処理装置に接続されるデータ提供装置を有し、
    前記データ提供装置は、
    第2のプロセッサと、前記クライアントシステムと通信するための第2の通信インタフェースと、を有し、
    前記方法は、
    前記第2のプロセッサが、前記クライアントシステムからの要求に従い、前記集計情報に基づいて第2の分析情報を生成する手順と、
    前記第2のプロセッサが、前記生成された第2の分析情報を前記クライアントシステムに、前記第2の通信インタフェースを介して送信する手順と、を含むことを特徴とするデータ処理方法。
  12. 請求項11に記載のデータ処理方法であって、
    前記履歴データは、前記利用者の属性を含み、
    前記第1の通信インタフェースは、前記利用者から収集された前記履歴データを保持するデータ保持システムに接続され、
    前記第2の分析情報を生成する手順は、前記第2のプロセッサが、前記クライアントシステムからの要求に従い、前記データ処理装置から取得された集計情報に基づいて、前記利用者の属性を含む前記第2の分析情報を生成する手順を含み、
    前記方法は、前記第2の通信インタフェースが、前記クライアントシステムから前記属性の指定を含む要求を受信した場合、前記第1の通信インタフェースは、当該受信した要求を前記データ保持システムに転送する手順を含むことを特徴とするデータ処理方法。
JP2015504131A 2013-03-05 2013-11-26 データ処理装置、データ処理システム、および、データ処理方法 Active JP5936765B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013043027 2013-03-05
JP2013043027 2013-03-05
PCT/JP2013/081745 WO2014136328A1 (ja) 2013-03-05 2013-11-26 データ処理装置、データ処理システム、および、データ処理方法

Publications (2)

Publication Number Publication Date
JP5936765B2 true JP5936765B2 (ja) 2016-06-22
JPWO2014136328A1 JPWO2014136328A1 (ja) 2017-02-09

Family

ID=51490873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015504131A Active JP5936765B2 (ja) 2013-03-05 2013-11-26 データ処理装置、データ処理システム、および、データ処理方法

Country Status (3)

Country Link
US (1) US9594926B2 (ja)
JP (1) JP5936765B2 (ja)
WO (1) WO2014136328A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5939580B2 (ja) * 2013-03-27 2016-06-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 匿名化データを名寄せするための名寄せシステム、並びに、その方法及びコンピュータ・プログラム
EP3935548A4 (en) 2019-03-08 2022-12-21 Anagog Ltd. DATA COLLECTION PRESERVING CONFIDENTIALITY
KR20210016838A (ko) * 2019-08-05 2021-02-17 삼성전자주식회사 서버 및 서버의 데이터 관리 방법
FR3117886A1 (fr) 2020-12-21 2022-06-24 IFP Energies Nouvelles Procede de captation de silicium en absence d’hydrogene
WO2023021673A1 (ja) * 2021-08-19 2023-02-23 日本電気株式会社 サーバ装置、システム、odデータ生成方法及び記憶媒体

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202901A (ja) * 2004-01-15 2005-07-28 Mcbi:Kk 個人情報管理方法、健康管理方法、健康管理システム、金融資産管理方法及び金融資産管理システム
WO2011043418A1 (ja) * 2009-10-09 2011-04-14 日本電気株式会社 情報管理装置、そのデータ処理方法、およびコンピュータプログラム
JP2011076291A (ja) * 2009-09-30 2011-04-14 Hitachi Ltd 行動傾向分析サーバ及び行動傾向分析方法
JP2012226505A (ja) * 2011-04-19 2012-11-15 Hitachi Ltd 仮名化システム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774377A (en) * 1991-07-30 1998-06-30 Hewlett-Packard Company Method and apparatus for monitoring a subsystem within a distributed system for providing an archive of events within a certain time of a trap condition
US6732113B1 (en) 1999-09-20 2004-05-04 Verispan, L.L.C. System and method for generating de-identified health care data
CN100465977C (zh) 2003-03-20 2009-03-04 株式会社日本医疗数据中心 信息管理系统
JP2007141192A (ja) 2005-11-15 2007-06-07 Japan Medical Information Research Institute Inc データ処理制御装置
US20080208760A1 (en) * 2007-02-26 2008-08-28 14 Commerce Inc. Method and system for verifying an electronic transaction

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202901A (ja) * 2004-01-15 2005-07-28 Mcbi:Kk 個人情報管理方法、健康管理方法、健康管理システム、金融資産管理方法及び金融資産管理システム
JP2011076291A (ja) * 2009-09-30 2011-04-14 Hitachi Ltd 行動傾向分析サーバ及び行動傾向分析方法
WO2011043418A1 (ja) * 2009-10-09 2011-04-14 日本電気株式会社 情報管理装置、そのデータ処理方法、およびコンピュータプログラム
JP2012226505A (ja) * 2011-04-19 2012-11-15 Hitachi Ltd 仮名化システム

Also Published As

Publication number Publication date
US20160004881A1 (en) 2016-01-07
WO2014136328A1 (ja) 2014-09-12
US9594926B2 (en) 2017-03-14
JPWO2014136328A1 (ja) 2017-02-09

Similar Documents

Publication Publication Date Title
Trépanier et al. Individual trip destination estimation in a transit smart card automated fare collection system
US10572833B2 (en) Determining host preferences for accommodation listings
Chen et al. Peeking beneath the hood of uber
JP5936765B2 (ja) データ処理装置、データ処理システム、および、データ処理方法
US11462037B2 (en) System and method for automated analysis of electronic travel data
JP5074688B2 (ja) 営業支援方法、営業支援システム及びコンピュータプログラム
CN106529711B (zh) 用户行为预测方法及装置
van Loenen et al. Data protection legislation: A very hungry caterpillar: The case of mapping data in the European Union
KR102190755B1 (ko) 표준 진료비에 기반한 동물병원 추천 방법 및 시스템
KR102293877B1 (ko) 블록체인 기반 관광 이벤트 처리 시스템 및 방법
WO2015033453A1 (ja) 料金払戻しシステムおよびその方法
CN110288451B (zh) 一种财务报销方法、系统、设备及存储介质
Long et al. Who is returning to public transport for non-work trips after COVID-19? Evidence from older citizens' smart cards in the UK's second largest city region
KR102204843B1 (ko) 가치선택적 마케팅 시스템
JP7553941B2 (ja) 経費検査装置、経費検査方法、およびプログラム
CN117689049A (zh) 旅客常住地预测方法、装置、电子设备和存储介质
US8666797B2 (en) Information collection program, information collection apparatus, and information collection method
JP5497852B2 (ja) 営業支援方法、営業支援システム及びコンピュータプログラム
JP2020077078A (ja) チケットシステム
JP6554076B2 (ja) 地域振興券管理システム地域振興券管理方法
JP5628133B2 (ja) 名寄せ装置及び名寄せ方法
Dave et al. Policies for Performance-Based On-Street Parking for CBD Areas of Developing Economies
KR102095577B1 (ko) 경조사시 방문자를 위한 전자 시스템 운영방법 및 시스템
KR20180113306A (ko) 온라인 삽입 이미지 검색 방법, 장치 및 컴퓨터-판독가능 매체
Dafu et al. Commuter travel identification based on bus IC data

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160510

R150 Certificate of patent or registration of utility model

Ref document number: 5936765

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150