WO2011132534A1

WO2011132534A1 - 統計情報生成システム及び統計情報生成方法

Info

Publication number: WO2011132534A1
Application number: PCT/JP2011/058730
Authority: WO
Inventors: 寺田　雅之; 岡島　一郎; 勇輝大薮
Original assignee: 株式会社エヌ・ティ・ティ・ドコモ
Priority date: 2010-04-23
Filing date: 2011-04-06
Publication date: 2011-10-27
Also published as: JPWO2011132534A1; KR20120139844A; JP5406981B2; US8903791B2; EP2562711A4; EP2562711A1; RU2527754C2; BR112012027137A2; KR20140135244A; CN102859547A; US20130073577A1; RU2012149859A

Abstract

　この統計情報生成システム１は、条件入力部２３と、非識別化位置データ及び非識別化属性データを抽出する抽出部２４と、非識別化属性データに対して拡大係数を付与する拡大係数付与部２５と、非識別化位置データと非識別化属性データと拡大係数とを用いて、統計データを算出する統計部２６と、非識別化位置データを集計する集計部２７と、集計されたデータ数の大小を判定する判定部３２と、統計データを隠蔽して出力する出力部３３と、を備える。

Description

統計情報生成システム及び統計情報生成方法

　本発明は、統計情報生成システム及び統計情報生成方法に関するものである。

　従来から、携帯端末の位置情報を取得して、その位置情報をもとに携帯端末のユーザの人口分布を解析する装置が知られている（下記特許文献１，２参照）。このように携帯端末の位置情報を用いることで、国勢調査等により得られた人口統計データに比べて、ユーザの移動傾向も反映した人口分布を得ることができる。

　例えば、特許文献１に記載の装置は、携帯端末のそれぞれに関する位置情報を格納するデータベースを利用して、ターゲット地域およびターゲット層に対応する人口分布を集計している。また、特許文献２に記載の装置は、端末確認信号を受信した端末の応答信号の基地局毎の集計結果を人口密集度情報として生成することを開示している。

　このような従来の人口分布の統計処理においては、携帯端末の利用者に電気通信サービスを提供するためのデータである携帯端末の位置データや利用者の属性データなどの運用データを利用している。これらの運用データに対して集計などの統計処理を施すことにより，「人数分布」「移動人数」「人数構成」などの人口動態に関する推計値を得ることができる。ここで、「人数分布」は各エリアに分布している人数、「移動人数」は各エリア間を移動する人数、「人数構成」は性別や年齢層別に区分した人数分布や移動人数を意味する。

特開２００３－３０３７３号公報特開２００５－２８６６５７号公報

　しかしながら、上記従来の統計処理においては、集計対象の人口の全てが携帯端末を保持しているわけではないため、単に携帯端末の位置データの総和をとるだけでは正確な人口動態を得ることはできない。正確な人口動態を得るには、携帯端末から得られた位置データに対し、その携帯端末の契約者の属性ごとの契約率の逆数を乗じて重みつきの総和をとることなどにより、集計対象の携帯端末を持っていない人々を含めた人口全体を推計する必要がある。

　従って、従来の統計処理の技術によって人口動態の推計を行おうとすると、以下のような問題が生じる。具体的には、秘匿に関する課題である。統計処理を行うことによって、個々の携帯端末に関する情報は失われ、集団としての統計的な傾向のみが集計結果に示されることになるが、統計処理の過程においてあまりに細かい集計範囲で集計情報を作成してしまうと、統計データに個人の識別性が出てきてしまうのではないかという懸念が生じる。その一方で、あまりに粗い集計範囲で集計情報を作成してしまうと、推計データの有用性を損なうことになる。この課題に対しては、従来の公的統計処理などにおいて、「秘匿処理」と呼ばれる処理が統計結果データに施されることがある。これは、集計表における数値がある一定の値 (秘匿基準と呼ばれる) を下回る場合に、その集計結果を表示しない、もしくは、零として表象する、などの処理を行うものである。しかしながら、上記の通り、携帯電話ネットワークからの位置データを利用した人口推定においては、契約者の属性ごとに異なる重みが乗じられた重みつき総和が求められるので、単純に推計値と秘匿基準との大小を比較することにより、秘匿の要否を判定することはできない。

　そこで、本発明は、かかる課題に鑑みて為されたものであり、携帯電話ネットワークから得られる位置データを利用した場合に、統計データにおける個人の識別性を秘匿することが可能な統計情報生成システム及び統計情報生成方法を提供することを目的とする。

　上記課題を解決するため、本発明の統計情報生成システムは、移動通信端末を識別する第１の識別情報と、該移動通信端末の位置に関する位置情報と、該位置情報が取得された時刻に関する時刻情報と、を含む位置情報蓄積データを入力する第１の入力手段と、移動通信端末を識別する第２の識別情報と、該移動通信端末の契約者に関する属性情報と、を含む属性情報蓄積データを入力する第２の入力手段と、位置情報蓄積データ及び属性情報蓄積データに対する検索条件情報を入力する条件入力手段と、検索条件情報を基に、位置情報蓄積データ及び属性情報蓄積データの一部を抽出する抽出手段と、抽出手段によって抽出された属性情報蓄積データに対して、属性情報蓄積データに含まれる属性情報に対応する係数であって、統計対象の数値への拡大度を示す拡大係数を付与する拡大係数付与手段と、抽出手段によって抽出された位置情報蓄積データと、抽出手段によって抽出され、位置情報蓄積データに含まれる第１の識別情報に対応する第２の識別情報を有する属性情報蓄積データと、該属性情報蓄積データに付与された拡大係数と、を用いて、人口に関する統計データを算出して出力する統計手段と、抽出手段によって抽出された位置情報蓄積データのデータ数を集計する集計手段と、集計手段によって集計されたデータ数を所定値と比較することによってデータ数の大小を判定する判定手段と、判定手段によってデータ数が大きいと判定された場合には、統計データを出力し、判定手段によってデータ数が小さいと判定された場合には、統計データに含まれる数値を隠蔽して出力する出力手段と、を備える。

　或いは、本発明の統計情報生成方法は、第１の入力手段が、移動通信端末を識別する第１の識別情報と、該移動通信端末の位置に関する位置情報と、該位置情報が取得された時刻に関する時刻情報と、を含む位置情報蓄積データを入力する第１の入力ステップと、第２の入力手段が、移動通信端末を識別する第２の識別情報と、該移動通信端末の契約者に関する属性情報と、を含む属性情報蓄積データを入力する第２の入力ステップと、条件入力手段が、位置情報蓄積データ及び属性情報蓄積データに対する検索条件情報を入力する条件入力ステップと、抽出手段が、検索条件情報を基に、位置情報蓄積データ及び属性情報蓄積データの一部を抽出する抽出ステップと、拡大係数付与手段が、抽出手段によって抽出された属性情報蓄積データに対して、属性情報蓄積データに含まれる属性情報に対応する係数であって、統計対象の数値への拡大度を示す拡大係数を付与する拡大係数付与ステップと、統計手段が、抽出手段によって抽出された位置情報蓄積データと、抽出手段によって抽出され、位置情報蓄積データに含まれる第１の識別情報に対応する第２の識別情報を有する属性情報蓄積データと、該属性情報蓄積データに付与された拡大係数と、を用いて、人口に関する統計データを算出して出力する統計ステップと、集計手段が、抽出手段によって抽出された位置情報蓄積データのデータ数を集計する集計ステップと、判定手段が、集計手段によって集計されたデータ数を所定値と比較することによってデータ数の大小を判定する判定ステップと、出力手段が、判定手段によってデータ数が大きいと判定された場合には、統計データを出力し、判定手段によってデータ数が小さいと判定された場合には、統計データに含まれる数値を隠蔽して出力する出力ステップと、を備える。

　このような統計情報生成システム或いは統計情報生成方法によれば、位置情報蓄積データ及び属性情報蓄積データから、検索条件を基に、統計対象の数値への拡大度が考慮された人口統計データが算出される。また、属性に応じた携帯端末の契約率などを考慮した人口の推計値である推計データだけでなく、推計データを生成するのに用いた位置データの真の個数であるデータ数を併せて集計することにより、統計データの秘匿の要否を判断するための材料となる情報が提供される。

　また、上述のようにして集計されたデータ数を基に、推計された統計データが「少数の集団」から生成された情報でないかどうかが判断され、その判断結果に応じて統計データが隠匿される。「少数の集団」から生成されたかどうかの判断は，統計データ中の統計数だけから行うことはできない。これは、統計数は、属性別に異なる携帯端末の契約率に基づく拡大推計によって導かれているためである。そこで、集計された上記データ数を用いることにより、集計データが「少数の集団」から生成されたか否かの判断が正確に行われる。

　その結果、位置情報蓄積データや属性情報蓄積データを基に推計された統計データにおける個人の識別性を秘匿することができる。

　本発明によれば、携帯電話ネットワークから得られる位置データを利用した場合に、統計データにおける個人の識別性を秘匿することができる。

本発明の好適な一実施形態にかかる統計情報生成システムの概略構成図である。図１の第１の入力部に入力される位置情報蓄積データのデータ構成を示す図である。図１の第２の入力部に入力される属性情報蓄積データのデータ構成を示す図である。図１の統計情報生成システムの動作を示すフローチャートである。本実施形態における端末数推計の考え方を説明するための図である。本実施形態における端末数推計に係る計算方法を説明するための図である。本実施形態における入込端末数推計処理を示すフローチャートである。本実施形態における推定滞在期間の算出方法を説明するための図である。本実施形態における位置データの抽出方法を説明するための図である。本実施形態における秘匿処理の一例を示すフローチャートである。

　以下、図面とともに本発明による統計情報生成システム及び統計情報生成方法の好適な実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。

　図１は、本発明の好適な一実施形態にかかる統計情報生成システム１の概略構成図である。図１に示す統計情報生成システム１は、移動体通信網NWにおいて複数の携帯端末２等の移動通信端末に電気通信サービスを提供するためのデータである位置情報を利用して、人口動態に関する推計値を含む統計データを生成するコンピュータシステムである。この統計情報生成システム１は、非識別化情報生成装置１１、集計装置２１、及び情報秘匿装置３１を含む複数の情報処理装置によって構成されおり、無線基地局３及び移動体通信網ＮＷを経由して携帯端末２や移動体通信網ＮＷに接続された通信装置との間で相互にデータ通信が可能とされている。なお、統計情報生成システム１は、１台の情報処理装置によって構成されてもいてもよいし、任意の台数の情報処理装置によって構成されていてもよい。

　上記の携帯端末２は、ＧＰＳを利用した測位や、無線基地局３からの電波を利用した測位等の様々な測位演算方式を使用した自己の位置情報を取得する機能を有している。また、その測位演算の結果得られた携帯端末２の位置情報は、携帯端末２や移動体通信網NWに接続された通信装置から、統計情報生成システム１に送信可能にされている。

　以下、統計情報生成システム１の構成について詳細に説明する。

　非識別化情報生成装置１１は、第１の入力部（第１の入力手段）１２、第２の入力部（第２の入力手段）１３、鍵管理部（鍵管理手段）１４、一方向演算部（一方向演算手段）１５、非識別化位置データ生成部（非識別化位置データ生成手段）１６、及び、非識別化属性データ生成部（非識別化属性データ生成手段）１７から構成される。

　第１の入力部１２は、移動体通信網ＮＷ等の外部から位置情報の入力を受け、位置情報蓄積データに蓄積する。位置情報蓄積データは、図２に示す通り，回線番号など携帯端末２を識別する情報である第１の識別情報“090-XXXX-XXXX”と、緯度・経度情報若しくは携帯端末２の位置登録信号を受信した無線基地局３の識別情報などの当該携帯端末２の位置に関する情報である位置情報“X1,Y1”と、位置情報を取得した時刻“2010/5/30 12:24”を含んでいる。また、第１の入力部１２は、蓄積した位置情報蓄積データを非識別化位置データ生成部１６に出力する。

　第２の入力部１３は、移動体通信網ＮＷ等の外部から携帯端末２の属性を示す属性データの入力を受け、属性情報蓄積データに蓄積する。属性情報蓄積データは、図３に示す通り、回線番号などの携帯端末２を識別する情報である第２の識別情報“090-XXXX-XXXX”と、第２の識別情報により識別される携帯端末２の契約者、すなわち、第２の識別情報が回線番号である場合は当該回線の契約者に関する属性を示す属性情報などを含む。このような属性情報としては、住所“東京都新宿区”、性別“男”や、年齢“３０代”等の情報が典型例として挙げられる。なお、同一の携帯端末２については，第１の識別情報と第２の識別情報は同じデータ値が与えられている。また、第２の入力部１３は、蓄積した属性情報蓄積データを非識別化属性データ生成部１７に出力する。

　図１に戻って、鍵管理部１４は，あらかじめ定められた電子鍵情報を保持する。この電子鍵情報は，鍵管理手段の外部に漏洩しないよう厳重に管理されていることが望ましい。

　一方向演算部１５は、非識別化位置データ生成部１６及び非識別化属性データ生成部１７から第１の識別情報及び第２の識別情報がそれぞれ入力されて、鍵管理部１４が保持する電子鍵情報を用い、第１の識別情報及び第２の識別情報に対して一方向関数を適用することによって、第１の非識別化情報及び第２の非識別化情報をそれぞれ出力する。たとえば、一方向演算部１５は、一方向性関数として SHA (Secure Hash Algorithm)-256 などのハッシュ関数を用い、第１の識別情報もしくは第２の識別情報と鍵情報との連接に対するハッシュ値を出力するなどの演算処理により、第１の非識別化情報もしくは第２の非識別化情報を出力する。

　非識別化位置データ生成部１６は、位置情報蓄積データから第１の識別情報を削除し、第１の識別情報を一方向演算部１５に入力することにより作成した第１の非識別化情報を、位置情報蓄積データに付加することにより、非識別化位置情報蓄積データを生成する。ここで、非識別化位置データ生成部１６は、位置情報に対しても適切なノイズを加えて位置をぶらすなど、さらなるデータ加工処理を加えることも好適である。また、非識別化位置データ生成部１６は、生成した非識別化位置情報蓄積データを、集計装置２１に引き渡す。

　非識別化属性データ生成部１７は，属性情報蓄積データから第２の識別情報を削除し、第２の識別情報を一方向演算部１５に入力することにより作成した第２の非識別化情報を、属性情報蓄積データに付加することにより、非識別化属性情報蓄積データを生成する。ここで、非識別化属性データ生成部１７は、属性情報を抽象化することによって抽象化属性情報を生成し、属性情報を抽象化属性情報に置換する処理を行うことも好適である。このような抽象化処理の例としては、「年齢」を「年齢層」に丸めたり、住所の詳細部分を削除したり、氏名などの個人識別性を持つ情報を取り除くなどの処理が挙げられる。また、非識別化属性データ生成部１７は、生成した非識別化属性情報蓄積データを、集計装置２１に引き渡す。

　統計情報生成システム１の集計装置２１は、格納部２２と、条件入力部（条件入力手段）２３と、抽出部（抽出手段）２４と，拡大係数付与部（拡大係数付与手段）２５と、統計部（統計手段）２６と、集計部（集計手段）２７とから構成される。

　格納部２２は，非識別化情報生成装置１１が生成する非識別化位置情報蓄積データと非識別化属性情報蓄積データとを格納する。

　条件入力部２３は、統計処理の要求者から、非識別化位置情報蓄積データと非識別化属性情報蓄積データに対する検索条件の入力を受け付ける。このような検索条件の入力は、統計情報生成システム１に直接入力されても良いし、移動体通信網NW等の通信ネットワーク経由で受信されてもよい。たとえば、要求者が「時刻tにA地域にいた男性の人数」を推計したい場合は、検索条件として、「時刻=t，位置情報∈A地域，性別=男性」に相当する情報の入力が受け付けられる。また、条件入力部２３は、受け付けた検索条件を抽出部２４に引き渡す。

　抽出部２４は、条件入力部２３から引き渡された検索条件に該当する一部のデータ集合を、格納部２２に格納された非識別化位置情報蓄積データ及び非識別化属性情報蓄積データの中から抽出する。たとえば，上述した検索条件が与えられた場合には、抽出部２４は、「時刻=t，位置情報∈A地域」に該当する非識別化位置情報蓄積データの集合と、「性別=男性」に該当する非識別化属性情報蓄積データの集合を抽出する。そして、抽出部２４は、抽出したそれぞれのデータ集合を対象にして、第１の非識別化情報および第２の非識別化情報をキー情報として、関係代数における結合（join）演算を実行する。これにより、「時刻=t，位置情報∈A地域，性別=男性」に該当する位置情報と属性情報とが結合されたデータ集合を得ることができる。

　ここで、抽出部２４は、検索条件と非識別化位置情報蓄積データとを照合した結果、検索条件に対する一致率が確率値として得られる場合には、非識別化位置情報蓄積データに対してその確率値を示す確率情報を付与しても良い。例えば、「位置情報∈A地域」であるかどうかが確率的に与えられる場合、その確率を抽出された集合に付与することができる。また、抽出部２４は、非識別化属性情報蓄積データに含まれる属性情報が抽象化属性情報に置換されていた場合には、抽象化位置情報と検索条件とを照合することにより、非識別化属性情報蓄積データを抽出する。例えば、抽象化属性情報が「年齢：５０代」と設定されていた場合には、検索条件「年齢＝２０代以上５０代以下」に適合していると判断されることになる。

　拡大係数付与部２５は、非識別化位置情報蓄積データと結合された非識別化属性情報蓄積データの含む属性情報を基にして、あらかじめ定められた手順に従って、数値である拡大係数を取得し、その拡大係数を結合されたデータ集合に付与する。この拡大係数は、統計対象の人口数値への拡大度を示す係数である。たとえば、拡大係数付与部２５は、「30代男性」「20代女性」などの年齢層及び性別の組み合わせごとの携帯電話の契約率を予め保持しておき、ある年齢及び性別の組み合わせを属性情報として含むデータ集合に対しては、対応する契約率の逆数を付与して出力する。さらに具体的には、「30代男性」の契約率が50% (=0.5)として保持されていた場合は、属性情報「35歳，男性」に対しては、“0.5” の逆数である拡大係数“2.0”を出力する。

　統計部２６は、抽出部２４により抽出された非識別化位置情報蓄積データ及び非識別化属性情報蓄積データを結合したデータ集合と、拡大係数付与部２５によって付与された拡大係数を用いて、人口推計数に関する統計データを算出する。具体的には、統計部２６は、データ集合に含まれるそれぞれの情報について、その属性情報から年齢と性別を抽出して、拡大係数付与部２５を呼び出して対応する拡大係数を得る。さらに、統計部２６は、データ集合に含まれる全データレコード（データ要素）の拡大係数の総和を、推計人数として算出する。ここで、統計部２６は、データ集合に含まれる一部のデータレコードについて、検索条件に該当する確率値を示す確率情報が付加されていた場合には、その確率情報に対して拡大係数を乗じた値の総和を取ることによって統計人数を算出することができる。また、統計部２６は、算出した統計データを情報秘匿装置３１に出力する。

　集計部２７は、抽出部２４により抽出されたデータ集合のデータレコード（データ要素）のデータ数を集計し、その集計値を集計人数として情報秘匿装置３１に出力する。ここでは、集計人数の計算には拡大係数や確率情報は考慮しない。その理由は、情報秘匿装置３１は「何人の携帯端末２のユーザの集団から推計された情報であるか」に基づいて、統計データの秘匿の要否を判定すべきであるため、拡大係数や確率情報による重みづけ処理を施す前の純粋なデータ要素数を必要とするためである。

　統計情報生成システム１の情報秘匿装置３１は、判定部（判定手段）３２と、出力部（出力手段）３３とから構成される。

　判定部３２は、集計部２７によって集計されたデータ数を所定値と比較することによって、データ数の大小を判定する。たとえば、判定部３２は、具体的な基準値として「10」が予め与えられていた場合、集計部２７によって集計された人数が「10」以上であるか否かを判定する。判定部３２は、判定の結果が10以上であった場合、集計人数が多いと判断し、10未満であった場合、集計人数が少ないと判断する。そして、判定部３２は、判定結果を出力部３３に引き渡す。

　出力部３３は、判定部３２の判定結果に基づいて、集計装置２１によって推計された推計人数を含む統計データを、そのまま出力するか否かを決定し、最終的な統計データを出力する。この統計データは、統計情報生成システム１に直接設けられたディスプレイ装置等の出力装置に出力されてもよいし、移動体通信網NW等の通信ネットワークを介して、携帯端末２等の遠隔装置に出力されてもよい。具体的には、出力部３３は、集計人数が多いと判断された場合は、統計データに含まれる推計人数をそのまま出力する。一方で、出力部３３は、集計人数が少ないと判断された場合は、推計人数をあらかじめ定められた数値もしくは符号に置き換えて出力することによって推計人数を隠蔽する。たとえば、推計人数を「0」として出力したり、隠蔽されたことを示す符号である「x」を推計人数に置換して出力したりする。なお、集計人数が多いと判断された場合でも、残差値の開示などの可能性を考慮して、推計人数をある数値間隔を有する概算値に丸めたり、乱数を加えた値等を推計値として出力することも好適である。

　以下、図４を参照して、統計情報生成システム１の動作について説明するとともに、併せて統計情報生成システム１における統計情報生成方法について詳述する。図４は、統計情報生成システム１による統計情報生成時の動作を示すフローチャートである。

　まず、非識別化情報生成装置１１が、位置情報の入力を受け、位置情報蓄積データに蓄積する（ステップＳ１０１）。次に、非識別化情報生成装置１１の非識別化位置データ生成部１６は、位置情報蓄積データから第１の識別情報を削除するとともに、それを一方向演算部１５に入力することにより得られた第１の非識別化情報を、位置情報蓄積データに付加することにより、非識別化位置情報蓄積データを生成し、集計装置２１の格納部２２に格納する（ステップＳ１０２）。　その後、非識別化情報生成装置１１が、属性情報の入力を受け、属性情報蓄積データに蓄積する（ステップＳ１０３）。次に、非識別化情報生成装置１１の非識別化属性データ生成部１７は、属性情報蓄積データから第２の識別情報を削除するとともに、それを一方向演算部１５に入力することにより得られた第２の非識別化情報を、属性情報蓄積データに付加することにより、非識別化属性情報蓄積データを生成し、集計装置２１の格納部２２に格納する（ステップＳ１０４）。

　さらに、集計装置２１の条件入力部２３は、統計処理の条件を定める検索条件の入力を受けつける（ステップＳ１０５）。たとえば、条件入力部２３は、「時刻tにA地域にいた男性の人数」を推計するための検索条件として、「時刻=t，位置情報∈A地域，性別=男性」に相当する情報の入力を受け付ける。これに応じて、抽出部２４は、受け付けられた検索条件に該当する非識別化位置情報蓄積データと非識別化属性情報蓄積データの集合を、格納部２２から抽出する（ステップＳ１０６）。具体的には、抽出部２４は、「時刻=t，位置情報∈A地域」に該当する非識別化位置情報蓄積データの集合と、「性別=男性」に該当する非識別化属性情報蓄積データの集合を、それぞれ格納部２２から抽出する。さらに、抽出部２４は、抽出したそれぞれの集合を対象にして、第１の非識別化情報および第２の非識別化情報をキーとして、結合演算を実行する（ステップＳ１０７）。その結果、抽出部２４は、検索条件に該当するデータ集合を得る。

　次に、統計部２６は、抽出部２４により抽出されたデータ集合の構成要素から属性情報の一部、たとえば年齢と性別を抽出して、拡大係数付与部２５に与えることによって、それぞれの構成要素に対する拡大係数を取得する（ステップＳ１０８）。その後、統計部２６は、拡大係数の総和を計算し、推計人数として得る（ステップＳ１０９）。さらに、集計部２７は、抽出部２４により抽出されたデータ集合の要素数を計算し、集計人数として取得する（ステップＳ１１０）。

　例えば、抽出部２４によって、以下のようなデータ項目「位置，時刻，年齢，性別」をそれぞれ含む４つのデータ要素から構成されるデータ集合が得られたと想定する。
要素1: (A, t, 23, 男性)
要素2: (A, t, 33, 男性)
要素3: (A, t, 31, 男性)
要素4: (A, t, 85, 男性)

　ここで、拡大係数付与部２５が、年齢層と性別の組に対する契約率として，以下の情報を保持していたとする。
(20 代，男性): 40% (=0.4)
(30 代，男性): 50% (=0.5)
(80 代，男性): 5% (=0.05)

　この場合、拡大係数は契約率の逆数であるとすると、それぞれの要素に対して、以下のような拡大係数が付与される。
要素1: (A, t, 23, 男性): 2.5
要素2: (A, t, 33, 男性): 2.0
要素3: (A, t, 31, 男性): 2.0
要素4: (A, t, 85, 男性): 20.0

　さらに、上記の例では，統計部２６によって推計される推計人数は“26.5”となり、集計部２７によって算出される集計人数は“4” となる。

　再び図４を参照して、その後、情報秘匿装置３１の判定部３２は、集計部２７によって算出された集計人数が、所定値以上であるか否かを判定する（ステップＳ１１１）。具体的な基準値として「10」が与えられていたとすると、上記の例では、集計人数は“4”であるため、集計人数が少ないと判定される。

　最後に、出力部３３は、判定部３２における判定に基づいて、推計人数をそのまま出力するか否かを決定し，最終的な推計値を出力する。すなわち、集計人数が多いと判定された場合には（ステップＳ１１１；ＹＥＳ）、出力部３３は、推計人数を推計値としてそのまま出力する（ステップＳ１１２）。一方、集計人数が少ないと判定された場合には（ステップＳ１１１；ＮＯ）、推計人数をあらかじめ定められた特定の数値もしくは符号に置き換えることにより、推計人数を隠蔽して出力する（ステップＳ１１３）。上記の例では、集計人数が少ないと判定されているため、推計値はたとえば「0」として出力されることになる。

　以上説明した統計情報生成システム１及び統計情報生成方法によれば、第１及び第２の識別情報により互いに対応づけられる位置情報蓄積データと属性情報蓄積データから、それぞれ第１及び第２の識別情報が取り除かれた上で第１及び第２の非識別化情報が付与される。この第１及び第２の非識別化情報は，予め保持された電子鍵情報と第１及び第２の識別情報を一方向性関数に代入することにより得られたものであり、非識別化情報から識別情報を逆算することはできない。また、一方向性関数が既知であったとしても、電子鍵の値が秘密にされている限り、識別情報を総当たりで一方向性関数に入力したとしても識別情報と非識別化情報の対応関係を知ることはできない。

　さらに、非識別化情報を付加された非識別化位置情報蓄積データ及び非識別化属性情報蓄積データから、検索条件を基に、統計対象の数値への拡大度が考慮された人口統計データが算出される。ここでは、識別情報は非識別化情報に置き換えられていることから、識別情報を用いた検索条件を与えることにより、特定個人の行動を開示させるような統計処理を実施することを未然に防ぐことができる。また、属性に応じた携帯端末の契約率などを考慮した人口の推計値である推計データだけでなく、推計データを生成するのに用いた位置データの真の個数であるデータ数を併せて集計することにより、統計データの秘匿の要否を判断するための材料となる情報が提供される。

　その結果、位置情報蓄積データや属性情報蓄積データに含まれる識別情報からの個人の識別を防止でき、かつ、推計された統計データにおける個人の識別性を秘匿することができる。

　上記統計情報生成システム１においては、属性情報蓄積データに含まれる属性情報が、情報を抽象化した抽象化属性情報に置換され、当該抽象化属性情報と検索条件情報を照合することにより、非識別化属性情報蓄積データの一部が抽出される。従って、抽象化された属性情報を単位にした統計データを得ることによって人口動態の概略を知ることができる。また、統計データを概略化することで統計データを基にした個人の識別をより困難にすることができる。

　また、非識別化位置情報蓄積データに対して確率情報が付与され、確率情報に対して拡大係数を乗じることによって統計データが算出されるので、位置情報と検索条件との一致率が確率として得られる場合に、その確率が反映された統計データを得ることができ、全体の人口動態傾向が反映された統計データを得ることができる。例えば、位置情報がエリアにおける確率分布として得られる場合には、その確率分布を反映した統計データを得ることができる。

　なお、本発明は、前述した実施形態に限定されるものではない。例えば、統計情報生成システム１で処理される位置情報蓄積データおよび属性情報蓄積データには、第１及び第２の識別情報として回線番号が含まれ、統計情報生成システム１は、その回線番号を携帯端末２を識別する情報として処理していた。これに対して、統計情報生成システム１は、回線番号に代えて携帯端末２を識別する情報として、ＩＭＳＩ（International Mobile Subscriber Identity）等の携帯端末２のユーザを識別する番号や、ＩＭＥＩ（International Mobile Equipment Identity）等の携帯端末２のデバイスを識別する番号等を処理してもよい。

　また、集計装置２１の抽出部２４は、検索条件に該当する一部のデータ集合を、格納部２２に格納された非識別化位置情報蓄積データ及び非識別化属性情報蓄積データの中から抽出していた。これは、抽出部２４が、非識別化位置情報蓄積データ及び非識別化属性情報蓄積データを結合演算によって結合した後に、結合されたデータ集合に確率情報を付加し、そのデータ集合のうちで検索条件に該当する一部のデータ集合を抽出するようにしてもよい。また、確率情報が付与される前のデータ集合を抽出してもよいし、拡大係数付与部２５によって拡大係数が付与されたデータ集合を抽出してもよい。

　また、集計装置２１の統計部２６は、抽出部２４によって抽出されたデータ集合に含まれる各データレコードの拡大係数の総和を算出していたが、データ集合に含まれるデータレコードの総和を属性毎に算出し、その総和に対して該当する属性に対応する拡大係数を乗じてもよい。例えば、データ集合に含まれる属性「３０代男性」に適合するデータレコードの総数または確率値の総和をまず算出し、その総数または総和に対して属性「３０代男性」に対応する拡大係数“2.0”を乗ずることで、その属性に対応した統計人数を算出できる。

　また、上述した実施形態では、情報秘匿装置３１の出力部３３は、集計装置２１の条件入力部２３によって入力が受け付けられた検索条件を基に、検索条件に対応する全体の統計人数を出力しているが、この統計人数は属性別に区分して出力してもよい。例えば、検索条件が「時刻=t，位置情報∈A地域，年齢=３０代」と受け付けられた際に、出力部３３は、性別ごとの統計人数を出力してもよいし、年齢ごとの統計人数を出力してもよいし、年齢及び性別ごとの統計人数を出力してもよい。

　また、集計装置２１では、以下のような手順で、抽出部２４によって、位置情報と属性情報とを結合したデータ（以下、単に「位置データ」という。）に対して、携帯端末２によって生成された位置情報についての推定生成密度に対応する情報である特徴量ｗ_ｉｊを付与し、この位置データの集合を統計部２６によって集計することによって在圏数推計を行ってもよい。ここでいう「推定生成密度」とは、当該位置情報を生成した端末が，当該位置情報の生成時刻周辺で単位時間あたりに生成する信号数の推定値を意味する。

　まず、端末数推計の考え方および計算方法を説明する。図５に示すモデルのように、ある観測期間（長さＴ）の間に、ｎ個の端末ａ_１，ａ_２，…，ａ_ｎが無線基地局３のセクタＳを通過し、各端末ａ_ｉの観測期間内のセクタＳの滞在時間がｔ_ｉ（０＜ｔ_ｉ≦Ｔ）であったとする。このとき、セクタＳに存在する端末数ｍ（実際にはセクタＳに存在する端末数ｍの観測期間内における平均値）は、以下の式（１）で表わされる。

即ち、各端末ａ_ｉの観測期間内のセクタＳの滞在時間ｔ_ｉの総和を観測期間の長さＴで除した結果を、端末数ｍとして推計する。ただし、端末ａ_ｉの観測期間内のセクタＳの滞在時間ｔ_ｉの真の値は観測不能であるが、各端末ａ_ｉは位置情報（例えば位置登録信号であり、以下では単に「信号」と言う。）を発信し、それらの信号は観測可能である。

　端末ａ_ｉが観測期間内にセクタＳで発信した信号を、時刻順に

（ｘ_ｉは、端末ａ_ｉが観測期間内にセクタＳで発信した信号の総数）とすると、端末数の推計とは、観測された信号ｑ_ｉｊ（ｊは１以上ｘ_ｉ以下の整数）からｍの値を推計することに他ならない。

　さて、図６に基づき端末数推計の計算方法を説明する。端末ａ_ｉから信号ｑ_ｉｊが送信される密度（即ち、単位時間あたりの信号数）をｐ_ｉとする。このとき、信号が送信される確率がセクタに対して独立であれば、端末ａ_ｉが観測期間内にセクタＳで発信した信号の総数ｘ_ｉの期待値Ｅ（ｘ_ｉ）は、Ｅ（ｘ_ｉ）＝ｔ_ｉ×ｐ_ｉであるため、端末ａ_ｉの観測期間内のセクタＳの滞在時間ｔ_ｉの期待値Ｅ（ｔ_ｉ）について以下の式（２）が成立する。
Ｅ（ｔ_ｉ）＝ｘ_ｉ／ｐ_ｉ　（２）
ここで、信号ｑ_ｉｊの送信時刻をｕ_ｉｊとしたとき、信号ｑ_ｉｊの密度ｐ_ｉｊは、以下の式（３）で与えられる。
ｐ_ｉｊ＝２／（ｕ_{ｉ（ｊ＋１）}－ｕ_{ｉ（ｊ－１）}）　（３）
ここで、信号ｑ_ｉｊを、特徴量ｗ_ｉｊを求める対象の位置データ（第１の位置データ）に係る信号とすると、信号ｑ_{ｉ（ｊ-１）}は、当該第１の位置データと同一の識別情報を含む位置データのうち、当該第１の位置データの直前の位置データ（第２の位置データ）に係る信号、信号ｑ_{ｉ（ｊ＋１）}は、当該第１の位置データと同一の識別情報を含む位置データのうち、当該第１の位置データの直後の位置データ（第３の位置データ）に係る信号に相当する。本実施形態では、第２の位置データに係る信号ｑ_{ｉ（ｊ-１）}の送信時刻ｕ_{ｉ（ｊ－１）}と第３の位置データに係る信号ｑ_{ｉ（ｊ＋１）}の送信時刻ｕ_{ｉ（ｊ＋１）}の差、即ち、上記式（３）の（ｕ_{ｉ（ｊ＋１）}－ｕ_{ｉ（ｊ－１）}）を、第１の位置データについての特徴量ｗ_ｉｊとする。そのため、上記式（３）は、以下となる。即ち、特徴量ｗ_ｉｊは、密度ｐ_ｉｊの逆数に対応付けて算出することができる。
ｐ_ｉｊ＝２／（ｕ_{ｉ（ｊ＋１）}－ｕ_{ｉ（ｊ－１）}）＝２／ｗ_ｉｊ　（４）
集計装置２１の抽出部２４は、集計対象の全ての位置データに対して特徴量ｗ_ｉｊを付加する。

　このとき密度ｐ_ｉは、

で与えられるため、端末数ｍの推計値Ｅ（ｍ）は以下の式（６）で計算することができる。

　図６の例に示すように、観測期間内であり且つ端末ａ_ｉがセクタＳに滞在していた期間内に、端末ａ_ｉは信号ｑ_ｉ１、ｑ_ｉ２、ｑ_ｉ３を送信し、信号ｑ_ｉ１の直前に信号ｑ_ｉ０を、信号ｑ_ｉ３の直後に信号ｑ_ｉ４を送信したものとし、信号ｑ_ｉ０、ｑ_ｉ１、ｑ_ｉ２、ｑ_ｉ３、ｑ_ｉ４の送信時刻をそれぞれｕ_ｉ０、ｕ_ｉ１、ｕ_ｉ２、ｕ_ｉ３、ｕ_ｉ４とすると、上記の考え方は、端末ａ_ｉの観測期間内のセクタＳの滞在時間ｔ_ｉを、（ｕ_ｉ０とｕ_ｉ１の中点）から（ｕ_ｉ３とｕ_ｉ４の中点）までの期間と推計することに相当する。

　上記の考え方に従い、集計装置２１の統計部２６は、データ集合に含まれる全ての位置データに付加された特徴量ｗ_ｉｊを特定し、それらの特徴量ｗ_ｉｊの総和を観測期間長Ｔの２倍によって除して得られた数値を、セクタＳ毎、属性毎の端末数として推計する。そして、統計部２６は、推計された端末数に拡大係数を乗ずることによってセクタＳ毎、属性毎の推計端末数を算出する。なお、式（６）より明らかなように、統計部２６は、観測対象位置データについての特徴量ｗ_ｉｊそれぞれを２で除して、（特徴量ｗ_ｉｊ／２）の総和を求め、求めた総和を観測期間長Ｔによって除して得られた数値を、端末数として推計してもよい。ただし、本実施形態のように観測対象位置データについての特徴量ｗ_ｉｊの総和を観測期間長Ｔの２倍によって除算する計算方法の方が、除算の回数が圧倒的に少なくて済むため、処理負荷を軽減できるという利点がある。また、統計部２６は、推計端末数を算出する際には、属性毎に拡大係数が乗じられた特徴量ｗ_ｉｊの総和を求め、求めた総和を観測期間長Ｔの２倍によって除して得られた数値を、セクタＳ毎、属性毎の推計端末数として推計してもよい。さらに、統計部２６は、セクタＳ毎の推計端末数を、メッシュなどの他のエリア区分毎の人口推計数に変換（エリア変換）して統計データを算出してもよい。

　このエリア変換の方法としては、例えばセクタＳ毎に推計端末数等の推計人数が算出されていた場合に、予めセクタ毎にメッシュや市町村などの複数のエリア区分に対する按分比を管理しておく。そして、統計部２６は、各メッシュ毎に推計された推計人数をその按分比に応じて複数のエリア区分に按分し、各エリア区分毎に按分された推計人数を足し合わせることによってエリア区分毎の推計人数に変換することができる。

　また、集計装置２１では、以下のような手順で、位置情報と属性情報とを結合した位置データを対象にして、観測期間の少なくとも一部において観測エリアに滞在したユニークな端末数である「入込端末数」や、観測期間の少なくとも一部において観測エリアに滞在したユニークな人数である「入込数」を推計してもよい。

　ここで、図７を用いて、本発明の入込端末数推計方法に係る入込端末数推計処理を説明する。ここでは、携帯端末の位置データに含まれる位置情報には、一例として、当該携帯端末が在圏するセクタのセクタ番号が与えられているものとする。また、ここでは、観測期間情報として、観測開始時刻ｔ_０と観測終了時刻ｔ_１の組が条件入力部２３により予め取得され、観測エリア情報として、セクタ番号Ｓが条件入力部２３により予め取得されたものとする。

　まず、抽出部２４が、格納部２２に蓄積された位置データから、観測期間の少なくとも一部において観測エリアに滞在したと推定される端末、又は、当該端末にて観測期間内又は後述する拡張期間内に生成された１つの位置データを抽出する。ここでの抽出方法は、さまざまな方法を採用しうるが、以下では、一例として、観測エリアの各端末の推定滞在期間を用いた方法を説明する。

　抽出部２４は、同一端末に関する位置データにおいて、取得時刻が後述の拡張期間内にあり位置情報が観測エリア内を示すエリア内位置データ、および取得時刻順に時系列に並べた場合に当該エリア内位置データに隣接し位置情報が観測エリア外を示すエリア外位置データに基づいて、端末が観測エリア内に滞在していた推定滞在期間を端末ごとに算出する（図７のステップＳ１）。なお、上記の「拡張期間」は、ここでは一例として、観測期間を前後に所定の時間幅（例えば１時間）だけ拡張した期間、即ち、観測開始時刻ｔ_０から所定時間だけ過去に遡った時刻を開始点とし、観測終了時刻ｔ_１から所定時間だけ未来に進めた時刻を終了点とする期間を意味する。

　図８に示すように、拡張期間内に取得された同一端末に関する一連の位置データを取得時刻順に時系列に並べ、位置情報が観測エリア内を示すエリア内位置データを黒丸で、エリア内位置データに隣接し位置情報が観測エリア外を示すエリア外位置データを白丸で、それぞれ示した場合、時系列上で最先のエリア内位置データの取得時刻ｔ_ａと、該最先のエリア内位置データに隣接するエリア外位置データの取得時刻ｔ_ｘとの按分点（一例として中点）に相当する時刻ｔ_ｉｎを推定滞在期間の開始時刻とする。同様に、時系列上で最後のエリア内位置データの取得時刻ｔ_ｃと、該最後のエリア内位置データに隣接するエリア外位置データの取得時刻ｔ_ｙとの按分点（一例として中点）に相当する時刻ｔ_ｏｕｔを推定滞在期間の終了時刻とする。これにより、図８に長方形で示した期間、即ち、時刻ｔ_ｉｎから時刻ｔ_ｏｕｔまでの期間が、当該端末の推定滞在期間として算出される。

　そして、抽出部２４は、算出された推定滞在期間と観測期間とが重複する端末を抽出する（図７のステップＳ２）。図９には、拡張期間内に取得された端末Ａ～Ｅに関する一連の位置データを端末ごとに、取得時刻順に時系列に横軸方向に並べた図を示しており、この図９では、位置情報が観測エリア内を示すエリア内位置データを黒丸で、位置情報が観測エリア外を示すエリア外位置データを白丸でそれぞれ示している。仮に、取得時刻が観測期間（時刻ｔ_０～時刻ｔ_１）内にあるエリア内位置データにのみ着目すると、対応する端末としては端末Ｃ～Ｅの３つが抽出される。

　ところが、図９で長方形により示した推定滞在期間と観測期間（時刻ｔ_０～時刻ｔ_１）とが重複する端末としては、端末Ａ～Ｅの５つが挙げられるため、ステップＳ２では端末Ａ～Ｅの５つが抽出される。これにより、黒丸で示すエリア内位置データにのみ着目した場合に除外される端末Ａ、Ｂについても、観測期間中のどこかで観測エリア内に滞在していたと推定されることとなる。なお、上述したステップＳ１、Ｓ２における推定滞在期間を用いた方法は一例であり、他の方法を採用しても構わない。他の方法については後述する。

　次に、統計部２６が、ステップＳ１、Ｓ２により抽出された端末の数をカウントし、得られたカウント数を観測期間内における観測エリアの入込端末数として推計する（図７のステップＳ３）。

　次に、拡大係数付与部２５が、抽出された端末それぞれについて、対応する属性情報を基にして入込端末数を入込数に変換するための拡大係数を導出する（図７のステップＳ４）。また、端末契約率などの拡大係数が時刻に応じて変動する場合、拡大係数付与部２５は、推定滞在期間と観測期間とが重複する期間の先頭時刻を抽出し、得られた先頭時刻に対応する拡大係数を導出することが好適である。

　次に、統計部２６が、拡大係数付与部２５により導出された、端末ごとの位置データそれぞれについての拡大係数を集計し、得られた拡大係数の総和を観測期間内における観測エリアの入込数として推計する（図７のステップＳ５）。そして、統計部２６は、推計により得られた入込数を情報秘匿装置３１に出力する（図７のステップＳ６）。このとき、ステップＳ３で得られた入込端末数も併せて出力してもよい。

　また、上記実施形態では、拡大係数付与部２５が、属性情報に対応する契約率の逆数を拡大係数と付与しているが、端末の在圏率を反映した拡大係数を付与してもよい。例えば、拡大係数付与部２５は、在圏率を反映した拡大係数として、「所定範囲の地域における人口」に占める「位置データを得られた特定の通信事業者の契約端末数」の割合である「端末契約率」の逆数を用いることができる。この「位置データを得られた特定の通信事業者の契約端末数」は、格納部２２に格納された位置データから集計することができる。このような拡大係数は、住所区分毎、年齢層毎、性別毎、時間帯毎に計算することができる。

　また、情報秘匿装置３１による秘匿処理は以下のように実行されてもよい。

　情報秘匿装置３１は、統計部２６から推計値（推計人口など）を受け取ったときに、例えば図１０に示す秘匿処理を行う。即ち、判定部３２は、推計の基礎となったエリア（セル）ごとの位置データが何台の端末から取得されたかを示す取得元端末数が、秘匿処理が必要と判断するための予め定められた基準値（一例として１０）未満であるか否かを判定する（図１０のステップＳ６１）。なお、取得元端末数は、同一端末についての重複を除いたユニークな端末数を示す。ここでの判定を行うには、エリア（セル）ごとの位置データの取得元端末数が必要となるが、一例としては、集計部２７が、統計部２６によって位置データに対応付けられた特徴量が集計される際に、該位置データ中の識別情報（例えば、前述した非識別化位置データ生成部１６による非識別化処理後のハッシュ済み電話番号）の数をカウントし、得られたハッシュ済み電話番号総数の情報を判定部３２に渡し、判定部３２がハッシュ済み電話番号総数をエリア（セル）ごとの位置データの取得元端末数として用いてもよい。

　より具体的には、統計部２６がセクタＳからエリア区分へのエリア変換を実行している場合には、判定部３２は、集計部２７によって集計されるエリア区分毎の位置データの取得元端末数を判定する。例えば、あるエリア区分ＱがセクタＳＡとセクタＳＢに跨っていた場合に、集計対象の観測期間の間に、セクタＳＡでは、端末識別番号：ＩＤ１，ＩＤ２，ＩＤ３，ＩＤ４，ＩＤ５，ＩＤ６の６台の携帯端末２からの位置登録信号が観測され、セクタＳＢでは、端末識別番号：ＩＤ４，ＩＤ５，ＩＤ６，ＩＤ７，ＩＤ８の５台の携帯端末２からの位置登録信号が観測されたものとする。このような場合には、判定部３２の判定は、各セクタＳＡ，ＳＢ毎の取得元端末数の総和では無くて、エリア区分Ｑについて、その推計の基礎となった位置データが何台の端末から取得されたかを示すエリア区分Ｑの取得元端末数を用いて行われる。上記の例では、セクタＳＡではユニーク端末数：６、セクタＳＢではユニーク端末数５であるが、判定部３２が判定対象とする取得元端末数は、エリア区分Ｑについて算出された取得元端末数：８となる。仮に基準値が１０台であれば、取得元端末数が基準値未満となるので、判定部３２は、当該エリア区分Ｑの推計値を秘匿対象とする。

　ステップＳ６１にて、推計の基礎となったエリア（セル）ごとの位置データの取得元端末数が基準値未満ならば、出力部３３は当該エリア（セル）に関する推計値をゼロとすることで、当該推計値を秘匿する（ステップＳ６２）。なお、ここでの秘匿方法は、推計値をゼロとすることに限定されるものではなく、推計値を所定の文字や記号（例えば「Ｘ」など）で表象する方法など他の方法を採用してもよい。

　一方、ステップＳ６１にて、推計の基礎となったエリア（セル）ごとの位置データの取得元端末数が基準値以上ならば、出力部３３は当該エリア（セル）に関する推計値に対し、以下のような、推計値出力にて用いられる階級幅の確率的丸めを行う（ステップＳ６３）。即ち、あるエリア（セル）に関する推計値をｘ、階級幅をｋとすると、出力部３３は、ｋｎ≦ｘ＜ｋ（ｎ＋１）（ｎは整数）の場合に、当該推計値ｘを、確率（ｘ－ｋｎ）／ｋでｋ（ｎ＋１）に、確率（ｋ（ｎ＋１）－ｘ）／ｋでｋｎに丸める。

　例えば、推計値ｘが２３、階級幅ｋが１０の場合、ｋ×２≦ｘ＜ｋ（２＋１）なので、ｎ＝２となり、推計値「２３」は、確率0.3（３０％の確率）で「３０」に、確率0.7（７０％の確率）で「２０」に丸められる。

　以上のような情報秘匿装置３１による秘匿処理により、推計結果からの個人特定を防止して推計結果の有用性を高めることができる。また、秘匿した値が他の値から推測できてしまうといった不都合を未然に防止することができる。

　なお、確率的丸めにおける階級幅は、集計に用いた位置データのうち拡大係数が最大のものを抽出し、その拡大係数を所定倍（例えば１０倍）した値を階級幅として設定してもよい。また、予め階級幅を決定しておき、確率的丸めを実施してもよい。その際、拡大係数が予め定められた階級幅の所定割合（例えば1/10）を超える位置データを含むエリア（セル）のデータは捨てるといった処理規則を採用してもよい。

　また、情報秘匿装置３１による秘匿処理は、図１０に示す処理には限定されず、別の処理を採用してもよい。例えば、図１０のステップＳ６１では、「推計の基礎となったエリア（セル）ごとの位置データの取得元端末数」に代わり、「推計の基礎となったエリア（セル）ごとの位置データの個数」が基準値未満か否かを判定してもよいし、「出力される推計値（人口又は端末数）」が基準値未満か否かを判定してもよい。また、図１０のステップＳ６１で否定判定された場合には、ステップＳ６３の処理を省略してもよい。

　上記統計情報生成システムにおいては、予め定められた電子鍵情報を保持する鍵管理手段と、第１の識別情報及び第２の識別情報が入力されて、第１の識別情報及び第２の識別情報それぞれに対して、鍵管理手段が保持する電子鍵情報を用いた一方向関数を適用して、第１の非識別化情報及び第２の非識別化情報を出力する一方向演算手段と、位置情報蓄積データから第１の識別情報を削除するとともに、位置情報蓄積データに対して、一方向演算手段によって出力された第１の非識別化情報を第１の識別情報として付加して位置情報蓄積データを生成する非識別化位置データ生成手段と、属性情報蓄積データから第２の識別情報を削除するとともに、属性情報蓄積データに対して、一方向演算手段によって出力された第２の非識別化情報を第２の識別情報として付加して属性情報蓄積データを生成する非識別化属性データ生成手段と、をさらに備えることが好ましい。この場合、第１及び第２の識別情報により互いに対応づけられる位置情報蓄積データと属性情報蓄積データから、それぞれ第１及び第２の識別情報が取り除かれた上で第１及び第２の非識別化情報が付与される。この第１及び第２の非識別化情報は，予め保持された電子鍵情報と第１及び第２の識別情報を一方向性関数に代入することにより得られたものであり、非識別化情報から識別情報を逆算することはできない。また、一方向性関数が既知であったとしても、電子鍵の値が秘密にされている限り、識別情報を総当たりで一方向性関数に入力したとしても識別情報と非識別化情報の対応関係を知ることはできない。その結果、位置情報蓄積データや属性情報蓄積データに含まれる識別情報からの個人の識別を防止できる。また、識別情報は非識別化情報に置き換えられていることから、識別情報を用いた検索条件を与えることにより、特定個人の行動を開示させるような統計処理を実施することを未然に防ぐことができる。

　また、非識別化属性データ生成手段は、属性情報蓄積データに含まれる属性情報を、情報を抽象化した抽象化属性情報に置換し、抽出手段は、当該抽象化された抽象化属性情報と検索条件情報を照合することにより、非識別化属性情報蓄積データの一部を抽出する、ことが好ましい。こうすれば、抽象化された属性情報を単位にした統計データを得ることによって人口動態の概略を知ることができると共に、統計データを基にした個人の識別をより困難にすることができる。

　また、抽出手段は、位置情報蓄積データに対して、検索条件情報との一致率を示す確率情報を付与し、統計手段は、位置情報蓄積データに付与された確率情報に対して拡大係数を乗じることによって統計データを算出する、ことも好ましい。かかる構成を採れば、位置情報と検索条件との一致率が確率として得られる場合に、その確率が反映された統計データを得ることができ、全体の人口動態傾向が反映された統計データを得ることができる。

　また、抽出手段は、位置情報蓄積データを基にして、移動通信端末によって生成された位置情報に関する推定生成密度に対応する値を推計して特徴量として付与し、統計手段は、位置情報蓄積データに付与された滞在時間情報に対して拡大係数を乗じることによって統計データを算出する、ことも好ましい。かかる構成を採れば、セクタに存在する滞在時間を推計してその滞在時間が反映された統計データを得ることができ、全体の人口動態傾向が反映された統計データを得ることができる。

　本発明は、位置情報集計装置及び位置情報集計方法を使用用途とし、様々な誤差を生じる測位方式を用いた場合であっても、誤差の少ない高精度の人口分布を算出することができるものである。

　１…統計情報生成システム、２…携帯端末（移動通信端末）、１１…非識別化情報生成装置、１２…第１の入力部（第１の入力手段）、１３…第２の入力部（第２の入力手段）、１４…鍵管理部（鍵管理手段）、１５…一方向演算部（一方向演算手段）、１６…非識別化位置データ生成部（非識別化位置データ生成手段）、１７…非識別化属性データ生成部（非識別化属性データ生成手段）、２１…集計装置、２３…条件入力部（条件入力手段）、２４…抽出部（抽出手段）、２５…拡大係数付与部（拡大係数付与手段）、２６…統計部（統計手段）、２７…集計部（集計手段）、３１…情報秘匿装置、３２…判定部（判定手段）、３３…出力部（出力手段）。

Claims

　移動通信端末を識別する第１の識別情報と、該移動通信端末の位置に関する位置情報と、該位置情報が取得された時刻に関する時刻情報と、を含む位置情報蓄積データを入力する第１の入力手段と、
　移動通信端末を識別する第２の識別情報と、該移動通信端末の契約者に関する属性情報と、を含む属性情報蓄積データを入力する第２の入力手段と、
　前記位置情報蓄積データ及び前記属性情報蓄積データに対する検索条件情報を入力する条件入力手段と、
　前記検索条件情報を基に、前記位置情報蓄積データ及び前記属性情報蓄積データの一部を抽出する抽出手段と、
　前記抽出手段によって抽出された前記属性情報蓄積データに対して、前記属性情報蓄積データに含まれる属性情報に対応する係数であって、統計対象の数値への拡大度を示す拡大係数を付与する拡大係数付与手段と、
　前記抽出手段によって抽出された前記位置情報蓄積データと、前記抽出手段によって抽出され、前記位置情報蓄積データに含まれる前記第１の識別情報に対応する前記第２の識別情報を有する前記属性情報蓄積データと、該属性情報蓄積データに付与された前記拡大係数と、を用いて、人口に関する統計データを算出して出力する統計手段と、
　前記抽出手段によって抽出された前記位置情報蓄積データのデータ数を集計する集計手段と、
　前記集計手段によって集計された前記データ数を所定値と比較することによって前記データ数の大小を判定する判定手段と、
　前記判定手段によって前記データ数が大きいと判定された場合には、前記統計データを出力し、前記判定手段によって前記データ数が小さいと判定された場合には、前記統計データに含まれる数値を隠蔽して出力する出力手段と、
を備えることを特徴とする統計情報生成システム。
　前記集計手段は、前記抽出手段によって抽出された位置情報蓄積データ中のユニークな前記第１の識別情報の個数を前記データ数として集計する、
ことを特徴とする請求項１記載の統計情報生成システム。
　前記集計手段は、前記統計手段による集計単位であるエリア区分毎のユニークな前記第１の識別情報の個数を前記データ数として集計する、
ことを特徴とする請求項２記載の統計情報生成システム。
　予め定められた電子鍵情報を保持する鍵管理手段と、
　前記第１の識別情報及び前記第２の識別情報が入力されて、前記第１の識別情報及び前記第２の識別情報それぞれに対して、前記鍵管理手段が保持する前記電子鍵情報を用いた一方向関数を適用して、第１の非識別化情報及び第２の非識別化情報を出力する一方向演算手段と、
　前記位置情報蓄積データから前記第１の識別情報を削除するとともに、前記位置情報蓄積データに対して、前記一方向演算手段によって出力された前記第１の非識別化情報を前記第１の識別情報として付加して位置情報蓄積データを生成する非識別化位置データ生成手段と、
　前記属性情報蓄積データから前記第２の識別情報を削除するとともに、前記属性情報蓄積データに対して、前記一方向演算手段によって出力された前記第２の非識別化情報を前記第２の識別情報として付加して属性情報蓄積データを生成する非識別化属性データ生成手段と、
をさらに備えることを特徴とする請求項１～３のいずれか１項に記載の統計情報生成システム。
　前記非識別化属性データ生成手段は、前記属性情報蓄積データに含まれる属性情報を、情報を抽象化した抽象化属性情報に置換し、
　前記抽出手段は、当該抽象化された抽象化属性情報と前記検索条件情報を照合することにより、前記非識別化属性情報蓄積データの一部を抽出する、
ことを特徴とする請求項４記載の統計情報生成システム。
　前記抽出手段は、前記位置情報蓄積データに対して、検索条件情報との一致率を示す確率情報を付与し、
　前記統計手段は、前記位置情報蓄積データに付与された前記確率情報に対して前記拡大係数を乗じることによって前記統計データを算出する、
ことを特徴とする請求項１～５のいずれか１項に記載の統計情報生成システム。
　前記抽出手段は、前記位置情報蓄積データを基にして、前記移動通信端末によって生成された前記位置情報に関する推定生成密度に対応する値を推計して特徴量として付与し、
　前記統計手段は、前記位置情報蓄積データに付与された前記特徴量に対して前記拡大係数を乗じることによって前記統計データを算出する、
ことを特徴とする請求項１～５のいずれか１項に記載の統計情報生成システム。
　移動通信端末を識別する第１の識別情報と、該移動通信端末の位置に関する位置情報と、該位置情報が取得された時刻に関する時刻情報と、を含む位置情報蓄積データを入力する第１の入力手段と、
　移動通信端末を識別する第２の識別情報と、該移動通信端末の契約者に関する属性情報と、を含む属性情報蓄積データを入力する第２の入力手段と、
　予め定められた電子鍵情報を保持する鍵管理手段と、
　前記第１の識別情報及び前記第２の識別情報が入力されて、前記第１の識別情報及び前記第２の識別情報それぞれに対して、前記鍵管理手段が保持する前記電子鍵情報を用いた一方向関数を適用して、第１の非識別化情報及び第２の非識別化情報を出力する一方向演算手段と、
　前記位置情報蓄積データから前記第１の識別情報を削除するとともに、前記位置情報蓄積データに対して、前記一方向演算手段によって出力された前記第１の非識別化情報を付加して非識別化位置情報蓄積データを生成する非識別化位置データ生成手段と、
　前記属性情報蓄積データから前記第２の識別情報を削除するとともに、前記属性情報蓄積データに対して、前記一方向演算手段によって出力された前記第２の非識別化情報を付加して非識別化属性情報蓄積データを生成する非識別化属性データ生成手段と、
　前記非識別化位置情報蓄積データ及び前記非識別化属性情報蓄積データに対する検索条件情報を入力する条件入力手段と、
　前記検索条件情報を基に、前記非識別化位置情報蓄積データ及び前記非識別化属性情報蓄積データの一部を抽出する抽出手段と、
　前記抽出手段によって抽出された前記非識別化属性情報蓄積データに対して、前記非識別化属性情報蓄積データに含まれる属性情報に対応する係数であって、統計対象の数値への拡大度を示す拡大係数を付与する拡大係数付与手段と、
　前記抽出手段によって抽出された前記非識別化位置情報蓄積データと、前記抽出手段によって抽出され、前記非識別化位置情報蓄積データに含まれる前記第１の非識別化情報に対応する前記第２の非識別化情報を有する前記非識別化属性情報蓄積データと、該非識別化属性情報蓄積データに付与された前記拡大係数と、を用いて、人口に関する統計データを算出して出力する統計手段と、
　前記抽出手段によって抽出された前記非識別化位置情報蓄積データのデータ数を集計する集計手段と、
　前記集計手段によって集計された前記データ数を所定値と比較することによって前記データ数の大小を判定する判定手段と、
　前記判定手段によって前記データ数が大きいと判定された場合には、前記統計データを出力し、前記判定手段によって前記データ数が小さいと判定された場合には、前記統計データに含まれる数値を隠蔽して出力する出力手段と、
を備えることを特徴とする統計情報生成システム。
　第１の入力手段が、移動通信端末を識別する第１の識別情報と、該移動通信端末の位置に関する位置情報と、該位置情報が取得された時刻に関する時刻情報と、を含む位置情報蓄積データを入力する第１の入力ステップと、
　第２の入力手段が、移動通信端末を識別する第２の識別情報と、該移動通信端末の契約者に関する属性情報と、を含む属性情報蓄積データを入力する第２の入力ステップと、
　条件入力手段が、前記位置情報蓄積データ及び前記属性情報蓄積データに対する検索条件情報を入力する条件入力ステップと、
　抽出手段が、前記検索条件情報を基に、前記位置情報蓄積データ及び前記属性情報蓄積データの一部を抽出する抽出ステップと、
　拡大係数付与手段が、前記抽出手段によって抽出された前記属性情報蓄積データに対して、前記属性情報蓄積データに含まれる属性情報に対応する係数であって、統計対象の数値への拡大度を示す拡大係数を付与する拡大係数付与ステップと、
　統計手段が、前記抽出手段によって抽出された前記位置情報蓄積データと、前記抽出手段によって抽出され、前記位置情報蓄積データに含まれる前記第１の識別情報に対応する前記第２の識別情報を有する前記属性情報蓄積データと、該属性情報蓄積データに付与された前記拡大係数と、を用いて、人口に関する統計データを算出して出力する統計ステップと、
　集計手段が、前記抽出手段によって抽出された前記位置情報蓄積データのデータ数を集計する集計ステップと、
　判定手段が、前記集計手段によって集計された前記データ数を所定値と比較することによって前記データ数の大小を判定する判定ステップと、
　出力手段が、前記判定手段によって前記データ数が大きいと判定された場合には、前記統計データを出力し、前記判定手段によって前記データ数が小さいと判定された場合には、前記統計データに含まれる数値を隠蔽して出力する出力ステップと、
を備えることを特徴とする統計情報生成方法。