JP5490908B2

JP5490908B2 - 人口算出システム及び人口算出方法

Info

Publication number: JP5490908B2
Application number: JP2012534045A
Authority: JP
Inventors: 基成小林; 雅之寺田; 智大永田; 一郎岡島
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2010-09-15
Filing date: 2011-09-14
Publication date: 2014-05-14
Anticipated expiration: 2031-09-14
Also published as: EP2618299A1; JPWO2012036222A1; US20130090891A1; EP2618299A4; WO2012036222A1

Description

本発明の一形態は、秘匿化された人口を算出する人口算出システム及び人口算出方法に関する。

従来から、特定エリアの人口を求める方法が知られている。例えば下記特許文献１には、携帯端末をそれぞれ携帯する複数のユーザに関する人口分布を解析すべき領域を設定する領域設定手段と、複数の携帯端末のそれぞれの位置情報を取得する位置情報取得手段と、取得された前記位置情報に基づいて、設定された領域におけるユーザの人口分布を解析する解析手段と、を備えたことを特徴とする人口分布解析装置が開示されている。

特開２００３−３０３７３号公報

しかしながら、上記特許文献１に記載の装置等により人口に関する集計を行うと、その集計結果である人口データから個人が特定される場合があり、プライバシー等の点で問題が起こりうる。そこで、人口データにノイズを乗せて情報を隠し、その人口データを秘匿化することが求められる。しかし、人口データを秘匿化する際に必要以上に大きなノイズを乗せると、秘匿化前の人口データとの乖離が大きくなり、人口データの情報としての信頼性が落ちる可能性がある。

そこで本発明の一側面は、人口データの信頼性を一定以上に保ちつつ、人口を秘匿化して提示することが可能な人口算出システム及び人口算出方法を提供することを目的とする。

本発明の一形態に係る人口算出システムは、対象エリアの秘匿化された人口を算出する人口算出システムであって、対象エリアを含む測定エリアにおいてサンプルとして測定された測定人数を取得する取得手段と、取得手段により取得された測定人数と、測定人数から測定エリア内の人口を求めるための拡大係数とに基づいて、該測定エリアの人口を算出し、算出された測定エリアの人口に基づいて対象エリアの人口を算出する人口算出手段と、人口算出手段による算出処理の際に、測定エリアの人口又は対象エリアの人口を、最小集計単位の基準値である秘匿基準と拡大係数との積である階級幅に基づいて秘匿化する秘匿化手段と、秘匿化手段による秘匿化処理を経て得られた対象エリアの人口を該対象エリアの秘匿化人口として出力する出力手段と、を備えることを特徴とする。

本発明の一形態に係る人口算出方法は、対象エリアの秘匿化された人口を算出する人口算出システムにより実行される人口算出方法であって、人口算出システムが、対象エリアを含む測定エリアにおいてサンプルとして測定された測定人数を取得する取得ステップと、人口算出システムが、取得ステップにおいて取得された測定人数と、測定人数から測定エリア内の人口を求めるための拡大係数とに基づいて、該測定エリアの人口を算出し、算出された測定エリアの人口に基づいて対象エリアの人口を算出する人口算出ステップと、人口算出システムが、人口算出ステップにおける算出処理の際に、測定エリアの人口又は対象エリアの人口を、最小集計単位の基準値である秘匿基準と拡大係数との積である階級幅に基づいて秘匿化する秘匿化ステップと、人口算出システムが、秘匿化ステップにおける秘匿化処理を経て得られた対象エリアの人口を該対象エリアの秘匿化人口として出力する出力ステップと、を含むことを特徴とする。

このような形態によれば、測定した人数から測定エリア内の人口を求め、その人口に基づいて対象エリアの人口を求める際に、測定エリアの人口又は対象エリアの人口が秘匿基準及び拡大係数の積である階級幅に基づいて秘匿化される。このように、上記秘匿基準に基づく階級幅を用いて対象エリアの人口を離散的に求めることで、当該階級幅未満の端数を適度に丸め込むことができるので、人口データの信頼性を一定以上に保ちつつ、人口を秘匿化して提示することができる。

別の形態に係る人口算出システムでは、秘匿化手段が、人口算出手段により算出された対象エリアの人口を階級幅に基づいて秘匿化してもよい。

このような形態によれば、算出処理の際に、計算の最終結果である対象エリアの人口が階級幅に基づいて秘匿化されるので、人口データの信頼性を一定以上に保ちつつ、人口を秘匿化して提示することができる。

さらに別の形態に係る人口算出システムでは、秘匿化手段が、人口算出手段により算出された測定エリアの人口を階級幅に基づいて秘匿化し、人口算出手段が、秘匿化手段により秘匿化された測定エリアの人口と、秘匿化前の測定エリアの人口に対する対象エリアの人口の比との積を、秘匿化処理を経て得られた対象エリアの人口として算出してもよい。

このような形態によれば、算出処理の際に、計算の途中結果である測定エリアの人口が、階級幅に基づいて秘匿化され、秘匿化された測定エリアの人口と、秘匿化前の測定エリアの人口に対する対象エリアの人口の比との積が、秘匿化処理を経て得られた対象エリアの人口として算出される。このように、対象エリアよりも人口が多い測定エリアの人口を秘匿化してから、測定エリアの人口に対する対象エリアの人口の比を乗じて対象エリアの秘匿化された人口を算出することで、対象エリアの人口を直接秘匿化する場合に比べて、秘匿化前の人口データとの乖離を小さくすることができる。

さらに別の形態に係る人口算出システムでは、対象エリアと測定エリアとが同一であり、秘匿化手段が、人口算出手段により算出された測定エリアの人口を階級幅に基づいて秘匿化し、人口算出手段が、秘匿化手段により秘匿化された測定エリアの人口を、秘匿化処理を経て得られた対象エリアの人口として算出してもよい。

このような形態によれば、対象エリアと測定エリアが同一の場合、算出された測定エリアの人口が階級幅に基づいて秘匿化され、対象エリアの人口として算出される。このように、対象エリアと測定エリアが同一の場合でも、人口データの信頼性を一定以上に保ちつつ、人口を秘匿化して提示することができる。

さらに別の形態に係る人口算出システムでは、取得手段が、測定人数を複数の属性毎に取得し、人口算出手段が、複数の属性毎に設定された拡大係数に基づいて、測定エリアの人口及び対象エリアの人口を複数の属性毎に算出するとともに、前記複数の属性のうち少なくとも二つの属性についての測定エリアの人口の合計及び対象エリアの人口の合計を算出し、秘匿化手段が、測定エリアの合計人口又は対象エリアの合計人口を、秘匿基準と少なくとも二つの属性毎に設定された拡大係数のうち最大の拡大係数との積である階級幅に基づいて秘匿化してもよい。

このような形態によれば、測定エリアの人口及び対象エリアの人口が複数の属性毎に算出されるとともに、これら２つのエリアについて複数の属性のうち少なくとも二つの属性についての人口の合計が算出される。そして、測定エリア又は対象エリアの合計人口が、秘匿基準と少なくとも二つの属性毎に設定された拡大係数のうち最大の拡大係数との積である階級幅に基づいて秘匿化される。複数の属性の拡大係数のうち最大の拡大係数は、当該複数の属性のうち最も個人が特定されやすい属性の拡大係数であるが、そのような最大の拡大係数に基づいて、対象エリアの合計人口を秘匿化することで、個人が特定されるリスクを抑えることができる。さらに別の形態に係る人口算出システムでは、取得手段が、測定人数を複数の属性毎に取得し、人口算出手段が、複数の属性毎に設定された拡大係数に基づいて、測定エリアの人口及び対象エリアの人口を複数の属性毎に算出し、秘匿化手段が、測定エリアの人口又は対象エリアの人口を、複数の属性毎に秘匿基準と当該属性に設定された拡大係数との積である階級幅に基づいて秘匿化し、複数の属性全てについて足し合わせることで、秘匿化された測定エリアの合計人口又は秘匿化された対象エリアの合計人口を算出してもよい。

さらに別の形態に係る人口算出システムでは、秘匿化手段が、測定エリアの合計人口又は対象エリアの合計人口を、階級幅ではなく、階級幅とは異なる別の階級幅に基づいて秘匿化し、別の階級幅が、少なくとも二つの属性毎に設定された拡大係数を降順に並べた際の上位ｎ個（ｎは秘匿基準）の拡大係数の和であってもよい。

このような形態によれば、少なくとも二つの属性毎に設定された拡大係数を降順に並べた際の上位ｎ個（ｎは秘匿基準）の拡大係数の和を階級幅として秘匿化が行われる。これにより、秘匿化前の人口データとの乖離を小さくしつつ、秘匿化することができる。

さらに別の形態に係る人口算出システムでは、秘匿化手段が、階級幅に基づく秘匿化を実行する際に、人口を階級幅の整数倍に量子化してもよい。

このような形態によれば、人口を階級幅の整数倍に量子化することで秘匿化が行われる。これにより、秘匿化前の人口データとの乖離を小さくしつつ、秘匿化することができる。

さらに別の形態に係る人口算出システムでは、秘匿化手段が、人口を階級幅の整数倍に量子化することで人口を特定の階級に丸め込む際に、人口との差が最も小さい階級と人口との差が次に小さい階級とのうちどちらか一方の階級に、人口とそれぞれの階級との差に基づいて丸め込んでもよい。

このような形態によれば、人口を秘匿化する際に、人口と、その人口を丸め込む候補となる各階級との差が考慮されるので、秘匿化前の人口データとの乖離を小さくしつつ、秘匿化することができる。さらに別の形態に係る人口算出システムでは、秘匿化手段が、階級幅に基づく秘匿化を実行する際に、階級幅未満の人口を切り捨ててもよい。さらに別の形態に係る人口算出システムでは、秘匿化手段が、階級幅に基づく秘匿化を実行する際に、階級幅の大きさに応じた確率に基づいて人口をランダムな値にしてもよい。

さらに別の形態に係る人口算出システムでは、秘匿化手段が、別の階級幅に基づく秘匿化を実行する際に、人口を別の階級幅の整数倍に量子化してもよい。

このような形態によれば、人口を別の階級幅の整数倍に量子化することで秘匿化が行われる。これにより、秘匿化前の人口データとの乖離を小さくしつつ、秘匿化することができる。

さらに別の形態に係る人口算出システムでは、秘匿化手段が、人口を別の階級幅の整数倍に量子化することで人口を特定の階級に丸め込む際に、人口との差が最も小さい階級と人口との差が次に小さい階級とのうちどちらか一方の階級に、人口とそれぞれの階級との差に基づいて丸め込んでもよい。

このような形態によれば、人口を秘匿化する際に、人口と、その人口を丸め込む候補となる各階級との差が考慮されるので、秘匿化前の人口データとの乖離を小さくしつつ、秘匿化することができる。さらに別の形態に係る人口算出システムでは、秘匿化手段が、別の階級幅に基づく秘匿化を実行する際に、別の階級幅未満の人口を切り捨ててもよい。さらに別の形態に係る人口算出システムでは、秘匿化手段が、別の階級幅に基づく秘匿化を実行する際に、別の階級幅の大きさに応じた確率に基づいて人口をランダムな値にしてもよい。

さらに別の形態に係る人口算出システムでは、取得手段が、所定期間に測定エリア内で移動機から登録された位置情報のそれぞれについて、移動機が位置情報を登録した時刻、当該移動機が一つ前の位置情報を登録した時刻、及び当該移動機が一つ後の位置情報を登録した時刻、のうち二つ以上を用いて特徴量を算出し、特徴量の総和に基づいて測定エリア内の移動機の数を推計し、測定人数として取得してもよい。

このような形態によれば、特徴量に基づいて、より正確な測定人数を取得することができる。

さらに別の形態に係る人口算出システムでは、取得手段が、移動機から登録された位置情報のうち、移動機が位置情報を登録した時刻が集計される集計時間帯内又は集計時間帯を所定幅拡張した拡張期間内にある位置情報に基づいて、集計時間帯の少なくとも一部において測定エリアに滞在したと推定される移動機、又は当該移動機にて集計時間帯又は拡張期間内に生成された１つの位置情報を抽出し、抽出された移動機の数又は位置情報の数に基づいて、集計時間帯内における測定エリア内の移動機の数を推計し、測定人数として取得してもよい。

このような形態によれば、移動機の２重カウントを回避できるため、より正確な測定人数を取得することができる。

このような形態によれば、測定エリアの人口と対象エリアの人口とが求められ、秘匿化された測定エリアの人口と、秘匿化前の測定エリアの人口に対する対象エリアの人口の比との積が、対象エリアの秘匿化人口として出力される。このように、対象エリアよりも人口が多い測定エリアの人口を秘匿化してから、測定エリアの人口に対する対象エリアの人口の比を乗じて対象エリアの秘匿化された人口を算出することで、対象エリアの人口を直接秘匿化する場合に比べて、秘匿化前の人口データとの乖離を小さくすることができる。

このような人口算出システム及び人口算出方法によれば、人口データの信頼性を一定以上に保ちつつ、人口を秘匿化して提示することができる。

第１実施形態に係る人口算出システムの機能構成を示すブロック図である。第１実施形態に係る人口算出システムのハードウェア構成を示す図である。第１実施形態に係る測定エリア及び対象エリアの例を示す図である。（ａ）〜（ｃ）は図１に示すデータベースに記憶される情報の例を示す図である。図１に示すデータベースに記憶される情報の例を示す図である。第１実施形態に係る人口算出システムの処理を示すフローチャートである。第２実施形態に係る人口算出システムの機能構成を示すブロック図である。図７に示すデータベースに記憶される情報の例を示す図である。第２実施形態に係る人口算出システムの処理を示すフローチャートである。第２実施形態の変形例１に係る測定エリア及び対象エリアの例を示す図である。（ａ）〜（ｃ）は図７に示すデータベースに記憶される情報の例を示す図である。図７に示すデータベースに記憶される情報の例を示す図である。端末数推計（在圏数推計）の考え方を説明するための図である（その１）。端末数推計（在圏数推計）の考え方を説明するための図である（その２）。端末数推計（入込数推計）の考え方を説明するための図である（その１）。端末数推計（入込数推計）の考え方を説明するための図である（その２）。

以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は同等の要素には同一の符号を付し、重複する説明を省略する。

（第１実施形態）
まず、図１〜５を用いて、第１実施形態に係る人口算出システム１の機能及び構成を説明する。人口算出システム１は、特定のエリアの量子化された人口を算出するためのコンピュータシステムである。図１に示すように、人口算出システム１は機能的構成要素として取得部（取得手段）１０、第１算出部（人口算出手段）１１、第２算出部（人口算出手段）１２、量子化部（秘匿化手段）１３、出力部（出力手段）１４、及びデータベース１５を備えている。

この人口算出システム１は、図２に示すように、オペレーティングシステムやアプリケーション・プログラムなどを実行するＣＰＵ１０１と、ＲＯＭ及びＲＡＭで構成される主記憶部１０２と、メモリなどで構成される補助記憶部１０３と、データ通信を行う通信制御部１０４と、ディスプレイなどで構成される表示部１０５と、キーボードなどで構成される操作部１０６とで構成される。図１に示す各機能は、ＣＰＵ１０１及び主記憶部１０２の上に所定のプログラムを読み込ませ、ＣＰＵ１０１の制御の下で通信制御部１０４、表示部１０５及び操作部１０６を動作させるとともに、主記憶部１０２や補助記憶部１０３に対してデータの読み出し又は書き込みを行うことで実現される。データベースや処理に必要なデータは主記憶部１０２または補助記憶部１０３内に格納されている。

図１に戻って、取得部１０は、対象エリアを含む測定エリアにおいてサンプルとして測定された測定人数を取得する手段である。

対象エリアは、推定人口を算出する対象となる特定の地理範囲である。一方、測定エリアは、移動体通信網を構成する特定の基地局の通信可能範囲であり、本実施形態では複数のセクタで構成されている。対象エリア及び測定エリアの例を図３に示す。図３の例では、セクタＡ及びＢで構成される一つの測定エリア内に、対象エリアである矩形のメッシュＭが設けられている。なお、対象エリア及び測定エリアの形状などは限定されない。

移動機が特定の基地局の特定のセクタ内に入ると、移動機と基地局との通信により位置登録処理が行われ、移動機が当該セクタに在圏していることを示す位置情報が移動体通信網の所定のデータベース（図示せず）に記憶される。あるいは、移動機と基地局との定期的な通信により、位置登録処理が定期的に行われ、位置情報がそのデータベースに記憶される。したがって、例えばセクタＡ及びＢのそれぞれに関して０以上の位置情報がデータベースに登録され得る。また、移動体通信網内には、移動機のユーザに関するユーザ情報が登録されているデータベースも存在する。取得部１０は、これらのデータベースを参照することで、各セクタ内に存在するユーザ数（測定人数）をユーザ属性毎に集計（測定）する。このとき、取得部１０はセクタ内の移動機をユーザ数としてカウントしている。

取得部１０は、移動機に搭載されたＧＰＳ等により取得された移動機の位置情報に基づいて、測定人数を取得してもよい。ＧＰＳ等により取得された移動機の位置情報は、移動体通信網の所定のデータベースに記憶される。取得部１０は、このデータベースとユーザ情報が登録されているデータベースとを参照し、測定エリア内に位置する位置情報を集計することで、当該測定エリア内に存在するユーザ数をユーザ属性毎に集計する。また、測定エリアと対象エリアとが同じ、あるいはほぼ同じ地理範囲を示している場合、取得部１０は、測定エリアではなく対象エリア内に位置する位置情報を集計することで、測定人数として取得してもよい。なお、取得部１０が測定人数を取得する際の集計条件や集計方法は限定されない。

図４（ａ）の“ユーザ数”列は、取得部１０がセクタＡ及びＢにおいて取得した測定人数を示す。取得部１０は、測定人数を属性毎に取得してもよい。図４（ａ）の例では、ユーザ数を２種類の属性１及び２に分けて集計している。図４（ａ）では、属性を属性１及び属性２で抽象的に表現しているが、例えば、性別毎（男性、女性）や年齢層毎（１０代、２０代、３０代、…）などのような任意の切り口でユーザ数を集計してもよい。したがって、あるセクタについて作成されるレコードの個数も２つとは限らない。図４（ａ）の例では、“ユーザ数”列に示す通り、取得部１０は、セクタＡにおける属性１のユーザ数が５、セクタＡにおける属性２のユーザ数が１５２、セクタＢにおける属性１のユーザ数が５、及びセクタＢにおける属性２のユーザ数が５５であるという情報を取得している。取得部１０によって取得された図４（ａ）の情報は、取得部１０によりデータベース１５に記憶される。

データベース１５には、図４（ｂ）及び（ｃ）に示す情報が予め記憶されている。図４（ｂ）は、測定人数から測定エリア内の人口を求めるための拡大係数を示している。ここで、拡大係数とは、サンプル調査におけるサンプル率の逆数である。例えば、サンプル率が５０％の場合、拡大係数は２となる。つまり、拡大係数は、サンプルとして測定した人数を何倍すれば母集団における数になるかを表す数であり、測定人数に拡大係数を乗じることで測定エリア内の人口を算出することができる。図４の例では、例えば、セクタＡにおける属性１のユーザ数は５であり、属性１の拡大係数が２であるから、セクタＡにおける属性１の人口は、ユーザ数と拡大係数との積である５×２＝１０となる。

図４（ｃ）は、測定エリアと当該測定エリアに含まれる対象エリアとの面積比を示している。例えば、図４（ｃ）は、セクタＡに含まれるメッシュＭの面積はセクタＡの面積の３０％であり、セクタＢに含まれるメッシュＭの面積はセクタＢの面積の２０％であることを示している。

第１算出部１１は、取得部１０により取得された測定人数と、測定人数から測定エリア内の人口を求めるための拡大係数とに基づいて、該測定エリアの人口を算出する手段である。第１算出部１１は、属性毎に設定された拡大係数に基づいて、測定エリアの人口を属性毎に算出してもよい。

第１算出部１１は、セクタＡにおける属性１の人口として、セクタＡにおける属性１のユーザ数と属性１の拡大係数との積である５×２＝１０を算出する。同様に、第１算出部１１は、セクタＡにおける属性２の人口として１５２×２．５＝３８０、セクタＢにおける属性１の人口として５×２＝１０、セクタＢにおける属性１の人口として５５×２．５＝１３７．５を算出する。第１算出部１１は、これら計算結果を、図４（ａ）に示すテーブルの“人口”列のようにデータベース１５に記憶する。

第２算出部１２は、算出された測定エリアの人口に基づいて対象エリアの人口を算出する手段である。第２算出部１２は、対象エリアの人口を属性毎に算出してもよい。

第２算出部１２は、メッシュＭにおける属性１の人口として、セクタＡにおける属性１の人口と、セクタＢにおける属性１の人口と、セクタＡとセクタＡに含まれるメッシュＭとの面積比と、セクタＢとセクタＢに含まれるメッシュＭとの面積比とから、１０×０．３＋１０×０．２＝５を算出する。同様に、第２算出部１２は、メッシュＭにおける属性２の人口として、３８０×０．３＋１３７．５×０．２＝１４１．５を算出する。また、第２算出部１２は、メッシュＭの全属性の人口の合計である５＋１４１．５＝１４６．５を、メッシュＭの合計人口として算出する。第２算出部１２は、これらの計算結果を、図５に示すテーブルの“Ｍ人口”（メッシュＭの人口を示す）列のようにデータベース１５に記憶する。

量子化部１３は、第２算出部１２による算出処理の際に、対象エリアの人口を、最小集計単位の基準値である秘匿基準と前記拡大係数との積である階級幅に基づいて秘匿化する手段である。本実施形態では、量子化部１３は、対象エリアの人口を階級幅の整数倍に量子化するものとして説明するが、秘匿化の方法はこれに限定されない。

量子化部１３は、まず、秘匿基準と属性の拡大係数との積である階級幅を算出する。ここで、秘匿基準とは、集計単位における最少人数の基準値である。例えば、ユーザ数を集計した結果、ユーザ数が数人となった場合、個人が容易に特定される可能性がある。そのため、集計した結果、ユーザ数が所定の人数以下にならないようにすることで、当該所定の人数以下の個人が特定されないような集計が可能になる。この所定の人数が秘匿基準である。本実施形態では、属性の種類やエリアに依らず秘匿基準を一律に１０とする。

属性１の人口を求める場合には、量子化部１３は、属性１の階級幅として１０×２＝２０を算出する。次に、量子化部１３は、メッシュＭにおける属性１の人口である５を、階級幅である２０の整数倍に量子化する。量子化部１３は、人口を階級幅の整数倍に量子化することで人口を特定の階級に丸め込む際に、人口との差が最も小さい階級と人口との差が次に小さい階級とのうちどちらか一方の階級に丸め込む。ここで、人口との差が最も小さい階級は０（差は５）、人口との差が次に小さい階級は２０（差は１５）である。これら２つの階級のうち、値の小さい階級（０）を下値、値が大きい階級（２０）を上値とする。本実施形態では、量子化部１３は、丸め込む人口を下値に丸め込むものとする。よって、量子化部１３は、メッシュＭにおける属性１の人口である５を０に量子化する。同様に、量子化部１３は、メッシュＭにおける属性２の人口である１４１．５を、属性２の階級幅である１０×２．５＝２５の整数倍に基づき、１２５に量子化する。

量子化部１３は、対象エリアの合計人口を、秘匿基準と属性毎に設定された拡大係数のうち最大の拡大係数との積である階級幅の整数倍に量子化してもよい。

属性１及び２に設定された拡大係数のうち最大の拡大係数は属性２の２．５であるため、量子化部１３は、合計人口に対する階級幅として１０×２．５＝２５を算出する。次に、量子化部１３は、メッシュＭの合計人口である１４６．５を、階級幅である２５の整数倍に量子化した１２５を算出する。

本実施形態では、量子化部１３は丸め込む人口を下値に丸め込んでいるが、丸め込みの方法はこれに限定されない。例えば、量子化部１３は、人口を切り上げて上値に丸め込んでもよい。また、量子化部１３は、人口を上値及び下値のうち人口との差が小さい方に一方的に丸め込んでもよいし、人口を上値及び下値のうちランダムにどちらか一方に丸め込んでもよい。

さらに量子化部１３は、人口を階級幅の整数倍に量子化することで人口を特定の階級に丸め込む際に、人口との差が最も小さい階級と人口との差が次に小さい階級とのうちどちらか一方の階級に、人口とそれぞれの階級との差に基づいて丸め込んでもよい。

以下では、丸め込む人口が上値に近いときは上値に丸め込む確率を高くし、下値に近いときは下値に丸め込む確率を高くしてランダムに丸め込む方法を示す。丸め込む人口をｅ、下値をｒ１、及び上値をｒ２として、人口ｅをｒ１に丸め込む確率を（ｒ２−ｅ）／（ｒ２−ｒ１）とし、人口ｅをｒ２に丸め込む確率を（ｅ−ｒ１）／（ｒ２−ｒ１）とする。例えば、メッシュＭにおける属性１の人口を丸め込む場合、ｅ＝５、ｒ１＝０、及びｒ２＝２０なので、量子化部１３がメッシュＭにおける属性１の人口を下値に丸め込む確率は（２０−５）／（２０−０）＝７５（％）、上値に丸め込む確率は（５−０）／（２０−０）＝２５（％）となる。

量子化部１３は、上記のような階級幅を用いずに、属性毎に設定された拡大係数を降順に並べた際の上位ｎ個（ｎは秘匿基準）の拡大係数の和を別の階級幅として用いて、対象エリアの合計人口を量子化してもよい。

例えば、あるエリアにいる１０人の拡大係数がそれぞれ１０、５、２、５、３、１、２、４、６、及び３であるとする。ここで秘匿基準が３の場合、量子化部１３は、上記１０人のうち拡大係数順に上位３人分の拡大係数である１０、６、及び５の和である２１を別の階級幅とする。そして量子化部１３は、当該別の階級幅の整数倍に合計人口を量子化する。ここで、量子化部１３が、階級幅を秘匿基準と最大の拡大係数との積として算出する場合、階級幅は３×１０＝３０となり、上記の通り、別の階級幅である２１とした方が量子化前後で人口データの乖離が小さくなる。なお、最大の拡大係数を持つ属性の人数が秘匿基準以上の場合は、上記別の階級幅は最大の拡大係数を用いる場合と同じになる。

出力部１４は、量子化部１３による量子化（秘匿化）処理を経て得られた対象エリアの人口を該対象エリアの秘匿化人口として出力する手段である。

具体的には、出力部１４は、量子化された人口を図５の“秘匿化後Ｍ人口”列のようにデータベース１５に記憶する。図５の例では、メッシュＭにおける属性１及び２の人口、及び合計人口である０、１２５、１２５がデータベース１５に記憶されている。なお、秘匿化人口の出力方法は限定されない。出力部１４は、秘匿化人口を、ディスプレイなどの表示部１０５に出力してもよいし、ネットワークで接続された他のシステムに出力してもよい。

次に、図６を用いて、図１に示す人口算出システム１の動作を説明するとともに本実施形態に係る人口算出方法について説明する。

まず、取得部１０が、メッシュＭを含むセクタＡ及びＢにおけるユーザ数を取得する（ステップＳ１１、取得ステップ）。次に、第１算出部１１が、ステップＳ１１にて取得したユーザ数と、拡大係数とに基づいて、セクタＡ及びＢの人口を算出し、第２算出部１２が、算出されたセクタＡ及びＢの人口に基づいて、メッシュＭの人口を算出する（ステップＳ１２、人口算出ステップ）。次に、量子化部１３が、ステップＳ１２にて算出したメッシュＭの人口を、秘匿基準と拡大係数との積である階級幅に基づいて秘匿化する（ステップＳ１３、秘匿化ステップ）。次に、出力部１４が、ステップＳ１３にて秘匿化したメッシュＭの人口を、メッシュＭの秘匿化人口として出力する（ステップＳ１４、出力ステップ）。

以上説明したように、本実施形態によれば、測定した人数からセクタＡ及びＢ内の人口を求め、その人口に基づいてメッシュＭの人口を求める際に、セクタＡ及びＢの人口又はメッシュＭの人口が秘匿基準及び拡大係数の積である階級幅の整数倍に量子化される。このように、上記秘匿基準に基づく階級幅を用いてメッシュＭの人口を離散的に求めることで、当該階級幅未満の端数を適度に丸め込むことができるので、人口データの信頼性を一定以上に保ちつつ、人口を秘匿化して提示することができる。

また本実施形態によれば、セクタＡ及びＢの人口及びメッシュＭの人口が属性毎に算出されるとともに、これら２つのエリアについて全属性の人口の合計が算出される。そして、セクタＡ及びＢ又はメッシュＭの合計人口が、秘匿基準と属性毎に設定された拡大係数のうち最大の拡大係数との積である階級幅の整数倍に量子化される。各属性の拡大係数のうち最大の拡大係数は、各属性のうち最も個人が特定されやすい属性の拡大係数であるが、そのような最大の拡大係数に基づいて、対象エリアの合計人口を秘匿化することで、個人が特定されるリスクを抑えることができる。

また本実施形態によれば、属性毎に設定された拡大係数を降順に並べた際の上位ｎ個（ｎは秘匿基準）の拡大係数の和を階級幅として量子化が行われる。これにより、量子化前の人口データとの乖離を小さくしつつ、量子化することができる。

また本実施形態によれば、人口を量子化する際に、人口と、その人口を丸め込む候補となる各階級との差が考慮されるので、量子化前の人口データとの乖離を小さくしつつ、量子化することができる。

なお、メッシュＭの全属性の合計人口を量子化する場合に限らず、当該メッシュＭにおける、３以上の属性のうち少なくとも二つの属性についての合計人口を量子化する場合であっても、上述した最大の拡大係数あるいは別の階級幅を同様に設定することができる。例えば、量子化部１３は、メッシュＭにおける、属性１〜５のうち三つの属性１、３、５についての合計人口を求める際に、秘匿基準と当該属性１、３、５の拡大係数のうち最大の拡大係数との積である階級幅を用いて量子化処理を実行してもよい。また、量子化部１３は、同様の場合に、属性１、３、５に属する人の拡大係数を降順に並べた際の上位ｎ個の拡大係数の和を階級幅として、量子化を実行してもよい。

（第２実施形態）
次に、図３、４、７、及び８を用いて、第２実施形態に係る人口算出システム１Ａの機能及び構成を説明する。図７に示すように、人口算出システム１Ａは、第１実施形態における量子化部１３に代えて量子化部１３Ａ、出力部１４に代えて出力部１４Ａを備え、さらに第３算出部１６（人口算出手段）を備える。本実施形態の他の構成は、第１実施形態と同じなので、説明を省略する。また、人口算出システム１Ａのハードウェア構成や当該ハードウェア構成による各機能的構成要素の実現方法も第１実施形態と同様なので、その説明も省略する。

第２実施形態に係る人口算出システム１Ａは、第１実施形態と同様に、図３に示すセクタＡ及びＢに含まれるメッシュＭの秘匿化された人口を算出するものとする。また、図４（ｂ）及び（ｃ）に示す初期値が与えられ、取得部１０により図４（ａ）に示す“ユーザ数”列の値が取得され、第１算出部１１により同図に示す“人口”列の値が取得されたものとする。また、第２算出部１２は、第１実施形態と同様に、メッシュＭの人口を算出し、算出結果を図８に示すテーブルの“Ｍ人口”列のようにデータベース１５に記憶したものとする。

第１算出部１１は、セクタＡ及びＢ（セクタＡ＋Ｂともいう）における属性１の人口として、図４（ａ）の“人口”列の値を利用して、１０＋１０＝２０を算出する。同様に、第１算出部１１は、セクタＡ＋Ｂにおける属性２の人口として３８０＋１３７．５＝５１７．５を算出する。また、第１算出部１１は、セクタＡ＋Ｂにおける全属性の人口として、２０＋５１７．５＝５３７．５を算出する。第１算出部１１は、これらの計算結果を、図８に示すテーブルの“Ａ＋Ｂ人口”（セクタＡ＋Ｂの人口を示す）列のようにデータベース１５に記憶する。

量子化部１３Ａは、第１算出部１１による算出処理の際に、測定エリアの人口を、秘匿基準と拡大係数との積である階級幅に基づいて秘匿化する手段である。本実施形態では、量子化部１３Ａは、対象エリアの人口を階級幅の整数倍に量子化するものとして説明するが、秘匿化の方法はこれに限定されない。

量子化部１３Ａは、セクタＡ＋Ｂにおける属性１の人口である２０を、階級幅である１０×２＝２０を利用して、２０に量子化する。同様に、量子化部１３Ａは、セクタＡ＋Ｂにおける属性２の人口である５１７．５を、階級幅である１０×２．５＝２５を利用して、５００に量子化する。

量子化部１３Ａは、測定エリアの全属性の合計人口を、秘匿基準と属性毎に設定された拡大係数のうち最大の拡大係数との積である階級幅の整数倍に量子化してもよい。

属性１及び２に設定された拡大係数のうち最大の拡大係数は属性２の２．５であるため、量子化部１３Ａは、階級幅として１０×２．５＝２５を算出する。次に、量子化部１３Ａは、セクタＡ＋Ｂにおける合計人口である５３７．５を、階級幅である２５の整数倍に量子化した５２５を算出する。量子化部１３Ａが量子化したセクタＡ＋Ｂにおける人口は、量子化部１３Ａにより、図８の“量子化後Ａ＋Ｂ人口”（量子化されたセクタＡ＋Ｂの人口を示す）列のようにデータベース１５に記憶される。

なお、量子化部１３Ａは、上記の量子化において、人口を下値に切り下げて丸め込んだが、丸め込みの方法はこれに限るものではない。例えば、量子化部１３Ａは、第１実施形態と同様に、人口を上値に切り上げて丸め込んでもよいし、人口と階級との差が小さい下値に丸め込んでもよいし、ランダムにどちらかの階級に丸め込んでもよい。

また、量子化部１３Ａは、第１実施形態の量子化部１３と同様に、セクタＡ＋Ｂにおける全属性の人口を、属性毎に設定された拡大係数順に上位秘匿基準人分の拡大係数の和である階級幅の整数倍に量子化してもよい。

第３算出部１６は、量子化部１３Ａにより量子化された測定エリアの人口と、量子化前の測定エリアの人口に対する対象エリアの人口の比であるエリア人口比との積を、量子化処理を経て得られた対象エリアの人口として算出する手段である。

第３算出部１６は、属性１において、量子化部１３Ａにより量子化されたセクタＡ＋Ｂの人口である２０と、エリア人口比である５／２０との積として、２０×（５／２０）＝５を算出する。同様に、第３算出部１６は、属性２において、上記積として、５００×（１４１．５／５１７．５）＝１３６．７を算出する。同様に、第３算出部１６は、セクタＡ＋Ｂにおける全属性の人口について、上記積として５２５×（１４６．５／５３７．５）＝１４３．０を算出する。なお、本実施形態では、小数点以下第２位を切り捨てる。

出力部１４Ａは、量子化（秘匿化）処理を経て得られた対象エリアの人口を該対象エリアの秘匿化人口として出力する。

具体的には、出力部１４Ａは、量子化された人口を図８の“秘匿化後Ｍ人口”列のようにデータベース１５に記憶する。図８の例では、メッシュＭにおける属性１及び２の人口、及び合計人口である５、１３６．７、１４３．０がデータベース１５に記憶されている。なお、秘匿化人口の出力方法は限定されない。出力部１４Ａは、秘匿化人口を、ディスプレイなどの表示部１０５に出力してもよいし、ネットワークで接続された他のシステムに出力してもよい。

ここで、図８に示すテーブルの“秘匿化後Ｍ人口”の値に着目すると、属性１及び２の人口を単純に足すと５＋１３６．７＝１４１．７となり、秘匿化された合計人口である１４３．０と一致しない。このように、人口の秘匿化後において、合計人口は必ずしも各属性の人口合計値と一致しない。これにより、例えば、全属性の秘匿化後の人口と属性２の秘匿化後の人口が公開されている場合でも、これらの差を求めて属性１の秘匿化後の人口を知ることができないので、個人が特定されるリスクを抑えることができる。

次に、図９を用いて、図７に示す人口算出システム１Ａの動作を説明するとともに本実施形態に係る人口算出方法について説明する。

まず、取得部１０が、メッシュＭを含むセクタＡ及びＢにおけるユーザ数を取得する（ステップＳ３１、取得ステップ）。次に、第１算出部１１が、ステップＳ３１にて取得したユーザ数と、拡大係数とに基づいて、セクタＡ及びＢの人口を算出する（ステップＳ３２、人口算出ステップ）。次に、第２算出部１２が、ステップＳ３２にて算出されたセクタＡ及びＢの人口に基づいて、メッシュＭの人口を算出する（ステップＳ３３、人口算出ステップ）。次に、量子化部１３Ａが、ステップＳ３２にて算出したセクタＡ＋Ｂの人口を、秘匿基準と拡大係数との積である階級幅に基づいて秘匿化する（ステップＳ３４、秘匿化ステップ）。次に、第３算出部１６が、ステップＳ３４にて秘匿化したセクタＡ＋Ｂの人口と、ステップＳ３２にて算出したセクタＡ＋Ｂの人口に対するステップＳ３３にて算出したメッシュＭの人口の比との積を算出する（ステップＳ３５、第３算出ステップ）。次に、出力部１４Ａが、ステップＳ３５にて算出した積を、メッシュＭの秘匿化人口として出力する（ステップＳ３６、出力ステップ）。

以上説明したように、本実施形態によれば、算出処理の際に、計算の途中結果であるセクタＡ及びＢの人口が、最小集計単位の基準値である秘匿基準と拡大係数との積である階級幅の整数倍に量子化され、量子化されたセクタＡ及びＢの人口と、エリア人口比との積が量子化処理を経て得られたメッシュＭの人口として算出される。メッシュＭの人口を直接秘匿化する場合でも人口データの信頼性を一定以上に保ちつつ人口を秘匿化することが可能であるが、このように、メッシュＭよりも人口が多いセクタＡ及びＢの人口を秘匿化してから、エリア人口比を乗じてメッシュＭの秘匿化された人口を算出することで、上記のようにメッシュＭの人口を直接秘匿化する場合に比べて、秘匿化前の人口データとの乖離をさらに小さくすることができる。

なお、メッシュＭとセクタＡ＋Ｂが同一、あるいはほぼ同一の地理範囲を示す場合、第３算出部１６は、量子化部１３Ａにより量子化されたセクタＡ＋Ｂの人口を、メッシュＭの人口として算出し、出力部１４Ａは、該メッシュＭの人口を秘匿化人口として出力してもよい。このようにメッシュＭとセクタＡ＋Ｂが同一の地理範囲を示す場合でも、人口データの信頼性を一定以上に保ちつつ、人口を秘匿化して提示することができる。このような処理は、量子化された測定エリア人口にエリア人口比「１」を乗じて秘匿化人口を求める処理と実質的に同じである。

また、セクタＡ＋Ｂの全属性の合計人口を量子化する場合に限らず、当該セクタＡ＋Ｂにおける、３以上の属性のうち少なくとも二つの属性についての合計人口を量子化する場合であっても、上述した最大の拡大係数あるいは別の階級幅を同様に設定することができる。例えば、量子化部１３Ａは、セクタＡ＋Ｂにおける、属性１〜５のうち三つの属性１、３、５についての合計人口を求める際に、秘匿基準と当該属性１、３、５の拡大係数のうち最大の拡大係数との積である階級幅を用いて量子化処理を実行してもよい。また、量子化部１３Ａは、同様の場合に、属性１、３、５に属する人の拡大係数を降順に並べた際の上位ｎ個の拡大係数の和を階級幅として、量子化を実行してもよい。

（第２実施形態の変形例１）
次に、図１０〜１２を用いて、第２実施形態に係る人口算出システム１Ａの変形例１について説明する。本変形例において、人口算出システム１Ａは、図１０に示すように、単一の測定エリアであるセクタＣに含まれている対象エリアであるメッシュＮの秘匿化人口を算出する。図１１及び１２の各列については図４及び図５と同様のため説明を省略する。

取得部１０は、図１１（ａ）に示す通り、セクタＣにおける属性１のユーザ数として５、セクタＣにおける属性２のユーザ数として１５２を取得する。

第１算出部１１は、セクタＣにおける属性１の人口として、セクタＣにおける属性１のユーザ数と属性１の拡大係数との積である５×２＝１０を算出する。同様に、第１算出部１１は、セクタＣにおける属性２の人口として１５２×２．５＝３８０を算出する。また、第１算出部１１は、セクタＣにおける全属性の人口として１０＋３８０＝３９０を算出する。

第２算出部１２は、メッシュＮにおける属性１の人口として、１０×０．３＝３を算出する。同様に、第２算出部１２は、メッシュＮにおける属性２の人口として、３８０×０．３＝１１４を算出する。また、第２算出部１２は、メッシュＮにおける全属性の人口として、３＋１１４＝１１７を算出する。

量子化部１３ＡはセクタＣにおける属性１の人口である１０を、階級幅である１０×２＝２０の整数倍で量子化し、０を算出する。同様に、量子化部１３ＡはセクタＣにおける属性２の人口である３８０を、階級幅である１０×２．５＝２５の整数倍で量子化し、３７５を算出する。同様に、量子化部１３ＡはセクタＣの全属性の人口である３９０を、最大の拡大係数を用いて算出された階級幅である１０×２．５＝２５の整数倍で量子化し、３７５を算出する。

第３算出部１６は、メッシュＮにおける属性１の人口として０×（３／１０）＝０を算出し、メッシュＮにおける属性２の人口として３７５×（１１４／３８０）＝１１２．５を算出し、メッシュＮの合計人口として３７５×（１１７／３９０）＝１１２．５を算出する。

出力部１４Ａは、メッシュＮにおける属性１及び２の秘匿化後人口、及び秘匿化後合計人口である０、１１２．５、１１２．５を出力する。

なお、第１実施形態の人口算出システム１も、図１０に示すメッシュＮの秘匿化人口を求めることが可能である。本発明に係る人口算出システムは、２以上の測定エリアに跨っている対象エリアの秘匿化人口を求めることも、単一の測定エリアに含まれる対象エリアの秘匿化人口を求めることもできる。秘匿化人口を求める手順は、測定エリアと対象エリアとの位置関係に関係なく同じである。

（第２実施形態の変形例２）
次に、第２実施形態に係る人口算出システム１Ａの変形例２について説明する。本変形例において、人口算出システム１Ａは、秘匿化部（秘匿化手段）をさらに備える。

秘匿化部は、第１算出部１１により算出された測定エリアの人口を秘匿化する。
秘匿化の方法は特定の方法に限るものではない。秘匿化の方法の一例として、第２実施形態における量子化部１３Ａの量子化の方法が挙げられる。

秘匿化部による秘匿化の方法の別の一例として、秘匿基準、または秘匿基準と最大の拡大係数との積より小さい値を切り捨てる方法が挙げられる。例えば、測定エリアの人口が５の場合、秘匿基準である１０より小さいので秘匿化部により切り捨てられ、最終的に秘匿化人口は出力されない。逆に、例えば、測定エリアの人口が２０の場合、秘匿基準である１０以上であるので秘匿化部により切り捨てられず、秘匿化された測定エリアの人口は２０となる。

秘匿化部による秘匿化の方法の別の一例として、拡大係数を決めている単位である単位属性ごとに特定の秘匿化法で秘匿化し、足し合わせる方法が挙げられる。ここで、第２実施形態において、図８のように、量子化部１３Ａは、Ａ＋Ｂにおける合計人口である５３７．５を階級幅である２５の整数倍に量子化した５２５を、全属性の量子化後のＡ＋Ｂ人口として算出している。この量子化の方法に換えて、例えば、秘匿化部は、属性１のＡ＋Ｂ人口である２０を属性１の階級幅である２０の整数倍に量子化した２０と、属性２のＡ＋Ｂ人口である５１７．５を属性２の階級幅である２５の整数倍に量子化した５００とを足した５２０を、全属性の量子化後のＡ＋Ｂ人口として算出する。この秘匿化の方法により、秘匿化部は、単位属性を秘匿化した値を足し合わせることで、単位属性が複数含まれる複合属性を秘匿化することができる。

秘匿化部による秘匿化の方法の別の一例として、第２実施形態における階級幅を設定せずに、乱数により値をぶれさせる方法が挙げられる。第２実施形態において、量子化部１３は、人口を階級幅の整数倍に量子化することで人口を特定の階級に丸め込む際に、人口を上値または下値に丸め込んでいる。一方、乱数により値をぶれさせる秘匿化の方法では、例えば、階級幅に応じた大きさの分散を持つ確率密度関数に応じた確率で、ランダムな値に人口が秘匿化される。

秘匿化部による秘匿化の方法の別の一例として、人口を秘匿基準と拡大係数との積である階級幅の実数倍に秘匿化する方法が挙げられる。ここで、例えば、階級幅をｙ、整数をｚとすると、第１実施形態及び第２実施形態において、それぞれ量子化部１３及び量子化部１３Ａは、人口を０、ｙ、２ｙ、３ｙ、…、ｚｙ、…に秘匿化している。この秘匿化の方法に換えて、例えば、量子化部１３及び量子化部１３Ａは、人口を０、１．１ｙ、２．２ｙ、３．３ｙ、…、１．１ｚｙ、…に秘匿化する。

秘匿化部による秘匿化の方法の別の一例として、人口を秘匿基準と拡大係数との積である階級幅の整数倍に所定の実数を加えた値に秘匿化する方法が挙げられる。ここで、例えば、階級幅をｙ、整数をｚとすると、第１実施形態及び第２実施形態において、それぞれ量子化部１３及び量子化部１３Ａは、人口を０、ｙ、２ｙ、３ｙ、…、ｚｙ、…に秘匿化している。この秘匿化の方法に換えて、例えば、量子化部１３及び量子化部１３Ａは、人口を０、０．５、ｙ＋０．５、２ｙ＋０．５、３ｙ＋０．５、…、ｚｙ＋０．５、…に秘匿化する。

なお、本第２実施形態の変形例２で挙げた秘匿化部による秘匿化の方法の全ては、第１実施形態でも適用可能である。

出力部１４Ａは、秘匿化部により秘匿化された測定エリアの人口と、秘匿化前の測定エリアの人口に対する第２算出部１２により算出された対象エリアの人口の比であるエリア人口比との積を、対象エリアの秘匿化人口として出力する。秘匿化された測定エリアの人口とエリア人口比との積の算出の具体例は、第２実施形態における第３算出部１６の算出内容と同様のため、説明を省略する。

以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。

人口算出システム１及び１Ａは、１台のコンピュータで構成されてもよいし、複数台のコンピュータで構成されてもよい。人口算出システム１及び１Ａを複数のコンピュータで構成する場合には、サーバ間でそれぞれの機能的構成要素の入出力を送受信することで、人口算出システム１及び１Ａの機能を実現してもよい。

上記各実施形態では、第１算出部１１及び第２算出部１２が、測定人数と拡大係数とに基づいて測定エリアの人口を算出し、算出された測定エリアの人口に基づいて対象エリアの人口を算出したが、対象エリアの人口の算出手順はこれに限るものではない。例えば、人口算出手段が、測定人数と測定エリアに対する対象エリアの面積比とに基づいて対象エリアの測定人数を算出し、算出された対象エリアの測定人数と拡大係数とに基づいて対象エリアの人口を算出してもよい。

上記各実施形態では測定エリアを移動体通信における空間的なセクタとしたが、これに限定されない。例えば、測定エリアとしてテレビ番組の視聴率調査における実際の視聴率調査対象世帯が挙げられる。このように、測定エリアは、サンプルとして人数が測定可能な領域であればよい。

また、上記各実施形態では人口算出システム１及び１Ａにおいて機能的構成要素が算出した一時的なデータをデータベース１５に記憶するとしたが、作業用メモリやデータベースシステムなどに記憶してもよい。

また、上記各実施形態の人口算出システム１及び１Ａは、秘匿化された人口を算出するが、人口の算出以外にも本発明を適用できる。例えば、データの信頼性を一定以上に保ちつつ、データを秘匿化して提示する分野のコンピュータシステムにも適用してもよい。

また、上記各実施形態の人口算出システム１及び１Ａは、取得部１０がユーザ数を取得する際、移動体通信網の所定のデータベースを参照することでユーザ数を集計して取得するとしたが、これに限定されない。例えば、アンケートの集計データのように、予め集計された静的な集計データから測定人数を取得してもよい。

また、上記各実施形態の人口算出システム１及び１Ａにおいて、取得部１０が位置情報やユーザ情報が登録されているデータベースを参照して集計する際に、取得部１０は、位置情報やユーザ情報に含まれるユーザ識別子（例えば電話番号）に対し、一方向性関数による不可逆符号への変換を含む非識別化処理を行ってもよい。この一方向性関数として、国内外の評価プロジェクトや評価機関により推奨されているハッシュ関数に基づく鍵付ハッシュ関数を用いることができる。

また、上記各実施形態の人口算出システム１及び１Ａにおいて、取得部１０が測定人数を取得する際に、例えば、次に説明する端末数推計である在圏数推計、又は入込数推計により、測定人数（移動機数）を推計し、取得してもよい。

以下では、在圏数推計の考え方及び計算方法を説明する。図１３に示すモデルのように、ある集計時間帯（長さＴ）の間に、ｎ個の移動機ａ_１，ａ_２，…，ａ_ｎがセクタＳを通過し、各移動機ａ_ｉの集計時間帯内のセクタＳの滞在時間がｔ_ｉ（０＜ｔ_ｉ≦Ｔ）であったとする。このとき、セクタＳに存在する移動機数ｍ（実際にはセクタＳに存在する移動機数ｍの集計時間帯内における平均値）は、以下の式（１）で表わされる。

即ち、各移動機ａ_ｉの集計時間帯内のセクタＳの滞在時間ｔ_ｉの総和を集計時間帯の長さＴで除した結果を、移動機数ｍとして推計する。ただし、移動機ａ_ｉの集計時間帯内のセクタＳの滞在時間ｔ_ｉの真の値は観測不能であるが、各移動機ａ_ｉが位置情報を登録するために発する信号は観測可能である。

移動機ａ_ｉが集計時間帯内にセクタＳで発信した信号を、時刻順に

（ｘ_ｉは、移動機ａ_ｉが集計時間帯内にセクタＳで発信した信号の総数）とすると、観測されたｑ_ｉｊ（ｊは１以上ｘ_ｉ以下の整数）からｍの値を推計することができる。

さて、図１４に基づき移動機数推計の計算方法を説明する。移動機ａ_ｉから信号ｑ_ｉｊが送信される密度（即ち、単位時間あたりの信号数）をｐ_ｉとする。このとき、信号が送信される確率がセクタに対して独立であれば、移動機ａ_ｉが集計時間帯内にセクタＳで発信した信号の総数ｘ_ｉの期待値Ｅ（ｘ_ｉ）は、Ｅ（ｘ_ｉ）＝ｔ_ｉ×ｐ_ｉであるため、移動機ａ_ｉの集計時間帯内のセクタＳの滞在時間ｔ_ｉの期待値Ｅ（ｔ_ｉ）について以下の式（２）が成立する。
Ｅ（ｔ_ｉ）＝ｘ_ｉ／ｐ_ｉ（２）
ここで、信号ｑ_ｉｊの送信時刻をｕ_ｉｊとしたとき、信号ｑ_ｉｊの密度ｐ_ｉｊは、以下の式（３）で与えられる。
ｐ_ｉｊ＝２／（ｕ_{ｉ（ｊ＋１）}−ｕ_{ｉ（ｊ−１）}）（３）
ここで、上記式（３）の（ｕ_{ｉ（ｊ＋１）}−ｕ_{ｉ（ｊ−１）}）を、信号ｑ_ｉｊについての特徴量ｗ_ｉｊとする。すると、上記式（３）は、以下となる。即ち、特徴量ｗ_ｉｊは、密度ｐ_ｉｊの逆数に対応づけて算出することができる。
ｐ_ｉｊ＝２／（ｕ_{ｉ（ｊ＋１）}−ｕ_{ｉ（ｊ−１）}）＝２／ｗ_ｉｊ（４）
このとき密度ｐ_ｉは、

で与えられるため、移動機数ｍの推計値Ｅ（ｍ）は以下の式（６）で計算することができる。

図１４の例に示すように、集計時間帯内であり且つ移動機ａ_ｉがセクタＳに滞在していた期間内に、移動機ａ_ｉは信号ｑ_ｉ１、ｑ_ｉ２、ｑ_ｉ３を送信し、信号ｑ_ｉ１の直前に信号ｑ_ｉ０を、信号ｑ_ｉ３の直後に信号ｑ_ｉ４を送信したものとし、信号ｑ_ｉ０、ｑ_ｉ１、ｑ_ｉ２、ｑ_ｉ３、ｑ_ｉ４の送信時刻をそれぞれｕ_ｉ０、ｕ_ｉ１、ｕ_ｉ２、ｕ_ｉ３、ｕ_ｉ４とすると、上記の考え方は、移動機ａ_ｉの集計時間帯内のセクタＳの滞在時間ｔ_ｉを、（ｕ_ｉ０とｕ_ｉ１の中点）から（ｕ_ｉ３とｕ_ｉ４の中点）までの期間と推計することに相当する。なお、移動機ａ_ｉは、集計時間帯内ではないものの、セクタＳへの滞在中に信号ｑ_ｉ４を送信している。但し、滞在時間ｔ_ｉの推計量の不偏性を維持するために、ここでは一例として、滞在時間ｔ_ｉの終了時刻を集計時間帯Ｔの終了時刻と同じとして推計することは行わない処理を説明する。

続いて、以下では、入込数推計の考え方及び計算方法を説明する。なお、本明細書において、入込端末数とは、集計時間帯の少なくとも一部において集計対象とするエリア（セクタ）に滞在したユニークな移動機数を意味する。また、ここでの「ユニークな」とは、同一移動機の重複カウントを除いた後の数を意味する。

以下、取得部１０で行われる入込端末数推計処理の一例を説明する。この一例においては、セクタ内の各移動機の推定滞在期間を用いて入込端末数を求める。まず、取得部１０は、ユーザ識別子が同じ位置登録情報において、位置登録情報が取得された時刻が後述の拡張期間内にあり、セクタＩＤがある所定のセクタを示すセクタ内位置データ、及び位置登録情報が取得された時刻順に時系列に並べた場合に当該セクタ内位置データに隣接しセクタＩＤがある所定のセクタ外を示すセクタ外位置データに基づいて、移動機がある所定のセクタ内に滞在していた推定滞在期間を移動機毎に算出する。なお、上記の「拡張期間」は、ここでは一例として、集計時間帯を前後に所定の時間幅（例えば１時間）だけ拡張した期間、即ち、集計開始時刻ｔ０から所定時間だけ過去に遡った時刻を開始点とし、集計終了時刻ｔ１から所定時間だけ未来に進めた時刻を終了点とする時間帯を意味する。

図１５に示すように、拡張期間内に取得された同一移動機に関する一連の位置登録情報を当該位置登録情報が取得された時刻順に時系列に並べ、位置登録情報のセクタＩＤがある所定のセクタを示すセクタ内位置データを黒丸で、セクタ内位置データに隣接しセクタＩＤがある所定のセクタ外を示すセクタ外位置データを白丸で、それぞれ示した場合、時系列上で最先のセクタ内位置データの取得時刻ｔ_ａと、該最先のセクタ内位置データに隣接するセクタ外位置データの取得時刻ｔ_ｘとの按分点（一例として中点）に相当する時刻ｔ_ｉｎを推定滞在期間の開始時刻とする。同様に、時系列上で最後のセクタ内位置データの取得時刻ｔ_ｃと、該最後のセクタ内位置データに隣接するセクタ外位置データの取得時刻ｔ_ｙとの按分点（一例として中点）に相当する時刻ｔ_ｏｕｔを推定滞在期間の終了時刻とする。これにより、図１５に長方形で示した期間、即ち、時刻ｔ_ｉｎから時刻ｔ_ｏｕｔまでの期間が、当該移動機の推定滞在期間として算出される。

そして、取得部１０は、算出された推定滞在期間と集計時間帯とが重複する移動機を抽出する。図１６には、拡張期間内に取得された移動機Ａ〜Ｅに関する一連の位置登録情報を移動機毎に、位置登録情報の取得時刻順に時系列に横軸方向に並べた図を示しており、この図１６では、セクタＩＤがある所定のセクタを示すセクタ内位置データを黒丸で、セクタＩＤがある所定のセクタ外を示すセクタ外位置データを白丸でそれぞれ示している。仮に、位置登録情報の取得時刻が集計時間帯（時刻ｔ０〜時刻ｔ１）内にあるセクタ内位置データにのみ着目すると、対応する移動機としては移動機Ｃ〜Ｅの３つが抽出される。

ところが、図１６で長方形により示した推定滞在期間と集計時間帯（時刻ｔ０〜時刻ｔ１）とが重複する移動機としては、移動機Ａ〜Ｅの５つが挙げられるため、取得部１０は、移動機Ａ〜Ｅの５つを抽出する。これにより、黒丸で示すセクタ内位置データにのみ着目した場合に除外される移動機Ａ、Ｂについても、集計時間帯中のどこかである所定のセクタ内に滞在していたと推定されることとなる。この処理を、セクタ毎に順次行うことで、集計時間帯中のどこかで各セクタ内に滞在していた移動機をセクタ毎に抽出することができる。なお、上述した推定滞在期間を用いた方法は一例であり、他の方法を採用しても構わない。他の方法については後述する。

次に、取得部１０は、抽出された移動機の数をセクタＩＤ毎にカウントし、得られたカウント数を集計時間帯内における各セクタ内の入込端末数として推計する。以上のように、取得部１０においてセクタ毎の入込端末数を求める。

なお、前述した取得部１０における推定滞在期間を用いた入込端末数の推計方法は一例であり、他の方法を採用しても構わない。別の例として、取得部１０は、同一移動機に関する位置登録情報において、位置登録情報が取得された時刻が集計時間帯内にあるセクタ内位置データのうち、１つの位置登録情報（一例として取得時刻が最も早い位置登録情報）を抽出してもよい。このようにして移動機毎に１つの位置登録情報を抽出する場合、上述した推定滞在期間を用いた方法よりも抽出の精度がやや劣るものの、移動機毎の推定滞在期間を算出する必要がないため、低い処理負荷で移動機毎に１つの位置登録情報を抽出することができる。この場合、取得部１０は、抽出された位置登録情報の数をカウントすることで入込端末数を推計すればよい。なお、移動機毎に１つの位置登録情報を抽出する場合、取得時刻が最も早い位置登録情報を抽出することは必須ではなく、他の１つの位置登録情報を抽出してもよい。例えば、取得時刻が最も遅い位置登録情報を抽出してもよいし、取得時刻が観測期間のちょうど真ん中の時点に最も近い位置登録情報を抽出してもよい。

なお、上記各実施形態では、移動機の位置情報として、ＧＰＳ等により取得された位置情報や位置登録情報以外にも、位置を把握できる情報であれば利用できる。

本発明の他の適用分野としては、テレビ番組の視聴率調査、政党支持率調査、Ｗｅｂアンケート調査、及び国勢調査などが挙げられる。

１，１Ａ…人口算出システム、１０…取得部（取得手段）、１１…第１算出部（人口算出手段）、１２…第２算出部（人口算出手段）、１３，１３Ａ…量子化部（秘匿化手段）、１４，１４Ａ…出力部（出力手段）、１５…データベース、１６…第３算出部（人口算出手段）。

Claims

対象エリアの秘匿化された人口を算出する人口算出システムであって、
前記対象エリアを含む測定エリアにおいてサンプルとして測定された測定人数を取得する取得手段と、
前記取得手段により取得された測定人数と、前記測定人数から前記測定エリア内の人口を求めるための拡大係数とに基づいて、該測定エリアの人口を算出し、算出された測定エリアの人口に基づいて前記対象エリアの人口を算出する人口算出手段と、
前記人口算出手段による算出処理の際に、前記測定エリアの人口又は前記対象エリアの人口を、最小集計単位の基準値である秘匿基準と前記拡大係数との積である階級幅に基づいて秘匿化する秘匿化手段と、
前記秘匿化手段による秘匿化処理を経て得られた前記対象エリアの人口を該対象エリアの秘匿化人口として出力する出力手段と、を備えることを特徴とする人口算出システム。
前記秘匿化手段が、前記人口算出手段により算出された対象エリアの人口を前記階級幅に基づいて秘匿化する、請求項１に記載の人口算出システム。
前記秘匿化手段が、前記人口算出手段により算出された測定エリアの人口を前記階級幅に基づいて秘匿化し、
前記人口算出手段が、前記秘匿化手段により秘匿化された測定エリアの人口と、秘匿化前の前記測定エリアの人口に対する前記対象エリアの人口の比との積を、秘匿化処理を経て得られた前記対象エリアの人口として算出する、請求項１に記載の人口算出システム。
前記対象エリアと前記測定エリアとが同一であり、
前記秘匿化手段が、前記人口算出手段により算出された測定エリアの人口を前記階級幅に基づいて秘匿化し、
前記人口算出手段が、前記秘匿化手段により秘匿化された測定エリアの人口を、秘匿化処理を経て得られた前記対象エリアの人口として算出する、請求項１に記載の人口算出システム。
前記取得手段が、前記測定人数を複数の属性毎に取得し、
前記人口算出手段が、前記複数の属性毎に設定された前記拡大係数に基づいて、前記測定エリアの人口及び前記対象エリアの人口を前記複数の属性毎に算出するとともに、前記複数の属性のうち少なくとも二つの属性についての前記測定エリアの人口の合計及び前記対象エリアの人口の合計を算出し、
前記秘匿化手段が、前記測定エリアの合計人口又は前記対象エリアの合計人口を、前記秘匿基準と前記少なくとも二つの属性毎に設定された前記拡大係数のうち最大の拡大係数との積である前記階級幅に基づいて秘匿化する、請求項１〜４の何れか一項に記載の人口算出システム。
前記取得手段が、前記測定人数を複数の属性毎に取得し、
前記人口算出手段が、前記複数の属性毎に設定された前記拡大係数に基づいて、前記測定エリアの人口及び前記対象エリアの人口を前記複数の属性毎に算出し、
前記秘匿化手段が、前記測定エリアの人口又は前記対象エリアの人口を、前記複数の属性毎に前記秘匿基準と当該属性に設定された前記拡大係数との積である前記階級幅に基づいて秘匿化し、前記複数の属性全てについて足し合わせることで、秘匿化された前記測定エリアの合計人口又は秘匿化された前記対象エリアの合計人口を算出する、請求項１〜４の何れか一項に記載の人口算出システム。
前記秘匿化手段が、前記測定エリアの合計人口又は前記対象エリアの合計人口を、前記階級幅ではなく、前記階級幅とは異なる別の階級幅に基づいて秘匿化し、
前記別の階級幅が、前記少なくとも二つの属性毎に設定された前記拡大係数を降順に並べた際の上位ｎ個（ｎは前記秘匿基準）の拡大係数の和である、請求項５に記載の人口算出システム。
前記秘匿化手段が、前記階級幅に基づく秘匿化を実行する際に、人口を前記階級幅の整数倍に量子化する、請求項１〜６の何れか一項に記載の人口算出システム。
前記秘匿化手段が、人口を前記階級幅の整数倍に量子化することで人口を特定の階級に丸め込む際に、人口との差が最も小さい階級と人口との差が次に小さい階級とのうちどちらか一方の階級に、人口とそれぞれの階級との差に基づいて丸め込む、請求項８に記載の人口算出システム。
前記秘匿化手段が、前記階級幅に基づく秘匿化を実行する際に、前記階級幅未満の人口を切り捨てる、請求項１〜６の何れか一項に記載の人口算出システム。
前記秘匿化手段が、前記階級幅に基づく秘匿化を実行する際に、前記階級幅の大きさに応じた確率に基づいて人口をランダムな値にする、請求項１〜６の何れか一項に記載の人口算出システム。
前記秘匿化手段が、前記別の階級幅に基づく秘匿化を実行する際に、人口を前記別の階級幅の整数倍に量子化する、請求項７に記載の人口算出システム。
前記秘匿化手段が、人口を前記別の階級幅の整数倍に量子化することで人口を特定の階級に丸め込む際に、人口との差が最も小さい階級と人口との差が次に小さい階級とのうちどちらか一方の階級に、人口とそれぞれの階級との差に基づいて丸め込む、請求項１２に記載の人口算出システム。
前記秘匿化手段が、前記別の階級幅に基づく秘匿化を実行する際に、前記別の階級幅未満の人口を切り捨てる、請求項７に記載の人口算出システム。
前記秘匿化手段が、前記別の階級幅に基づく秘匿化を実行する際に、前記別の階級幅の大きさに応じた確率に基づいて人口をランダムな値にする、請求項７に記載の人口算出システム。
前記取得手段が、所定期間に前記測定エリア内で移動機から登録された位置情報のそれぞれについて、前記移動機が前記位置情報を登録した時刻、当該移動機が一つ前の前記位置情報を登録した時刻、及び当該移動機が一つ後の前記位置情報を登録した時刻、のうち二つ以上を用いて特徴量を算出し、前記特徴量の総和に基づいて前記測定エリア内の前記移動機の数を推計し、前記測定人数として取得する、請求項１〜１５の何れか一項に記載の人口算出システム。
前記取得手段が、移動機から登録された位置情報のうち、前記移動機が前記位置情報を登録した時刻が集計される集計時間帯内又は前記集計時間帯を所定幅拡張した拡張期間内にある前記位置情報に基づいて、前記集計時間帯の少なくとも一部において前記測定エリアに滞在したと推定される前記移動機、又は当該移動機にて前記集計時間帯又は前記拡張期間内に生成された１つの前記位置情報を抽出し、抽出された前記移動機の数又は前記位置情報の数に基づいて、前記集計時間帯内における前記測定エリア内の前記移動機の数を推計し、前記測定人数として取得する、請求項１〜１５の何れか一項に記載の人口算出システム。
対象エリアの秘匿化された人口を算出する人口算出システムにより実行される人口算出方法であって、
前記人口算出システムが、前記対象エリアを含む測定エリアにおいてサンプルとして測定された測定人数を取得する取得ステップと、
前記人口算出システムが、前記取得ステップにおいて取得された測定人数と、前記測定人数から前記測定エリア内の人口を求めるための拡大係数とに基づいて、該測定エリアの人口を算出し、算出された測定エリアの人口に基づいて前記対象エリアの人口を算出する人口算出ステップと、
前記人口算出システムが、前記人口算出ステップにおける算出処理の際に、前記測定エリアの人口又は前記対象エリアの人口を、最小集計単位の基準値である秘匿基準と前記拡大係数との積である階級幅に基づいて秘匿化する秘匿化ステップと、
前記人口算出システムが、前記秘匿化ステップにおける秘匿化処理を経て得られた前記対象エリアの人口を該対象エリアの秘匿化人口として出力する出力ステップと、を含むことを特徴とする人口算出方法。