KR20140135244A - 통계 정보 생성 시스템 및 통계 정보 생성 방법 - Google Patents
통계 정보 생성 시스템 및 통계 정보 생성 방법 Download PDFInfo
- Publication number
- KR20140135244A KR20140135244A KR1020147028590A KR20147028590A KR20140135244A KR 20140135244 A KR20140135244 A KR 20140135244A KR 1020147028590 A KR1020147028590 A KR 1020147028590A KR 20147028590 A KR20147028590 A KR 20147028590A KR 20140135244 A KR20140135244 A KR 20140135244A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- information
- statistical
- identification information
- accumulation data
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Complex Calculations (AREA)
Abstract
통계 정보 생성 시스템(1)은, 조건 입력부(23), 비식별화 위치 데이터 및 비식별화 속성 데이터를 추출하는 추출부(24), 비식별화 속성 데이터에 대하여 확대 계수를 부여하는 확대 계수 부여부(25), 비식별화 위치 데이터와 비식별화 속성 데이터와 확대 계수를 사용하여, 통계 데이터를 산출하는 통계부(26), 비식별화 위치 데이터를 집계하는 집계부(27), 집계된 데이터 수의 대소를 판정하는 판정부(32), 및 통계 데이터를 은폐해서 출력하는 출력부(33)를 구비한다.
Description
본 발명은, 통계 정보 생성 시스템 및 통계 정보 생성 방법에 관한 것이다.
종래부터, 휴대 단말기의 위치 정보를 취득하여, 그 위치 정보를 기초로 휴대 단말기의 사용자의 인구 분포를 해석하는 장치가 알려져 있다(일본 특허출원 공개번호 2003-30373호 공보 및 일본 특허출원 공개번호 2005-286657호 공보 참조). 이와 같이 휴대 단말기의 위치 정보를 사용함으로써, 인구조사 등에 의해 얻어진 인구통계 데이터에 비하여, 사용자의 이동 경향도 반영한 인구 분포를 얻을 수 있다.
예를 들면, 일본 특허출원 공개번호 2003-30373호 공보에 기재된 장치는, 휴대 단말기의 각각에 관한 위치 정보를 저장하는 데이터 베이스를 이용하여, 타겟 지역 및 타겟 층에 대응하는 인구 분포를 집계하고 있다. 또한, 일본 특허출원 공개번호 2005-286657호 공보에 기재된 장치는, 단말기 확인 신호를 수신한 단말기의 응답 신호의 기지국마다 집계 결과를 인구 밀집도 정보로서 생성하는 것을 개시하고 있다.
이와 같은 종래의 인구 분포의 통계 처리에서는, 휴대 단말기의 이용자에게 전기 통신 서비스를 제공하기 위한 데이터인 휴대 단말기의 위치 데이터나 이용자의 속성 데이터 등의 운용 데이터를 이용하고 있다. 이들 운용 데이터에 대하여 집계 등의 통계 처리를 행함으로써, "인원수 분포", "이동 인원수", "인원수 구성" 등의 인구 동태에 관한 추계 값을 얻을 수 있다. 여기서, "인원수 분포"는 각 영역에 분포되어 있는 인원수, "이동 인원수"는 각 영역 사이를 이동하는 인원수, "인원수 구성"은 성별이나 연령별로 구분한 인원수 분포나 이동 인원수를 의미한다.
그러나, 이러한 종래의 통계 처리에서는, 집계 대상의 인구의 모두가 휴대 단말기를 가지고 있는 것은 아니기 때문에, 단지 휴대 단말기의 위치 데이터의 총합을 취하는 것만으로는 정확한 인구 동태를 얻을 수 없다. 정확한 인구 동태를 얻으려면, 휴대 단말기로부터 얻어진 위치 데이터에 대하여, 그 휴대 단말기의 계약자의 속성마다 계약율의 역수를 곱해 가중치의 총합을 취하는 것 등에 의해, 집계 대상의 휴대 단말기를 가지고 있지 않은 사람들을 포함한 인구 전체를 추계할 필요가 있다.
따라서, 종래의 통계 처리의 기술에 의해 인구 동태의 추계를 행하려고 하면, 다음과 같은 문제가 생긴다. 구체적으로는, 은닉에 관한 과제이다. 통계 처리를 행함으로써, 개개의 휴대 단말기에 관한 정보는 손실되고 집단으로서의 통계적인 경향만이 집계 결과에 나타내는 것으로 되지만, 통계 처리의 과정에서 너무 미세한 집계 범위에서 집계 정보를 작성하게 되면, 통계 데이터에 개인의 식별성이 드러나게 될 염려가 생긴다. 한편, 너무 개략적인 집계 범위에서 집계 정보를 작성하게 되면, 추계 데이터의 유용성을 해치게 된다. 이 과제에 대해서는, 종래의 공적 통계 처리 등에서, "은닉 처리"라는 처리가 통계 결과 데이터에 행해지는 경우가 있다. 이것은 집계표에서의 수치가 있는 일정한 값(은닉 기준이라 함)을 밑도는 경우에, 그 집계 결과를 표시하지 않거나 영으로서 표상하는 등의 처리를 행하는 것이다. 그러나, 상기한 바와 같이, 휴대 전화기 네트워크로부터의 위치 데이터를 이용한 인구 추정에서는, 계약자의 속성마다 상이한 가중치를 곱한 가중치 총합이 구해지므로, 단순하게 추계 값과 은닉 기준의 대소를 비교함으로써, 은닉의 필요와 불필요를 판정할 수는 없다.
그래서, 본 발명은, 이러한 과제에 감안하여 이루어진 것이며, 휴대 전화기 네트워크로부터 얻어지는 위치 데이터를 이용한 경우에, 통계 데이터에서의 개인의 식별성을 은닉하는 것이 가능한 통계 정보 생성 시스템 및 통계 정보 생성 방법을 제공하는 것을 목적으로 한다.
상기 과제를 해결하기 위하여, 본 발명의 통계 정보 생성 시스템은, 이동 통신 단말기를 식별하는 제1 식별 정보, 상기 이동 통신 단말기의 위치에 관한 위치 정보, 및 상기 위치 정보가 취득된 시각에 관한 시각 정보를 포함하는 위치 정보 축적 데이터를 입력하는 제1 입력 수단; 이동 통신 단말기를 식별하는 제2 식별 정보와, 상기 이동 통신 단말기의 계약자에 관한 속성 정보를 포함하는 속성 정보 축적 데이터를 입력하는 제2 입력 수단; 위치 정보 축적 데이터 및 속성 정보 축적 데이터에 대한 검색 조건 정보를 입력하는 조건 입력 수단; 검색 조건 정보를 기초로, 위치 정보 축적 데이터 및 속성 정보 축적 데이터의 일부를 추출하는 추출 수단; 추출 수단에 의해 추출된 속성 정보 축적 데이터에 대하여, 속성 정보 축적 데이터에 포함되는 속성 정보에 대응하는 계수로서, 통계 대상의 수치로의 확대 정도를 나타내는 확대 계수를 부여하는 확대 계수 부여 수단; 추출 수단에 의해 추출된 위치 정보 축적 데이터, 추출 수단에 의해 추출되고 위치 정보 축적 데이터에 포함되는 제1 식별 정보에 대응하는 제2 식별 정보를 가지는 속성 정보 축적 데이터, 및 상기 속성 정보 축적 데이터에 부여된 확대 계수를 사용하여, 인구에 관한 통계 데이터를 산출하여 출력하는 통계 수단; 추출 수단에 의해 추출된 위치 정보 축적 데이터의 데이터 수를 집계하는 집계 수단; 집계 수단에 의해 집계된 데이터 수를 소정 값과 비교함으로써 데이터 수의 대소를 판정하는 판정 수단과, 판정 수단에 의해 데이터 수가 크다고 판정된 경우에는, 통계 데이터를 출력하고, 판정 수단에 의해 데이터 수가 작다고 판정된 경우에는, 통계 데이터에 포함되는 수치를 은폐해서 출력하는 출력 수단을 구비한다.
또는, 본 발명의 통계 정보 생성 방법은, 제1 입력 수단이, 이동 통신 단말기를 식별하는 제1 식별 정보와, 상기 이동 통신 단말기의 위치에 관한 위치 정보와, 상기 위치 정보가 취득된 시각에 관한 시각 정보를 포함하는 위치 정보 축적 데이터를 입력하는 제1 입력 단계; 제2 입력 수단이, 이동 통신 단말기를 식별하는 제2 식별 정보와, 상기 이동 통신 단말기의 계약자에 관한 속성 정보를 포함하는 속성 정보 축적 데이터를 입력하는 제2 입력 단계; 조건 입력 수단이, 위치 정보 축적 데이터 및 속성 정보 축적 데이터에 대한 검색 조건 정보를 입력하는 조건 입력 단계; 추출 수단이, 검색 조건 정보를 기초로, 위치 정보 축적 데이터 및 속성 정보 축적 데이터의 일부를 추출하는 추출 단계; 확대 계수 부여 수단이, 추출 수단에 의해 추출된 속성 정보 축적 데이터에 대하여, 속성 정보 축적 데이터에 포함되는 속성 정보에 대응하는 계수로서, 통계 대상의 수치로의 확대 정도를 나타내는 확대 계수를 부여하는 확대 계수 부여 단계; 통계 수단이, 추출 수단에 의해 추출된 위치 정보 축적 데이터와, 추출 수단에 의해 추출되고, 위치 정보 축적 데이터에 포함되는 제1 식별 정보에 대응하는 제2 식별 정보를 가지는 속성 정보 축적 데이터와, 상기 속성 정보 축적 데이터에 부여된 확대 계수를 사용하여, 인구에 관한 통계 데이터를 산출하여 출력하는 통계 단계; 집계 수단이, 추출 수단에 의해 추출된 위치 정보 축적 데이터의 데이터 수를 집계하는 집계 단계; 판정 수단이, 집계 수단에 의해 집계된 데이터 수를 소정 값과 비교함으로써 데이터 수의 대소를 판정하는 판정 단계; 및 출력 수단이, 판정 수단에 의해 데이터 수가 크다고 판정된 경우에는, 통계 데이터를 출력하고, 판정 수단에 의해 데이터 수가 작다고 판정된 경우에는, 통계 데이터에 포함되는 수치를 은폐해서 출력하는 출력 단계를 포함한다.
이와 같은 통계 정보 생성 시스템 또는 통계 정보 생성 방법에 의하면, 위치 정보 축적 데이터 및 속성 정보 축적 데이터로부터, 검색 조건에 기초하여 통계 대상의 수치로의 확대 정도가 고려된 인구통계 데이터가 산출된다. 또한, 속성에 따른 휴대 단말기의 계약율 등을 고려한 인구의 추계치인 추계 데이터만이 아니고, 추계 데이터를 생성하는데 사용한 위치 데이터의 진정한 개수인 데이터 수를 병행하여 집계함으로써, 통계 데이터의 은닉의 필요와 불필요를 판단하기 위한 재료로 되는 정보가 제공된다.
또한, 전술한 바와 같이 하여 집계된 데이터 수를 기초로, 추계된 통계 데이터가 "소수의 집단"으로부터 생성된 정보가 아닌지 여부가 판단되고, 그 판단 결과에 따라 통계 데이터가 은닉된다. "소수의 집단"으로부터 생성되었는지 여부의 판단은, 통계 데이터 내의 통계수만으로부터는 행할 수 없다. 통계수는 속성별로 상이한 휴대 단말기의 계약율에 따른 확대 추계에 의해 안내되어 있기 때문이다. 그래서, 집계된 상기 데이터 수를 사용함으로써, 집계 데이터가 "소수의 집단"으로부터 생성되었는지 여부의 판단이 정확하게 행해진다.
그 결과, 위치 정보 축적 데이터나 속성 정보 축적 데이터를 기초로 추계된 통계 데이터에서의 개인의 식별성을 은닉할 수 있다.
본 발명에 의하면, 휴대 전화기 네트워크로부터 얻어지는 위치 데이터를 이용한 경우에, 통계 데이터에서의 개인의 식별성을 은닉할 수 있다.
도 1은 본 발명의 바람직한 일실시예에 관한 통계 정보 생성 시스템의 개략 구성도이다.
도 2는 도 1의 제1 입력부에 입력되는 위치 정보 축적 데이터의 데이터 구성을 나타낸 도면이다.
도 3은 도 1의 제2 입력부에 입력되는 속성 정보 축적 데이터의 데이터 구성을 나타낸 도면이다.
도 4는 도 1의 통계 정보 생성 시스템의 동작을 나타낸 흐름도이다.
도 5는 본 실시형태에서의 단말기 수 추계의 생각을 설명하기 위한 도면이다.
도 6은 본 실시형태에서의 단말기 수 추계에 관한 계산방법을 설명하기 위한 도면이다.
도 7은 본 실시형태에서의 가입 단말기 수 추계 처리를 나타낸 흐름도이다.
도 8은 본 실시형태에서의 추정 체재 기간의 산출 방법을 설명하기 위한 도면이다.
도 9는 본 실시형태에서의 위치 데이터의 추출 방법을 설명하기 위한 도면이다.
도 10은 본 실시형태에서의 은닉 처리의 일례를 나타낸 흐름도이다.
도 2는 도 1의 제1 입력부에 입력되는 위치 정보 축적 데이터의 데이터 구성을 나타낸 도면이다.
도 3은 도 1의 제2 입력부에 입력되는 속성 정보 축적 데이터의 데이터 구성을 나타낸 도면이다.
도 4는 도 1의 통계 정보 생성 시스템의 동작을 나타낸 흐름도이다.
도 5는 본 실시형태에서의 단말기 수 추계의 생각을 설명하기 위한 도면이다.
도 6은 본 실시형태에서의 단말기 수 추계에 관한 계산방법을 설명하기 위한 도면이다.
도 7은 본 실시형태에서의 가입 단말기 수 추계 처리를 나타낸 흐름도이다.
도 8은 본 실시형태에서의 추정 체재 기간의 산출 방법을 설명하기 위한 도면이다.
도 9는 본 실시형태에서의 위치 데이터의 추출 방법을 설명하기 위한 도면이다.
도 10은 본 실시형태에서의 은닉 처리의 일례를 나타낸 흐름도이다.
이하, 도면을 참조하여, 본 발명에 의한 통계 정보 생성 시스템 및 통계 정보 생성 방법의 바람직한 실시형태에 대하여 상세하게 설명한다. 그리고, 도면의 설명에서는 동일 요소에는 동일 부호를 부여하고, 중복되는 설명을 생략한다.
도 1은 본 발명의 바람직한 일실시예에 관한 통계 정보 생성 시스템(1)의 개략 구성도이다. 도 1에 나타내는 통계 정보 생성 시스템(1)은 이동체 통신망(NW)에서 복수 개의 휴대 단말기(2) 등의 이동 통신 단말기에 전기 통신 서비스를 제공하기 위한 데이터인 위치 정보를 이용하여, 인구 동태에 관한 추계 값을 포함하는 통계 데이터를 생성하는 컴퓨터 시스템이다. 이 통계 정보 생성 시스템(1)은 비식별화 정보 생성 장치(11), 집계 장치(21), 및 정보 은닉 장치(31)를 포함하는 복수 개의 정보 처리 장치에 의해 구성되고, 무선 기지국(3) 및 이동체 통신망(NW)를 경유하여 휴대 단말기(2)나 이동체 통신망(NW)에 접속된 통신 장치 사이에 서로 데이터 통신이 가능하게 되어 있다. 그리고, 통계 정보 생성 시스템(1)은 1대의 정보 처리 장치에 의해 구성되어도 있어도 되고, 임의의 대수의 정보 처리 장치에 의해 구성되어 있어도 된다.
상기의 휴대 단말기(2)는 GPS를 이용한 위치결정(positioning)이나, 무선 기지국(3)으로부터의 전파를 이용한 위치결정 등의 다양한 위치결정 연산 방식을 이용한 자기의 위치 정보를 취득하는 기능을 가지고 있다. 또한, 그 위치결정 연산의 결과 얻어진 휴대 단말기(2)의 위치 정보는, 휴대 단말기(2)나 이동체 통신망(NW)에 접속된 통신 장치로부터, 통계 정보 생성 시스템(1)에 송신 가능하게 되어 있다.
이하, 통계 정보 생성 시스템(1)의 구성에 대하여 상세하게 설명한다.
비식별화 정보 생성 장치(11)는 제1 입력부(제1 입력 수단)(12), 제2 입력부(제2 입력 수단)(13), 키 관리부(키 관리 수단)(14), 일방향 연산부(일방향 연산 수단)(15), 비식별화 위치 데이터 생성부(비식별화 위치 데이터 생성 수단)(16), 및 비식별화 속성 데이터 생성부(비식별화 속성 데이터 생성 수단)(17)를 포함하여 구성된다.
제1 입력부(12)는 이동체 통신망(NW) 등의 외부로부터 위치 정보의 입력을 받아 위치 정보 축적 데이터에 축적한다. 위치 정보 축적 데이터는, 도 2에 나타내는 바와 같이, 회선 번호 등 휴대 단말기(2)를 식별하는 정보인 제1 식별 정보 "090-XXXX-XXXX"와 위도 및 경도 정보 또는 휴대 단말기(2)의 위치 등록 신호를 수신한 무선 기지국(3)의 식별 정보 등의 상기 휴대 단말기(2)의 위치에 관한 정보인 위치 정보 "X1, Y1"와 위치 정보를 취득한 시각 "2010/5/30 12:24"을 포함하고 있다. 또한, 제1 입력부(12)는 축적된 위치 정보 축적 데이터를 비식별화 위치 데이터 생성부(16)에 출력한다.
제2 입력부(13)는 이동체 통신망(NW) 등의 외부로부터 휴대 단말기(2)의 속성을 나타내는 속성 데이터의 입력을 받아 속성 정보 축적 데이터에 축적한다. 속성 정보 축적 데이터는, 도 3에 나타내는 바와 같이, 회선 번호 등의 휴대 단말기(2)를 식별하는 정보인 제2 식별 정보 "090-XXXX-XXXX"와 제2 식별 정보에 의해 식별되는 휴대 단말기(2)의 계약자, 즉 제2 식별 정보가 회선 번호인 경우에는 상기 회선의 계약자에 관한 속성을 나타내는 속성 정보 등을 포함한다. 이와 같은 속성 정보로서는, 주소 "도쿄 신쥬쿠(tokyo shinjuku)", 성별 "남자", 연령 "30대" 등의 정보가 전형적인 예로서 들고 있다. 그리고, 동일한 휴대 단말기(2)에 대하여는, 제1 식별 정보와 제2 식별 정보는 같은 데이터 값이 부여되어 있다. 또한, 제2 입력부(13)는 축적된 속성 정보 축적 데이터를 비식별화 속성 데이터 생성부(17)에 출력한다.
도 1을 다시 참조하면, 키 관리부(14)는 미리 정해진 전자 키 정보를 유지한다. 이 전자 키 정보는 키 관리 수단의 외부에 누출하지 않게 엄중하게 관리되어 있는 것이 바람직하다.
일방향 연산부(15)는 비식별화 위치 데이터 생성부(16) 및 비식별화 속성 데이터 생성부(17)로부터 제1 식별 정보 및 제2 식별 정보가 각각 입력되어, 키 관리부(14)가 유지하는 전자 키 정보를 사용하고, 제1 식별 정보 및 제2 식별 정보에 대하여 일방향 함수를 적용함으로써, 제1 비식별화 정보 및 제2 비식별화 정보를 각각 출력한다. 예를 들면, 일방향 연산부(15)는 일방향성 함수로서 SHA(Secure Hash Algorithm)-256 등의 해시 함수(hash function)를 사용하고, 제1 식별 정보 또는 제2 식별 정보와 키 정보와의 연접에 대한 해시값을 출력하는 등의 연산 처리에 의해, 제1 비식별화 정보 또는 제2 비식별화 정보를 출력한다.
비식별화 위치 데이터 생성부(16)는 위치 정보 축적 데이터로부터 제1 식별 정보를 삭제하고, 제1 식별 정보를 일방향 연산부(15)에 입력함으로써 작성한 제1 비식별화 정보를 위치 정보 축적 데이터에 부가함으로써, 비식별화 위치 정보 축적 데이터를 생성한다. 여기서, 비식별화 위치 데이터 생성부(16)는 위치 정보에 대해서도 적절한 노이즈를 가하여, 위치 등 새로운 데이터 가공 처리를 가하는 것에 적합하다. 또한, 비식별화 위치 데이터 생성부(16)는 생성한 비식별화 위치 정보 축적 데이터를 집계 장치(21)에 안내한다.
*비식별화 속성 데이터 생성부(17)는 속성 정보 축적 데이터로부터 제2 식별 정보를 삭제하고, 제2 식별 정보를 일방향 연산부(15)에 입력함으로써 작성한 제2 비식별화 정보를, 속성 정보 축적 데이터에 부가함으로써, 비식별화 속성 정보 축적 데이터를 생성한다. 여기서, 비식별화 속성 데이터 생성부(17)는 속성 정보를 추상화함으로써 추상화 속성 정보를 생성하고, 속성 정보를 추상화 속성 정보에 치환하는 처리를 행하는 것도 바람직하다. 이와 같은 추상화 처리의 예로서는, "연령"을 "연령층"으로 라운드처리하거나, 주소의 상세 부분을 삭제하거나, 성명 등의 개인 식별성을 가지는 정보를 없애는 등의 처리를 들 수 있다. 또한, 비식별화 속성 데이터 생성부(17)는 생성한 비식별화 속성 정보 축적 데이터를 집계 장치(21)로 전달한다.
통계 정보 생성 시스템(1)의 집계 장치(21)는 저장부(22), 조건 입력부(조건 입력 수단)(23), 추출부(추출 수단)(24), 확대 계수 부여부(확대 계수 부여 수단)(25), 통계부(통계 수단)(26), 및 집계부(집계 수단)(27)를 포함하여 구성된다.
저장부(22)는 비식별화 정보 생성 장치(11)가 생성하는 비식별화 위치 정보 축적 데이터와 비식별화 속성 정보 축적 데이터를 저장한다.
조건 입력부(23)는 통계 처리의 요구자로부터 비식별화 위치 정보 축적 데이터와 비식별화 속성 정보 축적 데이터에 대한 검색 조건의 입력을 받아들인다. 이와 같은 검색 조건의 입력은 통계 정보 생성 시스템(1)에 직접 입력해도 되고, 이동체 통신망(NW) 등의 통신 네트워크를 경유하여 수신해도 된다. 예를 들면, 요구자가 "시각 t에 A 지역에 있던 남성의 인원수"를 추계하고 싶은 경우에는, 검색 조건으로서, "시각=t, 위치 정보∈A 지역, 성별=남성"에 상당하는 정보의 입력을 받아들일 수 있다. 또한, 조건 입력부(23)는 받아들인 검색 조건을 추출부(24)에 전달한다.
추출부(24)는 조건 입력부(23)로부터 전달된 검색 조건에 해당하는 일부의 데이터 집합을 저장부(22)에 저장된 비식별화 위치 정보 축적 데이터 및 비식별화 속성 정보 축적 데이터 중에서 추출한다. 예를 들면, 전술한 검색 조건이 주어진 경우에는, 추출부(24)는 "시각=t, 위치 정보∈A 지역"에 해당하는 비식별화 위치 정보 축적 데이터의 집합과, "성별=남성"에 해당하는 비식별화 속성 정보 축적 데이터의 집합을 추출한다. 그리고, 추출부(24)는 추출한 각각의 데이터 집합을 대상으로 하여, 제1 비식별화 정보 및 제2 비식별화 정보를 키 정보로 하여, 관계 대수에서의 결합(join) 연산을 실행한다. 이로써, "시각=t, 위치 정보∈A 지역, 성별=남성"에게 해당하는 위치 정보와 속성 정보가 결합된 데이터 집합을 얻을 수 있다.
여기서, 추출부(24)는 검색 조건과 비식별화 위치 정보 축적 데이터를 대조 한 결과, 검색 조건에 대한 일치율이 확률 값으로서 얻어지는 경우에는, 비식별화 위치 정보 축적 데이터에 대하여 그 확률 값을 나타내는 확률 정보를 부여해도 된다. 예를 들면, "위치 정보∈A 지역"인지 여부가 확률적으로 부여되는 경우, 그 확률을 추출된 집합에 부여할 수 있다. 또한, 추출부(24)는 비식별화 속성 정보 축적 데이터에 포함되는 속성 정보가 추상화 속성 정보에 치환되어 있었을 경우에는, 추상화 위치 정보와 검색 조건을 대조함으로써, 비식별화 속성 정보 축적 데이터를 추출한다. 예를 들면, 추상화 속성 정보가 "연령:50대"라고 설정되어 있었을 경우에는, 검색 조건 "연령=20대 이상 50대 이하"에 적합하게 있는 것으로 판단되게 된다.
확대 계수 부여부(25)는 비식별화 위치 정보 축적 데이터와 결합된 비식별화 속성 정보 축적 데이터의 포함하는 속성 정보를 기초로 하여, 미리 정해진 순서에 따라, 수치인 확대 계수를 취득하고, 그 확대 계수가 결합된 데이터 집합에 부여한다. 이 확대 계수는 통계 대상의 인구 수치로의 확대 정도를 나타내는 계수이다. 예를 들면, 확대 계수 부여부(25)는 "30대 남성", "20대 여성" 등의 연령층 및 성별의 조합마다의 휴대 전화기의 계약율을 미리 유지해 두고, 어느 연령 및 성별의 조합을 속성 정보로서 포함하는 데이터 집합에 대해서는, 대응하는 계약율의 역수를 부여하여 출력한다. 더 구체적으로는, "30대 남성"의 계약율이 50%(=0.5)로서 유지되어 있던 경우에는, 속성 정보 "35세, 남성"에 대해서는, "0.5"의 역수인 확대 계수 "2.0"을 출력한다.
통계부(26)는 추출부(24)에 의해 추출된 비식별화 위치 정보 축적 데이터 및 비식별화 속성 정보 축적 데이터를 결합한 데이터 집합과 확대 계수 부여부(25)에 의해 부여된 확대 계수를 사용하여, 인구 추계수에 관한 통계 데이터를 산출한다. 구체적으로, 통계부(26)는 데이터 집합에 포함되는 각각의 정보에 대하여, 그 속성 정보로부터 연령과 성별을 추출하여, 확대 계수 부여부(25)를 호출하여 대응하는 확대 계수를 얻는다. 또한, 통계부(26)는 데이터 집합에 포함되는 전체 데이터 레코드(데이터 요소)의 확대 계수의 총합을, 추계 인원수로서 산출한다. 여기서, 통계부(26)는 데이터 집합에 포함되는 일부의 데이터 레코드에 대하여, 검색 조건에 해당하는 확률 값을 나타내는 확률 정보가 부가되어 있는 경우에는, 그 확률 정보에 대하여 확대 계수를 곱한 값의 총합을 취함으로써 통계 인원수를 산출할 수 있다. 또한, 통계부(26)는 산출한 통계 데이터를 정보 은닉 장치(31)에 출력한다.
집계부(27)는 추출부(24)에 의해 추출된 데이터 집합의 데이터 레코드(데이터 요소)의 데이터 수를 집계하고, 그 집계 값을 집계 인원수로서 정보 은닉 장치(31)에 출력한다. 여기서, 집계 인원수의 계산에 확대 계수나 확률 정보는 고려하지 않는다. 그 이유는, 정보 은닉 장치(31)는 "몇 사람의 휴대 단말기(2)의 사용자의 집단으로부터 추계된 정보 인가"에 따라 통계 데이터의 은닉의 필요와 불필요를 판정해야 하기 때문에, 확대 계수나 확률 정보에 의한 가중치 처리를 행하는 전의 순수한 데이터 요소 수를 필요로 하기 때문이다.
통계 정보 생성 시스템(1)의 정보 은닉 장치(31)는 판정부(판정 수단)(32)와 출력부(출력 수단)(33)를 포함하여 구성된다.
판정부(32)는 집계부(27)에 의해 집계된 데이터 수를 소정 값과 비교함으로써, 데이터 수의 대소를 판정한다. 예를 들면, 판정부(32)는 구체적인 기준 값으로서 "10"이 미리 주어져 있었을 경우, 집계부(27)에 의해 집계된 인원수가 "10" 이상인지 여부를 판정한다. 판정부(32)는 판정의 결과가 10 이상인 경우, 집계 인원수가 많다고 판단하고, 10 미만인 경우, 집계 인원수가 적다고 판단한다. 그리고, 판정부(32)는 판정 결과를 출력부(33)에 전달한다.
출력부(33)는 판정부(32)의 판정 결과에 따라, 집계 장치(21)에 의해 추계된 추계 인원수를 포함하는 통계 데이터를 그대로 출력하는지 여부를 결정하고, 최종적인 통계 데이터를 출력한다. 이 통계 데이터는 통계 정보 생성 시스템(1)에 직접 설치된 디스플레이 장치 등의 출력 장치에 출력되어도 되고, 이동체 통신망(NW) 등의 통신 네트워크를 통하여, 휴대 단말기(2) 등의 원격 장치에 출력되어도 된다. 구체적으로, 출력부(33)는 집계 인원수가 많은 것으로 판단된 경우에는, 통계 데이터에 포함되는 추계 인원수를 그대로 출력한다. 한편, 출력부(33)는 집계 인원수가 적다고 판단된 경우에는, 추계 인원수를 미리 정해진 수치 또는 부호로 치환하여 출력함으로써 추계 인원수를 은폐한다. 예를 들면, 추계 인원수를 "0"으로 출력하거나, 은폐된 것을 나타내는 부호인 "x"를 추계 인원수로 치환하여 출력한다. 그리고, 집계 인원수가 많다고 판단된 경우에도, 잔차 값의 표시 등의 가능성을 고려하여, 추계 인원수를 어떤 수치 간격을 가지는 개산 값으로 라운드처리하거나 난수를 추가한 값 등을 추계 값으로 출력하는 것도 바람직하다.
이하, 도 4를 참조하여, 통계 정보 생성 시스템(1)의 동작에 대하여 설명하는 동시에, 통계 정보 생성 시스템(1)에서의 통계 정보 생성 방법에 대하여 상세하게 설명한다. 도 4는 통계 정보 생성 시스템(1)에 의한 통계 정보 생성시의 동작을 나타낸 흐름도이다.
먼저, 비식별화 정보 생성 장치(11)가 위치 정보의 입력을 받아 위치 정보 축적 데이터에 축적한다(단계 S101). 다음에, 비식별화 정보 생성 장치(11)의 비식별화 위치 데이터 생성부(16)는 위치 정보 축적 데이터로부터 제1 식별 정보를 삭제하는 동시에 그것을 일방향 연산부(15)에 입력하는 것에 의해 얻어진 제1 비식별화 정보를 위치 정보 축적 데이터에 부가함으로써, 비식별화 위치 정보 축적 데이터를 생성하고, 집계 장치(21)의 저장부(22)에 저장한다(단계 S102). 그 후, 비식별화 정보 생성 장치(11)는 속성 정보의 입력을 받아 속성 정보 축적 데이터에 축적한다(단계 S103). 다음에, 비식별화 정보 생성 장치(11)의 비식별화 속성 데이터 생성부(17)는 속성 정보 축적 데이터로부터 제2 식별 정보를 삭제하는 동시에 그것을 일방향 연산부(15)에 입력함으로써 얻어진 제2 비식별화 정보를 속성 정보 축적 데이터에 부가함으로써, 비식별화 속성 정보 축적 데이터를 생성하고, 집계 장치(21)의 저장부(22)에 저장한다(단계 S104).
또한, 집계 장치(21)의 조건 입력부(23)는 통계 처리의 조건을 정하는 검색 조건의 입력을 받아들인다(단계 S105). 예를 들면, 조건 입력부(23)는 "시각 t에 A지역에 있던 남성의 인원수"를 추계하기 위한 검색 조건으로서, "시각=t, 위치 정보∈A 지역, 성별=남성"에 상당하는 정보의 입력을 받아들인다. 이에 따라, 추출부(24)는 접수된 검색 조건에 해당하는 비식별화 위치 정보 축적 데이터와 비식별화 속성 정보 축적 데이터의 집합을 저장부(22)로부터 추출한다(단계 S106). 구체적으로, 추출부(24)는 "시각=t, 위치 정보∈A 지역"에 해당하는 비식별화 위치 정보 축적 데이터의 집합과 "성별=남성"에 해당하는 비식별화 속성 정보 축적 데이터의 집합을 각각 저장부(22)로부터 추출한다. 또한, 추출부(24)는 추출한 각각의 집합을 대상으로 하여, 제1 비식별화 정보 및 제2 비식별화 정보를 키로 하여, 결합 연산을 실행한다(단계 S107). 그 결과, 추출부(24)는 검색 조건에 해당하는 데이터 집합을 얻는다.
다음에, 통계부(26)는 추출부(24)에 의해 추출된 데이터 집합의 구성 요소로부터 속성 정보의 일부, 예를 들면, 연령과 성별을 추출하여, 확대 계수 부여부(25)에 제공하는 것에 의해, 각각의 구성 요소에 대한 확대 계수를 취득한다(단계 S108). 그 후, 통계부(26)는 확대 계수의 총합을 계산해서 추계 인원수로서 얻는다(단계 S109). 또한, 집계부(27)는 추출부(24)에 의해 추출된 데이터 집합의 요소수를 계산해서, 집계 인원수로서 취득한다(단계 S110).
예를 들면, 추출부(24)에 의해, 다음과 같은 데이터 항목 "위치, 시각, 연령, 성별"을 각각 포함하는 4개의 데이터 요소로 구성되는 데이터 집합을 얻을 수 있다고 상정한다.
요소 1: (A, t, 23, 남성)
요소 2: (A, t, 33, 남성)
요소 3: (A, t, 31, 남성)
요소 4: (A, t, 85, 남성)
여기서, 확대 계수 부여부(25)는 연령층과 성별의 세트에 대한 계약율로서 이하의 정보를 유지하고 있는 것으로 한다.
(20대, 남성): 40%(=0.4)
(30대, 남성): 50%(=0.5)
(80대, 남성): 5%(=0.05)
이 경우, 확대 계수는 계약율의 역수인 것으로 하면, 각각의 요소에 대하여, 다음과 같은 확대 계수가 부여된다.
요소 1: (A, t, 23, 남성): 2.5
요소 2: (A, t, 33, 남성): 2.0
요소 3: (A, t, 31, 남성): 2.0
요소 4: (A, t, 85, 남성): 20.0
또한, 상기 예에서, 통계부(26)에 의해 추계되는 추계 인원수는 "26.5"로 되고, 집계부(27)에 의해 산출되는 집계 인원수는 "4"로 된다.
다시 도 4를 참조하여, 그 후, 정보 은닉 장치(31)의 판정부(32)는 집계부(27)에 의해 산출된 집계 인원수가, 소정 값 이상인지 여부를 판정한다(단계 S111). 구체적인 기준 값으로서 "10"이 주어져 있다고 하면, 상기 예에서는, 집계 인원수가 "4"이므로, 집계 인원수가 적다고 판정된다.
마지막으로, 출력부(33)는 판정부(32)에서의 판정에 따라 추계 인원수를 그대로 출력하는지 여부를 결정하고, 최종적인 추계 값을 출력한다. 즉, 집계 인원수가 많다고 판정된 경우에는(단계 S111;YES), 출력부(33)는 추계 인원수를 추계 값으로서 그대로 출력한다(단계 S112). 한편, 집계 인원수가 적다고 판정된 경우에는(단계 S111; NO), 추계 인원수를 미리 정해진 특정한 수치 또는 부호로 치환함으로써, 추계 인원수를 은폐해서 출력한다(단계 S113). 상기 예에서는, 집계 인원수가 적다고 판정되어 있으므로, 추계치는 예를 들면, "0"으로 출력된다.
이상 설명한 통계 정보 생성 시스템(1) 및 통계 정보 생성 방법에 의하면, 제1 및 제2 식별 정보에 의해 서로 대응시킬 수 있는 위치 정보 축적 데이터와 속성 정보 축적 데이터로부터, 각각 제1 및 제2 식별 정보가 제거된 다음, 제1 및 제2 비식별화 정보가 부여된다. 이 제1 및 제2 비식별화 정보는 미리 유지된 전자 키 정보와 제1 및 제2 식별 정보를 일방향성 함수에 대입함으로써 얻어진 것이며, 비식별화 정보로부터 식별 정보를 역산할 수 없다. 또한, 일방향성 함수가 이미 알려져 있다고 해도, 전자 키의 값이 비밀로 되어 있는 한, 식별 정보를 무작위로 일방향성 함수에 입력해도 식별 정보와 비식별화 정보의 대응 관계를 알 수 없다.
또한, 비식별화 정보를 부가된 비식별화 위치 정보 축적 데이터 및 비식별화 속성 정보 축적 데이터로부터, 검색 조건을 기초로, 통계 대상의 수치로의 확대 정도가 고려된 인구통계 데이터가 산출된다. 여기서는, 식별 정보는 비식별화 정보로 치환되어 있으므로, 식별 정보를 사용한 검색 조건을 부여함으로써, 특정 개인의 행동을 개시시키는 것 같은 통계 처리를 행하는 것을 미리 막을 수 있다. 또한, 속성에 따른 휴대 단말기의 계약율 등을 고려한 인구의 추계치인 추계 데이터만이 아니라, 추계 데이터를 생성하는데 사용한 위치 데이터의 진정한 개수인 데이터 수를 병행하여 집계함으로써, 통계 데이터의 은닉의 필요와 불필요를 판단하기 위한 재료로 되는 정보가 제공된다.
*또한, 전술한 바와 같이 하여 집계된 데이터 수를 기초로, 추계된 통계 데이터가 "소수의 집단"으로부터 생성된 정보가 아닌지 여부가 판단되고, 그 판단 결과에 따라 통계 데이터가 은닉된다. "소수의 집단"으로부터 생성되었는지 여부의 판단은 통계 데이터 내의 통계수만에 의해서는 행할 수 없다. 통계수는 속성별로 상이한 휴대 단말기의 계약율에 따른 확대 추계에 의해 안내되기 때문이다. 그래서, 집계된 상기 데이터 수를 사용함으로써, 집계 데이터가 "소수의 집단"으로부터 생성되었는지 여부의 판단이 정확하게 행해진다.
그 결과, 위치 정보 축적 데이터나 속성 정보 축적 데이터에 포함되는 식별 정보로부터의 개인의 식별을 방지할 수 있고, 또한 추계된 통계 데이터에서의 개인의 식별성을 은닉할 수 있다.
통계 정보 생성 시스템(1)에서는, 속성 정보 축적 데이터에 포함되는 속성 정보가, 정보를 추상화한 추상화 속성 정보로 치환되어 추상화 속성 정보와 검색 조건 정보를 대조함으로써, 비식별화 속성 정보 축적 데이터의 일부가 추출된다. 따라서, 추상화된 속성 정보를 단위로 한 통계 데이터를 얻는 것에 의해 인구 동태의 개략을 알 수 있다. 또한, 통계 데이터를 개략화하는 것으로 통계 데이터를 기초로 한 개인의 식별을 더 곤란하게 할 수 있다.
또한, 비식별화 위치 정보 축적 데이터에 대하여 확률 정보가 부여되고, 확률 정보에 대하여 확대 계수를 곱함으로써 통계 데이터가 산출되므로, 위치 정보와 검색 조건의 일치율이 확률로서 얻어지는 경우에, 그 확률이 반영된 통계 데이터를 얻을 수 있고, 전체의 인구 동태 경향이 반영된 통계 데이터를 얻을 수 있다. 예를 들면, 위치 정보가 영역에서의 확률 분포로서 얻어지는 경우에는, 그 확률 분포를 반영한 통계 데이터를 얻을 수 있다.
그리고, 본 발명은 전술한 실시형태에 한정되는 것은 아니다. 예를 들면, 통계 정보 생성 시스템(1)에서 처리되는 위치 정보 축적 데이터 및 속성 정보 축적 데이터에는 제1 및 제2 식별 정보로서 회선 번호가 포함되고, 통계 정보 생성 시스템(1)은 그 회선 번호를 휴대 단말기(2)를 식별하는 정보로서 처리하고 있다. 이에 대하여, 통계 정보 생성 시스템(1)은 회선 번호에 대신하여 휴대 단말기(2)를 식별하는 정보로서, IMSI(International Mobile Subscriber Identity) 등의 휴대 단말기(2)의 사용자를 식별하는 번호나, IMEI(International Mobile Equipment Identity) 등의 휴대 단말기(2)의 디바이스를 식별하는 번호 등을 처리해도 된다.
또한, 집계 장치(21)의 추출부(24)는 검색 조건에 해당하는 일부의 데이터 집합을 저장부(22)에 저장된 비식별화 위치 정보 축적 데이터 및 비식별화 속성 정보 축적 데이터 중에서 추출한다. 추출부(24)는 비식별화 위치 정보 축적 데이터 및 비식별화 속성 정보 축적 데이터를 결합 연산에 의해 결합한 후에, 결합된 데이터 집합에 확률 정보를 부가하고, 그 데이터 집합 중에서 검색 조건에 해당하는 일부의 데이터 집합을 추출하도록 해도 된다. 또한, 확률 정보가 부여되기 전에 데이터 집합을 추출해도 되고, 확대 계수 부여부(25)에 의해 확대 계수가 부여된 데이터 집합을 추출해도 된다.
또한, 집계 장치(21)의 통계부(26)는 추출부(24)에 의해 추출된 데이터 집합에 포함되는 각 데이터 레코드의 확대 계수의 총합을 산출하고 있지만, 데이터 집합에 포함되는 데이터 레코드의 총합을 속성마다 산출하고, 그 총합에 대하여 해당하는 속성에 대응하는 확대 계수를 곱해도 된다. 예를 들면, 데이터 집합에 포함되는 속성 "30대 남성"에 적합한 데이터 레코드의 총수 또는 확률 값의 총합을 먼저 산출하고, 그 총수 또는 총합에 대하여 속성 "30대 남성"에 대응하는 확대 계수 " 2.0"을 곱하는 것으로, 그 속성에 대응한 통계 인원수를 산출할 수 있다.
또한, 전술한 실시형태에서, 정보 은닉 장치(31)의 출력부(33)는 집계 장치(21)의 조건 입력부(23)에 의해 입력이 접수된 검색 조건을 기초로, 검색 조건에 대응하는 전체의 통계 인원수를 출력하고 있지만, 이 통계 인원수는 속성별로 구분하여 출력해도 된다. 예를 들면, 검색 조건이 "시각=t, 위치 정보∈A 지역, 연령=30대"라고 접수되었을 때, 출력부(33)는 성별마다 통계 인원수를 출력해도 되고, 연령마다 통계 인원수를 출력해도 되며, 연령 및 성별마다 통계 인원수를 출력해도 된다.
또한, 집계 장치(21)에서는, 다음과 같은 단계에서, 추출부(24)에 의해, 위치 정보와 속성 정보를 결합한 데이터(이하, 간단히 "위치 데이터"라고 함)에 대하여, 휴대 단말기(2)에 의해 생성된 위치 정보에 대한 추정 생성 밀도에 대응하는 정보인 특징량 wij를 부여하고, 이 위치 데이터의 집합을 통계부(26)에 의해 집계함으로써 재권수 추계를 행해도 된다. 여기서 말하는 "추정 생성 밀도"는 상기 위치 정보를 생성한 단말기가 상기 위치 정보의 생성 시각 주변에서 단위 시간당 생성하는 신호수의 추정 값을 의미한다.
먼저, 단말기 수 추계의 생각 및 계산방법을 설명한다. 도 5에 나타내는 모델과 같이, 어느 관측기간(길이 T) 사이에, n개의 단말기 a1, a2, …, an이 무선 기지국(3)의 섹터 S를 통과하고, 각 단말기 ai의 관측기간 내의 섹터 S의 체재 시간이 ti(0<ti≤T)이었다고 한다. 이 경우, 섹터 S에 존재하는 단말기 수 m(실제로는, 섹터 S에 존재하는 단말기 수 m의 관측기간 내에서의 평균 값)은 이하의 식 (1)로 나타낸다.
[식 1]
즉, 각 단말기 ai의 관측기간 내의 섹터 S의 체재 시간 ti의 총합을 관측 기간의 길이 T로 제산한 결과를, 단말기 수 m으로서 추계한다. 다만, 단말기 ai의 관측기간 내의 섹터 S의 체재 시간 ti의 진정한 값은 관측 불가능하지만, 각 단말기 ai는 위치 정보(예를 들면, 위치 등록 신호이며, 이하에서는 간단히 "신호"라고 함)를 발신하고, 이들 신호는 관측 가능하다.
단말기 ai가 관측기간 내에 섹터 S에서 발신한 신호를, 시각 순으로
(xi는, 단말기 ai가 관측기간 내에 섹터 S에서 발신한 신호의 총수)로 하면, 단말기 수의 추계는 관측된 신호 qij(j는 1 이상 xi 이하의 정수)로부터 m의 값을 추계하는 것이 된다.
그런데, 도 6에 따라 단말기 수 추계의 계산방법을 설명한다. 단말기 ai로부터 신호 qij가 송신되는 밀도(즉, 단위 시간당의 신호수)를 pi로 한다. 이 경우, 신호가 송신되는 확률이 섹터에 대하여 독립적이면, 단말기 ai가 관측기간 내에 섹터 S에서 발신한 신호의 총수 xi의 기대값 E(xi)는, E(xi)=ti×pi이므로, 단말기 ai의 관측기간 내의 섹터 S의 체재 시간 ti의 기대값 E(ti)에 대하여 이하의 식 (2)가 성립한다.
[식 2]
E(ti)=xi/pi
여기서, 신호 qij의 송신 시각을 uij로 했을 때, 신호 qij의 밀도 pij는, 이하의 식 3에서 부여된다.
[식 3]
pij=2/(ui (j+1)-ui (j-1))
여기서, 신호 qij를, 특징량 wij를 구하는 대상의 위치 데이터(제1 위치 데이터)에 관한 신호로 하면, 신호 qi (j-1)는 상기 제1 위치 데이터와 동일한 식별 정보를 포함하는 위치 데이터 중에서 상기 제1 위치 데이터의 직전의 위치 데이터(제2 위치 데이터)에 관한 신호에 상당하며, 신호 qi (j+1)는 상기 제1 위치 데이터와 동일한 식별 정보를 포함하는 위치 데이터 중에서 상기 제1 위치 데이터의 직후의 위치 데이터(제3 위치 데이터)에 관한 신호에 상당한다. 본 실시형태에서, 제2 위치 데이터에 관한 신호 qi (j-1)의 송신 시각 ui (j-1)와 제3 위치 데이터에 관한 신호 qi (j+1)의 송신 시각 ui (j+1)의 차, 즉 상기 식 (3)의 (ui (j+1)-ui (j-1))를 제1 위치 데이터에 대한 특징량 wij로 한다. 그러므로, 상기 식 (3)은 이하로 된다. 즉, 특징량 wij는 밀도 pij의 역수에 대응시켜 산출할 수 있다.
[식 4]
pij=2/(ui (j+1)-ui (j-1))=2/wij
집계 장치(21)의 추출부(24)는 집계 대상의 모든 위치 데이터에 대하여 특징량 wij를 부가한다.
이 경우, 밀도 pi는,
[식 5]
으로 부여되므로 단말기 수 m의 추계치 E(m)는 이하의 식 (6)에서 계산할 수 있다.
[식 6]
도 6의 예로 나타낸 바와 같이, 관측기간 내이며 또한 단말기 ai가 섹터 S에 체재하고 있던 기간 내에, 단말기 ai는 신호 qi1, qi2, qi3를 송신하고, 신호 qi1의 직전에 신호 qi0를, 신호 qi3의 직후에 신호 qi4를 송신하는 것으로 하고, 신호 qi0, qi1, qi2, qi3, qi4의 송신 시각을 각각 ui0, ui1, ui2, ui3, ui4로 하면, 상기의 생각은 단말기 ai의 관측기간 내의 섹터 S의 체재 시간 ti를 (ui0과 ui1의 중간 점)으로부터 (ui3과 ui4의 중간 점)까지의 기간이라고 추계하는 것에 상당한다.
상기의 생각에 따라 집계 장치(21)의 통계부(26)는 데이터 집합에 포함되는 모든 위치 데이터에 부가된 특징량 wij를 특정하고, 이들 특징량 wij의 총합을 관측기간 길이 T의 2배에 의해 제산하여 얻어진 수치를 섹터 S마다, 속성마다 단말기 수로 하여 추계한다. 그리고, 통계부(26)는 추계된 단말기 수에 확대 계수를 곱하는 것에 의해 섹터 S마다, 속성마다 추계 단말기 수를 산출한다. 그리고, 식 (6)으로부터 명백한 바와 같이, 통계부(26)는 관측 대상 위치 데이터에 대한 특징량 wij 각각을 2로 제산하여, (특징량 wij/2)의 총합을 구하고, 구한 총합을 관측기간 길이 T에 의해 제산하여 얻어진 수치를 단말기 수로 추계해도 된다. 다만, 본 실시형태와 같이 관측 대상 위치 데이터에 대한 특징량 wij의 총합을 관측기간 길이 T의 2배에 의해 제산하는 계산방법 쪽이, 제산의 횟수가 압도적으로 적어지게 되기 때문에, 처리 부하를 경감할 수 있는 장점이 있다. 또한, 통계부(26)는 추계 단말기 수를 산출할 때는, 속성마다 확대 계수를 곱한 특징량 wij의 총합을 구하고, 구한 총합을 관측기간 길이 T의 2배에 의해 제산하여 얻어진 수치를 섹터 S마다, 속성마다 추계 단말기 수라고 추계해도 된다. 또한, 통계부(26)는 섹터 S마다 추계 단말기 수를 메시 등의 다른 영역 구분마다 인구 추계수로 변환(영역 변환)하여 통계 데이터를 산출해도 된다.
이 영역 변환의 방법으로서는, 예를 들면, 섹터 S마다 추계 단말기 수 등의 추계 인원수가 산출되어 있는 경우에, 미리 섹터마다 메시나 시읍면(행정구역) 등의 복수 개의 영역 구분에 대한 안분 비율을 관리한다. 그리고, 통계부(26)는 각 메시마다 추계된 추계 인원수를 그 안분 비율에 따라 복수 개의 영역 구분으로 안분하고, 각 영역 구분마다 안분된 추계 인원수를 가산하는 것에 의해 영역 구분마다 추계 인원수로 변환할 수 있다.
또한, 집계 장치(21)에서는, 다음과 같은 단계에서, 위치 정보와 속성 정보를 결합한 위치 데이터를 대상으로 하여, 관측기간 중 적어도 일부에서 관측 영역에 체재한 고유 단말기 수인 "가입 단말기 수"나 관측기간 중 적어도 일부에서 관측 영역에 체재한 고유 인원수인 "가입수"를 추계해도 된다.
여기서, 도 7을 사용하여, 본 발명의 가입 단말기 수 추계 방법에 관한 가입 단말기 수 추계 처리를 설명한다. 여기서는, 휴대 단말기의 위치 데이터에 포함되는 위치 정보에는, 일례로서, 상기 휴대 단말기가 재권하는 섹터의 섹터 번호가 부여되어 있는 것으로 한다. 또한, 여기서는, 관측기간 정보로서, 관측 개시 시각 t0와 관측 종료시각 t1의 세트가 조건 입력부(23)에 의해 미리 취득되고, 관측 영역 정보로서, 섹터 번호 S가 조건 입력부(23)에 의해 미리 취득된 것으로 한다.
먼저, 추출부(24)는 저장부(22)에 축적된 위치 데이터로부터 관측기간 중 적어도 일부에서 관측 영역에 체재했다고 추정되는 단말기 또는 상기 단말기에 의해 관측기간 내 또는 후술하는 확장기간 내에 생성된 1개의 위치 데이터를 추출한다. 여기서의 추출 방법은, 다양한 방법을 채용하고 있지만, 이하에서는, 일례로서, 관측 영역의 각 단말기의 추정 체재 기간을 사용한 방법을 설명한다.
추출부(24)는 동일 단말기에 관한 위치 데이터에서, 취득시각이 후술하는 확장기간 내이고 위치 정보가 관측 영역 내를 나타내는 영역 내 위치 데이터 및 취득 시각 순으로 시계열로 배열된 경우에 상기 영역 내 위치 데이터에 인접하고 위치 정보가 관측 영역 밖을 나타내는 영역 밖 위치 데이터에 따라 단말기가 관측 영역 내에 체재하고 있던 추정 체재 기간을 단말기마다 산출한다(도 7의 단계 S1). 그리고, 상기의 "확장기간"은, 여기서는 일례로서, 관측기간을 전후에 소정 시간 폭(예를 들면, 1시간)만큼 확장한 기간, 즉 관측 개시 시각 t0로부터 소정 시간만큼 과거로 거슬러 갔을 때의 시각을 개시 점으로 하고, 관측 종료시각 t1로부터 소정 시간만큼 미래로 진행했을 때 시각을 종료 점으로 하는 기간을 의미한다.
도 8에 나타낸 바와 같이, 확장기간 내에 취득된 동일 단말기에 관한 일련의 위치 데이터를 취득시각 순으로 시계열로 정렬하고 위치 정보가 관측 영역 내를 나타내는 영역 내 위치 데이터를 검은 원으로 나타내고, 영역 내 위치 데이터에 인접 하고 위치 정보가 관측 영역 밖을 나타내는 영역 밖 위치 데이터를 비어 있는 원으로, 각각 나타낸 경우, 시계열 상에서 가장 빠른 영역 내 위치 데이터의 취득시각 ta와 상기 가장 빠른 영역 내 위치 데이터에 인접하는 영역 밖 위치 데이터의 취득시각 tx의 안분 지점(일례로서, 중간 지점)에 상당할 때의 시각 tin를 추정 체재 기간의 개시 시각으로 한다. 마찬가지로, 시계열 상에서 가장 늦은 영역 내 위치 데이터의 취득시각 tc와 상기 가장 늦은 영역 내 위치 데이터에 인접하는 영역 밖 위치 데이터의 취득시각 ty의 안분 지점(일례로서, 중간 지점)에 상당할 때의 시각 tout를 추정 체재 기간의 종료시각으로 한다. 이로써, 도 8에 직사각형으로 나타낸 기간, 즉 시각 tin로부터 시각 tout까지의 기간이 상기 단말기의 추정 체재 기간으로서 산출된다.
그리고, 추출부(24)는 산출된 추정 체재 기간과 관측기간이 중복되는 단말기를 추출한다(도 7의 단계 S2). 도 9에는, 확장기간 내에 취득된 단말기 A~E에 관한 일련의 위치 데이터를 단말기마다 취득 시각 순으로 시계열로 가로축 방향으로 배열된 도면을 나타내고, 도 9에서는, 위치 정보가 관측 영역 내를 나타내는 영역 내 위치 데이터를 검은 원으로, 위치 정보가 관측 영역 밖을 나타내는 영역 밖 위치 데이터를 비어 있는 원으로 각각 나타내고 있다. 만일, 취득시각이 관측기간(시각 t0~시각 t1) 내에 있는 영역 내 위치 데이터에만 주목하면, 대응하는 단말기로서는 단말기(C~E)의 3개가 추출된다.
그런데, 도 9에 직사각형으로 나타낸 추정 체재 기간과 관측기간(시각 t0~시각 t1)이 중복되는 단말기로서는, 단말기(A~E)의 5개를 들 수 있으므로, 단계 S2에서는 단말기(A~E)의 5개가 추출된다. 이로써, 검은 원으로 나타내는 영역 내 위치 데이터에만 주목하고 경우에 제외되는 단말기(A, B)에 대해서도, 관측기간 중의 어디선가 관측 영역 내에 체재하고 있었다고 추정된다. 그리고, 전술한 단계 S1, S2에서의 추정 체재 기간을 사용한 방법은 일례이며, 다른 방법을 채용해도 된다. 다른 방법에 대하여는 후술한다.
다음에, 통계부(26)는 단계 S1, S2에 의해 추출된 단말기의 수를 카운트하고, 얻어진 카운트 수를 관측기간 내에서의 관측 영역의 가입 단말기 수로 추계한다(도 7의 단계 S3).
다음에, 확대 계수 부여부(25)는 추출된 단말기 각각에 대하여 대응하는 속성 정보를 기초로 하여 가입 단말기 수를 가입 수로 변환하기 위한 확대 계수를 도출한다(도 7의 단계 S4). 또한, 단말기 계약율 등의 확대 계수가 시각에 따라 변동하는 경우, 확대 계수 부여부(25)는 추정 체재 기간과 관측기간이 중복되는 기간의 선두 시각을 추출하고, 얻어진 선두 시각에 대응하는 확대 계수를 도출하는 것에 매우 적합하다.
다음에, 통계부(26)는 확대 계수 부여부(25)에 의해 도출된, 단말기마다 위치 데이터 각각에 대한 확대 계수를 집계하고, 얻어진 확대 계수의 총합을 관측기간 내에서의 관측 영역의 가입 수로 추계한다(도 7의 단계 S5). 그리고, 통계부(26)는 추계에 의해 얻어진 가입 수를 정보 은닉 장치(31)에 출력한다(도 7의 단계 S6). 이 경우, 단계 S3에서 얻어진 가입 단말기 수도 병행하여 출력해도 된다.
또한, 상기 실시형태에서는, 확대 계수 부여부(25)가 속성 정보에 대응하는 계약율의 역수를 확대 계수와 부여하고 있지만, 단말기의 재권 비율을 반영한 확대 계수를 부여해도 된다. 예를 들면, 확대 계수 부여부(25)는 재권 비율을 반영한 확대 계수로서, "소정 범위의 지역에서의 인구"에서 차지하는 "위치 데이터를 구한 특정 통신 사업자의 계약 단말기 수"의 비율인 "단말기 계약율"의 역수를 사용할 수 있다. 이 "위치 데이터를 구한 특정 통신 사업자의 계약 단말기 수"는 저장부(22)에 저장된 위치 데이터로부터 집계할 수 있다. 이와 같은 확대 계수는 주소 구분마다, 연령층마다, 성별마다, 시간대마다 계산할 수 있다.
또한, 정보 은닉 장치(31)에 의한 은닉 처리는 다음과 같이 실행되어도 된다.
정보 은닉 장치(31)는 통계부(26)로부터 추계치(추계 인구 등)를 취득했을 때, 예를 들면, 도 10에 나타내는 은닉 처리를 행한다. 즉, 판정부(32)는 추계의 기초가 된 영역(셀)마다 위치 데이터가 몇 대의 단말기로부터 취득된 것인지를 나타내는 취득원 단말기 수가 은닉 처리가 필요하다고 판단하기 위한 미리 정해진 기준 값(일례로서, 10) 미만인지 여부를 판정한다(도 10의 단계 S61). 그리고, 취득원 단말기 수는 동일 단말기에 대한 중복을 제외한 고유 단말기 수를 나타낸다. 여기서, 판정을 행하는 데는 영역(셀)마다 위치 데이터의 취득원 단말기 수가 필요하지만, 일례로서, 집계부(27)는 통계부(26)에 의해 위치 데이터에 대응한 특징량이 집계되는 경우, 상기 위치 데이터 내의 식별 정보(예를 들면, 전술한 비식별화 위치 데이터 생성부(16)에 의한 비식별화 처리 후의 해시 처리된 전화 번호)의 수를 카운트하고, 얻어진 해시 처리된 전화 번호 총수의 정보를 판정부(32)에 전달하며, 판정부(32)가 해시 처리된 전화 번호 총수를 영역(셀)마다 위치 데이터의 취득원 단말기 수로서 사용해도 된다.
더 구체적으로, 통계부(26)는 섹터 S로부터 영역 구분으로의 영역 변환을 실행하고 있는 경우, 판정부(32)는 집계부(27)에 의해 집계되는 영역 구분마다 위치 데이터의 취득원 단말기 수를 판정한다. 예를 들면, 어느 영역 구분 Q가 섹터 SA와 섹터 SB에 걸쳐 있는 경우, 집계 대상의 관측기간의 사이에, 섹터 SA에서는 단말기 식별 번호: ID1, ID2, ID3, ID4, ID5, ID6의 6대의 휴대 단말기(2)로부터의 위치 등록 신호가 관측되고, 섹터 SB에서는, 단말기 식별 번호: ID4, ID5, ID6, ID7, ID8의 5대의 휴대 단말기(2)로부터의 위치 등록 신호가 관측된 것으로 한다. 이와 같은 경우, 판정부(32)의 판정은 각 섹터 SA, SB마다 취득원 단말기 수의 총합은 아니고, 영역 구분 Q에 대하여, 그 추계의 기초가 된 위치 데이터가 몇 대의 단말기로부터 취득된 것인지를 나타내는 영역 구분 Q의 취득원 단말기 수를 사용하여 행해진다. 상기한 예에서, 섹터 SA에서는 고유 단말기 수가 6이고, 섹터 SB에서는 고유 단말기 수가 5이지만, 판정부(32)가 판정 대상으로 하는 취득원 단말기 수는 영역 구분 Q에 대하여 산출된 취득원 단말기 수는 8개가 된다. 만일 기준 값이 10대이면, 취득원 단말기 수가 기준 값 미만으로 되므로, 판정부(32)는 상기 영역 구분 Q의 추계 값을 은닉 대상으로 한다.
단계 S61에 의해, 추계의 기초가 된 영역(셀)마다 위치 데이터의 취득원 단말기 수가 기준 값 미만이라면, 출력부(33)는 상기 영역(셀)에 관한 추계 값을 제로로 함으로써, 상기 추계 값을 은닉한다(단계 S62). 그리고, 이 은닉 방법은 추계 값을 제로로 하는 것에 한정되지 않고, 추계 값을 소정의 문자나 기호(예를 들면, "X" 등)로 표상하는 방법 등 다른 방법을 채용해도 된다.
한편, 단계 S61에 의해, 추계의 기초가 된 영역(셀)마다 위치 데이터의 취득원 단말기 수가 기준 값 이상이면, 출력부(33)는 상기 영역(셀)에 관한 추계치에 대하여, 다음과 같은 추계치 출력에 의해 사용되는 계급 폭의 확률적 라운드처리를 행한다(단계 S63). 즉, 어느 영역(셀)에 관한 추계 값을 x, 계급 폭을 k로 하면, 출력부(33)는 kn≤x<k(n+1)(n는 정수)의 경우에, 상기 추계치 x를, 확률 (x-kn)/k에서 k(n+1)로 라운드처리하고, 확률(k(n+ (1-x)/k에서 kn으로 라운드처리한다.
예를 들면, 추계치 x가 23, 계급 폭 k가 10인 경우, k×2≤x<k(2+1)이므로, n=2로 되고, 추계치 "23"은 확률 0.3(30%의 확률)에서 "30"으로 라운드처리하고, 확률 0.7(70%의 확률)에서 "20"으로 라운드처리한다.
이상의 같은 정보 은닉 장치(31)에 의한 은닉 처리에 의해, 추계 결과로부터의 개인 특정을 방지하여 추계 결과의 유용성을 높일 수 있다. 또한, 은닉한 값이 다른 값으로부터 추측하게 되는 문제를 미리 방지할 수 있다.
그리고, 확률적 라운드처리에서의 계급 폭은, 집계에 사용한 위치 데이터 중 확대 계수가 최대의 것을 추출하고, 그 확대 계수를 소정 배수(예를 들면, 10배)로 한 값을 계급 폭으로 설정해도 된다. 또한, 미리 계급 폭을 결정하여 두고, 확률적 라운드처리를 실시해도 된다. 이 경우, 확대 계수가 미리 정해진 계급 폭의 소정 비율(예를 들면, 1/10)을 초과하는 위치 데이터를 포함하는 영역(셀)의 데이터는 폐기한다는 처리 규칙을 채용해도 된다.
또한, 정보 은닉 장치(31)에 의한 은닉 처리는, 도 10에 나타내는 처리에 한정되지 않고, 다른 처리를 채용해도 된다. 예를 들면, 도 10의 단계 S61에서는, "추계의 기초가 된 영역(셀)마다의 위치 데이터의 취득원 단말기 수"를 대신하여, "추계의 기초가 된 영역(셀)마다의 위치 데이터의 개수"가 기준 값 미만이지 아닌지를 판정해도 되고, "출력되는 추계치(인구 또는 단말기 수)"가 기준 값 미만이지 아닌지를 판정해도 된다. 또한, 도 10의 단계 S61에서 부정으로 판정된 경우에는, 단계 S63의 처리를 생략해도 된다.
상기 통계 정보 생성 시스템에서는, 미리 정해진 전자 키 정보를 유지하는 키 관리 수단과, 제1 식별 정보 및 제2 식별 정보가 입력되어, 제1 식별 정보 및 제2 식별 정보 각각에 대하여, 키 관리 수단이 유지하는 전자 키 정보를 사용한 일방향 함수를 적용하여, 제1 비식별화 정보 및 제2 비식별화 정보를 출력하는 일방향 연산 수단과, 위치 정보 축적 데이터로부터 제1 식별 정보를 삭제하는 동시에 위치 정보 축적 데이터에 대하여, 일방향 연산 수단에 의해 출력된 제1 비식별화 정보를 제1 식별 정보로서 부가하여 위치 정보 축적 데이터를 생성하는 비식별화 위치 데이터 생성 수단과, 속성 정보 축적 데이터로부터 제2 식별 정보를 삭제하는 동시에 속성 정보 축적 데이터에 대하여, 일방향 연산 수단에 의해 출력된 제2 비식별화 정보를 제2 식별 정보로서 부가하여 속성 정보 축적 데이터를 생성하는 비식별화 속성 데이터 생성 수단을 추가로 구비한 것이 바람직하다. 이 경우, 제1 및 제2 식별 정보에 의해 서로 대응시킬 수 있는 위치 정보 축적 데이터와 속성 정보 축적 데이터로부터, 각각 제1 및 제2 식별 정보가 제거된 다음 제1 및 제2 비식별화 정보가 부여된다. 제1 및 제2 비식별화 정보는, 미리 유지된 전자 키 정보와 제1 및 제2 식별 정보를 일방향성 함수에 대입함으로써 얻어진 것이며, 비식별화 정보로부터 식별 정보를 역산할 수 없다. 또한, 일방향성 함수를 미리 알고 있었다고 해도, 전자 키의 값이 비밀로 되어 있는 한, 식별 정보를 무작위로 일방향성 함수에 입력한 것으로도 식별 정보와 비식별화 정보의 대응 관계를 알 수 없다. 그 결과, 위치 정보 축적 데이터나 속성 정보 축적 데이터에 포함되는 식별 정보로부터의 개인의 식별을 방지할 수 있다. 또한, 식별 정보는 비식별화 정보로 치환되기 때문에, 식별 정보를 사용한 검색 조건을 부여함으로써, 특정 개인의 행동을 나타내는 것 같은 통계 처리를 행하는 것을 미리 막을 수 있다.
또한, 비식별화 속성 데이터 생성 수단은, 속성 정보 축적 데이터에 포함되는 속성 정보를, 정보를 추상화한 추상화 속성 정보로 치환하고, 추출 수단은 추상화된 추상화 속성 정보와 검색 조건 정보를 대조함으로써, 비식별화 속성 정보 축적 데이터의 일부를 추출하는 것이 바람직하다. 이렇게 하면, 추상화된 속성 정보를 단위로 한 통계 데이터를 얻는 것에 의해 인구 동태의 개략을 알 수 있는 동시에, 통계 데이터를 기초로 한 개인의 식별을 더 곤란하게 할 수 있다.
또한, 추출 수단은 위치 정보 축적 데이터에 대하여, 검색 조건 정보와의 일치율을 나타내는 확률 정보를 부여하고, 통계 수단은 위치 정보 축적 데이터에 부여된 확률 정보에 대하여 확대 계수를 곱함으로써 통계 데이터를 산출하는 것도 바람직하다. 이러한 구성을 사용하면, 위치 정보와 검색 조건의 일치율이 확률로서 얻어지는 경우, 그 확률이 반영된 통계 데이터를 얻을 수 있고, 전체의 인구 동태 경향이 반영된 통계 데이터를 얻을 수 있다.
또한, 추출 수단은 위치 정보 축적 데이터를 기초로 하여, 이동 통신 단말기에 의해 생성된 위치 정보에 관한 추정 생성 밀도에 대응하는 값을 추계해 특징량으로 부여하고, 통계 수단은 위치 정보 축적 데이터에 부여된 체재 시간 정보에 대하여 확대 계수를 곱함으로써 통계 데이터를 산출하는 것도 바람직하다. 이러한 구성을 채택하면, 섹터에 존재하는 체재 시간을 추계해 그 체재 시간이 반영된 통계 데이터를 얻을 수 있고, 전체의 인구 동태 경향이 반영된 통계 데이터를 얻을 수 있다.
[산업상의 이용 가능성]
본 발명은, 위치 정보 집계 장치 및 위치 정보 집계 방법을 사용 용도로 하고, 다양한 오차를 생기는 위치결정 방식을 이용한 경우라도, 오차가 적은 고정밀도의 인구 분포를 산출할 수 있다.
1 통계 정보 생성 시스템, 2 휴대 단말기(이동 통신 단말기), 11 비식별화 정보 생성 장치, 12 제1 입력부(제1 입력 수단, 13 제2 입력부(제2 입력 수단), 14 키 관리부(키 관리 수단), 15 일방향 연산부(일방향 연산 수단), 16 비식별화 위치 데이터 생성부(비식별화 위치 데이터 생성 수단), 17 비식별화 속성 데이터 생성부(비식별화 속성 데이터 생성 수단), 21 집계 장치, 23 조건 입력부(조건 입력 수단), 24 추출부(추출 수단), 25 확대 계수 부여부(확대 계수 부여 수단), 26 통계부(통계 수단), 27 집계부(집계 수단), 31 정보 은닉 장치, 32 판정부(판정 수단), 33 출력부(출력 수단)
Claims (9)
- 이동 통신 단말기를 식별하는 제1 식별 정보, 상기 이동 통신 단말기의 위치에 관한 위치 정보, 및 상기 위치 정보가 취득된 시각에 관한 시각 정보를 포함하는 위치 정보 축적 데이터를 입력하는 제1 입력 수단;
이동 통신 단말기를 식별하는 제2 식별 정보, 및 상기 이동 통신 단말기의 계약자에 관한 속성 정보를 포함하는 속성 정보 축적 데이터를 입력하는 제2 입력 수단;
상기 위치 정보 축적 데이터 및 상기 속성 정보 축적 데이터에 대한 검색 조건 정보를 입력하는 조건 입력 수단;
상기 검색 조건 정보를 기초로, 상기 위치 정보 축적 데이터 및 상기 속성 정보 축적 데이터의 일부를 추출하는 추출 수단;
상기 추출 수단에 의해 추출된 상기 속성 정보 축적 데이터에 대하여, 상기 속성 정보 축적 데이터에 포함되는 속성 정보에 대응하는 계수로서, 통계 대상의 수치로의 확대 정도를 나타내는 확대 계수를 부여하는 확대 계수 부여 수단;
상기 추출 수단에 의해 추출된 상기 위치 정보 축적 데이터, 상기 추출 수단에 의해 추출되고 상기 위치 정보 축적 데이터에 포함되는 상기 제1 식별 정보에 대응하는 상기 제2 식별 정보를 가지는 상기 속성 정보 축적 데이터, 및 상기 속성 정보 축적 데이터에 부여된 상기 확대 계수를 사용하여 인구에 관한 통계 데이터를 산출하여 출력하는 통계 수단;
상기 추출 수단에 의해 추출된 상기 위치 정보 축적 데이터의 데이터 수를 집계하는 집계 수단;
상기 집계 수단에 의해 집계된 상기 데이터 수를 소정 값과 비교함으로써 상기 데이터 수의 대소를 판정하는 판정 수단; 및
상기 판정 수단에 의해 상기 데이터 수가 크다고 판정된 경우에는, 상기 통계 데이터를 출력하고, 상기 판정 수단에 의해 상기 데이터 수가 작다고 판정된 경우에는, 상기 통계 데이터에 포함되는 수치를 은폐해서 출력하는 출력 수단
을 포함하는 것을 특징으로 하는 통계 정보 생성 시스템. - 제1항에 있어서,
상기 집계 수단은, 상기 추출 수단에 의해 추출된 위치 정보 축적 데이터 중의 고유한 상기 제1 식별 정보의 개수를 상기 데이터 수로 하여 집계하는, 통계 정보 생성 시스템. - 제2항에 있어서,
상기 집계 수단은, 상기 통계 수단에 의한 집계 단위인 영역 구분마다의 고유한 상기 제1 식별 정보의 개수를 상기 데이터 수로 하여 집계하는, 통계 정보 생성 시스템. - 제1항 내지 제3항 중 어느 한 항에 있어서,
미리 정해진 전자 키 정보를 유지하는 키 관리 수단;
상기 제1 식별 정보 및 상기 제2 식별 정보가 입력되고, 상기 제1 식별 정보 및 상기 제2 식별 정보 각각에 대하여 상기 키 관리 수단이 유지하는 상기 전자 키 정보를 사용한 일방향 함수를 적용하여, 제1 비식별화 정보 및 제2 비식별화 정보를 출력하는 일방향 연산 수단;
상기 위치 정보 축적 데이터로부터 상기 제1 식별 정보를 삭제하는 동시에, 상기 위치 정보 축적 데이터에 대하여 상기 일방향 연산 수단에 의해 출력된 상기 제1 비식별화 정보를 상기 제1 식별 정보로서 부가하여 위치 정보 축적 데이터를 생성하는 비식별화 위치 데이터 생성 수단; 및
상기 속성 정보 축적 데이터로부터 상기 제2 식별 정보를 삭제하는 동시에, 상기 속성 정보 축적 데이터에 대하여 상기 일방향 연산 수단에 의해 출력된 상기 제2 비식별화 정보를 상기 제2 식별 정보로서 부가하여 속성 정보 축적 데이터를 생성하는 비식별화 속성 데이터 생성 수단
을 더 포함하는 통계 정보 생성 시스템. - 제4항에 있어서,
상기 비식별화 속성 데이터 생성 수단은, 상기 속성 정보 축적 데이터에 포함되는 속성 정보를, 정보를 추상화한 추상화 속성 정보로 치환하고,
상기 추출 수단은, 상기 추상화된 추상화 속성 정보와 상기 검색 조건 정보를 대조함으로써, 상기 비식별화 속성 정보 축적 데이터의 일부를 추출하는, 통계 정보 생성 시스템. - 제1항 내지 제5항 중 어느 한 항에 있어서,
상기 추출 수단은, 상기 위치 정보 축적 데이터에 대하여, 검색 조건 정보와의 일치율을 나타내는 확률 정보를 부여하고,
상기 통계 수단은, 상기 위치 정보 축적 데이터에 부여된 상기 확률 정보에 대하여 상기 확대 계수를 곱함으로써 상기 통계 데이터를 산출하는, 통계 정보 생성 시스템. - 제1항 내지 제5항 중 어느 한 항에 있어서,
상기 추출 수단은, 상기 위치 정보 축적 데이터를 기초로 하여, 상기 이동 통신 단말기에 의해 생성된 상기 위치 정보에 관한 추정 생성 밀도에 대응하는 값을 추계하여 특징량으로 하여 부여하고,
상기 통계 수단은, 상기 위치 정보 축적 데이터에 부여된 상기 특징량에 대하여 상기 확대 계수를 곱함으로써 상기 통계 데이터를 산출하는, 통계 정보 생성 시스템. - 이동 통신 단말기를 식별하는 제1 식별 정보, 상기 이동 통신 단말기의 위치에 관한 위치 정보, 및 상기 위치 정보가 취득된 시각에 관한 시각 정보를 포함하는 위치 정보 축적 데이터를 입력하는 제1 입력 수단;
이동 통신 단말기를 식별하는 제2 식별 정보, 및 상기 이동 통신 단말기의 계약자에 관한 속성 정보를 포함하는 속성 정보 축적 데이터를 입력하는 제2 입력 수단;
미리 정해진 전자 키 정보를 유지하는 키 관리 수단;
상기 제1 식별 정보 및 상기 제2 식별 정보가 입력되고, 상기 제1 식별 정보 및 상기 제2 식별 정보 각각에 대하여, 상기 키 관리 수단이 유지하는 상기 전자 키 정보를 사용한 일방향 함수를 적용하여, 제1 비식별화 정보 및 제2 비식별화 정보를 출력하는 일방향 연산 수단;
상기 위치 정보 축적 데이터로부터 상기 제1 식별 정보를 삭제하는 동시에, 상기 위치 정보 축적 데이터에 대하여, 상기 일방향 연산 수단에 의해 출력된 상기 제1 비식별화 정보를 부가하여 비식별화 위치 정보 축적 데이터를 생성하는 비식별화 위치 데이터 생성 수단;
상기 속성 정보 축적 데이터로부터 상기 제2 식별 정보를 삭제하는 동시에, 상기 속성 정보 축적 데이터에 대하여, 상기 일방향 연산 수단에 의해 출력된 상기 제2 비식별화 정보를 부가하여 비식별화 속성 정보 축적 데이터를 생성하는 비식별화 속성 데이터 생성 수단;
상기 비식별화 위치 정보 축적 데이터 및 상기 비식별화 속성 정보 축적 데이터에 대한 검색 조건 정보를 입력하는 조건 입력 수단;
상기 검색 조건 정보를 기초로, 상기 비식별화 위치 정보 축적 데이터 및 상기 비식별화 속성 정보 축적 데이터의 일부를 추출하는 추출 수단;
상기 추출 수단에 의해 추출된 상기 비식별화 속성 정보 축적 데이터에 대하여, 상기 비식별화 속성 정보 축적 데이터에 포함되는 속성 정보에 대응하는 계수로서, 통계 대상의 수치로의 확대 정도를 나타내는 확대 계수를 부여하는 확대 계수 부여 수단;
상기 추출 수단에 의해 추출된 상기 비식별화 위치 정보 축적 데이터, 및 상기 추출 수단에 의해 추출되고 상기 비식별화 위치 정보 축적 데이터에 포함되는 상기 제1 비식별화 정보에 대응하는 상기 제2 비식별화 정보를 가지는 상기 비식별화 속성 정보 축적 데이터;
상기 비식별화 속성 정보 축적 데이터에 부여된 상기 확대 계수를 사용하여, 인구에 관한 통계 데이터를 산출하여 출력하는 통계 수단;
상기 추출 수단에 의해 추출된 상기 비식별화 위치 정보 축적 데이터의 데이터 수를 집계하는 집계 수단;
상기 집계 수단에 의해 집계된 상기 데이터 수를 소정 값과 비교함으로써 상기 데이터 수의 대소를 판정하는 판정 수단; 및
상기 판정 수단에 의해 상기 데이터 수가 크다고 판정된 경우에는, 상기 통계 데이터를 출력하고, 상기 판정 수단에 의해 상기 데이터 수가 작다고 판정된 경우에는, 상기 통계 데이터에 포함되는 수치를 은폐해서 출력하는 출력 수단
을 포함하는 것을 특징으로 하는 통계 정보 생성 시스템. - 제1 입력 수단이, 이동 통신 단말기를 식별하는 제1 식별 정보, 상기 이동 통신 단말기의 위치에 관한 위치 정보, 및 상기 위치 정보가 취득된 시각에 관한 시각 정보를 포함하는 위치 정보 축적 데이터를 입력하는 제1 입력 단계;
제2 입력 수단이, 이동 통신 단말기를 식별하는 제2 식별 정보, 및 상기 이동 통신 단말기의 계약자에 관한 속성 정보를 포함하는 속성 정보 축적 데이터를 입력하는 제2 입력 단계;
조건 입력 수단이, 상기 위치 정보 축적 데이터 및 상기 속성 정보 축적 데이터에 대한 검색 조건 정보를 입력하는 조건 입력 단계;
추출 수단이, 상기 검색 조건 정보를 기초로, 상기 위치 정보 축적 데이터 및 상기 속성 정보 축적 데이터의 일부를 추출하는 추출 단계;
확대 계수 부여 수단이, 상기 추출 수단에 의해 추출된 상기 속성 정보 축적 데이터에 대하여, 상기 속성 정보 축적 데이터에 포함되는 속성 정보에 대응하는 계수로서, 통계 대상의 수치로의 확대 정도를 나타내는 확대 계수를 부여하는 확대 계수 부여 단계;
통계 수단이, 상기 추출 수단에 의해 추출된 상기 위치 정보 축적 데이터, 상기 추출 수단에 의해 추출되고 상기 위치 정보 축적 데이터에 포함되는 상기 제1 식별 정보에 대응하는 상기 제2 식별 정보를 가지는 상기 속성 정보 축적 데이터, 및 상기 속성 정보 축적 데이터에 부여된 상기 확대 계수를 사용하여, 인구에 관한 통계 데이터를 산출하여 출력하는 통계 단계;
집계 수단이, 상기 추출 수단에 의해 추출된 상기 위치 정보 축적 데이터의 데이터 수를 집계하는 집계 단계;
판정 수단이, 상기 집계 수단에 의해 집계된 상기 데이터 수를 소정 값과 비교함으로써 상기 데이터 수의 대소를 판정하는 판정 단계; 및
출력 수단이, 상기 판정 수단에 의해 상기 데이터 수가 크다고 판정된 경우에는, 상기 통계 데이터를 출력하고, 상기 판정 수단에 의해 상기 데이터 수가 작다고 판정된 경우에는, 상기 통계 데이터에 포함되는 수치를 은폐해서 출력하는 출력 단계
를 포함하는 것을 특징으로 하는 통계 정보 생성 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2010-099855 | 2010-04-23 | ||
JP2010099855 | 2010-04-23 | ||
PCT/JP2011/058730 WO2011132534A1 (ja) | 2010-04-23 | 2011-04-06 | 統計情報生成システム及び統計情報生成方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127029458A Division KR20120139844A (ko) | 2010-04-23 | 2011-04-06 | 통계 정보 생성 시스템 및 통계 정보 생성 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140135244A true KR20140135244A (ko) | 2014-11-25 |
Family
ID=44834065
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147028590A KR20140135244A (ko) | 2010-04-23 | 2011-04-06 | 통계 정보 생성 시스템 및 통계 정보 생성 방법 |
KR1020127029458A KR20120139844A (ko) | 2010-04-23 | 2011-04-06 | 통계 정보 생성 시스템 및 통계 정보 생성 방법 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127029458A KR20120139844A (ko) | 2010-04-23 | 2011-04-06 | 통계 정보 생성 시스템 및 통계 정보 생성 방법 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8903791B2 (ko) |
EP (1) | EP2562711A4 (ko) |
JP (1) | JP5406981B2 (ko) |
KR (2) | KR20140135244A (ko) |
CN (1) | CN102859547A (ko) |
BR (1) | BR112012027137A2 (ko) |
RU (1) | RU2527754C2 (ko) |
WO (1) | WO2011132534A1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101585985B1 (ko) * | 2015-01-19 | 2016-01-15 | 경희대학교 산학협력단 | 개인정보 비식별화 전송장치 및 전송방법 |
KR102115329B1 (ko) * | 2019-08-12 | 2020-05-26 | 대영유비텍 주식회사 | 공개키 기반의 개인 정보 비식별화 시스템 및 방법 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013125393A (ja) * | 2011-12-14 | 2013-06-24 | Zenrin Datacom Co Ltd | ユーザ情報出力システム、ユーザ情報出力方法及びユーザ情報出力プログラム |
JP5797120B2 (ja) * | 2012-01-24 | 2015-10-21 | 株式会社Nttドコモ | 情報分析装置および人口分布算出方法 |
JP5758315B2 (ja) * | 2012-01-27 | 2015-08-05 | 日本電信電話株式会社 | 匿名データ提供システム、匿名データ装置、及びそれらが実行する方法 |
JP5670366B2 (ja) * | 2012-01-27 | 2015-02-18 | 日本電信電話株式会社 | 匿名データ提供システム、匿名データ装置、それらが実行する方法、およびプログラム |
JP2013222305A (ja) * | 2012-04-16 | 2013-10-28 | Research Organization Of Information & Systems | 緊急時情報管理システム |
JP6210780B2 (ja) * | 2013-07-30 | 2017-10-11 | 株式会社ゼンリンデータコム | 推定値算出装置、推定値算出方法及びプログラム |
WO2020085993A1 (en) * | 2018-10-26 | 2020-04-30 | Eureka Analytics Pte. Ltd. | Mathematical summaries of telecommunications data for data analytics |
US20230169414A1 (en) * | 2020-04-23 | 2023-06-01 | Ntt Docomo, Inc. | Population extraction device |
US20220138260A1 (en) * | 2020-10-30 | 2022-05-05 | Here Global B.V. | Method, apparatus, and system for estimating continuous population density change in urban areas |
JP7164762B1 (ja) * | 2021-10-15 | 2022-11-01 | 楽天グループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7136631B1 (en) * | 2000-11-09 | 2006-11-14 | Nortel Networks Limited | Apparatus and method to provide one-click logon service for wireless devices |
JP4582939B2 (ja) * | 2001-03-07 | 2010-11-17 | ソニー株式会社 | 情報管理システム、情報管理方法、および情報処理装置、情報処理方法、並びにプログラム |
JP2003030373A (ja) * | 2001-07-10 | 2003-01-31 | Fujitsu Ltd | 人口分布解析装置 |
US7010779B2 (en) * | 2001-08-16 | 2006-03-07 | Knowledge Dynamics, Inc. | Parser, code generator, and data calculation and transformation engine for spreadsheet calculations |
JP2003122877A (ja) * | 2001-10-09 | 2003-04-25 | Oki Electric Ind Co Ltd | 地域内人口算出システム |
JP4417132B2 (ja) * | 2004-02-19 | 2010-02-17 | 日本電信電話株式会社 | プライバシ情報管理サーバ及び方法並びにプログラム |
JP2005286657A (ja) | 2004-03-29 | 2005-10-13 | Victor Co Of Japan Ltd | 人口密集度情報収集システム |
JPWO2006121161A1 (ja) * | 2005-05-12 | 2008-12-18 | 株式会社エヌ・ティ・ティ・ドコモ | 通信機器の検索システム |
DE102006018645B4 (de) * | 2006-04-21 | 2008-07-24 | Nokia Siemens Networks Gmbh & Co.Kg | Verfahren, Vorrichtungen und Computerprogrammprodukt zum Ver- und Entschlüsseln von Mediendaten |
KR100818549B1 (ko) | 2006-09-27 | 2008-04-01 | 김성엽 | 휴대용 단말기의 위치 정보를 기반으로 한 실시간 정보제공 서비스 방법 |
CN101083785A (zh) * | 2007-07-04 | 2007-12-05 | 贾林 | 获得人口信息的方法及系统 |
JP5057924B2 (ja) * | 2007-10-15 | 2012-10-24 | 株式会社エヌ・ティ・ティ・ドコモ | 配信サーバ、通信システム及び通信方法 |
WO2009119393A1 (ja) * | 2008-03-24 | 2009-10-01 | 日本電気株式会社 | マージン設計装置、マージン設計システム、マージン設計方法及びプログラム |
US8352493B2 (en) * | 2008-06-04 | 2013-01-08 | Hw Llc | Searchable health events directory |
WO2010066472A1 (en) * | 2008-12-08 | 2010-06-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Presence service time zone information |
JP4364936B1 (ja) * | 2009-02-27 | 2009-11-18 | ソフトバンクBb株式会社 | 流動性人口推定システム、流動性人口推定方法及び流動性人口推定プログラム |
US8401899B1 (en) * | 2009-06-15 | 2013-03-19 | Adchemy, Inc. | Grouping user features based on performance measures |
US8359238B1 (en) * | 2009-06-15 | 2013-01-22 | Adchemy, Inc. | Grouping user features based on performance measures |
-
2011
- 2011-04-06 CN CN201180019852XA patent/CN102859547A/zh active Pending
- 2011-04-06 EP EP11771870.0A patent/EP2562711A4/en not_active Withdrawn
- 2011-04-06 WO PCT/JP2011/058730 patent/WO2011132534A1/ja active Application Filing
- 2011-04-06 KR KR1020147028590A patent/KR20140135244A/ko not_active Application Discontinuation
- 2011-04-06 BR BR112012027137A patent/BR112012027137A2/pt not_active IP Right Cessation
- 2011-04-06 JP JP2012511606A patent/JP5406981B2/ja active Active
- 2011-04-06 RU RU2012149859/08A patent/RU2527754C2/ru not_active IP Right Cessation
- 2011-04-06 KR KR1020127029458A patent/KR20120139844A/ko not_active IP Right Cessation
- 2011-04-06 US US13/642,643 patent/US8903791B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101585985B1 (ko) * | 2015-01-19 | 2016-01-15 | 경희대학교 산학협력단 | 개인정보 비식별화 전송장치 및 전송방법 |
US10769304B2 (en) | 2015-01-19 | 2020-09-08 | University-Industry Cooperation Group Of Kyung Hee University | Apparatus and method for transmitting personal information in individually unidentifiable way |
KR102115329B1 (ko) * | 2019-08-12 | 2020-05-26 | 대영유비텍 주식회사 | 공개키 기반의 개인 정보 비식별화 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2011132534A1 (ja) | 2013-07-18 |
CN102859547A (zh) | 2013-01-02 |
WO2011132534A1 (ja) | 2011-10-27 |
US8903791B2 (en) | 2014-12-02 |
RU2527754C2 (ru) | 2014-09-10 |
EP2562711A1 (en) | 2013-02-27 |
BR112012027137A2 (pt) | 2016-07-26 |
RU2012149859A (ru) | 2014-05-27 |
KR20120139844A (ko) | 2012-12-27 |
JP5406981B2 (ja) | 2014-02-05 |
EP2562711A4 (en) | 2015-01-14 |
US20130073577A1 (en) | 2013-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20140135244A (ko) | 통계 정보 생성 시스템 및 통계 정보 생성 방법 | |
WO2012050176A1 (ja) | 位置情報集計装置及び位置情報集計方法 | |
US8924433B2 (en) | Methods for geotemporal fingerprinting | |
RU2530349C1 (ru) | Устройство для оценивания количества терминалов и способ оценивания количества терминалов | |
EP3132592B1 (en) | Method and system for identifying significant locations through data obtainable from a telecommunication network | |
EP3014904B1 (en) | Categorized location identification based on historical locations of a user device | |
KR20190139130A (ko) | 피셀 알고리즘을 이용하여 실시간 유동 인구 데이터의 제공이 가능한 유동인구 정보 분석 방법 | |
CN111148018B (zh) | 基于通信数据识别定位区域价值的方法和装置 | |
MX2013001160A (es) | Agregacion de informacion de distribucion demografica. | |
KR20130052014A (ko) | 단말기 수 추계 장치 및 단말기 수 추계 방법 | |
CN109195219B (zh) | 服务器确定移动终端位置的方法 | |
WO2018059122A1 (zh) | 服务推荐方法、终端、服务器和存储介质 | |
US20130176433A1 (en) | Unique-terminal-count estimation device and unique-terminal-count estimation method | |
EP2875623A1 (en) | Method and system for traffic estimation | |
US20150113024A1 (en) | Generating social graphs using coincident geolocation data | |
JP2015056018A (ja) | 携帯端末を所持したユーザの滞在目的を推定する装置、プログラム及び方法 | |
JP2013121073A (ja) | 位置情報分析装置及び位置情報分析方法 | |
CN112954626A (zh) | 手机信令数据分析方法、装置、电子设备及存储介质 | |
JP2012054921A (ja) | 移動機分布算出システム及び移動機分布算出方法 | |
CN108600413B (zh) | 定位方法及装置和电子设备 | |
CN110807052A (zh) | 用户群分类方法、装置、设备及存储介质 | |
JPWO2012036222A1 (ja) | 人口算出システム及び人口算出方法 | |
EP2693376A1 (en) | Information processing device and method for estimating number of terminals | |
JP2012059254A (ja) | 人口算出装置および人口算出方法 | |
JP7201783B1 (ja) | 情報処理装置及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |