RU2527754C2 - Система генерирования статистической информации и способ генерирования статистической информации - Google Patents

Система генерирования статистической информации и способ генерирования статистической информации Download PDF

Info

Publication number
RU2527754C2
RU2527754C2 RU2012149859/08A RU2012149859A RU2527754C2 RU 2527754 C2 RU2527754 C2 RU 2527754C2 RU 2012149859/08 A RU2012149859/08 A RU 2012149859/08A RU 2012149859 A RU2012149859 A RU 2012149859A RU 2527754 C2 RU2527754 C2 RU 2527754C2
Authority
RU
Russia
Prior art keywords
information
data
data storing
location
attribute
Prior art date
Application number
RU2012149859/08A
Other languages
English (en)
Other versions
RU2012149859A (ru
Inventor
Масаюки ТЕРАДА
Итиро ОКАДЗИМА
Юки ОЯБУ
Original Assignee
Нтт Докомо, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Нтт Докомо, Инк. filed Critical Нтт Докомо, Инк.
Publication of RU2012149859A publication Critical patent/RU2012149859A/ru
Application granted granted Critical
Publication of RU2527754C2 publication Critical patent/RU2527754C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Complex Calculations (AREA)

Abstract

Изобретение относится к компьютерной технике, а именно к генерированию статистической информации. Технический результат - возможность скрытия идентификационных данных личности в статистических данных в случае использования данных о местоположении, полученных при помощи телефонной сети. Система генерирования статистической информации включает в себя секцию ввода условия, секцию извлечения, которая извлекает неидентифицируемые данные о местоположении и неидентифицируемые атрибутивные данные, секцию добавления коэффициента увеличения, которая добавляет коэффициент увеличения к неидентифицируемым атрибутивным данным, секцию статистики, которая вычисляет статистические данные посредством использования неидентифицируемых данных о местоположении, неидентифицируемых атрибутивных данных и коэффициента увеличения, секцию подсчета, которая подсчитывает неидентифицируемые данные о местоположении, секцию определения, которая определяет величину количества порций данных, и секцию вывода, которая скрывает статистические данные для вывода статистических данных. 3 н. и 6 з.п. ф-лы, 10 ил.

Description

Область техники, к которой относится изобретение
Настоящее изобретение относится к системе генерирования статистической информации и способу генерирования статистической информации.
Уровень техники
Известно устройство для получения информации о местоположении портативного терминала и анализа распределения населения пользователей портативного терминала на основе информации о местоположении (см. патентную литературу 1 и 2). Посредством использования информации о местоположении портативного терминала таким образом, в отличие от случая использования демографических данных, полученных посредством переписи населения и т.п., также может быть получено распределение населения, отражающее тенденцию передвижения пользователей.
Например, устройство, описанное в патентной литературе 1, вычисляет распределение населения, соответствующее целевым областям и демографическим характеристикам целевой группы посредством использования базы данных, которая хранит информацию о местоположении каждого портативного терминала. Кроме того, устройство, описанное в патентной литературе 2, генерирует итоговый результат ответных сигналов терминалов, которые принимают сигнал подтверждения терминала для каждой базовой станции, в качестве информации о плотности населения.
Такая традиционная статистическая обработка распределения населения использует рабочие данные, такие как данные о местоположении портативного терминала и атрибутивные данные пользователя, в качестве данных для предложения услуги связи пользователю портативного терминала. Посредством применения статистической обработки, такой как подсчет рабочих данных, может быть получено оценочное значение, связанное с передвижением населения, включающее в себя «распределение населения», «количество передвигающихся людей» и «состав населения». В данном случае «распределение населения» означает количество населения, распределенное в каждой области, «количество движущихся людей» означает количество людей, передвигающихся между областями, и «состав населения» означает распределение населения и количество движущихся людей, которые разделены по полу, возрастной категории.
Список ссылок
Патентная литература
[Патентная литература 1] Опубликованная заявка на патент Японии № 2003-30373.
[Патентная литература 2] Опубликованная заявка на патент Японии № 2005-286657.
Сущность изобретения
Техническая проблема
Однако в вышеупомянутой традиционной статистической обработке, так как все люди, подлежащие подсчету, не имеют своих собственных портативных терминалов, точное передвижение населения не может быть получено простым суммированием данных о местоположении портативных терминалов. Чтобы получить точное передвижение населения, например, посредством умножения данных о местоположении, полученных от портативных терминалов, на обратную величину соотношения абонентов для каждого атрибута абонентов портативных терминалов для вычисления взвешенной суммы, необходимо оценить все население, включая в подсчет людей, не имеющих портативные терминалы.
Соответственно, при попытке оценить передвижение населения в соответствии с традиционной технологией статистической обработки, имеет место следующая проблема. В частности, это проблема скрытия. Когда выполняется статистическая обработка, информация об индивидуальных портативных терминалах теряется и только статистическая тенденция группы представлена в итоговом результате. Однако, когда итоговая информация генерируется в слишком маленьком итоговом диапазоне во время хода статистической обработки, в статистических данных могут появиться идентификационные данные личности. С другой стороны, когда итоговая информация генерируется в излишне приблизительном итоговом диапазоне, ухудшается практичность оценочных данных. Чтобы решить эту проблему, при традиционной статистической обработке данных об обществе результирующие статистические данные могут подвергаться обработке, называемой «обработкой скрытия». То есть, если значение в итоговой таблице падает ниже некоторого значения (упоминаемого как эталонный уровень скрытия), итоговый результат не отображается или отображается как ноль. Однако, как описано выше, при оценке населения с использованием данных о местоположении от сети мобильной телефонной связи, так как находится взвешенная сумма, полученная посредством умножения данных на разные весовые коэффициенты для разных атрибутов абонентов, необходимость или отсутствие необходимости скрытия не может быть определена просто посредством сравнения оценочного значения с эталонным уровнем скрытия по величине.
Поэтому настоящее изобретение выполнено с учетом такой проблемы и его задачей является обеспечение системы генерирования статистической информации и способа генерирования статистической информации, которые могут скрывать идентификационные данные личности в статистических данных в случае использования данных о местоположении, полученных при помощи мобильной телефонной сети.
Решение проблемы
Для решения вышеупомянутой проблемы система генерирования статистической информации настоящего изобретения включает в себя: первое средство ввода, которое вводит данные, хранящие информацию о местоположении, включающие в себя первую идентификационную информацию, идентифицирующую терминал мобильной связи, информацию о местоположении терминала мобильной связи и временную информацию о времени, когда получена информация о местоположении; второе средство ввода, которое вводит данные, хранящие атрибутивную информацию, включающие в себя вторую идентификационную информацию, идентифицирующую терминал мобильной связи, и атрибутивную информацию об абоненте терминала мобильной связи; средство ввода условия, которое вводит информацию условия поиска для данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию; средство извлечения, которое извлекает часть данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию, на основе информации условия поиска; средство добавления коэффициента увеличения, которое добавляет к данным, хранящим атрибутивную информацию, извлеченным средством извлечения, коэффициент увеличения, соответствующий атрибутивной информации, включенной в данные, хранящие атрибутивную информацию, и указывающий степень увеличения до значения статистической цели; средство статистики, которое вычисляет и выводит статистические данные по населению посредством использования данных, хранящих информацию о местоположении, извлеченных средством извлечения, данных, хранящих атрибутивную информацию, извлеченных средством извлечения и имеющих вторую идентификационную информацию, соответствующую первой идентификационной информации, включенной в данные, хранящие информацию о местоположении, и коэффициента увеличения, добавленного к данным, хранящим атрибутивную информацию; средство подсчета, которое подсчитывает количество порций данных, хранящих информацию о местоположении, извлеченных средством извлечения; средство определения, которое определяет величину количества порций данных посредством сравнения количества порций данных, подсчитанных средством подсчета, с предварительно определенным значением; и средство вывода, которое выводит статистические данные, когда средство определения определяет, что количество порций данных является большим, и скрывает значение, включенное в статистические данные, для вывода статистических данных, когда средство определения определяет, что количество порций данных является малым.
Альтернативно способ генерирования статистической информации настоящего изобретения включает в себя: первый этап ввода в первом средстве ввода для ввода данных, хранящих информацию о местоположении, включающих в себя первую идентификационную информацию, идентифицирующую терминал мобильной связи, информацию о местоположении терминала мобильной связи и временную информацию о времени, когда получена информация о местоположении; второй этап ввода во втором средстве ввода для ввода данных, хранящих атрибутивную информацию, включающих в себя вторую идентификационную информацию, идентифицирующую терминал мобильной связи, и атрибутивную информацию об абоненте терминала мобильной связи; этап ввода условия в средстве ввода условия для ввода информации условия поиска для данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию; этап извлечения в средстве извлечения для извлечения части данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию, на основе информации условия поиска; этап добавления коэффициента увеличения в средстве добавления коэффициента увеличения для добавления к данным, хранящим атрибутивную информацию, извлеченным средством извлечения, коэффициента увеличения, соответствующего атрибутивной информации, включенной в данные, хранящие атрибутивную информацию, и указывающего степень увеличения до значения статистической цели; этап статистики в средстве статистики для вычисления и вывода статистических данных по населению посредством использования данных, хранящих информацию о местоположении, извлеченных средством извлечения, данных, хранящих атрибутивную информацию, извлеченных средством извлечения и имеющих вторую идентификационную информацию, соответствующую первой идентификационной информации, включенной в данные, хранящие информацию о местоположении, и коэффициента увеличения, добавленного к данным, хранящим атрибутивную информацию; этап подсчета в средстве подсчета для подсчета количества порций данных, хранящих информацию о местоположении, извлеченных средством извлечения; этап определения в средстве определения для определения величины количества порций данных посредством сравнения количества порций данных, подсчитанных средством подсчета, с предварительно определенным значением; и этап вывода в средстве вывода для вывода статистических данных, когда средство определения определяет, что количество порций данных является большим, и скрытия значения, включенного в статистические данные, для вывода статистических данных, когда средство определения определяет, что количество порций данных является малым.
Согласно такой системе генерирования статистической информации или способу генерирования статистической информации демографические данные, учитывающие степень увеличения до значения статистической цели, вычисляются из данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию, на основе условия поиска. Кроме того, информация в качестве сведений для определения необходимости или отсутствия необходимости скрытия статистических данных обеспечивается посредством подсчета оценочных данных в качестве оценочного значения населения, учитывая соотношение абонентов портативного терминала в соответствии с атрибутом, а также количества порций данных в качестве действительного количества порций данных о местоположении, используемых для генерирования оценочных данных.
Кроме того, определяется, генерируются ли или нет оценочные статистические данные из «малой группы» на основе вышеупомянутого количества порций данных, и статистические данные скрываются на основе результата определения. Генерируются ли или нет оценочные статистические данные из «малой группы», не может быть определено только на основе статистического показателя в статистических данных. Это происходит вследствие того, что статистический показатель выводится в соответствии с расширенной оценкой, основанной на соотношении абонентов портативного терминала, которое меняется в соответствии с атрибутом. Таким образом, посредством использования подсчитанного количества порций данных может точно определяться, генерируются ли или нет подсчитанные данные из «малой группы».
В результате могут быть скрыты идентификационные данные личности в статистических данных, оцененных на основе данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию.
Полезные эффекты изобретения
Согласно настоящему изобретению в случае использования данных о местоположении, полученных посредством сети мобильной телефонной связи, могут быть скрыты идентификационные данные личности в статистических данных.
Краткое описание чертежей
Фиг.1 представляет собой схематический вид конфигурации, изображающий систему генерирования статистической информации согласно одному предпочтительному варианту осуществления настоящего изобретения.
Фиг.2 представляет собой вид, изображающий структуру данных для данных, хранящих информацию о местоположении, введенных в первую секцию ввода на фиг.1.
Фиг.3 представляет собой вид, изображающий структуру данных для данных, хранящих атрибутивную информацию, введенную во вторую секцию ввода на фиг.1.
Фиг.4 представляет собой блок-схему последовательности операций, изображающую операции системы генерирования статистической информации на фиг.1.
Фиг.5 представляет собой вид для объяснения принципа оценки количества терминалов в данном варианте осуществления.
Фиг.6 представляет собой вид для объяснения способа вычисления в соответствии с оценкой количества терминалов в данном варианте осуществления.
Фиг.7 представляет собой блок-схему последовательности операций, изображающую обработку оценки количества посещающих терминалов в данном варианте осуществления.
Фиг.8 представляет собой вид для объяснения способа вычисления оценочного периода пребывания в данном варианте осуществления.
Фиг.9 представляет собой вид для объяснения способа извлечения данных о местоположении в данном варианте осуществления.
Фиг.10 представляет собой блок-схему последовательности операций, изображающую пример обработки скрытия в данном варианте осуществления.
Описание вариантов осуществления
Ниже подробно описывается предпочтительный вариант осуществления системы генерирования статистической информации и способа генерирования статистической информации согласно настоящему изобретению со ссылкой на фигуры. Следует отметить, что в описании фигур одинаковым компонентам присвоены одинаковые ссылочные позиции и излишнее описание опускается.
Фиг.1 представляет собой схематический вид конфигурации, изображающий систему 1 генерирования статистической информации согласно одному предпочтительному варианту осуществления настоящего изобретения. Система 1 генерирования статистической информации, показанная на фиг.1, представляет собой компьютерную систему, которая генерирует статистические данные, включающие в себя оценочное значение передвижения населения посредством использования информации о местоположении в качестве данных для предложения услуги связи терминалам мобильной связи, таким как множество портативных терминалов 2 в сети NW мобильной связи. Система 1 генерирования статистической информации состоит из множества процессоров информации, включающих в себя устройство 11 генерирования неидентифицируемой информации, устройство 21 подсчета и устройство 31 скрытия информации, и позволяет выполнять передачу данных с портативными терминалами 2 и устройствами связи, подсоединенными к сети NW мобильной связи посредством базовой радиостанции 3 и сети NW мобильной связи. Система 1 генерирования статистической информации может включать в себя один процессор информации или может включать в себя любое количество процессоров информации.
Каждый портативный терминал 2, описанный выше, имеет функцию получения информации о своем местоположении в соответствии с различными системами операции позиционирования, такими как позиционирование посредством использования GPS и позиционирования посредством использования электрических волн от базовой радиостанции 3. Кроме того, информация о местоположении портативных терминалов 2, которая получается в результате операции позиционирования, является передаваемой с портативных терминалов 2 и устройств связи, подсоединенных к сети NW мобильной связи, на систему 1 генерирования статистической информации.
Ниже подробно описывается конфигурация системы 1 генерирования статистической информации.
Устройство 11 генерирования неидентифицируемой информации включает в себя первую секцию 12 ввода (первое средство ввода), вторую секцию 13 ввода (второе средство ввода), секцию 14 управления ключом (средство управления ключом), секцию 15 одностороннего действия (средство одностороннего действия), секцию 16 генерирования неидентифицируемых данных о местоположении (средство генерирования неидентифицируемых данных о местоположении) и секцию 17 генерирования неидентифицируемых атрибутивных данных (средство генерирования неидентифицируемых атрибутивных данных).
Первая секция 12 ввода принимает информацию о местоположении извне, например от сети NW мобильной связи, и сохраняет ее в данных, хранящих информацию о местоположении. Как показано на фиг.2, данные, хранящие информацию о местоположении, включают в себя: первую идентификационную информацию «090-ХХХХ-ХХХХ» в качестве информации для идентификации портативного терминала 2, например телефонный номер; информацию «X1 и Y1» о местоположении в качестве информации, относящейся к местоположению портативного терминала 2, например информации о широте и долготе или идентификационной информации базовой радиостанции 3, которая принимает сигнал регистрации местоположения портативного терминала 2; и время «2010/5/30 12:24», когда получается информация о местоположении. Кроме того, первая секция 12 ввода выводит хранимые данные, хранящие информацию о местоположении, на секцию 16 генерирования неидентифицируемых данных о местоположении.
Вторая секция 13 ввода принимает атрибутивные данные, указывающие атрибут портативного терминала 2, извне, например от сети NW мобильной связи, и сохраняет их в данных, хранящих атрибутивную информацию. Как показано на фиг.3, данные, хранящие атрибутивную информацию, включают в себя вторую идентификационную информацию «090-ХХХХ-ХХХХ» в качестве информации для идентификации портативного терминала 2, например телефонного номера, и атрибутивную информацию, указывающую атрибут абонента портативного терминала 2, идентифицированного на основе второй идентификационной информации, т.е. когда второй идентификационной информацией является телефонный номер, атрибут абонента этого телефона. Конкретные примеры такой атрибутивной информации включают в себя адрес «Tokyo, Shinjuku-ku», пол «мужской», возраст «тридцатилетние» в качестве типовых примеров. Следует отметить, что для этого же портативного терминала 2 первая идентификационная информация имеет такое же значение данных, что и вторая идентификационная информация. Кроме того, вторая секция 13 ввода выводит хранимые данные, хранящие атрибутивную информацию, на секцию 17 генерирования неидентифицируемых атрибутивных данных.
Ссылаясь снова на фиг.1, секция 14 управления ключом хранит предварительно определенную информацию электронного ключа. Желательно, чтобы информация электронного ключа управлялась строго, чтобы предотвратить утечку из средства управления ключом.
Секция 15 одностороннего действия принимает первую идентификационную информацию и вторую идентификационную информацию от секции 16 генерирования неидентифицируемых данных о местоположении и секции 17 генерирования неидентифицируемых атрибутивных данных соответственно и применяет одностороннюю функцию к каждой из первой идентификационной информации и второй идентификационной информации на основе информации электронного ключа, содержащейся в секции 14 управления ключом, для вывода первой неидентифицируемой информации и второй неидентифицируемой информации соответственно. Например, секция 15 одностороннего действия использует хеш-функцию, такую как SHA (алгоритм безопасного хеширования)-256 в качестве односторонней функции и выполняет операцию вывода хеш-значения соединения первой идентификационной информации или второй идентификационной информации и информации ключа, таким образом выводя первую неидентифицируемую информацию или вторую неидентифицируемую информацию.
Секция 16 генерирования неидентифицируемых данных о местоположении добавляет первую неидентифицируемую информацию, созданную посредством удаления первой идентификационной информации из данных, хранящих информацию о местоположении, и ввода первой идентификационной информации в секцию 15 одностороннего действия, к данным, хранящим информацию о местоположении, таким образом генерируя данные, хранящие неидентифицируемую информацию о местоположении. В данном случае является предпочтительным, что секция 16 генерирования неидентифицируемых данных о местоположении выполняет дополнительную обработку данных, например добавляет подходящий шум к информации о местоположении для сдвига местоположения. Кроме того, секция 16 генерирования неидентифицируемых данных о местоположении передает сгенерированные данные, хранящие неидентифицируемую информацию о местоположении, на устройство 21 подсчета.
Секция 17 генерирования неидентифицируемых атрибутивных данных добавляет вторую неидентифицируемую информацию, созданную посредством удаления второй идентификационной информации из данных, хранящих атрибутивную информацию, и ввода второй идентификационной информации в секцию 15 одностороннего действия, к данным, хранящим атрибутивную информацию, таким образом генерируя данные, хранящие неидентифицируемую атрибутивную информацию. В данном случае является предпочтительным, что секция 17 генерирования неидентифицируемых атрибутивных данных генерирует атрибутивную информацию абстрагирования, полученную посредством абстрагирования атрибутивной информации, и заменяет атрибутивную информацию атрибутивной информацией абстрагирования. Примеры такой обработки абстрагирования включают в себя округление «возраста» до «возрастной категории», удаление подробностей адреса и удаление информации, включающей в себя идентификационные данные личности, такие как имена. Кроме того, секция 17 генерирования неидентифицируемых атрибутивных данных передает сгенерированные данные, хранящие неидентифицируемую атрибутивную информацию, на устройство 21 подсчета.
Устройство 21 подсчета системы 1 генерирования статистической информации включает в себя секцию 22 хранения, секцию 23 ввода условия (средство ввода условия), секцию 24 извлечения (средство извлечения), секцию 25 добавления коэффициента увеличения (средство добавления коэффициента увеличения), секцию 26 статистики (средство статистики) и секцию 27 подсчета (средство подсчета).
Секция 22 хранения хранит данные, хранящие неидентифицируемую информацию о местоположении, и данные, хранящие неидентифицируемую атрибутивную информацию, которые генерируются устройством 11 генерирования неидентифицируемой информации.
Секция 23 ввода условия принимает ввод условия поиска для данных, хранящих неидентифицируемую информацию о местоположении, и данных, хранящих неидентифицируемую атрибутивную информацию, от запросчика статистической обработки. Условие поиска может вводиться непосредственно в систему 1 генерирования статистической информации или может приниматься посредством сети связи, такой как сеть NW мобильной связи. Например, когда запросчик пытается оценить «количество мужчин, которые присутствуют в области А в момент времени t», секция 23 ввода условия принимает ввод информации, соответствующей «момент времени = t, информация о местоположении ∈ области A, пол = мужской», в качестве условия поиска. Кроме того, секция 23 ввода условия передает принятое условие поиска на секцию 24 извлечения.
Секция 24 извлечения извлекает некоторые наборы данных, соответствующие условию поиска, переданные от секции 23 ввода условия, из данных, хранящих неидентифицируемую информацию о местоположении, и данных, хранящих неидентифицируемую атрибутивную информацию, хранимых в секции 22 хранения. Например, когда задается вышеупомянутое условие поиска, секция 24 извлечения извлекает набор данных, хранящих неидентифицируемую информацию о местоположении, которые соответствуют «момент времени = t, информация о местоположении ∈ области А», и набор данных, хранящих неидентифицируемую атрибутивную информацию, которые соответствуют «пол = мужской». Затем секция 24 извлечения выполняет операцию соединения в реляционной алгебре над соответствующими извлеченными наборами данных посредством использования первой неидентифицируемой информации и второй неидентифицируемой информации в качестве информации ключа. Таким образом, может быть получен набор данных, который получается посредством соединения информации о местоположении и атрибутивной информации, которая соответствует «момент времени = t, информация о местоположении ∈ области А, пол = мужской».
В данном случае, когда степень соответствия условию поиска получается как значение вероятности в результате сравнения условия поиска с данными, хранящими неидентифицируемую информацию о местоположении, секция 24 извлечения может добавить вероятностную информацию, указывающую значение вероятности, к данным, хранящим неидентифицируемую информацию о местоположении. Например, когда задается вероятностно, выполняется ли или нет «информация о местоположении ∈ области А», вероятность может быть добавлена к извлеченным наборам. Когда атрибутивная информация, включенная в данные, хранящие неидентифицируемую атрибутивную информацию, заменяется на атрибутивную информацию абстрагирования, секция 24 извлечения извлекает данные, хранящие неидентифицируемую атрибутивную информацию, посредством сравнения информации о местоположении абстрагирования с условием поиска. Например, когда атрибутивная информация абстрагирования устанавливается на «возраст: пятидесятилетние», определяется, что атрибутивная информация абстрагирования соответствует условию поиска «возраст = двадцатилетние - пятидесятилетние».
Основываясь на атрибутивной информации, включенной в данные, хранящие неидентифицируемую атрибутивную информацию, соединенные с данными, хранящими неидентифицируемую информацию о местоположении, секция 25 добавления коэффициента увеличения получает коэффициент увеличения в качестве числового значения и добавляет коэффициент увеличения к соединенному набору данных в соответствии с предварительно определенной процедурой. Коэффициент увеличения представляет собой коэффициент, указывающий степень увеличения значения населения статистической цели. Например, секция 25 добавления коэффициента увеличения предварительно сохраняет соотношение абонентов мобильного телефона для каждой комбинации возрастной категории и пола, такой как «тридцатилетние, мужской» и «двадцатилетние, женский», и добавляет обратную величину соответствующего соотношения абонентов набору данных, включающему в себя некоторую комбинацию возраста и пола в качестве атрибутивной информации, и выводит ее. Более конкретно, когда соотношение абонентов «тридцатилетние, мужской» удовлетворяется на 50% (=0,5), коэффициент увеличения «2,0» в качестве обратной величины «0,5» выводится в атрибутивную информацию «35 лет, мужской».
Секция 26 статистики вычисляет статистические данные, относящиеся к оценочному населению посредством использования набора данных, полученного посредством соединения данных, хранящих неидентифицируемую информацию о местоположении, и данных, хранящих неидентифицируемую атрибутивную информацию, которые извлекаются секцией 24 извлечения, друг с другом, и коэффициент увеличения, добавляемый секцией 25 добавления коэффициента увеличения. В частности, секция 26 статистики извлекает возраст и пол из атрибутивной информации для каждой информации, включенной в набор данных, и запрашивает получение секцией 25 добавления коэффициента увеличения соответствующего коэффициента увеличения. Кроме того, секция 26 статистики вычисляет общую сумму коэффициентов увеличения всех записей данных (элементов данных), включенных в набор данных, в качестве оценочного количества людей. В данном случае, когда некоторые записи данных, включенные в набор данных, добавляются с вероятностной информацией, указывающей значение вероятности, соответствующее условию поиска, секция 26 статистики может вычислить статистическое количество людей, беря общую сумму значений, полученных посредством умножения вероятностной информации на коэффициент увеличения. Кроме того, секция 26 статистики также выводит вычисленные статистические данные на устройство 31 скрытия информации.
Секция 27 подсчета подсчитывает количество порций данных записей данных (элементов данных) в наборе данных, извлеченном секцией 24 извлечения, и выводит подсчитанное значение в качестве подсчитанного количества людей на устройство 31 скрытия информации. В данном случае при вычислении подсчитанного количества людей не принимаются во внимание коэффициент увеличения и вероятностная информация. Причина заключается в следующем: так как устройство 31 скрытия информации должно определять необходимость или отсутствие необходимости скрытия статистических данных, основываясь на том, что «информация оценивается из такой группы, сколько пользователей портативных терминалов 2», необходимо исходное количество элементов данных перед обработкой взвешивания, использующей коэффициент увеличения и вероятностную информацию.
Устройство 31 скрытия информации системы 1 генерирования статистической информации включает в себя секцию 32 определения (средство определения) и секцию 33 вывода (средство вывода).
Секция 32 определения сравнивает количество порций данных, подсчитанных секцией 27 подсчета, с предварительно определенным значением для определения величины количества порций данных. Например, когда конкретное эталонное значение предварительно задается как «10», секция 32 определения определяет, равно ли или нет количество людей, которое подсчитано секцией 27 подсчета, «10» или больше. Когда количество людей равно 10 или больше в результате определения, секция 32 определения определяет, что подсчитанное количество людей является большим, и когда количество людей меньше 10, определяет, что подсчитанное количество людей является малым. Затем секция 32 определения передает результат определения на секцию 33 вывода.
Секция 33 вывода принимает решение, выводить ли или нет непосредственно статистические данные, включающие в себя оценочное количество людей, которое оценивается секцией 21 подсчета, на основе результата определения секции 32 определения и выводит окончательные статистические данные. Статистические данные могут выводиться на устройство вывода, такое как устройство отображения, обеспечиваемое непосредственно в системе 1 генерирования статистической информации, или может выводиться на удаленное устройство, такое как портативный терминал 2, посредством сети связи, такой как сеть NW мобильной связи. В частности, когда определяется, что подсчитанное количество людей является большим, секция 33 вывода непосредственно выводит оценочное количество людей, которое включено в статистические данные. С другой стороны, когда определяется, что подсчитанное количество людей является малым, секция 33 вывода заменяет оценочное количество людей предварительно определенным значением или символом и выводит его, таким образом скрывая оценочное количество людей. Например, оценочное количество людей выводится как «0» или заменяется символом «x», представляющим выводимое скрытие. Даже когда определяется, что подсчитанное количество людей является большим, является предпочтительным, что при рассмотрении возможности раскрытия остаточного значения оценочное количество людей округляется до приблизительного значения, имеющего некоторый числовой интервал, или значение, полученное посредством добавления случайного числа, выводится в качестве оценочного значения.
Ниже в данном документе, ссылаясь на фиг.4, описываются операции системы 1 генерирования статистической информации и подробно описывается способ генерирования статистической информации в системе 1 генерирования статистической информации. Фиг.4 представляет собой блок-схему последовательности операций, изображающую операции системы 1 генерирования статистической информации при генерировании статистической информации.
Сначала устройство 11 генерирования неидентифицируемой информации принимает вводы информации о местоположении и сохраняет их в данных, хранящих информацию о местоположении (этап S101). Затем секция 16 генерирования неидентифицируемых данных о местоположении устройства 11 генерирования неидентифицируемой информации удаляет первую идентификационную информацию из данных, хранящих информацию о местоположении, и добавляет первую неидентифицируемую информацию, полученную посредством ввода ее в секцию 15 одностороннего действия, к данным, хранящим информацию о местоположении, таким образом генерирует данные, хранящие неидентифицируемую информацию о местоположении, и сохраняет ее в секции 22 хранения устройства 21 подсчета (этап S102). После этого устройство 11 генерирования неидентифицируемой информации принимает вводы атрибутивной информации и сохраняет их в данных, хранящих атрибутивную информацию (этап S103). Затем секция 17 генерирования неидентифицируемых атрибутивных данных устройства 11 генерирования неидентифицируемой информации удаляет вторую идентификационную информацию из данных, хранящих атрибутивную информацию, и добавляет вторую неидентифицируемую информацию, полученную посредством ввода ее в секцию 15 одностороннего действия, к данным, хранящим атрибутивную информацию, таким образом генерирует данные, хранящие неидентифицируемую атрибутивную информацию, и сохраняет их в секции 22 хранения устройства 21 подсчета (этап S104).
Далее секция 23 ввода условия устройства 21 подсчета принимает ввод условия поиска для задания условия статистической обработки (этап S105). Например, секция 23 ввода условия принимает ввод информации, соответствующий «момент времени = t, информация о местоположении ∈ области A, пол = мужской» в качестве условия поиска для оценки «количества мужчин, которые присутствуют в момент t времени в области A». В ответ на это секция 24 извлечения извлекает набор данных, хранящих неидентифицируемую информацию о местоположении, и набор данных, хранящих неидентифицируемую атрибутивную информацию, которые соответствуют принятому условию поиска, из секции 22 хранения (этап S106). В частности, секция 24 извлечения извлекает набор данных, хранящих неидентифицируемую информацию о местоположении, соответствующих «момент времени = t, информация о местоположении ∈ области A», и набор данных, хранящих неидентифицируемую атрибутивную информацию, соответствующих «пол = мужской», из секции 22 хранения соответственно. Далее секция 24 извлечения выполняет операцию соединения над соответствующими извлеченными наборами посредством использования первой неидентифицируемой информации и второй неидентифицируемой информации в качестве ключей (этап S107). В результате секция 24 извлечения получает набор данных, соответствующий условию поиска.
Затем секция 26 статистики извлекает часть атрибутивной информации, например возраст и пол, из компонентов набора данных, извлеченного секцией 24 извлечения, и предоставляет эту часть секции 25 добавления коэффициента увеличения, таким образом получая коэффициент увеличения для каждого компонента (этап S108). После этого секция 26 статистики вычисляет общую сумму коэффициентов увеличения для получения оценочного количества людей (этап S109). Далее секция 27 подсчета вычисляет количество элементов набора данных, извлеченных секцией 24 извлечения, для получения подсчитанного количества людей (этап S110).
Предполагается, что секция 24 извлечения получает набор данных, состоящий из четырех элементов данных, причем каждый включает в себя элементарные группы данных «местоположение, момент времени, возраст, пол», как показано ниже.
Элемент 1: (A, t, 23, мужской)
Элемент 2: (A, t, 33, мужской)
Элемент 3: (A, t, 31, мужской)
Элемент 4: (A, t, 85, мужской)
В данном случае предполагается, что секция 25 добавления коэффициента увеличения содержит следующую информацию в качестве соотношения абонентов для пары возрастной категории и пола.
(двадцатилетние, мужской): 40% (=0,4)
(тридцатилетние, мужской): 50% (=0,5)
(восьмидесятилетние, мужской): 5% (=0,05)
В данном случае, при условии что коэффициент увеличения представляет собой обратную величину соотношения абонентов, следующие коэффициенты увеличения добавляются к соответствующим элементам.
Элемент 1: (A, t, 23, мужской): 2,5
Элемент 2: (A, t, 33, мужской): 2,0
Элемент 3: (A, t, 31, мужской): 2,0
Элемент 4: (A, t, 85, мужской): 20,0
Далее в вышеупомянутом примере оценочное количество людей, которое оценивается секцией 26 статистики, равно «26,5» и подсчитанное количество людей, которое вычисляется секцией 27 подсчета, равно «4».
Ссылаясь снова на фиг.4, после этого секция 32 определения устройства 31 скрытия информации определяет, является ли или нет подсчитанное количество людей, которое вычисляется секцией 27 подсчета, предварительно определенным значением или большим (этап S111). При условии, что конкретное эталонное значение устанавливается на «10», так как подсчитанное количество людей равно «4» в вышеупомянутом примере, подсчитанное количество людей определяется малым.
Наконец, секция 33 вывода принимает решение, выводить ли или нет непосредственно оценочное количество людей, основываясь на определении секции 32 определения, и выводит окончательное оценочное значение. Т.е. когда оценочное количество людей определяется большим (этап S111; ДА), секция 33 вывода выводит непосредственно оценочное количество людей в качестве оценочного значения (этап S112). С другой стороны, когда оценочное количество людей определяется малым (этап S111; НЕТ), оценочное количество людей заменяется предварительно определенным конкретным значением или символом и, таким образом, оценочное количество людей скрывается и выводится (этап S113). В вышеупомянутом примере, так как подсчитанное количество людей определяется малым, оценочное значение выводится, например, как «0».
Согласно вышеописанным системе 1 генерирования статистической информации и способу генерирования статистической информации, после того как первая и вторая идентификационная информация будет удалена из данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию, которые ассоциируются друг с другом на основе первой и второй идентификационной информации, добавляется первая и вторая неидентифицируемая информация. Первая и вторая неидентифицируемая информация получается посредством подстановки предварительно содержащейся информации электронного ключа и первой и второй идентификационной информации в одностороннюю функцию, и идентификационная информация не может быть вычислена в обратном направлении из неидентифицируемой информации. Кроме того, даже если односторонняя функция известна, до тех пор пока значение электронного ключа держится в секрете, даже если идентификационная информация вводится в одностороннюю функцию циклическим образом, нельзя узнать отношение соответствия между идентификационной информацией и неидентифицируемой информацией.
Кроме того, основываясь на условии поиска, демографические данные, применяющие степень увеличения к значению статистической цели, вычисляются из данных, хранящих неидентифицируемую информацию о местоположении, и данных, хранящих неидентифицируемую атрибутивную информацию, к которым добавляется неидентифицируемая информация. В данном случае, так как идентификационная информация заменяется неидентифицируемой информацией, статистическая обработка, которая позволяет раскрыть поведение любого конкретного человека, может быть предотвращена предоставлением условия поиска, использующего идентификационную информацию. Кроме того, информация, являющаяся сведениями для определения необходимости или отсутствия необходимости скрытия статистических данных, обеспечивается посредством подсчета оценочных данных в качестве оценочного значения населения, учитывающее соотношение абонентов портативных терминалов в соответствии с атрибутом, а также количество порций данных в качестве фактического количества порций данных о местоположении, используемых для генерирования оценочного значения.
Кроме того, определяется, являются ли или нет оценочные статистические данные информацией, генерируемой из «малой группы» на основе количества порций данных, подсчитанных таким образом, и статистические данные скрываются на основе результата определения. Нельзя определить, являются ли или нет оценочные статистические данные информацией, генерируемой из «малой группы» только из статистического значения в статистических данных. Это вследствие того, что статистическое значение выводится из оценки расширения, основанной на соотношении абонентов портативных терминалов, которое меняется в соответствии с атрибутом. Таким образом, посредством использования вышеупомянутого подсчитанного количества порций данных точно определяется, генерируются ли или нет подсчитанные данные из «малой группы».
В результате может предотвращаться идентификация любого человека на основе идентификационной информации, включенной в данные, хранящие информацию о местоположении, и данные, хранящие атрибутивную информацию, и могут быть скрыты идентификационные данные личности в оценочных статистических данных.
В системе 1 генерирования статистической информации атрибутивная информация, включенная в данные, хранящие атрибутивную информацию, заменяется атрибутивной информацией абстрагирования, полученной посредством абстрагирования информации, атрибутивная информация абстрагирования сравнивается с информацией условия поиска, и, таким образом, извлекается часть данных, хранящих неидентифицируемую атрибутивную информацию. Соответственно, посредством получения статистических данных в единицах абстрагированной атрибутивной информации может быть известен отчет о передвижении населения. Кроме того, делая статистические данные схематическими, может становиться более трудной идентификация любого человека на основе статистических данных.
Кроме того, так как статистические данные вычисляются посредством добавления вероятностной информации к данным, хранящим неидентифицируемую информацию о местоположении, и умножения вероятностной информации на коэффициент увеличения, когда степень соответствия между информацией о местоположении и условием поиска получается в качестве вероятности, могут быть получены статистические данные, отражающие вероятность, и, таким образом, могут быть получены статистические данные, отражающие общую тенденцию передвижения населения. Например, когда информация о местоположении получается в виде распределения вероятности в каждой области, могут быть получены статистические данные, отражающие распределение вероятности.
Следует отметить, что настоящее изобретение не ограничивается вышеупомянутым вариантом осуществления. Например, данные, хранящие информацию о местоположении, и данные, хранящие атрибутивную информацию, которые обрабатываются в системе 1 генерирования статистической информации, включают в себя телефонные номера в качестве первой и второй идентификационной информации, и система 1 генерирования статистической информации использует телефонные номера в качестве информации для идентификации портативных терминалов 2. Альтернативно система 1 генерирования статистической информации может обрабатывать номера для идентификации пользователей портативных терминалов 2, такие как международный идентификатор абонента мобильной связи (IMSI), и номера для идентификации устройств портативных терминалов 2, такие как международный идентификатор мобильного оборудования (IMEI), в качестве информации для идентификации портативных терминалов 2 вместо телефонных номеров.
Кроме того, секция 24 извлечения устройства 21 подсчета извлекает некоторые наборы данных, соответствующие условию поиска, из данных, хранящих неидентифицируемую информацию о местоположении, и данных, хранящих неидентифицируемую атрибутивную информацию, которые хранятся в секции 22 хранения. После того как секция 24 извлечения соединит данные, хранящие неидентифицируемую информацию о местоположении, и данные, хранящие неидентифицируемую атрибутивную информацию, друг с другом в соответствии с операцией соединения, вероятностная информация может быть добавлена к соединенным наборам данных, и некоторые наборы данных, соответствующие условию поиска, могут извлекаться из соединенных наборов данных. Кроме того, может извлекаться набор данных перед добавлением вероятностной информации или может извлекаться набор данных, к которому добавляется коэффициент увеличения посредством секции 25 добавления коэффициента увеличения.
Кроме того, хотя секция 26 статистики устройства 21 подсчета вычисляет общую сумму коэффициентов увеличения записей данных, включенных в набор данных, извлеченный секцией 24 извлечения, общая сумма записей данных, включенных в набор данных, может вычисляться для каждого атрибута, и общая сумма может умножаться на коэффициент увеличения, соответствующий рассматриваемому атрибуту. Например, статистическое количество людей, соответствующее атрибуту «тридцатилетние, мужской», сначала посредством вычисления общего количества записей данных или общей суммы значений вероятности записей данных, которые соответствуют атрибуту «тридцатилетние, мужской», включенному в набор данных, и затем умножения общего количества или общей суммы на коэффициент увеличения «2,0», соответствующий атрибуту «тридцатилетние, мужской».
Кроме того, в вышеупомянутом варианте осуществления на основе условия поиска, ввод которого принимается секцией 23 ввода условия устройства 21 подсчета, секция 33 вывода устройства 31 скрытия информации выводит полное статистическое количество людей, соответствующих условию поиска. Однако статистическое количество людей может быть разделено и выведено в соответствии с атрибутом. Например, когда условие поиска принимается как информация «момент времени = t, информация о местоположении ∈ области A, возраст = тридцатилетние», секция 33 вывода может выводить статистическое количество людей для каждого пола, может выводить статистическое количество людей для каждого возраста и может выводить статистическое количество людей для каждой комбинации возраста и пола.
Кроме того, в устройстве 21 подсчета в соответствии со следующей процедурой секция 24 извлечения может добавлять величину признака wij в качестве информации, соответствующей оценочной плотности поколения информации о местоположении, генерируемой портативными терминалами 2, к данным, полученным посредством соединения информации о местоположении и атрибутивной информации (ниже в данном документе упоминаемой просто как «данные о местоположении»), и секция 26 статистики может подсчитывать набор данных о местоположении для оценки количества терминалов в зоне обслуживания. «Оценочная плотность поколения», используемая в данном документе, означает оценочное значение количества сигналов, которые терминал, генерирующий информацию о местоположении, генерирует около времени генерирования информации о местоположении на единицу времени.
Сначала описывается принцип оценки количества терминалов и способ его вычисления. Как показано в модели на фиг.5, предполагается, что n терминалов a1, a2, …, an проходят через сектор S базовой радиостанции 3 в течение некоторого периода наблюдения (длительность T) и период пребывания каждого терминала ai в секторе S в течение периода наблюдения равен ti (0<ti≤T). В этот момент времени количество терминалов m, существующих в секторе S (фактически среднее значение количества терминалов m, существующих в секторе S в течение периода наблюдения), выражается следующим выражением (1).
[Формула 1]
Figure 00000001
Т.е. значение, полученное посредством деления общей суммы периода ti пребывания каждого терминала ai в секторе S в течение периода наблюдения длительностью T периода наблюдения, оценивается как количество терминалов m. Однако действительное значение периода ti пребывания каждого терминала ai в секторе S в течение периода наблюдения не может наблюдаться, но каждый терминал ai передает информацию о местоположении (например, сигнал регистрации местоположения и ниже в данном документе упоминаемый просто как «сигнал»), и сигнал может наблюдаться.
При условии что сигналы, передаваемые с терминала ai в секторе S в течение периода наблюдения, в порядке времени представляют собой
[Формула 2]
Figure 00000002
(xi представляет собой общее количество сигналов, передаваемых с терминала ai в секторе S в течение периода наблюдения), оценка количества терминалов не является ни больше, ни меньше оценки значения m на основе наблюдаемого сигнала qij (j представляет собой целое число не менее 1 и не более xi).
Как показано на фиг.6, описывается способ вычисления оценки количества терминалов. Плотность, в которой терминал ai передает сигнал qij (т.е. количество сигналов на единицу времени), определяется как pi. В этот момент времени, когда вероятность передачи сигнала является независимой от сектора, так как ожидаемое значение E(xi) общего количества xi сигналов, передаваемых с терминала ai в секторе S в течение периода наблюдения, равно ti × pi, ожидаемое значение E(ti) периода ti пребывания терминала ai в секторе S в течение периода наблюдения удовлетворяет следующему выражению (2).
Figure 00000003
В данном случае, при условии что время передачи сигнала qij равно uij, плотность pij сигнала qij задается следующим выражением (3).
Figure 00000004
В данном случае, при условии что сигнал qij представляет собой сигнал в соответствии с данными о местоположении (первые данные о местоположении) цели, величину признака wij которых необходимо найти, сигнал qi(j-1) соответствует сигналу в соответствии с данными о местоположении (вторые данные о местоположении) непосредственно перед первыми данными о местоположении из данных о местоположении, включающих в себя такую же идентификационную информацию, что и первые данные о местоположении, и сигнал qi(j+1) соответствует сигналу в соответствии с данными о местоположении (третьи данные о местоположении) непосредственно после первых данных о местоположении из данных о местоположении, включающих в себя такую же идентификационную информацию, что и первые данные о местоположении. В данном варианте осуществления разность между временем ui(j-1) передачи сигнала qi(j-1) в соответствии со вторыми данными о местоположении и временем ui(j+1) передачи сигнала qi(j+1) в соответствии с третьими данными о местоположении, т.е. (ui(j+1) - ui(j-1)) в выражении (3) определяется как величина признака wij первых данных о местоположении. По этой причине выражение (3) является следующим. Т.е. величина признака wij может быть вычислена в связи с обратной величиной плотности pij.
Figure 00000005
Секция 24 извлечения устройства 21 подсчета добавляет величину признака wij ко всем данным о местоположении цели подсчета.
В этот момент времени, так как плотность pi определяется по
[Формула 3]
Figure 00000006
оценочное значение E(m) количества терминалов m может вычисляться по следующему выражению (6).
[Формула 4]
Figure 00000007
Как показано в примере на фиг.6, при условии что терминал ai передает сигналы qi1, qi2 и qi3 в периоде, когда терминал ai пребывает в секторе S в течение периода наблюдения, сигнал qi0 передается непосредственно перед сигналом qi1, сигнал qi4 передается непосредственно после сигнала qi3, и моментами времени передачи сигналов qi0, qi1, qi2, qi3 и qi4 являются ui0, ui1, ui2, ui3 и ui4 соответственно, вышеупомянутый принцип оценки означает, что период ti пребывания терминала ai в секторе S в течение периода наблюдения соответствует периоду от (средней точки ui0 и ui1) до (средней точки ui3 и ui4).
Согласно вышеупомянутому принципу секция 26 статистики устройства 21 подсчета задает величину признаков wij, добавленных ко всем данным о местоположении, включенным в набор данных, и оценивает значение, полученное посредством деления общей суммы величины признаков wij на удвоенную длительность T периода наблюдения в качестве количества терминалов для каждого сектора S и каждого атрибута. Затем секция 26 статистики умножает количество терминалов, оцененных таким образом, на коэффициент увеличения для вычисления оценочного количества терминалов для каждого сектора S и каждого атрибута. Следует отметить, что, как очевидно из выражения (6), секция 26 статистики может делить каждую величину признака wij данных о местоположении, подлежащих наблюдению, на два и может вычислять общую сумму (величин признака wij/2) и оценивать значение, полученное посредством деления общей суммы на длительность T периода наблюдения в качестве количества терминалов. Однако в способе вычисления деления общей суммы величин признака wij данных о местоположении, подлежащих наблюдению, на удвоенную длительность T периода наблюдения, как в данном варианте осуществления, количество делений является очень малым и, таким образом, может быть выгодно снижена нагрузка от обработки. Кроме того, при вычислении оценочного количества терминалов секция 26 статистики может находить общую сумму величин признака wij, на которую коэффициент увеличения умножается для каждого атрибута, и оценивать значение, полученное посредством деления найденной общей суммы на удвоенную длительность T периода наблюдения в качестве оценочного количества терминалов для каждого сектора S и каждого атрибута. Кроме того, секция 26 статистики может преобразовывать оценочное количество терминалов для каждого сектора S в оценочное количество людей для каждого другого сегмента области, такого как ячейка (преобразование области) для вычисления статистических данных.
В качестве примера способа преобразования области, например, когда оценочное количество людей, такое как оценочное количество терминалов, было вычислено для каждого сектора S, предварительно организовывается пропорциональное распределение множества сегментов области, таких как ячейки, и крупные города, небольшие города и деревни для каждого сектора. Затем секция 26 статистики пропорционально делит оценочное количество людей, оцененное для каждой ячейки, на множество сегментов области в соответствии с пропорциональным распределением и суммирует оценочное количество людей, пропорционально разделенное для каждого сегмента области, таким образом преобразуя оценочное количество терминалов в оценочное количество людей для каждого сегмента области.
Согласно следующей процедуре, устройство 21 подсчета может оценивать «количество посещающих терминалов» в качестве уникального количества терминалов, пребывающих в области наблюдения в течение по меньшей мере части периода наблюдения, или «количество посетителей» в качестве уникального количества людей, пребывающих в области наблюдения в течение по меньшей мере части периода наблюдения, для данных о местоположении, полученных посредством соединения информации о местоположении и атрибутивной информации.
В данном случае, ссылаясь на фиг.7, описывается обработка оценки количества посещающих терминалов согласно способу оценки количества посещающих терминалов настоящего изобретения. В данном случае предполагается, что информации о местоположении, включенной в данные о местоположении портативного терминала, задается номер сектора для сектора, который обслуживает портативный терминал. Далее предполагается, что в качестве информации о периоде наблюдения пара момента t0 времени начала наблюдения и момента t1 времени окончания наблюдения предварительно получается секцией 23 ввода условия и в качестве информации об области наблюдения номер S сектора предварительно получается секцией 23 ввода условия.
Сначала секция 24 извлечения извлекает терминал, оцениваемый на пребывание в области наблюдения в течение по меньшей мере части периода наблюдения, или одну порцию данных о местоположении, генерируемых терминалом в течение периода наблюдения, или нижеупомянутый период расширения из данных о местоположении, хранимых в секции 22 хранения. Хотя могут применяться различные способы извлечения, ниже описывается в качестве примера способ, использующий оценочный период пребывания каждого терминала в области наблюдения.
Для данных о местоположении одного и того же терминала секция 24 извлечения вычисляет оценочный период пребывания, когда терминал пребывает в области наблюдения для каждого терминала на основе данных о местоположении внутри области, имеющих время получения в нижеупомянутом периоде расширения, и информации о местоположении, указывающей, что терминал находится внутри области наблюдения, и данных о местоположении вне области, которые являются смежными с данными о местоположении внутри области во временной последовательности по порядку времени получения и имеет информацию о местоположении, указывающую, что терминал находится вне области наблюдения (этап S1 на фиг.7). Следует отметить, что «период расширения» означает в качестве примера период, расширенный от периода наблюдения в обе стороны на предварительно определенную временную длительность (например, 1 час), т.е. период, имеющий момент времени, расположенный ранее момента t0 времени начала наблюдения на предварительно определенное время, в качестве начальной точки и момент времени, расположенный после момента t1 времени окончания наблюдения через предварительно определенное время в качестве конечной точки.
Как показано на фиг.8, когда последовательность порций данных о местоположении об одном и том же терминале, которые получаются в периоде расширения, выровнены во временной последовательности по порядку времени получения, порции данных о местоположении внутри области, имеющие информацию о местоположении, указывающую, что терминал находится внутри области наблюдения, изображаются в виде черных кружков, и порции данных о местоположении вне области, которые являются смежными с данными о местоположении внутри области и имеют информацию о местоположении, указывающую, что терминал находится вне области наблюдения, изображаются в виде белых кружков соответственно, момент tin времени, соответствующий пропорциональной точке (например, средней точке) времени ta получения самых ранних данных о местоположении внутри области и момента tx времени получения данных о местоположении вне области, смежных с самыми ранними данными о местоположении внутри области, определяется как момент времени начала оценочного периода пребывания во временной последовательности. Аналогично, момент tout времени, соответствующий пропорциональной точке (например, средней точке) момента tc времени получения самых последних данных о местоположении внутри области и момента ty времени получения данных о местоположении вне области, смежных с самыми последними данными о местоположении внутри области, определяется как момент времени окончания оценочного периода пребывания во временной последовательности. Таким образом, период, представленный как прямоугольник на фиг.8, т.е. период от момента tin времени до момента tout времени, вычисляется как оценочный период пребывания терминала.
Затем секция 24 извлечения извлекает терминалы, вычисленный оценочный период пребывания и период наблюдения которых перекрывается (этап S2 на фиг.7). Фиг.9 представляет собой вид, изображающий последовательность порций данных о местоположении о каждом из терминалов A-E, полученных в период расширения, выровненных во временной последовательности по порядку момента времени получения в направлении горизонтальной оси, и на фиг.9 порции данных о местоположении внутри области, имеющих информацию о местоположении, указывающую, что терминал находится внутри области наблюдения, изображаются черными кружками, и порции данных о местоположении вне области, имеющих информацию о местоположении, указывающую, что терминал находится вне области наблюдения, изображаются белыми кружками. Отмечая только данные о местоположении внутри области, имеющие момент времени получения в периоде наблюдения (момент t0 времени - момент t1 времени), три терминала C-E извлекаются в качестве соответствующих терминалов.
Однако так как пять терминалов A-E перечислены в качестве терминалов, оценочный период пребывания, представленный как прямоугольники на фиг.9, и период наблюдения (момент t0 времени - момент t1 времени) которых перекрываются, терминалы A-E извлекаются на этапе S2. Таким образом, даже терминалы A, B, исключенные при указании только данных о местоположении внутри области, изображенных как черные кружки, оцениваются как пребывающие в области наблюдения в течение периода наблюдения. Вышеупомянутый способ, использующий оценочный период пребывания на этапах S1 и S2, является просто примером, и могут применяться другие способы. Другие способы описаны ниже.
Затем секция 26 статистики подсчитывает количество терминалов, извлеченных на этапах S1 и S2, и оценивает подсчет как количество посещающих терминалов в области наблюдения в течение периода наблюдения (этап S3 на фиг.7).
Потом секция 25 добавления коэффициента увеличения выводит коэффициент увеличения для преобразования количества посещающих терминалов в количество посетителей для каждого извлеченного терминала на основе соответствующей атрибутивной информации (этап S4 на фиг.7). Кроме того, когда коэффициент увеличения, такой как соотношение абонентов терминала, меняется во времени, секция 25 добавления коэффициента увеличения предпочтительно извлекает начальный момент времени периода, когда оценочный период пребывания и период наблюдения перекрываются, и выводит коэффициент увеличения, соответствующий полученному начальному моменту времени.
Затем секция 26 статистики вычисляет коэффициент увеличения данных о местоположении каждого терминала, который выводится секцией 25 добавления коэффициента увеличения, и оценивает общую сумму полученных коэффициентов увеличения в качестве количества посетителей в области наблюдения в течение периода наблюдения (этап S5 на фиг.7). Затем секция 26 статистики выводит оценочное количество посетителей на устройство 31 скрытия информации (этап S6 на фиг.7). В этот момент также может выводиться количество посещающих терминалов, которое получено на этапе S3.
В вышеупомянутом варианте осуществления секция 25 добавления коэффициента увеличения добавляет обратную величину соотношения абонентов, соответствующего атрибутивной информации, в качестве коэффициента увеличения, но может добавлять коэффициент увеличения, отражающий коэффициент пребывания в обслуживающей зоне терминала. Например, секция 25 добавления коэффициента увеличения может использовать обратную величину «соотношения абонентов терминала» в качестве отношения «количества абонентских терминалов конкретной компании связи, от которой могут быть получены данные о местоположении» к «населению в области в предварительно определенном диапазоне», в качестве коэффициента увеличения, отражающего коэффициент пребывания в зоне обслуживания. «Количество абонентских терминалов конкретной компании связи, от которой могут быть получены данные о местоположении» может быть подсчитано из данных о местоположении, хранимых в секции 22 хранения. Такой коэффициент увеличения может вычисляться в соответствии с каждым сегментом адреса, возрастной категорией, полом и временной зоной.
Кроме того, обработка скрытия устройства 31 скрытия информации может выполняться следующим образом.
При приеме оценочного значения (например, оценочного населения) от секции 26 статистики устройство 31 скрытия информации выполняет, например, обработку скрытия, показанную на фиг.10. Т.е. секция 32 определения определяет, является ли или нет количество исходных терминалов, которое указывает количество терминалов, от которых получены данные о местоположении для каждой области (соты) в качестве основы для оценки, меньше предварительно определенного эталонного значения (например, 10) для определения необходимости обработки скрытия (этап S61 на фиг.10). Следует отметить, что количество исходных терминалов ссылается на уникальное количество терминалов за исключением одного и того же перекрывающегося терминала. Чтобы сделать такое определение, получают количество исходных терминалов для данных о местоположении для каждой области (соты). В качестве примера, когда секция 26 статистики подсчитывает величины признака, ассоциированного с данными о местоположении, секция 27 подсчета может подсчитывать количество порций идентификационной информации (например, хешированные телефонные номера после неидентификационной обработки секции 16 генерирования неидентифицируемых данных о местоположении) в данных о местоположении и передавать информацию об общем количестве хешированных телефонных номеров на секцию 32 определения, и секция 32 определения может использовать общее количество хешированных телефонных номеров в качестве количества исходных терминалов для данных о местоположении для каждой области (соты).
Более конкретно, когда секция 26 статистики выполняет преобразование области из сектора S в сегменты области, секция 32 определения определяет количество исходных терминалов для данных о местоположении для каждого сегмента области, которое подсчитывается секцией 27 подсчета. Например, предполагается, что, когда некоторый сегмент Q области покрывает сектор SA и сектор SB в течение периода наблюдения цели подсчета, сигналы регистрации местоположения от шести портативных терминалов 2, имеющих соответствующие идентификационные номера терминала: ID1, ID2, ID3, ID4, ID5 и ID6, наблюдаются в секторе SA и сигналы регистрации местоположения от пяти портативных терминалов 2, имеющих соответствующие идентификационные номера терминала: ID4, ID5, ID6, ID7 и ID8, наблюдаются в секторе SB. В таком случае определение секции 32 определения выполняется с использованием количества исходных терминалов, которое указывает количество терминалов, от которых получаются данные о местоположении для сегмента Q области в качестве основы для оценки, а не с использованием общей суммы количества исходных терминалов для каждого из секторов SA, SB. В вышеупомянутом примере уникальное количество терминалов в секторе SA равно шести, и уникальное количество терминалов в секторе SB равно пяти. Однако количество исходных терминалов, которое определяется секцией 32 определения, представляет собой количество исходных терминалов, которое вычисляется для сегмента Q области, т.е. восемь. Если эталонным значением является 10, количество исходных терминалов является меньше эталонного значения и, таким образом, секция 32 определения предназначает оценочное значение сегмента Q области для скрытия.
Когда количество исходных терминалов для данных о местоположении для каждой области (соты) в качестве основы для оценки меньше эталонного значения на этапе S61, секция 33 вывода устанавливает оценочное значение для области (соты) на ноль, таким образом скрывая оценочное значение (этап S62). Следует отметить, что способ скрытия не ограничивается установлением оценочного значения на ноль, и могут применяться другие способы, такие как способ представления оценочного значения в качестве предварительно определенного знака или символа (например, «X»).
С другой стороны, когда количество исходных терминалов для данных о местоположении для каждой области (соты) в качестве основы для оценки представляет собой эталонное значение или больше на этапе S61, секция 33 вывода выполняет вероятностное округление ширины класса, используемой для вывода оценочного значения, относительно оценочного значения для области (соты) следующим образом (этап S63). Т.е. при условии, что оценочное значение для некоторой области (соты) равно x и ширина класса равна k, в случае kn≤x<k(n+1) (n представляет собой целое число), секция 33 вывода округляет оценочное значение x до k(n+1) с вероятностью (x-kn)/k и до kn с вероятностью (k(n+1)-x)/k.
Например, в случае оценочного значения x, равного 23, и ширины k класса, равной 10, n равно 2 в соответствии с k×2≤x<k(2+1) и оценочное значение «23» округляется до «30» с вероятностью 0,3 (вероятностью 30%) и до «20» с вероятностью 0,7 (вероятностью 70%).
В соответствии с обработкой скрытия устройства 31 скрытия информации может предотвращаться идентификация любого человека на основе результата оценки для повышения практичности результата оценки. Кроме того, может предотвращаться недостаток, что скрытое значение может предполагаться из других значений.
Следует отметить, что ширина класса при вероятностном округлении может устанавливаться посредством извлечения наибольших коэффициентов увеличения из коэффициентов увеличения данных о местоположении, используемых при подсчете, и умножения коэффициента увеличения на предварительно определенное значение (например, 10). Кроме того, ширина класса может предварительно определяться для выполнения вероятностного округления. В данном случае может применяться правило обработки исключения данных для области (соты), включающих в себя данные о местоположении, коэффициент увеличения которых превышает предварительно определенную долю (например, 1/10) предварительно определенной ширины класса.
Кроме того, обработка скрытия устройства 31 скрытия информации не ограничивается обработкой, показанной на фиг.10, и может быть любой другой обработкой. Например, на этапе S61 на фиг.10 может определяться, является ли или нет, вместо «количества исходных терминалов для данных о местоположении для каждой области (соты) в качестве основы для оценки», «количество порций данных о местоположении для каждой области (соты) в качестве основы для оценки» меньше эталонного значения или является ли или нет «выводимое оценочное значение (население или количество терминалов)» меньше эталонного значения. Кроме того, когда результатом определения этапа S61 на фиг.10 является НЕТ, может опускаться обработка на этапе S63.
Является предпочтительным, что система генерирования статистической информации дополнительно включает в себя средство управления ключом, которое содержит предварительно определенную информацию электронного ключа; средство одностороннего действия, которое принимает первую идентификационную информацию и вторую идентификационную информацию и применяет одностороннюю функцию, используя информацию электронного ключа, содержащуюся в средстве управления ключом, к каждой из первой идентификационной информации и второй идентификационной информации для вывода первой неидентифицируемой информации и второй неидентифицируемой информации; средство генерирования неидентифицируемых данных о местоположении, которое удаляет первую идентификационную информацию из данных, хранящих информацию о местоположении, и добавляет первую неидентифицируемую информацию, выводимую из средства одностороннего действия, в качестве первой идентификационной информации в данные, хранящие информацию о местоположении, для генерирования данных, хранящих информацию о местоположении; и средство генерирования неидентифицируемых атрибутивных данных, которое удаляет вторую идентификационную информацию из данных, хранящих атрибутивную информацию, и добавляет вторую неидентифицируемую информацию, выводимую из средства одностороннего действия, в качестве второй идентификационной информации в данные, хранящие атрибутивную информацию, для генерирования данных, хранящих атрибутивную информацию. В данном случае первая идентификационная информация и вторая идентификационная информация удаляются из данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию, которые ассоциируются друг с другом посредством первой и второй идентификационной информации соответственно, и затем добавляется первая неидентифицируемая информация и вторая неидентифицируемая информация. Первая и вторая неидентифицируемая информация получается подстановкой первоначально хранящейся информации электронного ключа и первой и второй идентификационной информации в одностороннюю функцию, и идентификационная информация не может быть вычислена в обратном направлении из неидентифицируемой информации. Кроме того, даже если односторонняя функция известна, пока значение электронного ключа держится в секрете, даже когда идентификационная информация вводится в одностороннюю функцию циклическим образом, нельзя узнать отношение соответствия между идентификационной информацией и неидентифицируемой информацией. В результате может предотвращаться идентификация любого человека на основе идентификационной информации, включенной в данные, хранящие информацию о местоположении, и данные, хранящие атрибутивную информацию. Кроме того, так как идентификационная информация заменяется неидентифицируемой информацией, может предотвращаться совершение статистической обработки, которая позволяет раскрыть поведение любого конкретного человека посредством установления условия поиска, использующего идентификационную информацию.
Кроме того, является предпочтительным, что средство генерирования неидентифицируемых атрибутивных данных заменяет атрибутивную информацию, включенную в данные, хранящие атрибутивную информацию, на атрибутивную информацию абстрагирования, полученную посредством абстрагирования информации, и средство извлечения сравнивает абстрагированную атрибутивную информацию абстрагирования с информацией условия поиска, таким образом извлекая часть данных, хранящих неидентифицируемую атрибутивную информацию. Таким образом, итоговое передвижение населения может быть известно посредством получения статистических данных в единицах абстрагированной атрибутивной информации и может быть сделана более трудной идентификация личности, основанная на статистических данных.
Кроме того, является предпочтительным, что средство извлечения добавляет вероятностную информацию, указывающую степень соответствия информации условия поиска, к данным, хранящим информацию о местоположении, и средство статистики вычисляет статистические данные посредством умножения вероятностной информации, добавленной к данным, хранящим информацию о местоположении, на коэффициент увеличения. С такой конфигурацией, когда степень соответствия между информацией о местоположении и условием поиска получается в виде вероятности, могут быть получены статистические данные, отражающие вероятность, и, таким образом, могут быть получены статистические данные, отражающие общую тенденцию передвижения населения.
Кроме того, является предпочтительным, что средство извлечения оценивает значение, соответствующее оценочной плотности поколения информации о местоположении, генерируемой терминалом мобильной связи, на основе данных, хранящих информацию о местоположении, и добавляет значение в виде величины признака к данным, хранящим информацию о местоположении, и средство статистики вычисляет статистические данные посредством умножения величины признака, добавленной к данным, хранящим информацию о местоположении, на коэффициент увеличения. С такой конфигурацией может оцениваться период пребывания в секторе и могут быть получены статистические данные, отражающие период пребывания, приводя к тому, что могут быть получены статистические данные, отражающие общую тенденцию передвижения населения.
Промышленная применимость
Согласно настоящему изобретению, даже когда настоящее изобретение применяется к устройству подсчета информации о местоположении и способу подсчета информации о местоположении и используется способ позиционирования, вызывающий различные ошибки, может быть вычислено высокоточное распределение населения с малой ошибкой.
Список ссылочных позиций
1: система генерирования статистической информации, 2: портативный терминал (терминал мобильной связи), 11: устройство генерирования неидентифицируемой информации, 12: первая секция ввода (первое средство ввода), 13: вторая секция ввода (второе средство ввода), 14: секция управления ключом (средство управления ключом), 15: секция одностороннего действия (средство одностороннего действия), 16: секция генерирования неидентифицируемых данных о местоположении (средство генерирования неидентифицируемых данных о местоположении), 17: секция генерирования неидентифицируемых атрибутивных данных (средство генерирования неидентифицируемых атрибутивных данных), 21: устройство подсчета, 23: секция ввода условия (средство ввода условия), 24: секция извлечения (средство извлечения), 25: секция добавления коэффициента увеличения (средство добавления коэффициента увеличения), 26: секция статистики (средство статистики), 27: секция подсчета (средство подсчета), 31: устройство скрытия информации, 32: секция определения (средство определения), 33: секция вывода (средство вывода).

Claims (9)

1. Система генерирования статистической информации, содержащая:
первое средство ввода, которое вводит данные, хранящие информацию о местоположении, включающие в себя первую идентификационную информацию, идентифицирующую терминал мобильной связи, информацию о местоположении о местоположении терминала мобильной связи и временную информацию о времени, когда получена информация о местоположении;
второе средство ввода, которое вводит данные, хранящие атрибутивную информацию, включающие в себя вторую идентификационную информацию, идентифицирующую терминал мобильной связи, и атрибутивную информацию об абоненте терминала мобильной связи;
средство ввода условия, которое вводит информацию условия поиска для данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию;
средство извлечения, которое извлекает часть данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию, на основе информации условия поиска;
средство добавления коэффициента увеличения, которое добавляет к данным, хранящим атрибутивную информацию, извлеченным средством извлечения, коэффициент увеличения, соответствующий атрибутивной информации, включенной в данные, хранящие атрибутивную информацию, и указывающий степень увеличения до значения статистической цели;
средство статистики, которое вычисляет и выводит статистические данные по населению посредством использования данных, хранящих информацию о местоположении, извлеченных средством извлечения, данных, хранящих атрибутивную информацию, извлеченных средством извлечения и имеющих вторую идентификационную информацию, соответствующую первой идентификационной информации, включенной в данные, хранящие информацию о местоположении, и коэффициента увеличения, добавленного к данным, хранящим атрибутивную информацию;
средство подсчета, которое подсчитывает количество порций данных, хранящих информацию о местоположении, извлеченных средством извлечения;
средство определения, которое определяет величину количества порций данных посредством сравнения количества порций данных, подсчитанных средством подсчета, с предварительно определенным значением; и
средство вывода, которое выводит статистические данные, когда средство определения определяет, что количество порций данных является большим, и скрывает значение, включенное в статистические данные, для вывода статистических данных, когда средство определения определяет, что количество порций данных является малым.
2. Система генерирования статистической информации по п.1, в которой средство подсчета подсчитывает в качестве количества порций данных количество порций первой идентификационной информации в данных, хранящих информацию о местоположении, извлеченных средством извлечения.
3. Система генерирования статистической информации по п.2, в которой средство подсчета подсчитывает в качестве количества порций данных количество порций первой идентификационной информации для каждого сегмента области в качестве единицы подсчета средства статистики.
4. Система генерирования статистической информации по п.1, дополнительно содержащая:
средство управления ключом, которое хранит предварительно определенную информацию электронного ключа;
средство одностороннего действия, которое принимает первую идентификационную информацию и вторую идентификационную информацию и применяет одностороннюю функцию, используя информацию электронного ключа, хранящуюся в средстве управления ключом, к каждой из первой идентификационной информации и второй идентификационной информации для вывода первой неидентифицируемой информации и второй неидентифицируемой информации;
средство генерирования неидентифицируемых данных о местоположении, которое удаляет первую идентификационную информацию из данных, хранящих информацию о местоположении, и добавляет первую неидентифицируемую информацию, выводимую из средства одностороннего действия в качестве первой идентификационной информации, к данным, хранящим информацию о местоположении, для генерирования данных, хранящих информацию о местоположении; и
средство генерирования неидентифицируемых атрибутивных данных, которое удаляет вторую идентификационную информацию из данных, хранящих атрибутивную информацию, и добавляет вторую неидентифицируемую информацию, выводимую из средства одностороннего действия в качестве второй идентификационной информации, к данным, хранящим атрибутивную информацию, для генерирования данных, хранящих атрибутивную информацию.
5. Система генерирования статистической информации по п.4, в которой
средство генерирования неидентифицируемых атрибутивных данных заменяет атрибутивную информацию, включенную в данные, хранящие атрибутивную информацию, атрибутивной информацией абстрагирования, которая получается посредством абстрагирования информации, и
средство извлечения сравнивает абстрагированную атрибутивную информацию абстрагирования с информацией условия поиска, таким образом извлекая часть данных, хранящих неидентифицируемую атрибутивную информацию.
6. Система генерирования статистической информации по любому одному из пп.1-5, в которой
средство извлечения добавляет вероятностную информацию, указывающую степень соответствия с информацией условия поиска, к данным, хранящим информацию о местоположении, и
средство статистики вычисляет статистические данные посредством умножения вероятностной информации, добавленной к данным, хранящим информацию о местоположении, на коэффициент увеличения.
7. Система генерирования статистической информации по любому одному из пп.1-5, в которой
средство извлечения оценивает значение, соответствующее оценочной плотности поколения информации о местоположении, генерируемой терминалом мобильной связи, на основе данных, хранящих информацию о местоположении, и добавляет значение в качестве величины признака к данным, хранящим информацию о местоположении, и
средство статистики вычисляет статистические данные посредством умножения величины признака, добавленной к данным, хранящим информацию о местоположении, на коэффициент увеличения.
8. Система генерирования статистической информации, содержащая:
первое средство ввода, которое вводит данные, хранящие информацию о местоположении, включающие в себя первую идентификационную информацию, идентифицирующую терминал мобильной связи, информацию о местоположении о местоположении терминала мобильной связи и временную информацию о времени, когда получена информация о местоположении;
второе средство ввода, которое вводит данные, хранящие атрибутивную информацию, включающие в себя вторую идентификационную информацию, идентифицирующую терминал мобильной связи, и атрибутивную информацию об абоненте терминала мобильной связи;
средство управления ключом, которое хранит предварительно определенную информацию электронного ключа;
средство одностороннего действия, которое принимает первую идентификационную информацию и вторую идентификационную информацию и применяет одностороннюю функцию, используя информацию электронного ключа, хранящуюся в средстве управления ключом, для каждой из первой идентификационной информации и второй идентификационной информации для вывода первой неидентифицируемой информации и второй неидентифицируемой информации;
средство генерирования неидентифицируемых данных о местоположении, которое удаляет первую идентификационную информацию из данных, хранящих информацию о местоположении, и добавляет первую неидентифицируемую информацию, выводимую из средства одностороннего действия, к данным, хранящим информацию о местоположении, для генерирования данных, хранящих неидентифицируемую информацию о местоположении;
средство ввода условия, которое вводит информацию условия поиска для данных, хранящих неидентифицируемую информацию о местоположении, и данных, хранящих неидентифицируемую атрибутивную информацию;
средство извлечения, которое извлекает часть данных, хранящих неидентифицируемую информацию о местоположении, и данных, хранящих неидентифицируемую атрибутивную информацию, на основе информации условия поиска;
средство добавления коэффициента увеличения, которое добавляет к данным, хранящим неидентифицируемую атрибутивную информацию, извлеченным средством извлечения, коэффициент увеличения, соответствующий атрибутивной информации, включенной в данные, хранящие неидентифицируемую атрибутивную информацию, и указывающий степень увеличения до значения статистической цели;
средство статистики, которое вычисляет и выводит статистические данные по населению посредством использования данных, хранящих неидентифицируемую информацию о местоположении, извлеченных средством извлечения, данных, хранящих неидентифицируемую атрибутивную информацию, извлеченных средством извлечения и имеющих вторую неидентифицируемую информацию, соответствующую первой неидентифицируемой информации, включенной в данные, хранящие неидентифицируемую информацию о местоположении, и коэффициента увеличения, добавленного к данным, хранящим неидентифицируемую атрибутивную информацию;
средство подсчета, которое подсчитывает количество порций данных, хранящих неидентифицируемую информацию о местоположении, извлеченных средством извлечения;
средство определения, которое определяет величину количества порций данных посредством сравнения количества порций данных, подсчитанных средством подсчета, с предварительно определенным значением; и
средство вывода, которое выводит статистические данные, когда средство определения определяет, что количество порций данных является большим, и скрывает значение, включенное в статистические данные, для вывода статистических данных, когда средство определения определяет, что количество порций данных является малым.
9. Способ генерирования статистической информации, содержащий:
первый этап ввода, на котором в первом средстве ввода вводят данные, хранящие информацию о местоположении, включающие в себя первую идентификационную информацию, идентифицирующую терминал мобильной связи, информацию о местоположении о местоположении терминала мобильной связи и временную информацию о времени, когда получена информация о местоположении;
второй этап ввода, на котором во втором средстве ввода вводят данные, хранящие атрибутивную информацию, включающие в себя вторую идентификационную информацию, идентифицирующую терминал мобильной связи, и атрибутивную информацию об абоненте терминала мобильной связи;
этап ввода условия, на котором в средстве ввода условия вводят информацию условия поиска для данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию;
этап извлечения, на котором в средстве извлечения извлекают часть данных, хранящих информацию о местоположении, и данных, хранящих атрибутивную информацию, на основе информации условия поиска;
этап добавления коэффициента увеличения, на котором в средстве добавления коэффициента увеличения добавляют к данным, хранящим атрибутивную информацию, извлеченным средством извлечения, коэффициент увеличения, соответствующий атрибутивной информации, включенной в данные, хранящие атрибутивную информацию, и указывающий степень увеличения до значения статистической цели;
этап статистики, на котором в средстве статистики вычисляют и выводят статистические данные по населению посредством использования данных, хранящих информацию о местоположении, извлеченных средством извлечения, данных, хранящих атрибутивную информацию, извлеченных средством извлечения и имеющих вторую идентификационную информацию, соответствующую первой идентификационной информации, включенной в данные, хранящие информацию о местоположении, и коэффициента увеличения, добавленного к данным, хранящим атрибутивную информацию;
этап подсчета, на котором в средстве подсчета подсчитывают количество порций данных, хранящих информацию о местоположении, извлеченных средством извлечения;
этап определения, на котором в средстве определения определяют величину количества порций данных посредством сравнения количества порций данных, подсчитанных средством подсчета, с предварительно определенным значением; и
этап вывода, на котором в средстве вывода выводят статистические данные, когда средство определения определяет, что количество порций данных является большим, и скрывают значение, включенное в статистические данные, для вывода статистических данных, когда средство определения определяет, что количество порций данных является малым.
RU2012149859/08A 2010-04-23 2011-04-06 Система генерирования статистической информации и способ генерирования статистической информации RU2527754C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010099855 2010-04-23
JP2010-099855 2010-04-23
PCT/JP2011/058730 WO2011132534A1 (ja) 2010-04-23 2011-04-06 統計情報生成システム及び統計情報生成方法

Publications (2)

Publication Number Publication Date
RU2012149859A RU2012149859A (ru) 2014-05-27
RU2527754C2 true RU2527754C2 (ru) 2014-09-10

Family

ID=44834065

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012149859/08A RU2527754C2 (ru) 2010-04-23 2011-04-06 Система генерирования статистической информации и способ генерирования статистической информации

Country Status (8)

Country Link
US (1) US8903791B2 (ru)
EP (1) EP2562711A4 (ru)
JP (1) JP5406981B2 (ru)
KR (2) KR20140135244A (ru)
CN (1) CN102859547A (ru)
BR (1) BR112012027137A2 (ru)
RU (1) RU2527754C2 (ru)
WO (1) WO2011132534A1 (ru)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013125393A (ja) * 2011-12-14 2013-06-24 Zenrin Datacom Co Ltd ユーザ情報出力システム、ユーザ情報出力方法及びユーザ情報出力プログラム
JP5797120B2 (ja) * 2012-01-24 2015-10-21 株式会社Nttドコモ 情報分析装置および人口分布算出方法
JP5758315B2 (ja) * 2012-01-27 2015-08-05 日本電信電話株式会社 匿名データ提供システム、匿名データ装置、及びそれらが実行する方法
JP5670366B2 (ja) * 2012-01-27 2015-02-18 日本電信電話株式会社 匿名データ提供システム、匿名データ装置、それらが実行する方法、およびプログラム
JP2013222305A (ja) * 2012-04-16 2013-10-28 Research Organization Of Information & Systems 緊急時情報管理システム
JP6210780B2 (ja) * 2013-07-30 2017-10-11 株式会社ゼンリンデータコム 推定値算出装置、推定値算出方法及びプログラム
KR101585985B1 (ko) 2015-01-19 2016-01-15 경희대학교 산학협력단 개인정보 비식별화 전송장치 및 전송방법
US20220038892A1 (en) * 2018-10-26 2022-02-03 Eureka Analytics Pte Ltd Mathematical Summaries of Telecommunications Data for Data Analytics
KR102115329B1 (ko) * 2019-08-12 2020-05-26 대영유비텍 주식회사 공개키 기반의 개인 정보 비식별화 시스템 및 방법
US20230169414A1 (en) * 2020-04-23 2023-06-01 Ntt Docomo, Inc. Population extraction device
US20220138260A1 (en) * 2020-10-30 2022-05-05 Here Global B.V. Method, apparatus, and system for estimating continuous population density change in urban areas
EP4198916A4 (en) * 2021-10-15 2023-07-05 Rakuten Group, Inc. INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD AND PROGRAM

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7136631B1 (en) * 2000-11-09 2006-11-14 Nortel Networks Limited Apparatus and method to provide one-click logon service for wireless devices

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4582939B2 (ja) * 2001-03-07 2010-11-17 ソニー株式会社 情報管理システム、情報管理方法、および情報処理装置、情報処理方法、並びにプログラム
JP2003030373A (ja) 2001-07-10 2003-01-31 Fujitsu Ltd 人口分布解析装置
US7010779B2 (en) * 2001-08-16 2006-03-07 Knowledge Dynamics, Inc. Parser, code generator, and data calculation and transformation engine for spreadsheet calculations
JP2003122877A (ja) * 2001-10-09 2003-04-25 Oki Electric Ind Co Ltd 地域内人口算出システム
JP4417132B2 (ja) * 2004-02-19 2010-02-17 日本電信電話株式会社 プライバシ情報管理サーバ及び方法並びにプログラム
JP2005286657A (ja) 2004-03-29 2005-10-13 Victor Co Of Japan Ltd 人口密集度情報収集システム
CN101069437B (zh) * 2005-05-12 2010-05-19 株式会社Ntt都科摩 通信设备的检索系统
DE102006018645B4 (de) * 2006-04-21 2008-07-24 Nokia Siemens Networks Gmbh & Co.Kg Verfahren, Vorrichtungen und Computerprogrammprodukt zum Ver- und Entschlüsseln von Mediendaten
KR100818549B1 (ko) 2006-09-27 2008-04-01 김성엽 휴대용 단말기의 위치 정보를 기반으로 한 실시간 정보제공 서비스 방법
CN101083785A (zh) * 2007-07-04 2007-12-05 贾林 获得人口信息的方法及系统
JP5057924B2 (ja) * 2007-10-15 2012-10-24 株式会社エヌ・ティ・ティ・ドコモ 配信サーバ、通信システム及び通信方法
EP2259616A1 (en) * 2008-03-24 2010-12-08 NEC Corporation Margin design apparatus, margin design system, margin design method, and program
US8352493B2 (en) * 2008-06-04 2013-01-08 Hw Llc Searchable health events directory
EP2371149B1 (en) * 2008-12-08 2016-09-14 Telefonaktiebolaget LM Ericsson (publ) Presence service time zone information
JP4364936B1 (ja) * 2009-02-27 2009-11-18 ソフトバンクBb株式会社 流動性人口推定システム、流動性人口推定方法及び流動性人口推定プログラム
US8359238B1 (en) * 2009-06-15 2013-01-22 Adchemy, Inc. Grouping user features based on performance measures
US8401899B1 (en) * 2009-06-15 2013-03-19 Adchemy, Inc. Grouping user features based on performance measures

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7136631B1 (en) * 2000-11-09 2006-11-14 Nortel Networks Limited Apparatus and method to provide one-click logon service for wireless devices

Also Published As

Publication number Publication date
EP2562711A1 (en) 2013-02-27
KR20120139844A (ko) 2012-12-27
US20130073577A1 (en) 2013-03-21
US8903791B2 (en) 2014-12-02
BR112012027137A2 (pt) 2016-07-26
EP2562711A4 (en) 2015-01-14
KR20140135244A (ko) 2014-11-25
CN102859547A (zh) 2013-01-02
WO2011132534A1 (ja) 2011-10-27
JPWO2011132534A1 (ja) 2013-07-18
RU2012149859A (ru) 2014-05-27
JP5406981B2 (ja) 2014-02-05

Similar Documents

Publication Publication Date Title
RU2527754C2 (ru) Система генерирования статистической информации и способ генерирования статистической информации
EP3132592B1 (en) Method and system for identifying significant locations through data obtainable from a telecommunication network
RU2530349C1 (ru) Устройство для оценивания количества терминалов и способ оценивания количества терминалов
RU2540824C2 (ru) Устройство агрегации информации о местоположении и способ агрегации информации о местоположении
EP3241368B1 (en) Method and system for a real-time counting of a number of participants at a public happening
CN111148018B (zh) 基于通信数据识别定位区域价值的方法和装置
US8725554B2 (en) Household member number distribution estimation apparatus and household member number distribution estimation method
CN109195219B (zh) 服务器确定移动终端位置的方法
CN104680250A (zh) 一种位置预测系统
Lian et al. Analyzing location predictability on location-based social networks
CN110298687B (zh) 一种区域吸引力评估方法及设备
CN105376223A (zh) 网络身份关系的可靠度计算方法
CN112954626A (zh) 手机信令数据分析方法、装置、电子设备及存储介质
US20220007133A1 (en) System and method for identifying associated subjects from location histories
JP5490908B2 (ja) 人口算出システム及び人口算出方法
JP2012054921A (ja) 移動機分布算出システム及び移動機分布算出方法
Gupta et al. Automatic identification of informal social groups and places for geo-social recommendations
CN116756522A (zh) 概率预报方法、装置、存储介质及电子设备
Karra et al. An empirical assessment of the complexity and realism of synthetic social contact networks
CN107040603B (zh) 用于确定应用程序App活跃场景的方法和装置
CN114970495A (zh) 人名消歧方法、装置、电子设备及存储介质
CN115345324A (zh) 故障定位方法、装置、设备、存储介质及产品
EP2693376A1 (en) Information processing device and method for estimating number of terminals
JP2012059254A (ja) 人口算出装置および人口算出方法
IL283913A (en) A system and method for identifying related people from location histories

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20160407