WO2011142327A1 - 情報処理装置、制御方法及びプログラム - Google Patents
情報処理装置、制御方法及びプログラム Download PDFInfo
- Publication number
- WO2011142327A1 WO2011142327A1 PCT/JP2011/060685 JP2011060685W WO2011142327A1 WO 2011142327 A1 WO2011142327 A1 WO 2011142327A1 JP 2011060685 W JP2011060685 W JP 2011060685W WO 2011142327 A1 WO2011142327 A1 WO 2011142327A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- information
- personal information
- anonymous
- anonymization
- anonymity
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
Definitions
- the present invention relates to an information processing apparatus, a control method, and a program for anonymizing personal information so as to ensure that there are a predetermined number or more of personal information after anonymization.
- An object of the present invention is to provide an information processing apparatus, a control method, and a program for anonymizing personal information so as to ensure that there are a predetermined number or more of personal information after anonymization.
- the information processing apparatus of the present invention defines a personal information database that stores a plurality of pieces of personal information in association with identification information of providers of the personal information, and processing contents that obscure the description contents of the personal information.
- the algorithm definition unit that stores the plurality of types of algorithms associated with the algorithm identification information, and the description content of each personal information stored in the personal information database is changed according to the algorithm corresponding to the predetermined algorithm identification information.
- a comparison unit that compares the minimum value with a predetermined reference value, and each of the algorithms until the minimum content value is equal to or greater than the reference value.
- control method of the present invention stores a plurality of types of personal information in association with the identification information of each personal information provider, and defines a plurality of types of processing contents that obscure the description content of each personal information. Are stored in association with the algorithm identification information, and the description content of each stored personal information is changed according to the algorithm corresponding to the predetermined algorithm identification information.
- the program of the present invention includes a plurality of procedures defining a procedure for storing a plurality of personal information in association with identification information of each personal information provider, and a processing content for obscuring the description content of each personal information.
- An information processing apparatus comprising: a procedure for storing a type of algorithm in association with each algorithm identification information; and changing a description content of each stored personal information according to an algorithm corresponding to the predetermined algorithm identification information
- the procedure, the procedure for calculating the number of providers of personal information to be changed to the description after each change, and the minimum value of the number of each provider is compared with a predetermined reference value.
- the processing apparatus of the present invention can anonymize personal information so as to ensure that there are a predetermined number or more of the corresponding persons in the personal information after anonymization. Based on the processing apparatus of the present invention, the service user can provide personal information with peace of mind without worrying about identifying the individual. In addition, the service user can receive a convenient service using the personal information of the service user.
- the anonymity guarantee system 1000 according to the first exemplary embodiment of the present invention will be described in detail with reference to the drawings.
- ⁇ Overall configuration> As shown in FIG. 1, in the anonymity guarantee system 1000 according to the first embodiment, user terminals 100 ⁇ / b> A and 100 ⁇ / b> B, anonymity guarantee device 200, and service provider server 300 can communicate via a network 400. Connected to. In the following, for simplification of description, when there is no need to distinguish between the user terminal 100A and the user terminal 100B, the user terminal 100 may be collectively described as appropriate.
- the user terminal 100A transmits the personal information of the user of the user terminal 100A to the anonymity guarantee device 200.
- the user terminal 100B transmits the personal information of the user of the user terminal 100B to the anonymity guarantee device 200.
- personal information is, for example, the telephone numbers, ages, sexes, addresses, occupations, hobbies, location information of the user terminals 100A and 100B, etc. of the users of the user terminals 100A and 100B.
- the personal information includes information that allows a third party who has acquired the personal information to specify the provider of the personal information.
- the user terminal 100 transmits personal information provider identification information to the anonymity guarantee device 200 together with the personal information.
- the identification information is, for example, the names of users of the user terminals 100A and 100B.
- the anonymity guarantee device 200 stores personal information and identification information received from the user terminal 100.
- the anonymity guarantee apparatus 200 anonymizes the personal information received from the user terminal 100 and creates anonymous information.
- Anonymization is a process that makes it difficult to identify the provider of personal information by changing the description of personal information.
- Anonymization includes, for example, processing for reducing the amount of information included in personal information and processing for reducing the accuracy of personal information so as to increase the difficulty of identifying an individual from personal information.
- Anonymization can generally be called obfuscation.
- anonymous information generated from different personal information may be the same. For example, when anonymization is performed so as to delete the last digit of the telephone number (personal information) provided by the user, ten pieces of personal information are converted into the same anonymous information.
- the anonymity guarantee device 200 can make it difficult for a third party to specify a provider of personal information even if the third party acquires anonymous information.
- the anonymity guarantee apparatus 200 which concerns on this embodiment can control the strength of anonymization. Based on this control, the anonymity guarantee device 200 can control the difficulty in identifying an individual from the generated anonymous information. For example, when anonymization is performed so as to delete the “last two digits” of the telephone number (personal information) provided by the user, 100 pieces of personal information are converted into the same anonymous information.
- the anonymity guarantee device 200 can increase the specific difficulty of an individual as compared with anonymization that deletes the “last digit”.
- the anonymity guarantee apparatus 200 expresses the difficulty in specifying an individual from anonymous information as “reference anonymity”, which will be described later, and satisfies this “reference anonymity”. Control the strength of anonymization. For example, when the anonymity guarantee device 200 controls anonymization so as to delete the last digit of the telephone number (personal information) provided by the user, the provision of the telephone number from a certain user is stopped. As a result of deleting the anonymous information generated from the personal information of the user, there may be a case where there is only one provider of the telephone number after anonymization. In this case, since there is only one provider of the telephone number after anonymization, the provider is specified.
- the anonymity guarantee apparatus 200 is anonymous so as to delete the “last two digits” of the base telephone number, for example, so that the telephone number after anonymization satisfies “reference anonymity” Change phone numbers to make phone numbers anonymous.
- the anonymity guarantee apparatus 200 transmits the anonymous information created so as to satisfy the “reference anonymity” as described above to the service provider server 300.
- the service provider server 300 uses the anonymous information received from the anonymity guarantee device 200 to provide the user terminal 100 with a service for the user of the user terminal 100. Based on this anonymity guarantee device 200, the user can provide personal information with peace of mind without worrying about identifying the individual. In addition, the user can receive a convenient service using the personal information of the user.
- FIG. 100 The configuration of the user terminal 100 is shown in FIG.
- User terminal 100 includes a personal information transmission unit 110, a service request transmission unit 120, and a service reception unit 130.
- the personal information transmission unit 110 transmits personal information and identification information to the anonymity guarantee device 200.
- the service request transmission unit 120 transmits a service execution request to the service provider server 300.
- the service receiving unit 130 receives a service execution result from the service provider server 300.
- ⁇ Configuration of service provider server> The configuration of the service provider server 300 is shown in FIG.
- the service provider server 300 receives a service execution request from the user terminal 100 and processes information for providing a service to the user of the user terminal 100 using the anonymous information received from the anonymity guarantee device 200. To do.
- Service provider server 300 transmits an execution result that is a result of the information processing to the user terminal 100.
- the service provider server 300 voluntarily processes information using anonymous information and transmits the execution result to the user terminal 100.
- Service provider server 300 includes a service request reception unit 310, an anonymous information request unit 320, an anonymous information acquisition unit 330, a service execution unit 340, and a service transmission unit 350.
- the service request receiving unit 310 receives a service execution request from the user terminal 100.
- the anonymous information request unit 320 requests anonymous information from the anonymity guarantee device 200.
- the anonymous information acquisition unit 330 receives anonymous information from the anonymity guarantee device 200.
- the service execution unit 340 uses the anonymous information received from the anonymity guarantee device 200 to process information for providing a service to the user of the user terminal 100.
- the service transmission unit 350 transmits a process execution result to the user terminal 100.
- the anonymity guarantee apparatus 200 includes a personal information update receiving unit 210, a database 220, a personal information anonymization program 230, and an anonymous information providing unit 240.
- the database 220 includes a personal information database 221, a related information database 222, an anonymization level storage unit 223, a reference anonymity storage unit 224, and an anonymous information database 225.
- the personal information anonymization program 230 includes an anonymization control unit 231, a personal information anonymization unit 232, and an anonymity determination unit 233.
- the anonymity guarantee device 200 includes a CPU (Central Processing Unit) 201, a memory 202, a port 203, a hard disk drive 204, a recording medium 205, a recording medium reader 206, and an input device. It can also be configured using a computer including 207 and the output device 208.
- the CPU 201 controls the entire anonymity guarantee device 200.
- the CPU 201 reads out and executes the personal information anonymization program 230 composed of codes for performing various operations according to the present embodiment stored in the hard disk drive 204 to the memory 202, and serves as the anonymity guarantee device 200.
- the recording medium reading device 206 is a device for reading a program and data recorded on a recording medium 205 such as a flexible disk, a magnetic tape, and a compact disk.
- the read program and data are stored in the memory 202 and the hard disk drive 204. Therefore, the anonymity guarantee device 200 can read the personal information anonymization program 230 recorded on the recording medium 205 from the recording medium 205 using the recording medium reader 206 and store it in the memory 202 or the hard disk drive 204, for example.
- the recording medium reading device 206 can be built in the anonymity guarantee device 200 or can be externally attached.
- the hard disk drive 204 for example, a hard disk device or a semiconductor storage device can be used.
- the hard disk drive 204 stores a personal information anonymization program 230 and a database 220.
- FIG. 4 shows a state in which the hard disk drive 204 stores the personal information anonymization program 230 and the database 220.
- the input device 207 is a device used for data input to the anonymity guarantee device 200 and functions as a user interface. For example, a keyboard or a mouse can be used as the input device 207.
- the output device 208 is a device for outputting information to the outside, and functions as a user interface. For example, a display or a printer can be used as the output device 208.
- the port 203 is a device for communication.
- the anonymity guarantee device 200 can communicate with other computers such as the user terminal 100 and the service provider server 300 via the network 400 via the port 203. Further, for example, the anonymity guarantee apparatus 200 can receive the personal information anonymization program 230 and the database 220 from another computer via the network 400 via the port 203 and store them in the memory 202 or the hard disk drive 204. .
- the personal information update receiving unit 210 receives the personal information and the identification information from the user terminal 100, and writes the personal information and the identification information in the personal information database 221.
- the personal information database 221 stores personal information and identification information received from the user terminal 100. An example of the personal information database 221 is shown in FIG.
- the personal information transmitted from the user terminal 100 includes, for example, “phone number”, “birth date”, and “gender”.
- the identification information transmitted from the user terminal 100 includes, for example, “user name”.
- the personal information database 221 in FIG. 7 stores five pieces of personal information from the user A to the user E. Each piece of personal information stored in the personal information database 221 is identified using a “personal information identification number”.
- the anonymization level storage unit (corresponding to the algorithm definition unit described in the claims) 223 determines how the personal information is anonymized in the anonymization level ( Each corresponding to the algorithm identification information described in the claims). For example, an example of the anonymization level storage unit 223 shown in FIG.
- the 8 stores how the personal information is anonymized for each anonymization level from anonymization levels 1 to K.
- the greater the anonymization level value the greater the degree of lowering the accuracy of anonymized personal information. That is, the larger the value of the anonymization level, the greater the amount of information in the personal information for anonymization.
- the phone number is anonymized at anonymization level 1
- the last two digits of the phone number are hidden.
- the anonymization level 2 the last 3 digits, in the anonymization level 3, the last 4 digits, and in the anonymization level K, all digits are hidden.
- the higher the anonymization level the greater the degree of lowering the accuracy of personal information for anonymization.
- the anonymization level storage unit 223 makes the last digit of the phone number a cover character, makes an arbitrary character of the date of birth a cover character, makes an address address a cover character, makes a hobby or occupation a superordinate concept, etc. Thus, the processing content according to anonymization is described for every anonymization level.
- ⁇ Related information database> An example of the related information database 222 is shown in FIG.
- the related information database 222 stores “provisional anonymous information” generated by anonymization described later with respect to the personal information stored in the personal information database 221.
- the related information database 222 stores “anonymous ID (Identification)” which is an identifier of provisional anonymous information generated by converting “personal name” included in the personal information into another character string.
- the related information database 222 includes “identification number of personal information based on provisional anonymous information”, “anonymization level of provisional anonymous information”, and “number of anonymous IDs having the same provisional attribute information”. Is stored for each provisional anonymous information.
- the provisional anonymous information includes “phone number after anonymization”, “birth date after anonymization”, and “sex after anonymization”.
- the “anonymization level of provisional anonymous information” column stores the anonymization level at which the provisional anonymous information is anonymized.
- An example of the anonymous information database 225 is shown in FIG.
- the anonymous information database 225 stores “anonymous information” and “anonymous ID”. “Anonymous information” represents the provisional anonymous information described above that satisfies reference anonymity described later.
- the anonymous information includes “phone number after anonymization”, “birth date after anonymization”, and “sex after anonymization”.
- the anonymous information stored in the anonymous information database 225 is transmitted to the service provider server 300 using the anonymous information providing unit 240 described later.
- ⁇ Standard Anonymity Storage Unit> Returning to FIG. 2, the reference anonymity storage unit 224 stores the reference anonymity (corresponding to the “predetermined reference value” described in the claims).
- the reference anonymity is a reference value of the difficulty of identifying the individual that satisfies the anonymous information generated based on the anonymization according to the present embodiment.
- the anonymity guarantee device 200 of the present embodiment when all anonymous information created by the anonymity guarantee device 200 is grouped with the same anonymous attribute information, the number of anonymous IDs belonging to each group Anonymize so that the minimum value exceeds the standard anonymity value. Based on such processing, even if some anonymous information is known to a third party, the number of people who provided the personal information on which the anonymous information was based is equal to or greater than the number of “standard anonymity”. Identification becomes difficult.
- standard anonymity is a value which the administrator of the anonymity guarantee apparatus 200 sets, for example.
- the anonymization control unit 231 causes the personal information anonymization unit 232 to specify the anonymization level and anonymize the personal information stored in the personal information database 221.
- the anonymization control unit 231 acquires the provisional anonymous information generated based on the anonymization from the related information database 222 and determines whether or not the provisional anonymous information satisfies the reference anonymity. Let me determine. As a result of the determination, the anonymization control unit 231 changes the anonymization level when the anonymous information generated based on the anonymization does not satisfy the standard anonymity, and again the personal information anonymization unit 232. Make personal information anonymous. Moreover, the anonymization control part 231 reads the said temporary anonymous information from the related information database 222, when the said temporary anonymous information produced
- the personal information anonymization section (corresponding to the description change section described in the claims and the number-of-contents provider calculation section according to the description) 232 requests the anonymization request from the anonymization control section 231 to specify the anonymization level.
- the anonymization level storage unit 223 is referred to, the personal information stored in the personal information database 221 is anonymized with the contents corresponding to the anonymization level, and provisional anonymous information is created.
- the personal information anonymization unit 232 calculates the number of anonymous IDs (k-anonymity described later) belonging to a group having the same provisional anonymous information.
- the personal information anonymization unit 232 converts each personal name stored in the personal information database 221 into another character string and creates an “anonymous ID” at the time of anonymization.
- the personal information anonymization unit 232 includes the provisional anonymous information, the anonymous ID, the anonymization level, the number of anonymous IDs belonging to the group having the same provisional anonymous information, and the personal information identification on which the provisional anonymous information is based. The number is written in the related information database 222.
- ⁇ Anonymity determination unit> The anonymity determination unit 233 (corresponding to the comparison unit described in the claims) is based on the minimum number of anonymous IDs belonging to a group having the same anonymous information of the anonymous information generated based on the anonymization. Judge whether it is more than anonymity.
- the anonymous information providing unit 240 When the anonymous information providing unit 240 receives an anonymous information acquisition request from the service provider server 300, the anonymous information providing unit 240 reads the anonymous information from the anonymous information database 225 and transmits it to the service provider server 300.
- the number of anonymous IDs belonging to a group having the same provisional anonymous information may be described as “k-anonymity”.
- “k-anonymity” can be applied to the number of anonymous IDs belonging to a group having the same anonymous information and the number of users belonging to a group having the same personal information. k-anonymity will be described with reference to FIGS. 7, 8, 11, and 12. In the present embodiment, k-anonymity is defined as follows.
- k- Anonymity is k.
- k-anonymity is an index representing the difficulty of identifying an individual from anonymous information.
- the personal information that is the basis of the anonymous information of the personal information identification numbers 1 and 2 is provided by two different users whose anonymous IDs are represented by user_A and user_B. Therefore, the k-anonymity of the anonymous information of the personal information identification numbers 1 and 2 is 2, respectively.
- the anonymous information of personal information identification numbers 3, 4, and 5 does not have the same anonymous information in all of the telephone number, the date of birth, and the sex other than itself, the k-anonymity is 1 It is.
- the personal information described in the personal information database 221 shown in FIG. 7 is anonymized at the anonymization level 2 described in the anonymization level storage unit 223 shown in FIG. 8, it is described in the table shown in FIG. Anonymous information is generated.
- the three anonymous information represented by the personal information identification numbers 1, 2, and 3 described in the table shown in FIG. 12 are the same in all of the telephone number, date of birth, and gender.
- the personal information that is the basis of the anonymous information with the personal information identification numbers 1, 2, and 3 may be provided by three different users whose anonymous IDs are represented by user_A, user_B, and user_C. Recognize. Therefore, the k-anonymity of the anonymous information of the personal information identification numbers 1, 2, and 3 is 3, respectively. Similarly, the k-anonymity of the anonymous information of the personal information identification numbers 4 and 5 is 2, respectively.
- ⁇ Personal information reception processing> The operation of the anonymity guarantee device 200 when personal information and identification information are received from the user terminal 100 will be described with reference to the sequence diagram of FIG.
- the personal information update receiving unit 210 When receiving the personal information and the identification information from the user terminal 100 (A1), the personal information update receiving unit 210 writes the received personal information and the identification information in the personal information database 221 (A2). Also, the personal information update accepting unit 210 requests the anonymization control unit 231 to anonymize the personal information recorded in the personal information database 221 (A3).
- the anonymization control unit 231 When the anonymization control unit 231 receives a request for anonymization from the personal information update acceptance unit 210, the anonymization control unit 231 first instructs the personal information anonymization unit 232 to perform anonymization with the anonymization level specified as 1 (A4).
- the personal information anonymization unit 232 When receiving the anonymization instruction, the personal information anonymization unit 232 reads the personal information and identification information stored in the personal information database 221 (A5), and starts anonymization of the personal information and identification information. (A6). First, the personal information anonymization unit 232 replaces identification information (personal name) attached to each personal information with an anonymous ID. An anonymous ID is a character string that cannot identify a personal name. Next, the personal information anonymization unit 232 refers to the anonymization level storage unit 223 and anonymizes each personal information with the content specified by the anonymization level 1 to generate provisional anonymous information. In addition, the personal information anonymization unit 232 counts the number of anonymous IDs (k-anonymity) having the same provisional attribute information for each provisional anonymous information after anonymization.
- k-anonymity the number of anonymous IDs having the same provisional attribute information for each provisional anonymous information after anonymization.
- personal information anonymization part 232 becomes the basis of anonymous ID, anonymization level, the number of anonymous IDs with the same temporary anonymous information, personal information identification number, and temporary anonymous information for each temporary anonymous information.
- the associated personal information identification number is recorded in the related information database 222 in association with each other (A7), and the anonymization control unit 231 is notified of the completion of anonymization (A8).
- the anonymization control unit 231 receives a notification of completion of anonymization from the personal information anonymization unit 232, the anonymization control unit 231 determines whether each provisional anonymous information stored in the related information database 222 satisfies the reference anonymity. A request is made to the anonymity determination unit 233 (A9).
- the anonymity determination unit 233 compares the reference anonymity stored in the reference anonymity storage unit 224 with the “minimum value of the number of anonymous IDs having the same provisional anonymous information” recorded in the related information database 222. (A10). As a result of the comparison, if the “minimum value of the number of anonymous IDs with the same provisional anonymous information” stored in the related information database 222 is less than the reference anonymity, the anonymity determination unit 233 performs anonymization control. Notification to the unit 231 (A11). Similarly, if the result of the comparison shows that the “minimum value of the number of anonymous IDs with the same provisional anonymous information” stored in the related information database 222 is equal to or greater than the reference anonymity, the anonymity determination unit 233 indicates that fact.
- the anonymization control unit 231 is notified (A11).
- the anonymization control unit 231 receives a notification from the anonymity determination unit 233 that the “minimum value of the number of anonymous IDs with the same provisional anonymous information” stored in the related information database 222 is less than the reference anonymity. If this happens, the anonymization level is raised by one and the personal information anonymization unit 232 is instructed to anonymize again (A12). Thereafter, the anonymization control unit 231 notifies the anonymity determination unit 233 that the “minimum value of the number of anonymous IDs with the same provisional anonymous information” stored in the related information database 222 is equal to or greater than the standard anonymity.
- the anonymization level is raised one by one, and anonymization is instructed to the personal information anonymization unit 232 (A4 to A11).
- the anonymization control unit 231 notifies the anonymity determination unit 233 that the “minimum value of the number of anonymous IDs with the same provisional anonymous information” stored in the related information database 222 is equal to or greater than the reference anonymity.
- the provisional anonymous information stored in the related information database 222 is read (A13), and the read provisional anonymous information is written to the anonymous information database 225 as anonymous information (A14).
- the reference anonymity storage unit 224 requests the anonymization control unit 231 to anonymize the personal information recorded in the personal information database 221 ( A3). Subsequent processing is the same as A4 to A14.
- the personal information deletion request is a request transmitted from the user terminal 100 of the user when the user wants to stop providing personal information to the anonymity guarantee device 200.
- the anonymity guarantee device 200 When the anonymity guarantee device 200 receives a personal information deletion request from the user terminal 100, the anonymity guarantee device 200 deletes the personal information and identification information of the user from the personal information database 221, as well as the related information database 222 and the anonymous information. Information generated based on the personal information and identification information of the user is also deleted from the database 225. In this case, any anonymous information stored in the anonymous information database 225 may not satisfy the standard anonymity. Therefore, the anonymity guarantee apparatus 200 according to the present embodiment processes the following when receiving a personal information deletion request.
- the personal information update acceptance unit 210 receives a personal information deletion request from the user terminal 100 (B1).
- the personal information update accepting unit 210 deletes the personal information and identification information of the user of the user terminal 100 that has transmitted the personal information deletion request from the personal information database 221 (B2). Also, the personal information update accepting unit 210 deletes all information generated based on the personal information and identification information of the user from the related information database 222 and the anonymous information database 225 to the anonymization control unit 231. (B3).
- the anonymization control unit 231 deletes all information generated based on the personal information and identification information of the user from the related information database 222 and the anonymous information database 225 (B4, B5).
- the related information database 222 and the anonymous information database 225 store the association between the anonymous information and the personal information on which the anonymous information is based on the personal information identification number in the personal information database 221.
- the anonymization control unit 231 that has received the anonymous information deletion request can specify information created based on the personal information to be deleted and the identification information. Then, the anonymization control unit 231 requests the anonymity determination unit 233 to determine whether each provisional anonymous information recorded in the related information database 222 satisfies the reference anonymity (B6). The anonymity determination unit 233 compares the reference anonymity stored in the reference anonymity storage unit 224 with the “minimum value of the number of anonymous IDs having the same provisional attribute information” recorded in the related information database 222. (B7).
- the anonymity determination unit 233 performs anonymization control. Notification to the unit 231 (B8). Similarly, if the result of the comparison shows that the “minimum value of the number of anonymous IDs with the same provisional anonymous information” stored in the related information database 222 is equal to or greater than the reference anonymity, the anonymity determination unit 233 indicates that fact. The anonymization control unit 231 is notified (B8).
- the anonymization control unit 231 receives a notification from the anonymity determination unit 233 that the “minimum value of the number of anonymous IDs with the same provisional anonymous information” stored in the related information database 222 is less than the reference anonymity.
- the anonymization level is increased by one and the personal information anonymization unit 232 is instructed to anonymize.
- the operation of the anonymity guarantee device 200 at the time of anonymization is the same as the operation (A4 to A14) at the time of receiving personal information described above.
- the anonymization control unit 231 notifies the anonymity determination unit 233 that the “minimum value of the number of anonymous IDs with the same provisional anonymous information” stored in the related information database 222 is equal to or greater than the reference anonymity.
- the process ends there. It is guaranteed that all anonymity information provided by the anonymity guarantee device 200 according to the present embodiment always satisfies the standard anonymity. Therefore, the user can provide personal information with peace of mind without worrying about identifying the individual. In addition, the user can receive a convenient service using the personal information of the user. In addition, the anonymity guarantee device 200 according to the present embodiment always provides the reference anonymity even when there is an update request such as addition or deletion of personal information from the service user or when the reference anonymity is changed. It is possible to provide satisfying anonymous information.
- the personal information stored in the personal information database 221 is anonymized (A4 to A14) before the information to be deleted is deleted.
- the provisional anonymous information satisfies the standard anonymity B6 to B9
- B6 to B9 can be read by reading the personal information stored in the personal information database 221 before the determination, and anonymization can be started.
- all anonymity information created by the anonymity guarantee device 200 can be anonymized at the minimum anonymization level within a range that satisfies the standard anonymity. Therefore, the anonymity information provided by the anonymity guarantee device 200 of the present embodiment can have high accuracy while guaranteeing that the standard anonymity is always satisfied.
- the user terminal 100 is, for example, a mobile phone provided with a GPS (Global Positioning System).
- the user terminal 100 transmits the “personal information” and “mobile identification number” of the user terminal 100 to the anonymity guarantee device 200.
- the personal information transmitted by the user terminal 100 includes “position information” and “time information”.
- Position information represents the geographical position of the user terminal 100 and includes latitude and longitude.
- Time information represents the time at which position information is measured by GPS.
- the “mobile identification number” is information that can specify the mobile phone that provided the location information.
- the timing at which the user terminal 100 transmits personal information to the anonymity guarantee device 200 may be, for example, at regular time intervals, or the user terminal 100 may transmit at an arbitrary timing.
- the anonymity guarantee device 200 stores the personal information received from the user terminal 100 and the mobile identification number. Moreover, the anonymity guarantee apparatus 200 anonymizes the personal information received from the user terminal 100 and creates anonymous information. Anonymization in the present embodiment is a process of reducing the accuracy of the position information so as to increase the difficulty of specifying the user terminal 100 that provided the personal information from the position information. Upon receiving the personal information from the user terminal 100, the anonymity guarantee device 200 anonymizes the received personal information and creates anonymous information. And the anonymity guarantee apparatus 200 transmits the created anonymous information to the service provider server 300. The service provider server 300 uses the anonymous information received from the anonymity guarantee device 200 to provide the user terminal 100 with a service that takes into account the geographical location information of the user terminal 100.
- the personal information database 221 stores personal information received from the user terminal 100 and a mobile identification number.
- the personal information transmitted from the user terminal 100 includes “position information” and “time information”. “Position information” is expressed using “latitude” and “longitude”.
- the personal information database 221 of FIG. 15 stores seven pieces of personal information. Each piece of personal information stored in the personal information database 221 is identified based on a personal information identification number.
- the personal information database 221 may store the received personal information sorted in order of time information.
- the anonymization level storage unit 223 stores, for each anonymization level, how the location information is anonymized during anonymization.
- the anonymization level storage unit 223 illustrated in FIG. 16 stores how the location information is anonymized for each anonymization level from anonymization levels 1 to K.
- the greater the value of the anonymization level the greater the degree of lowering the accuracy of the position information during anonymization. For example, when the latitude and longitude are anonymized at anonymization level 1, the fractions of the latitude and longitude that are three decimal places or less are hidden.
- the related information database 222 is generated by anonymizing the position information stored in the personal information database 221, “temporary anonymous information”, “time information”, “anonymous ID”, and “based on temporary anonymous information” "The identification number of personal information", “anonymization level of provisional anonymous information”, and “number of anonymous IDs with the same provisional attribute information" are stored for each anonymous information.
- the provisional anonymous information includes “latitude after anonymization” and “longitude after anonymization”.
- the “anonymization level of provisional anonymous information” column stores the anonymization level at which the provisional anonymous information is anonymized.
- the anonymous ID column describes the identifier of provisional anonymous information generated by converting the “mobile identification number” included in the personal information into another character string.
- ⁇ Anonymous information database> An example of the anonymous information database 225 in the second embodiment is shown in FIG.
- the anonymous information database 225 stores “anonymous information”, “time information”, and “anonymous ID”.
- “Anonymous information” represents the provisional anonymous information described above that satisfies the standard anonymity.
- the anonymous information includes “latitude after anonymization” and “longitude after anonymization”.
- the anonymous information stored in the anonymous information database 225 is transmitted to the service provider server 300 using the anonymous information providing unit 240 described later.
- the reference anonymity storage unit 224 stores reference anonymity.
- the reference anonymity is a reference value of the difficulty of identifying the individual that satisfies the anonymous information generated based on the anonymization according to the present embodiment.
- the anonymity guarantee device 200 has the reference anonymity as a minimum value of the number of anonymous IDs belonging to each group when all the anonymous information to be created is grouped with the same attribute. Anonymize to exceed the value.
- the anonymization controller 231 reads out personal information stored in the personal information database 221 at regular time intervals.
- the anonymization control unit 231 designates an anonymization level in the personal information anonymization unit 232 and anonymizes the personal information read from the personal information database 221.
- the anonymization control unit 231 acquires provisional anonymous information generated based on the above anonymization from the related information database 222 and determines whether the provisional anonymous information satisfies the reference anonymity or not. Let us determine. As a result of the determination, the anonymization control unit 231 changes the anonymization level when the anonymous information generated based on the anonymization does not satisfy the standard anonymity, and again the personal information anonymization unit 232. To be anonymized. Moreover, the anonymization control part 231 reads the said temporary anonymous information from the related information database 222, when the said temporary anonymous information produced
- the personal information anonymization unit 232 anonymizes the personal information stored in the personal information database 221 with the content corresponding to the anonymization level designated by the anonymization control unit 231.
- the anonymity determination unit 233 determines whether the anonymous information generated based on the anonymization satisfies the reference anonymity.
- the anonymous information providing unit 240 reads anonymous information from the anonymous information database 225 and transmits it to the service provider server 300.
- K-anonymity> Here, the “number of anonymous IDs having the same anonymous information (k-anonymity)” in the second embodiment will be described with reference to FIG. In the table of FIG.
- k-anonymity is defined as “number of anonymous IDs” rather than “number of anonymous information” in which anonymous information is the same, and is represented by personal information identification numbers 1, 3, and 4.
- the k-anonymity of the provisional anonymous information is 2.
- the personal information update receiving unit 210 requests the anonymization control unit 231 to anonymize the personal information read from the personal information database 221 at regular time intervals (C3).
- the personal information update accepting unit 210 can be set to request the anonymization control unit 231 to anonymize personal information read from the personal information database 221 at an arbitrary timing.
- the anonymization control unit 231 receives a request for anonymization from the personal information update receiving unit 210, the anonymization control unit 231 first instructs the personal information anonymization unit 232 to perform anonymization with the anonymization level specified as 1 (C4).
- the personal information anonymization unit 232 When receiving the anonymization instruction, the personal information anonymization unit 232 reads the personal information stored in the personal information database 221 (C5). When the personal information anonymization unit 232 reads the personal information from the personal information database 221, the personal information anonymization unit 232 reads the personal information with new time information. In the present embodiment, it is assumed that personal information having time information on the date of the day to be anonymized is read. Now, for example, it is assumed that anonymization occurs at 01:00 on September 10. In this case, for example, assuming that personal information as shown in FIG. 15 is stored in the personal information database 221, the personal information anonymization unit 232 reads the personal information of personal information identification numbers 1 to 6. The personal information anonymization unit 232 starts anonymization of the read personal information (C6).
- the personal information anonymization unit 232 replaces the mobile identification number included in each personal information with an anonymous ID.
- the anonymous ID is a character string that cannot identify the user terminal 100.
- the personal information anonymization unit 232 refers to the anonymization level storage unit 223 and anonymizes each personal information with the content specified by the anonymization level 1 to generate provisional anonymous information.
- the personal information anonymization unit 232 counts the number of anonymous IDs (k-anonymity) having the same provisional attribute information for each provisional anonymous information after anonymization.
- the personal information anonymization unit 232 associates each temporary anonymous information with a personal information identification number, an anonymous ID, time information, anonymization level, and the number of anonymous IDs having the same temporary attribute information.
- the anonymization control unit 231 determines whether each provisional anonymous information recorded in the related information database 222 satisfies the standard anonymity. A request is made to the anonymity determination unit 233 (C9).
- the anonymity determination unit 233 compares the reference anonymity stored in the reference anonymity storage unit 224 with the number of anonymous IDs having the same provisional attribute information recorded in the related information database 222 (C10). .
- the anonymity determination unit 233 anonymizes any personal information after anonymization stored in the related information database 222 that does not satisfy the standard anonymity.
- the control unit 231 is notified (C11, C12).
- the anonymization control unit 231 receives a notification from the anonymity determination unit 233 that there is at least one temporary anonymity information stored in the related information database 222 that does not satisfy the standard anonymity.
- the anonymization level is increased by one and the personal information anonymization unit 232 is instructed to anonymize again (C4). Thereafter, the anonymization control unit 231 sets the anonymization level until the anonymity determination unit 233 receives a notification that all the provisional anonymous information stored in the related information database 222 satisfies the standard anonymity.
- the personal information anonymization unit 232 is instructed to anonymize (C4 to C11). Similarly, if all the provisional anonymous information stored in the related information database 222 satisfies the standard anonymity as a result of the comparison, the anonymity determination unit 233 notifies the anonymization control unit 231 to that effect ( C11, C12). In this embodiment, as shown in FIG. 17, the “number of anonymous IDs with the same attribute after anonymization (k-anonymity)” of all provisional anonymous information generated by anonymization at anonymization level 1 is the standard. Since the anonymity is satisfied, the process proceeds to step C13 and subsequent steps without repeating anonymization.
- the anonymization control unit 231 When the anonymization control unit 231 receives a notification from the anonymity determination unit 233 that all personal information stored in the related information database 222 satisfies the standard anonymity (C12), the anonymization control unit 231 stores the information in the related information database 222. The stored temporary anonymous information is read (C13), and the read temporary anonymous information is written to the anonymous information database 225 as anonymous information (C14).
- the personal information deletion request is a request transmitted from the user terminal 100 of the user when the user wants to stop providing personal information to the anonymity guarantee device 200.
- the anonymity guarantee device 200 When the anonymity guarantee device 200 receives a personal information deletion request from the user terminal 100, the anonymity guarantee device 200 deletes the personal information and identification information of the user from the personal information database 221, as well as the related information database 222 and the anonymous information. Information generated based on the personal information and identification information of the user is also deleted from the database 225. In this case, any anonymous information stored in the anonymous information database 225 may not satisfy the standard anonymity. Therefore, the anonymity guarantee apparatus 200 according to the present embodiment processes the following when receiving a personal information deletion request. Assume that the personal information database 221 currently stores personal information as shown in FIG.
- the personal information update acceptance unit 210 receives a personal information deletion request from the user terminal 100 (D1). Then, the personal information update accepting unit 210 deletes the personal information and identification information of the user of the user terminal 100 that has transmitted the personal information deletion request from the personal information database 221 (D2). Also, the personal information update acceptance unit 210 deletes all information generated based on the personal information and identification information of the user from the related information database 222 and the anonymous information database 225. (D3).
- the anonymization control unit 231 deletes all information generated based on the personal information and identification information of the user from the related information database 222 and the anonymous information database 225 (D4, D5).
- the temporary anonymous information stored in the related information database 222 after deletion is shown in FIG.
- the anonymous information database 225 stores the association between the anonymous information and the personal information based on the anonymous information using the personal information identification number in the personal information database 221. Therefore, the anonymization control unit 231 that has received the anonymous information deletion request can specify the anonymous information created based on the personal information to be deleted. Then, the anonymization control unit 231 requests the anonymity determination unit 233 to determine whether each provisional anonymous information recorded in the related information database 222 satisfies the reference anonymity (D6).
- the anonymity determination unit 233 compares the reference anonymity stored in the reference anonymity storage unit 224 with the number of anonymous IDs having the same provisional anonymous information recorded in the related information database 222 (D7). .
- the temporary anonymous information of personal information identification numbers 2 and 5 is the same in latitude and longitude, but the user terminal that provided the personal information that is the basis of the temporary anonymous information of personal information identification numbers 2 and 5 is an anonymous ID. Is one unit represented by user_B.
- the anonymity determination unit 233 determines that if there is any temporary anonymity information stored in the related information database 222 that does not satisfy the standard anonymity, the anonymization control unit 231 indicates that. (D8).
- the anonymity determination unit 233 notifies the anonymization control unit 231 to that effect ( D8).
- the anonymization control unit 231 receives a notification from the anonymity determination unit 233 that there is at least one temporary anonymity information stored in the related information database 222 that does not satisfy the standard anonymity.
- the anonymization level is increased by one and the personal information anonymization unit 232 is instructed to anonymize.
- the operation of the anonymity guarantee device 200 at the time of anonymization is the same as the above-described operation (C4 to C14) when receiving personal information.
- the provisional anonymous information generated as a result of anonymization at the anonymization level 1 does not satisfy the standard anonymity, so the anonymization level 2 is anonymized again.
- the provisional anonymous information generated by anonymization at anonymization level 2 is shown in FIG. In FIG.
- the user can provide the location information of the user terminal with peace of mind without worrying about identifying the individual.
- the user can receive a convenient service using geographical information of the user terminal.
- corresponds the table which memorize
- the regional mesh code is a “standard regional mesh and standard regional mesh code used for statistics” established by the Ministry of Internal Affairs and Communications (Administrative Administration Agency Notification No. 143 of 1973).
- the area mesh code is identification information of position information in which an area formed by dividing a map along latitude and longitude is expressed using an identifier for use in statistics.
- the regional mesh code has a hierarchical structure, and is composed of four layers of a primary mesh, a secondary mesh, a tertiary mesh, and a 1/2 regional mesh in order of increasing area.
- the primary mesh includes 64 secondary meshes.
- the secondary mesh includes 100 tertiary meshes.
- the tertiary mesh includes four half area meshes.
- the area mesh is expressed in a form in which identifiers of areas in each hierarchy are listed.
- the primary mesh is represented by a 4-digit number.
- the primary mesh is a section of one map of a 1: 200,000 terrain map with one unit section, with a latitude difference of 40 minutes and a longitude difference of 1 degree.
- the length of one side is about 80 km.
- the primary mesh code is a four-digit number, with the upper two digits representing latitude (1.5 times rounded up to the nearest minute) and the lower two digits representing longitude (lower two digits).
- the secondary mesh is expressed as 3570-12 together with the primary mesh.
- the first 4 digits 3570 represents the primary mesh, and the subsequent 12 represents the secondary mesh.
- the secondary mesh is an area formed by dividing the primary mesh into eight equal parts in the latitude direction and the meridian direction, and the length of one side is about 10 km.
- the secondary mesh code is a two-digit number, with the first digit representing the latitude direction and the last digit representing the longitude direction.
- the tertiary mesh is an area formed by dividing into 10 equal parts in the latitude and longitude directions, the latitude difference is 30 seconds, the longitude difference is 45 seconds, and the length of one side is about 1 km.
- the third mesh code is a two-digit number like the second mesh code, with the first digit representing the latitude direction and the last digit representing the longitude direction. By combining this with the primary and secondary mesh codes, the tertiary mesh is represented as 3570-12-34. There is a 1/2 area mesh as a more detailed area division.
- the half-region mesh is a tertiary mesh divided into two equal parts vertically and horizontally.
- the mesh of the southwest side is 1, the southeast is 2, the northwest is 3, and the northeast is 4, and the half area mesh is represented as 3570-12-34-3.
- Personal information anonymization in the present embodiment will be described with reference to FIG. The difference from the second embodiment is the step C6.
- the personal information anonymization unit 232 replaces the mobile identification number included in each personal information with an anonymous ID.
- the anonymous ID is a character string that cannot identify the user terminal 100.
- the personal information anonymization unit 232 refers to the anonymization level storage unit 223 and converts the position information represented by the latitude and longitude of each personal information into a regional mesh code.
- the personal information anonymization unit 232 refers to the table in which the anonymization level and the processing content are associated with each other as shown in FIG. 24 for the position information of each personal information converted into the regional mesh code. Anonymize the content specified at anonymization level 1 to generate provisional anonymous information. In addition, the personal information anonymization unit 232 counts the number of anonymous IDs (k-anonymity) having the same provisional attribute information for each provisional anonymous information after anonymization. Other processes are the same as those in the second embodiment. Based on the anonymity guarantee device 200 according to the present embodiment, it is guaranteed that all anonymous information provided by the anonymity guarantee device 200 always satisfies the standard anonymity. Therefore, the user can provide personal information with peace of mind without worrying about identifying the individual.
- the user can receive a convenient service using geographical information of the user terminal.
- the regional mesh code is determined by the Ministry of Internal Affairs and Communications and is often used for various statistics. Therefore, when the anonymous information received from the anonymity guarantee device 200 is utilized for behavior analysis data or the like, for example, it is easy to analyze in combination with other statistical information.
- the region mesh code may be an original one other than the one set by the Ministry of Internal Affairs and Communications.
- the processing content stored in the anonymization level storage unit (corresponding to the algorithm definition unit described in the claims) 223 can include processing for deleting a part of the description content of the personal information.
- the processing content stored in the anonymization level storage unit (corresponding to the algorithm definition unit described in the claims) 223 may include processing for replacing a part of the description content of the personal information with a higher concept word / phrase.
- the personal information stored in the personal information database 221 includes location information of each of a plurality of mobile phones that are communicably connected to the anonymity guarantee device (corresponding to the information processing device described in claims) 200. Can do.
- the location information of each mobile phone can include information indicating the latitude and longitude of the location of each mobile phone.
- the processing content stored in the anonymization level storage unit 223 can include processing for reducing the accuracy of at least one of latitude and longitude.
- the anonymization level storage unit (corresponding to the algorithm definition unit described in the claims) 223 includes each layer that includes a lowermost area formed by dividing a map hierarchically along latitude and longitude.
- the identification information that enumerates and expresses the identifiers of the areas in the hierarchical order and the information that expresses the range of the lowermost area in terms of latitude and longitude are stored in association with each lowermost area.
- the identifiers of each layer that constitutes the identification information the plurality of algorithms that indicate to which layer the identifier from the lowest layer identifier is to be deleted, the algorithm identification information that has a larger numerical value as the algorithm that deletes the higher layer They can be stored in association with each other.
- the personal information anonymization unit (corresponding to the description content changing unit and the description content-specific provider number calculating unit described in the claims) 232 refers to the algorithm definition unit and stores each information stored in the personal information database 221.
- Each information indicating the latitude and longitude of the location of the mobile phone is converted into the identification information of the corresponding lowest layer area, and the layer of the hierarchy determined by the algorithm from the identifier of the lowest layer among the identifiers of each layer constituting each identification information You can delete up to the identifier.
- the algorithm can include a process of deleting a part of the description content of the personal information.
- the algorithm may include a process of replacing a part of the description content of the personal information with a higher concept word / phrase.
- the location information of each mobile phone can include information indicating the latitude and longitude of the location of each mobile phone.
- the algorithm can include a process of reducing the accuracy of at least one of latitude and longitude.
- the algorithm definition unit includes identification information that expresses the lowest layer area obtained by hierarchically dividing the map along latitude and longitude by listing the identifiers of the areas of each layer that include the area in hierarchical order, and the lowest layer Information indicating the range of the area in terms of latitude and longitude is stored in association with each of the lowest layer areas, and from the identifiers of the lowest layer among the identifiers of each layer constituting the identification information of the lowest layer area
- a plurality of algorithms indicating to which hierarchy an identifier is to be deleted can be stored in association with algorithm identification information that has a larger numerical value as an algorithm for deleting an upper hierarchy.
- the description content changing unit refers to the algorithm definition unit, converts each information indicating the latitude and longitude of the location of each mobile phone stored in the personal information database into identification information of the corresponding lowest layer area, Of the identifiers of each layer constituting each identification information, the identifiers from the lowest layer to the layer identifier determined by the algorithm can be deleted.
- the anonymity guarantee apparatus of this invention is not restricted to the structure shown in FIG.
- FIG. 25 is a block diagram showing an example of the configuration of the anonymity guarantee device 250 according to another embodiment of the present invention. 25, the same components as those in FIG. 2 are denoted by the same reference numerals and detailed description thereof is omitted.
- the personal information anonymization unit 232 includes a description content changing unit 234 and a description content-specific provider number calculating unit 235.
- the personal information database 221 stores a plurality of personal information in association with the identification information of the providers of the personal information.
- the anonymization level storage unit 223 stores a plurality of types of algorithms that define the content for anonymizing the description content of each personal information in association with the algorithm identification information.
- the description content changing unit 234 changes the description content of each personal information stored in the personal information database 221 according to an algorithm corresponding to predetermined algorithm identification information.
- the number-of-provided provider count calculation unit 235 calculates the number of providers of personal information to be changed to the description content after each change for each description content after the change.
- the anonymity determination unit 233 compares the minimum value of the number of providers with a predetermined reference value. Then, the description content changing unit 234 changes the description content of each personal information stored in the personal information database 221 with an algorithm corresponding to each algorithm identification information until the minimum value becomes equal to or greater than the reference value.
- the anonymity guarantee device 250 repeats these processes to achieve the same effect as the anonymity guarantee device 200.
- the anonymity guarantee device 250 corresponds to the information processing device described in the claims
- the anonymization level storage unit 223 corresponds to the algorithm definition unit described in the claims
- the anonymity determination unit is the anonymity determination unit.
- Reference numeral 233 corresponds to a comparison unit in the claims.
- the anonymity guarantee device 250 shown in FIG. 25 has the minimum configuration of the present invention.
- the present invention has been described with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
- This application claims the priority on the basis of Japanese application Japanese Patent Application No. 2010-108050 for which it applied on May 10, 2010, and takes in those the indications of all here.
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
匿名化後の個人情報の該当者が所定人数以上存在することを保証するように個人情報を匿名化する。 本発明の情報処理装置は、複数の個人情報を記憶する個人情報データベースと、各個人情報の記載内容を曖昧化する処理内容を定義した複数種類のアルゴリズムをアルゴリズム識別情報とそれぞれ対応付けて記憶するアルゴリズム定義部と、各個人情報の記載内容を、所定のアルゴリズム識別情報に対応するアルゴリズムに従って変更する記載内容変更部と、変更後の記載内容毎に、各変更後の記載内容に変更される個人情報の提供者数を算出する記載内容別提供者数算出部と、各提供者数のうちの最小値を所定基準値と比較する比較部とを含み、記載内容変更部が、最小値が基準値以上になるまで各アルゴリズム識別情報に対応するアルゴリズムで個人情報データベースに記憶されている各個人情報の記載内容を変更する処理を繰り返す。
Description
本発明は、匿名化後の個人情報の該当者が所定人数以上存在することを保証するように個人情報を匿名化する情報処理装置、制御方法及びプログラムに関する。
近年、インターネットを使ったサービスの普及に伴い、サービス利用者の個人情報(年齢、性別、趣味、職業など)を活用したサービスが、一般的になりつつある。このようなサービスを提供するサービス提供業者は、サービス利用者から収集した個人情報を基に、サービス利用者の特性に合わせた便利なサービスを、サービス利用者に提供する。
また、サービス利用者の個人情報を保護するために、サービス利用者から収集した個人情報を匿名化する技術も、開発されている(例えば、特許文献1、特許文献2、特許文献3を参照)。
また、秘匿化にレベルを備えることも行われている(例えば、特許文献4を参照)。
特開2004−145483号公報
特開2004−206319号公報
特開2007−287102号公報
特開2006−185311号公報
また、サービス利用者の個人情報を保護するために、サービス利用者から収集した個人情報を匿名化する技術も、開発されている(例えば、特許文献1、特許文献2、特許文献3を参照)。
また、秘匿化にレベルを備えることも行われている(例えば、特許文献4を参照)。
しかし、個人情報を匿名化したからと言って、個人情報の提供者が特定されないとは、必ずしも、言えない。例えば、匿名化した個人情報の該当者が一人しかいなければ、その個人情報の提供者を特定することは、可能である。
そのため、匿名化後の個人情報の該当者が所定人数以上存在することを保証するように個人情報を匿名化する技術が、求められている。
本発明は、上記課題を鑑みてなされたものである。本発明の目的は、匿名化後の個人情報の該当者が所定人数以上存在することを保証するように個人情報を匿名化する情報処理装置、制御方法及びプログラムを提供することにある。
そのため、匿名化後の個人情報の該当者が所定人数以上存在することを保証するように個人情報を匿名化する技術が、求められている。
本発明は、上記課題を鑑みてなされたものである。本発明の目的は、匿名化後の個人情報の該当者が所定人数以上存在することを保証するように個人情報を匿名化する情報処理装置、制御方法及びプログラムを提供することにある。
本発明の情報処理装置は、複数の個人情報を、各個人情報の提供者の識別情報とそれぞれ対応付けて記憶する個人情報データベースと、前記各個人情報の記載内容を曖昧化する処理内容を定義した複数種類のアルゴリズムを、アルゴリズム識別情報とそれぞれ対応付けて記憶するアルゴリズム定義部と、前記個人情報データベースに記憶されている各個人情報の記載内容を、所定のアルゴリズム識別情報に対応するアルゴリズムに従って変更する記載内容変更部と、変更後の記載内容毎に、各変更後の記載内容に変更される個人情報の提供者数を算出する記載内容別提供者数算出部と、前記各提供者数のうちの最小値を所定の基準値と比較する比較部とを含み、前記記載内容変更部が、前記最小値が前記基準値以上になるまで、各アルゴリズム識別情報に対応するアルゴリズムで前記個人情報データベースに記憶されている各個人情報の記載内容を変更する処理を繰り返すことを特徴とする。
また、本発明の制御方法は、複数の個人情報を、各個人情報の提供者の識別情報とそれぞれ対応付けて記憶し、前記各個人情報の記載内容を曖昧化する処理内容を定義した複数種類のアルゴリズムを、アルゴリズム識別情報とそれぞれ対応付けて記憶し、前記記憶されている各個人情報の記載内容を、所定のアルゴリズム識別情報に対応するアルゴリズムに従って変更し、変更後の記載内容毎に、各変更後の記載内容に変更される個人情報の提供者数を算出し、前記各提供者数のうちの最小値を所定の基準値と比較し、前記最小値が前記基準値以上になるまで、各アルゴリズム識別情報に対応するアルゴリズムで前記個人情報データベースに記憶されている各個人情報の記載内容を変更する処理を繰り返すことを特徴とする。
また、本発明のプログラムは、複数の個人情報を、各個人情報の提供者の識別情報とそれぞれ対応付けて記憶する手順と、前記各個人情報の記載内容を曖昧化する処理内容を定義した複数種類のアルゴリズムを、アルゴリズム識別情報とそれぞれ対応付けて記憶する手順と、を備える情報処理装置に、前記記憶されている各個人情報の記載内容を、所定のアルゴリズム識別情報に対応するアルゴリズムに従って変更する手順と、変更後の記載内容毎に、各変更後の記載内容に変更される個人情報の提供者数を算出する手順と、前記各提供者数のうちの最小値を所定の基準値と比較する手順と、前記最小値が前記基準値以上になるまで、各アルゴリズム識別情報に対応するアルゴリズムで記憶されている各個人情報の記載内容を変更する処理を繰り返す手順とをコンピュータに実行させる。
その他、本願が開示する課題及びその解決方法は、発明を実施するための最良の形態の欄、及び図面にて明らかにされる。
また、本発明の制御方法は、複数の個人情報を、各個人情報の提供者の識別情報とそれぞれ対応付けて記憶し、前記各個人情報の記載内容を曖昧化する処理内容を定義した複数種類のアルゴリズムを、アルゴリズム識別情報とそれぞれ対応付けて記憶し、前記記憶されている各個人情報の記載内容を、所定のアルゴリズム識別情報に対応するアルゴリズムに従って変更し、変更後の記載内容毎に、各変更後の記載内容に変更される個人情報の提供者数を算出し、前記各提供者数のうちの最小値を所定の基準値と比較し、前記最小値が前記基準値以上になるまで、各アルゴリズム識別情報に対応するアルゴリズムで前記個人情報データベースに記憶されている各個人情報の記載内容を変更する処理を繰り返すことを特徴とする。
また、本発明のプログラムは、複数の個人情報を、各個人情報の提供者の識別情報とそれぞれ対応付けて記憶する手順と、前記各個人情報の記載内容を曖昧化する処理内容を定義した複数種類のアルゴリズムを、アルゴリズム識別情報とそれぞれ対応付けて記憶する手順と、を備える情報処理装置に、前記記憶されている各個人情報の記載内容を、所定のアルゴリズム識別情報に対応するアルゴリズムに従って変更する手順と、変更後の記載内容毎に、各変更後の記載内容に変更される個人情報の提供者数を算出する手順と、前記各提供者数のうちの最小値を所定の基準値と比較する手順と、前記最小値が前記基準値以上になるまで、各アルゴリズム識別情報に対応するアルゴリズムで記憶されている各個人情報の記載内容を変更する処理を繰り返す手順とをコンピュータに実行させる。
その他、本願が開示する課題及びその解決方法は、発明を実施するための最良の形態の欄、及び図面にて明らかにされる。
本発明の処理装置は、匿名化後の個人情報の該当者が所定人数以上存在することを保証するように個人情報を匿名化することができる。
本発明の処理装置に基づき、サービス利用者は、個人が特定される不安を抱くことなく安心して個人情報を提供することができる。また、サービス利用者は、サービス利用者の個人情報を利用した便利なサービスの提供を受けることが可能となる。
本発明の処理装置に基づき、サービス利用者は、個人が特定される不安を抱くことなく安心して個人情報を提供することができる。また、サービス利用者は、サービス利用者の個人情報を利用した便利なサービスの提供を受けることが可能となる。
(第一の実施の形態)
本発明の第1の実施形態に係る匿名性保証システム1000について、図面を参照して詳細に説明する。
<全体の構成>
図1に示すように、第1の実施形態に係る匿名性保証システム1000は、利用者端末100A及び100Bと、匿名性保証装置200と、サービス提供者サーバ300とがネットワーク400を介して通信可能に接続している。なお、以下では、記載の簡略化のため、利用者端末100Aと利用者端末100Bとを区別する必要が無い場合などには、適宜まとめて利用者端末100と記載する場合がある。
利用者端末100Aは、匿名性保証装置200に、利用者端末100Aの利用者の個人情報を送信する。また、利用者端末100Bも、同様に、匿名性保証装置200に、利用者端末100Bの利用者の個人情報を送信する。
これらの個人情報は、例えば、利用者端末100A及び100Bの利用者の電話番号、年齢、性別、住所、職業、趣味、利用者端末100A及び100Bの位置情報などである。このように、個人情報には、個人情報を取得した第三者が、個人情報の提供者を特定できる情報が含まれる。
また、利用者端末100は、匿名性保証装置200に、個人情報と共に、個人情報の提供者の識別情報を送信する。識別情報は、例えば、利用者端末100A及び100Bの利用者の氏名などである。
匿名性保証装置200は、利用者端末100から受信した個人情報と識別情報とを記憶する。また、匿名性保証装置200は、利用者端末100から受信した個人情報を匿名化し、匿名情報を作成する。匿名化とは、個人情報の記載内容を変更し、個人情報の提供者の特定を困難にする処理である。匿名化は、例えば、個人情報に含まれる情報量を削減する処理や、個人情報から個人を特定する困難性を高めるように個人情報の精度を下げる処理を含む。匿名化は、一般的に曖昧化と呼ぶことが出来る。
匿名化の結果、異なる個人情報から生成される匿名情報が同一となる場合が生じる。例えば、利用者から提供された電話番号(個人情報)の下一桁を削除するように匿名化した場合には、10個の個人情報が同一の匿名情報に変換される。この処理に基づき、匿名性保証装置200は、第三者が匿名情報を取得したとしても、第三者が個人情報の提供者を特定することを困難にできる。
また、詳しくは後述するが、本実施形態に係る匿名性保証装置200は、匿名化の強さを制御できる。この制御に基づき、匿名性保証装置200は、生成された匿名情報から個人を特定する際の困難性を制御できる。例えば、利用者から提供された電話番号(個人情報)の「下二桁」を削除するように匿名化した場合には、100個の個人情報が同一の匿名情報に変換されることになるため、匿名性保証装置200は、「下一桁」を削除する匿名化に比べて、個人の特定の困難性を高めることができる。
なお、本実施形態に係る匿名性保証装置200は、匿名情報から個人を特定する際の困難性を、後述する「基準匿名性」として表現しており、この「基準匿名性」を満たすように匿名化の強さを制御する。
例えば、匿名性保証装置200が利用者から提供された電話番号(個人情報)の下一桁を削除するように匿名化を制御している場合に、ある利用者から電話番号の提供を中止するとの申し出があり、その利用者の個人情報から生成された匿名情報を削除した結果、匿名化後の電話番号の提供者が一人しかいなくなるというケースも生じうる。この場合は、匿名化後の電話番号でも、その電話番号の提供者が一人しかいないため、その提供者は、特定されてしまう。
その場合、本実施形態に係る匿名性保証装置200は、匿名化後の電話番号が「基準匿名性」を満たすように、例えば、基の電話番号の「下二桁」を削除するように匿名化を変更して、電話番号を匿名化する。
匿名性保証装置200は、上記のように「基準匿名性」を満たすように作成した匿名情報を、サービス提供者サーバ300に送信する。
サービス提供者サーバ300は、匿名性保証装置200から受信した匿名情報を利用して、上記利用者端末100の利用者向けのサービスを、利用者端末100に提供する。
この匿名性保証装置200に基づき、利用者は、個人が特定される不安を抱くことなく、安心して個人情報を提供できる。また、利用者は、利用者の個人情報を利用した便利なサービスの提供を受けることが可能となる。
<利用者端末の構成>
利用者端末100の構成を図5に示す。
利用者端末100は、個人情報送信部110と、サービス要求送信部120と、サービス受信部130とを含む。
個人情報送信部110は、個人情報と識別情報とを匿名性保証装置200に送信する。サービス要求送信部120は、サービス提供者サーバ300にサービス実行要求を送信する。サービス受信部130は、サービス提供者サーバ300からサービスの実行結果を受信する。
<サービス提供者サーバの構成>
サービス提供者サーバ300の構成を図6に示す。サービス提供者サーバ300は、利用者端末100からサービス実行要求を受け、匿名性保証装置200から受信した匿名情報を利用して、利用者端末100の利用者へサービスを提供するための情報を処理する。そして、サービス提供者サーバ300は、情報の処理の結果である実行結果を利用者端末100に送信する。
あるいは、サービス提供者サーバ300は、利用者端末100からサービス実行要求を受信しなくても、自発的に、匿名情報を利用して情報を処理し、利用者端末100にその実行結果を送信もできる。
サービス提供者サーバ300は、サービス要求受信部310と、匿名情報要求部320と、匿名情報取得部330と、サービス実行部340と、サービス送信部350とを含む。
サービス要求受信部310は、利用者端末100からサービス実行要求を受け付ける。
匿名情報要求部320は、匿名性保証装置200に匿名情報を要求する。
匿名情報取得部330は、匿名性保証装置200から匿名情報を受信する。
サービス実行部340は、匿名性保証装置200から受信した匿名情報を利用して、利用者端末100の利用者へサービスを提供するための情報を処理する。
サービス送信部350は、利用者端末100に処理の実行結果を送信する。
<匿名性保証装置の構成>
図2に示すように、本実施形態に係る匿名性保証装置200は、個人情報更新受付部210と、データベース220と、個人情報匿名化プログラム230と、匿名情報提供部240とを含む。
データベース220は、個人情報データベース221と、関連情報データベース222と、匿名化レベル記憶部223と、基準匿名性記憶部224と、匿名情報データベース225とを含む。
個人情報匿名化プログラム230は、匿名化制御部231と、個人情報匿名化部232と、匿名性判定部233とを含む。
<ハードウェア構成>
図3に示すように、匿名性保証装置200は、CPU(Central Processing Unit)201と、メモリ202と、ポート203と、ハードディスクドライブ204と、記録媒体205と、記録媒体読取装置206と、入力装置207と、出力装置208とを含むコンピュータを用いても構成することができる。
CPU201は、匿名性保証装置200の全体を制御する。CPU201は、ハードディスクドライブ204に記憶された本実施の形態に係る各種の動作を行うためのコードから構成される個人情報匿名化プログラム230をメモリ202に読み出して実行し、匿名性保証装置200としての各種機能を実現する。
記録媒体読取装置206は、フレキシブルディスクや磁気テープ、コンパクトディスク等の記録媒体205に記録されているプログラムやデータを読み取るための装置である。読み取られたプログラムやデータは、メモリ202やハードディスクドライブ204に格納される。従って、匿名性保証装置200は、例えば、記録媒体205に記録された個人情報匿名化プログラム230を、記録媒体読取装置206を用いて上記記録媒体205から読み取り、メモリ202やハードディスクドライブ204に記憶できる。記録媒体読取装置206は、匿名性保証装置200に内蔵されている形態とすることもできるし、外付されている形態とすることもできる。
ハードディスクドライブ204は、例えば、ハードディスク装置や半導体記憶装置を用いることができる。ハードディスクドライブ204は、個人情報匿名化プログラム230及びデータベース220を記憶する。ハードディスクドライブ204が、個人情報匿名化プログラム230及びデータベース220を記憶している様子を図4に示す。
入力装置207は、匿名性保証装置200へのデータ入力等のために用いられる装置であり、ユーザインタフェースとして機能する。入力装置207は、例えば、キーボードやマウスを用いることができる。
出力装置208は、情報を外部に出力するための装置であり、ユーザインタフェースとして機能する。出力装置208は、例えば、ディスプレイやプリンタを用いることができる。
ポート203は、通信のための装置である。例えば、匿名性保証装置200は、ネットワーク400を介した利用者端末100、サービス提供者サーバ300等の他のコンピュータとの通信を、ポート203を経由してできる。また、例えば、匿名性保証装置200は、個人情報匿名化プログラム230及びデータベース220を、ポート203を経由して、他のコンピュータからネットワーク400を介して受信し、メモリ202やハードディスクドライブ204に記憶できる。
<個人情報更新受付部>
図2に戻って、個人情報更新受付部210は、利用者端末100から個人情報と識別情報とを受信し、個人情報と識別情報とを個人情報データベース221に書き込む。
<個人情報データベース>
個人情報データベース221は、利用者端末100から受信した個人情報と識別情報とを記憶する。個人情報データベース221の一例を図7に示す。利用者端末100から送信される個人情報には、例えば、「電話番号」と「生年月日」と「性別」とが含まれる。利用者端末100から送信される識別情報には、例えば、「利用者の氏名」が含まれる。
図7の個人情報データベース221は、ユーザAからユーザEまでの、5つの個人情報を記憶している。個人情報データベース221が記憶する各個人情報は、それぞれ「個人情報識別番号」を用いて識別される。
<匿名化レベル記憶部>
図2に戻って、匿名化レベル記憶部(特許請求の範囲に記載のアルゴリズム定義部に相当する)223は、匿名化の際に個人情報をどのように匿名化するかを、匿名化レベル(特許請求の範囲に記載のアルゴリズム識別情報に相当)ごとに記憶する。
例えば、図8に示す匿名化レベル記憶部223の一例は、匿名化レベル1からKまでの匿名化レベル毎に、個人情報をどのように匿名化するかを記憶している。なお、図8に示す例では、匿名化レベルの値が大きいほど、匿名化の個人情報の精度を下げる度合いが大きくなる。つまり、匿名化レベルの値が大きいほど、匿名化の個人情報内の情報量が大きく削減される。例えば、図8に示す例では、匿名化レベル1で電話番号を匿名化すると、電話番号の下2桁が伏せ字になる。匿名化レベル2では下3桁、匿名化レベル3では下4桁、匿名化レベルKではすべての桁が伏せ字になる。このように、匿名化レベルが高いほど、匿名化の個人情報の精度を下げる度合いが大きくなる。また、匿名化レベルを見るだけで匿名化の程度を把握することも可能である。
匿名化レベル記憶部223は、電話番号の下何桁かを伏せ字にする、生年月日の任意の桁を伏せ字にする、住所の番地を伏せ字にする、趣味や職業を上位概念化する、などのように、匿名化に応じた処理内容を、匿名化レベル毎に記載する。
<関連情報データベース>
関連情報データベース222の一例を図9に示す。関連情報データベース222は、個人情報データベース221に記憶されている個人情報に対して、後述する匿名化で生成される「暫定匿名情報」を記憶する。また、関連情報データベース222は、個人情報に含まれる「個人名」を別の文字列に変換することで生成される暫定匿名情報の識別子である「匿名ID(Identification)」を記憶する。また、関連情報データベース222は、「暫定匿名情報のもとになった個人情報の識別番号」と、「暫定匿名情報の匿名化レベル」と、「暫定属性情報が同一の匿名IDの数」とを暫定匿名情報毎に記憶する。
暫定匿名情報は、「匿名化後の電話番号」と、「匿名化後の生年月日」と、「匿名化後の性別」とを含む。「暫定匿名情報の匿名化レベル」欄は、その暫定匿名情報がどの匿名化レベルで匿名化されたかを記憶する。
<匿名情報データベース>
匿名情報データベース225の一例を図10に示す。匿名情報データベース225は、「匿名情報」と「匿名ID」とを記憶する。「匿名情報」とは、前述した暫定匿名情報のうち、後述する基準匿名性を満たしているものを表す。
匿名情報は、「匿名化後の電話番号」と、「匿名化後の生年月日」と、「匿名化後の性別」とを含む。
匿名情報データベース225が記憶する匿名情報は、後述する匿名情報提供部240を用いて、サービス提供者サーバ300に送信される。
<基準匿名性記憶部>
図2に戻って、基準匿名性記憶部224は、基準匿名性(特許請求の範囲に記載の「所定の基準値」に相当する)を記憶する。
ここで基準匿名性とは、本実施形態に係る匿名化に基づいて生成される匿名情報が満足する個人特定困難性の基準値である。例えば、本実施形態の匿名性保証装置200は、匿名性保証装置200が作成する全ての匿名情報を匿名属性情報が同一のもの同士でグループ化した場合に、各グループに属する匿名IDの個数の最小値が基準匿名性の値を上回るように、匿名化する。
このような処理に基づき、ある匿名情報が第三者に知られたとしても、その匿名情報の基になった個人情報を提供した人数が「基準匿名性」の数以上であるので、個人の特定は、困難となる。基準匿名性は、例えば、匿名性保証装置200の管理者が設定する値である。
<匿名化制御部>
匿名化制御部231は、個人情報匿名化部232に、匿名化レベルを指定して、個人情報データベース221に記憶されている個人情報を匿名化させる。また、匿名化制御部231は、上記匿名化に基づいて生成された暫定匿名情報を関連情報データベース222から取得して、それらの暫定匿名情報が基準匿名性を満たすかどうかを匿名性判定部233に判定させる。
匿名化制御部231は、判定の結果、匿名化に基づいて生成された上記匿名情報が基準匿名性を満たしていない場合には、匿名化レベルを変更して、再度、個人情報匿名化部232に個人情報を匿名化させる。
また、匿名化制御部231は、判定の結果、匿名化に基づいて生成された上記暫定匿名情報が基準匿名性を満たしている場合には、関連情報データベース222から上記暫定匿名情報を読み込み、匿名情報として匿名情報データベース225に書き込む。
<個人情報匿名化部>
個人情報匿名化部(特許請求の範囲に記載の記載内容変更部と記載内容別提供者数算出部に相当する)232は、匿名化制御部231から匿名化レベルを指定した匿名化の要求を受けると、匿名化レベル記憶部223を参照し、その匿名化レベルに応じた内容で、個人情報データベース221に記憶されている個人情報の匿名化し、暫定匿名情報を作成する。また、個人情報匿名化部232は、同一の暫定匿名情報を持つグループに属する匿名IDの数(後述する k−匿名性)を算出する。また、個人情報匿名化部232は、匿名化の際に、個人情報データベース221が記憶する各個人名を別の文字列へと変換し「匿名ID」を作成する。個人情報匿名化部232は、上記暫定匿名情報と、匿名IDと、匿名化レベルと、同一の暫定匿名情報を持つグループに属する匿名IDの数と、暫定匿名情報の基となった個人情報識別番号とを関連情報データベース222に書き込む。
<匿名性判定部>
匿名性判定部233(特許請求の範囲に記載の比較部に相当)は、上記匿名化に基づいて生成される匿名情報の同一の匿名情報を持つグループに属する匿名IDの数の最小値が基準匿名性以上か否かを判定する。
<匿名情報提供部>
匿名情報提供部240は、サービス提供者サーバ300から匿名情報の取得要求を受けると、匿名情報データベース225から匿名情報を読み出して、サービス提供者サーバ300に送信する。
<k−匿名性>
なお、本実施形態において、同一の暫定匿名情報を持つグループに属する匿名IDの数のことを「k−匿名性」と記すこともある。「k−匿名性」は、もちろん、同一の匿名情報を持つグループに属する匿名IDの数や、同一の個人情報を持つグループに属する利用者の人数にも適用できる。
k−匿名性(k−anonymity)について、図7、図8、図11、図12を用いて説明する。本実施形態において、k−匿名性は、以下のように定義される。すなわち、個人情報を匿名化して生成される各匿名情報において、同一の匿名情報の基となった個人情報を提供した利用者が自分自身を含めk人以上存在するとき、その匿名情報のk−匿名性は、kである。k−匿名性は、匿名情報から個人を特定する困難性を表す指標になる。
図7に示される個人情報データベース221に記載される個人情報を、図8に示される匿名化レベル記憶部223に記載される匿名化レベル1で匿名化すると、図11に示すような匿名情報が生成される。
図11に示されるテーブルに記載される個人情報識別番号1、2の匿名情報は、電話番号、生年月日、性別の全てにおいて同一である。また、個人情報識別番号1、2の匿名情報の基となった個人情報は、匿名IDがuser_Aとuser_Bとで表される異なる2人の利用者から提供されたものであることがわかる。従って、個人情報識別番号1、2の匿名情報のk−匿名性は、それぞれ2である。
一方、個人情報識別番号3、4、5の匿名情報は、自分自身以外に、電話番号、生年月日、性別の全てにおいて同一である匿名情報が存在しないため、それぞれk−匿名性は、1である。
図7に示される個人情報データベース221に記載される個人情報を、図8に示される匿名化レベル記憶部223に記載される匿名化レベル2で匿名化すると、図12に示されるテーブルに記載される匿名情報が生成される。図12に示されるテーブルに記載される個人情報識別番号1、2、3で表される3つの匿名情報は、電話番号、生年月日、性別の全てにおいて同一である。また、個人情報識別番号1、2、3の匿名情報の基となった個人情報は、匿名IDがuser_A、user_B、user_Cで表される異なる3人の利用者から提供されたものであることがわかる。従って、個人情報識別番号1、2、3の匿名情報のk−匿名性は、それぞれ3である。同様に、個人情報識別番号4、5の匿名情報のk−匿名性は、それぞれ2である。
<処理の流れ>
本実施形態の全体の動作について詳細に説明する。
<個人情報受信処理>
図13のシーケンス図を参照して、利用者端末100から個人情報と識別情報とを受信したときの匿名性保証装置200の動作について説明する。
個人情報更新受付部210は、利用者端末100から個人情報と識別情報とを受信すると(A1)、受信した個人情報と識別情報とを個人情報データベース221に書き込む(A2)。
また、個人情報更新受付部210は、個人情報データベース221に記録されている個人情報の匿名化を匿名化制御部231に要求する(A3)。
<匿名化>
匿名化制御部231は、個人情報更新受付部210から匿名化の要求を受けると、個人情報匿名化部232に、まずは、匿名化レベルを1に指定した匿名化を指示する(A4)。
個人情報匿名化部232は、匿名化の指示を受けると、個人情報データベース221に記憶されている個人情報と識別情報とを読み出して(A5)、それら個人情報と識別情報との匿名化を開始する(A6)。
まず、個人情報匿名化部232は、各個人情報にそれぞれ付属する識別情報(個人名)を匿名IDに置き換える。匿名IDは、個人名を特定できない文字列である。
次に、個人情報匿名化部232は、匿名化レベル記憶部223を参照して、各個人情報を、匿名化レベル1で特定される内容で匿名化し、暫定匿名情報を生成する。また、個人情報匿名化部232は、匿名化後の各暫定匿名情報に対して、暫定属性情報が同一となる匿名IDの数(k−匿名性)を集計する。
そして、個人情報匿名化部232は、各暫定匿名情報を、匿名IDと、匿名化レベルと、暫定匿名情報が同一の匿名IDの数と、個人情報識別番号と、暫定匿名情報の基となった個人情報識別番号と、それぞれ対応付けて関連情報データベース222に記録し(A7)、匿名化制御部231に匿名化の完了を通知する(A8)。
匿名化制御部231は、個人情報匿名化部232から匿名化の完了通知を受けると、関連情報データベース222に記憶されている各暫定匿名情報が、基準匿名性を満たしているか否かの判定を匿名性判定部233に要求する(A9)。
匿名性判定部233は、基準匿名性記憶部224に記憶されている基準匿名性と、関連情報データベース222に記録されている「暫定匿名情報が同一の匿名IDの数の最小値」とを比較する(A10)。
匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性未満であれば、その旨を匿名化制御部231に通知する(A11)。
同様に、匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性以上であれば、その旨を匿名化制御部231に通知する(A11)。
匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性未満である旨の通知を受けた場合には、匿名化レベルを一つ上げて、再度、個人情報匿名化部232に、匿名化を指示する(A12)。
以後、匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性以上である旨の通知を受けるまで、匿名化レベルを一つずつ上げて、個人情報匿名化部232に匿名化を指示する(A4~A11)。
一方、匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性以上である旨の通知を受けると(A11、A12)、関連情報データベース222に記憶されている暫定匿名情報を読み込み(A13)、読み込んだ暫定匿名情報を、匿名情報として、匿名情報データベース225に書き込む(A14)。
<基準匿名性変更時の処理>
匿名性保証装置200の管理者が、基準匿名性を変更した場合の匿名性保証装置200の動作について説明する。
匿名性保証装置200の管理者が、基準匿名性を変更すると、基準匿名性記憶部224は、個人情報データベース221に記録されている個人情報の匿名化を、匿名化制御部231に要求する(A3)。以降の処理は、上記A4~A14と同様である。
<個人情報削除要求受信時の処理>
図14のシーケンス図を参照して、利用者端末100から個人情報削除要求を受信した場合の、匿名性保証装置200の動作について説明する。個人情報削除要求とは、利用者が匿名性保証装置200への個人情報の提供を中止したいと考えた場合に、その利用者の利用者端末100から送信される要求である。
匿名性保証装置200は、利用者端末100から個人情報削除要求を受信した場合には、その利用者の個人情報と識別情報とを個人情報データベース221から削除すると共に、関連情報データベース222や匿名情報データベース225からも、その利用者の個人情報と識別情報とを基に生成された情報を削除する。この場合、匿名情報データベース225に記憶されているいずれかの匿名情報が基準匿名性を満たさなくなる可能性がある。
そのため、本実施形態に係る匿名性保証装置200は、個人情報削除要求を受信した場合には、以下を処理する。
個人情報更新受付部210は、利用者端末100から個人情報削除要求を受信する(B1)。そうすると、個人情報更新受付部210は、個人情報削除要求を送信してきた利用者端末100の利用者の個人情報と識別情報とを個人情報データベース221から削除する(B2)。
また、個人情報更新受付部210は、匿名化制御部231に、その利用者の個人情報と識別情報とを基に生成されたすべての情報を、関連情報データベース222及び匿名情報データベース225からの削除を指示する(B3)。
匿名化制御部231は、関連情報データベース222及び匿名情報データベース225から、その利用者の個人情報と識別情報とを基に生成された全ての情報を削除する(B4、B5)。なお、前述したように、関連情報データベース222及び匿名情報データベース225は、匿名情報と、その基となった個人情報との対応付けを、個人情報データベース221における個人情報識別番号を用いて記憶している。従って、匿名情報削除要求を受信した匿名化制御部231は、削除対象の個人情報と識別情報とを基に作成された情報を特定することができる。
そして、匿名化制御部231は、匿名性判定部233に、関連情報データベース222に記録されている各暫定匿名情報が、基準匿名性を満たしているか否かの判定を要求する(B6)。
匿名性判定部233は、基準匿名性記憶部224に記憶されている基準匿名性と、関連情報データベース222に記録されている「暫定属性情報が同一の匿名IDの数の最小値」とを比較する(B7)。
匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性未満であれば、その旨を匿名化制御部231に通知する(B8)。
同様に、匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性以上であれば、その旨を匿名化制御部231に通知する(B8)。
匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性未満である旨の通知を受けた場合には(B8、B9)、匿名化レベルを一つ上げて、個人情報匿名化部232に、匿名化を指示する。この匿名化の際の匿名性保証装置200の動作は、上記で説明した個人情報受信時における動作(A4~A14)と同様である。
一方、匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性以上である旨の通知を受けると(B8、B9)、そこで処理を終了する。
本実施形態に係る匿名性保証装置200が提供する全ての匿名情報は、必ず基準匿名性を満たしていることが保証される。そのため、利用者は、個人が特定される不安を抱くことなく安心して個人情報を提供することができる。また、利用者は、利用者の個人情報を利用した便利なサービスの提供を受けることが可能となる。
また、本実施形態に係る匿名性保証装置200は、サービス利用者から個人情報の追加や削除などの更新要求があった場合、又は基準匿名性に変更があった場合でも、必ず基準匿名性を満たした匿名情報を提供することが可能である。
なお、本実施形態における個人情報削除要求受信時の匿名性保証装置200の動作では、個人情報データベース221が記憶する個人情報の匿名化の(A4~A14)前に、削除対象の情報削除後の暫定匿名情報が基準匿名性を満たしているか否か判定する(B6~B9)が、判定する前に個人情報データベース221に記憶されている個人情報を読み出して、匿名化を開始することもできる。
この処理に基づき、匿名性保証装置200が作成する全ての匿名情報は、基準匿名性を満たす範囲の中で最小の匿名化レベルで匿名化されるようにできる。
従って、本実施形態の匿名性保証装置200が提供する匿名情報は、必ず基準匿名性を満たしていることが保証されつつ、高い精度を持つことが可能となる。
(第2の実施形態)
第2の実施形態では、利用者端末100は、一例として、GPS(Global Positioning System)を備えた携帯電話機である。
利用者端末100は、匿名性保証装置200に、利用者端末100の「個人情報」と「携帯識別番号」とを送信する。利用者端末100が送信する個人情報は、「位置情報」と、「時刻情報」とを含む。「位置情報」は、利用者端末100の地理的な位置を表し、緯度と経度を含む。「時刻情報」は、GPSで位置情報を測定した時刻を表す。「携帯識別番号」は、位置情報を提供した携帯電話機を特定できる情報である。
利用者端末100が匿名性保証装置200に個人情報を送信するタイミングは、例えば、一定時間間隔毎としても良いし、利用者端末100が任意のタイミングで送信してもかまわない。
匿名性保証装置200は、利用者端末100から受信した個人情報と携帯識別番号とを記憶する。また、匿名性保証装置200は、利用者端末100から受信した個人情報を匿名化し、匿名情報を作成する。本実施形態における匿名化は、位置情報から、個人情報を提供した利用者端末100を特定する困難性を高めるよう、位置情報の精度を下げる処理である。
匿名性保証装置200は、利用者端末100から上記個人情報を受信すると、受信した個人情報を匿名化し、匿名情報を作成する。そして、匿名性保証装置200は、作成した匿名情報をサービス提供者サーバ300に送信する。
サービス提供者サーバ300は、匿名性保証装置200から受信した匿名情報を利用して、利用者端末100の地理的な位置情報を考慮に入れたサービスを利用者端末100に提供する。もしくは、匿名性保証装置200から受信した匿名情報は、行動分析のデータなどに活用する応用も考えられる。
<個人情報データベース>
第二の実施形態における個人情報データベース221の一例を図15に示す。個人情報データベース221は、利用者端末100から受信した個人情報と携帯識別番号とを記憶する。利用者端末100から送信される個人情報は、「位置情報」と「時刻情報」とを含む。「位置情報」は、「緯度」と「経度」に用いて表される。図15の個人情報データベース221は、7つの個人情報を記憶している。個人情報データベース221が記憶する各個人情報は、それぞれ個人情報識別番号に基づいて識別される。個人情報データベース221は、受信した個人情報を、時刻情報の新しい順にソートして記憶してもよい。
<匿名化レベル記憶部>
第二の実施形態における匿名化レベル記憶部223の一例を図16に示す。匿名化レベル記憶部223は、匿名化の際に位置情報をどのように匿名化するかを、匿名化レベルごとに記憶する。例えば、図16に示す匿名化レベル記憶部223は、匿名化レベル1からKまでの匿名化レベル毎に、位置情報をどのように匿名化するかを記憶している。図16に示す例では、匿名化レベルの値が大きいほど、匿名化の際に位置情報の精度を下げる度合いが大きくなる。例えば、匿名化レベル1で緯度と経度を匿名化すると、緯度と経度の小数点以下3位以下の端数が伏せ字となる。匿名化レベル2では、小数点以下2位以下、匿名化レベル3では小数点以下1位以下、匿名化レベルKではすべての桁が伏せ字となる。このように、匿名化レベルが高いほど、匿名化の際に位置情報の精度を下げる度合いが大きくなる。
<関連情報データベース>
第二の実施形態における関連情報データベース222の一例を図17に示す。関連情報データベース222は、個人情報データベース221に記憶されている位置情報を匿名化して生成される「暫定匿名情報」と、「時刻情報」と、「匿名ID」と、「暫定匿名情報のもとになった個人情報の識別番号」と、「暫定匿名情報の匿名化レベル」と、「暫定属性情報が同一の匿名IDの数」とを匿名情報毎に記憶する。暫定匿名情報は、「匿名化後の緯度」と「匿名化後の経度」とを含む。「暫定匿名情報の匿名化レベル」欄は、その暫定匿名情報がどの匿名化レベルで匿名化されたかを記憶する。
匿名ID欄は、個人情報に含まれる「携帯識別番号」を別の文字列に変換することで生成される暫定匿名情報の識別子を記載する。
<匿名情報データベース>
第二の実施形態における匿名情報データベース225の一例を図18に示す。匿名情報データベース225は、「匿名情報」と、「時刻情報」と、「匿名ID」とを記憶する。「匿名情報」とは、前述した暫定匿名情報のうち、基準匿名性を満たしているものを表す。匿名情報は、「匿名化後の緯度」と、「匿名化後の経度」とを含む。匿名情報データベース225が記憶する匿名情報は、後述する匿名情報提供部240を用いて、サービス提供者サーバ300に送信される。
<基準匿名性記憶部>
基準匿名性記憶部224は、基準匿名性を記憶する。ここで基準匿名性とは、本実施形態に係る匿名化に基づいて生成される匿名情報が満足する個人特定困難性の基準値である。例えば、本実施形態では、匿名性保証装置200は、作成する全ての匿名情報を、属性が同一のもの同士でグループ化した場合に各グループに属する匿名IDの個数の最小値が基準匿名性の値を上回るように、匿名化する。
このような処理に基づき、ある匿名情報が第三者に知られたとしても、その匿名情報の基になった個人情報を提供した利用者端末100の台数が「基準匿名性」の数以上あるので、匿名性保証装置200は、個人情報を提供した利用者端末100の特定を困難にできる。基準匿名性は、例えば、匿名性保証装置200の管理者が設定する値である。
<匿名化制御部>
匿名化制御部231は、一定時間間隔毎に、個人情報データベース221に蓄積された個人情報を読み出す。匿名化制御部231は、個人情報匿名化部232に、匿名化レベルを指定し、上記個人情報データベース221から読み出した個人情報を匿名化する。
また、匿名化制御部231は、上記匿名化に基づいて生成される暫定匿名情報を関連情報データベース222から取得して、それらの暫定匿名情報が基準匿名性を満たすかどうかを匿名性判定部233に判定させる。
匿名化制御部231は、判定の結果、匿名化に基づいて生成された上記匿名情報が基準匿名性を満たしていない場合には、匿名化レベルを変更して、再度、個人情報匿名化部232に匿名化させる。また、匿名化制御部231は、判定の結果、匿名化に基づいて生成された上記暫定匿名情報が基準匿名性を満たしている場合には、関連情報データベース222から上記暫定匿名情報を読み込み、匿名情報として匿名情報データベース225に書き込む。
<個人情報匿名化部>
個人情報匿名化部232は、匿名化制御部231から指定される匿名化レベルに応じた内容で、個人情報データベース221に記憶されている個人情報を匿名化する。
<匿名性判定部>
匿名性判定部233は、上記匿名化に基づいて生成される匿名情報が基準匿名性を満たすかどうかを判定する。
<匿名情報提供部>
匿名情報提供部240は、匿名情報データベース225から匿名情報を読み出して、サービス提供者サーバ300に送信する。
<k−匿名性>
ここで、第二の実施形態における「同一の匿名情報を持つ匿名IDの個数(k−匿名性)」について、図17を用いて説明する。図17のテーブルにおいて、「緯度 35.02X、経度 135.02X」という同一の暫定匿名情報が3つ存在している(個人情報識別番号1、3、4で表される暫定匿名情報)。しかし、これら3つの暫定匿名情報は、「緯度 35.02X、経度 135.02X」で現されるエリア内に3台の利用者端末100が存在することを意味していない。何故なら、匿名IDがuser_Aで表される同一の利用者端末100が、時刻を変えて複数回、匿名性保証装置200に個人情報を送信しているからである。実質、「緯度 35.02X、経度 135.02X」という暫定匿名情報を提供しているのは、匿名IDがuser_Aとuser_Cとで表される2台の利用者端末100である。本願発明ではk−匿名性を、匿名情報が同一となる「匿名情報の個数」ではなく、「匿名IDの個数」と定義しているので、個人情報識別番号1、3、4で表される暫定匿名情報のk−匿名性は、2である。
<処理の流れ>
本実施形態の全体の動作について詳細に説明する。
<個人情報受信処理>
図19のシーケンス図を参照して、利用者端末100から個人情報を受信したときの匿名性保証装置200の動作について説明する。個人情報更新受付部210は、利用者端末100から個人情報と携帯識別番号とを受信すると(C1)、受信した個人情報と携帯識別番号とを個人情報データベース221に書き込む(C2)。
<匿名化>
図19のシーケンス図を参照して、匿名化する際の匿名性保証装置200の動作について説明する。簡単のため、本実施形態において、基準匿名性は、2とする。
個人情報更新受付部210は、一定時間間隔ごとに、個人情報データベース221から読み出した個人情報の匿名化を匿名化制御部231に要求する(C3)。
あるいは、個人情報更新受付部210は、任意のタイミングで個人情報データベース221から読み出した個人情報の匿名化を匿名化制御部231に要求するように設定することもできる。
匿名化制御部231は、個人情報更新受付部210から匿名化の要求を受けると、個人情報匿名化部232に、まずは、匿名化レベルを1に指定した匿名化を指示する(C4)。
個人情報匿名化部232は、匿名化の指示を受けると、個人情報データベース221に記憶されている個人情報を読み出す(C5)。個人情報匿名化部232は、上記個人情報データベース221から個人情報を読み出す際に、時刻情報が新しい個人情報を読み出す。本実施形態では、匿名化する当日の日付の時刻情報を持つ個人情報を読み出すと仮定する。今、例えば、9月10日の01時00分に匿名化するとする。この場合、例えば、個人情報データベース221に、図15が示すような個人情報が記憶されていると仮定すると、個人情報匿名化部232は、個人情報識別番号1~6までの個人情報を読み出す。
個人情報匿名化部232は、読み出した個人情報の匿名化を開始する(C6)。まず、個人情報匿名化部232は、各個人情報それぞれ含まれる携帯識別番号を匿名IDに置き換える。匿名IDは、利用者端末100を特定できない文字列である。
次に、個人情報匿名化部232は、匿名化レベル記憶部223を参照して、各個人情報を、匿名化レベル1で特定される内容で匿名化し、暫定匿名情報を生成する。また、個人情報匿名化部232は、匿名化後の各暫定匿名情報に対して、暫定属性情報が同一となる匿名IDの数(k−匿名性)を集計する。
そして、個人情報匿名化部232は、各暫定匿名情報を、個人情報識別番号と、匿名IDと、時刻情報と、匿名化レベルと、暫定属性情報が同一の匿名IDの数と、それぞれ対応付けて関連情報データベース222に記録し(C7)、匿名化制御部231に匿名化の完了を通知する(C8)。
匿名化制御部231は、個人情報匿名化部232から匿名化の完了通知を受けると、関連情報データベース222に記録されている各暫定匿名情報が、基準匿名性を満たしているか否かの判定を匿名性判定部233に要求する(C9)。
匿名性判定部233は、基準匿名性記憶部224に記憶されている基準匿名性と、関連情報データベース222に記録されている暫定属性情報が同一の匿名IDの数と、を比較する(C10)。
匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている匿名化後の個人情報の中で、一つでも基準匿名性を満たしていないものがあれば、その旨を匿名化制御部231に通知する(C11、C12)。
匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている暫定匿名情報の中で、一つでも基準匿名性を満たしていないものがあった旨の通知を受けた場合には、匿名化レベルを一つ上げて、再度、個人情報匿名化部232に、匿名化を指示する(C4)。
以後、匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている全ての暫定匿名情報が基準匿名性を満たしている旨の通知を受けるまで、匿名化レベルを一つずつ上げて、個人情報匿名化部232に匿名化を指示する(C4~C11)。
同様に、匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている全ての暫定匿名情報が基準匿名性を満たしていれば、その旨を匿名化制御部231に通知する(C11、C12)。本実施形態では、図17に示すように、匿名化レベル1で匿名化して生成した全ての暫定匿名情報の「匿名化後の属性が同一の匿名IDの数(k−匿名性)」が基準匿名性を満たしているので、匿名化を繰り返すことなくC13以下のステップに進む。
匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている全ての個人情報が基準匿名性を満たしている旨の通知を受けると(C12)、関連情報データベース222に記憶されている暫定匿名情報を読み込み(C13)、読み込んだ暫定匿名情報を匿名情報として、匿名情報データベース225に書き込む(C14)。
<個人情報削除要求受信時の処理>
次に、図20のシーケンス図を用いて、第二の実施形態における利用者端末100から個人情報削除要求を受信した場合の匿名性保証装置200の動作を説明する。個人情報削除要求とは、利用者が匿名性保証装置200への個人情報の提供を中止したいと考えた場合に、その利用者の利用者端末100から送信される要求である。
匿名性保証装置200は、利用者端末100から個人情報削除要求を受信した場合には、その利用者の個人情報と識別情報とを個人情報データベース221から削除すると共に、関連情報データベース222や匿名情報データベース225からも、その利用者の個人情報と識別情報とを基に生成された情報を削除する。
この場合、匿名情報データベース225に記憶されているいずれかの匿名情報が基準匿名性を満たさなくなる可能性がある。
そのため、本実施形態に係る匿名性保証装置200は、個人情報削除要求を受信した場合には、以下を処理する。
現在、個人情報データベース221は、図15に示すような個人情報を記憶していると仮定する。匿名性保証装置200が、携帯識別番号Aで表される利用者端末100の利用者から個人情報削除要求を受信したと仮定して、個人情報削除要求を受信した場合の第二の実施形態における匿名性保証装置200の動作について説明する。
個人情報更新受付部210は、利用者端末100から個人情報削除要求を受信する(D1)。そうすると、個人情報更新受付部210は、個人情報削除要求を送信してきた利用者端末100の利用者の個人情報と識別情報とを個人情報データベース221から削除する(D2)。
また、個人情報更新受付部210は、匿名化制御部231に、その利用者の個人情報と識別情報とを基に生成されたすべての情報の、関連情報データベース222及び匿名情報データベース225からの削除を指示する(D3)。匿名化制御部231は、関連情報データベース222及び匿名情報データベース225から、その利用者の個人情報と識別情報とを基に生成された全ての情報を削除する(D4、D5)。削除後の関連情報データベース222が記憶する暫定匿名情報を、図21に示す。
なお、前述したように、匿名情報データベース225は、匿名情報と、その基となった個人情報との対応付けを、個人情報データベース221における個人情報識別番号を用いて記憶している。従って、匿名情報削除要求を受信した匿名化制御部231は、削除対象の個人情報を基に作成された匿名情報を特定できる。
そして、匿名化制御部231は、匿名性判定部233に、関連情報データベース222に記録されている各暫定匿名情報が、基準匿名性を満たしているか否かの判定を要求する(D6)。
匿名性判定部233は、基準匿名性記憶部224に記憶されている基準匿名性と、関連情報データベース222が記録している同一の暫定匿名情報を持つ匿名IDの数とを比較する(D7)。
図21を参照すると、携帯識別番号Aから受信した個人情報を基に作成された暫定匿名情報が関連情報データベース222から削除された結果、個人情報識別番号2,4,5いずれの前提匿名情報も「匿名化後の属性が同一の匿名IDの数(k−匿名性)」が基準匿名性(=2)を満たせなくなることがわかる。個人情報識別番号2、5の暫定匿名情報は、緯度、経度とも同一であるが、個人情報識別番号2、5の暫定匿名情報の基となった個人情報を提供した利用者端末は、匿名IDがuser_Bで表される1台である。従って、個人情報識別番号2、5の暫定匿名情報の「匿名化後の属性が同一の匿名IDの数(k−匿名性)」は、1である。これは、基準匿名性(=2)を満たさない。
匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている暫定匿名情報の中で、一つでも基準匿名性を満たしていないものがあれば、その旨を匿名化制御部231に通知する(D8)。
同様に、匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている全ての暫定匿名情報が基準匿名性を満たしていれば、その旨を匿名化制御部231に通知する(D8)。
匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている暫定匿名情報の中で、一つでも基準匿名性を満たしていないものがあった旨の通知を受けた場合には(D8、D9)、匿名化レベルを一つ上げて、個人情報匿名化部232に、匿名化を指示する。この匿名化の際の匿名性保証装置200の動作は、上記説明した個人情報受信時における動作(C4~C14)と同様である。
本実施形態では、匿名化レベル1での匿名化の結果生成した暫定匿名情報が基準匿名性を満たさないので、匿名化レベル2で再度匿名化することになる。
匿名化レベル2で匿名化して生成した暫定匿名情報を図22に示す。図22において、個人情報識別番号2、4、5の暫定匿名情報は、緯度、経度とも同一で、基となった個人情報はuser_Bとuser_Cの2台の利用者端末から受信したことがわかる。従って、個人情報識別番号2、4、5の暫定匿名情報は、「匿名化後の属性が同一の匿名IDの数(k−匿名性)」が2である。この処理に基づき、すべての暫定匿名情報が基準匿名性(=2)を満たすので、暫定匿名情報は、匿名情報データベース225に匿名情報として記憶される(図23)
本実施形態に係る匿名性保証装置200に基づけば、匿名性保証装置200が提供する全ての匿名情報は、必ず基準匿名性を満たしていることが保証される。そのため、利用者は、個人が特定される不安を抱くことなく安心して利用者端末の位置情報を提供することができる。また、利用者は、利用者端末の地理的な情報を利用した便利なサービスの提供を受けることが可能となる。
(第3の実施形態)
第3の実施形態では、匿名化レベル記憶部223は、緯度経度と地域メッシュコードとの対応関係を記憶するテーブルと、図24に示すような、匿名化レベルと地域メッシュコードの次数とを対応して記憶するテーブルとの、2つのテーブルを記憶する。
地域メッシュコードとは、総務省が定めた「統計に用いる標準地域メッシュおよび標準地域メッシュコード」(昭和48年行政管理庁告示第143号)のことである。地域メッシュコードは、統計に利用するために、地図を緯度及び経度に沿って区画して成る区域を、識別子を用いて表現した位置情報の識別情報である。
地域メッシュコードは、階層的な構造をしており、区域の広い順に、第一次メッシュ、第二次メッシュ、第三次メッシュ、2分の1地域メッシュの4階層から成る。第一次メッシュの中には、64個の第二次メッシュが包含される。第二次メッシュの中には、100個の第三次メッシュが包含される。第三次メッシュの中には、4つの2分の1地域メッシュが包含される。地域メッシュは、各階層の区域の識別子を列挙した形で表現される。
第一次メッシュは、4桁の数字で表される。第一次メッシュは、20万分の1の地勢図の1図葉の区画を1単位区画としたもので、緯度差は40分、経度差は1度となっている。1辺の長さは約80kmである。一次メッシュコードは、4桁の数字で、上2桁が緯度(1.5倍して分以下を切り上げたもの)、下2桁が経度(下2桁)を表す。
第二次メッシュは、第一次メッシュと合わせて3570−12のように表される。上4桁の3570が第一次メッシュを、続く12が第二次メッシュを表す。第二次メッシュは、第一次メッシュを緯線方向及び経線方向に8等分してできる区域で、1辺の長さは約10kmである。第二次メッシュコードは、2桁の数字で、上1桁が緯度方向、下1桁が経度方向を表す。
第三次メッシュは、緯線方向及び経線方向に10等分してできる区域であり、緯度差は30秒、経度差は45秒で、1辺の長さは約1kmである。第三次メッシュコードは、第二次メッシュコードと同様に2桁の数字で、上1桁が緯度方向、下1桁が経度方向を表す。これに第一次・第二次メッシュコードを合せて、第三次メッシュは、3570−12−34のように表す。
さらに細かな地域区分として2分の1地域メッシュがある。2分の1地域メッシュは、第三次メッシュを縦横に2等分したものである。南西側のメッシュを1、南東を2、北西を3、北東を4として、2分の1地域メッシュは、3570−12−34−3のように表す。
本実施形態における個人情報匿名化について図19を用いて説明する。第二の実施形態との差異があるのはC6のステップである。
まず、個人情報匿名化部232は、各個人情報にそれぞれ含まれる携帯識別番号を匿名IDに置き換える。匿名IDは、利用者端末100を特定できない文字列である。
次に、個人情報匿名化部232は、匿名化レベル記憶部223を参照して、各個人情報の緯度、経度で表される位置情報を地域メッシュコードに変換する。それから、個人情報匿名化部232は、地域メッシュコードに変換された各個人情報の位置情報に対して、図24に示すような匿名化レベルと処理内容とを対応させたテーブルを参照して、匿名化レベル1で特定される内容で匿名化し、暫定匿名情報を生成する。また、個人情報匿名化部232は、匿名化後の各暫定匿名情報に対して、暫定属性情報が同一となる匿名IDの数(k−匿名性)を集計する。他の処理に関しては、第二の実施形態と同様である。
本実施形態に係る匿名性保証装置200に基づけば、匿名性保証装置200が提供する全ての匿名情報は、必ず基準匿名性を満たしていることが保証される。そのため、利用者は、個人が特定される不安を抱くことなく安心して個人情報を提供することができる。また、利用者は、利用者端末の地理的な情報を利用した便利なサービスの提供を受けることが可能となる。
また、地域メッシュコードは、総務省が定めたものであり、各種統計によく用いられている。従って、匿名性保証装置200から受信した匿名情報を、行動分析のデータなどに活用したときに、例えば、他の統計情報と組み合わせて分析することが容易である。もちろん、地域メッシュコードは、総務省が定めたもの以外にも、独自に作成したものを用いても良い。
(その他の実施形態)
匿名化レベル記憶部(特許請求の範囲に記載のアルゴリズム定義部に相当する)223が記憶する処理内容は、個人情報の記載内容の一部を削除する処理を含むことができる。
匿名化レベル記憶部(特許請求の範囲に記載のアルゴリズム定義部に相当する)223が記憶する処理内容は、個人情報の記載内容の一部をより上位概念の語句に置き換える処理を含むことができる。
個人情報データベース221が記憶する個人情報は、匿名性保証装置(特許請求の範囲に記載の情報処理装置に相当する)200と通信可能に接続される複数の携帯電話機のそれぞれの位置情報を含むことができる。各携帯電話機の位置情報は、各携帯電話機の所在地の緯度および経度を示す情報を含むことができる。匿名化レベル記憶部223が記憶する処理内容は、緯度および経度の少なくとも一方の精度を下げる処理を含むことができる。
匿名化レベル記憶部(特許請求の範囲に記載のアルゴリズム定義部に相当する)223は、地図を緯度及び経度に沿って階層的に区画して成る最下層の区域をその区域を包含する各階層の区域の識別子を階層順に列挙して表現した識別情報と、最下層の区域の範囲を緯度及び経度で表した情報とを各最下層の区域についてそれぞれ対応付けて記憶すると共に、最下層の区域の識別情報を構成する各階層の識別子のうち、最下層の識別子からどの階層までの識別子を削除するかを示す複数のアルゴリズムを、より上位階層まで削除するアルゴリズムほど大きな数値となるアルゴリズム識別情報と対応付けて記憶することができる。
個人情報匿名化部(特許請求の範囲に記載の記載内容変更部と記載内容別提供者数算出部に相当する)232は、アルゴリズム定義部を参照し、個人情報データベース221に記憶されている各携帯電話機の所在地の緯度及び経度を示す各情報を、それぞれ対応する最下層の区域の識別情報に変換し、各識別情報を構成する各階層の識別子のうち最下層の識別子からアルゴリズムで定まる階層の識別子までを削除することができる。
アルゴリズムは、個人情報の記載内容の一部を削除する処理を含むことができる。
アルゴリズムは、個人情報の記載内容の一部をより上位概念の語句に置き換える処理を含むことができる。
各携帯電話機の位置情報は、各携帯電話機の所在地の緯度および経度を示す情報を含むことができる。
アルゴリズムは、緯度および経度の少なくとも一方の精度を下げる処理を含むことができる。
アルゴリズム定義部は、地図を緯度及び経度に沿って階層的に区画して成る最下層の区域をその区域を包含する各階層の区域の識別子を階層順に列挙して表現した識別情報と、最下層の区域の範囲を緯度及び経度で表した情報とを各最下層の区域についてそれぞれ対応付けて記憶すると共に、最下層の区域の識別情報を構成する各階層の識別子のうち、最下層の識別子からどの階層までの識別子を削除するかを示す複数のアルゴリズムを、より上位階層まで削除するアルゴリズムほど大きな数値となるアルゴリズム識別情報と対応付けて記憶することができる。
記載内容変更部は、アルゴリズム定義部を参照し、個人情報データベースに記憶されている各携帯電話機の所在地の緯度及び経度を示す各情報を、それぞれ対応する最下層の区域の識別情報に変換し、各識別情報を構成する各階層の識別子のうち最下層の識別子からアルゴリズムで定まる階層の識別子までを削除することができる。
なお、本発明の匿名性保証装置は、図2に示す構成に限らない。
図25は、本発明の別の実施形態に係る匿名性保証装置250の構成の一例を示すブロック図である。図25において、図2と同じ構成には同じ番号を付し詳細な説明は、省略する。
図25に示す匿名性保証装置250は、個人情報データベース221と、匿名化レベル記憶部223と、個人情報匿名化部232と、匿名性判定部233とを含む。個人情報匿名化部232は、記載内容変更部234と、記載内容別提供者数算出部235とを含む。
個人情報データベース221は、複数の個人情報を、各個人情報の提供者の識別情報とそれぞれ対応付けて記憶する。匿名化レベル記憶部223は、各個人情報の記載内容を匿名化する内容を定義した複数種類のアルゴリズムを、アルゴリズム識別情報とそれぞれ対応付けて記憶する。記載内容変更部234は、個人情報データベース221に記憶されている各個人情報の記載内容を、所定のアルゴリズム識別情報に対応するアルゴリズムに従って変更する。記載内容別提供者数算出部235は、変更後の記載内容毎に、各変更後の記載内容に変更される個人情報の提供者数を算出する。匿名性判定部233は、各提供者数のうちの最小値を所定の基準値と比較する。そして、記載内容変更部234が、最小値が基準値以上になるまで、各アルゴリズム識別情報に対応するアルゴリズムで個人情報データベース221に記憶されている各個人情報の記載内容を変更する。匿名性保証装置250は、これら処理を繰り返すして、匿名性保証装置200と同様の効果を実現する。
ここで、匿名性保証装置250は、特許請求の範囲に記載の情報処理装置に相当し、匿名化レベル記憶部223は、特許請求の範囲に記載のアルゴリズム定義部に相当し、匿名性判定部233は、特許請求の範囲の比較部に相当する。
なお図25に示す匿名性保証装置250は、本発明の最小構成となっている。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2010年5月10日に出願された日本出願特願2010−108050を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明の第1の実施形態に係る匿名性保証システム1000について、図面を参照して詳細に説明する。
<全体の構成>
図1に示すように、第1の実施形態に係る匿名性保証システム1000は、利用者端末100A及び100Bと、匿名性保証装置200と、サービス提供者サーバ300とがネットワーク400を介して通信可能に接続している。なお、以下では、記載の簡略化のため、利用者端末100Aと利用者端末100Bとを区別する必要が無い場合などには、適宜まとめて利用者端末100と記載する場合がある。
利用者端末100Aは、匿名性保証装置200に、利用者端末100Aの利用者の個人情報を送信する。また、利用者端末100Bも、同様に、匿名性保証装置200に、利用者端末100Bの利用者の個人情報を送信する。
これらの個人情報は、例えば、利用者端末100A及び100Bの利用者の電話番号、年齢、性別、住所、職業、趣味、利用者端末100A及び100Bの位置情報などである。このように、個人情報には、個人情報を取得した第三者が、個人情報の提供者を特定できる情報が含まれる。
また、利用者端末100は、匿名性保証装置200に、個人情報と共に、個人情報の提供者の識別情報を送信する。識別情報は、例えば、利用者端末100A及び100Bの利用者の氏名などである。
匿名性保証装置200は、利用者端末100から受信した個人情報と識別情報とを記憶する。また、匿名性保証装置200は、利用者端末100から受信した個人情報を匿名化し、匿名情報を作成する。匿名化とは、個人情報の記載内容を変更し、個人情報の提供者の特定を困難にする処理である。匿名化は、例えば、個人情報に含まれる情報量を削減する処理や、個人情報から個人を特定する困難性を高めるように個人情報の精度を下げる処理を含む。匿名化は、一般的に曖昧化と呼ぶことが出来る。
匿名化の結果、異なる個人情報から生成される匿名情報が同一となる場合が生じる。例えば、利用者から提供された電話番号(個人情報)の下一桁を削除するように匿名化した場合には、10個の個人情報が同一の匿名情報に変換される。この処理に基づき、匿名性保証装置200は、第三者が匿名情報を取得したとしても、第三者が個人情報の提供者を特定することを困難にできる。
また、詳しくは後述するが、本実施形態に係る匿名性保証装置200は、匿名化の強さを制御できる。この制御に基づき、匿名性保証装置200は、生成された匿名情報から個人を特定する際の困難性を制御できる。例えば、利用者から提供された電話番号(個人情報)の「下二桁」を削除するように匿名化した場合には、100個の個人情報が同一の匿名情報に変換されることになるため、匿名性保証装置200は、「下一桁」を削除する匿名化に比べて、個人の特定の困難性を高めることができる。
なお、本実施形態に係る匿名性保証装置200は、匿名情報から個人を特定する際の困難性を、後述する「基準匿名性」として表現しており、この「基準匿名性」を満たすように匿名化の強さを制御する。
例えば、匿名性保証装置200が利用者から提供された電話番号(個人情報)の下一桁を削除するように匿名化を制御している場合に、ある利用者から電話番号の提供を中止するとの申し出があり、その利用者の個人情報から生成された匿名情報を削除した結果、匿名化後の電話番号の提供者が一人しかいなくなるというケースも生じうる。この場合は、匿名化後の電話番号でも、その電話番号の提供者が一人しかいないため、その提供者は、特定されてしまう。
その場合、本実施形態に係る匿名性保証装置200は、匿名化後の電話番号が「基準匿名性」を満たすように、例えば、基の電話番号の「下二桁」を削除するように匿名化を変更して、電話番号を匿名化する。
匿名性保証装置200は、上記のように「基準匿名性」を満たすように作成した匿名情報を、サービス提供者サーバ300に送信する。
サービス提供者サーバ300は、匿名性保証装置200から受信した匿名情報を利用して、上記利用者端末100の利用者向けのサービスを、利用者端末100に提供する。
この匿名性保証装置200に基づき、利用者は、個人が特定される不安を抱くことなく、安心して個人情報を提供できる。また、利用者は、利用者の個人情報を利用した便利なサービスの提供を受けることが可能となる。
<利用者端末の構成>
利用者端末100の構成を図5に示す。
利用者端末100は、個人情報送信部110と、サービス要求送信部120と、サービス受信部130とを含む。
個人情報送信部110は、個人情報と識別情報とを匿名性保証装置200に送信する。サービス要求送信部120は、サービス提供者サーバ300にサービス実行要求を送信する。サービス受信部130は、サービス提供者サーバ300からサービスの実行結果を受信する。
<サービス提供者サーバの構成>
サービス提供者サーバ300の構成を図6に示す。サービス提供者サーバ300は、利用者端末100からサービス実行要求を受け、匿名性保証装置200から受信した匿名情報を利用して、利用者端末100の利用者へサービスを提供するための情報を処理する。そして、サービス提供者サーバ300は、情報の処理の結果である実行結果を利用者端末100に送信する。
あるいは、サービス提供者サーバ300は、利用者端末100からサービス実行要求を受信しなくても、自発的に、匿名情報を利用して情報を処理し、利用者端末100にその実行結果を送信もできる。
サービス提供者サーバ300は、サービス要求受信部310と、匿名情報要求部320と、匿名情報取得部330と、サービス実行部340と、サービス送信部350とを含む。
サービス要求受信部310は、利用者端末100からサービス実行要求を受け付ける。
匿名情報要求部320は、匿名性保証装置200に匿名情報を要求する。
匿名情報取得部330は、匿名性保証装置200から匿名情報を受信する。
サービス実行部340は、匿名性保証装置200から受信した匿名情報を利用して、利用者端末100の利用者へサービスを提供するための情報を処理する。
サービス送信部350は、利用者端末100に処理の実行結果を送信する。
<匿名性保証装置の構成>
図2に示すように、本実施形態に係る匿名性保証装置200は、個人情報更新受付部210と、データベース220と、個人情報匿名化プログラム230と、匿名情報提供部240とを含む。
データベース220は、個人情報データベース221と、関連情報データベース222と、匿名化レベル記憶部223と、基準匿名性記憶部224と、匿名情報データベース225とを含む。
個人情報匿名化プログラム230は、匿名化制御部231と、個人情報匿名化部232と、匿名性判定部233とを含む。
<ハードウェア構成>
図3に示すように、匿名性保証装置200は、CPU(Central Processing Unit)201と、メモリ202と、ポート203と、ハードディスクドライブ204と、記録媒体205と、記録媒体読取装置206と、入力装置207と、出力装置208とを含むコンピュータを用いても構成することができる。
CPU201は、匿名性保証装置200の全体を制御する。CPU201は、ハードディスクドライブ204に記憶された本実施の形態に係る各種の動作を行うためのコードから構成される個人情報匿名化プログラム230をメモリ202に読み出して実行し、匿名性保証装置200としての各種機能を実現する。
記録媒体読取装置206は、フレキシブルディスクや磁気テープ、コンパクトディスク等の記録媒体205に記録されているプログラムやデータを読み取るための装置である。読み取られたプログラムやデータは、メモリ202やハードディスクドライブ204に格納される。従って、匿名性保証装置200は、例えば、記録媒体205に記録された個人情報匿名化プログラム230を、記録媒体読取装置206を用いて上記記録媒体205から読み取り、メモリ202やハードディスクドライブ204に記憶できる。記録媒体読取装置206は、匿名性保証装置200に内蔵されている形態とすることもできるし、外付されている形態とすることもできる。
ハードディスクドライブ204は、例えば、ハードディスク装置や半導体記憶装置を用いることができる。ハードディスクドライブ204は、個人情報匿名化プログラム230及びデータベース220を記憶する。ハードディスクドライブ204が、個人情報匿名化プログラム230及びデータベース220を記憶している様子を図4に示す。
入力装置207は、匿名性保証装置200へのデータ入力等のために用いられる装置であり、ユーザインタフェースとして機能する。入力装置207は、例えば、キーボードやマウスを用いることができる。
出力装置208は、情報を外部に出力するための装置であり、ユーザインタフェースとして機能する。出力装置208は、例えば、ディスプレイやプリンタを用いることができる。
ポート203は、通信のための装置である。例えば、匿名性保証装置200は、ネットワーク400を介した利用者端末100、サービス提供者サーバ300等の他のコンピュータとの通信を、ポート203を経由してできる。また、例えば、匿名性保証装置200は、個人情報匿名化プログラム230及びデータベース220を、ポート203を経由して、他のコンピュータからネットワーク400を介して受信し、メモリ202やハードディスクドライブ204に記憶できる。
<個人情報更新受付部>
図2に戻って、個人情報更新受付部210は、利用者端末100から個人情報と識別情報とを受信し、個人情報と識別情報とを個人情報データベース221に書き込む。
<個人情報データベース>
個人情報データベース221は、利用者端末100から受信した個人情報と識別情報とを記憶する。個人情報データベース221の一例を図7に示す。利用者端末100から送信される個人情報には、例えば、「電話番号」と「生年月日」と「性別」とが含まれる。利用者端末100から送信される識別情報には、例えば、「利用者の氏名」が含まれる。
図7の個人情報データベース221は、ユーザAからユーザEまでの、5つの個人情報を記憶している。個人情報データベース221が記憶する各個人情報は、それぞれ「個人情報識別番号」を用いて識別される。
<匿名化レベル記憶部>
図2に戻って、匿名化レベル記憶部(特許請求の範囲に記載のアルゴリズム定義部に相当する)223は、匿名化の際に個人情報をどのように匿名化するかを、匿名化レベル(特許請求の範囲に記載のアルゴリズム識別情報に相当)ごとに記憶する。
例えば、図8に示す匿名化レベル記憶部223の一例は、匿名化レベル1からKまでの匿名化レベル毎に、個人情報をどのように匿名化するかを記憶している。なお、図8に示す例では、匿名化レベルの値が大きいほど、匿名化の個人情報の精度を下げる度合いが大きくなる。つまり、匿名化レベルの値が大きいほど、匿名化の個人情報内の情報量が大きく削減される。例えば、図8に示す例では、匿名化レベル1で電話番号を匿名化すると、電話番号の下2桁が伏せ字になる。匿名化レベル2では下3桁、匿名化レベル3では下4桁、匿名化レベルKではすべての桁が伏せ字になる。このように、匿名化レベルが高いほど、匿名化の個人情報の精度を下げる度合いが大きくなる。また、匿名化レベルを見るだけで匿名化の程度を把握することも可能である。
匿名化レベル記憶部223は、電話番号の下何桁かを伏せ字にする、生年月日の任意の桁を伏せ字にする、住所の番地を伏せ字にする、趣味や職業を上位概念化する、などのように、匿名化に応じた処理内容を、匿名化レベル毎に記載する。
<関連情報データベース>
関連情報データベース222の一例を図9に示す。関連情報データベース222は、個人情報データベース221に記憶されている個人情報に対して、後述する匿名化で生成される「暫定匿名情報」を記憶する。また、関連情報データベース222は、個人情報に含まれる「個人名」を別の文字列に変換することで生成される暫定匿名情報の識別子である「匿名ID(Identification)」を記憶する。また、関連情報データベース222は、「暫定匿名情報のもとになった個人情報の識別番号」と、「暫定匿名情報の匿名化レベル」と、「暫定属性情報が同一の匿名IDの数」とを暫定匿名情報毎に記憶する。
暫定匿名情報は、「匿名化後の電話番号」と、「匿名化後の生年月日」と、「匿名化後の性別」とを含む。「暫定匿名情報の匿名化レベル」欄は、その暫定匿名情報がどの匿名化レベルで匿名化されたかを記憶する。
<匿名情報データベース>
匿名情報データベース225の一例を図10に示す。匿名情報データベース225は、「匿名情報」と「匿名ID」とを記憶する。「匿名情報」とは、前述した暫定匿名情報のうち、後述する基準匿名性を満たしているものを表す。
匿名情報は、「匿名化後の電話番号」と、「匿名化後の生年月日」と、「匿名化後の性別」とを含む。
匿名情報データベース225が記憶する匿名情報は、後述する匿名情報提供部240を用いて、サービス提供者サーバ300に送信される。
<基準匿名性記憶部>
図2に戻って、基準匿名性記憶部224は、基準匿名性(特許請求の範囲に記載の「所定の基準値」に相当する)を記憶する。
ここで基準匿名性とは、本実施形態に係る匿名化に基づいて生成される匿名情報が満足する個人特定困難性の基準値である。例えば、本実施形態の匿名性保証装置200は、匿名性保証装置200が作成する全ての匿名情報を匿名属性情報が同一のもの同士でグループ化した場合に、各グループに属する匿名IDの個数の最小値が基準匿名性の値を上回るように、匿名化する。
このような処理に基づき、ある匿名情報が第三者に知られたとしても、その匿名情報の基になった個人情報を提供した人数が「基準匿名性」の数以上であるので、個人の特定は、困難となる。基準匿名性は、例えば、匿名性保証装置200の管理者が設定する値である。
<匿名化制御部>
匿名化制御部231は、個人情報匿名化部232に、匿名化レベルを指定して、個人情報データベース221に記憶されている個人情報を匿名化させる。また、匿名化制御部231は、上記匿名化に基づいて生成された暫定匿名情報を関連情報データベース222から取得して、それらの暫定匿名情報が基準匿名性を満たすかどうかを匿名性判定部233に判定させる。
匿名化制御部231は、判定の結果、匿名化に基づいて生成された上記匿名情報が基準匿名性を満たしていない場合には、匿名化レベルを変更して、再度、個人情報匿名化部232に個人情報を匿名化させる。
また、匿名化制御部231は、判定の結果、匿名化に基づいて生成された上記暫定匿名情報が基準匿名性を満たしている場合には、関連情報データベース222から上記暫定匿名情報を読み込み、匿名情報として匿名情報データベース225に書き込む。
<個人情報匿名化部>
個人情報匿名化部(特許請求の範囲に記載の記載内容変更部と記載内容別提供者数算出部に相当する)232は、匿名化制御部231から匿名化レベルを指定した匿名化の要求を受けると、匿名化レベル記憶部223を参照し、その匿名化レベルに応じた内容で、個人情報データベース221に記憶されている個人情報の匿名化し、暫定匿名情報を作成する。また、個人情報匿名化部232は、同一の暫定匿名情報を持つグループに属する匿名IDの数(後述する k−匿名性)を算出する。また、個人情報匿名化部232は、匿名化の際に、個人情報データベース221が記憶する各個人名を別の文字列へと変換し「匿名ID」を作成する。個人情報匿名化部232は、上記暫定匿名情報と、匿名IDと、匿名化レベルと、同一の暫定匿名情報を持つグループに属する匿名IDの数と、暫定匿名情報の基となった個人情報識別番号とを関連情報データベース222に書き込む。
<匿名性判定部>
匿名性判定部233(特許請求の範囲に記載の比較部に相当)は、上記匿名化に基づいて生成される匿名情報の同一の匿名情報を持つグループに属する匿名IDの数の最小値が基準匿名性以上か否かを判定する。
<匿名情報提供部>
匿名情報提供部240は、サービス提供者サーバ300から匿名情報の取得要求を受けると、匿名情報データベース225から匿名情報を読み出して、サービス提供者サーバ300に送信する。
<k−匿名性>
なお、本実施形態において、同一の暫定匿名情報を持つグループに属する匿名IDの数のことを「k−匿名性」と記すこともある。「k−匿名性」は、もちろん、同一の匿名情報を持つグループに属する匿名IDの数や、同一の個人情報を持つグループに属する利用者の人数にも適用できる。
k−匿名性(k−anonymity)について、図7、図8、図11、図12を用いて説明する。本実施形態において、k−匿名性は、以下のように定義される。すなわち、個人情報を匿名化して生成される各匿名情報において、同一の匿名情報の基となった個人情報を提供した利用者が自分自身を含めk人以上存在するとき、その匿名情報のk−匿名性は、kである。k−匿名性は、匿名情報から個人を特定する困難性を表す指標になる。
図7に示される個人情報データベース221に記載される個人情報を、図8に示される匿名化レベル記憶部223に記載される匿名化レベル1で匿名化すると、図11に示すような匿名情報が生成される。
図11に示されるテーブルに記載される個人情報識別番号1、2の匿名情報は、電話番号、生年月日、性別の全てにおいて同一である。また、個人情報識別番号1、2の匿名情報の基となった個人情報は、匿名IDがuser_Aとuser_Bとで表される異なる2人の利用者から提供されたものであることがわかる。従って、個人情報識別番号1、2の匿名情報のk−匿名性は、それぞれ2である。
一方、個人情報識別番号3、4、5の匿名情報は、自分自身以外に、電話番号、生年月日、性別の全てにおいて同一である匿名情報が存在しないため、それぞれk−匿名性は、1である。
図7に示される個人情報データベース221に記載される個人情報を、図8に示される匿名化レベル記憶部223に記載される匿名化レベル2で匿名化すると、図12に示されるテーブルに記載される匿名情報が生成される。図12に示されるテーブルに記載される個人情報識別番号1、2、3で表される3つの匿名情報は、電話番号、生年月日、性別の全てにおいて同一である。また、個人情報識別番号1、2、3の匿名情報の基となった個人情報は、匿名IDがuser_A、user_B、user_Cで表される異なる3人の利用者から提供されたものであることがわかる。従って、個人情報識別番号1、2、3の匿名情報のk−匿名性は、それぞれ3である。同様に、個人情報識別番号4、5の匿名情報のk−匿名性は、それぞれ2である。
<処理の流れ>
本実施形態の全体の動作について詳細に説明する。
<個人情報受信処理>
図13のシーケンス図を参照して、利用者端末100から個人情報と識別情報とを受信したときの匿名性保証装置200の動作について説明する。
個人情報更新受付部210は、利用者端末100から個人情報と識別情報とを受信すると(A1)、受信した個人情報と識別情報とを個人情報データベース221に書き込む(A2)。
また、個人情報更新受付部210は、個人情報データベース221に記録されている個人情報の匿名化を匿名化制御部231に要求する(A3)。
<匿名化>
匿名化制御部231は、個人情報更新受付部210から匿名化の要求を受けると、個人情報匿名化部232に、まずは、匿名化レベルを1に指定した匿名化を指示する(A4)。
個人情報匿名化部232は、匿名化の指示を受けると、個人情報データベース221に記憶されている個人情報と識別情報とを読み出して(A5)、それら個人情報と識別情報との匿名化を開始する(A6)。
まず、個人情報匿名化部232は、各個人情報にそれぞれ付属する識別情報(個人名)を匿名IDに置き換える。匿名IDは、個人名を特定できない文字列である。
次に、個人情報匿名化部232は、匿名化レベル記憶部223を参照して、各個人情報を、匿名化レベル1で特定される内容で匿名化し、暫定匿名情報を生成する。また、個人情報匿名化部232は、匿名化後の各暫定匿名情報に対して、暫定属性情報が同一となる匿名IDの数(k−匿名性)を集計する。
そして、個人情報匿名化部232は、各暫定匿名情報を、匿名IDと、匿名化レベルと、暫定匿名情報が同一の匿名IDの数と、個人情報識別番号と、暫定匿名情報の基となった個人情報識別番号と、それぞれ対応付けて関連情報データベース222に記録し(A7)、匿名化制御部231に匿名化の完了を通知する(A8)。
匿名化制御部231は、個人情報匿名化部232から匿名化の完了通知を受けると、関連情報データベース222に記憶されている各暫定匿名情報が、基準匿名性を満たしているか否かの判定を匿名性判定部233に要求する(A9)。
匿名性判定部233は、基準匿名性記憶部224に記憶されている基準匿名性と、関連情報データベース222に記録されている「暫定匿名情報が同一の匿名IDの数の最小値」とを比較する(A10)。
匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性未満であれば、その旨を匿名化制御部231に通知する(A11)。
同様に、匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性以上であれば、その旨を匿名化制御部231に通知する(A11)。
匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性未満である旨の通知を受けた場合には、匿名化レベルを一つ上げて、再度、個人情報匿名化部232に、匿名化を指示する(A12)。
以後、匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性以上である旨の通知を受けるまで、匿名化レベルを一つずつ上げて、個人情報匿名化部232に匿名化を指示する(A4~A11)。
一方、匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性以上である旨の通知を受けると(A11、A12)、関連情報データベース222に記憶されている暫定匿名情報を読み込み(A13)、読み込んだ暫定匿名情報を、匿名情報として、匿名情報データベース225に書き込む(A14)。
<基準匿名性変更時の処理>
匿名性保証装置200の管理者が、基準匿名性を変更した場合の匿名性保証装置200の動作について説明する。
匿名性保証装置200の管理者が、基準匿名性を変更すると、基準匿名性記憶部224は、個人情報データベース221に記録されている個人情報の匿名化を、匿名化制御部231に要求する(A3)。以降の処理は、上記A4~A14と同様である。
<個人情報削除要求受信時の処理>
図14のシーケンス図を参照して、利用者端末100から個人情報削除要求を受信した場合の、匿名性保証装置200の動作について説明する。個人情報削除要求とは、利用者が匿名性保証装置200への個人情報の提供を中止したいと考えた場合に、その利用者の利用者端末100から送信される要求である。
匿名性保証装置200は、利用者端末100から個人情報削除要求を受信した場合には、その利用者の個人情報と識別情報とを個人情報データベース221から削除すると共に、関連情報データベース222や匿名情報データベース225からも、その利用者の個人情報と識別情報とを基に生成された情報を削除する。この場合、匿名情報データベース225に記憶されているいずれかの匿名情報が基準匿名性を満たさなくなる可能性がある。
そのため、本実施形態に係る匿名性保証装置200は、個人情報削除要求を受信した場合には、以下を処理する。
個人情報更新受付部210は、利用者端末100から個人情報削除要求を受信する(B1)。そうすると、個人情報更新受付部210は、個人情報削除要求を送信してきた利用者端末100の利用者の個人情報と識別情報とを個人情報データベース221から削除する(B2)。
また、個人情報更新受付部210は、匿名化制御部231に、その利用者の個人情報と識別情報とを基に生成されたすべての情報を、関連情報データベース222及び匿名情報データベース225からの削除を指示する(B3)。
匿名化制御部231は、関連情報データベース222及び匿名情報データベース225から、その利用者の個人情報と識別情報とを基に生成された全ての情報を削除する(B4、B5)。なお、前述したように、関連情報データベース222及び匿名情報データベース225は、匿名情報と、その基となった個人情報との対応付けを、個人情報データベース221における個人情報識別番号を用いて記憶している。従って、匿名情報削除要求を受信した匿名化制御部231は、削除対象の個人情報と識別情報とを基に作成された情報を特定することができる。
そして、匿名化制御部231は、匿名性判定部233に、関連情報データベース222に記録されている各暫定匿名情報が、基準匿名性を満たしているか否かの判定を要求する(B6)。
匿名性判定部233は、基準匿名性記憶部224に記憶されている基準匿名性と、関連情報データベース222に記録されている「暫定属性情報が同一の匿名IDの数の最小値」とを比較する(B7)。
匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性未満であれば、その旨を匿名化制御部231に通知する(B8)。
同様に、匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性以上であれば、その旨を匿名化制御部231に通知する(B8)。
匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性未満である旨の通知を受けた場合には(B8、B9)、匿名化レベルを一つ上げて、個人情報匿名化部232に、匿名化を指示する。この匿名化の際の匿名性保証装置200の動作は、上記で説明した個人情報受信時における動作(A4~A14)と同様である。
一方、匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている「暫定匿名情報が同一の匿名IDの数の最小値」が基準匿名性以上である旨の通知を受けると(B8、B9)、そこで処理を終了する。
本実施形態に係る匿名性保証装置200が提供する全ての匿名情報は、必ず基準匿名性を満たしていることが保証される。そのため、利用者は、個人が特定される不安を抱くことなく安心して個人情報を提供することができる。また、利用者は、利用者の個人情報を利用した便利なサービスの提供を受けることが可能となる。
また、本実施形態に係る匿名性保証装置200は、サービス利用者から個人情報の追加や削除などの更新要求があった場合、又は基準匿名性に変更があった場合でも、必ず基準匿名性を満たした匿名情報を提供することが可能である。
なお、本実施形態における個人情報削除要求受信時の匿名性保証装置200の動作では、個人情報データベース221が記憶する個人情報の匿名化の(A4~A14)前に、削除対象の情報削除後の暫定匿名情報が基準匿名性を満たしているか否か判定する(B6~B9)が、判定する前に個人情報データベース221に記憶されている個人情報を読み出して、匿名化を開始することもできる。
この処理に基づき、匿名性保証装置200が作成する全ての匿名情報は、基準匿名性を満たす範囲の中で最小の匿名化レベルで匿名化されるようにできる。
従って、本実施形態の匿名性保証装置200が提供する匿名情報は、必ず基準匿名性を満たしていることが保証されつつ、高い精度を持つことが可能となる。
(第2の実施形態)
第2の実施形態では、利用者端末100は、一例として、GPS(Global Positioning System)を備えた携帯電話機である。
利用者端末100は、匿名性保証装置200に、利用者端末100の「個人情報」と「携帯識別番号」とを送信する。利用者端末100が送信する個人情報は、「位置情報」と、「時刻情報」とを含む。「位置情報」は、利用者端末100の地理的な位置を表し、緯度と経度を含む。「時刻情報」は、GPSで位置情報を測定した時刻を表す。「携帯識別番号」は、位置情報を提供した携帯電話機を特定できる情報である。
利用者端末100が匿名性保証装置200に個人情報を送信するタイミングは、例えば、一定時間間隔毎としても良いし、利用者端末100が任意のタイミングで送信してもかまわない。
匿名性保証装置200は、利用者端末100から受信した個人情報と携帯識別番号とを記憶する。また、匿名性保証装置200は、利用者端末100から受信した個人情報を匿名化し、匿名情報を作成する。本実施形態における匿名化は、位置情報から、個人情報を提供した利用者端末100を特定する困難性を高めるよう、位置情報の精度を下げる処理である。
匿名性保証装置200は、利用者端末100から上記個人情報を受信すると、受信した個人情報を匿名化し、匿名情報を作成する。そして、匿名性保証装置200は、作成した匿名情報をサービス提供者サーバ300に送信する。
サービス提供者サーバ300は、匿名性保証装置200から受信した匿名情報を利用して、利用者端末100の地理的な位置情報を考慮に入れたサービスを利用者端末100に提供する。もしくは、匿名性保証装置200から受信した匿名情報は、行動分析のデータなどに活用する応用も考えられる。
<個人情報データベース>
第二の実施形態における個人情報データベース221の一例を図15に示す。個人情報データベース221は、利用者端末100から受信した個人情報と携帯識別番号とを記憶する。利用者端末100から送信される個人情報は、「位置情報」と「時刻情報」とを含む。「位置情報」は、「緯度」と「経度」に用いて表される。図15の個人情報データベース221は、7つの個人情報を記憶している。個人情報データベース221が記憶する各個人情報は、それぞれ個人情報識別番号に基づいて識別される。個人情報データベース221は、受信した個人情報を、時刻情報の新しい順にソートして記憶してもよい。
<匿名化レベル記憶部>
第二の実施形態における匿名化レベル記憶部223の一例を図16に示す。匿名化レベル記憶部223は、匿名化の際に位置情報をどのように匿名化するかを、匿名化レベルごとに記憶する。例えば、図16に示す匿名化レベル記憶部223は、匿名化レベル1からKまでの匿名化レベル毎に、位置情報をどのように匿名化するかを記憶している。図16に示す例では、匿名化レベルの値が大きいほど、匿名化の際に位置情報の精度を下げる度合いが大きくなる。例えば、匿名化レベル1で緯度と経度を匿名化すると、緯度と経度の小数点以下3位以下の端数が伏せ字となる。匿名化レベル2では、小数点以下2位以下、匿名化レベル3では小数点以下1位以下、匿名化レベルKではすべての桁が伏せ字となる。このように、匿名化レベルが高いほど、匿名化の際に位置情報の精度を下げる度合いが大きくなる。
<関連情報データベース>
第二の実施形態における関連情報データベース222の一例を図17に示す。関連情報データベース222は、個人情報データベース221に記憶されている位置情報を匿名化して生成される「暫定匿名情報」と、「時刻情報」と、「匿名ID」と、「暫定匿名情報のもとになった個人情報の識別番号」と、「暫定匿名情報の匿名化レベル」と、「暫定属性情報が同一の匿名IDの数」とを匿名情報毎に記憶する。暫定匿名情報は、「匿名化後の緯度」と「匿名化後の経度」とを含む。「暫定匿名情報の匿名化レベル」欄は、その暫定匿名情報がどの匿名化レベルで匿名化されたかを記憶する。
匿名ID欄は、個人情報に含まれる「携帯識別番号」を別の文字列に変換することで生成される暫定匿名情報の識別子を記載する。
<匿名情報データベース>
第二の実施形態における匿名情報データベース225の一例を図18に示す。匿名情報データベース225は、「匿名情報」と、「時刻情報」と、「匿名ID」とを記憶する。「匿名情報」とは、前述した暫定匿名情報のうち、基準匿名性を満たしているものを表す。匿名情報は、「匿名化後の緯度」と、「匿名化後の経度」とを含む。匿名情報データベース225が記憶する匿名情報は、後述する匿名情報提供部240を用いて、サービス提供者サーバ300に送信される。
<基準匿名性記憶部>
基準匿名性記憶部224は、基準匿名性を記憶する。ここで基準匿名性とは、本実施形態に係る匿名化に基づいて生成される匿名情報が満足する個人特定困難性の基準値である。例えば、本実施形態では、匿名性保証装置200は、作成する全ての匿名情報を、属性が同一のもの同士でグループ化した場合に各グループに属する匿名IDの個数の最小値が基準匿名性の値を上回るように、匿名化する。
このような処理に基づき、ある匿名情報が第三者に知られたとしても、その匿名情報の基になった個人情報を提供した利用者端末100の台数が「基準匿名性」の数以上あるので、匿名性保証装置200は、個人情報を提供した利用者端末100の特定を困難にできる。基準匿名性は、例えば、匿名性保証装置200の管理者が設定する値である。
<匿名化制御部>
匿名化制御部231は、一定時間間隔毎に、個人情報データベース221に蓄積された個人情報を読み出す。匿名化制御部231は、個人情報匿名化部232に、匿名化レベルを指定し、上記個人情報データベース221から読み出した個人情報を匿名化する。
また、匿名化制御部231は、上記匿名化に基づいて生成される暫定匿名情報を関連情報データベース222から取得して、それらの暫定匿名情報が基準匿名性を満たすかどうかを匿名性判定部233に判定させる。
匿名化制御部231は、判定の結果、匿名化に基づいて生成された上記匿名情報が基準匿名性を満たしていない場合には、匿名化レベルを変更して、再度、個人情報匿名化部232に匿名化させる。また、匿名化制御部231は、判定の結果、匿名化に基づいて生成された上記暫定匿名情報が基準匿名性を満たしている場合には、関連情報データベース222から上記暫定匿名情報を読み込み、匿名情報として匿名情報データベース225に書き込む。
<個人情報匿名化部>
個人情報匿名化部232は、匿名化制御部231から指定される匿名化レベルに応じた内容で、個人情報データベース221に記憶されている個人情報を匿名化する。
<匿名性判定部>
匿名性判定部233は、上記匿名化に基づいて生成される匿名情報が基準匿名性を満たすかどうかを判定する。
<匿名情報提供部>
匿名情報提供部240は、匿名情報データベース225から匿名情報を読み出して、サービス提供者サーバ300に送信する。
<k−匿名性>
ここで、第二の実施形態における「同一の匿名情報を持つ匿名IDの個数(k−匿名性)」について、図17を用いて説明する。図17のテーブルにおいて、「緯度 35.02X、経度 135.02X」という同一の暫定匿名情報が3つ存在している(個人情報識別番号1、3、4で表される暫定匿名情報)。しかし、これら3つの暫定匿名情報は、「緯度 35.02X、経度 135.02X」で現されるエリア内に3台の利用者端末100が存在することを意味していない。何故なら、匿名IDがuser_Aで表される同一の利用者端末100が、時刻を変えて複数回、匿名性保証装置200に個人情報を送信しているからである。実質、「緯度 35.02X、経度 135.02X」という暫定匿名情報を提供しているのは、匿名IDがuser_Aとuser_Cとで表される2台の利用者端末100である。本願発明ではk−匿名性を、匿名情報が同一となる「匿名情報の個数」ではなく、「匿名IDの個数」と定義しているので、個人情報識別番号1、3、4で表される暫定匿名情報のk−匿名性は、2である。
<処理の流れ>
本実施形態の全体の動作について詳細に説明する。
<個人情報受信処理>
図19のシーケンス図を参照して、利用者端末100から個人情報を受信したときの匿名性保証装置200の動作について説明する。個人情報更新受付部210は、利用者端末100から個人情報と携帯識別番号とを受信すると(C1)、受信した個人情報と携帯識別番号とを個人情報データベース221に書き込む(C2)。
<匿名化>
図19のシーケンス図を参照して、匿名化する際の匿名性保証装置200の動作について説明する。簡単のため、本実施形態において、基準匿名性は、2とする。
個人情報更新受付部210は、一定時間間隔ごとに、個人情報データベース221から読み出した個人情報の匿名化を匿名化制御部231に要求する(C3)。
あるいは、個人情報更新受付部210は、任意のタイミングで個人情報データベース221から読み出した個人情報の匿名化を匿名化制御部231に要求するように設定することもできる。
匿名化制御部231は、個人情報更新受付部210から匿名化の要求を受けると、個人情報匿名化部232に、まずは、匿名化レベルを1に指定した匿名化を指示する(C4)。
個人情報匿名化部232は、匿名化の指示を受けると、個人情報データベース221に記憶されている個人情報を読み出す(C5)。個人情報匿名化部232は、上記個人情報データベース221から個人情報を読み出す際に、時刻情報が新しい個人情報を読み出す。本実施形態では、匿名化する当日の日付の時刻情報を持つ個人情報を読み出すと仮定する。今、例えば、9月10日の01時00分に匿名化するとする。この場合、例えば、個人情報データベース221に、図15が示すような個人情報が記憶されていると仮定すると、個人情報匿名化部232は、個人情報識別番号1~6までの個人情報を読み出す。
個人情報匿名化部232は、読み出した個人情報の匿名化を開始する(C6)。まず、個人情報匿名化部232は、各個人情報それぞれ含まれる携帯識別番号を匿名IDに置き換える。匿名IDは、利用者端末100を特定できない文字列である。
次に、個人情報匿名化部232は、匿名化レベル記憶部223を参照して、各個人情報を、匿名化レベル1で特定される内容で匿名化し、暫定匿名情報を生成する。また、個人情報匿名化部232は、匿名化後の各暫定匿名情報に対して、暫定属性情報が同一となる匿名IDの数(k−匿名性)を集計する。
そして、個人情報匿名化部232は、各暫定匿名情報を、個人情報識別番号と、匿名IDと、時刻情報と、匿名化レベルと、暫定属性情報が同一の匿名IDの数と、それぞれ対応付けて関連情報データベース222に記録し(C7)、匿名化制御部231に匿名化の完了を通知する(C8)。
匿名化制御部231は、個人情報匿名化部232から匿名化の完了通知を受けると、関連情報データベース222に記録されている各暫定匿名情報が、基準匿名性を満たしているか否かの判定を匿名性判定部233に要求する(C9)。
匿名性判定部233は、基準匿名性記憶部224に記憶されている基準匿名性と、関連情報データベース222に記録されている暫定属性情報が同一の匿名IDの数と、を比較する(C10)。
匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている匿名化後の個人情報の中で、一つでも基準匿名性を満たしていないものがあれば、その旨を匿名化制御部231に通知する(C11、C12)。
匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている暫定匿名情報の中で、一つでも基準匿名性を満たしていないものがあった旨の通知を受けた場合には、匿名化レベルを一つ上げて、再度、個人情報匿名化部232に、匿名化を指示する(C4)。
以後、匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている全ての暫定匿名情報が基準匿名性を満たしている旨の通知を受けるまで、匿名化レベルを一つずつ上げて、個人情報匿名化部232に匿名化を指示する(C4~C11)。
同様に、匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている全ての暫定匿名情報が基準匿名性を満たしていれば、その旨を匿名化制御部231に通知する(C11、C12)。本実施形態では、図17に示すように、匿名化レベル1で匿名化して生成した全ての暫定匿名情報の「匿名化後の属性が同一の匿名IDの数(k−匿名性)」が基準匿名性を満たしているので、匿名化を繰り返すことなくC13以下のステップに進む。
匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている全ての個人情報が基準匿名性を満たしている旨の通知を受けると(C12)、関連情報データベース222に記憶されている暫定匿名情報を読み込み(C13)、読み込んだ暫定匿名情報を匿名情報として、匿名情報データベース225に書き込む(C14)。
<個人情報削除要求受信時の処理>
次に、図20のシーケンス図を用いて、第二の実施形態における利用者端末100から個人情報削除要求を受信した場合の匿名性保証装置200の動作を説明する。個人情報削除要求とは、利用者が匿名性保証装置200への個人情報の提供を中止したいと考えた場合に、その利用者の利用者端末100から送信される要求である。
匿名性保証装置200は、利用者端末100から個人情報削除要求を受信した場合には、その利用者の個人情報と識別情報とを個人情報データベース221から削除すると共に、関連情報データベース222や匿名情報データベース225からも、その利用者の個人情報と識別情報とを基に生成された情報を削除する。
この場合、匿名情報データベース225に記憶されているいずれかの匿名情報が基準匿名性を満たさなくなる可能性がある。
そのため、本実施形態に係る匿名性保証装置200は、個人情報削除要求を受信した場合には、以下を処理する。
現在、個人情報データベース221は、図15に示すような個人情報を記憶していると仮定する。匿名性保証装置200が、携帯識別番号Aで表される利用者端末100の利用者から個人情報削除要求を受信したと仮定して、個人情報削除要求を受信した場合の第二の実施形態における匿名性保証装置200の動作について説明する。
個人情報更新受付部210は、利用者端末100から個人情報削除要求を受信する(D1)。そうすると、個人情報更新受付部210は、個人情報削除要求を送信してきた利用者端末100の利用者の個人情報と識別情報とを個人情報データベース221から削除する(D2)。
また、個人情報更新受付部210は、匿名化制御部231に、その利用者の個人情報と識別情報とを基に生成されたすべての情報の、関連情報データベース222及び匿名情報データベース225からの削除を指示する(D3)。匿名化制御部231は、関連情報データベース222及び匿名情報データベース225から、その利用者の個人情報と識別情報とを基に生成された全ての情報を削除する(D4、D5)。削除後の関連情報データベース222が記憶する暫定匿名情報を、図21に示す。
なお、前述したように、匿名情報データベース225は、匿名情報と、その基となった個人情報との対応付けを、個人情報データベース221における個人情報識別番号を用いて記憶している。従って、匿名情報削除要求を受信した匿名化制御部231は、削除対象の個人情報を基に作成された匿名情報を特定できる。
そして、匿名化制御部231は、匿名性判定部233に、関連情報データベース222に記録されている各暫定匿名情報が、基準匿名性を満たしているか否かの判定を要求する(D6)。
匿名性判定部233は、基準匿名性記憶部224に記憶されている基準匿名性と、関連情報データベース222が記録している同一の暫定匿名情報を持つ匿名IDの数とを比較する(D7)。
図21を参照すると、携帯識別番号Aから受信した個人情報を基に作成された暫定匿名情報が関連情報データベース222から削除された結果、個人情報識別番号2,4,5いずれの前提匿名情報も「匿名化後の属性が同一の匿名IDの数(k−匿名性)」が基準匿名性(=2)を満たせなくなることがわかる。個人情報識別番号2、5の暫定匿名情報は、緯度、経度とも同一であるが、個人情報識別番号2、5の暫定匿名情報の基となった個人情報を提供した利用者端末は、匿名IDがuser_Bで表される1台である。従って、個人情報識別番号2、5の暫定匿名情報の「匿名化後の属性が同一の匿名IDの数(k−匿名性)」は、1である。これは、基準匿名性(=2)を満たさない。
匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている暫定匿名情報の中で、一つでも基準匿名性を満たしていないものがあれば、その旨を匿名化制御部231に通知する(D8)。
同様に、匿名性判定部233は、比較の結果、関連情報データベース222に記憶されている全ての暫定匿名情報が基準匿名性を満たしていれば、その旨を匿名化制御部231に通知する(D8)。
匿名化制御部231は、匿名性判定部233から、関連情報データベース222に記憶されている暫定匿名情報の中で、一つでも基準匿名性を満たしていないものがあった旨の通知を受けた場合には(D8、D9)、匿名化レベルを一つ上げて、個人情報匿名化部232に、匿名化を指示する。この匿名化の際の匿名性保証装置200の動作は、上記説明した個人情報受信時における動作(C4~C14)と同様である。
本実施形態では、匿名化レベル1での匿名化の結果生成した暫定匿名情報が基準匿名性を満たさないので、匿名化レベル2で再度匿名化することになる。
匿名化レベル2で匿名化して生成した暫定匿名情報を図22に示す。図22において、個人情報識別番号2、4、5の暫定匿名情報は、緯度、経度とも同一で、基となった個人情報はuser_Bとuser_Cの2台の利用者端末から受信したことがわかる。従って、個人情報識別番号2、4、5の暫定匿名情報は、「匿名化後の属性が同一の匿名IDの数(k−匿名性)」が2である。この処理に基づき、すべての暫定匿名情報が基準匿名性(=2)を満たすので、暫定匿名情報は、匿名情報データベース225に匿名情報として記憶される(図23)
本実施形態に係る匿名性保証装置200に基づけば、匿名性保証装置200が提供する全ての匿名情報は、必ず基準匿名性を満たしていることが保証される。そのため、利用者は、個人が特定される不安を抱くことなく安心して利用者端末の位置情報を提供することができる。また、利用者は、利用者端末の地理的な情報を利用した便利なサービスの提供を受けることが可能となる。
(第3の実施形態)
第3の実施形態では、匿名化レベル記憶部223は、緯度経度と地域メッシュコードとの対応関係を記憶するテーブルと、図24に示すような、匿名化レベルと地域メッシュコードの次数とを対応して記憶するテーブルとの、2つのテーブルを記憶する。
地域メッシュコードとは、総務省が定めた「統計に用いる標準地域メッシュおよび標準地域メッシュコード」(昭和48年行政管理庁告示第143号)のことである。地域メッシュコードは、統計に利用するために、地図を緯度及び経度に沿って区画して成る区域を、識別子を用いて表現した位置情報の識別情報である。
地域メッシュコードは、階層的な構造をしており、区域の広い順に、第一次メッシュ、第二次メッシュ、第三次メッシュ、2分の1地域メッシュの4階層から成る。第一次メッシュの中には、64個の第二次メッシュが包含される。第二次メッシュの中には、100個の第三次メッシュが包含される。第三次メッシュの中には、4つの2分の1地域メッシュが包含される。地域メッシュは、各階層の区域の識別子を列挙した形で表現される。
第一次メッシュは、4桁の数字で表される。第一次メッシュは、20万分の1の地勢図の1図葉の区画を1単位区画としたもので、緯度差は40分、経度差は1度となっている。1辺の長さは約80kmである。一次メッシュコードは、4桁の数字で、上2桁が緯度(1.5倍して分以下を切り上げたもの)、下2桁が経度(下2桁)を表す。
第二次メッシュは、第一次メッシュと合わせて3570−12のように表される。上4桁の3570が第一次メッシュを、続く12が第二次メッシュを表す。第二次メッシュは、第一次メッシュを緯線方向及び経線方向に8等分してできる区域で、1辺の長さは約10kmである。第二次メッシュコードは、2桁の数字で、上1桁が緯度方向、下1桁が経度方向を表す。
第三次メッシュは、緯線方向及び経線方向に10等分してできる区域であり、緯度差は30秒、経度差は45秒で、1辺の長さは約1kmである。第三次メッシュコードは、第二次メッシュコードと同様に2桁の数字で、上1桁が緯度方向、下1桁が経度方向を表す。これに第一次・第二次メッシュコードを合せて、第三次メッシュは、3570−12−34のように表す。
さらに細かな地域区分として2分の1地域メッシュがある。2分の1地域メッシュは、第三次メッシュを縦横に2等分したものである。南西側のメッシュを1、南東を2、北西を3、北東を4として、2分の1地域メッシュは、3570−12−34−3のように表す。
本実施形態における個人情報匿名化について図19を用いて説明する。第二の実施形態との差異があるのはC6のステップである。
まず、個人情報匿名化部232は、各個人情報にそれぞれ含まれる携帯識別番号を匿名IDに置き換える。匿名IDは、利用者端末100を特定できない文字列である。
次に、個人情報匿名化部232は、匿名化レベル記憶部223を参照して、各個人情報の緯度、経度で表される位置情報を地域メッシュコードに変換する。それから、個人情報匿名化部232は、地域メッシュコードに変換された各個人情報の位置情報に対して、図24に示すような匿名化レベルと処理内容とを対応させたテーブルを参照して、匿名化レベル1で特定される内容で匿名化し、暫定匿名情報を生成する。また、個人情報匿名化部232は、匿名化後の各暫定匿名情報に対して、暫定属性情報が同一となる匿名IDの数(k−匿名性)を集計する。他の処理に関しては、第二の実施形態と同様である。
本実施形態に係る匿名性保証装置200に基づけば、匿名性保証装置200が提供する全ての匿名情報は、必ず基準匿名性を満たしていることが保証される。そのため、利用者は、個人が特定される不安を抱くことなく安心して個人情報を提供することができる。また、利用者は、利用者端末の地理的な情報を利用した便利なサービスの提供を受けることが可能となる。
また、地域メッシュコードは、総務省が定めたものであり、各種統計によく用いられている。従って、匿名性保証装置200から受信した匿名情報を、行動分析のデータなどに活用したときに、例えば、他の統計情報と組み合わせて分析することが容易である。もちろん、地域メッシュコードは、総務省が定めたもの以外にも、独自に作成したものを用いても良い。
(その他の実施形態)
匿名化レベル記憶部(特許請求の範囲に記載のアルゴリズム定義部に相当する)223が記憶する処理内容は、個人情報の記載内容の一部を削除する処理を含むことができる。
匿名化レベル記憶部(特許請求の範囲に記載のアルゴリズム定義部に相当する)223が記憶する処理内容は、個人情報の記載内容の一部をより上位概念の語句に置き換える処理を含むことができる。
個人情報データベース221が記憶する個人情報は、匿名性保証装置(特許請求の範囲に記載の情報処理装置に相当する)200と通信可能に接続される複数の携帯電話機のそれぞれの位置情報を含むことができる。各携帯電話機の位置情報は、各携帯電話機の所在地の緯度および経度を示す情報を含むことができる。匿名化レベル記憶部223が記憶する処理内容は、緯度および経度の少なくとも一方の精度を下げる処理を含むことができる。
匿名化レベル記憶部(特許請求の範囲に記載のアルゴリズム定義部に相当する)223は、地図を緯度及び経度に沿って階層的に区画して成る最下層の区域をその区域を包含する各階層の区域の識別子を階層順に列挙して表現した識別情報と、最下層の区域の範囲を緯度及び経度で表した情報とを各最下層の区域についてそれぞれ対応付けて記憶すると共に、最下層の区域の識別情報を構成する各階層の識別子のうち、最下層の識別子からどの階層までの識別子を削除するかを示す複数のアルゴリズムを、より上位階層まで削除するアルゴリズムほど大きな数値となるアルゴリズム識別情報と対応付けて記憶することができる。
個人情報匿名化部(特許請求の範囲に記載の記載内容変更部と記載内容別提供者数算出部に相当する)232は、アルゴリズム定義部を参照し、個人情報データベース221に記憶されている各携帯電話機の所在地の緯度及び経度を示す各情報を、それぞれ対応する最下層の区域の識別情報に変換し、各識別情報を構成する各階層の識別子のうち最下層の識別子からアルゴリズムで定まる階層の識別子までを削除することができる。
アルゴリズムは、個人情報の記載内容の一部を削除する処理を含むことができる。
アルゴリズムは、個人情報の記載内容の一部をより上位概念の語句に置き換える処理を含むことができる。
各携帯電話機の位置情報は、各携帯電話機の所在地の緯度および経度を示す情報を含むことができる。
アルゴリズムは、緯度および経度の少なくとも一方の精度を下げる処理を含むことができる。
アルゴリズム定義部は、地図を緯度及び経度に沿って階層的に区画して成る最下層の区域をその区域を包含する各階層の区域の識別子を階層順に列挙して表現した識別情報と、最下層の区域の範囲を緯度及び経度で表した情報とを各最下層の区域についてそれぞれ対応付けて記憶すると共に、最下層の区域の識別情報を構成する各階層の識別子のうち、最下層の識別子からどの階層までの識別子を削除するかを示す複数のアルゴリズムを、より上位階層まで削除するアルゴリズムほど大きな数値となるアルゴリズム識別情報と対応付けて記憶することができる。
記載内容変更部は、アルゴリズム定義部を参照し、個人情報データベースに記憶されている各携帯電話機の所在地の緯度及び経度を示す各情報を、それぞれ対応する最下層の区域の識別情報に変換し、各識別情報を構成する各階層の識別子のうち最下層の識別子からアルゴリズムで定まる階層の識別子までを削除することができる。
なお、本発明の匿名性保証装置は、図2に示す構成に限らない。
図25は、本発明の別の実施形態に係る匿名性保証装置250の構成の一例を示すブロック図である。図25において、図2と同じ構成には同じ番号を付し詳細な説明は、省略する。
図25に示す匿名性保証装置250は、個人情報データベース221と、匿名化レベル記憶部223と、個人情報匿名化部232と、匿名性判定部233とを含む。個人情報匿名化部232は、記載内容変更部234と、記載内容別提供者数算出部235とを含む。
個人情報データベース221は、複数の個人情報を、各個人情報の提供者の識別情報とそれぞれ対応付けて記憶する。匿名化レベル記憶部223は、各個人情報の記載内容を匿名化する内容を定義した複数種類のアルゴリズムを、アルゴリズム識別情報とそれぞれ対応付けて記憶する。記載内容変更部234は、個人情報データベース221に記憶されている各個人情報の記載内容を、所定のアルゴリズム識別情報に対応するアルゴリズムに従って変更する。記載内容別提供者数算出部235は、変更後の記載内容毎に、各変更後の記載内容に変更される個人情報の提供者数を算出する。匿名性判定部233は、各提供者数のうちの最小値を所定の基準値と比較する。そして、記載内容変更部234が、最小値が基準値以上になるまで、各アルゴリズム識別情報に対応するアルゴリズムで個人情報データベース221に記憶されている各個人情報の記載内容を変更する。匿名性保証装置250は、これら処理を繰り返すして、匿名性保証装置200と同様の効果を実現する。
ここで、匿名性保証装置250は、特許請求の範囲に記載の情報処理装置に相当し、匿名化レベル記憶部223は、特許請求の範囲に記載のアルゴリズム定義部に相当し、匿名性判定部233は、特許請求の範囲の比較部に相当する。
なお図25に示す匿名性保証装置250は、本発明の最小構成となっている。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2010年5月10日に出願された日本出願特願2010−108050を基礎とする優先権を主張し、その開示の全てをここに取り込む。
100 利用者端末
100A 利用者端末
100B 利用者端末
110 個人情報送信部
120 サービス要求送信部
130 サービス受信部
200 匿名性保証装置
201 CPU
202 メモリ
203 ポート
204 ハードディスクドライブ
205 記録媒体
206 記録媒体読取装置
207 入力装置
208 出力装置
210 個人情報更新受付部
220 データベース
221 個人情報データベース
222 関連情報データベース
223 匿名化レベル記憶部
224 基準匿名性記憶部
225 匿名情報データベース
230 個人情報匿名化プログラム
231 匿名化制御部
232 個人情報匿名化部
233 匿名性判定部
234 記載内容変更部
235 記載内容別提供者数算出部
240 匿名情報提供部
300 サービス提供者サーバ
310 サービス要求受信部
320 匿名情報要求部
330 匿名情報取得部
340 サービス実行部
350 サービス送信部
400 ネットワーク
1000 匿名性保証システム
100A 利用者端末
100B 利用者端末
110 個人情報送信部
120 サービス要求送信部
130 サービス受信部
200 匿名性保証装置
201 CPU
202 メモリ
203 ポート
204 ハードディスクドライブ
205 記録媒体
206 記録媒体読取装置
207 入力装置
208 出力装置
210 個人情報更新受付部
220 データベース
221 個人情報データベース
222 関連情報データベース
223 匿名化レベル記憶部
224 基準匿名性記憶部
225 匿名情報データベース
230 個人情報匿名化プログラム
231 匿名化制御部
232 個人情報匿名化部
233 匿名性判定部
234 記載内容変更部
235 記載内容別提供者数算出部
240 匿名情報提供部
300 サービス提供者サーバ
310 サービス要求受信部
320 匿名情報要求部
330 匿名情報取得部
340 サービス実行部
350 サービス送信部
400 ネットワーク
1000 匿名性保証システム
Claims (10)
- 複数の個人情報を、各個人情報の提供者の識別情報とそれぞれ対応付けて記憶する個人情報データベースと、
前記各個人情報の記載内容を曖昧化する処理内容を定義した複数種類のアルゴリズムを、アルゴリズム識別情報とそれぞれ対応付けて記憶するアルゴリズム定義部と、
前記個人情報データベースに記憶されている各個人情報の記載内容を、所定のアルゴリズム識別情報に対応するアルゴリズムに従って変更する記載内容変更部と、
変更後の記載内容毎に、各変更後の記載内容に変更される個人情報の提供者数を算出する記載内容別提供者数算出部と、
前記各提供者数のうちの最小値を所定の基準値と比較する比較部とを含み、
前記記載内容変更部が、前記最小値が前記基準値以上になるまで、各アルゴリズム識別情報に対応するアルゴリズムで前記個人情報データベースに記憶されている各個人情報の記載内容を変更する処理を繰り返す情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記記載内容変更部は、前記最小値が前記基準値以上である場合には、変更後の各記載内容をそれぞれ匿名情報として匿名情報データベースに記録することを特徴とする情報処理装置。 - 請求項1又は請求項2に記載の情報処理装置であって、前記アルゴリズム識別情報が、各アルゴリズムに基づいて記載内容を変更した場合に見込まれる変更後の記載内容の該当者数に応じて定められることを特徴とする情報処理装置。
- 請求項1乃至請求項3のいずれかに記載の情報処理装置であって、
前記記載内容変更部が、前記アルゴリズム定義部に記憶されているアルゴリズムに従って各記載内容を変更する際に、変更後の記載内容の該当者数が少ないと見込まれるアルゴリズムから順に各アルゴリズムを選択することを特徴とする情報処理装置。 - 請求項1乃至請求項4のいずれかに記載の情報処理装置であって、
前記個人情報データベースに記憶されている各個人情報の記載内容を変更した結果、一旦、前記最小値が前記基準値以上となった後に、前記個人情報データベースに記憶されている個人情報のいずれかが削除された場合には、
前記記載内容変更部が、前記個人情報データベースに記憶されている残りの各個人情報について、前記最小値が前記基準値以上になるまで再度各記載内容を変更することを特徴とする情報処理装置。 - 請求項1乃至請求項4のいずれかに記載の情報処理装置であって、
前記個人情報データベースに記憶されている各個人情報の記載内容の変更した結果、一旦、前記最小値が前記基準値以上となった後に、前記個人情報データベースに記憶されている個人情報のいずれかが削除された場合には、
前記記載内容別提供者数算出部が、前記削除された個人情報以外の各個人情報について、変更後の記載内容に変更される個人情報の提供者数を、変更後の記載内容毎に再度算出し、
前記比較部が、前記各提供者数のうちの最小値を所定の基準値と再度比較し、
前記記載内容変更部が、前記最小値が前記基準値以上でない場合に、前記個人情報データベースに記憶されている残りの各個人情報について、前記最小値が前記基準値以上になるまで再度各記載内容を変更することを特徴とする情報処理装置。 - 請求項1乃至請求項6のいずれかに記載の情報処理装置であって、
前記各個人情報は、前記情報処理装置と通信可能に接続される複数の携帯電話機のそれぞれの位置情報を含むことを特徴とする情報処理装置。 - 請求項1乃至請求項7のいずれかに記載の情報処理装置であって、
前記個人情報データベースに記憶される各個人情報の提供元である複数の提供者端末と、前記匿名情報データベースに記憶される各匿名情報を利用した情報を処理し、前記情報処理の結果を前記提供者端末に送信するサービス提供者サーバと、に通信可能に接続され、
前記匿名情報データベースに記憶されている各匿名情報を、前記サービス提供者サーバに送信する匿名情報提供部と、を備えることを特徴とする情報処理装置。 - 複数の個人情報を、各個人情報の提供者の識別情報とそれぞれ対応付けて記憶し、
前記各個人情報の記載内容を曖昧化する処理内容を定義した複数種類のアルゴリズムを、アルゴリズム識別情報とそれぞれ対応付けて記憶し、
前記記憶されている各個人情報の記載内容を、所定のアルゴリズム識別情報に対応するアルゴリズムに従って変更し、
変更後の記載内容毎に、各変更後の記載内容に変更される個人情報の提供者数を算出し、
前記各提供者数のうちの最小値を所定の基準値と比較し、
前記最小値が前記基準値以上になるまで、各アルゴリズム識別情報に対応するアルゴリズムで前記個人情報データベースに記憶されている各個人情報の記載内容を変更する処理を繰り返す制御方法。 - 複数の個人情報を、各個人情報の提供者の識別情報とそれぞれ対応付けて記憶する手順と、
前記各個人情報の記載内容を曖昧化する処理内容を定義した複数種類のアルゴリズムを、アルゴリズム識別情報とそれぞれ対応付けて記憶する手順と、
前記記憶されている各個人情報の記載内容を、所定のアルゴリズム識別情報に対応するアルゴリズムに従って変更する手順と、
変更後の記載内容毎に、各変更後の記載内容に変更される個人情報の提供者数を算出する手順と、
前記各提供者数のうちの最小値を所定の基準値と比較する手順と、
前記最小値が前記基準値以上になるまで、各アルゴリズム識別情報に対応するアルゴリズムで前記個人情報データベースに記憶されている各個人情報の記載内容を変更する処理を繰り返す手順と、をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012514791A JP5796574B2 (ja) | 2010-05-10 | 2011-04-27 | 情報処理装置、制御方法及びプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010108050 | 2010-05-10 | ||
JP2010-108050 | 2010-05-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2011142327A1 true WO2011142327A1 (ja) | 2011-11-17 |
Family
ID=44914383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2011/060685 WO2011142327A1 (ja) | 2010-05-10 | 2011-04-27 | 情報処理装置、制御方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5796574B2 (ja) |
WO (1) | WO2011142327A1 (ja) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013232068A (ja) * | 2012-04-27 | 2013-11-14 | Kddi Corp | 位置情報匿名化装置、位置情報匿名化方法およびプログラム |
JP2014016675A (ja) * | 2012-07-05 | 2014-01-30 | Fujitsu Ltd | 制御プログラム、情報処理装置およびシステム |
JP2014086037A (ja) * | 2012-10-26 | 2014-05-12 | Toshiba Corp | 匿名化データ変更システム |
JP2014092978A (ja) * | 2012-11-05 | 2014-05-19 | Nippon Telegr & Teleph Corp <Ntt> | 位置情報提供装置、安全度評価装置、位置情報提供方法、安全度評価方法、プログラム |
JP2014199589A (ja) * | 2013-03-29 | 2014-10-23 | ニフティ株式会社 | 匿名情報配信システム、匿名情報配信方法及び匿名情報配信プログラム |
JP2015007885A (ja) * | 2013-06-25 | 2015-01-15 | 日本電気株式会社 | 情報処理装置、及び、データ処理方法 |
JP2015049648A (ja) * | 2013-08-30 | 2015-03-16 | ニフティ株式会社 | 匿名化システム |
JP2015090617A (ja) * | 2013-11-06 | 2015-05-11 | 富士通株式会社 | 匿名化データ生成方法、装置及びプログラム |
JPWO2013121739A1 (ja) * | 2012-02-17 | 2015-05-11 | 日本電気株式会社 | 匿名化装置及び匿名化方法 |
WO2015170531A1 (ja) * | 2014-05-08 | 2015-11-12 | 学校法人慶應義塾 | 匿名化システム、発行装置及びプログラム |
JP2016115330A (ja) * | 2014-12-12 | 2016-06-23 | パナソニックIpマネジメント株式会社 | 履歴情報匿名化方法及び履歴情報匿名化装置 |
JP2016162271A (ja) * | 2015-03-03 | 2016-09-05 | Kddi株式会社 | 匿名化装置、方法及びプログラム |
US9521444B2 (en) | 2014-08-07 | 2016-12-13 | Panasonic Intellectual Property Management Co., Ltd. | Information providing apparatus, information providing method, and information providing system |
JPWO2015118801A1 (ja) * | 2014-02-04 | 2017-03-23 | 日本電気株式会社 | 情報判定装置、情報判定方法及びプログラム |
US10013576B2 (en) | 2014-12-12 | 2018-07-03 | Panasonic Intellectual Property Management Co., Ltd. | History information anonymization method and history information anonymization device for anonymizing history information |
WO2018123190A1 (ja) * | 2016-12-28 | 2018-07-05 | ソニー株式会社 | サーバ装置、情報管理方法、情報処理装置、情報処理方法およびプログラム |
JP2018519606A (ja) * | 2015-12-14 | 2018-07-19 | グーグル エルエルシー | 店舗訪問データ作成および管理 |
WO2019220791A1 (ja) * | 2018-05-14 | 2019-11-21 | 株式会社Nttドコモ | 対話装置 |
JP2020198008A (ja) * | 2019-06-05 | 2020-12-10 | キヤノンマーケティングジャパン株式会社 | サーバ装置、サーバ装置の制御方法、プログラム、正規品判定システム、及び正規品判定システムの制御方法 |
US10872353B2 (en) | 2015-12-14 | 2020-12-22 | Google Llc | Providing content to store visitors without requiring proactive information sharing |
JP2021157343A (ja) * | 2020-03-25 | 2021-10-07 | 京セラドキュメントソリューションズ株式会社 | データ連携システムおよび匿名化制御システム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5772563B2 (ja) * | 2011-12-14 | 2015-09-02 | 富士通株式会社 | 情報処理方法、装置及びプログラム |
KR101856455B1 (ko) * | 2014-03-31 | 2018-05-10 | 도이체 텔레콤 악티엔 게젤샤프트 | 데이터 보호 서비스의 가입자의 사용자 신원 및/또는 사용자 데이터를 보호 및/또는 익명화하기 위한 방법 및 시스템, 모바일 통신 네트워크, 프로그램 및 컴퓨터 프로그램 제품 |
JP7045290B2 (ja) * | 2018-09-10 | 2022-03-31 | ヤフー株式会社 | 情報管理システム、情報管理方法、およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003016064A (ja) * | 2001-06-29 | 2003-01-17 | Toshiba Corp | 電子文書の実名語/匿名語マップ作成装置、作成方法、及び作成プログラム、並びに電子文書の匿名化装置、並びに電子文書の実名化装置 |
WO2006132143A1 (ja) * | 2005-06-10 | 2006-12-14 | Matsushita Electric Industrial Co., Ltd. | 認証システム、認証装置、端末装置及び検証装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4956455B2 (ja) * | 2008-01-29 | 2012-06-20 | 株式会社日立製作所 | 情報管理装置、プログラム及び情報管理方法。 |
-
2011
- 2011-04-27 JP JP2012514791A patent/JP5796574B2/ja active Active
- 2011-04-27 WO PCT/JP2011/060685 patent/WO2011142327A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003016064A (ja) * | 2001-06-29 | 2003-01-17 | Toshiba Corp | 電子文書の実名語/匿名語マップ作成装置、作成方法、及び作成プログラム、並びに電子文書の匿名化装置、並びに電子文書の実名化装置 |
WO2006132143A1 (ja) * | 2005-06-10 | 2006-12-14 | Matsushita Electric Industrial Co., Ltd. | 認証システム、認証装置、端末装置及び検証装置 |
Non-Patent Citations (2)
Title |
---|
MOHAMED F. MOKBEL ET AL.: "The New Casper: Query Processing for Location Services without Compromising Privacy", PROCEEDINGS OF THE 32ND INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASES, ACM, 15 September 2006 (2006-09-15), pages 763 - 774 * |
SHIN'YA MIYAGAWA ET AL.: "Achieving Anonymity and Diversity for Location-based Services", DAI 72 KAI (HEISEI 22 NEN) ZENKOKU TAIKAI KOEN RONBUNSHU (3) NETWORK SECURITY, 8 March 2010 (2010-03-08), pages 577 - 578 * |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2013121739A1 (ja) * | 2012-02-17 | 2015-05-11 | 日本電気株式会社 | 匿名化装置及び匿名化方法 |
JP2013232068A (ja) * | 2012-04-27 | 2013-11-14 | Kddi Corp | 位置情報匿名化装置、位置情報匿名化方法およびプログラム |
JP2014016675A (ja) * | 2012-07-05 | 2014-01-30 | Fujitsu Ltd | 制御プログラム、情報処理装置およびシステム |
JP2014086037A (ja) * | 2012-10-26 | 2014-05-12 | Toshiba Corp | 匿名化データ変更システム |
JP2014092978A (ja) * | 2012-11-05 | 2014-05-19 | Nippon Telegr & Teleph Corp <Ntt> | 位置情報提供装置、安全度評価装置、位置情報提供方法、安全度評価方法、プログラム |
JP2014199589A (ja) * | 2013-03-29 | 2014-10-23 | ニフティ株式会社 | 匿名情報配信システム、匿名情報配信方法及び匿名情報配信プログラム |
JP2015007885A (ja) * | 2013-06-25 | 2015-01-15 | 日本電気株式会社 | 情報処理装置、及び、データ処理方法 |
JP2015049648A (ja) * | 2013-08-30 | 2015-03-16 | ニフティ株式会社 | 匿名化システム |
JP2015090617A (ja) * | 2013-11-06 | 2015-05-11 | 富士通株式会社 | 匿名化データ生成方法、装置及びプログラム |
JPWO2015118801A1 (ja) * | 2014-02-04 | 2017-03-23 | 日本電気株式会社 | 情報判定装置、情報判定方法及びプログラム |
WO2015170531A1 (ja) * | 2014-05-08 | 2015-11-12 | 学校法人慶應義塾 | 匿名化システム、発行装置及びプログラム |
JP2015215676A (ja) * | 2014-05-08 | 2015-12-03 | 学校法人慶應義塾 | 匿名化システム、発行装置及びプログラム |
US10303897B2 (en) | 2014-05-08 | 2019-05-28 | Keio University | Anonymization system, issuance device, and storage medium |
US9521444B2 (en) | 2014-08-07 | 2016-12-13 | Panasonic Intellectual Property Management Co., Ltd. | Information providing apparatus, information providing method, and information providing system |
US10013576B2 (en) | 2014-12-12 | 2018-07-03 | Panasonic Intellectual Property Management Co., Ltd. | History information anonymization method and history information anonymization device for anonymizing history information |
JP2020091916A (ja) * | 2014-12-12 | 2020-06-11 | パナソニックIpマネジメント株式会社 | 情報匿名化方法及び情報匿名化装置 |
JP2019117647A (ja) * | 2014-12-12 | 2019-07-18 | パナソニックIpマネジメント株式会社 | 情報匿名化方法及び情報匿名化装置 |
JP2016115330A (ja) * | 2014-12-12 | 2016-06-23 | パナソニックIpマネジメント株式会社 | 履歴情報匿名化方法及び履歴情報匿名化装置 |
JP2016162271A (ja) * | 2015-03-03 | 2016-09-05 | Kddi株式会社 | 匿名化装置、方法及びプログラム |
US10621603B2 (en) | 2015-12-14 | 2020-04-14 | Google Llc | Store visit data creation and management |
US11049122B2 (en) | 2015-12-14 | 2021-06-29 | Google Llc | Store visit data creation and management |
US11397958B2 (en) | 2015-12-14 | 2022-07-26 | Google Llc | Store visit data creation and management |
JP2019139822A (ja) * | 2015-12-14 | 2019-08-22 | グーグル エルエルシー | 店舗訪問データ作成および管理 |
US10592913B2 (en) | 2015-12-14 | 2020-03-17 | Google Llc | Store visit data creation and management |
JP2018519606A (ja) * | 2015-12-14 | 2018-07-19 | グーグル エルエルシー | 店舗訪問データ作成および管理 |
US10872353B2 (en) | 2015-12-14 | 2020-12-22 | Google Llc | Providing content to store visitors without requiring proactive information sharing |
WO2018123190A1 (ja) * | 2016-12-28 | 2018-07-05 | ソニー株式会社 | サーバ装置、情報管理方法、情報処理装置、情報処理方法およびプログラム |
US11194931B2 (en) | 2016-12-28 | 2021-12-07 | Sony Corporation | Server device, information management method, information processing device, and information processing method |
JPWO2018123190A1 (ja) * | 2016-12-28 | 2019-10-31 | ソニー株式会社 | サーバ装置、情報管理方法、情報処理装置、情報処理方法およびプログラム |
JPWO2019220791A1 (ja) * | 2018-05-14 | 2021-02-12 | 株式会社Nttドコモ | 対話装置 |
WO2019220791A1 (ja) * | 2018-05-14 | 2019-11-21 | 株式会社Nttドコモ | 対話装置 |
JP7033195B2 (ja) | 2018-05-14 | 2022-03-09 | 株式会社Nttドコモ | 対話装置 |
JP2020198008A (ja) * | 2019-06-05 | 2020-12-10 | キヤノンマーケティングジャパン株式会社 | サーバ装置、サーバ装置の制御方法、プログラム、正規品判定システム、及び正規品判定システムの制御方法 |
JP2021157343A (ja) * | 2020-03-25 | 2021-10-07 | 京セラドキュメントソリューションズ株式会社 | データ連携システムおよび匿名化制御システム |
Also Published As
Publication number | Publication date |
---|---|
JP5796574B2 (ja) | 2015-10-21 |
JPWO2011142327A1 (ja) | 2013-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5796574B2 (ja) | 情報処理装置、制御方法及びプログラム | |
KR102430649B1 (ko) | 익명화를 위해 속성들을 자동으로 식별하기 위한 컴퓨터 구현 시스템 및 방법 | |
US9619669B2 (en) | Systems and methods for anonosizing data | |
EP3063691B1 (en) | Dynamic de-identification and anonymity | |
US9361481B2 (en) | Systems and methods for contextualized data protection | |
US20150169895A1 (en) | Anonymization for data having a relational part and sequential part | |
US9087215B2 (en) | Dynamic de-identification and anonymity | |
US10176340B2 (en) | Abstracted graphs from social relationship graph | |
US20170277907A1 (en) | Abstracted Graphs from Social Relationship Graph | |
EP2793162A1 (en) | Anonymization device, anonymization method, and computer program | |
JP5782636B2 (ja) | 情報匿名化システム、情報損失判定方法、及び情報損失判定プログラム | |
EP3254226A1 (en) | Systems and methods for contextualized data protection | |
JP2016126579A (ja) | データ秘匿装置、データ秘匿プログラムおよびデータ秘匿方法 | |
KR101345574B1 (ko) | 원격통신 네트워크에서 공유 멀티미디어 오브젝트들에 관한 태그들의 관리 | |
JP6334915B2 (ja) | 匿名化システム | |
Yoose | Balancing privacy and strategic planning needs: A case study in de-identification of patron data | |
JP6127774B2 (ja) | 情報処理装置、及び、データ処理方法 | |
Pawar et al. | Prevalence of Cyberchondria among Outpatients with Metabolic Syndrome in a Tertiary Care Hospital in Southern India | |
Peng et al. | Differential attribute desensitization system for personal information protection | |
Scherf | Yes I agree*: Assessing the failure of privacy “Self-Management” and its regulatory reforms | |
JP6685118B2 (ja) | 個人情報保護・利用サーバ | |
JP5875535B2 (ja) | 匿名化装置、匿名化方法、プログラム | |
WO2014125557A1 (ja) | 計算機、データアクセスの管理方法及び記録媒体 | |
JP7226782B2 (ja) | 匿名化レベル判定装置、匿名化レベル判定方法およびプログラム | |
US9721013B2 (en) | Method and system for providing targeted searching and browsing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 11780584 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2012514791 Country of ref document: JP |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 11780584 Country of ref document: EP Kind code of ref document: A1 |