WO2023079818A1 - データ価値評価演算装置、データ流通システム - Google Patents
データ価値評価演算装置、データ流通システム Download PDFInfo
- Publication number
- WO2023079818A1 WO2023079818A1 PCT/JP2022/031895 JP2022031895W WO2023079818A1 WO 2023079818 A1 WO2023079818 A1 WO 2023079818A1 JP 2022031895 W JP2022031895 W JP 2022031895W WO 2023079818 A1 WO2023079818 A1 WO 2023079818A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- data
- distribution
- information
- value
- provider
- Prior art date
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 21
- 238000013441 quality evaluation Methods 0.000 claims abstract description 52
- 238000012790 confirmation Methods 0.000 claims description 44
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 32
- 238000003908 quality control method Methods 0.000 description 27
- 238000000034 method Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 21
- 238000012986 modification Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 4
- 238000012854 evaluation process Methods 0.000 description 4
- 238000013502 data validation Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011157 data evaluation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Definitions
- the present invention relates to a data value evaluation computing device and a data distribution system.
- Patent Document 1 discloses an information linkage platform system for mutually linking a plurality of organizations that respectively manage customer information including a plurality of items of customer information, wherein at least one item of information is shared between at least two organizations.
- the identification information management unit that manages the linking information that associates the organizations with each other, and when the item information of the customer is updated in any of the organizations, the organization and the customer a data update registration unit that records data update information indicating the item information; and a data update registration unit that indicates that the item information of the customer has been updated based on the data update information.
- a notification generator that notifies an organization associated with the organization.
- Patent Document 1 does not reflect the values of the data receiving side in data distribution.
- a data value evaluation computing device comprises a storage unit storing data quality standard information describing data value standards corresponding to each of a plurality of data users; and a data quality evaluation unit that evaluates the provided distribution data based on the data quality standard information.
- a data distribution system comprises a data provider computer that transmits distribution data to be evaluated and distributed; an arithmetic device for transmitting the distribution data, the arithmetic device comprising a storage unit storing data quality standard information describing data value standards corresponding to each of the plurality of data users; a data quality evaluation unit that evaluates based on the data quality standard information and sends the distribution data exceeding a predetermined standard to the data user corresponding to the data quality standard information.
- FIG. 10 is a diagram showing an example of a screen displayed on the data provider computer by the proposal function in modification 3; Configuration diagram of the data provider computer in the second embodiment Configuration diagram of the data user computer in the second embodiment
- FIG. 1 A first embodiment of an information distribution system will be described below with reference to FIGS. 1 to 14.
- FIG. 1 A first embodiment of an information distribution system will be described below with reference to FIGS. 1 to 14.
- FIG. 1 A first embodiment of an information distribution system will be described below with reference to FIGS. 1 to 14.
- FIG. 1 A first embodiment of an information distribution system will be described below with reference to FIGS. 1 to 14.
- FIG. 1 A first embodiment of an information distribution system will be described below with reference to FIGS. 1 to 14.
- FIG. 1 is a diagram showing an overview of data transactions in this embodiment.
- the four subjects appear.
- a plurality of each subject may exist.
- the four entities are the data sovereign 2, the data provider 4, the manager of the data trading market 3 (hereinafter also referred to as "market manager"), and the data user 5.
- market manager the manager of the data trading market 3
- these four subjects can be natural persons, voluntary bodies, and legal entities.
- each subject's processing described in the present embodiment may be executed manually by each subject, or may be executed automatically based on preset processing rules.
- a data sovereign 2 is a person who provides information about himself/herself to a third party.
- the information that the data sovereign 2 provides to a third party is called "distribution data".
- the data provider 4 is a person who acquires distribution data from the data sovereign 2 and provides the distribution data to the data user 5 .
- a market manager is a person who manages the data trading market 3 accessed by the data provider 4 and the data user 5 .
- a data user 5 is a person who uses distribution data.
- FIG. 1 Although only one subject is shown in FIG. 1 for the sake of simplicity, there may be multiple subjects.
- the circulation data is, for example, information on relocation of data sovereign 2, information on inheritance, and information on purchase of real estate.
- the types of distribution data distributed in the data trading market 3 are determined in advance by the market manager. In this embodiment, the type of distribution data is called "procedure classification".
- Data user 5 can, for example, use the distribution data to create quotations and contracts, update information held by himself, contact data sovereign 2, and provide services to data sovereign 2. can.
- the data provider 4 registers a standard data table describing outline information of distribution data to be provided (S1).
- the standard data table includes minimum data items and information on the newness and certainty of each data item. That is, the standard data table does not contain distribution data itself, so-called actual data.
- the data user 5 accesses the data trading market 3, browses the information registered by the data provider 4, and purchases the right to acquire any data (S2). At this time, there may be a plurality of data users 5 who purchase the right to acquire data.
- purchase is used here for the sake of convenience, it is not an essential requirement that the rights be paid, and the consideration for rights may be other than money. Also, since the actual data cannot be obtained at this stage, it can be said that it was purchased in advance.
- the distribution data of which data provider 4 has been purchased in advance for each data user 5 is recorded as a "purchase list".
- data provider 4 presents candidates for providing distribution data to data sovereign 2 (S3).
- the data provider 4 may present only the data users 5 who purchased the data acquisition right in S2, or may present all data users 5.
- the data sovereign 2 selects a provider candidate who is a candidate for providing distribution data from the presented data users 5 and informs the data provider 4 of the candidate.
- the data sovereign 2 selects a provider candidate from the presented candidates (S4), and further provides information on the data sovereign 2, that is, distribution data to the data provider 4 (S5).
- the data sovereign 2 permits the data provider 4 to provide the data to the data user 5 selected in the provision destination candidates.
- the data sovereign 2 may select the candidate for the provision destination and provide the distribution data at the same time, or may provide the distribution data on different days.
- the data provider 4 provides the distribution data to the data user 5 who purchased the data acquisition right information (S6).
- S6 data acquisition right information
- FIG. 2 is an overall configuration diagram of the information distribution system S according to the present invention.
- the information distribution system S includes a data sovereign computer 200 , a data quality control computer 300 , a data provider computer 400 and a data user computer 500 .
- the information distribution system S may include a plurality of each of the data sovereign computer 200, the data provider computer 400, and the data user computer 500.
- a plurality of data quality control computers 300 may be included.
- the data sovereign computer 200 is operated by the data sovereign 2 .
- Data quality control computer 300 is operated by a market manager.
- Data provider computer 400 is operated by data provider 4 .
- the data user computer 500 is operated by the data user 5 . Since the data quality control computer 300 evaluates the value of data as will be described later, it can also be called a "data value evaluation computing device".
- FIG. 3 is a configuration diagram of the data quality control computer 300.
- the data quality control computer 300 comprises a processor 3100 , a memory 3200 , a network interface 3300 , an IO device 3400 and a storage device 3500 .
- Processor 3100 is a central processing unit, and develops a program stored in storage device 3500 in memory 3200 and executes it.
- Memory 3200 is a semiconductor device that can be read and written at high speed.
- the network interface 3300 is a communication module such as a network interface card for communicating with other computers.
- the IO device 3400 is a user interface between the market manager and the data quality control computer 300, such as a keyboard, mouse and liquid crystal display.
- Storage device 3500 is a non-volatile information recording device. Information stored in the memory 3200 is read from the storage device 3500 when the data quality control computer 300 is activated.
- the memory 3200 contains a data quality standard creation program 3210, a data quality evaluation program 3220, a data quality definition table 3230, an important item table 3240, a data quality standard table 3250, a data quality evaluation value table 3260, and a purchase list. 3270 are stored.
- the purchase list 3270 is the one described in S2 of FIG. 1. In the purchase list 3270, which data provider 4's distribution data has been purchased in advance for each data user 5 is recorded. Details of other information stored in memory 3200 are provided below.
- Data quality definition table 3230 , important item table 3240 , and data quality criteria table 3250 may always be stored in storage device 3500 without being read into memory 3200 .
- the data quality standard creation program 3210 and the data quality evaluation program 3220 are described as separate programs for the sake of convenience, but they may be separate functions realized by the same program.
- the data quality standard creation program 3210 and the data quality evaluation program 3220 are implemented by means other than programs, such as FPGAs (Field Programmable Gate Arrays), which are rewritable logic circuits, and ASICs (Application Specific Integrated Circuits), which are application-specific integrated circuits. may be realized by Therefore, the data quality criteria creation program 3210 and the data quality evaluation program 3220 can also be called a "data quality criteria creation unit" and a "data quality evaluation unit", respectively.
- FIG. 4 is a configuration diagram of the data provider computer 400.
- the data provider computer 400 comprises a processor 4100 , a memory 4200 , a network interface 4300 , an IO device 4400 and a storage device 4500 .
- Processor 4100 is a central processing unit, and develops a program stored in storage device 4500 in memory 4200 and executes it.
- the memory 4200 is a semiconductor device capable of reading and writing at high speed.
- the network interface 4300 is a communication module such as a network interface card for communicating with other computers.
- IO device 4400 is a user interface between data provider 4 and data provider computer 400, such as a keyboard, mouse, and liquid crystal display.
- Storage device 4500 is a non-volatile information recording device. Information stored in the memory 4200 is read from the storage device 4500 when the data provider computer 400 is started.
- the memory 4200 stores a data provider program 4210 that assists the data provider 4 in entering information.
- data provider program 4210 creates data confirmation table 4220 based on data provider 4's operation to IO device 4400 .
- FIG. 5 is a configuration diagram of the data user computer 500.
- the data user computer 500 comprises a processor 5100 , a memory 5200 , a network interface 5300 , an IO device 5400 and a storage device 5500 .
- Processor 5100 is a central processing unit, and develops a program stored in storage device 5500 in memory 5200 and executes it.
- the memory 5200 is a semiconductor device capable of reading and writing at high speed.
- a network interface 5300 is a communication module, such as a network interface card, for communicating with other computers.
- IO device 5400 is a user interface between data user 5 and data user computer 500, such as a keyboard, mouse, and liquid crystal display.
- Storage device 5500 is a non-volatile information recording device.
- the memory 5200 stores a data user program 5210 that assists the data user 5 in entering information.
- the data user program 5210 purchases the right to acquire circulation data in the data trading market 3 (S2 in FIG. 1) based on the input operation to the IO device 5400 by the data user 5.
- FIG. 1 A data user program 5210 that assists the data user 5 in entering information.
- the data user program 5210 purchases the right to acquire circulation data in the data trading market 3 (S2 in FIG. 1) based on the input operation to the IO device 5400 by the data user 5.
- each of the data quality control computer 300, the data provider computer 400, and the data user computer 500 is described as if they were one hardware device, but each of them is plural. hardware device.
- Part or all of the programs and data stored in the storage devices 3500, 4500, 5500 of each computer may be stored in advance, or may be connected to the network interfaces 3300, 4300, 5300 via the network. or from a non-transitory storage medium connected to an interface (not shown), if necessary.
- FIG. 6 is a diagram showing an example of the data quality definition table 3230.
- FIG. Data quality definition table 3230 is created in advance by the market operator. However, the market operator may manually update the data quality definition table 3230 according to the actual situation of data trading, or may build a mechanism for automatically updating the data quality definition table 3230 by automatic processing.
- the data quality definition table 3230 is composed of a plurality of records, and each record includes recency 3232 which is the standard of recency and credibility 3233 which is the standard of credibility for each level 3231 . Note that the recency 3232 and the credibility 3233 are independent indexes, and are simply represented by one table for the sake of convenience. That is, the data quality definition table 3230 shows the correspondence between the level 3231 and recency 3232 and the correspondence between the level 3231 and credibility 3233 .
- the level 3231 is, for example, an integer of 1 or more, and in the present embodiment, the higher the numerical value, the more preferable.
- the recency 3232 indicates that the higher the level 3231 is, the newer the distribution data is.
- the level “1" of the recency 3232 is "no deadline", the level “2" is “within 3 months”, and the level “3” is “within 7 days”.
- the credibility 3233 indicates that the higher the level, the higher the credibility of the distribution data. For example, the level “1" of credibility 3233 is “oral”, the level “2” is “non-official document", and the level “3” is "official document, physical confirmation".
- FIG. 7 is a diagram showing an example of the important item table 3240.
- the key item table 3240 is created in advance by the market operator.
- the important item table 3240 consists of a plurality of records, and each record contains important items 3242 for each procedure classification 3241 .
- the procedure classification 3241 is information indicating the type of distribution data.
- the important item 3242 is an item of important information in the distribution data corresponding to the procedure classification 3241 . For example, when the procedure classification 3241 is "moving", the important item 3242 is "old address, new address”.
- FIG. 8 is a diagram showing an example of the data quality criteria table 3250.
- a data quality criteria table 3250A and a data quality criteria table 3250B are shown as two specific examples.
- Data quality standard table 3250 is created for each data user 5 by data quality standard creation program 3210 .
- Data quality criteria table 3250 is composed of one or more records, each record including data item 3251 , important item 3252 , recency 3253 , and credibility 3254 .
- a data item 3251 is information indicating the type of data, and is the same type of information as the important item 3242 in the important item table 3240 .
- the important item 3252 is information indicating the importance of the data item 3251 for the data user 5 corresponding to the data quality standard table 3250.
- the important item 3252 can have two values of "High” and “Low” or three values of "High”, “Middle” and “Low”.
- the important item 3252 may be settable with a value of 4 or more.
- the data quality criteria table 3250 is merely described as a "table" for the sake of convenience, and similar information may be stored in a format other than a table.
- a database may be used, stored in a text file in a predetermined format, or recorded as binary data. Therefore, the data quality standard table 3250 can also be called "data quality standard information”.
- FIG. 9 is a diagram showing an example of the data quality evaluation value table 3260.
- Data quality evaluation value table 3260 is created by data quality evaluation program 3220 for each cooperation destination candidate each time data quality control computer 300 receives distribution data and cooperation destination candidates from data provider computer 400 . That is, each data quality evaluation value table 3260 has corresponding distribution data, data provider 4, and data user 5.
- FIG. 9 is a diagram showing an example of the data quality evaluation value table 3260.
- Data quality evaluation value table 3260 is created by data quality evaluation program 3220 for each cooperation destination candidate each time data quality control computer 300 receives distribution data and cooperation destination candidates from data provider computer 400 . That is, each data quality evaluation value table 3260 has corresponding distribution data, data provider 4, and data user 5.
- the data quality evaluation value table 3260 consists of a plurality of records, and each record has data item 3261, important item 3262, exceeding standard 3263, accuracy 3264, and probability 3265.
- Data item 3261 indicates the type of distribution data, and is the same type of information as data item 3251 of data quality standard table 3250 .
- Specific items set in the data item 3261 are included in the distribution data that the data provider computer 400 transmits to the data quality control computer 300 .
- Critical items 3262 are similar to critical items 3252 in data quality criteria table 3250 .
- a specific value set in the important item 3262 is the value of the data quality standard table 3250 of the data user 5 corresponding to the data quality evaluation value table 3260 .
- the exceeding the standard 3263 is information indicating whether or not the distribution data corresponding to the data quality evaluation value table 3260 exceeds the standard of the data user 5 corresponding to the data quality evaluation value table 3260. Specifically, when the distribution data corresponding to the data quality evaluation value table 3260 satisfies both the recency 3253 and credibility 3254 in the data quality criteria table 3250 of the data user 5 corresponding to the data quality evaluation value table 3260 Only “YES” is set, and if one of them is not satisfied, "NO” is set. However, if the item is not set as an important item in the data quality criteria table 3250 , there is no criterion itself, so information indicating that no determination is made, for example, “ ⁇ ” is set in the exceeding criterion 4363 . Note that in the example shown in FIG. 8, when the important item 3252 is "Low", the criterion is not set because it does not correspond to the important item. .
- Accuracy 3264 quantifies the recency and credibility of data items in the same record of the corresponding distribution data. The newer the information and the higher the credibility, the higher the accuracy 3264 value is set. In the example of FIG. 10, the accuracy 3264 is represented by a positive number with a maximum value of "1.0", but the range of numerical values may be changed arbitrarily as long as the magnitude relationship is clear.
- the probability 3265 is a value obtained by multiplying the accuracy 3264 by a value indicating credibility of the data provider 4 . In this embodiment, a value indicating credibility is predetermined for each data provider 4 .
- the data provider 4 and the data user 5 are specified in the data quality evaluation value table 3260. The data provider 4 and data user 5 corresponding to each quality evaluation value table 3260 may be managed separately.
- FIG. 10 is a diagram showing an example of the data confirmation table 4220.
- FIG. Data confirmation table 4220 is created in data provider computer 400 for each distribution data.
- the data confirmation table 4220 consists of a plurality of records, each record including a data item 4221, a confirmation degree 4222, a confirmation item 4223, and a date/time 4224.
- Data item 4221 is the same type of information as data item 3251 in FIG. 7, and indicates the type of distribution data.
- the degree of confirmation 4222 is information indicating the degree of confirmation of information, and is at least one of two values of "High” and “Low”. good. For example, “High” indicates that some confirmation has been made, and “Low” indicates that no confirmation has been made. Also, for example, "Middle” indicates that the confirmation was not strict but simple.
- the confirmation item 4223 is the item used to confirm the information. For example, when information recorded in distribution data is confirmed using a resident card, which is an official document in which the address and name are recorded, it is described as a "resident card” and is verbally confirmed by the data sovereign 2. is described as “verbal”.
- the date and time 4224 is the creation date and time of the confirmation item 4223 . For example, if the confirmation item 4223 is a document such as a "certificate of residence", it is the date and time of issuance of the document.
- the data confirmation table 4220 may be created by a person who is the data provider 4, or part or all of the data confirmation table 4220 may be created by automatic processing.
- the data confirmation table 4220 is created by automatic processing, for example, the electronic signature of the document attached to the distribution data can be confirmed, or the distribution data can be confirmed by character recognition processing.
- FIG. 11 is a diagram showing an example of the standard data table 4230.
- FIG. Standard data table 4230 is prepared in advance for each data provider 4 .
- the standard data table 4230 is a table showing the minimum data items, minimum recency and credibility in distribution data transmitted by the data provider 4 .
- each data provider 4 collects more data than the data items listed in the standard data table 4230, and the recency 3253 and credibility 3254 are based on criteria higher than those specified in the standard data table 4230. collect.
- FIG. 12 is a flow chart showing definition table creation processing for creating the data quality standard table 3250 by the data quality standard creation program 3210 .
- the definition table creation processing described below is processing for a certain data user 5 , and the processing in FIG. 12 is repeated by the number of data users 5 .
- the data user 5 corresponding to the data quality standard table 3250 to be created from now on is referred to as "target data user 5".
- step S11 which is the first process in the definition table creation process, the data quality standard creation program 3210 acquires data items, procedure classifications, and related information for the target data user 5.
- the data quality standard creation program 3210 may directly or indirectly acquire information on each of data items, procedure classifications, and related information from the data user 5, or Information for each of the data items, procedure classifications, and related information may be extracted from the information.
- the data quality standard creation program 3210 may acquire the above information from the data user 5 as part of the registration work when the data user 5 participates in the data trading market 3 .
- the relevant information is information that indicates the freshness and credibility required in the information that the data user 5 acquires. be.
- step S12 the data quality standard creation program 3210 writes the data items acquired in step S11 in the data item 3251 column of the new data quality standard table 3250.
- step S12 is completed, only the data item 3251 is filled in the data quality criteria table 3250 being created, and the important item 3252, recency 3253, and credibility 3254 are blank.
- the data quality standard creation program 3210 assigns the important item label to the important item 3252 column of the data quality standard table 3250 based on the important item table 3240 and the procedure name acquired in step S11. For example, when the procedure name acquired in step S11 is "move", the process when the important item table 3240 is the example shown in FIG. 7 will be described. In this case, the procedure classification 3241 corresponds to "moving" and the important item 3242 is "old address, new address”. Only the record sets the important item 3252 to "High", and the other records set the important item 3252 to "Low”.
- the data quality standard creation program 3210 refers to the related information acquired in step S11 and the data quality definition table 3230, and stores the level in the recency 3253 and credibility 3254 of the data quality standard table 3250.
- the data quality definition table 3230 is as shown in FIG. 6, the procedure name obtained in step S11 is "moving", and the related information obtained in step S11 is "public document within 3 months",
- the recency 3232 is set to level "2" and the credibility 3233 is set to level "3".
- the level of recency 3232 and credibility 3233 may be directly specified in the related information acquired in step S11. The above is the processing of the data quality standard creation program 3210 in FIG.
- FIG. 13 is a flow chart showing evaluation processing in which the data quality evaluation program 3220 creates the data quality evaluation value table 3260.
- FIG. This flowchart is executed for each data user 5 included in the provision destination candidates for certain distribution data.
- step S21 which is the first process in the evaluation process, the data quality evaluation program 3220 converts the names of the data provider 4 who transmitted the distribution data to be evaluated and the data user 5 who is a candidate for receiving the distribution data into a data quality evaluation value. Described in table 3260.
- the data quality evaluation program 3220 describes all data items described in the standard data table 4230 of the data provider 4 in the data quality evaluation value table 3260.
- the data quality evaluation program 3220 refers to the data quality criteria table 3250 of the data user 5 and fills in the columns of important items in the data quality evaluation value table 3260.
- FIG. Specifically, the data quality evaluation program 3220 sets only data items whose important items are “High” in the data quality criteria table 3250 to “High” also in the data quality evaluation value table 3260 .
- the data quality evaluation program 3220 sets items whose important items are "Low” in the data quality criteria table 3250 and data items not listed in the data quality criteria table 3250 to "Low” in the data quality evaluation value table 3260.
- the data quality evaluation program 3220 targets records in which the important item is "High” in the data quality evaluation value table 3260, and only when both the recency and credibility satisfy the criteria, the data quality evaluation value table 3260 If the criteria are met, the exceeding criteria 3263 is set to "YES", and if the criteria are not met, "NO" is set. In this step, the data quality evaluation program 3220 refers to the data confirmation table 4220 corresponding to the distribution data to be processed and the data quality standard table 3250 of the data user 5 to be processed.
- the data quality evaluation program 3220 adds "-" indicating that there is no data in the exceeding standard column of the data quality evaluation value table 3260 for the record whose important item is "Low” in the data quality evaluation value table 3260. be described.
- the data quality evaluation program 3220 calculates accuracy and probability for each data item, records them in the data quality evaluation value table 3260, and ends the processing shown in FIG.
- steps S24 and S25 for convenience of explanation with the example shown in FIG. 8, it is assumed that the important item has a standard for "High” and no standard for “Low”, but it is not limited to this.
- the criteria may be set even if the important item is "Middle” or "Low".
- the process of comparing with the reference may be performed in the same manner as the process of step S24, and the process of FIG. 13 may be terminated without performing the subsequent process of step S25.
- FIG. 14 is a time chart showing data quality calculation in the information distribution system S. Specifically, the processing before and after the quality calculation processing by the data quality evaluation program 3220 is shown. In FIG. 14, time elapses from the upper portion of the drawing toward the lower portion of the drawing. Note that execution of the definition table creation process described with reference to FIG. 12 is completed before the process shown in FIG. 14 is executed.
- distribution data and provision destination candidates are transmitted from the data sovereign computer 200 to the data provider computer 400 (S31). This process corresponds to S4 and S5 in FIG.
- the data sovereign 2 may also transmit the electronic data of the confirmation item that backs up the distribution data to the data provider computer 400 together.
- the data provider computer 400 creates a data confirmation table 4220 using the received distribution data, and transmits it to the data quality control computer 300 together with the received distribution data and the supply destination candidates (S32). It is not essential for the data sovereign person 2 to use the data sovereign computer 200 for sending distribution data.
- the distribution data and provision destination candidates may be communicated to the data provider 4 orally or in writing, or the data sovereign 2 may operate the data provider computer 400 to input the distribution data and provision destination candidates. good too.
- the data quality control computer 300 evaluates the data quality evaluation program 3220 for each data user 5 associated with the data provider 4 who has transmitted the distribution data in the purchase list 3270 and is included in the supply destination candidates.
- An evaluation process for creating an evaluation value table 3260 is executed (S33). The details of the evaluation process are as described with reference to FIG.
- the data quality control computer 300 determines whether the level of the received data confirmation table 4220 satisfies the level of the data quality standard table 3250 for each candidate of the provision destination (S34). This judgment can be easily made by referring to the created data quality evaluation value table 3260 .
- the level of the data confirmation table 4220 satisfies the level of the data quality standard table 3250, and there is only one "NO” in the column exceeding the standard. , it can be determined that the level of the data confirmation table 4220 does not meet the level of the data quality standard table 3250.
- the data quality control computer 300 If the data quality control computer 300 makes an affirmative determination in S33, it transmits the distribution data and the data quality evaluation value table 3260 to the data user computer 500, and the data user computer 500 receives them (S36). If the data quality control computer 300 makes a negative determination in S33, the data provider computer 400 notifies the data provider computer 400 that the conditions are not met and the data cannot be sent to the provider, and the data provider computer 400 receives this. (S35). The above is the description of FIG.
- the data quality control computer 300 is provided by a memory 3200 storing a data quality standard table 3250 in which data value standards corresponding to each of a plurality of data users 5 are described, and by the data provider computer 400. and a data quality evaluation program 3220 that evaluates the distributed data based on the data quality criteria table 3250 . Therefore, the distribution data can be distributed while reflecting the values of the data user 5 who accepts the data. Specifically, the values of the data user 5 are reflected in the data quality criteria table 3250 , and based on this data quality criteria table 3250 , distribution data that meets predetermined criteria can be sent to the data user 5 .
- the data sovereign 2 who owns the distribution data selects a provider candidate from whom the distribution data can be obtained from among the plurality of data users 5 .
- the data quality evaluation program 3220 sends the distribution data to the data users 5 corresponding to the data quality standard information whose evaluation of the distribution data exceeds a predetermined standard and who is included in the provision destination candidates. Therefore, it is possible to reflect the intention of the data sovereign 2 in providing distribution data.
- the memory 3200 of the data quality control computer 300 stores in advance a purchase list 3270 showing one or more data users 5 corresponding to each data provider computer 400, and a data quality criteria table 3250.
- the data quality evaluation program 3220 is a data provider who is a data user 5 corresponding to the data quality standard table 3250 whose distribution data evaluation exceeds a predetermined standard, is included in the provision destination candidates, and has transmitted the distribution data.
- a combination of computer 400 and data user 5 sends distribution data to data user 5 indicated in purchase list 3270 .
- the value of the distribution data is higher than the threshold for the data user 5, the data sovereign 2 is the data user 5 who has agreed to the provision of the distribution data, and the distribution provided by the specific data provider 4 in advance Distribution data can be provided to the data user 5 whose desire for the data is described in the purchase list 3270 .
- Distribution data includes multiple data items.
- the data quality evaluation program 3220 evaluates the freshness of the information for each data item, the credibility of the information for each data item, and the confirmation of the data item by the data provider 4 who sent the distribution data. Accuracy is evaluated based on the degree, ie, confirmation degree 4222 .
- the data quality evaluation program 3220 calculates the probability by multiplying the accuracy by a value indicating the reliability of the data provider 4 who transmitted the distribution data for each data item.
- the data quality criteria table 3250 includes criteria for recency, which is the newness of information, for each data item, and criteria for credibility, which is the certainty of information, for each data item.
- FIG. 15 is a diagram showing an example of a data content confirmation screen generated by the data provider computer 400 in Modification 1.
- the data provider computer 400 may display the display shown in FIG.
- a generated data confirmation table 4220 is displayed in the center of the screen, and a button for selecting whether or not to transmit is displayed in the lower right of the screen.
- the generated data confirmation table 4220 is sent to the data quality control computer 300 together with the distribution data.
- the data quality evaluation program 3220 may calculate the original data value of distribution data and the relative data value for each data user 5 .
- the original data value is calculated using the probability 3265 of all data items in the data quality evaluation value table 3260 .
- the original data value is the sum or average of the probability 3265 values of all data items.
- the relative data value is obtained by weighting the values of the probability 3265 of all data items in the data quality evaluation value table 3260 by the important items for the data user 5 .
- the relative data value is the sum or average of only the data items whose important item 3262 is “High” among the values of the probability 3265 in the data quality evaluation value table 3260 .
- the important item 3262 is the product of the probability value of the data item "High” and 1.0, the product of the probability value of the data item "Middle” and 0.5, and "Low". It may be the sum of the product of the probability value of the data item and 0.3. In other words, it is sufficient if the higher importance influences the value more.
- the data quality evaluation program 3220 may transmit the relative data value and the original data value together with the distribution data, or transmit at least one of the relative data value and the original data value prior to the distribution data, and the data user
- the distribution data may be transmitted according to the response from computer 500 . That is, in this modified example, even if the distribution data is transmitted in the first embodiment, the distribution data may not be transmitted according to the response from the data user computer 500. In the embodiment, even if the distribution data is not transmitted, the distribution data may be transmitted according to the response from the data user computer 500 .
- FIG. 16 is a diagram showing an example of a receipt confirmation screen displayed on the data user's computer 500 in Modification 2.
- FIG. 16 a relative data value, original data value, and data quality evaluation value table 3260 is displayed on the IO device 5400 of the data user computer 500.
- FIG. Furthermore, a button for selecting whether or not to accept is displayed at the lower right of the receipt confirmation screen. In this case, when the data user 5 selects “Yes” using the IO device 5400 , the distribution data corresponding to the displayed data quality evaluation value table 3260 is transmitted to the data user computer 500 .
- the data user program 5210 may read the numerical value and determine whether or not distribution data is necessary based on preset criteria. In this case, it is not essential that the information shown in FIG. 16 is displayed on the screen;
- the data quality evaluation program 3220 calculates the relative data value for each data item using the value obtained by weighting the probability value according to the importance of the data item included in the data quality standard information. Therefore, it is possible to calculate the relative data value in which the distribution data is evaluated based on the values of the data user 5 .
- the data provider 4 may present the data sovereign 2 with the provision destination candidates reflected by the information in the purchase list 3270 . That is, the data provider 4 may present only the data users 5 who have purchased the distribution data provided by the data provider 4 . In this case, there is no need to check the purchase list 3270 again in the data quality control computer 300, and the processing in S33 of FIG. 14 is simplified.
- Modification 4 In the first embodiment described above, only the data users 5 selected by the data sovereign person 2 are provided with the distribution data owned by the data sovereign person 2 . However, the distribution data of the data sovereign 2 may be provided to the data user 5 without confirming the intention of the data sovereign 2 .
- the data quality control computer 300 may further have a proposal function for suggesting addition or correction of distribution data.
- This suggestion function compares each data quality criteria table 3250 with the data validation table 4220 . Then, how the data confirmation table 4220 is corrected, how many new standards set by the data quality standard table 3250 are exceeded is calculated and output to the data provider computer 400 . For example, for each data quality criteria table 3250 where the data validation table 4220 currently does not meet the criteria, this feature lists the changes in the data validation table 4220 that are required to meet the criteria. Then, 1 or more is output in descending order of the number of overlaps of necessary changes.
- FIG. 17 is a diagram showing an example of a screen displayed on the data provider computer 400 by the proposal function.
- FIG. 17 shows that there are "10" data users 5 who satisfy the conditions by changing the confirmation item of the data item "address” to a "resident card” issued "within three months". there is
- FIG. 18 A second embodiment of the information distribution system will be described with reference to FIGS. 18 and 19.
- FIG. 18 the same components as those in the first embodiment are assigned the same reference numerals, and differences are mainly described. Points that are not particularly described are the same as those in the first embodiment.
- This embodiment differs from the first embodiment mainly in that the functions and information that the data quality control computer had are installed in the data provider computer 400 and the data user computer 500 .
- FIG. 18 is a configuration diagram of the data provider computer 400A in the second embodiment.
- the memory 4200A stores a data quality evaluation program 3220, a data quality definition table 3230, an important item table 3240, a data quality criteria table 3250, a data quality evaluation value table 3260, and a purchase list. 3270 is further stored.
- the data quality standard table 3250 is indicated by broken lines in FIG. 17 because it is received from the data user computer 500A and stored.
- FIG. 19 is a configuration diagram of the data user computer 500A in the second embodiment.
- the memory 5200A further includes a data quality standard creation program 3210, a data quality definition table 3230, an important item table 3240, a data quality standard table 3250, and a data quality evaluation value table 3260. It is the point that is stored.
- the data quality evaluation value table 3260 is indicated by broken lines in FIG. 18 because it is received from the data provider computer 400A and stored.
- the information distribution system S in this embodiment does not include the data quality control computer 300 .
- the functions provided by the data quality control computer 300 in the first embodiment are distributed to the data provider computer 400A and the data user computer 500A. Therefore, the processing contents are generally the same as those in the first embodiment, but the information transmission timing and destination are different. Specifically, it is as follows.
- the data user computer 500A creates the data quality standard table 3250 by itself and transmits it to the data provider computer 400A.
- Data provider computer 400A executes the processes of S33 and S34 in FIG. 14, and if the determination is affirmative, transmits distribution data and data quality evaluation value table 3260 to target data user computer 500A.
- the data quality control computer 300 is unnecessary, and the data provider 4 and the data user 5 can directly exchange information.
- the configuration of the functional blocks is merely an example. Some functional configurations shown as separate functional blocks may be configured integrally, or a configuration represented by one functional block diagram may be divided into two or more functions. Further, a configuration may be adopted in which part of the functions of each functional block is provided in another functional block.
- each computing device or computer may have an input/output interface, and a program may be read from another device via a medium that can use this input/output interface.
- the medium refers to, for example, a storage medium that can be attached to and detached from an input/output interface, or a communication medium, that is, a wired, wireless, or optical network, or a carrier wave or digital signal that propagates through the network.
- part or all of the functions realized by the program may be realized by a hardware circuit or FPGA.
- Data sovereign Data trading market 4
- Data provider 5
- Data sovereign computer 300
- Data quality control computer 400 400A
- Data provider computer 500
- 500A Data user computer 3200
- Memory 3210
- Data quality standard creation program 3220
- Data quality evaluation program 3230
- Data quality definition table 3240
- Important item table 3250
- Data quality standard table 3260
- Data quality evaluation value table 3270 Purchase list 4220
- Data confirmation table 4230 Standard data table
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
データ価値評価演算装置は、複数のデータ利用者のそれぞれに対応するデータ価値の基準が記されたデータ品質基準情報が格納される記憶部と、データ提供者計算機から提供される流通データをデータ品質基準情報に基づき評価するデータ品質評価部と、を備える。
Description
本発明は、データ価値評価演算装置、およびデータ流通システムに関する。
センサを使って収集した気象データなどは古くからやり取りされているが、近年は個人に関する情報を流通させる試みが始まっている。特許文献1には、顧客に関する複数の項目情報を含む顧客情報をそれぞれに管理する複数の組織を相互に連携させるための情報連携基盤システムであって、少なくとも1つの項目情報を少なくとも2つの組織間で連携させる顧客および当該項目情報について、当該組織同士を関連付ける紐付情報を管理する識別情報管理部と、前記組織のいずれかにおいて前記顧客の前記項目情報が更新されると、当該組織と当該顧客と当該項目情報とを示すデータ更新情報を記録するデータ更新登録部と、前記データ更新情報に基づいて、前記顧客の前記項目情報が更新された旨を、前記紐付情報において前記項目情報の更新された組織に関連付けられた組織へ通知する通知生成部と、を有する連携基盤システムが開示されている。
特許文献1に記載されている発明では、データの流通においてデータを受領する側の価値観が反映されていない。
本発明の第1の態様によるデータ価値評価演算装置は、複数のデータ利用者のそれぞれに対応するデータ価値の基準が記されたデータ品質基準情報が格納される記憶部と、データ提供者計算機から提供される流通データを前記データ品質基準情報に基づき評価するデータ品質評価部と、を備える。
本発明の第2の態様によるデータ流通システムは、評価及び流通の対象となる流通データを送信するデータ提供者計算機と、前記流通データを評価して評価結果に基づき1または複数のデータ利用者に前記流通データを送信する演算装置と、を備え、前記演算装置は、複数の前記データ利用者のそれぞれに対応するデータ価値の基準が記されたデータ品質基準情報が格納される記憶部と、前記データ品質基準情報に基づき評価して所定の基準を超えた前記流通データを、当該データ品質基準情報に対応する前記データ利用者に送付するデータ品質評価部と、を備える。
本発明の第2の態様によるデータ流通システムは、評価及び流通の対象となる流通データを送信するデータ提供者計算機と、前記流通データを評価して評価結果に基づき1または複数のデータ利用者に前記流通データを送信する演算装置と、を備え、前記演算装置は、複数の前記データ利用者のそれぞれに対応するデータ価値の基準が記されたデータ品質基準情報が格納される記憶部と、前記データ品質基準情報に基づき評価して所定の基準を超えた前記流通データを、当該データ品質基準情報に対応する前記データ利用者に送付するデータ品質評価部と、を備える。
本発明によれば、データを受容する側の価値観を反映してデータを流通させることができる。
―第1の実施の形態―
以下、図1~図14を参照して、情報流通システムの第1の実施の形態を説明する。
以下、図1~図14を参照して、情報流通システムの第1の実施の形態を説明する。
図1は、本実施の形態におけるデータ取引の概要を示す図である。本実施の形態では、以下に説明する4つの主体が登場する。各主体は複数存在してもよい。4つの主体とは、データ主権者2、データ提供者4、データ取引市場3の管理者(以下、「市場管理者」とも呼ぶ)、およびデータ利用者5である。ただしこれら4つの主体は自然人、任意団体、および法人のいずれでもよい。また本実施の形態において説明する各主体の処理は、各主体が手動操作により実行してもよいし、あらかじめ設定した処理ルールに基づき自動処理により実行してもよい。
データ主権者2とは、自身に関する情報を第三者に提供する者である。本実施の形態では、データ主権者2が第三者に提供する情報を「流通データ」と呼ぶ。データ提供者4とは、データ主権者2から流通データを取得し、データ利用者5に流通データを提供する者である。市場管理者とは、データ提供者4およびデータ利用者5がアクセスするデータ取引市場3を管理する者である。データ利用者5とは、流通データを利用する者である。
なお図1では説明を簡便にするために各主体を1つのみ記載しているが、各主体が複数存在してもよい。特に、データ主権者2、データ提供者4、およびデータ利用者5は複数存在することが想定される。流通データはたとえば、データ主権者2の転居に関する情報、相続に関する情報、および不動産の購入に関する情報である。データ取引市場3において流通する流通データは、あらかじめ市場管理者が流通データの種類を定めている。本実施の形態では、流通データの種類を「手続き分類」と呼ぶ。データ利用者5はたとえば、流通データを用いて見積書や契約書の作成、自己が保有する情報の更新、データ主権者2への連絡、データ主権者2へのサービスの提供などを行うことができる。
本実施の形態におけるデータ取引では、まずデータ提供者4が提供予定の流通データの概要情報を記した標準データテーブルを登録する(S1)。標準データテーブルには、最低限含まれるデータ項目と、各データ項目の新しさや確からしさの情報が含まれる。すなわち標準データテーブルには流通データそのもの、いわゆる実データは含まれていない。
次にデータ利用者5がデータ取引市場3にアクセスしてデータ提供者4により登録された情報を閲覧し、いずれかのデータ取得の権利を購入する(S2)。このとき、データ取得の権利を購入するデータ利用者5が複数存在してもよい。なお、ここでは便宜的に「購入」と表現しているが、有償であることは必須の要件ではないし、権利の対価が金銭以外であってもよい。また、この段階では実際のデータは取得できないので、事前に購入したとも言える。データ取引市場3にはデータ利用者5ごとにどのデータ提供者4の流通データを予め購入したかが「購入リスト」として記録される。
次にデータ提供者4は、データ主権者2に対して流通データを提供する候補を提示する(S3)。このときデータ提供者4は、S2においてデータ取得の権利を購入したデータ利用者5に限定して提示してもよいし、全てのデータ利用者5を提示してもよい。次にデータ主権者2は、提示されたデータ利用者5の中から流通データを提供する候補である提供先候補を選択してデータ提供者4に伝える。
データ主権者2は、提示された候補から提供先候補を選択し(S4)、さらにデータ主権者2に関する情報、すなわち流通データをデータ提供者4に提供する(S5)。データ主権者2は、データ提供者4に対して、提供先候補にて選択したデータ利用者5に対してデータを提供することを許可する許諾を行う。データ主権者2は、提供先候補の選択と流通データの提供を同時に行ってもよいし、流通データの提供は異なる日に行ってもよい。次にデータ提供者4は、データ取得権利情報を購入したデータ利用者5に対して流通データを提供する(S6)。以上が本実施の形態におけるデータ取引の概要説明である。
図2は、本発明に係る情報流通システムSの全体構成図である。情報流通システムSは、データ主権者計算機200と、データ品質管理計算機300と、データ提供者計算機400と、データ利用者計算機500とを含む。情報流通システムSには、データ主権者計算機200、データ提供者計算機400、およびデータ利用者計算機500のそれぞれが複数含まれてもよく、データ流通市場が複数存在する場合には情報流通システムSにデータ品質管理計算機300が複数含まれてもよい。データ主権者計算機200は、データ主権者2により操作される。データ品質管理計算機300は、市場管理者により操作される。データ提供者計算機400はデータ提供者4により操作される。データ利用者計算機500は、データ利用者5により操作される。なおデータ品質管理計算機300は、後述するようにデータの価値を評価するので、「データ価値評価演算装置」とも呼べる。
図3は、データ品質管理計算機300の構成図である。データ品質管理計算機300は、プロセッサ3100と、メモリ3200と、ネットワークインタフェース3300と、IOデバイス3400と、記憶装置3500とを備える。プロセッサ3100は中央演算装置であり、記憶装置3500に格納されたプログラムをメモリ3200に展開して実行する。メモリ3200は高速に読み書き可能な半導体デバイスである。ネットワークインタフェース3300は、他の計算機との通信を行う通信モジュール、たとえばネットワークインタフェースカードである。IOデバイス3400は、市場管理者とデータ品質管理計算機300とのユーザインタフェースであり、たとえばキーボード、マウス、液晶ディスプレイなどである。記憶装置3500は、不揮発性の情報記録装置である。メモリ3200に格納される情報はデータ品質管理計算機300の起動時に記憶装置3500から読み出される。
メモリ3200には、データ品質基準作成プログラム3210と、データ品質評価プログラム3220と、データ品質定義テーブル3230と、重要項目テーブル3240と、データ品質基準テーブル3250と、データ品質評価値テーブル3260と、購入リスト3270とが格納される。購入リスト3270は図1のS2において説明したものであり、購入リスト3270にはデータ利用者5ごとにどのデータ提供者4の流通データを予め購入したかが記録される。メモリ3200に格納される他の情報の詳細は後述する。なお、データ品質定義テーブル3230、重要項目テーブル3240、およびデータ品質基準テーブル3250は、メモリ3200に読み込まれることなく常に記憶装置3500に格納されてもよい。
データ品質基準作成プログラム3210およびデータ品質評価プログラム3220は、便宜的に個別のプログラムとして記載しているが、両者が同一のプログラムによって実現される個別の機能であってもよい。また、データ品質基準作成プログラム3210およびデータ品質評価プログラム3220がプログラム以外の手段、たとえば書き換え可能な論理回路であるFPGA(Field Programmable Gate Array)や特定用途向け集積回路であるASIC(Application Specific Integrated Circuit)により実現されてもよい。そのため、データ品質基準作成プログラム3210およびデータ品質評価プログラム3220のそれぞれは、「データ品質基準作成部」および「データ品質評価部」と呼ぶこともできる。
図4は、データ提供者計算機400の構成図である。データ提供者計算機400は、プロセッサ4100と、メモリ4200と、ネットワークインタフェース4300と、IOデバイス4400と、記憶装置4500とを備える。プロセッサ4100は中央演算装置であり、記憶装置4500に格納されたプログラムをメモリ4200に展開して実行する。メモリ4200は高速に読み書き可能な半導体デバイスである。ネットワークインタフェース4300は、他の計算機との通信を行う通信モジュール、たとえばネットワークインタフェースカードである。IOデバイス4400は、データ提供者4とデータ提供者計算機400とのユーザインタフェースであり、たとえばキーボード、マウス、液晶ディスプレイなどである。記憶装置4500は、不揮発性の情報記録装置である。メモリ4200に格納される情報はデータ提供者計算機400の起動時に記憶装置4500から読み出される。
メモリ4200には、データ提供者4による情報の入力を補助するデータ提供者プログラム4210が格納される。たとえばデータ提供者プログラム4210は、データ提供者4によるIOデバイス4400への操作に基づきデータ確認テーブル4220を作成する。
図5は、データ利用者計算機500の構成図である。データ利用者計算機500は、プロセッサ5100と、メモリ5200と、ネットワークインタフェース5300と、IOデバイス5400と、記憶装置5500とを備える。プロセッサ5100は中央演算装置であり、記憶装置5500に格納されたプログラムをメモリ5200に展開して実行する。メモリ5200は高速に読み書き可能な半導体デバイスである。ネットワークインタフェース5300は、他の計算機との通信を行う通信モジュール、たとえばネットワークインタフェースカードである。IOデバイス5400は、データ利用者5とデータ利用者計算機500とのユーザインタフェースであり、たとえばキーボード、マウス、液晶ディスプレイなどである。記憶装置5500は、不揮発性の情報記録装置である。
メモリ5200には、データ利用者5による情報の入力を補助するデータ利用者プログラム5210が格納される。データ利用者プログラム5210は、データ利用者5によるIOデバイス5400への入力操作に基づき、データ取引市場3における流通データを取得する権利の購入(図1のS2)などを行う。
なお図3~図5では、データ品質管理計算機300、データ提供者計算機400、およびデータ利用者計算機500のそれぞれを1台のハードウエア装置であるかのように記載しているが、それぞれが複数のハードウエア装置から構成されてもよい。
また、各計算機の記憶装置3500、4500、5500に格納されているプログラムやデータの一部または全ては、予め格納されていてもよいし、ネットワークを介してネットワークインタフェース3300、4300、5300に接続される他の装置の非一時的記憶装置から、または、図示していないインタフェースに接続される非一時的な記憶媒体から、必要に応じて格納されてもよい。
図6は、データ品質定義テーブル3230の一例を示す図である。データ品質定義テーブル3230は、市場運用者によりあらかじめ作成される。ただし市場運用者は、データ取引の実情にあわせてデータ品質定義テーブル3230を手動で更新してもよいし、自動処理によりデータ品質定義テーブル3230を自動で更新する仕組みを構築してもよい。データ品質定義テーブル3230は複数のレコードから構成され、各レコードはレベル3231ごとに最新性の基準である最新性3232、および信憑性の基準である信憑性3233を含む。なお、最新性3232と信憑性3233は独立した指標であり、便宜的に1つのテーブルで表しているにすぎない。すなわちデータ品質定義テーブル3230は、レベル3231と最新性3232との対応、およびレベル3231と信憑性3233との対応を示している。
レベル3231はたとえば1以上の整数であり、本実施の形態では数値が高いほど好ましいことを示す。最新性3232は、レベル3231が高いほど流通データが新しいことを示す。最新性3232のレベル「1」は「期限なし」であり、レベル「2」は「3か月以内」、レベル「3」は「7日以内」である。信憑性3233は、レベルが高いほど流通データの信憑性が高いことを示す。たとえば信憑性3233のレベル「1」は「口頭」、レベル「2」は「非公的文書」、レベル「3」は「公的文書、現物確認」である。
図7は、重要項目テーブル3240の一例を示す図である。重要項目テーブル3240は、市場運用者によりあらかじめ作成される。重要項目テーブル3240は複数のレコードから構成され、各レコードは手続き分類3241ごとの重要項目3242を含む。手続き分類3241は、流通データの種類を示す情報である。重要項目3242は、手続き分類3241に該当する流通データにおいて重要な情報の項目である。たとえば手続き分類3241が「引っ越し」の場合の重要項目3242は「旧住所、新住所」である。
図8は、データ品質基準テーブル3250の例を示す図であり、ここでは2つの具体例としてデータ品質基準テーブル3250Aとデータ品質基準テーブル3250Bを示している。データ品質基準テーブル3250は、データ品質基準作成プログラム3210によりデータ利用者5ごとに作成される。データ品質基準テーブル3250は1以上のレコードにより構成され、各レコードはデータ項目3251、重要項目3252、最新性3253、および信憑性3254を含む。データ項目3251はデータの種類を示す情報であり、重要項目テーブル3240における重要項目3242と同種の情報である。
重要項目3252は、そのデータ品質基準テーブル3250に対応するデータ利用者5におけるデータ項目3251の重要性を示す情報である。たとえば重要項目3252は、「High」と「Low」の2値、または「High」、「Middle」、「Low」の3値を設定可能である。ただし重要項目3252は、4以上の値を設定可能としてもよい。
なお、データ品質基準テーブル3250は便宜的に「テーブル」として説明しているにすぎず、テーブル以外の形式で同様の情報が格納されてもよい。たとえばデータベースを用いてもよいし、あらかじめ定めた書式でテキストファイルに格納してもよいし、バイナリデータとして記録されてもよい。そのためデータ品質基準テーブル3250は、「データ品質基準情報」と呼ぶこともできる。
図9は、データ品質評価値テーブル3260の一例を示す図である。データ品質評価値テーブル3260は、データ品質管理計算機300が流通データおよび連携先候補をデータ提供者計算機400から受信するたびにデータ品質評価プログラム3220が連携先候補ごとに作成する。すなわちそれぞれのデータ品質評価値テーブル3260は、対応する流通データ、データ提供者4、およびデータ利用者5が存在する。
データ品質評価値テーブル3260は複数のレコードから構成され、各レコードはデータ項目3261、重要項目3262、基準超え3263、正確性3264、および蓋然性3265を有する。データ項目3261は、流通データの種類を示すものであり、データ品質基準テーブル3250のデータ項目3251と同種の情報である。データ項目3261に設定される具体的な項目は、データ提供者計算機400がデータ品質管理計算機300に送信する流通データに含まれるものである。重要項目3262はデータ品質基準テーブル3250における重要項目3252と同種である。重要項目3262に設定される具体的な値は、そのデータ品質評価値テーブル3260に対応するデータ利用者5のデータ品質基準テーブル3250の値である。
基準超え3263は、データ品質評価値テーブル3260に対応する流通データが、データ品質評価値テーブル3260に対応するデータ利用者5の基準を超えるか否かを示す情報である。具体的には、データ品質評価値テーブル3260に対応する流通データが、データ品質評価値テーブル3260に対応するデータ利用者5のデータ品質基準テーブル3250における最新性3253および信憑性3254の両方を満たす場合のみ「YES」が設定され、一方でも満たさない場合には「NO」が設定される。ただし、データ品質基準テーブル3250において重要項目に設定されていない場合は基準自体が存在しないので、判断しないことを示す情報、たとえば「-」が基準超え4363に設定される。なお図8に示す例では重要項目3252が「Low」の場合、重要項目に該当しないとして基準を設定していないが、これに限定せず「Low」であっても基準を設定してもよい。
正確性3264は、対応する流通データの同一レコードにおけるデータ項目について、最新性および信憑性を数値化したものである。情報が新しく、信憑性が高いほど正確性3264の値が大きく設定される。なお図10の例では正確性3264は最大値を「1.0」とする正の数で表現しているが、大小関係が明確であれば数値の範囲は任意に変更してよい。蓋然性3265は、正確性3264にデータ提供者4の信憑性を示す値を乗じた値である。本実施の形態では、データ提供者4ごとに信憑性を示す値があらかじめ定められている。なお図9に示す例ではデータ品質評価値テーブル3260にデータ提供者4およびデータ利用者5を明示しているが、データ品質評価値テーブル3260にこれらの情報が含まれることは必須ではなく、データ品質評価値テーブル3260ごとに対応するデータ提供者4およびデータ利用者5が別途管理されてもよい。
図10は、データ確認テーブル4220の一例を示す図である。データ確認テーブル4220は、流通データごとにデータ提供者計算機400において作成される。データ確認テーブル4220は複数のレコードから構成され、各レコードはデータ項目4221、確認程度4222、確認物4223、および日時4224を含む。データ項目4221は図7のデータ項目3251と同種の情報であり、流通データの種類を示す。
確認程度4222は、情報の確認の程度を示す情報であり、少なくとも「High」と「Low」の2値のいずれかであるが、「Middle」を加えた3値以上のいずれかであってもよい。たとえば「High」は何らかの確認をしたことを示し、「Low」は確認していないことを示す。またたとえば、「Middle」は厳密ではなく簡易に確認したことを示す。
確認物4223は、情報の確認に使用した物である。たとえば流通データに記載された情報を、住所や氏名が記載された公的文書である住民票を用いて確認し場合には「住民票」と記載され、口頭でデータ主権者2に確認した場合には「口頭」と記載される。日時4224は、確認物4223の生成日時である。たとえば確認物4223が「住民票」などの書類の場合には書類の発行日時であり、確認物4223が「口頭」の場合には口頭で確認した日時である。
なお、確認物4223および日時4224の存在は、何らかの確認をしたことが前提となる。そのため、確認をしていない場合、すなわち確認程度4222が「Low」の場合には確認物4223および日時4224は空欄、または情報が存在しないことを示す記号が記載される。データ確認テーブル4220は、データ提供者4である人間が作成してもよいし、データ確認テーブル4220の一部またはすべてを自動処理により作成してもよい。データ確認テーブル4220を自動処理により作成する場合は、たとえば流通データに添付された書類の電子署名を確認することや、文字認識処理により流通データを確認できる。
図11は、標準データテーブル4230の一例を示す図である。標準データテーブル4230は、データ提供者4ごとに予め用意される。標準データテーブル4230は、データ提供者4が送信する流通データにおける最小のデータ項目、および最低限の最新性および信憑性を示すテーブルである。換言するとそれぞれのデータ提供者4は、標準データテーブル4230において記載されているデータ項目以上のデータを収集し、最新性3253および信憑性3254は標準データテーブル4230に規定されているもの以上の基準で収集する。
図12は、データ品質基準作成プログラム3210がデータ品質基準テーブル3250を作成する定義テーブル作成処理を示すフローチャートである。以下に説明する定義テーブル作成処理は、あるデータ利用者5を対象とする処理であり、データ利用者5の人数だけ図12の処理が繰り返される。なお図12の説明では、これから作成するデータ品質基準テーブル3250に対応するデータ利用者5を「対象データ利用者5」と呼ぶ。
定義テーブル作成処理における最初の処理であるステップS11ではデータ品質基準作成プログラム3210は、対象データ利用者5に対するデータ項目、手続き分類、および関連情報を取得する。
データ品質基準作成プログラム3210は、データ利用者5からデータ項目、手続き分類、および関連情報のそれぞれの情報を直接的、または間接的に取得してもよいし、データ利用者5が事前に入力した情報からデータ項目、手続き分類、および関連情報のそれぞれの情報を抽出してもよい。たとえばデータ利用者5がデータ取引市場3に参加する際の登録作業の一環として、データ品質基準作成プログラム3210がデータ利用者5から前述の情報を取得してもよい。なお関連情報とは、データ利用者5が取得する情報において必要とする最新性や信憑性を示す情報であり、具体的にはデータ主権者2が提出する書類の種類や情報の鮮度の情報である。
続くステップS12ではデータ品質基準作成プログラム3210は、ステップS11において取得したデータ項目を新たなデータ品質基準テーブル3250のデータ項目3251の欄に記載する。ステップS12が完了した時点では、作成しているデータ品質基準テーブル3250はデータ項目3251のみが埋まっており、重要項目3252、最新性3253、および信憑性3254は空欄である。
続くステップS13ではデータ品質基準作成プログラム3210は、重要項目テーブル3240とステップS11において取得した手続き名に基づき、データ品質基準テーブル3250の重要項目3252の欄に重要項目のラベルを付与する。たとえばステップS11において取得した手続き名が「引っ越し」の場合に、重要項目テーブル3240が図7に示す例であった場合の処理を説明する。この場合には、手続き分類3241が「引っ越し」に対応する重要項目3242が「旧住所、新住所」なので、データ品質基準作成プログラム3210はデータ項目3251が「旧住所」と「新住所」であるレコードのみ重要項目3252を「High」に設定し、他のレコードは重要項目3252を「Low」に設定する。
続くステップS14ではデータ品質基準作成プログラム3210は、ステップS11において取得した関連情報とデータ品質定義テーブル3230を参照して、データ品質基準テーブル3250の最新性3253と信憑性3254にレベルを格納する。たとえばデータ品質定義テーブル3230が図6に示すものであり、ステップS11において取得した手続き名が「引っ越し」、ステップS11において取得した関連情報が「3か月以内の公的文書」の場合には、最新性3232がレベル「2」、信憑性3233がレベル「3」に設定される。ただし、ステップS11において取得する関連情報において最新性3232および信憑性3233のレベルが直接指定されてもよい。以上が図12におけるデータ品質基準作成プログラム3210の処理である。
図13は、データ品質評価プログラム3220がデータ品質評価値テーブル3260を作成する評価処理を示すフローチャートである。本フローチャートは、ある流通データについて提供先候補に含まれるデータ利用者5ごとに実行される。評価処理における最初の処理であるステップS21ではデータ品質評価プログラム3220は、評価対象の流通データを送信したデータ提供者4と、流通データを受け取る候補となるデータ利用者5の名称をデータ品質評価値テーブル3260に記載する。
続くステップS22ではデータ品質評価プログラム3220は、データ提供者4の標準データテーブル4230に記載されている全てのデータ項目をデータ品質評価値テーブル3260に記載する。続くステップS23ではデータ品質評価プログラム3220は、データ利用者5のデータ品質基準テーブル3250を参照してデータ品質評価値テーブル3260の重要項目の欄を埋める。具体的にはデータ品質評価プログラム3220は、データ品質基準テーブル3250において重要項目が「High」のデータ項目のみデータ品質評価値テーブル3260でも「High」に設定する。またデータ品質評価プログラム3220は、データ品質基準テーブル3250において重要項目が「Low」の項目、およびデータ品質基準テーブル3250に記載されていないデータ項目はデータ品質評価値テーブル3260において「Low」に設定する。
続くステップS24ではデータ品質評価プログラム3220は、データ品質評価値テーブル3260において重要項目が「High」のレコードを対象として、最新性と信憑性の両方が基準を満たす場合のみデータ品質評価値テーブル3260の基準を満たす場合に基準超え3263に「YES」を設定し、基準を満たさない場合に「NO」を設定する。本ステップではデータ品質評価プログラム3220は、処理対象の流通データに対応するデータ確認テーブル4220、および対象となるデータ利用者5のデータ品質基準テーブル3250を参照する。
続くステップS25ではデータ品質評価プログラム3220は、データ品質評価値テーブル3260において重要項目が「Low」のレコードについて、データ品質評価値テーブル3260の基準超えの欄にデータが存在しないことを示す「-」を記載する。続くステップS26ではデータ品質評価プログラム3220は、データ項目ごとに正確性と蓋然性を算出してデータ品質評価値テーブル3260に記録し、図13に示す処理を終了する。
なお、ステップS24とS25では図8に示す例との説明の便宜上、重要項目が「High」に基準があり「Low」に基準がないとしているが、これに限定しない。たとえば重要項目が「Middle」や「Low」であっても基準が設定されてもよい。このように「Low」に基準が設定されている場合、ステップS24の処理同様に基準との比較する処理を行い、続くステップS25の処理は行わずに図13の処理を終了してもよい。
図14は、情報流通システムSにおけるデータ品質算出を示すタイムチャートである。具体的には、データ品質評価プログラム3220による品質算出処理の前後の処理を示している。図14では図示上部から図示下部に向かって時間が経過している。なお図14に示す処理が実行される前に、図12を参照して説明した定義テーブル作成処理の実行が完了している。
図14ではまず、データ主権者計算機200からデータ提供者計算機400に対して、流通データと提供先候補とが送信される(S31)。この処理は、図1におけるS4およびS5に相当する。なおデータ主権者2は、流通データを裏付ける確認物の電子データも一緒にデータ提供者計算機400に送信してもよい。次にデータ提供者計算機400は、受信した流通データを用いてデータ確認テーブル4220を作成し、受信した流通データおよび提供先候補とともにデータ品質管理計算機300に送信する(S32)。なおデータ主権者2が流通データの送付にデータ主権者計算機200を用いることは必須ではない。たとえばデータ提供者4に対して口頭や書面で流通データおよび提供先候補を伝達してもよいし、データ主権者2がデータ提供者計算機400を操作して流通データおよび提供先候補を入力してもよい。
次にデータ品質管理計算機300は、提供先候補に含まれ、かつ購入リスト3270において流通データを送信したデータ提供者4に関連付けられているデータ利用者5ごとに、データ品質評価プログラム3220がデータ品質評価値テーブル3260を作成する評価処理を実行する(S33)。評価処理の詳細は、図13を参照して説明したとおりである。次にデータ品質管理計算機300は、提供先候補ごとに、受信したデータ確認テーブル4220のレベルがデータ品質基準テーブル3250のレベルを満たしているか否かを判断する(S34)。この判断は、作成したデータ品質評価値テーブル3260を参照することで容易に判断できる。すなわち、基準超えの欄に「NO」が1つも存在しない場合にはデータ確認テーブル4220のレベルがデータ品質基準テーブル3250のレベルを満たしていると判断でき、基準超えの欄に「NO」が1つで存在する場合にはデータ確認テーブル4220のレベルがデータ品質基準テーブル3250のレベルを満たしていないと判断できる。
データ品質管理計算機300は、S33において肯定判断する場合は流通データおよびデータ品質評価値テーブル3260をデータ利用者計算機500に送信し、データ利用者計算機500はこれを受信する(S36)。データ品質管理計算機300は、S33において否定判断する場合はデータ提供者計算機400に条件を満たさないので提供先に送信できない旨をデータ提供者計算機400に送信し、データ提供者計算機400はこれを受信する(S35)。以上が図14の説明である。
上述した第1の実施の形態によれば、次の作用効果が得られる。
(1)データ品質管理計算機300は、複数のデータ利用者5のそれぞれに対応するデータ価値の基準が記されたデータ品質基準テーブル3250が格納されるメモリ3200と、データ提供者計算機400から提供される流通データをデータ品質基準テーブル3250に基づき評価するデータ品質評価プログラム3220と、を備える。そのため、データを受容するデータ利用者5の価値観を反映して流通データを流通させることができる。具体的には、データ利用者5の価値観がデータ品質基準テーブル3250に反映され、このデータ品質基準テーブル3250に基づき所定の基準を満たした流通データをデータ利用者5に送付できる。
(1)データ品質管理計算機300は、複数のデータ利用者5のそれぞれに対応するデータ価値の基準が記されたデータ品質基準テーブル3250が格納されるメモリ3200と、データ提供者計算機400から提供される流通データをデータ品質基準テーブル3250に基づき評価するデータ品質評価プログラム3220と、を備える。そのため、データを受容するデータ利用者5の価値観を反映して流通データを流通させることができる。具体的には、データ利用者5の価値観がデータ品質基準テーブル3250に反映され、このデータ品質基準テーブル3250に基づき所定の基準を満たした流通データをデータ利用者5に送付できる。
(2)流通データを所有するデータ主権者2は、複数のデータ利用者5のうち流通データを取得可能な提供先候補を選択する。データ品質評価プログラム3220は、流通データの評価が所定の基準を超えるデータ品質基準情報に対応するデータ利用者5であって、かつ提供先候補に含まれるデータ利用者5に流通データを送付する。そのため、流通データの提供においてデータ主権者2の意思を反映させることができる。
(3)データ品質管理計算機300のメモリ3200には、それぞれのデータ提供者計算機400に対応する1以上のデータ利用者5が示された購入リスト3270、およびデータ品質基準テーブル3250があらかじめ格納される。データ品質評価プログラム3220は、流通データの評価が所定の基準を超えるデータ品質基準テーブル3250に対応するデータ利用者5であって、かつ提供先候補に含まれ、かつ流通データを送信したデータ提供者計算機400とデータ利用者5の組合せが購入リスト3270に示されているデータ利用者5に流通データを送付する。そのため、流通データの価値がそのデータ利用者5にとって閾値よりも高く、データ主権者2が流通データの提供に同意したデータ利用者5であり、かつ事前に特定のデータ提供者4の提供する流通データを欲することが購入リスト3270に記載されたデータ利用者5に、流通データを提供できる。
(4)流通データには複数のデータ項目が含まれる。データ品質評価プログラム3220は、データ項目ごとの情報の新しさである最新性、データ項目ごとの情報の確からしさである信憑性、および流通データを送付したデータ提供者4における当該データ項目の確認の度合い、すなわち確認程度4222に基づき正確性を評価する。
(5)データ品質評価プログラム3220は、データ項目ごとに、正確性に流通データを送信したデータ提供者4の信頼度を示す値を乗じることで蓋然性を算出する。
(6)データ品質基準テーブル3250には、情報の新しさである最新性の基準がデータ項目ごとに含まれ、情報の確からしさである信憑性の基準がデータ項目ごとに含まれる。
(変形例1)
図15は、変形例1においてデータ提供者計算機400が生成するデータ内容確認画面の一例を示す図である。データ提供者計算機400は、データ確認テーブル4220を生成すると、データ提供者4に生成内容を確認させるために図15に示す表示をIOデバイス4400に表示してもよい。図15に示す例では、画面の中央に生成したデータ確認テーブル4220が表示され、画面の右下に送信の可否を選択させるボタンが表示される。この場合に、データ提供者4がIOデバイス4400を用いて「Yes」を選択すると、生成したデータ確認テーブル4220が流通データとともにデータ品質管理計算機300に送信される。
図15は、変形例1においてデータ提供者計算機400が生成するデータ内容確認画面の一例を示す図である。データ提供者計算機400は、データ確認テーブル4220を生成すると、データ提供者4に生成内容を確認させるために図15に示す表示をIOデバイス4400に表示してもよい。図15に示す例では、画面の中央に生成したデータ確認テーブル4220が表示され、画面の右下に送信の可否を選択させるボタンが表示される。この場合に、データ提供者4がIOデバイス4400を用いて「Yes」を選択すると、生成したデータ確認テーブル4220が流通データとともにデータ品質管理計算機300に送信される。
(変形例2)
データ品質評価プログラム3220は、流通データのオリジナルデータ価値、およびデータ利用者5ごとの相対データ価値を算出してもよい。オリジナルデータ価値は、データ品質評価値テーブル3260における全データ項目の蓋然性3265の値を用いて算出される。たとえばオリジナルデータ価値は、全データ項目の蓋然性3265の値の総和または平均である。相対データ価値は、データ品質評価値テーブル3260における全データ項目の蓋然性3265の値を、データ利用者5における重要項目により重みづけして得られる。たとえば相対データ価値は、データ品質評価値テーブル3260における蓋然性3265の値のうち、重要項目3262が「High」であるデータ項目のみの総和や平均である。他には、たとえば重要項目3262が「High」であるデータ項目の蓋然性の値と1.0の積、「Middle」であるデータ項目の蓋然性の値と0.5の積、「Low」であるデータ項目の蓋然性の値と0.3の積、との総和としてもよい。すなわち重要度が高いものがより値に影響するようであればよい。
データ品質評価プログラム3220は、流通データのオリジナルデータ価値、およびデータ利用者5ごとの相対データ価値を算出してもよい。オリジナルデータ価値は、データ品質評価値テーブル3260における全データ項目の蓋然性3265の値を用いて算出される。たとえばオリジナルデータ価値は、全データ項目の蓋然性3265の値の総和または平均である。相対データ価値は、データ品質評価値テーブル3260における全データ項目の蓋然性3265の値を、データ利用者5における重要項目により重みづけして得られる。たとえば相対データ価値は、データ品質評価値テーブル3260における蓋然性3265の値のうち、重要項目3262が「High」であるデータ項目のみの総和や平均である。他には、たとえば重要項目3262が「High」であるデータ項目の蓋然性の値と1.0の積、「Middle」であるデータ項目の蓋然性の値と0.5の積、「Low」であるデータ項目の蓋然性の値と0.3の積、との総和としてもよい。すなわち重要度が高いものがより値に影響するようであればよい。
この場合にデータ品質評価プログラム3220は、流通データとともに相対データ価値やオリジナルデータ価値を送信してもよいし、流通データに先立って相対データ価値およびオリジナルデータ価値の少なくとも一方を送信し、データ利用者計算機500からの応答に応じて流通データを送信してもよい。すなわち本変形例では、第1の実施の形態では流通データを送信していた状況であっても、データ利用者計算機500からの応答に応じて流通データを送信しない場合もあるし、第1の実施の形態では流通データを送信しない状況であっても、データ利用者計算機500からの応答に応じて流通データを送信する場合もある。
図16は、変形例2においてデータ利用者計算機500に表示される受領確認画面の一例を示す図である。図16に示す例では、相対データ価値、オリジナルデータ価値、およびデータ品質評価値テーブル3260がデータ利用者計算機500のIOデバイス5400に表示される。さらに、受領確認画面の右下には受領するか否かを選択するボタンが表示される。この場合に、データ利用者5がIOデバイス5400を用いて「Yes」を選択すると、表示されているデータ品質評価値テーブル3260に対応する流通データがデータ利用者計算機500に送信される。
また、データ利用者5の代わりにデータ利用者プログラム5210が数値を読み取り、あらかじめ設定された基準に基づき流通データの要否を判断してもよい。この場合には、図16に示された情報が画面に表示されることは必須ではなく、その情報がデータ利用者計算機500に入力されればよい。
本変形例によれば次の作用効果が得られる。
(7)データ品質評価プログラム3220は、データ項目ごとに、蓋然性の値をデータ品質基準情報に含まれる当該データ項目における重要度により重みづけして得られる値を用いて相対データ価値を算出する。そのため、データ利用者5の価値観により流通データを評価した相対データ価値を算出できる。
(7)データ品質評価プログラム3220は、データ項目ごとに、蓋然性の値をデータ品質基準情報に含まれる当該データ項目における重要度により重みづけして得られる値を用いて相対データ価値を算出する。そのため、データ利用者5の価値観により流通データを評価した相対データ価値を算出できる。
(変形例3)
上述した第1の実施の形態では、データ提供者4がデータ主権者2に提示する提供先候補には、購入リスト3270の情報が反映されていなかった。しかし、データ提供者4は購入リスト3270の情報が反映した提供先候補をデータ主権者2に提示してもよい。すなわちデータ提供者4は、当該データ提供者4が提供する流通データを購入したデータ利用者5のみを提示してもよい。この場合には、データ品質管理計算機300において購入リスト3270を改めて確認する必要がなくなり、図14のS33における処理が簡略化される。
上述した第1の実施の形態では、データ提供者4がデータ主権者2に提示する提供先候補には、購入リスト3270の情報が反映されていなかった。しかし、データ提供者4は購入リスト3270の情報が反映した提供先候補をデータ主権者2に提示してもよい。すなわちデータ提供者4は、当該データ提供者4が提供する流通データを購入したデータ利用者5のみを提示してもよい。この場合には、データ品質管理計算機300において購入リスト3270を改めて確認する必要がなくなり、図14のS33における処理が簡略化される。
(変形例4)
上述した第1の実施の形態では、データ主権者2が選択したデータ利用者5にのみそのデータ主権者2が所有する流通データが提供された。しかし、データ主権者2の意思を確認することなく、データ利用者5にそのデータ主権者2の流通データを提供してもよい。
上述した第1の実施の形態では、データ主権者2が選択したデータ利用者5にのみそのデータ主権者2が所有する流通データが提供された。しかし、データ主権者2の意思を確認することなく、データ利用者5にそのデータ主権者2の流通データを提供してもよい。
(変形例5)
データ品質管理計算機300は、流通データの追加や修正を提案する提案機能をさらに有してもよい。この提案機能は、それぞれのデータ品質基準テーブル3250と、データ確認テーブル4220とを比較する。そして、データ確認テーブル4220をどのように修正されると、いくつのデータ品質基準テーブル3250が定める基準を新たに上回るのかを算出してデータ提供者計算機400に出力する。この機能はたとえば、現状ではデータ確認テーブル4220が基準を満たさないそれぞれのデータ品質基準テーブル3250に対して、基準を満たすために必要なデータ確認テーブル4220の変更点を挙げる。そして、必要な変更点の重複が多い方から1以上を出力する。
データ品質管理計算機300は、流通データの追加や修正を提案する提案機能をさらに有してもよい。この提案機能は、それぞれのデータ品質基準テーブル3250と、データ確認テーブル4220とを比較する。そして、データ確認テーブル4220をどのように修正されると、いくつのデータ品質基準テーブル3250が定める基準を新たに上回るのかを算出してデータ提供者計算機400に出力する。この機能はたとえば、現状ではデータ確認テーブル4220が基準を満たさないそれぞれのデータ品質基準テーブル3250に対して、基準を満たすために必要なデータ確認テーブル4220の変更点を挙げる。そして、必要な変更点の重複が多い方から1以上を出力する。
図17は、提案機能によりデータ提供者計算機400に表示される画面の一例を示す図である。図17では、データ項目「住所」の確認物を「三ヵ月以内」に発行された「住民票」に変更することにより、条件を満たすデータ利用者5が「10件」あることが示されている。
―第2の実施の形態―
図18~図19を参照して、情報流通システムの第2の実施の形態を説明する。以下の説明では、第1の実施の形態と同じ構成要素には同じ符号を付して相違点を主に説明する。特に説明しない点については、第1の実施の形態と同じである。本実施の形態では、主に、データ品質管理計算機が有していた機能および情報がデータ提供者計算機400およびデータ利用者計算機500に搭載される点で、第1の実施の形態と異なる。
図18~図19を参照して、情報流通システムの第2の実施の形態を説明する。以下の説明では、第1の実施の形態と同じ構成要素には同じ符号を付して相違点を主に説明する。特に説明しない点については、第1の実施の形態と同じである。本実施の形態では、主に、データ品質管理計算機が有していた機能および情報がデータ提供者計算機400およびデータ利用者計算機500に搭載される点で、第1の実施の形態と異なる。
図18は、第2の実施の形態におけるデータ提供者計算機400Aの構成図である。第1の実施の形態における構成との相違点は、メモリ4200Aにデータ品質評価プログラム3220、データ品質定義テーブル3230、重要項目テーブル3240、データ品質基準テーブル3250、データ品質評価値テーブル3260、および購入リスト3270がさらに格納される点である。データ品質基準テーブル3250は、データ利用者計算機500Aから受信して保存するため図17では破線で示している。
図19は、第2の実施の形態におけるデータ利用者計算機500Aの構成図である。第1の実施の形態における構成との相違点は、メモリ5200Aにデータ品質基準作成プログラム3210、データ品質定義テーブル3230、重要項目テーブル3240、データ品質基準テーブル3250、およびデータ品質評価値テーブル3260がさらに格納される点である。データ品質評価値テーブル3260は、データ提供者計算機400Aから受信して保存するため図18では破線で示している。
本実施の形態における情報流通システムSは、データ品質管理計算機300を含まない。第1の実施の形態においてデータ品質管理計算機300が備えた機能を、データ提供者計算機400Aおよびデータ利用者計算機500Aに振り分けている。そのため、処理内容は第1の実施の形態と概ね同様であり、情報の送付タイミングおよび宛先が異なる。具体的には次のとおりである。
データ利用者計算機500Aは、自らデータ品質基準テーブル3250を作成してデータ提供者計算機400Aに送信する。データ提供者計算機400Aは、図14におけるS33およびS34の処理を実行して、肯定判断する場合に流通データおよびデータ品質評価値テーブル3260を対象のデータ利用者計算機500Aに送信する。
上述した第2の実施の形態によれば、データ品質管理計算機300が不要であり、データ提供者4とデータ利用者5が直接に情報を授受できる。
上述した各実施の形態および変形例において、機能ブロックの構成は一例に過ぎない。別々の機能ブロックとして示したいくつかの機能構成を一体に構成してもよいし、1つの機能ブロック図で表した構成を2以上の機能に分割してもよい。また各機能ブロックが有する機能の一部を他の機能ブロックが備える構成としてもよい。
上述した各実施の形態および変形例において、それぞれの演算装置や計算機は入出力インタフェースを備え、この入出力インタフェースが利用可能な媒体を介して、他の装置からプログラムが読み込まれてもよい。ここで媒体とは、たとえば入出力インタフェースに着脱可能な記憶媒体、または通信媒体、すなわち有線、無線、光などのネットワーク、または当該ネットワークを伝搬する搬送波やディジタル信号、を指す。また、プログラムにより実現される機能の一部または全部がハードウエア回路やFPGAにより実現されてもよい。
上述した各実施の形態および変形例は、それぞれ組み合わせてもよい。上記では、種々の実施の形態および変形例を説明したが、本発明はこれらの内容に限定されるものではない。本発明の技術的思想の範囲内で考えられるその他の態様も本発明の範囲内に含まれる。
2…データ主権者
3…データ取引市場
4…データ提供者
5…データ利用者
200…データ主権者計算機
300…データ品質管理計算機
400、400A…データ提供者計算機
500、500A…データ利用者計算機
3200…メモリ
3210…データ品質基準作成プログラム
3220…データ品質評価プログラム
3230…データ品質定義テーブル
3240…重要項目テーブル
3250…データ品質基準テーブル
3260…データ品質評価値テーブル
3270…購入リスト
4220…データ確認テーブル
4230…標準データテーブル
3…データ取引市場
4…データ提供者
5…データ利用者
200…データ主権者計算機
300…データ品質管理計算機
400、400A…データ提供者計算機
500、500A…データ利用者計算機
3200…メモリ
3210…データ品質基準作成プログラム
3220…データ品質評価プログラム
3230…データ品質定義テーブル
3240…重要項目テーブル
3250…データ品質基準テーブル
3260…データ品質評価値テーブル
3270…購入リスト
4220…データ確認テーブル
4230…標準データテーブル
Claims (14)
- 複数のデータ利用者のそれぞれに対応するデータ価値の基準が記されたデータ品質基準情報が格納される記憶部と、
データ提供者計算機から提供される流通データを前記データ品質基準情報に基づき評価するデータ品質評価部と、を備えるデータ価値評価演算装置。 - 請求項1に記載のデータ価値評価演算装置において、
前記流通データを所有するデータ主権者は、前記複数のデータ利用者のうち前記流通データを取得可能な提供先候補を選択し、
前記データ品質評価部は、前記流通データの評価が所定の基準を超える前記データ品質基準情報に対応する前記データ利用者であって、かつ前記提供先候補に含まれる前記データ利用者に前記流通データを送付する、データ価値評価演算装置。 - 請求項2に記載のデータ価値評価演算装置において、
前記記憶部には、それぞれの前記データ提供者計算機に対応する1以上の前記データ利用者が示された送付リスト、および前記データ品質基準情報があらかじめ格納され、
前記データ品質評価部は、前記流通データの評価が所定の基準を超える前記データ品質基準情報に対応する前記データ利用者であって、かつ前記提供先候補に含まれ、かつ前記流通データを送信した前記データ提供者計算機と前記データ利用者の組合せが前記送付リストに示されている前記データ利用者に前記流通データを送付する、データ価値評価演算装置。 - 請求項1に記載のデータ価値評価演算装置において、
前記流通データには複数のデータ項目が含まれ、
前記データ品質評価部は、前記データ項目ごとの情報の新しさである最新性、前記データ項目ごとの情報の確からしさである信憑性、および前記流通データを送付した前記データ提供者計算機を操作するデータ提供者における当該データ項目の確認の度合いに基づき正確性を評価する、データ価値評価演算装置。 - 請求項4に記載のデータ価値評価演算装置において、
前記正確性は数値として算出され、
前記データ品質評価部は前記データ項目ごとに、前記正確性に前記流通データを送信した前記データ提供者計算機を操作するデータ提供者の信頼度を示す値を乗じることで蓋然性を算出する、データ価値評価演算装置。 - 請求項1に記載のデータ価値評価演算装置において、
前記流通データには複数のデータ項目が含まれ、
前記データ品質基準情報には、情報の新しさである最新性の基準が前記データ項目ごとに含まれ、情報の確からしさである信憑性の基準が前記データ項目ごとに含まれる、データ価値評価演算装置。 - 請求項5に記載のデータ価値評価演算装置において、
前記データ品質評価部はさらに、前記データ項目ごとに、前記蓋然性の値を前記データ品質基準情報に含まれる当該データ項目における重要度により重みづけして得られる値を用いて相対データ価値を算出する、データ価値評価演算装置。 - 評価及び流通の対象となる流通データを送信するデータ提供者計算機と、
前記流通データを評価して評価結果に基づき1または複数のデータ利用者に前記流通データを送信するデータ価値評価演算装置と、を備え、
前記データ価値評価演算装置は、
複数の前記データ利用者のそれぞれに対応するデータ価値の基準が記されたデータ品質基準情報が格納される記憶部と、
前記データ品質基準情報に基づき評価して所定の基準を超えた前記流通データを、当該データ品質基準情報に対応する前記データ利用者に送付するデータ品質評価部と、を備える、データ流通システム。 - 請求項8に記載のデータ流通システムにおいて、
前記流通データを所有するデータ主権者は、前記複数のデータ利用者から前記流通データを取得可能な提供先候補を選択し、
前記データ品質評価部は、前記流通データの評価が所定の基準を超える前記データ品質基準情報に対応する前記データ利用者であって、かつ前記提供先候補に含まれる前記データ利用者に前記流通データを送付する、データ流通システム。 - 請求項9に記載のデータ流通システムにおいて、
前記記憶部には、それぞれの前記データ提供者計算機に対応する1以上の前記データ利用者が示された送付リスト、および前記データ品質基準情報があらかじめ格納され、
前記データ品質評価部は、前記流通データの評価が所定の基準を超える前記データ品質基準情報に対応する前記データ利用者であって、かつ前記提供先候補に含まれ、かつ前記流通データを送信した前記データ提供者計算機と前記データ利用者の組合せが前記送付リストに示されている前記データ利用者に前記流通データを送付する、データ流通システム。 - 請求項8に記載のデータ流通システムにおいて、
前記流通データには複数のデータ項目が含まれ、
前記データ品質評価部は、前記データ項目ごとの情報の新しさである最新性、前記データ項目ごとの情報の確からしさである信憑性、および前記流通データを送付した前記データ提供者計算機を操作するデータ提供者における当該データ項目の確認の度合いに基づき正確性を評価する、データ流通システム。 - 請求項11に記載のデータ流通システムにおいて、
前記正確性は数値として算出され、
前記データ品質評価部は、前記正確性に前記流通データを送信した前記データ提供者計算機を操作するデータ提供者の信頼度を示す値を乗じることで蓋然性を算出する、データ流通システム。 - 請求項8に記載のデータ流通システムにおいて、
前記流通データには複数のデータ項目が含まれ、
前記データ品質基準情報には、情報の新しさである最新性の基準が前記データ項目ごとに含まれ、情報の確からしさである信憑性の基準が前記データ項目ごとに含まれる、データ流通システム。 - 請求項12に記載のデータ流通システムにおいて、
前記データ品質評価部はさらに、前記データ項目ごとに、前記蓋然性の値を前記データ品質基準情報に含まれる当該データ項目における重要度により重みづけして得られる値を用いて相対データ価値を算出する、データ流通システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021-181307 | 2021-11-05 | ||
JP2021181307A JP7473514B2 (ja) | 2021-11-05 | 2021-11-05 | データ価値評価演算装置、データ流通システム |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023079818A1 true WO2023079818A1 (ja) | 2023-05-11 |
Family
ID=86241249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2022/031895 WO2023079818A1 (ja) | 2021-11-05 | 2022-08-24 | データ価値評価演算装置、データ流通システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7473514B2 (ja) |
WO (1) | WO2023079818A1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10260955A (ja) * | 1997-03-19 | 1998-09-29 | Toshiba Corp | 情報収集装置、情報評価装置、情報処理システム、情報収集方法、情報評価方法及び情報処理方法 |
JP2009199573A (ja) * | 2008-01-25 | 2009-09-03 | Nippon Telegr & Teleph Corp <Ntt> | 属性情報開示システム、属性情報開示方法および属性情報開示処理プログラム |
JP2017111501A (ja) * | 2015-12-14 | 2017-06-22 | オムロン株式会社 | データフロー制御装置およびデータフロー制御方法 |
WO2021085061A1 (ja) * | 2019-10-31 | 2021-05-06 | 日本電気株式会社 | 情報取引システム、情報取引装置、情報取引方法、プログラム |
JP2021114141A (ja) * | 2020-01-20 | 2021-08-05 | 富士通株式会社 | サーバ装置、データ処理方法、および通信プログラム |
JP2021114240A (ja) * | 2020-01-21 | 2021-08-05 | 富士通株式会社 | データ取引支援方法、データ取引支援プログラム、データ取引支援システム |
-
2021
- 2021-11-05 JP JP2021181307A patent/JP7473514B2/ja active Active
-
2022
- 2022-08-24 WO PCT/JP2022/031895 patent/WO2023079818A1/ja unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10260955A (ja) * | 1997-03-19 | 1998-09-29 | Toshiba Corp | 情報収集装置、情報評価装置、情報処理システム、情報収集方法、情報評価方法及び情報処理方法 |
JP2009199573A (ja) * | 2008-01-25 | 2009-09-03 | Nippon Telegr & Teleph Corp <Ntt> | 属性情報開示システム、属性情報開示方法および属性情報開示処理プログラム |
JP2017111501A (ja) * | 2015-12-14 | 2017-06-22 | オムロン株式会社 | データフロー制御装置およびデータフロー制御方法 |
WO2021085061A1 (ja) * | 2019-10-31 | 2021-05-06 | 日本電気株式会社 | 情報取引システム、情報取引装置、情報取引方法、プログラム |
JP2021114141A (ja) * | 2020-01-20 | 2021-08-05 | 富士通株式会社 | サーバ装置、データ処理方法、および通信プログラム |
JP2021114240A (ja) * | 2020-01-21 | 2021-08-05 | 富士通株式会社 | データ取引支援方法、データ取引支援プログラム、データ取引支援システム |
Also Published As
Publication number | Publication date |
---|---|
JP2023069454A (ja) | 2023-05-18 |
JP7473514B2 (ja) | 2024-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10699349B2 (en) | Computerized system and method for data field pre-filling and pre-filling prevention | |
US10109017B2 (en) | Web data scraping, tokenization, and classification system and method | |
US20180144421A1 (en) | System and Methods for Complaint Evaluation | |
US9830663B2 (en) | System and method for determination of insurance classification and underwriting determination for entities | |
Krasnikov et al. | Evaluating the financial impact of branding using trademarks: A framework and empirical evidence | |
US20160196587A1 (en) | Predictive modeling system applied to contextual commerce | |
JP2021534468A (ja) | 自動化された企業トランザクションデータアグリゲーションおよび会計 | |
US20150254754A1 (en) | Methods and apparatuses for consumer evaluation of insurance options | |
US20220327627A1 (en) | Machine-Learning Driven Data Analysis Based on Demographics, Risk, and Need | |
US20120290330A1 (en) | System and method for web-based industrial classification | |
Souza et al. | Importance of coding co-morbidities for APR-DRG assignment: focus on cardiovascular and respiratory diseases | |
US20180165757A1 (en) | Purchase health care system | |
US20070050210A1 (en) | Systems and Methods for Providing Pharmacy Discounts for Cash Customers While Maintaining Third-Party Reimbursement Rates | |
CN110737831B (zh) | 适配搜索结果的系统和方法 | |
JP2009169968A (ja) | 消費者の寄付に基づいて市場の需要を判定するための方法およびシステム | |
US10373267B2 (en) | User data augmented propensity model for determining a future financial requirement | |
CN113742492A (zh) | 保险方案生成方法、装置、电子设备及存储介质 | |
US20230334590A1 (en) | Machine-Learning Driven Data Analysis Based on Demographics, Risk, and Need | |
KR20230158390A (ko) | 판매자 맞춤형 상품 등록 기능을 지원하는 온라인 커머스 큐레이션 서비스를 제공하는 방법 및 장치 | |
Fang | Commercially successful blockchain healthcare projects: a scoping review | |
Powell et al. | Evaluating how safety-net hospitals are identified: systematic review and recommendations | |
US20230281654A1 (en) | Systems and methods for autonomous management of manufacturer coupons | |
WO2023079818A1 (ja) | データ価値評価演算装置、データ流通システム | |
US20220051343A1 (en) | Life insurance policy application process and system | |
TWM614130U (zh) | 推薦名單產製系統 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22889643 Country of ref document: EP Kind code of ref document: A1 |