WO2020141584A1 - 処理システムおよびプログラム - Google Patents

処理システムおよびプログラム Download PDF

Info

Publication number
WO2020141584A1
WO2020141584A1 PCT/JP2019/047339 JP2019047339W WO2020141584A1 WO 2020141584 A1 WO2020141584 A1 WO 2020141584A1 JP 2019047339 W JP2019047339 W JP 2019047339W WO 2020141584 A1 WO2020141584 A1 WO 2020141584A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
personal information
personal
key
simulation
Prior art date
Application number
PCT/JP2019/047339
Other languages
English (en)
French (fr)
Inventor
豊 塚本
陽子 塚本
Original Assignee
株式会社フューチャーアイ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社フューチャーアイ filed Critical 株式会社フューチャーアイ
Priority to JP2020563862A priority Critical patent/JP7446621B2/ja
Publication of WO2020141584A1 publication Critical patent/WO2020141584A1/ja
Priority to JP2024023394A priority patent/JP2024045636A/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/14Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using a plurality of keys or algorithms

Definitions

  • the present invention relates to a processing system and program for an information recording system such as a block chain that is difficult to tamper with or erase.
  • Blockchain has been generally known as an information recording method that is difficult to tamper with.
  • Japanese Patent Laid-Open Publication No. 2004-242242 discloses various information relating to freight transportation using this block chain.
  • the present invention has been conceived in view of such circumstances, and its purpose is to eliminate a dilemma in which there is a trade-off between the guarantee of authenticity of recorded information and the guarantee of right to delete the information.
  • the present invention is an encryption means for performing an encryption process for encrypting information to be recorded, Recording means for recording information after the encryption processing, Decryption means for performing decryption processing on the information recorded by the recording means using the first key and the second key to obtain plaintext information, And a decryption disabling unit that puts the information recorded by the recording unit into a decryption disabled state in which the information cannot be decrypted,
  • the decryption means includes a second key secret holding means for holding the second key in secret.
  • the decryption disabler makes the decryption disabled by updating the second key held by the second key concealment holder to another key.
  • the decryption means further includes a first key distribution means for distributing the first key to those who wish to browse the information.
  • it further comprises search means for searching the information recorded by the recording means without making it plain text.
  • the information recorded by the recording means includes personal information
  • the decryption disabler renders the personal information of the personal information owner into the decryption disabled state in response to the request of the personal information owner.
  • Another aspect of the present invention is a step of performing an encryption process for encrypting information to be recorded, A decryption step of decrypting the information recorded by the recording means for recording the information after the encryption processing using the first key and the second key to obtain plaintext information; A step of setting the information recorded by the recording means into a non-decodable state in which the information cannot be decrypted, Let the computer run
  • the decrypting step includes a step of keeping the second key secret.
  • the decryption disabled state is set by updating the second key held in the holding step to another key.
  • FIG. 1 It is a system diagram which shows the whole structure of a processing system.
  • A is a figure explaining the information memorize
  • B is a figure explaining the information memorize
  • A) is a flow chart showing a main routine program of a public chain user terminal
  • B) is a flow chart showing a subroutine program of personal information recording processing
  • a flow chart of an authorized business operator server It is a flowchart which shows the subroutine program of the smart contract process performed by the user terminal of a public chain.
  • (A) is a flow chart showing a main routine program of a user terminal of a private chain
  • (B) is a flow chart showing a subroutine program of personal information search processing. It is a flowchart which shows the subroutine program of the smart contract process performed by the user terminal of a private chain.
  • (A) is a continuation of the flowchart showing the subroutine program of the smart contract processing executed by the user terminal of the private chain
  • (B) is the flowchart showing the subroutine program of the machine learning processing executed by the user terminal of the private chain. is there.
  • It is a flow chart which shows a subroutine program of AI smart contract generation processing performed with a user terminal of a private chain.
  • (A) is a flowchart showing a subroutine program of a simulation learning process executed by a user terminal of a private chain
  • (B) is a flowchart showing a subroutine program of an AI smart contract group generation process executed by a user terminal of a private chain. Is. It is a flowchart which shows the subroutine program of the smart contract trust contract processing performed with the user terminal of a private chain.
  • (A) is a flowchart showing a subroutine program of reinforcement learning processing of a personalized AI smart contract learned model
  • (B) is a flowchart showing a main routine program executed by a user terminal of the consortium chain.
  • (A) is a flowchart showing a subroutine program of an IoT sensor data totaling process executed by a user terminal of the consortium chain
  • (B) is a flowchart showing a subroutine program of a simulation process executed by a user terminal of the consortium chain.
  • (A) is a flowchart showing a subroutine program of AI smart contract group generation processing executed by a user terminal of the consortium chain
  • (B) is a flowchart showing a subroutine program of smart contract processing executed by a user terminal of the consortium chain.
  • A is a figure explaining the information memorize
  • B is a figure explaining the information memorize
  • A) is a flow chart showing a subroutine program of a personal information recording process and a key registration process to a block chain
  • (B) is a flow chart showing a subroutine program of a record deciphering request process and a record deciphering process.
  • (A) is a schematic diagram of a multi-service DAO construction system
  • (B) is a flowchart of a main routine of a mirror world server and a user terminal. It is a flow chart which shows a subroutine program of simulation reinforcement learning preparation processing and simulation reinforcement learning preparation response processing. It is explanatory drawing which registers a multi-service DAO digital twin in a mirror world as a simulation object. It is a schematic system diagram of the simulation reinforcement learning of multi-service DAO. It is a flow chart which shows a subroutine program of DAO agent reinforcement learning processing.
  • (A) is a diagram showing a reward table stored as knowledge by a DAO agent
  • (B) is a flowchart showing a subroutine program of persona agent reinforcement learning processing.
  • (A) is a flow chart showing a subroutine program of idea proposal service execution processing
  • (B) is a flow chart showing a subroutine program of improvement proposal service execution processing.
  • (A) is a flowchart showing a subroutine program of commercialization service execution processing
  • (B) is a flowchart showing a subroutine program of infringement countermeasure service execution processing.
  • (A) is a flowchart showing a subroutine program of token purchase service execution processing
  • (B) is a diagram for explaining price fluctuations at a floating market of tokens due to token purchases by a group of persona agents. It is a figure which shows an element integrated DAO construction system.
  • FIG. 1 is a schematic system showing simulation reinforcement learning of an element integrated DAO digital twin.
  • A is a figure which shows the calculation algorithm of the performance and distribution rate which the material procurement element agent has memorize
  • B shows the calculation algorithm of the performance and distribution rate which the assembly element agent has memorize
  • (C) is a figure which shows the calculation algorithm of the performance and distribution rate which the advertising element agent has memorize
  • (A) is a figure which shows the performance and distribution ratio calculation algorithm which the sales element agent has memorized as knowledge
  • (B) is a figure which shows the reward table which the general agent has memorized as knowledge.
  • (A) is a flowchart showing a subroutine program of information collection processing by the crawler
  • (B) is a diagram showing various data stored in the material procurement DB. It is a flowchart which shows the subroutine program of an assembly element agent reinforcement learning process. It is a flow chart which shows a subroutine program of advertising element agent reinforcement learning processing.
  • (A) is a flowchart showing a subroutine program of information collection processing by the crawler
  • (B) is a diagram showing various data stored in the advertisement DB.
  • (A) is a flow chart showing a subroutine program of information collection processing
  • (B) is a view showing various data stored in the sales DB.
  • (A) is a flow chart showing a subroutine program of personal AI reinforcement learning processing for material procurement
  • (B) is a flow chart showing a subroutine program of personal AI reinforcement learning processing for assembly.
  • (A) is a flowchart showing a subroutine program of a personal AI reinforcement learning process for advertising
  • (B) is a flowchart showing a subroutine program of personal AI reinforcement learning process for sales. It is explanatory drawing which shows the installation method of a program.
  • a first embodiment of the present invention will be described with reference to FIGS.
  • three types of block chain networks, a private chain 2, a consortium chain 3, and a public chain 4 are connected to a centralized oracle 21.
  • the public chain 4 is a completely open system, and anyone can trade there. Transactions can be effectively confirmed on the blockchain. Mining (booking rights competition) is free and anyone can participate.
  • Consortium chain 3 is a block chain that can be used only by partners who belong to associations and unions. The people (nodes) among them are designated as bookkeepers. The generation of blocks is also determined in advance, and other people (nodes) can trade but do not have the bookkeeping right.
  • the private chain 2 only records with the block chain technology, and the recording right is not open but is monopolized by an individual or a company, and only internal transactions are recorded.
  • Polkadot is used to connect blockchains and exchange tokens and data between each blockchain.
  • Polkadot is a blockchain for connecting different blockchains.
  • a blockchain developed using Substrate can be connected to Polkadot, and by connecting to Polkadot, it becomes possible to exchange tokens and data with other blockchains connected to Polkadot.
  • the centralized oracle 21 is a system that bridges data between the blockchain and the Internet 1, collects various information that is connected to the Internet 1 and scattered on the Internet, and provides the information to the blockchain smart contract. I do.
  • Each node 19 of the private chain 2, the consortium chain 3, and the public chain 4 is composed of a user terminal such as a personal computer (hereinafter referred to as “PC”) 16.
  • This PC (hereinafter also referred to as “user terminal”) 16 is connected to the Internet 1.
  • the Internet 1 is further connected to a server 20 of an SNS (Social Networking Service) 40 and a server 18 of a block chain certified business 17.
  • SNS Social Networking Service
  • server 18 of the authorized business operator 17 may participate in the block chain as the node 19.
  • a server of a certificate authority that issues a digital certificate in PKI (Public Key Infrastructure) may be connected to the Internet 1.
  • the authorized business operator 17 keeps personal information, issues an electronic ID mainly to the personal semi-information owner, and records the hash value of the personal information in the block chain.
  • the personal information stored is stored in a personal information database (hereinafter referred to as “personal information DB”) 29.
  • the authorized business operator 17 may participate in the block chain as the node 19.
  • the PC 16 includes a CPU (Central Processing Unit) 10 as a control center, a RAM (Random Access Memory) 9 that functions as a work area of the CPU 10, a ROM (Read Only Memory) 11 that stores data and programs, and an HDD (hard disk). drive) 12, etc., a display, an input operation unit 7 such as a keyboard, a communication unit 5, a display unit 6, an interface 8, a bus 13, and various other hardware.
  • Various servers such as the server 20 and the server 18 are also configured by the same hardware as the PC 16, and therefore, illustration and description thereof will not be repeated here.
  • An SDD Solid State Drive
  • IoT (Internet of Things) device 14 and wireless sensor network 15 are connected to node 19 of consortium chain 3. Sensor signals from the IoT device 14 and the wireless sensor network 15 are input to the node 19, and at the same time, a drive signal for the IoT device 14 is output from the node 19.
  • the IoT device 14 is various sensors and actuators for IoT.
  • the wireless sensor network 15 is a wireless network that allows a plurality of wireless terminals with sensors to be scattered in space and cooperate with each other to collect environment and physical conditions.
  • a sensor device is made from energy harvesting, M2M, or a battery, and deterioration of metal fatigue, for example, is constantly monitored by a pressure sensor or a gauge sensor, and the change is notified.
  • It is mainly installed in buildings such as bridges and tunnels.
  • it includes a plurality of sensor nodes and a gateway sensor node.
  • the nodes are usually composed of one or more sensors, wireless chips, microprocessors, power supplies (batteries, etc.).
  • a wireless sensor network usually has an ad hoc function and a routing function for sending data from each node to a central node.
  • the IoT device 14 and the wireless sensor network 15 are connected to the consortium chain 3 via the node 19, but one or both of the IoT device 14 and the wireless sensor network 15 are not connected via the node 19. It may itself be a part of the node 19 of the consortium chain 3.
  • the HDD 12 has a user's private key SK, a public key PK, a common key K1, a trapdoor common key K2, a blockchain user address, a smart contract, a token, and artificial intelligence (also called "AI (Artificial Intelligence)". ) And blockchain data etc. are stored.
  • the user is a broad concept that includes not only natural persons but also corporations.
  • the secret key SK and the public key PK are a key pair used in PKI (Public key Infratructure), and the data encrypted with the public key PK is decrypted with the secret key SK.
  • the private key SK is also used for the electronic signature.
  • the common key K1 is a key used for common key encryption such as DES (Data Encryption Standard) and AES (Advanced Encryption Standard).
  • the data encrypted with the common key K1 is decrypted with the same common key K1.
  • a different common key is used for each personal information to be encrypted.
  • the encrypted personal information E K1 personal information
  • the index is encrypted with the common key K2.
  • an encrypted search query (this is called a “trapdoor”) in which a keyword (search query) used for the search is encrypted with the common key K2 is used for the search.
  • This common key K2 is stored in the HDD 12 as the trap door common key K2.
  • a user's address on the blockchain is generated through the following process. 1 Generate a public key with ECDSA from the private key. 2 Pass the public key through the hash function SHA-256 to get the hash value. 3 The hash value is further passed through the hash function RIPEMD-160 to obtain the hash value. 4 Add 00 as a prefix to the beginning of the hash value. 5 Pass through the hash function SHA-256. 6 Once again, pass the hash function SHA-256. 7 Add 4-byte checksum to the end. 8 Encode in Base58 format.
  • Smart contract is a computer protocol intended for smooth contract verification, condition confirmation, execution, execution, and negotiation.
  • a token is a unique currency issued on the blockchain by companies and individuals.
  • the data in each block of the blockchain includes the hash value of the previous block, the nonce, and the data of the multiple transactions (also called transactions).
  • the time stamp is also embedded in the block chain.
  • Such a block chain is generated by each node 19 performing block chain processing (see S3, S19, S30, S51, S117, S122, S153, etc. described later), and is added as a new block chain.
  • Blockchain processing mainly consists of three phases: transaction, propagation and recording.
  • the transaction phase is an act generally called a transaction, and means a legal act such as a buying/selling act, an assigning act, or a lending (renting) act. More specifically, this transaction phase can be divided into three phases: generation ⁇ signature ⁇ propagation.
  • the generation phase is to generate a transaction.
  • Mr. A decides to Mr. B that "a PC resource (computation resource) in a dormant state is lent for 39005 seconds to obtain 25.78 tokens.”
  • Electronically sign that This electronic signature is generated by passing the transaction data through a predetermined hash function to generate a hash value and encrypting the hash value using the secret key SK of the parties (Mr. A and Mr. B) of the transaction.
  • the certificate authority may issue a digital public key certificate.
  • FIG. 2 shows an example of lending PC resources (computation resources), but the lending target is not limited to that. For example, electric power generated at home or a company, expert knowledge experience and skills of users. Values such as personal connections (including personal networks on the Internet), credit, etc. are considered.
  • the propagation phase is to ask other nodes to confirm that the transaction has been created and signed correctly. If it is determined that the transaction was not generated and signed correctly, the transaction will be discarded.
  • the recording phase is for the miner to mine and record the transaction when it is confirmed that the transaction has been correctly generated and signed. Transactions that have been confirmed to have been correctly generated and signed are moved to a so-called mining pool. After that, the miner selects a transaction to be recorded from the mining pool and performs mining.
  • the nonce is a value for adjusting so that a very small hash value such that many 0s are arranged at the head is generated when the data of the block is passed through the hash function. A new block is created if the nonce can be calculated such that the hash value is less than or equal to the target value.
  • the transaction data includes a hash value of E K1 (personal information) obtained by encrypting the user's personal information with the key K1, its electronic ID, and an index of the personal information, as shown in transaction I on the right side of FIG. It also includes E K2 (provided by index + 2.4 tokens) encrypted with the key K2 and the consideration for providing personal information (provided by 2.4 tokens in FIG. 2).
  • E K1 personal information
  • E K2 provided by index + 2.4 tokens
  • the personal information include vital information such as the user's heart rate, blood pressure, body temperature, and electroencephalogram, action history information such as purchase history and website browsing history, user location information such as GPS, race, creed, and society. It includes information such as target status, medical history, electronic medical record data, ID (identification), and information posted to SNS.
  • the posted information to the SNS or the like is obtained by transferring the past posted information already posted to the SNS 25 and stored in the server 20 from the server 20 to the personal information DB 29 and the block chain. Specifically, the user himself/herself encrypts all his/her past posted information, stores it in the personal information DB 29 of the authorized business operator, and records the hash value in the block chain. After that, the user does not post to the SNS 25, but encrypts and stores the posted content in the personal information DB 29 of the authorized operator and records the hash value in the block chain. This allows the user to retrieve personal information from a business operator such as SNS and put it under self-management.
  • the consideration for providing personal information may be recorded in the blockchain as plain text without being encrypted. In that case, even if the other user does not obtain the encryption key K2, the user can search the block chain and know the price.
  • the transaction conditions such as consideration for providing personal information and consideration for lending PC resources (computing resources) (in FIG. 2, lending PC resources (computing resources) for 39005 seconds to obtain 25.78 tokens) are smart contracts. As a code, a transaction (legal act) may be automated by a smart contract.
  • the encrypted personal information itself which is the target of the hash value recorded as the transaction I, is stored in the personal information DB 29 of the authorized business operator 17. Specifically, FIG. 2 (B), the vendor approved 17 in association with the electronic ID issued to the encrypted personal information E K1 (personal information) encrypted personal information E K1 (personal information) Is stored in the personal information DB 29.
  • the index is an index for performing a keyword search on the encrypted personal information E K1 (personal information).
  • the keyword used for the search is encrypted with the common key K2. Search using a search query (this is called a "trapdoor").
  • the common key K2 is a different key for each user, but if the encryption index of the same user is used, the same key is used. Therefore, for example, if the user A makes a transaction to distribute the common key K2 to the user B by a smart contract described later, the user B uses E K2 (search query) to retrieve all the encrypted indexes of the user A. It will be possible to search on the blockchain.
  • a searchable cipher such as a homomorphic cipher or a perfect homomorphic cipher that can be searched with the ciphertext encrypted may be used.
  • the personal information may be encrypted using the homomorphic encryption or the perfect homomorphic encryption, and the encrypted personal information may be directly recorded in the block chain. Further, the encrypted personal information E K1 (personal information) may be directly recorded in the block chain.
  • step S (hereinafter simply referred to as “S”) 1, a personal information recording process is performed, a smart contract process is performed in S2, and a block chain process is performed in S3.
  • the personal information recording process is a process in which the personal information owner encrypts the personal information, registers it in the certified business 17, and records the hash value of the encrypted personal information in the block chain.
  • the smart contract process is a process of automatically performing legal acts such as contract conclusion and execution according to a predetermined rule. The specific content of the block chain process is as described above with reference to FIG.
  • the personal information recording process will be described with reference to FIG. In S5, it is determined whether or not the user terminal configuring the node 19 of the public chain 19 has performed a personal information registration operation. If not, this personal information recording processing returns and shifts to the smart contract processing of S2. If it is determined that the personal information registration operation has been performed, in S6, the personal information stored in the memory (HDD 12 or the like) of the user terminal is encrypted with the key K1 and then digitally signed with the secret key SK. At the same time, the index is encrypted with the key K2 and transmitted to the server 18 of the authorized business operator 17.
  • the user terminal having received it stores the electronic ID in the memory (HDD 12 or the like).
  • the server 18 of the authorized business operator 17 performs a process for recording the electronic ID, the hash value, and the encryption index in the block chain in S10.
  • the control proceeds to S14, the common key K2 is transmitted to the distribution destination, and then the control proceeds to S19.
  • S19 processing for recording the established contract as a transaction in the block chain is performed.
  • the control advances to S18, and the loan process of the PC resource (calculation resource) is performed.
  • the control proceeds to S20, the electronic ID of the personal information to be provided and the signature agreeing to provide the personal information are returned to the other party, and the personal information to be provided is provided.
  • the common key K1 used for encryption is encrypted with the public key of the other party and sent back to the other party.
  • control proceeds to S21, and after the ordering process is performed, proceeds to S19.
  • control advances to S23, a process for obtaining the purchase target is executed, and the process advances to S19.
  • the personal information search process is performed in S28
  • the smart contract process is performed in S29
  • the block chain process is performed in S30
  • the machine learning process is performed in S31
  • the AI smart contract generation process is performed in S32
  • the S33 is performed.
  • Smart contract trust contract processing is performed.
  • the AI smart contract is a concept that includes both "integrated type” and "cooperative type”.
  • the “integrated type” is an AI in which the AI and smart contract are integrated and machine learning is performed based on contract (legal act) data to perform smart learning itself.
  • the “cooperation type” is a cooperation between an AI that performs machine learning based on contract (legal act) data and a smart contract.
  • the learned AI hereinafter referred to as “cooperation AI” adds, changes and updates the smart contract according to the situation.
  • Personal information search process is a process to search the encrypted index recorded in the blockchain by a trapdoor (encrypted search query).
  • the smart contract process is a process of automatically performing legal acts such as contract conclusion and execution according to a predetermined rule.
  • the specific content of the block chain process is as described above with reference to FIG.
  • the machine learning process is a process of machine learning the personal information of many users as learning data and generating a learned model of artificial intelligence.
  • the AI smart contract generation process is a process in which personal information related to a contract (legal act) is machine-learned as learning data to generate a learned model of a smart contract by artificial intelligence. More specifically, personal information about a huge amount of contracts (legal acts) that cannot identify the personal information owner is machine-learned as learning data to generate a general trained model of a smart contract using artificial intelligence, and then Personalized AI smart contracts personalized for each personal information owner (for example, for each address on the block chain) using personal information regarding contracts (legal acts) classified by data that can identify the information owner (for example, for an address on the block chain) This is a process of generating a learned model.
  • Smart contract trust contract processing is processing that performs services that automatically perform legal acts such as the conclusion and execution of contracts on behalf of the contractor. More specifically, a personalized AI smart contract trained model that is personalized for the trustee is generated, and the personalized AI smart contract trained model is used to perform legal acts on behalf of the trustee. The reward for AI is determined based on the result of the execution, and the personalized AI smart contract learned model is further reinforced and learned by the reward.
  • S37 it is determined whether or not the common key K2 is stored, and if not, the process returns.
  • K2 is stored in S45, which will be described later, it is determined in S37 that the common key K2 is stored, and the control advances to S38.
  • S38 a process of searching the encrypted index on the block chain with the search query (trapdoor) encrypted with K2 is performed.
  • S39 it is determined in S39 whether or not there is personal information to be obtained. If it is determined that there is no personal information to be acquired, the process returns, but if it is determined that there is personal information to be acquired, the electronic ID of the desired personal information to be acquired is stored in S40.
  • S42 it is determined whether there is search-requested personal information. In this determination, for example, if the conditions are met by sequentially negotiating with the smart contract of the personal information owner who has not been searched yet, the personal information of the personal information owner is determined to be the search-desired personal information. If it is determined in S42 that there is no search-desired personal information, it is determined in S46 whether or not the acquisition-desired personal information is stored. If it is determined that there is no storage-requested personal information, the control proceeds to S55 in FIG. 7(A).
  • PC resource (computation resource) loan contract It is determined whether or not a PC resource (computation resource) loan contract has been established. If it is determined that the PC resource (computation resource) lending contract has not been established, it is determined in S56 whether or not an ordering contract has been established, and it has not been established. If determined, it is determined in S57 whether or not the sales contract is established, and if it is determined not, the process returns.
  • the control proceeds to S43 to request the common key K2 from the personal information owner. Specifically, it sends its own address and an attribute certificate to the address on the block chain of the personal information owner of the personal information to be searched, and requests the common key K2.
  • S44 it is determined whether or not K2 is returned, and the process waits until it is received.
  • the personal information owner or the smart contract of the personal information owner checks the transmitted attribute certificate and determines whether or not K2 can be returned. If it is determined that the K2 can be returned, K2 is returned. When the personal information owner returns K2, the control advances to S45. After the returned K2 is stored, the control advances to S54.
  • S54 a process of storing the established contract as a transaction in the block chain is performed.
  • the contract that the common key K2 used for encrypting the index is distributed from the address of the returned personal information owner to the address of the user who received the reply is stored in the block chain.
  • control proceeds to S47, and a process of requesting the personal information owner for the desired personal information to be acquired is performed. Specifically, the personal information of the desired personal information to be obtained is requested to the personal information owner's address on the block chain by transmitting his/her own address and the attribute certificate.
  • the smart contract confirms the attribute certificate and determines whether or not the conditions for providing the personal information match, and if it is determined that the personal information may be provided (S16: YES), the electronic ID of the personal information to be provided and the signature that agrees to the provision of the personal information are returned, and the common key K1 used to encrypt the personal information to be provided is encrypted with the public key of the other party to be returned ( See S20).
  • the sales contract is established with the user terminal of the public chain (YES in S15)
  • the action eg, S42, S47, S58, S58, S58, S58, S58, S58, S58, S58, S58, S58
  • the action may be executed after obtaining the consent of the owner of the smart contract.
  • the consent of the owner may be given when executing the contract by the smart contract described below.
  • machine learning is performed using the learning data by utilizing the borrowed PC resource (computation resource).
  • the borrowed PC resource computation resource
  • a large data set including input information (vector x) and correct answer information y is used as training data (learning data).
  • the learned model includes the function ci.
  • the machine learning performed by the machine learning unit 34 is not limited to supervised learning, but is an intermediate method between unsupervised learning such as model estimation and pattern mining (data mining), and supervised learning. It may be anything such as semi-supervised learning, reinforcement learning, and deep learning.
  • a general learned model is generated by machine learning in S64 and is stored (S65).
  • This general learned model is a model in which a large amount of personal information that is personal information of many users and is stored in a form that the personal information owner cannot be specified is used as learning data, and can be widely applied to many users. It is an average trained model.
  • S66 it is determined whether or not the order is stored, and if not, the process returns. If there is, in S67, it is determined whether or not the artificial intelligence is ordered. If it is not an artificial intelligence order, the process returns. If it is an artificial intelligence order, a process of requesting personal information to the orderer's address is performed in S68. If the personal information is returned from the orderer, YES is determined in S69 and the process proceeds to S70.
  • the general learned model is personalized based on the returned personal information to generate a personalized learned model. The process of personalizing this general learned model to generate a personalized learned model is described in Japanese Patent No. 6432859. Since personal information necessary for personalization is collected using the blockchain, collecting the information while ensuring the anonymity of the blockchain has an advantage of avoiding privacy problems as much as possible.
  • the personalized learned model is transmitted to the address of the orderer.
  • S80 processing for extracting personal information relating to a contract (legal act) from the enormous amount of personal information stored in a form in which the personal information owner cannot be specified and making it learning data is performed.
  • S81 machine learning is performed using the learning data by utilizing the borrowed PC resource (computation resource).
  • the processes of S80 and S81 are the same as those described in S63 and S64 described above, and therefore, the repetitive description is omitted here.
  • a process of generating and storing a trained model of a general AI smart contract is performed.
  • a simulation learning process is executed.
  • legal actions such as contract verification, condition confirmation, execution, execution, and negotiation that are originally performed by a large number of people are virtually executed in a computer by using a large number of AI smart contracts as a substitute. (Simulation) is performed, and each AI smart contract is rewarded according to the result to perform reinforcement learning.
  • reinforcement learning There is an advantage that a huge amount of reinforcement learning can be performed in a short time because the reinforcement learning is performed by a simulation in a computer rather than the reinforcement learning in the real world.
  • Reinforcement learning is a mechanism in which an agent placed in a certain environment acquires a policy that maximizes the cumulative reward from the initial state to the goal, based on the reward given when selecting an action. That is.
  • learning progresses by interacting with a software agent (hereinafter referred to as "agent"), which is a type of AI, and the environment.
  • the agent is a type of AI, and is software that acts autonomously with some judgment ability while communicating with users, software, etc.
  • the agent performs a certain action a on the environment, the state s of the environment changes and a certain target state is reached, whereby a reward r is given to the agent.
  • the agent learns a function that outputs the action a with the state s as an input in order to maximize the reward r.
  • Reinforcement learning progresses by repeating the following simple steps. 1
  • the agent receives the observation o (or the state s of the environment directly) received from the environment and returns the action a to the environment based on the policy ⁇ .
  • the environment changes to the next state s′ based on the action a received from the agent and the current state s. Based on the transition, the next observation o′ and the goodness or badness of the immediately preceding action called reward r Returns one number (scalar amount) to the agent. 3 hours progress: t ⁇ t+1
  • represents an assignment operation.
  • the reinforcement learning for example, an alpha zero type reinforcement learning algorithm may be used.
  • This alpha-zero type reinforcement learning algorithm is different from algorithms such as DQN (Deep Q-Network), and uses Monte Carlo tree search (MCTS) for searching, and all values (Value) and policies (Policy) are used.
  • the prediction is corrected by a neural network, and the prediction is corrected only by the experience obtained by self-play by tree search.
  • the value network that predicts the value and the policy network that predicts the policy are integrated into one neural network, and the prediction accuracy is improved by multitask learning.
  • the improved performance of the neural network eliminates the need for processor layout (expanding the search tree until the reward is received) processing in tree search, enabling faster search.
  • evolutionary computation, a genetic algorithm, and a Generative adversarial networks may be used.
  • S84 it is determined whether or not there is an AI smart contract order storage, and if not, the process returns.
  • the control advances to S85 to determine whether or not the stored order is the simulation learned AI smart contract order. If it is not the order for the AI trained contract for which simulation has been learned, it is the order for the model for which the personalized AI smart contract has been learned. In that case, control proceeds to S86, and personal information regarding the contract (legal act) is sent to the address of the orderer. Is requested. When the orderer sends back the personal information, YES is determined in S87 and the control proceeds to S88.
  • processing is performed to personalize the learned model of the general AI smart contract based on the personal information regarding the returned contract (legal act) to generate the personalized AI smart contract learned model.
  • the process of personalizing the trained model of this general AI smart contract to generate the personalized AI smart contract trained model is described in Japanese Patent No. 6432859.
  • the personalized learned model is transmitted to the orderer's address in S89.
  • S334 it is determined whether or not the simulation is input, and if not, the process returns.
  • This simulation is input by the user terminal of the private chain 2, and for example, the policies and laws that the government is going to adopt (for example, the reduced tax rate due to the consumption tax increase, the revised immigration control law, the EU (European Union) in the United Kingdom). ), partial or full adoption of basic income, amendment of Article 9 of the Constitution of Japan, etc.), and simulation of trading in the investment market such as stock trading and futures trading, company management simulation , Or a consumption behavior simulation. Further, simulation of promotion of new products (including financial products and life insurance) and new services by various media may be used. If it is determined in S334 that the simulation is input, the control proceeds to S335, and the AI smart contract group generation process is executed.
  • a persona is generally defined as a virtual person, which is a typical target person of a company, a product, or a service.
  • the persona is defined as a virtual person, which is a typical person image targeted by the simulation content.
  • the above-mentioned consumption behavior simulation under the reduced tax rate due to the consumption tax increase it is a persona equivalent to general consumers, and it is grouped by gender, age group, region, annual income, etc. Set as persona.
  • the number of set personas should be proportional to the number of users belonging to the group. For example, the population distribution of general consumers by age is 5% in their teens, 5% in their 20s, 10% in their 30s, 10% in their 40s, 20% in their 50s, 20% in their 60s, 20% in their 70s, 5% in their 80s.
  • the number of personas representing the teens is 1, the number of personas representing the 20s is 1, the number of personas representing the 30s is 2, the number of personas representing the 40s is 2, The number of personas representing the 50s is 4, the number of personas representing the 60s is 4, the number of personas representing the 70s is 4, the number of personas representing the 80s is 1, and the number of personas representing the 90s is 1. , Set.
  • a process of selecting a user group belonging to each persona is performed by using the borrowed PC resource (computation resource).
  • a process of grouping the user groups belonging to each persona and collecting transaction data of the user groups from the block chain for each group is performed. For example, in the case of the consumption behavior simulation under the reduced tax rate due to the consumption tax increase mentioned above, the user group is grouped into sex, age group, region, annual income group, etc., and transaction data of the user group is grouped for each group. Collect from the blockchain. For the selection of the user group and the collection of the transaction data of the user group in S345 and S346, it is useful to use, for example, a questionnaire reply monitor member database held by the Internet questionnaire survey company.
  • Internet questionnaire survey companies store the contact information (email address, etc.) of questionnaire survey monitor members in a database in association with attributes such as gender, age group, place of residence, unmarried, married, occupation, and household annual income. Monitor member data for each attribute is used.
  • attributes such as gender, age group, place of residence, unmarried, married, occupation, and household annual income.
  • Monitor member data for each attribute is used.
  • S145 and S146, S586 and S587, S622 and S623 which will be described later, it is useful to use a database of questionnaire response monitor members owned by the Internet questionnaire survey company.
  • processing is performed using the borrowed PC resource (computation resource) to perform machine learning using the transaction data as learning data to generate a learned AI smart contract for each persona.
  • This AI smart contract is generated by the same number as the set number of the corresponding persona.
  • the environment for executing the simulation is prepared, and the simulation is performed in that environment.
  • each AI smart contract generated as described above executes a contract (legal act) according to act a (S336).
  • This "action a" is the action a as a result of the reinforcement learning in S338.
  • S337 a process of recording the contract established between the AI smart contracts in the block chain is performed.
  • the PC resource (computation resource) that has been borrowed is used to calculate the reward r based on the contents of the contract that has been established, and the processing for obtaining the action a according to the optimal policy ⁇ * by TD learning is performed.
  • the processing for obtaining the action a according to the optimal policy ⁇ * by TD learning is performed.
  • the smaller the value of (expenditure amount before tax increase-expenditure amount after tax increase) the higher the reward r.
  • it is determined whether or not the simulation is finished If the simulation is not finished yet, the control returns to S336, and the reinforcement learning is advanced by repeatedly repeating S337 ⁇ S338 ⁇ S339 ⁇ S336.
  • the control proceeds to S340, and the AI smart contract that has obtained the highest reward r is stored and then the process returns.
  • the AI smart contract is not limited to the AI smart contract having the highest reward r, and for example, the top 5% AI smart contract may be stored. Further, it is not always necessary to record to the blockchain in S337, and in that case, in the above-mentioned linkage type, the "AI smart contract" in S335, S336, S340 and S347 is changed to "AI for linkage". To do.
  • simulation in a computer does not involve the execution of contracts (legal acts) in the real world, so if you do not record in the blockchain, you do not need to use the smart contract, and you do not need to use the smart contract. This is because it is sufficient if the AIs perform the action a and perform reinforcement learning. Upon completion of the reinforcement learning and the actual quoting stage, the learned AI for cooperation may execute the contract in cooperation with the smart contract and record the contract in the blockchain.
  • S94 it is determined whether or not there is a smart contract trust order memory. If it is determined that there is no order memory, the process returns.
  • S95 the personal information regarding the contract (legal act) is requested to the address of the orderer, and when the personal information is returned from the orderer, YES is determined in S96 and the control proceeds to S97.
  • T is called the temperature in annealing, and if it is high, the action is selected with a probability close to equal probability, and if it is low, it is biased to the optimum one.
  • a general Neumann type computer is used as a computer for machine learning such as reinforcement learning, but a neural net processor (NNP) may be used.
  • NNP neural net processor
  • a large number of "artificial neurons" modeled on real neurons are mounted on the NNP chip, and each neuron cooperates with each other in a network.
  • a quantum computer adopting the “quantum annealing method” may be used. In particular, by using a quantum computer that adopts the "quantum annealing method", the time required for optimization calculation in machine learning can be greatly reduced.
  • the trustee receives the evaluation of the result of the trust contract processing performed by the personalized AI smart contract learned model.
  • a process of calculating the reward r based on the received evaluation is performed.
  • processing for obtaining the action a according to the optimal policy ⁇ * by TD learning is performed by utilizing the borrowed PC resource (computation resource).
  • the contract according to act a is executed as a proxy of the trustor.
  • the IoT sensor data totaling process is executed in S114, the smart contract process is executed in S115, the simulation process is executed in S116, and the block chain process is executed in S117.
  • the specific content of the block chain process is as described above with reference to FIG.
  • S120 a process of classifying the IoT sensor data by classifying it by type, period, region, etc. is performed. This processing includes not only IoT sensor data but also data from the wireless sensor network.
  • S121 a process of determining the value of each grouped data is performed. Depending on the value thus determined, the consideration (amount of tokens) for providing data is coded as a smart contract for each corresponding data.
  • S122 a process of recording each grouped data in the block chain is performed.
  • S150 it is determined whether or not a sales contract with a person who wants to obtain data has been established. This determination is automatically determined to be YES in S150 because the mutual conditions (the amount of tokens) for the provision of the data encoded as the smart contract match each other. If NO is determined in S150, the control proceeds to S151, it is determined whether or not the PC resource loan contract has been established, and if not, the process returns.
  • the control proceeds to S152, the data is transmitted to the address of the requesting person, and the process of acquiring the token as the consideration is performed.
  • the contract that has been established is recorded in the block chain as a transaction in S153.
  • the control advances to S154, the borrowing process of the PC resource (calculation resource) is performed, and the contract is recorded in the blockchain as a transaction by S153.
  • S134 it is determined whether or not a simulation request has been made, and if not, the process returns. If it is determined in S134 that a simulation request has been issued, control proceeds to S135, and AI smart contract group generation processing is executed.
  • a flow chart of the subroutine program of this AI smart contract group generation processing will be described based on FIG. 13(A).
  • the processing of setting the persona group that matches the requested simulation is performed by using the borrowed PC resource (computation resource).
  • a persona is generally defined as a virtual person, which is a typical target person of a company, a product, or a service.
  • the persona is defined as a virtual person, which is a typical person image targeted by the simulation content.
  • the persona corresponding to the general consumer is set as the persona for each group grouped by sex, age, region, annual income, etc. ..
  • the number of set personas should be proportional to the number of users belonging to the group.
  • the population distribution by age of the general public is 5% in their teens, 5% in their 20s, 10% in their 30s, 10% in their 40s, 20% in their 50s, 20% in their 60s, 20% in their 70s, 5% in their 80s
  • the number of personas representing the teens is 1
  • the number of personas representing the 20s is 1
  • the number of personas representing the 30s is 2
  • the number of personas representing the 40s is 2, 50
  • the number of personas that represents the era is 4, the number of personas that represents the 60s is 4, the number of personas that represents the 70s is 4, the number of personas that represents the 80s is 1, and the number of personas that represents the 90s is 1.
  • a process of selecting a user group belonging to each persona is performed using the borrowed PC resource (computation resource).
  • a process of grouping the user groups belonging to each persona and collecting transaction data of the user groups from the block chain for each group is performed. For example, in the case of the above-mentioned simulation of the reduced tax rate due to the consumption tax increase, the user group is grouped into sex, age group, region, annual income, etc., and transaction data of the user group is collected from the blockchain for each group. To do.
  • processing is performed by using the borrowed PC resource (computation resource) to perform machine learning using transaction data as learning data and generate an AI smart contract that has been learned for each persona. This AI smart contract is generated by the same number as the set number of the corresponding persona. As a result, the environment for executing the simulation is prepared, and the simulation is performed in that environment.
  • each AI smart contract generated as described above executes a contract (legal act) according to act a (S136).
  • This "action a" is the action a as a result of the reinforcement learning in S138.
  • S137 a process of recording the contract established between the AI smart contracts in the block chain is performed.
  • step S138 the PC resource (computation resource) that has been borrowed is used to calculate the reward r based on the content of the contract that has been established, and the processing for obtaining the action a according to the optimal policy ⁇ * by TD learning is performed. Be seen.
  • step S139 it is determined whether or not the simulation is completed. If the simulation is not completed yet, the control returns to S136, and S137 ⁇ S138 ⁇ S139 ⁇ S136 is repeatedly repeated to advance the reinforcement learning. When the simulation is finished, YES is determined in S139, the control proceeds to S140, the process of deriving the simulation result is performed, and then the process returns.
  • the simulation results show how each item of the business trend index fluctuates. Derive. In the case of a simulation associated with a monetary tightening policy in the stock market, we derive how the stock market fluctuated as a result of the simulation.
  • the mode of the optimal reduced tax rate while varying the specific mode of the reduced tax rate accompanying the consumption tax increase (for example, what is the item subject to the reduced tax rate and the reduced tax rate for each item subject to the reduced tax rate) into multiple modes
  • a simulation optimization method of determining As an optimal mode of the reduced tax rate, (tax revenue increase rate (%) + diffusion index (DI)/50 as a business trend index) is set as an expected value E, and a simulation result for maximizing the expected value E is set. Try to get Let ⁇ be the control parameter (mode of reduced tax rate) in the simulation and Y( ⁇ ) as the simulation result, and find ⁇ in maxE[Y( ⁇ )].
  • the authorized business operator 17 stores the encrypted personal information E K1 (personal information) of the user, but instead, records the encrypted personal information E K1 (personal information) directly on the block chain. You may do so.
  • Transaction data other than personal information such as transaction C and transaction F in FIG. 2 may be encrypted with the key K1 or the like and recorded in the blockchain in the same manner as personal information.
  • PC resources (computational resources) may be lent at the unit cost per hour as in the first embodiment.
  • the percentage may be distributed (payout) to lenders of PC resources (calculation resources).
  • the payout ratio (payout amount) is controlled to be proportional to the lending amount of PC resources (computation resources) (PC lending number x lending time, etc.).
  • the payout ratio is controlled so as to be proportional to the resource lending amount (providing amount).
  • the resource lender may acquire the right to receive the dividend (hereinafter referred to as “dividend enjoyment right”) instead of receiving the dividend itself.
  • the dividend receiving right may be controlled to be acquired by the lender (provider) in the form of a token issued by the project executor, for example.
  • the lender (provider) may control the acquired dividend enjoyment right (token) so that it can be transferred to another person at a price (token) depending on the market price at that time.
  • the dividend entitlement right (token) can be managed as if it were a stock transaction in the secondary market in the stock market.
  • the generated personalized learned model is sent to the orderer's address and delivered, but in addition to or instead of this, the generated personalized learned model is used for ordering. Persons may be provided with personalized services.
  • the contract verification, condition confirmation, execution, execution, and negotiation are automated by the smart contract. You may control so that it may require. Also, instead of seeking the consent of the user himself/herself with respect to all contracts (legal acts such as transactions), it is judged whether or not the contract is a predetermined important contract (legal acts such as transactions), and important contracts (transactions etc.) If it is determined that the user's legal action), the user may be requested to give consent.
  • the programs running on the user terminals 16 and the like that configure the node 19 of each block chain and various servers may be downloaded from a predetermined website or the like and installed, but for example, recorded on a CD-ROM 99 or the like.
  • the program may be recorded on a medium (non-transitory recording medium) and distributed, and a person who purchases the CD-ROM 99 or the like may install the program on the user terminal 16 and various servers (see FIG. 60). ..
  • an extracting unit that collects information collected by a plurality of oracles dispersed on the network to extract average information
  • an adopting unit that adopts the average information extracted by the extracting unit
  • an Oracle A plurality of oracles includes a first oracle and a second oracle, and the reward giving means provides information closer to the average information than the first oracle. More reward is given to the collected second oracle. The reward given to the first oracle may be 0 or may be negative.
  • Information that identifies the intention of the personal information owner for determination of one or both of establishment of the K2 distribution contract in S13 and establishment of the personal information provision contract in S16 (hereinafter referred to as "intention identification information"). ), it may be possible to provide a function of determining whether or not to be established. Specifically, when a personal information owner wants to recommend products or services that match him/her at an actual store or an electronic shopping mall, he/she can specify the specific information of his/her own mobile terminal (smartphone or IC card). By instructing the smart contract of the personal information owner to notify the personal identification information consisting of specific information and personal identification number by inputting the personal identification number to read and enter into the contract, the smart contract is executed according to the personal identification information. Determines.
  • FIG. 14A shows a normal state in which the deletion right is not exercised
  • FIG. 14B shows a state in which the deletion right is exercised and information cannot be decrypted.
  • an information holder (also referred to as an information owner) 40 double-encrypts information using two one-sided common keys KA and KB. If expressed by a formula, it becomes E KA (E KB (information)). Next, the encrypted information E KA (E KB (information)) is recorded in a block chain or the like.
  • the one-sided common key KA is stored in a secret state in the user terminal or the like of the information holder 40.
  • the information owner 40 updates one of the one-sided keys KA and KB used for encrypting the information to be made undecipherable to a random number R ( ⁇ KA).
  • the information requester 41 who has already stored the one-sided common key KB, requests information from the information owner 40
  • the information owner 40 sends the encrypted information E KA (E KB (information )) with the key R (random number).
  • the D R (E KA (E KB ( information)) Information main 40 is transmitted to the information requester 41.
  • the information requester 41 having received it decrypts D R (E KA (E KB (information)) with the already stored one-sided common key KB.
  • D KB (D R (E KA ( E KB (information)))) ⁇ Information
  • the guarantee of the right to delete information is more complete.It is not necessary to limit to the double encryption using the two keys KA and KB, and it is possible to use three keys or more (n keys). It is also possible to use a multi-encryption using a key R. In this case, by replacing at least one of the n keys with a random number R, the decryption state is set.
  • FIG. 15 corresponds to FIG. 2 in the first embodiment.
  • E KA E KB (personal information)
  • KA and KB are one-sided common keys.
  • a flow chart of a main routine of the user terminal configuring the node 19 of the private chain 2 and the user terminal 16 configuring the node of the public chain 4 will be described.
  • the flowchart of the operation process shown in the first embodiment is omitted, and only the flowchart of the operation process to be added or changed to the operation process shown in the first embodiment is shown.
  • the personal information recording process to the block chain is performed in S160
  • the record deciphering process is performed in S161
  • the personal information providing process is performed in S162.
  • the personal information acquisition process is performed in S170.
  • the process of recording personal information in the block chain is the process of recording personal information in the block chain.
  • the record undeciphering process is a process for exercising the deletion right to render the information undecipherable.
  • the personal information providing process is a process in which the user terminal 16 of the public chain 4 provides personal information to the user terminal of the private chain 2.
  • the personal information acquisition process is a process in which the user terminal of the private chain 2 acquires the personal information from the user terminal 16 of the public chain.
  • a flow chart of a subroutine program of personal information recording processing on the block chain will be described based on FIG. 17(A).
  • S174 a process of generating two random numbers is performed.
  • two 56-bit random numbers are generated and these 56-bit random numbers are used as the one-sided common keys KA and KB.
  • ADS two 128-bit random numbers are generated and these 128-bit random numbers are used as the one-sided common keys KA and KB.
  • This ciphertext identifier is an identifier for identifying E KA (E KB (personal information)) that is encrypted personal information, and corresponds to the electronic ID in the first embodiment.
  • the KA and KB are associated with the ciphertext identifier and stored in the HDD 12 of the user terminal 16.
  • step S190 it is determined whether or not there is a ciphertext that is desired to be undecipherable among the ciphertexts recorded in the block chain (for example, E KA (E KB (personal information)) and the like). If there is no ciphertext that should be made undecipherable, control proceeds to step S191, and the HDD 12 is searched for the one-sided common key KA stored in association with the ciphertext identifier of the ciphertext. Is done.
  • E KA E KB (personal information)
  • a random number R is generated in S192.
  • a random number R For example, in the case of DES, a 56-bit random number is generated. In the case of ADS, a 128-bit random number is generated.
  • a process of transmitting the ciphertext identifier of the personal information desired to be obtained to the user terminal 16 of the public chain 4 and requesting the one-sided common key KB is performed.
  • the user terminal 16 of the public chain 4 which received it in S200 it is determined by the smart contract whether or not to carry out the transaction for providing the personal information specified by the ciphertext identifier (see S16), and the transaction for providing the personal information.
  • the signature agreeing to provide personal information and the one-sided common key KB corresponding to the ciphertext identifier are returned in S201.
  • the signature and the ciphertext identifier of the personal information desired to be obtained are transmitted to the user terminal 16 of the public chain 4 in S203.
  • the process of calculating and returning D KA (encrypted personal information) or D R (encrypted personal information) is performed in S207.
  • the encrypted personal information E KA (E KB (personal information) is directly recorded in the block chain, and this large amount of encrypted personal information is recorded in each node (in the public chain 4, all If it is stored in a node, there is a disadvantage that each node (user terminal) requires a huge storage capacity.
  • a secret sharing technology for storing divided data in a plurality of computers Data is divided and fragmented, each fragmented data is distributed and stored in multiple nodes, and the data stored in each node is stored redundantly (redundantly). By having this, even if a part of the fragment data is lost, there is no hindrance to the restoration, and it is possible to ensure the difficulty of falsification as a block chain. It may be controlled so as to be determined by the intention, and may be controlled so as to give a consideration corresponding to the amount of memory to be carried to each node in the form of a token or the like.
  • the encrypted personal information E KA (E KB (personal information) was directly recorded in the block chain.
  • the encrypted personal information E KA (E KB (personal information)) is stored in the personal information DB 29 of the authorized business operator 17, and the hash value of the encrypted personal information is recorded in the block chain.
  • Transaction I shown in FIG. A hash value of E KA (E KB (personal information)) + E K2 (provided by index + 2.4 token) + ciphertext identifier and electronic signature are recorded in the field, as shown in FIG.
  • encrypted personal information E KA (E KB (personal information)) is stored in association with the ciphertext identifier.
  • the routine flowchart will be described.
  • the server 18 of the authorized business operator 17 participates in the block chain as the node 19.
  • the processing for recording personal information on the block chain is executed in S215, the recording indecipherable processing is executed in S216, the personal information providing processing is executed in S217, the hash value recording processing is executed in S220, and the ciphertext transmission processing is executed in S221. Is executed, and the personal information acquisition process is executed in S224.
  • the user terminal 16 configuring the node 19 of the public chain 4 sends the encrypted personal information E KA (E KB (personal information)) to the server 18 of the authorized business operator 17.
  • the hash value recording process is a process of storing the hash value in the server 18 of the authorized business operator 17, which has received the encrypted personal information E KA (E KB (personal information)) and recording the hash value in the block chain.
  • the record undecipherable process is a process for making the ciphertext such as the encrypted personal information E KA (E KB (personal information)) desired to be undecipherable undecipherable.
  • the personal information providing process is a process executed by the user terminal 16 configuring the node 19 of the public chain 4 to provide personal information to the user terminal configuring the node 19 of the private chain 2.
  • the personal information acquisition process is a process in which the user terminal configuring the node 19 of the private chain 2 acquires the personal information.
  • the server 18 of the authorized business operator 17 transmits the ciphertext such as the encrypted personal information E KA (E KB (personal information)) to the user terminal configuring the node 19 of the private chain 2. Processing.
  • E KA E KB (personal information)
  • E K2 index + consideration for providing personal information
  • the server 18 which has received it in S240, performs a process of generating a hash value of E KA (E KB (personal information)) and a ciphertext identifier in S241.
  • S242 a process of recording the hash value of E KA (E KB (personal information)), E K2 (index + consideration for providing personal information), and the ciphertext identifier in the block chain is performed.
  • a process of transmitting the ciphertext identifier to the user terminal 16 of the public chain 4 is performed.
  • the user terminal 16 of the public chain 4 which received it in S232 performs a process of storing the one-sided keys KA and KB in the HDD 12 in association with the received ciphertext identifier.
  • the server 18 of the authorized business operator 17 performs a process of storing E KA (E KB (personal information)) and the ciphertext identifier in the personal information DB 29 in association with each other.
  • the recording undecipherable process shown in FIG. 22 is the same as that already described in FIG. 17B of the second embodiment, and therefore the description thereof will not be repeated.
  • the server 18 of the authorized business operator 17 may be connected to the user terminal of the private chain 2 and the user terminal of the Pabook chain 4 via the Internet 1 without participating in the block chain as the node 19. ..
  • the one-sided common key KA was held by the personal information owner (stored in the HDD 12 of the user terminal 16).
  • the one-sided common key KA may be registered in the key DB 32.
  • the one-sided common key KA is stored in the key DB 32 in a secret state. This modification will be described with reference to FIGS. 24 to 27.
  • the server 31 of the key registration center 30 is connected to the Internet 1.
  • a ciphertext identifier and a one-sided common key KA are stored in association with each other for each address of a user who is each node 19 of the public chain 4. Then, if the user makes a request to make the recording undecipherable, the one-sided common key KA stored in association with the ciphertext identifier corresponding to the requested recording is updated to the random number R.
  • the one-sided common key stored in association with the ciphertext identifier 307cd4 at the address 0x6079dd is updated to the random number 1R2
  • the one-sided common key stored in association with the ciphertext identifier 4arb56 at the address 0x6080dd is The random number 2Rn is updated
  • the one-sided common key stored in association with the ciphertext identifier e2c87r at the address 0x6978dd is updated to the random number mR1.
  • the personal information recording process to the block chain is executed in S468, the record deciphering request process is executed in S469, and the decryption key providing process is executed in S470.
  • the key registration process is executed in S463
  • the record deciphering process is executed in S464, and the data decryption process is executed in S465.
  • the data acquisition process is executed in S460.
  • E KA E KB (personal information)
  • E K2 index + consideration for providing personal information
  • the ciphertext identifier are recorded in the block chain in S479, and one side is divided in S480.
  • a process of transmitting the common key KA and the ciphertext identifier to the key registration center 30 is performed.
  • the user terminal of the private chain 2 performs a process of transmitting the ciphertext identifier of the desired acquisition data to the server 31 of the key registration center 30.
  • the server 31 of the key registration center 30 which received it in S504
  • a process of searching the blockchain for the ciphertext (encrypted personal information etc.) corresponding to the ciphertext identifier is performed in S505.
  • a process of searching for the one-sided common key KA or R corresponding to the ciphertext identifier is performed.
  • D K A encrypted personal information
  • D R encrypted personal information
  • S507 a process of returning D K A (encrypted personal information) or D R (encrypted personal information) to the user terminal of the private chain 2 is performed. Specifically, if the one-sided common key KA stored in the key DB 32 of the key registration center 30 has already been updated to R, D R (encrypted personal information) is calculated and returned, but it has not yet been returned. If it has not been updated to R, a process of calculating D KA (encrypted personal information) and returning it is performed.
  • E KA E KB (personal information)
  • E KB personal information
  • Information that guarantees the right to delete is not limited to personal information, but is, for example, information posted to SNS or blogs (including data of posted photos and posted videos), notarized documents such as wills and voluntary guardianship contracts, and private documents. It may be any information, such as the articles of incorporation of a company or a company, and other items that require a fixed date. Further, in the second embodiment, the information for guaranteeing the deletion right is recorded using the block chain, but the block chain is only an example, and other information may be used for recording.
  • the programs running on the user terminals 16 and the like that configure the node 19 of each block chain and various servers may be downloaded from a predetermined website or the like and installed, but for example, recorded on a CD-ROM 99, etc.
  • the program may be recorded on a medium (non-transitory recording medium) and distributed, and a person who purchases the CD-ROM 99 or the like may install the program on the user terminal 16 and various servers (see FIG. 60). ..
  • encryption is performed twice with the one-sided common key KA and again with the one-sided common key KB, and is once decrypted with the one-sided common key KB. Is decrypted twice with the one-sided common key KA to form a plaintext.
  • the invention is not limited to this, and encryption with the one-sided common key KA or KB may be performed a plurality of times and decryption with the one-sided common key KA or KB may be performed a plurality of times.
  • the one-sided common keys KA and KB are not limited to two, and three or more one-sided common keys may be used.
  • E K personal information
  • the one-sided common key KA is registered in the key DB 32 of the key registration center 30, and the one-sided common key KB is distributed to the requester of the personal information.
  • the personal information owner who receives the request from the personal information requester transmits the encrypted personal information to the server 31 of the key registration center 30, and the personal information requester uses the distributed one-sided common key KB of the key registration center 30. It is transmitted to the server 31.
  • the server 31 of the key registration center 30 calculates an exclusive OR (exclusive OR) of the received one-sided common key KB and the one-sided common key KA registered in the key DB 32 to generate one key K.
  • K exclusive OR
  • the received encrypted personal information E K (personal information)
  • DK E K (personal information)
  • plain text plaintext personal information
  • exclusive OR exclusive OR
  • any algorithm may be used as long as it generates one key K from the one-sided common keys KA and KB.
  • the one-sided common keys KA and KB can be periodically updated to maintain security.
  • exclusive OR exclusive OR
  • the distributed one-sided common key KB can be a one-time key that can be used only once.
  • an encryption algorithm that satisfies the following conditions may be adopted.
  • the plaintext is M
  • the ciphertext is C
  • the encryption keys are KA, KB, KC and KD.
  • the encrypted personal information data holders to information requester (D KA (encrypted personal information) or D R (encrypted personal information)) and transmits a counterpart common key KB (S201 , S207), the information requester himself decrypted the encrypted personal information by using the one-sided common key KB to make it plain text (S209), but the decryption using the one-sided common key KB was performed by a third party (predetermined). (Service organization).
  • information holder sends a counterpart common key KB and encrypted personal information (D KA (encrypted personal information) or D R (encrypted personal information)) to the third party (predetermined service organization) ,
  • D KA encrypted personal information
  • D R encrypted personal information
  • Feature 1 relates to a processing system and a program for an information recording system such as a block chain that is difficult to be tampered with or erased.
  • Block chains have been generally known as an information recording method that is difficult to tamper with or erase.
  • Japanese Patent Laid-Open No. 2018-128723 discloses, for example, various information relating to freight transportation recorded using this block chain. [Outline of Feature 1] [Problems that Feature 1 tries to solve]
  • Characteristic 1 has been devised in view of such circumstances, and its purpose is to eliminate a dilemma in which there is a trade-off between the guarantee of authenticity of recorded information and the guarantee of the right to delete the information. [Means for solving the problem]
  • Feature 1 The subject of Feature 1 is shown as the following items, for example.
  • Encryption means for example, S174, S177, or S228, S231, or S478, S479) that performs an encryption process for encrypting information to be recorded (for example, personal information),
  • Recording means for example, S177 and block chain, or S231, S240, S242, S244, block chain and personal information DB 29, or S479 and block chain
  • the information recorded by the recording means is decrypted using the first key and the second key to obtain plaintext information (for example, S201, S202, S207 to S209, or S263 to S271).
  • the decryption unit includes a second key secret storage unit (for example, S194, S233, or S475) that secretly holds the second key (for example, the one-sided common key KA),
  • the decryption disabler makes the decryption disabled by updating the second key held by the second key secret storing means to another one (for example, a random number R) (for example, S190 to S194).
  • a random number R for example, S190 to S194.
  • the decryption unit distributes the first key (for example, the one-sided common key KB) to a person who wants to browse information (for example, S200, S201, or S2562, S263, or S500, S501).
  • the processing system of item 1 further comprising: (Item 3) 3.
  • the processing system according to item 1 or 2 further comprising search means (for example, S37 to S40, S42 to S45) for searching the information recorded by the recording means without making it in plain text.
  • the information recorded by the recording means includes personal information
  • the decryption disabler sets the personal information of the personal information owner to the decryption disabled state at the request of the personal information owner (for example, S190 to S194 or S250 to S254, or S494, S495, S485. ⁇ S489), the processing system according to any one of Items 1 to 3.
  • a step for example, S174, S177, or S228, S231, or S478, S479) of performing an encryption process for encrypting information to be recorded (for example, personal information), It is recorded by a recording unit (for example, S177 and block chain, or S231, S240, S242, S244, block chain and personal information DB 29, or S479 and block chain) that records information after the encryption processing.
  • a recording unit for example, S177 and block chain, or S231, S240, S242, S244, block chain and personal information DB 29, or S479 and block chain
  • Decryption step for decrypting information by using the first key and the second key to obtain plaintext information eg, S201, S202, S207 to S209, or S263 to S271, or S500 to S510
  • a step for example, S191 to S194, or S250 to S254, or S494, S495, S485 to S489 in which the information recorded by the recording means cannot be decrypted.
  • the decrypting step includes a step of secretly retaining the second key (for example, the one-sided common key KA) (for example, S194, S233, or S475),
  • the decryption disabled state is set by updating the second key held in the holding step to another key (for example, a random number R) (eg, S190 to S194). , Or S250 to S254, or S494, S495, S485 to S489), a program.
  • Feature 2 relates to a smart contract used in, for example, a block chain.
  • the smart contract is a computer protocol intended for smooth contract verification, condition confirmation, execution, execution, and negotiation, and has been used in block chains and the like.
  • This smart contract has been conventionally known as an automated contract, transaction, etc. (for example, Japanese Patent No. 6403177).
  • [Outline of Feature 2] [Problems that Feature 2 tries to solve]
  • the purpose of the feature 2 conceived in view of the actual situation is to provide an advanced smart contract that can execute a legal act on behalf of the user himself.
  • the subject of Feature 2 is shown as the following items, for example.
  • Machine learning means for example, S80 to S82
  • Personalization means for personalizing the general model into a model suitable for the user
  • personalization means for personalizing the general model based on information on legal acts performed by the user (for example, S86 to S88, or S94 to S98)
  • a smart contract generating unit for example, S86 to S88 or S94 to S98) that generates a smart contract for executing a legal act on behalf of the user using the personalized model. system.
  • (Item 2) It is a means to personalize a general model generated by inputting information on legal acts performed by multiple natural persons or corporations as data for machine learning into a model suitable for the user, Personalization means (for example, S80 to S82, S86 to S88, or S94 to S98) for personalizing the information based on the information about the legal act, And a smart contract generating unit (for example, S86 to S88 or S94 to S98) that generates a smart contract for executing a legal act on behalf of the user using the personalized model. system.
  • Personalization means for example, S80 to S82, S86 to S88, or S94 to S98
  • a smart contract generating unit for example, S86 to S88 or S94 to S98
  • a computer system comprising: a service providing unit (for example, S99) that provides a service for executing a legal act on behalf of the user by using the personalized model as a smart contract.
  • Reinforcement learning means for learning a strategy for maximizing the accumulation of the reward by the model by giving the executed model a reward for the legal act executed by the service providing means (for example, S99).
  • the service providing means for example, S99.
  • the computer system according to item 3 further including S105 to S108).
  • Generating means for example, S347) for performing machine learning to generate learned smart contract model groups for each persona by using the collected information about legal acts as learning data.
  • a simulation unit for example, S336 to S339) that executes a simulation in the computer to perform a legal action between the generated learned smart contract model groups.
  • Reinforcement learning means for example, the learning means learns a strategy for maximizing the accumulation of the reward by the learned smart contract model by giving a reward for the executed legal act to the executed learned smart contract model).
  • a computer system that performs a simulation in a computer to advance reinforcement learning,
  • the trained smart contract model group generated by machine learning is simulated in the computer by performing a legal action between them, and the trained smart contract model is given a reward for the executed legal action.
  • the contract model comprises a reinforcement learning means (for example, S336, S338) for performing a simulation reinforcement learning process for learning a strategy for maximizing the accumulation of the reward.
  • Item 6 further including selection means (for example, S340) for selecting a learned smart contract model to be actually used based on the result of the reinforcement learning result by the reinforcement learning means from the learned smart contract model group The described computer system.
  • selection means for example, S340
  • the "machine learning data” for general model generation and the “machine learning data” used for personalization are sufficient if they include “information on legal acts", except for "information on legal acts”.
  • Information for example, access history to website, GPS position information, etc.
  • the “smart contract generation means” includes, for example, a case where the artificial intelligence, such as a personal assistant machine-learned based on information about legal acts, plays a role as a smart contract.
  • Characteristic 3 is, for example, policies or laws that the government is trying to adopt (for example, reduced tax rate due to consumption tax increase, revised Immigration Control Act, withdrawal from EU (European Union) in the UK, partial or full adoption of basic income). , Article 9 of the Constitution of Japan, etc.), marketing-related conditions (eg setting prices and consideration for new products (including financial products and life insurance) and new services, promotional effects by various media, etc.), investment market-related Conditions (for example, weather conditions in futures trading, monetary tightening policy in the stock market, etc.) are set, and a simulation is performed in the computer under those conditions to predict in advance what kind of simulation results will be obtained. Regarding computer systems. [Background technology]
  • Feature 3 The subject of Feature 3 is shown as the following items, for example.
  • Pre-determined conditions eg policies and laws that the government intends to adopt (eg reduced tax rate due to consumption tax increase, revised immigration law, departure from EU (European Union) in the UK, partial or full basic income) Recruitment, revision of Article 9 of the Japanese Constitution, etc., marketing-related conditions (eg setting prices and consideration for new products (including financial products and life insurance), new services, promotional effects by various media, etc.), investment A computer system that performs simulation in a computer under market-related conditions (for example, weather conditions in futures trading, monetary tightening policy in stock markets, etc.), Selection means (for example, S144, S145) for selecting a user group belonging to a plurality of personas that match the conditions of the simulation, Collection means (for example, S146) for grouping the user groups selected by the selection means into each of the plurality of personas and collecting information on legal acts performed by the user groups for each group; Generating means (for example, S147) that
  • Deriving means for example, S140 for deriving the result of the simulation by the simulating means
  • Reinforcement learning means for example, the learning means learns a strategy for maximizing the accumulation of the reward by the learned smart contract model by giving a reward for the executed legal act to the executed learned smart contract model.
  • a computer system including S136, S138).
  • a computer system for performing simulation in a computer A simulation is performed in a computer to perform a legal action between the learned smart contract model groups generated by machine learning (for example, S144 to S146), and a reward for the executed legal action is applied to the executed learned smart contract model.
  • Reinforcement learning means for example, S136, S138
  • a computer system comprising: a deriving unit (for example, S140) for deriving a result of a simulation of performing a legal action between the learned smart contract model groups in which the reinforcement learning by the reinforcement learning unit has progressed. (Effect of feature 3)
  • an optimum solution that predicts the future is derived by performing simulation by using a mirror world (cyber space) that is composed of digital twins of the real world as a simulation environment.
  • the present invention relates to a system for deriving an optimal solution for incentive design in DAO (Decentralized Autonomous Organization) and for performing machine learning (for example, reinforcement learning) of AI.
  • DAO Decentralized Autonomous Organization
  • machine learning for example, reinforcement learning
  • a digital twin is a digital representation of a real world entity or system.
  • a mirror world is a mirror image world that is composed of digital twins in which all information in the physical world (real world), such as real nations, cities, society, local governments, organizations such as companies, people, etc., is digitized. ..
  • machine learning for learning a person's digital twin for example, a life log of the person's actions (both real and virtual actions) as knowledge, and assisting him in the most appropriate action (eg, agent It is composed of an assistant AI (hereinafter, referred to as “personal AI”) that has performed the reinforcement learning by.
  • This reinforcement learning is multi-agent reinforcement learning in which a plurality of personal AIs cooperate to perform reinforcement learning.
  • the digital twin of the relevant organization is configured by the personal AI of the people constituting the real world company, and the digital twin of the relevant local government is configured by the personal AI of the people configuring the real world local government.
  • the digital twin of the city is constructed by the personal AIs of the people who compose the real world city, and the digital twin of the country is constructed by the personal AIs of the people who compose the real world nation.
  • an actual nation, city, society, local government, organization such as a company, people and the like in the real world take the initiative and cooperate in the construction.
  • the personal AI of the digital twin participating in the simulation is machine-learned (for example, reinforcement learning), and the learned personal AI that has been learned to a higher degree is realized.
  • feedback Using this merit as an incentive, we encourage real world nations, cities, societies, local governments, organizations such as companies, people, etc. to take the initiative and cooperate in the construction of a mirror world.
  • mirror world data is stored in a data center 45 in which a plurality of mirror world servers (including storage servers) 46 are installed.
  • the hardware configuration of the mirror world server 46 is the same as the hardware configuration of the user terminal 16 shown in FIG. 1, and therefore, repeated illustration and description thereof will be omitted here.
  • a digital twin real world digital twin (for example, Japan)
  • the entire mirror world 51 composed of the national digital twin 53), the urban digital twin 54, society, local governments, organizations such as companies, people and the earth digital twin 52) is stored in the data center 45 as digital data.
  • Simulation is performed using this mirror world 51 as a simulation environment, and, for example, the optimum solution that predicts the future is derived by simulation optimization.
  • Simulations include, for example, the policies and laws that the government intends to adopt (for example, the reduced tax rate associated with the consumption tax hike, the revised Immigration Control Act, the departure from the EU (European Union) in the United Kingdom, the partial or basic income. Assuming that full adoption, revision of Article 9 of the Japanese Constitution, etc.) has been adopted, trading simulation in the investment market such as stock trading and futures trading, company management simulation, or consumption behavior simulation can be considered. Further, simulation of promotion of new products (including financial products and life insurance) and new services by various media may be used.
  • the optimal solution derived by the simulation optimization is fed back (reduced) to the real world, and the benefit of the optimal solution is provided to the real world.
  • the learned personal AI that has been machine-learned (for example, reinforcement learning) by simulation is returned to the real world so that the task by the more advanced personal AI can be performed.
  • the data center 45 is connected to the Internet 1 shown in FIGS. 1 and 24.
  • various block chains 2, 3, 4, the SNS 19, the key registration center 30 and the like are omitted.
  • FIG. 29 shows a specific example of the urban digital twin 54 in the mirror world 51.
  • the urban digital twins 54 corresponding to them include the ABC digital twin 59, Taro digital twin (Taro's personal AI) 57, and the Taro family digital twin 58.
  • Urban digital twin data including these data is stored in the mirror world server 46. If there are changes to various objects such as ABC 56 in the real world 49, Taro 55 who is a person, and Taro's family 56 (for example, personnel changes in a company, employment or retirement, marriage or childbirth about a person, etc.), Corresponding digital twins will be updated with the changed contents.
  • Such city digital twin data is stored in the data center 45 for every city and becomes the data of the digital twin 53 of Japan 49, and the city digital twin data in each country is stored in the data center 45 for every city. It becomes the digital twin data of each country, and the digital twin data of all the above becomes the data of the digital twin 52 of the earth 48.
  • Taro digital twin (Taro's personal AI) 57 name: Taro, AI identification number: 82km9, personal AI data, Taro's personal data (for example, life log, profile, preference). Data, electronic chart data, vital data, etc.) are stored.
  • Taro family's digital twin 58 the names: Taro, Sakura, Shiro, family composition: husband, wife, eldest son, AI identification number: 82km9, 11zk9, gf43y are stored.
  • FIG. 30A the CPU 10 of the user terminal 16 executes a member registration request process S555, a simulation preparation response process S556, and a simulation response process S557 for requesting participation registration in the mirror world 51 as the simulation environment.
  • the CPU 10 of the mirror world server 46 executes a member registration process 550, a simulation preparation process S551, and a simulation process S552.
  • the member registration process and the member registration request process will be described based on FIG. 30B. Both of these processes are for registering members who want to participate as a digital twin in a simulation using the mirror world 51 as a simulation environment.
  • the CPU 10 of the user terminal 16 determines whether or not to apply the registration application in S560. If it is determined that the registration application is not performed, the member registration process ends and the process returns. If it is determined that the registration application is made, in S561, the predetermined items necessary for the registration application are transmitted to the mirror world server 46, and if there is a person who does not have a personal AI, that fact and the blockchain address of the person are sent. Is also transmitted to the mirror world server 46.
  • the specific items required for the registration application are, in the case of a person's digital twin, the AI identification number and personal AI data of the person's personal AI, and in the case of a family digital twin, the family name and family composition, respectively.
  • the CPU 10 of the mirror world server 46 that received it in S565 determines in S566 whether or not the personal AI is already owned.
  • the control proceeds to S567 to perform the generation and sale process of the personal AI. If the information indicating “not done” is not included, the control advances to S568, and a predetermined item including the AI identification number sent in S562 is registered in the mirror world 51.
  • the personal AI generation/sale processing shown in S567 will be described with reference to FIG.
  • the CPU 10 of the mirror world server 46 sends the transaction data and the posted data such as SNS recorded in the block chain address (the block chain address of the user who does not have the personal AI) received in S565 from the block chain. collect.
  • machine learning is performed using transaction data and posted data such as SNS as learning data to generate a learned personal AI.
  • the learned personal AI is sold to the corresponding user.
  • the CPU 10 of the mirror world server 46 determines whether or not a simulation request has been received. If it is determined that the simulation has not been received, the simulation preparation process ends and the process returns. If it is determined that the simulation request has been received, the control advances to S578, and processing for indexing the personal AI group and digital twin that match the requested simulation is performed. For example, in the case of the above-mentioned consumption behavior simulation under the reduced tax rate due to the consumption tax increase, personal AI groups corresponding to general consumers are classified according to demographics such as sex, age, region, and annual income.
  • the personal AI group and the consumer digital maker digital twins and retailer digital twins that are subject to the reduced tax rate are indexed at different rates.
  • a process for requesting the consent of the simulation to the indexed personal AI group and digital twin is performed. Specifically, the user is asked whether or not to consent by transmitting the contents of the simulation to the user terminals 16 of the respective user groups corresponding to the indexed personal AI group and the digital twin.
  • the CPU 10 of the user terminal 16 of each of the indexed personal AI group and the user group corresponding to the digital twin receives the transmitted contents of the simulation in S580, and in S581, agrees to participate in the execution member of the simulation. It is determined whether to do. This determination may be made by the personal AI, or may be made by the user himself. When it is determined that the user does not agree, the simulation preparation response process ends and the process returns. However, when it is determined that the user agrees, the agreement is returned to the mirror world server 46 in S582.
  • the CPU 10 of the mirror world server 46 determines whether or not the amount of consent necessary to execute the requested simulation has been obtained. If it is determined that the AI group and the digital twin are obtained, the AI group and the digital twin for which the consent is obtained are copied and registered in the mirror world 51 as a simulation target in S584. The registered state is shown in FIG. 29 described above.
  • the control proceeds to S585, and the insufficient personal AI group and persona group matching the digital twin (of the manufacturer or the retailer).
  • a user group (including a persona corresponding to a digital twin) is set, a user group (including a user group engaged in a manufacturer or a store) belonging to each persona is selected in S586, and a user belonging to each persona is selected in S587.
  • the group is grouped to collect the transaction data of the user group (including the transaction data as a maker or a store) from the blockchain for each group, and in S588, machine learning is performed using the transaction data as learning data for each persona.
  • the process proceeds to S584.
  • the steps S585 to S588 are the same as the steps S344 to S347 of FIG. 9B, and detailed description thereof will not be repeated here.
  • the CPU 10 of the user terminal 16 which received it in S598 determines whether or not to delete the received personal AI in S599.
  • the received personal AI is the learned AI that has participated in the simulation and has undergone the reinforcement learning (machine learning), and the performance thereof has been improved accordingly, and it is possible to execute the advanced task processing.
  • the user may have received undesired reinforcement learning (machine learning).
  • YES is determined in S599, and the received personal AI is deleted in S601. To do.
  • the simulation is the content desired by the user and it is determined that the received personal AI has undergone the desired reinforcement learning (machine learning)
  • the control advances to S600, and the received learned personal AI is overwritten and saved. ..
  • FIG. 34A is a schematic diagram of a multi-service DAO construction system.
  • Bitcoin is a type of DAO, but the node (minor) has only one type of service called mining (competition of bookkeeping rights), and gives an incentive to give Bitcoin to those who succeed in mining.
  • mining component of bookkeeping rights
  • blocks are added and the Bitcoin system continues autonomously.
  • a DAO having multiple types of services is called a multi-service DAO.
  • a mirror world server 46 that stores multi-service DAO data has a DAO agent 61, a persona agent group 62 that performs service 1, a persona agent group 63 that performs service 2,...
  • the data of the persona agent group 64 performing n is stored.
  • the mirror world server 46 also stores the types of rewards r1, r2,... rn given to each persona agent group in association with reinforcement learning.
  • the terminal 16 of the multi-service DAO builder downloads and installs the DAO agent 61, the required persona agents, and the types of rewards r1, r2,... rn from the mirror world server 46.
  • the terminal 16 is each node 19 that constitutes the public chain 4.
  • the digital twin 66 of the multi-service DAO 65 operated in the public chain 4 constituted by each node 19 is subjected to simulation reinforcement learning in the mirror world 51 to derive the optimal solution for the incentive design in the multi-service DAO.
  • the optimum solution of the incentive design is applied to the actual multi-service DAO 65 in the real world 47 to create the optimum multi-service DAO 65 of the incentive design.
  • the simulation reinforcement learning in the mirror world 51 is executed in the mirror world server 46. The control will be described below.
  • the CPU 10 of the terminal 16 performs a simulation reinforcement learning preparation response process in S606 and a simulation reinforcement learning response process in S607.
  • the CPU 10 of the mirror world server 46 performs a simulation reinforcement learning preparation process in S611, a simulation reinforcement learning process in S612, and a DAO agent reinforcement learning process in S613.
  • the CPU 10 of the terminal 16 determines in S615 whether to request the simulation reinforcement learning. If no request is made, the simulation learning preparation response processing ends and the process returns.
  • the control advances to S616, where multi-service DAO data is transmitted to the mirror world server 46 and requested.
  • This multi-service DAO data includes the type of service. For example, in the case of an innovation-inducing DAO which will be described later with reference to FIGS. 36 to 42, there are five types of services, idea idea, improvement idea, commercialization, infringement discovery, and token purchase, and these services are transmitted.
  • the CPU 10 of the mirror world server 46 receiving it in S620 sets the persona group matching each of the multi-services in S621.
  • DAO innovation-inducing DAO
  • people who often think of invention as a persona group of idea idea and improvement idea people who are interested in commercialization as a persona group of commercialization, patent law and copyright as a persona group of infringement discovery.
  • Those who are familiar with the law and those who are interested in investment as persona groups for token purchase can be considered.
  • a user group belonging to each persona is selected.
  • the group of users listed as the inventor of the patent application as the group of users belonging to the persona group of the idea idea and the improvement idea
  • the manager of the company as the user group belonging to the persona group of the commercialization Users
  • attorneys and lawyers as users belonging to the infringement detection persona group
  • users who have purchased virtual currency such as Bitcoin as users belonging to the token purchasing persona group. ..
  • the user groups belonging to each persona are grouped to collect the transaction data of the user groups for each group from the blockchain, and in S624, machine learning is performed using the transaction data as learning data to learn for each persona. Generate a set of already-persona agents. Both of these controls are the same processes as S346 and S347 in FIG. 9B described above, and thus detailed description thereof will not be repeated here.
  • the group of persona agents is arranged in the multi-service DAO 65 to generate the multi-service DAO digital twin 66, and is registered in the mirror world 51 as a simulation target. The state is shown in FIG.
  • a digital twin 66 of a multi-service DAO 65 consisting of a public chain is built in the mirror world 51.
  • the multi-service DAO digital twin 66 a group of persona agents is provided in S625 and one persona agent is provided for each node.
  • the identification numbers of those persona agents are categorized for each service (idea idea, improvement idea, commercialization, infringement discovery, token purchase) and stored in the mirror world server 46. For example, kc29m, 1w13a,... 9nad8 is stored in the mirror world server 46 as the identification number of the persona agent of the idea generation service.
  • the multi-service DAO 65 is the innovation-inducing DAO described above, and hereinafter, the multi-service DAO will be described by taking the innovation-inducing DAO as an example.
  • the mirror world server 46 also stores a DAO agent that gives a reward (incentive) to the action of each persona agent.
  • This DAO agent derives an optimal solution for incentive design by performing reinforcement learning (machine learning) on the distribution ratio of rewards to be given and the reward amount.
  • FIG. 37 shows a schematic system of the reinforcement learning (machine learning).
  • the environmental state S1 is input to the DAO agent 61 and the persona agents who have performed the idea generation service. 67 is rewarded r11, r12,... r1n.
  • This idea drafting service is a broad concept that includes ideas such as dreams and ideas, business plans, technical ideas, and copyrighted works.
  • the state S1 of the environment is also given to the persona agent group 67 who has performed the idea generation service.
  • the state S1 of the environment is, for example, the origin idea posted content, the price of the floating market price of the token A1 given as a reward to each persona agent 68 who performed the idea generation service, and the like.
  • the state S2 of the environment is input to the DAO agent 61, and the persona who performed those proposal services. Remuneration r21, r22,... R2n is given to the agent group 68.
  • the state S1 of the environment is also given to the group of persona agents 68 who performed the improvement plan service.
  • the state S2 of this environment is, for example, the content of the improvement plan posting, the number of “likes” added to the improvement plan posting, and the like.
  • the subject who gives this “Like” is limited to, for example, only the person (persona agent group 71) who purchased the token A1 given as a reward for posting the origin idea.
  • the reason for limiting (restricting) the subject of giving a "Like” to interested parties is to prevent fraudulent acts.
  • the person who posted the improvement plan persona agent group 68
  • the grantor of “Like” to the persona agent group 69 who performed the commercialization service and the persona agent group 70 who performed the infringement response service also purchased the token A1 for the same reason (persona agent group 71). Limited to only.
  • the actions a31, a32,... A3n of the persona agent group 69 are, for example, posting of business plan, posting of progress of commercialization, posting of actual commercialization execution status, and profit from commercialized business. It is possible to post the amount.
  • the environmental state S3 is also given to the persona agent group 69 who has performed the commercialization service.
  • the state S3 of the environment is, for example, the number of “likes” given to the posting of the business plan, the posting of the progress status of the commercialization, the posting of the profit amount of the commercialized business, and the like.
  • the actions a31, a32,... A3n of the persona agent group 70 may be, for example, posting of a report of discovery of infringement, posting of infringement countermeasure report, posting of license negotiation report, and the like. Further, it may also include a service for posting a report of a patent application and a service for submitting a report of the patent application, which are prerequisites for these services.
  • the state S4 of the environment is also given to the persona agent group 70 who has performed the invasion countermeasure service.
  • the state S4 of the environment is, for example, the number of “likes” given to the report posting of the infringement discovery, the infringement countermeasure report posting, the license negotiation report posting, and the like.
  • the rewards r51, r52,... R5n are given to the persona agents 71 who have performed the service.
  • the state S5 of the environment is also given to the persona agents 71 who have performed the token purchasing service.
  • the state S5 of this environment is, for example, the number of tokens purchased (or the purchase amount).
  • the persona agent group 71 consumes virtual currency (for example, ETH of Ethereum) and purchases the token A1.
  • the purchased token can be converted (cashed) into virtual currency according to the price at the floating market, and the virtual currency can be converted (cashed) into legal currency such as yen or dollar according to the price at the floating market.
  • the rewards r1 to r5 given to each persona agent group are determined by the DAO agent 61 based on the reward table (see FIG. 39(A)).
  • R1 A1+B1 ⁇ b+G1 ⁇ g for the persona agent who performed the idea creation service
  • r2 A2 ⁇ e+B2 ⁇ b+G2 ⁇ g
  • R3 A3 ⁇ e+B3 ⁇ b for the persona agent who performed the conversion service
  • r4 A4 ⁇ e+B4 ⁇ b+G4 ⁇ g
  • the token purchase service for the persona agent who performed the infringement response service.
  • r5 B5 ⁇ b+G5 ⁇ g.
  • A2 to A4, B1 to B5, G1, G2, G4, G5 are coefficients, and the DAO agent 61 converges to the optimum one by the reinforcement learning.
  • A1 is a token
  • g is a license income
  • e is the number of "likes”
  • b is a commercialization income.
  • the persona agents who have performed the improvement service, the commercialization service, or the infringement response service may collectively perform the token purchase service.
  • the persona agent group 67 that has performed the idea-creating service may also perform the improving service, the commercialization service, or the infringement coping service.
  • the DAO agent 61 performs reinforcement learning by itself to optimize the rewards r1 to r5.
  • the DAO agent 61 determines in S630 whether or not each act a of the persona agent group has been received. If it has not been received, the process proceeds to S632, but if it is determined that it has been received, the control proceeds to S631, and the received actions a are stored.
  • S632 it is determined whether or not “Like” has been added, and if not, the process proceeds to S634, but if it is determined that it has been added, in S633, it is liked for each persona agent! Remember e.
  • S634 it is determined whether or not there is a commercialization profit. If it is determined that there is no commercialization profit, the process proceeds to S636, but if it is determined that there is a commercialization profit, the commercialization profit b is stored in S635.
  • S636 it is determined whether or not there is a license profit g. If not, the process proceeds to S638, but if it is determined that there is a license profit g, the license profit g is stored in S637.
  • S638 it is determined whether or not the reward calculation time has come. If not, in S639, the reward table (FIG. 39(A)) is referred to, and each reward is determined. Calculate r1 to r5 and assign to the corresponding persona agent.
  • S640 it is determined whether or not the learning update time has come. If not, the DAO agent reinforcement learning process ends and the process returns. If it is determined that the learning renewal time has come, in S641, the total grant price TT of the token A1 granted as a reward and the current total price TB of the granted token in the floating market are calculated, and in S642, the TB/TT The reward R of the DAO agent is calculated from the value.
  • the value of TB/TT at the time of the previous learning update is compared with the value of TB/TT at the time of the current learning update, and when the value of TB/TT at the current learning update is larger, the large reward R And a small reward R if small.
  • the reward R that can be obtained by the DAO agent 61 becomes large when the total price TB in the floating market of the token rises, and becomes small when the total price TB in the floating market of the token drops.
  • processing for obtaining the actions A1 to A4, B1 to B5, G1, G2, G4, G5 according to the optimal policy ⁇ * is performed by TD learning, and in S644, the reward table.
  • A1 to A4, B1 to B5, G1, G2, G4, G5 are updated to the required acts A1 to A4, B1 to B5, G1, G2, G4, G5.
  • the DAO agent 61 learns the optimal actions A1 to A4, B1 to B5, G1, G2, G4, G5 for raising the total price TB in the floating market of tokens.
  • This learning goal is just an example, and other learning goals include increasing the number of postings of origin ideas, increasing the total number of postings of origin ideas and improvement plans, and increasing the number of commercialization cases. It is also possible to increase the total profit for commercialization.
  • a request for simulation reinforcement learning can operate a learned multi-service DAO (innovation-inducing DAO) 65 with optimized incentive design in the real world 47.
  • this multi-service DAO (innovation-inducing DAO) 65 the “each persona agent group 67 to 71” shown in FIG. 37 becomes an actual user group, and the learned DAO agent is given to the user group performing each service.
  • the optimally designed reward (incentive) is distributed by 61.
  • services such as posted contents and token sale/purchase transaction contents are recorded in the block chain with a time stamp.
  • the blockchain plays the role of a notary public for posting contents of origin ideas and improvement proposals, applying exceptions to loss of novelty (Patent Law Article 30) and measures against derogatory application (Patent Law Article 49, paragraph 1, line 7). , Article 74, Article 123, paragraph 1, item 2) are also easier to carry out.
  • the DAO agent 61 continues machine learning (reinforcement learning) to provide a more optimal incentive that matches the operation situation of the person. It may be designed.
  • the learned persona groups 67 to 71 are also included in the multi-service DAO (innovation induction DAO) 65. It may be transmitted to the requester of the simulation reinforcement learning, and each persona agent group 67 to 71 may function as a counselor for the user group performing each service.
  • each service may be a persona agent operation-type multi-service DAO (innovation-inducing DAO) 65 that is executed only by each persona agent group 67 to 71.
  • the innovation-inducing DAO is not limited to the one generated through the above-mentioned simulation reinforcement learning in the mirror world, and is artificially generated based on another method, for example, an artificial design.
  • the organization is not limited to DAO, and may be an organization having a specific manager or subject (for example, a normal corporation).
  • S655 it is determined whether or not an idea is to be proposed, and if not, the process returns. If it is determined to be performed, in S656, a process of creating an idea is performed. For example, DABUS AI is used to create this idea. For example, the persona agent 67 and DABUS cooperate to create an idea. In S657, the posting content of the idea idea is generated, and in S658, the idea idea posting action a1i is executed.
  • DABUS AI is used to create this idea.
  • the persona agent 67 and DABUS cooperate to create an idea.
  • S657 the posting content of the idea idea is generated, and in S658, the idea idea posting action a1i is executed.
  • step S664 it is determined whether or not to post the improvement plan, and if not, the process returns. If it is determined to post, a process for creating an improvement plan is performed in S665.
  • the improvement proposal is created by using an AI called DABUS, for example.
  • DABUS an AI
  • the persona agent 68 and DABUS work together to create an improvement plan.
  • step S666 the improvement plan posting content is generated, and in step S667, the improvement plan posting action a2i is executed.
  • S674 it is determined whether to commercialize, and if not commercialized, the process returns.
  • a business plan is generated in S675
  • the business plan posting act a3i is executed in S676
  • the commercialization service is performed in S677
  • the performance status posting act a3i is executed in S678.
  • This performance status posting act a3i also includes posting of profits obtained from the above-mentioned commercialization.
  • S684 it is determined whether to execute the infringement coping service. If it is not executed, the process returns. If it is determined to execute, infringement act is investigated in S685, and it is determined in S686 whether infringement is found. It should be noted that, as described above, a patent application or an act of patenting the patent may be performed before the investigation of the infringing act. If no infringing act is found, the process returns. If it is determined that an infringing act has been found, in S687, a warning letter to the alleged infringer is generated, and in S688, the warning letter posting action a4i is executed. Then, in S689, an infringement coping act a4i such as negotiation with a suspected infringer is executed, and in S690, an execution status posting act a4i is executed.
  • S969 it is determined whether or not to purchase the token, and if not, the process returns. If it is determined to purchase, the token purchasing act a5i is executed in S697. Next, in S698, it is determined whether or not the reward r5i has been received from the DAO agent 61, and if not received, the process returns. If it is determined that the action has been received, in step S699, the action a according to the optimum policy ⁇ * is obtained by TD learning based on the received reward r5i.
  • This act a will repeat the act of commercialization service if the received remuneration r5i is satisfied, but if the remuneration r5i is not satisfied, another act (for example, idea-making service, Improvement service, commercialization service, infringement response service, or do nothing) will be selected.
  • the persona agent groups 67 to 71” in FIG. 37 become the user groups in the real world.
  • the token 72 given to the group of users who performed the idea generation service but also the token of the user himself who performs various services (hereinafter referred to as “my token”) may be traded.
  • Another user who has viewed the posted service content expects the poster and purchases the token of the poster himself, so that the price of the my token at the floating market rises.
  • a part of the income of the poster may be paid to the purchaser of My Token at a rate according to the purchase amount.
  • This My Token may be issued within the multi-service DAO 65, but the My Token issued by that professional is linked to the My Token issued to the user by the professional company that issues and distributes the My Token, and the My Token issued by the professional service is stored in the Multi-Service DAO 65. Users may be allowed to buy and sell.
  • VALU Co., Ltd. is a specialist company that issues and distributes My Token.
  • Such a DAO is hereinafter referred to as "element integrated DAO".
  • this element-integrated DAO makes it possible to easily construct a company organization or the like already existing in the real world 47 with the DAO, and the element DAO is generated and prepared in advance for each functional element.
  • a modularized element DAO is prepared for each functional element, and a desired element integrated DAO can be easily constructed by selecting and combining required element DAOs.
  • the element DAO provider 73 is provided with a server 74 and an element DAO protocol DB 75.
  • the element DAO protocol DB 75 includes, for example, an element DAO prepared for each functional element required for a company relationship, an element DAO prepared for each functional element required for an NPO (Nonprofit Organization) relationship, a functional element required for a local government.
  • the element DAO and the like prepared for each are stored.
  • the element-integrated DAO builder receives an order from the client to construct the element-integrated DAO, and installs the element DAO corresponding to the required functional element in the PC terminal 76 via the server 74.
  • A1 element DAO including A1 element agent
  • A2 element DAO including A2 element agent
  • A5 element DAO including A5 element agent
  • A9 element DAO including A9 element agent
  • Each element agent of A1 to A9 is an AI for performing reinforcement learning (machine learning) so that each corresponding element DAO can exhibit the best performance.
  • a general agent is also installed on the PC terminal 76.
  • This controlling agent controls the element agents of each element DAO so as to control so that the entire element integrated DAO is optimized, and the controlling agent itself also performs reinforcement learning (machine learning) to achieve overall optimization.
  • machine learning reinforcement learning
  • each element agent is for maximizing the performance of the element DAO in charge, there is a possibility that the element agent alone may fall into partial optimization, and overall optimization of the element integrated DAO may not be achieved. Therefore, an integrated agent that controls the entire element integrated DAO to be optimized is required. This can be said to be the same as the Pareto optimal solution search in an incomplete information game, for example.
  • the element integrated DAO installed in the PC 67 is installed in a plurality of terminals 16 in order to perform simulation reinforcement learning using the mirror world 51 as a simulation environment, and a block chain digital consisting of the private chain 2 having the terminals 16 as nodes 19
  • the twin 2T is generated in the mirror world 51.
  • the main routine of the simulation reinforcement learning of this element integrated DAO will be explained based on FIG. 44(A).
  • the CPU 10 of the user terminal 16 of the client who requests the simulation reinforcement learning of the element integrated DAO performs the simulation reinforcement learning preparation response process in S674, and performs the simulation reinforcement learning response process in S675.
  • the CPU 10 of the mirror world server 46 performs a simulation reinforcement learning preparation process in S679, and performs a simulation reinforcement learning process in S680.
  • the CPU 10 of the user terminal 16 determines in S679 whether or not to request the simulation reinforcement learning, and if not, returns.
  • DAO data is a functional element of an organization for which simulation reinforcement learning is desired.
  • the personal AI group is a personal AI of people who actually engage in element integrated DAO in the real world 47.
  • the simulation reinforcement learning is performed as described above based on S561, S565 to S568, S562, and S573 to S575. Generate and prepare a personal AI that matches the target element integrated DAO.
  • the CPU 10 of the mirror world server 46 determines in S683 whether or not there is a request for simulation reinforcement learning, and returns if not. If it is determined that there is a request for simulation reinforcement learning, in S684, the personal AI group is copied and placed in the element integrated DAO to generate an element integrated DAO digital twin, and registered in the mirror world 51 as a simulation target. ..
  • the state is shown in FIG.
  • the digital twin 78 of the element integrated DAO 77 of the real world 47 is registered in the mirror world 51.
  • the element-integrated DAO digital twin 78 shown in FIG. 45 is, for example, an element-integrated DAO digital twin 78 of a furniture assembly and sales company, which has respective function elements of material procurement, assembly, advertising, and sales, and is engaged in each function element.
  • the identification numbers of the personal AI groups of the performers are stored in the mirror world server 46.
  • FIG. 46 shows a schematic system of the reinforcement learning (machine learning).
  • a material procurement element agent 80 in the element integrated DAO digital twin 78, a material procurement element agent 80, a personal AI group 84 in charge of material procurement, and an assembly element agent corresponding to each functional element of material procurement, assembly, advertisement, and sales.
  • 81 and personal AI group 85 in charge of assembly
  • advertising element agent 82 and personal AI group 86 in charge of advertising
  • material procurement element agent 80 and personal AI group 84 in charge of material procurement
  • sales element agent 83 and personal AI group 87 in sales Is formed.
  • the control agent 79 controls each of these element agents 80 to 83.
  • the personal AI group 84 in charge of material procurement performs actions a11, a12,..., a1n such as proposals in an internal meeting, and finally executes the action a1 to the digital twin group 88 of the material provider.
  • the state S1 of the digital twin group 88 of the material provider for the action a1 is input to the material procurement element agent 80 and the personal AI group 84 in charge of the material procurement.
  • This state S1 is, for example, the number of materials requested, the number of materials replied to the price negotiation act a1, and the price of the replies.
  • the actions a11, a12,... A1n of the personal AI group 84 in charge of material procurement are also input to the material procurement element agent 80, and the collective actions a1 are also input to the general agent 79 and the material procurement element agent 80. To be done.
  • the material procurement element agent 80 calculates the performance p1 by the personal AI group 84 in charge of the material procurement based on the action a1 and the state S1, and transmits the performance p1 to the general agent 79.
  • the overall agent 79 determines the reward r1 based on the performance p1 and transmits the reward r1 to the material procurement element agent 80.
  • the material procurement element agent 80 determines the reward distribution ratio based on the actions a11, a12,... A1n of the personal AI group 84 in charge of the material procurement, and sets the reward r1 in accordance with the reward distribution ratio to the personal personnel responsible for each material procurement. Distribute to AI84.
  • the personal AI group 85 who is in charge of assembly performs actions a21, a22,..., A2i such as proposals in an internal meeting, and finally executes action a2 that has been put together to the digital twin group 89 of the assembly facility.
  • the state S2 of the digital twin group 89 of the assembly facility for the action a2 is input to the assembly element agent 81 and the personal AI group 85 in charge of the assembly.
  • This state S1 is, for example, the power consumption of the assembly equipment digital twin group 89, the total working time of the personal AI group 85 in charge of assembly engaged in the assembly equipment digital twin group 89, and the like.
  • the actions a21, a22,... A2i of the personal AI group 84 in charge of assembly are also input to the assembly element agent 81, and the aggregated actions a2 are also input to the overall agent 79 and the assembly element agent 81.
  • the assembly element agent 81 calculates the performance p2 by the personal AI group 85 in charge of assembly based on the action a2 and the state S2, and sends the performance p2 to the general agent 79.
  • the overall agent 79 determines the reward r2 based on the performance p2 and transmits the reward r2 to the assembly element agent 81.
  • the assembly element agent 81 determines the reward distribution ratio based on the actions a21, a22,... ..
  • the personal AI group 86 in charge of advertising performs actions a51, a52,..., A5j such as proposals in internal meetings, and finally performs the finalized action a5 to the consumer's personal AI group 90.
  • the state S5 of the consumer's personal AI group 90 for the action a5 is input to the advertising element agent 82 and the personal AI group 86 in charge of advertising.
  • the state S5 is, for example, the presence or absence of purchase of the product by the consumer in response to the product recommendation act a5 to the consumer, the purchase price, and the like.
  • the actions a51, a52,... A5j of the personal AI group 86 in charge of advertising are also input to the advertising element agent 82, and the collective actions a5 are also input to the general agent 79 and the advertising element agent 82.
  • the advertising element agent 82 calculates a performance p5 by the personal AI group 86 in charge of advertising based on the action a5 and the state S5, and sends the performance p5 to the general agent 79.
  • the overall agent 79 determines the reward r5 based on the performance p5 and transmits the reward r5 to the advertising element agent 82.
  • the advertising element agent 82 determines the reward distribution ratio based on each of the acts a51, a52,... ..
  • the personal AI group 87 in charge of sales carries out actions a91, a92,...a9m such as proposals during internal meetings, and finally carries out action a9 to the digital twin group 91 of stores and consumers.
  • the state S9 of the digital twin group 91 of the store and the consumer for the action a9 is input to the sales element agent 83 and the personal AI group 87 in charge of sales.
  • the state S9 is, for example, the total amount of sales in the store.
  • the state S5 of the digital twin 88 of the material provider for the above action a5 is also input to the sales element agent 83.
  • the actions a91, a92,... A9m of the personal AI group 87 in charge of sales are also input to the sales element agent 83, and the collected actions a9 are also input to the general agent 79 and the sales element agent 83.
  • the sales element agent 83 calculates the performance p9 by the personal AI group 87 in charge of sales based on the action a9 and the states S5 and S9, and sends the performance p9 to the general agent 79.
  • the general agent 79 determines the reward r9 based on the performance p9, and transmits the reward r9 to the sales element agent 83.
  • the sales element agent 83 determines the reward distribution ratio based on the actions a91, a92,... A9m of the personal AI group 87 in charge of sales, and distributes the reward r9 to the personal AI 87 in charge of sales according to the reward distribution ratio. ..
  • the material procurement element agent 80 stores the calculation algorithm of the performance p1 and the distribution rate as knowledge. A calculation algorithm for the performance p1 and the distribution rate will be described with reference to FIG.
  • the average purchase price is the average purchase price of materials from the start of simulation reinforcement learning to the present.
  • the average inventory quantity is the average inventory quantity of materials purchased from the start of simulation reinforcement learning to the present.
  • the reward distribution ratio is calculated in proportion to the degree of approval of the collective action a1 when p1 ⁇ 1, and conversely in the case of p1 ⁇ 1 is inversely proportional to the degree of approval of the collective action a1.
  • the material procurement element agent 80 is not limited to those proportional or inversely proportional to the first power of the “degree of approval” but also includes those proportional or inversely proportional to the nth power of the “degree of approval”. Is obtained by performing reinforcement learning (machine learning).
  • the “agreement degree” is the highest degree of approval for the personal AI that has proposed the collective action a1 itself, and the material procurement element agent 80 makes each personal personality based on each action a11, a12,..., A1n of the personal AI. Determine (calculate) the degree of approval of AI.
  • the total working time t of the assembly worker this time is the total working time of the personal AI group 85 in charge of the assembly who has engaged in the digital twin group 89 of the assembly facility this time.
  • the average power consumption is the average power consumption of the assembly equipment from the start of simulation reinforcement learning to the present.
  • the average total working time is an average of the total working time of assembly workers from the start of simulation reinforcement learning to the present.
  • the reward distribution ratio is calculated in proportion to the degree of approval of the collective action a2 when p2 ⁇ 1, and conversely, in the case of p2 ⁇ 1 is inversely proportional to the degree of approval of the collective action a2. calculate.
  • it is not limited to what is proportional or inversely proportional to the first power of the “agreement degree”, but also includes those which are proportional or inversely proportional to the nth power of the “agreement degree”. Obtained by performing reinforcement learning (machine learning).
  • the “degree of approval” has the highest degree of approval for the personal AI that has proposed the collective action a2 itself, and the assembly element agent 81 makes each personal AI based on each action a21, a22,..., A2i of the personal AI. Judge the degree of approval of (calculate).
  • the calculation algorithm of the performance p5 and the distribution rate stored as knowledge by the advertising element agent 82 will be described based on FIG. 47(C).
  • the performance p5 is calculated by the formula of the average total purchase amount K of AI.
  • the average total purchase amount K is the average of the total purchase amounts of the recommended consumer personal AI groups 90 from the start of simulation reinforcement learning to the present. As a result of this calculation formula, if the current total purchase amount k of the recommended consumer personal AI is high, the performance p5 is large.
  • the reward distribution ratio is calculated in proportion to the degree of approval of the collective action a5 when p5 ⁇ 1, and conversely in the case of p5 ⁇ 1 is inversely proportional to the degree of approval of the collective action a5. calculate.
  • the “agreement degree” is the highest degree of approval for the personal AI that has proposed the collective action a5 itself, and the advertising element agent 82 uses each personal AI for each personal AI based on each action a51, a52,... Judge the degree of approval of (calculate).
  • the calculation algorithm of the performance p5 and the distribution rate stored as knowledge by the sales element agent 83 will be described based on FIG. 48(A).
  • the sales element agent 83 sets the total sales amount h and the average total sales amount H at the store this time (from the last YES time point in S749 to the present YES time point) to state S9.
  • the average total sales amount H is the average of the total sales amount in the store from the time when the simulation reinforcement learning is started to the present.
  • k is the total purchase amount of the recommended consumer personal AIs this time
  • K is the average of the total purchase amount of the recommended consumer personal AI groups 90 from the start of the simulation reinforcement learning to the present (Fig. 47(C) and its description).
  • the performance p9 increases as the value obtained by subtracting the current total purchase amount k of the recommended consumer personal AI from the current total sale amount h at the store increases.
  • the total purchase price k of the recommended consumer personal AI this time is the credit of the personal AI group 86 in charge of advertising, and the credit only of the personal AI group 87 in charge of sales is recommended from the total sales amount h at this time in the store. This is because it is a value obtained by subtracting the total purchase amount k of the consumer personal AI this time.
  • the reward distribution ratio is calculated in proportion to the degree of approval of the collective action a9 when p9 ⁇ 1, and conversely in the case of p9 ⁇ 1 is inversely proportional to the degree of approval of the collective action a9. calculate.
  • it is not limited to what is proportional or inversely proportional to the first power of "agreement degree”, but also those which are proportional or inversely proportional to the nth power of "agreement degree”, etc. Obtained by performing reinforcement learning (machine learning).
  • the “approval degree” has the highest approval degree for the personal AI who has proposed the collective action a9 itself, and the sales element agent 83 makes each personal AI based on each action a91, a92,... Judge the degree of approval of (calculate).
  • the reward table 92 stores a formula for calculating the reward distributed by the general agent 79 to each of the element agents 80 to 83.
  • the reward to be distributed is calculated by coefficient ⁇ (profit for the current term) ⁇ (performance sent from the target element agent) ⁇ (sum of performance sent from all element agents).
  • profit for the current term
  • performance sent from the target element agent
  • sum of performance sent from all element agents.
  • the "current period" is from the last YES time point in S675 to the present YES time point.
  • Lt is a profit for the current period
  • A1, A2, A5, and A9 are coefficients as actions determined by the general agent 79.
  • the overall agent reinforcement learning process is executed in S687, the material procurement element agent reinforcement learning process is executed in S688, the assembly element agent reinforcement learning process is executed in S689, the advertisement element agent reinforcement learning process is executed in S690, and the S691 is executed.
  • the sales agent reinforcement learning process is executed, the material procurement personal AI reinforcement learning process is executed in S692, the assembly personal AI reinforcement learning process is executed in S693, and the advertising personal AI reinforcement learning process is executed in S694. Executes the personal AI reinforcement learning process for sales.
  • the overall agent 79 determines whether or not each performance p sent from each element agent 80 to 83 has been received. If not received, the control proceeds to S671, but if it is determined to be received, in S670, each received performance p is stored.
  • the reward R of the general agent 79 is calculated from the profit Lt. This reward R is proportional to the profit Lt.
  • the actions (coefficients) A1, A2, A5, A9 according to the optimal policy ⁇ * are obtained by TD learning based on the reward R.
  • A1, A2, A5, A9 of the reward table 92 are updated to the actions (coefficients) A1, A2, A5, A9 obtained in S681.
  • the general agent 79 will learn the actions (coefficients) A1, A2, A5, A9 that maximize the profit Lt.
  • the material procurement element agent 80 performs the information collection process by the crawler in S684.
  • a crawler is a program that periodically acquires documents and images on the Web and automatically creates a database. Also known as "Bot”, “Spider”, “Robot”.
  • the material procurement element agent 80 receives the information that the crawler circulates on the net and collects in S702. Next, in S703, the received information is stored in the material procurement DB 93.
  • Information stored in the material procurement DB 93 is shown in FIG. 52(B). As shown in the figure, the material procurement DB 93 stores various information necessary for material procurement such as economic information, social information, weather information, inventory information, market information,... Supplier information. ..
  • the material procurement element agent 80 determines in S685 whether or not the actions a11, a12,... A1n from the personal AI group 84 have been received. If it has not been received, the control advances to S687, but if it is determined that it has been received, in S686 the received actions a11, a12,... A1n are stored. In S687, it is determined whether or not the state S1 from the digital twin group 88 of the material supplier has been received, and if not received, the control proceeds to S689. If it is determined that it has been received, the received S1 is stored in S688.
  • the process returns.
  • the reward distribution ratio is calculated based on the reward distribution ratio algorithm shown in FIG. 47(A) (S693).
  • the rewards are multiplied by the respective distribution rates to calculate the respective rewards r11, r12...r1n, and in S695, the respective rewards r11, r12...r1n are given to the respective personal AI groups 84 in charge of material procurement.
  • the action (proportional function or inverse proportional function) according to the optimal policy ⁇ * is obtained by TD learning based on the received reward r1.
  • the proportional function or the inverse proportional function is updated to the one obtained in S696.
  • the material procurement element agent 80 learns the proportional function or inverse proportional function that maximizes the performance p1.
  • the assembling element agent 81 determines in S706 whether or not the actions a21, a22,... A2n from the personal AI group 85 have been received. If it has not been received, the control proceeds to S708, but if it is determined that it has been received, in S707, the received actions a21, a22,... A2n are stored. In S708, it is determined whether or not the state S2 from the digital twin group 89 of the assembly equipment has been received, and if not received, the control proceeds to S710. If it is determined that it has been received, the received state S2 is stored in S709.
  • the advertisement element agent 83 performs information collection processing by the crawler in S723. Details of this process will be described with reference to FIG.
  • the advertisement element agent 83 receives the information collected by the crawler circulating on the net in S740, and stores the received information in the advertisement DB 94 in S741.
  • the collected data stored in the advertisement DB 94 is shown in FIG. 55(B).
  • the advertisement DB 94 stores various action data of Taro, Jiro,... Hanako who are consumers. For example, in the case of Taro, it is determined that there is a high possibility that furniture will be purchased from the information that "I ordered a detached house", and Taro advertises the furniture. In the case of Jiro, it is judged from the information that “married couple buys” that there is a high possibility that he will buy furniture in a new house in order to get married soon, and advertises the furniture to Jiro.
  • the advertising element agent 83 determines in S742 whether or not an action from each personal AI group 86 has been received. If it has not been received, the control advances to S726, but if it is determined that it has been received, in S725, each received action is stored. In S726, it is determined whether or not the state S5 sent from the consumer's personal AI group 90 has been received, and if not received, the control proceeds to S728. If it is determined that the received state is received, the received state S5 is stored in S727.
  • each reward is multiplied by each distribution rate to calculate each reward r51, r52,..., R5j, and in S734, each reward r51, r52,..., R5j is given to the personal AI group in charge of promotion 87.
  • the action (proportional function or inverse proportional function) according to the optimum policy ⁇ * is obtained by TD learning based on the received reward r5.
  • the proportional function or the inverse proportional function is updated to the one obtained in S735.
  • the advertising element agent 82 learns a proportional function or an inverse proportional function that maximizes the performance p5.
  • the sales element agent 84 performs information collection processing by the crawler. Details of this processing will be described with reference to FIG.
  • the sales element agent 84 receives the information collected by the crawler circulating on the net in S760, and stores the received information in the sales DB 95 in S761. Further, in S762, the POS data of the store is stored in the sales DB 95.
  • the collected data stored in the sales DB 95 is shown in FIG. 57(B).
  • the sales DB 95 stores various data such as weather data and POS data.
  • "By date" in the weather information is a concept including by day of the week. Based on the weather information (date-based time-based weather temperature data) and the POS data (date-based time-based sales product data), for example, rearrangement of displayed products in consideration of days of the week, time, and weather conditions can be performed. it can.
  • the sales element agent 84 determines in S745 whether or not the act from each personal AI group 87 has been received. If not received, the control proceeds to S747, but if it is determined that it is received, in S746, each received action is stored. In S747, it is determined whether or not the state S9 sent from the personal AI group 91 of the store and the consumer is received, and if not received, the control proceeds to S749. If it is determined that the received state is received, the received state S9 is stored in S748.
  • each reward is multiplied by each distribution rate to calculate each reward r91, r92...r9m, and in S755, each reward r91, r92...r9m is given to the personal AI group in charge of sales 88.
  • the action (proportional function or inverse proportional function) according to the optimal policy ⁇ * is obtained by TD learning based on the received reward r9.
  • the proportional function or the inverse proportional function is updated to the one obtained in S756.
  • the sales element agent 83 learns a proportional function or an inverse proportional function that maximizes the performance p9.
  • step S765 the personal AI group 84 in charge of material procurement determines whether or not to negotiate with the digital twin group 88 of the material supplier. If not, control proceeds to step S770. If it is determined to negotiate, in S766, the stored data in the financing DB 93 is browsed, the action a1 is determined while making an internal meeting with reference to the stored data (S767), and the digital twin group 88 of the material supplier is negotiated. (S768). In S769, it is determined whether or not the negotiation is completed. If the negotiation is not completed yet, the process returns to S766, and the loop of S767 ⁇ S768 ⁇ S769 ⁇ S766 is repeated. The control proceeds to S770 when it is determined in S769 that the negotiation has ended.
  • the personal AI group 85 in charge of assembly determines in S775 whether or not to make an internal meeting, and if not, the control proceeds to S779. If it is determined to have a meeting, in S776, each personal AI in charge of assembly determines the action a2 while performing an internal meeting. Next, in S777, the assembly equipment digital twin group 89 is test-run according to the action a2, and the validity of the action a2 is verified. In S778, it is determined whether or not the meeting is completed. If the meeting is not completed yet, the process returns to S776, and the loop of S777 ⁇ S778 ⁇ S776 is repeated. If the action a2 is appropriate as a result of the test operation in S777, it is determined in S778 that the meeting has ended, and the control advances to S779.
  • the advertising personal AI group 86 determines whether or not to make an internal meeting. If not, the control proceeds to S789. If it is determined to have a meeting, in S785, each personal AI in charge of advertising decides action a5 while making an internal meeting. Next, in S787, the act a2 to the consumer is executed. In S788, it is determined whether or not the meeting is completed. If the meeting is not completed yet, the process returns to S785, and the loop of S786 ⁇ S787 ⁇ S788 is repeated. When the meeting is determined to be completed in S788, the control proceeds to S789.
  • the personal AI group 87 in charge of sales determines in S791 whether or not to make an internal meeting, and if not, the control proceeds to S795. If it is determined to have a meeting, in step S792, each sales personal AI determines the action a9 while making an internal meeting. Next, in S793, it is determined whether or not the meeting is completed. If the meeting is not completed yet, the process returns to S792, and the loop of S792 ⁇ S793 ⁇ S792 is cycled. When the meeting is determined to be completed in S793, the control proceeds to S794. In S794, the action determined by the above-mentioned meeting is executed for the consumer and the store.
  • the element-integrated DAO for which simulation reinforcement learning has been completed is operated as an actual organization in the real world 47.
  • an actual person (user) in the real world is in charge of the “each personal AI group 84 to 87” in FIG.
  • each of the personal AI groups 84 to 87 for which the simulation reinforcement learning has been completed can serve as a consultant for the actual person (user), and can provide the knowledge, experience, and know-how obtained by the simulation reinforcement learning to the actual person (user). it can.
  • the whole organization such as a company, NPO, and local government is created by combining element DAOs by function, but not the whole organization (for example, material procurement). ) May be constructed by the element DAO.
  • the above-described programs that operate on the user terminal 16 and various servers may be downloaded and installed from a predetermined website or the like, but for example, a recording medium such as a CD-ROM 99 (non-transitory recording).
  • the program may be recorded on a medium and distributed, and a person who purchases the CD-ROM 99 or the like may install the program on the user terminal 16 and various servers (see FIG. 60).
  • the names of Taro, Jiro, Sakura, Saburo, etc. in the digital twin data shown in FIG. 29 can be identified as the same person by using pseudonyms (anonymous) from the viewpoint of personal information protection.
  • the individual may not be specified.
  • the AI identification number or the block chain address may be used as a pseudonym (anonymous).
  • digital twins such as ABC Co., Ltd. also use pseudonyms (anonymous) for the company name (organization name), and they can be identified as the same company (same organization), but they cannot identify a specific company (organization).
  • You may Further, as the human digital twin, a plurality of digital twins by a plurality of personal AIs may be prepared for one human. Furthermore, one digital twin in one person may be configured by a set of a plurality of personal AIs (for example, a set of specialized personal AIs in various fields).
  • the learned persona groups are generated for each persona, but the personal AIs of the user groups belonging to each persona are the same as those of the existing personal AI groups registered in the mirror world 51. You may choose from among them and use it as a group of persona agents. In this case, it is necessary to inquire the user group belonging to each persona whether or not the personal AI may be used for the simulation, and obtain the consent that the personal AI may be used. Each personal AI of the consented user group is copied and used for the simulation, and the learned personal AI group after the completion of the simulation is transmitted to each corresponding user. When each user who receives the information determines that the learned personal AI is useful (necessary), the user overwrites and saves the learned personal AI on the existing personal AI. It should be noted that both the existing personal AI and the learned personal AI may be stored together so that they can be selectively used as needed.
  • multi-agent reinforcement learning the general agent responsible for overall optimization (master agent) distributes rewards to each agent, and the general agent itself also performs reinforcement learning to converge the action of reward distribution to the optimum one.
  • the master agent method is presented.
  • multi-agent reinforcement learning is not limited to this.For example, D-learning that can converge to an optimal solution under the Markov decision process, or Bucket Brigade as a reinforcement learning algorithm in the Classifier System. You can also use Profit Sharing.
  • the simulation using the digital twin is not limited to the digital twin of a person or an organization composed of people (for example, a corporation or NPO).
  • a digital twin of an environment in which the object operates for example, a room of a user's house in which an AI-moved cleaner that moves autonomously operates.
  • Is generated in the cyber space, and the AI installed in the object in the environment digital twin is simulated in advance to perform reinforcement learning (machine learning), and the customized (personalized) object with learned AI installed is applicable. It may be provided to the user.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】記録された情報の真正の保証とその情報の削除権の保証とが二律背反するジレンマを解消する。 【解決手段】2つの片割れ共通鍵KA及びKBで情報を二重暗号化EKA(EKB(情報))してブロックチェーンに記録する。情報保持者は、情報要求者に対し、一方の片割れ共通鍵KBを配布すると共に二重暗号化された情報を片割れ鍵KAで復号DKA(EKA(EKB(情報)))した情報EKB(情報)を送信する。情報要求者はDKB(EKB(情報))を演算して平文の情報を得る。情報保持者が片割れ共通鍵KAをRに更新することにより、情報要求者に対しDR(EKA(EKB(情報)))が送信され、情報要求者がKBで復号DKB(DR(EKA(EKB(情報)))しても、平文を得ることができなくする。

Description

処理システムおよびプログラム
 本発明は、例えば、ブロックチェーン等のような改竄や消去が困難な情報記録方式についての処理システムおよびプログラムに関する。
に関する。
 改竄が困難な情報記録方式としてブロックチェーンが従来から一般的に知られている。このブロックチェーンを利用して貨物輸送に関する各種情報を記録しているものとして、例えば、特許文献1がある。
特開2018-128723号
 しかし、このようなブロックチェーンを利用した情報の記録は、改竄が困難なばかりでなく消去も困難である(以下「消去不可能性」という)。その結果、一旦ブロックチェーンを利用して個人情報の記録を行った場合には、その個人情報主が個人情報を消去したくなっても消去できず個人情報消去権(いわゆる忘れられる権利)が損なわれるという欠点がある。
 つまり、記録された情報の真正の保証とその情報の削除権の保証とが二律背反するジレンマが生じるという欠点が生じる。
 本発明は、かかる実情に鑑み考え出されたものであり、その目的は、記録された情報の真正の保証とその情報の削除権の保証とが二律背反するジレンマを解消することである。
 本発明は、記録対象の情報を暗号化する暗号化処理を行う暗号化手段と、
 前記暗号化処理を経た後の情報を記録する記録手段と、
 前記記録手段により記録された情報に対し、第1鍵と第2鍵とを用いて復号処理を行って平文の情報にする復号手段と、
 前記記録手段により記録された情報を復号できない復号不能化状態にする復号不能化手段と、を備え、
 前記復号手段は、前記第2鍵を秘匿して保持する第2鍵秘匿保持手段を含み、
 前記復号不能化手段は、前記第2鍵秘匿保持手段により保持されている前記第2鍵を他のものに更新することにより復号不能化状態にする。
 好ましくは、前記復号手段は、前記第1鍵を情報の閲覧希望者に配布する第1鍵配布手段をさらに含む。
 好ましくは、前記記録手段により記録された情報を平文にすることなく検索する検索手段をさらに備えている。
 より好ましくは、前記記録手段により記録された情報は個人情報を含み、
 前記復号不能化手段は、個人情報主の要求に応じて当該個人情報主の個人情報を前記復号不能化状態にする。
 本発明の他の局面は、記録対象の情報を暗号化する暗号化処理を行うステップと、
 前記暗号化処理を経た後の情報を記録する記録手段により記録された情報に対し、第1鍵と第2鍵とを用いて復号処理を行って平文の情報にする復号ステップと、
 前記記録手段により記録された情報を復号できない復号不能化状態にするステップとを、
コンピュータに実行させ、
 前記復号ステップは、前記第2鍵を秘匿して保持するステップを含み、
 前記復号不能化状態にするステップは、前記保持するステップにより保持されている前記第2鍵を他のものに更新することにより復号不能化状態にする。
 本発明によれば、記録された情報の真正の保証とその情報の削除権の保証とが二律背反するジレンマを極力解消することができる。
処理システムの全体構成を示すシステム図である。 (A)はブロックチェーンのノードを構成するユーザ端末のHDDに記憶されている情報を説明する図であり、(B)は認定事業者の個人情報DBに記憶されている情報を説明する図である。 (A)はパブリックチェーンのユーザ端末のメインルーチンプログラムを示すフローチャートであり、(B)は個人情報記録処理のサブルーチンプログラムを示すフローチャート及び認定事業者のサーバのフローチャートである。 パブリックチェーンのユーザ端末で実行されるスマートコントラクト処理のサブルーチンプログラムを示すフローチャートである。 (A)はプライベートチェーンのユーザ端末のメインルーチンプログラムを示すフローチャートであり、(B)は個人情報検索処理のサブルーチンプログラムを示すフローチャートである。 プライベートチェーンのユーザ端末で実行されるスマートコントラクト処理のサブルーチンプログラムを示すフローチャートである。 (A)はプライベートチェーンのユーザ端末で実行されるスマートコントラクト処理のサブルーチンプログラムを示すフローチャートの続きであり、(B)はプライベートチェーンのユーザ端末で実行される機械学習処理のサブルーチンプログラムを示すフローチャートである。 プライベートチェーンのユーザ端末で実行されるAIスマートコントラクト生成処理のサブルーチンプログラムを示すフローチャートである。 (A)はプライベートチェーンのユーザ端末で実行されるシミュレーション学習処理のサブルーチンプログラムを示すフローチャートであり、(B)はプライベートチェーンのユーザ端末で実行されるAIスマートコントラクト群生成処理のサブルーチンプログラムを示すフローチャートである。 プライベートチェーンのユーザ端末で実行されるスマートコントラクト信託請負い処理のサブルーチンプログラムを示すフローチャートである。 (A)はパーソナライズドAIスマートコントラクト学習済みモデルの強化学習処理のサブルーチンプログラムを示すフローチャートであり、(B)はコンソーシアムチェーンのユーザ端末により実行されるメインルーチンプログラムを示すフローチャートである。 (A)はコンソーシアムチェーンのユーザ端末により実行されるIoTセンサデータ集計処理のサブルーチンプログラムを示すフローチャートであり、(B)はコンソーシアムチェーンのユーザ端末により実行されるシミュレーション処理のサブルーチンプログラムを示すフローチャートである。 (A)はコンソーシアムチェーンのユーザ端末により実行されるAIスマートコントラクト群生成処理のサブルーチンプログラムを示すフローチャートであり、(B)はコンソーシアムチェーンのユーザ端末により実行されるスマートコントラクト処理のサブルーチンプログラムを示すフローチャートである。 ブロックチェーンを利用して記録された情報を閲覧できない状態にする説明図であり、(A)は閲覧できる通常状態の図であり、(B)は解読不能化状態にして閲覧できないようにした図である。 ブロックチェーンのノードを構成するユーザ端末のHDDに記憶されている情報を説明する図である。 パブリックチェーンのユーザ端末とプライベートチェーンのユーザ端末とのメインルーチンプログラムを示すフローチャートである。 (A)はブロックチェーンへの個人情報記録処理のサブルーチンプログラムを示すフローチャートであり、(B)は記録解読不能処理のサブルーチンプログラムを示すフローチャートである。 個人情報入手処理及び個人情報提供処理のサブルーチンプログラムを示すフローチャートである。 (A)はブロックチェーンのノードを構成するユーザ端末のHDDに記憶されている情報を説明する図であり、(B)は認定事業者の個人情報DBに記憶されている情報を説明する図である。 パブリックチェーンのユーザ端末と認定事業者のサーバとプライベートチェーンのユーザ端末とのメインルーチンプログラムを示すフローチャートである。 ブロックチェーンへの個人情報記録処理及びハッシュ値記録処理のサブルーチンプログラムを示すフローチャートである。 記録解読不能処理のサブルーチンプログラムを示すフローチャートである。 個人情報提供処理と個人情報入手処理と暗号文送信処理とのサブルーチンプログラムを示すフローチャートである。 処理システムの全体構成を示すシステム図である。 パブリックチェーンのユーザ端末と鍵登録センタのサーバとプライベートチェーンのユーザ端末とのメインルーチンプログラムを示すフローチャートである。 (A)はブロックチェーンへの個人情報記録処理及び鍵登録処理のサブルーチンプログラムを示すフローチャートであり、(B)は記録解読不能化要求処理及び記録解読不能処理のサブルーチンプログラムを示すフローチャートである。 片割れ共通鍵提供処理とデータ入手処理とデータ復号処理とのサブルーチンプログラムを示すフローチャートである。 シミュレーション環境としてのミラーワールドの説明図である。 ミラーワールドにおける都市デジタルツインの具体例を示す図である。 ミラーワールドサーバとユーザ端末とのメインルーチンのフローチャートである。 パーソナルAIの生成販売処理のサブルーチンプログラムを示すフローチャートである。 シミュレーション準備処理及びシミュレーション準備応答処理のサブルーチンプログラムを示すフローチャートである。 シミュレーション処理のサブルーチンプログラムを示すフローチャートである。 (A)はマルチ役務DAO構築システムの概略図であり、(B)はミラーワールドサーバとユーザ端末とのメインルーチンのフローチャートである。 シミュレーション強化学習準備処理及びシミュレーション強化学習準備応答処理のサブルーチンプログラムを示すフローチャートである。 マルチ役務DAOデジタルツインをシミュレーション対象としてミラーワールドに登録する説明図である。 マルチ役務DAOのシミュレーション強化学習の概略システム図である。 DAOエージェント強化学習処理のサブルーチンプログラムを示すフローチャートである。 (A)はDAOエージェントが知識として記憶している報酬テーブルを示す図であり、(B)はペルソナエージェント強化学習処理のサブルーチンプログラムを示すフローチャートである。 (A)はアイデア発案役務実行処理のサブルーチンプログラムを示すフローチャートであり、(B)は改良案役務実行処理のサブルーチンプログラムを示すフローチャートである。 (A)は事業化役務実行処理のサブルーチンプログラムを示すフローチャートであり、(B)は侵害対処役務実行処理のサブルーチンプログラムを示すフローチャートである。 (A)はトークン購入役務実行処理のサブルーチンプログラムを示すフローチャートであり、(B)はペルソナエージェント群によるトークン購入に伴うトークンの変動相場での価格変動を説明する図である。 エレメント統合DAO構築システムを示す図である。 (A)はミラーワールドサーバとユーザ端末とのメインルーチンのフローチャートであり、(B)はシミュレーション強化学習準備処理とシミュレーション強化学習準備応答処理とのサブルーチンプログラムを示すフローチャートである。 エレメント統合DAOデジタルツインをシミュレーション対象としてミラーワールドに登録する説明図である。 エレメント統合DAOデジタルツインのシミュレーション強化学習を示す概略システムを図である。 (A)は資材調達エレメントエージェントが知識として記憶しているパフォーマンス及び分配率の算出アルゴリズムを示す図であり、(B)は組立エレメントエージェントが知識として記憶しているパフォーマンス及び分配率の算出アルゴリズムを示す図であり、(C)は宣伝エレメントエージェントが知識として記憶しているパフォーマンス及び分配率の算出アルゴリズムを示す図である。 (A)は販売エレメントエージェントが知識として記憶しているパフォーマンス及び分配率の算出アルゴリズムを示す図であり、(B)は統括エージェントが知識として記憶している報酬テーブルを示す図である。 シミュレーション強化学習処理のサブルーチンプログラムを示すフローチャートである。 統括エージェント強化学習処理のサブルーチンプログラムを示すフローチャートである。 資材調達エレメントエージェント強化学習処理のサブルーチンプログラムを示すフローチャートである。 (A)はクローラによる情報収集処理のサブルーチンプログラムを示すフローチャートであり、(B)は資材調達DBに記憶されている各種データを示す図である。 組立エレメントエージェント強化学習処理のサブルーチンプログラムを示すフローチャートである。 宣伝エレメントエージェント強化学習処理のサブルーチンプログラムを示すフローチャートである。 (A)はクローラによる情報収集処理のサブルーチンプログラムを示すフローチャートであり、(B)は宣伝DBに記憶されている各種データを示す図である。 販売エレメントエージェント強化学習処理のサブルーチンプログラムを示すフローチャートである。 (A)は情報収集処理のサブルーチンプログラムを示すフローチャートであり、(B)は販売DBに記憶されている各種データを示す図である。 (A)は資材調達担当パーソナルAI強化学習処理のサブルーチンプログラムを示すフローチャートであり、(B)は組立担当パーソナルAI強化学習処理のサブルーチンプログラムを示すフローチャートである。 (A)は宣伝担当パーソナルAI強化学習処理のサブルーチンプログラムを示すフローチャートであり、(B)は販売担当パーソナルAI強化学習処理のサブルーチンプログラムを示すフローチャートである。 プログラムのインストール方法を示す説明図である。
 [第1実施形態]
 図1~図13に基づいて本発明の第1実施形態を説明する。まず、図1の全体システムを参照し、3種類のブロックチェーンネットワークであるプライベートチェーン2、コンソーシアムチェーン3及びパブリックチェーン4が集中型オラクル21に接続されている。パブリックチェーン4は、完全にオープンな仕組みで、個人や団体が誰でもそこで取引することが可能である。取引はそのブロックチェーンで効果的に確認ができる。マイニング(記帳権の競争)も自由で誰でも参加できる。コンソーシアムチェーン3は、協会や組合に属しているパートナーのみが使うことができるブロックチェーンである。その中の人達(各ノード)は記帳者に指定される。ブロックの生成も事前に決定され、それ以外の他の人達(ノード)は、取引はできるが記帳権はない。プライベートチェーン2は、ブロックチェーン技術で記帳するのみで、記帳権はオープンではなく個人または企業が独占し、内部の取引だけを記録する。ブロックチェーン同士を繋いで各ブロックチェーン間でトークンやデータの交換を行うには、Polkadotを用いる。Polkadotとは、異なるブロックチェーンを繋ぐためのブロックチェーンである。Substrateを用いて開発されたブロックチェーンはPolkadotに接続することができ、Polkadotに接続することで、Polkadotに接続された他のブロックチェーンとトークンやデータの交換ができるようになる。
 集中型オラクル21は、ブロックチェーンとインターネット1の間でデータの橋渡しをするシステムであり、インターネット1に接続されてネット上に散在している各種情報を収集してブロックチェーンのスマートコントラクトに情報提供を行う。
 プライベートチェーン2、コンソーシアムチェーン3及びパブリックチェーン4の各ノード19は、パーソナルコンピュータ(以下「PC」という)16等のユーザ端末で構成されている。このPC(以下「ユーザ端末」ともいう)16がインターネット1に接続されている。インターネット1には、さらに、SNS(Social Networking Service)40のサーバ20及びブロックチェーンの認定事業者17のサーバ18が接続されている。なお、認定事業者17のサーバ18は、ノード19としてブロックチェーンに参加してもよい。また、PKI(Public Key Infrastructure)での電子証明書を発行する認証局のサーバがインターネット1に接続されていてもよい。
 認定事業者17は、個人情報を預かりその個人準情報主に電子IDを発行すると共に、その個人情報のハッシュ値をブロックチェーンに記録する。預かった個人情報は個人情報データベース(以下「個人情報DB」という)29に格納される。なお、認定事業者17がノード19としてブロックチェーンに参加してもよい。
 PC16は、制御中枢としてのCPU(Central Processing Unit)10、CPU10のワークエリアとして機能するRAM(Random Access Memory)9、データやプログラムを記憶しているROM(Read Only Memory)11、HDD(hard disk drive)12などの記憶部、ディスプレイ、キーボード等の入力操作部7、通信部5、表示部6、インタフェース8、バス13、その他種々のハードウェアによって構成される。サーバ20及びサーバ18等の各種サーバも、PC16と同様のハードウェアによって構成されており、ここでは図示及び説明の繰り返しを省略する。なお、記憶部として、上記HDDに加えてまたはその代わりSDD(Solid State Drive)を用いてもよい。
 コンソーシアムチェーン3のノード19には、IoT(Internet of Things)用デバイス14及びワイヤレスセンサネットワーク15が接続されている。IoT用デバイス14及びワイヤレスセンサネットワーク15からのセンサ信号がノード19に入力されると共に、ノード19からIoT用デバイス14の駆動信号が出力される。IoT用デバイス14は、IoT用の各種センサやアクチュエータ等である。
 ワイヤレスセンサネットワーク15とは、複数のセンサ付無線端末を空間に散在させ、それらが協調して環境や物理的状況を採取することを可能とする無線ネットワークのことである。例えばエネルギーハーベスティングかM2Mあるいは電池などでセンサ装置を作り、例えば金属疲労の劣化等を圧力センサやゲージセンサで常時モニターしておき、その変化があると知らせる。主に橋梁やトンネル等の建造物に設置される。一般的に、複数のセンサノードとゲートウェイセンサノードとを含む。それらノードは、通常1個以上のセンサ、無線チップ、マイクロプロセッサ、電源(電池など)により構成される。ワイヤレスセンサネットワークは、通常、アドホック(ad hoc)機能と、各ノードから中枢ノードへデータを送るためのルーティング機能(routing algorithm)を持つ。つまり、ノード間の通信に障害がでると別の通信経路を自律的に再構築する機能がある。ノードがグループとして連携するため分散処理の要素もある。加えて、外部から電力供給を受けずに長期間動作する機能もあり、そのために省電力機能または自己発電機能を持つ。
 本実施形態では、IoT用デバイス14及びワイヤレスセンサネットワーク15がノード19を介してコンソーシアムチェーン3に接続されているが、ノード19を介することなく、IoT用デバイス14及びワイヤレスセンサネットワーク15の一方または双方自体がコンソーシアムチェーン3のノード19の一部となっていてもよい。
 次に図2(A)を参照し、PC16のHDD12に記憶されている情報を説明する。HDD12には、ユーザの秘密鍵SK、公開鍵PK、共通鍵K1、トラップドア用共通鍵K2、ブロックチェーンでのユーザのアドレス、スマートコントラクト、トークン、人工知能(「AI(Artificial Intelligence)」ともいう)及びブロックチェーンデータ等が記憶されている。なお、ユーザは、自然人ばかりでなく法人をも含む広い概念である。
 秘密鍵SKと公開鍵PKは、PKI(Public key Infratructure)で用いる鍵ペアであり、公開鍵PKで暗号化されたデータを秘密鍵SKで復号する。秘密鍵SKは電子署名にも用いる。共通鍵K1は、例えばDES(Data Encryption Standard)やAES(Advanced Encryption Standard)等の共通鍵暗号に用いる鍵である。共通鍵K1により暗号化されたデータを同じ共通鍵K1を用いて復号する。本実施形態では、暗号化対象の個人情報毎に異なる共通鍵を用いている。第1実施形態では、暗号化個人情報EK1(個人情報)を暗号文についてキーワード検索用の索引(インデックス)が設けられている。そのインデックスは共通鍵K2により暗号化されている。キーワード検索するためには、検索に用いるキーワード(検索クエリ)を共通鍵K2で暗号化した暗号化検索クエリ(これを「トラップドア」という)を用いて検索する。この共通鍵K2をトラップドア用共通鍵K2としてHDD12に記憶している。
 ブロックチェーンでのユーザのアドレスは、以下のプロセスを経て生成される。
1 秘密鍵からECDSAで公開鍵を生成する。
2 公開鍵をハッシュ関数SHA-256に通しハッシュ値を得る。
3 そのハッシュ値をさらにハッシュ関数RIPEMD-160に通しハッシュ値を得る。
4 ハッシュ値の先頭にプレフィックスとして00を加える。
5 ハッシュ関数SHA-256に通す。
6 もう一度ハッシュ関数SHA-256に通す。
7 4バイトのチェックサムを一番後ろに加える。
8 Base58のフォーマットでエンコーディングする。
 スマートコントラクトとは、契約のスムーズな検証、条件確認、執行、実行、交渉を意図したコンピュータプロトコルである。トークンとは、企業や個人よりブロックチェーン上で発行された独自通貨のことである。
 次に、ブロックチェーンデータを説明する。ブロックチェーンの各ブロック内のデータは、前のブロックのハッシュ値、ナンス及び複数の取引のデータ(トランザクションともいう)を含んでいる。また、図示を省略しているが、タイムスタンプもブロックチェーンに埋め込まれている。このようなブロックチェーンは、各ノード19がブロックチェーン処理(後述するS3、S19、S30、S51、S117、S122、S153等参照)を行うことにより生成されて新たなブロックチェーンとして追加される。ブロックチェーン処理は、主に、取引、伝搬及び記録の3つのフェーズからなる。
 取引のフェーズは、一般的にトランザクションといわれる行為であり、売買行為、譲渡行為、貸与(貸渡し)行為等の法律行為を意味する。この取引フェーズは、より具体的には、生成→署名→伝搬と3つのフェーズに分けることができる。
 生成フェーズは、トランザクションの生成を行うことであり、例えば、A氏がB氏に対し「休止状態のPC資源(計算資源)を39005秒貸与して25.78トークンを得る。」と決め、トランザクションを生成したことを電子署名する。この電子著名は、トランザクションデータを所定のハッシュ関数を通すことによりハッシュ値を生成し、トランザクション(取引)の当事者(A氏とB氏)の秘密鍵SKを用いてそのハッシュ値を暗号化したものである。また、認証局によりデジタル公開鍵証明書を発行してもらってもよい。図2では、PC資源(計算資源)を貸与する例を示しているが、貸与対象はそれに限定されるものではなく、例えば、家庭や企業で自己発電した電力、ユーザの専門的知識経験やスキルや人脈(ネット上での人的ネットワークを含む)や信用等の価値、などが考えられる。
 伝搬フェーズは、正しくトランザクションの生成・署名が完了したことを、他のノードに確認してもらうことである。正しくトランザクションの生成・署名が行われなかったと判断された場合、そのトランザクションは破棄される
 記録フェーズは、正しくトランザクションの生成・署名が完了したことが確認された場合に、マイナーがマイニングを行って取引の記録を行うことである。正しく生成・署名が完了したことが確認されたトランザクションは、マイニングプールといわれる場所に移動する。その後、マイナーが、マイニングプールから記録するトランザクションを選んでマイニングを行う。
 マイニングは、ナンスを算出する作業である。ナンスとは、ブロックのデータをハッシュ関数に通したときに先頭に0がたくさん並ぶような非常に小さなハッシュ値が生成されるように調整するための値のことである。ハッシュ値がターゲット値以下になるようなナンスを計算することができると新しいブロックが生成される。
 なお、取引のデータは、図2の右側の取引Iに示すように、ユーザの個人情報を鍵K1で暗号化したEK1(個人情報)のハッシュ値、その電子ID、及び個人情報のインデックスと個人情報の提供に対する対価(図2では2.4トークンで提供)とを鍵K2で暗号化したEK2(インデックス+2.4トークンで提供)も含んでいる。個人情報の具体例としては、ユーザの心拍数、血圧、体温、脳波等のバイタル情報、購買履歴やウェブサイト閲覧履歴等の行動履歴情報、GPS等のユーザの位置情報、人種、信条、社会的身分、病歴、電子カルテデータ、ID(identification)、SNS等への投稿情報等である。
 SNS等への投稿情報は、既にSNS25に投稿されてサーバ20に記憶されている過去の投稿情報をサーバ20から個人情報DB29及びブロックチェーンに移し替えたものである。具体的には、ユーザ自身が自身の過去の投稿情報を全て暗号化して認定事業者の個人情報DB29に記憶させると共にそのハッシュ値をブロックチェーンに記録する。以降、ユーザは、SNS25に投稿するのではなく、投稿内容を認定事業者の個人情報DB29に暗号化して記憶させると共にそのハッシュ値をブロックチェーンに記録する。これにより、ユーザは、個人情報をSNS等の事業者から取戻して自己管理下に置くことが可能になる。
 なお、個人情報の提供に対する対価(図2では2.4トークンで提供)については、暗号化することなく平文のままブロックチェーンに記録してもよい。その場合には、他ユーザが暗号鍵K2を入手しなくてもブロックチェーンを検索して対価を知ることができる。さらに、個人情報の提供に対する対価やPC資源(計算資源)の貸与の対価(図2ではPC資源(計算資源)を39005秒貸与して25.78トークンを得る)等の取引条件を、スマートコントラクトとしてコードの形にし、スマートコントラクトにより取引(法律行為)の自動化を行うようにしてもよい。
 取引Iとして記録されるハッシュ値の対象である暗号化個人情報自体は、認定事業者17の個人情報DB29に記憶されている。具体的には、図2(B)に示すように、認定事業者17が暗号化個人情報EK1(個人情報)に対し発行した電子IDに対応付けて暗号化個人情報EK1(個人情報)が個人情報DB29に記憶されている。
 インデックスとは、暗号化個人情報EK1(個人情報)をキーワード検索するための索引のことである。本実施形態では、インデックスを共通鍵K2により暗号化する共通鍵暗号方式を採用しているため、キーワード検索するためには、検索に用いるキーワード(検索クエリ)を共通鍵K2で暗号化した暗号化検索クエリ(これを「トラップドア」という)を用いて検索する。共通鍵K2は、ユーザ毎に異なる鍵であるが、同じユーザの暗号化インデックスであれば同じ鍵が用いられる。よって、後述するスマートコントラクトにより、例えばユーザAがユーザBに対して共通鍵K2を配布するトランザクションを行えば、ユーザBは、EK2(検索クエリ)を用いてユーザAの全ての暗号化インデックスをブロックチェーン上で検索可能となる。
 なお、暗号文を暗号化したまま検索できる準同型暗号や完全準同型暗号等の検索可能暗号を用いてもよい。その際、準同型暗号や完全準同型暗号を用いて個人情報を暗号化し、その暗号化個人情報をブロックチェーンに直接記録してもよい。また、暗号化個人情報EK1(個人情報)を直接ブロックチェーンに記録するようにしてもよい。
 次に、図3(A)を参照して、パブリックチェーン19のユーザ端末のメインルーチンプログラムのフローチャートを説明する。ステップS(以下単に「S」という)1により、個人情報記録処理が行われ、S2によりスマートコントラクト処理が行われ、S3によりブロックチェーン処理が行われる。
 個人情報記録処理とは、個人情報主が個人情報を暗号化して認定事業者17に登録してその暗号化個人情報のハッシュ値をブロックチェーンに記録する処理である。スマートコントラクト処理とは、予め決められているルールに従って契約の締結及び執行等の法律行為を自動的に行う処理である。ブロックチェーン処理の具体的内容は、図2(A)に基づいて前述したとおりである。
 図3(B)を参照して個人情報記録処理を説明する。S5により、パブリックチェーン19のノード19を構成しているユーザ端末において個人情報の登録操作があったか否か判定される。ない場合にはこの個人情報記録処理がリターンしてS2のスマートコントラクト処理に移行する。個人情報の登録操作があったと判定された場合には、S6により、ユーザ端末のメモリ(HDD12等)に記憶されている個人情報を鍵K1で暗号化した上で秘密鍵SKで電子署名し、かつ、インデックスを鍵K2で暗号化して認定事業者17のサーバ18へ送信する。
 それをS7で受信した認定事業者17のサーバ18は、電子IDを発行すると共に受信した暗号化個人情報であるEK1(個人情報)のハッシュ値を生成する。次に、発行した電子IDをユーザ端末に返信する(S9)。それを受信したユーザ端末は、電子IDをメモリ(HDD12等)に記憶する。認定事業者17のサーバ18は、S10において、電子IDとハッシュ値と暗号化インデックスとをブロックチェーンに記録するための処理を行う。
 S2に示されたスマートコントラクト処理のサブルーチンプログラムのフローチャートを説明する。図4を参照して、S13において、共通鍵K2の配布契約が成立したか否か判定され、成立していない場合にはS15において、ユーザ端末のPC資源(計算資源)の貸与契約が成立したか否か判定され、成立していない場合にはS16において個人情報の提供契約が成立したか否か判定され、成立していない場合にはS17においてオーダーメイド商品等を発注する発注契約が成立したか否か判定され、成立していない場合にはS22において商品等の売買契約が成立したか否か判定され、成立していない場合にはリターンする。これらの判定はスマートコントラクトによって行われる。例えば、前述した対価等をスマートコントラクトとしてコード化している場合には、当事者双方の対価等の条件が合致したか否かをスマートコントラクトが判定し、合致したと判定した場合に、契約の締結及び執行を自動的に行う。
 共通鍵K2の配布契約が成立したと判定された場合には制御がS14へ進み、配布先に共通鍵K2が送信された後、制御がS19へ進む。S19では、その成立した契約をトランザクションとしてブロックチェーンに記録するための処理が行われる。PC資源(計算資源)の貸与契約が成立したと判定された場合には制御がS18へ進み、PC資源(計算資源)の貸与処理が行われる。個人情報の提供契約が成立したと判定された場合には制御がS20へ進み、提供する個人情報の電子IDと個人情報の提供に合意する署名とを提供相手に返信すると共に、提供する個人情報の暗号化に使用した共通鍵K1を提供相手の公開鍵で暗号化して提供相手に返信する。
 発注契約が成立したと判定された場合には制御がS21へ進み、発注処理が行われた後にS19へ進む。売買契約が成立したと判定された場合には制御がS23へ進み、購入対象を入手する処理が実行されてS19へ進む。
 次に、プライベートチェーン2のノード19を構成しているユーザ端末のメインルーチンプログラムのフローチャートを図5(A)に基づいて説明する。S28により個人情報検索処理が行われ、S29によりスマートコントラクト処理が行われ、S30によりブロックチェーン処理が行われ、S31により機械学習処理が行われ、S32によりAIスマートコントラクト生成処理が行われ、S33によりスマートコントラクト信託請負い処理が行われる。AIスマートコントラクトは、「一体化タイプ」と「連携タイプ」との両者を含む概念である。「一体化タイプ」とは、AIとスマートコントラクトとが一体化し契約(法律行為)のデータに基づいて機械学習を行いスマートコントラクト自体をAI化したものである。「連携タイプ」とは、契約(法律行為)のデータに基づいて機械学習を行ったAIとスマートコントラクトとが連携したものである。連携タイプの場合、学習済みAI(以下「連携用AI」という)が状況に応じてスマートコントラクトの追加、変更及び更新等を行う。
 個人情報検索処理とは、ブロックチェーンに記録されている暗号化インデックスをトラップドア(暗号化検索クエリ)により検索する処理である。スマートコントラクト処理とは、予め決められているルールに従って契約の締結及び執行等の法律行為を自動的に行う処理である。ブロックチェーン処理の具体的内容は、図2(A)に基づいて前述したとおりである。機械学習処理とは、多数のユーザの個人情報を学習用データとして機械学習して人工知能の学習済みモデルを生成する処理である。より具体的には、個人情報主を特定できない形の膨大な個人情報を学習用データとして機械学習して人工知能の一般的学習済みモデルを生成した後、個人情報主を特定できるデータ(例えばブロックチェーンにおけるアドレス)毎に分類された個人情報を用いて個人情報主毎(ブロックチェーンのアドレス毎)にパーソナライズされたパーソナライズド学習済みモデルを生成する処理である。
 AIスマートコントラクト生成処理とは、契約(法律行為)に関する個人情報を学習用データとして機械学習して人工知能によるスマートコントラクトの学習済みモデルを生成する処理である。より具体的には、個人情報主を特定できない形の膨大な契約(法律行為)に関する個人情報を学習用データとして機械学習して人工知能によるスマートコントラクトの一般的学習済みモデルを生成した後、個人情報主を特定できるデータ(例えばブロックチェーンにおけるアドレス)毎に分類された契約(法律行為)に関する個人情報を用いて個人情報主毎(例えばブロックチェーンにおけるアドレス毎)にパーソナライズされたパーソナライズドAIスマートコントラクト学習済みモデルを生成する処理である。
 スマートコントラクト信託請負い処理とは、契約の締結及び執行等の法律行為を自動的に行う処理を本人から請負い本人に代わって実行するサービスを行う処理である。より具体的には、信託者用にパーソナライズされたパーソナライズドAIスマートコントラクト学習済みモデルを生成し、そのパーソナライズドAIスマートコントラクト学習済みモデルを用いて信託者に代わって法律行為を実行する。その実行の結果に基づいてAI用の報酬を決め、その報酬によりパーソナライズドAIスマートコントラクト学習済みモデルをさらに強化学習させる。
 次に、図5(B)に基づいて、S28に示された個人情報検索処理のサブルーチンプログラムのフローチャートを説明する。S37により共通鍵K2の記憶があるか判定され、ない場合にはリターンする。後述のS45によりK2が記憶されている場合には、S37により共通鍵K2の記憶があると判定されて制御がS38へ進む。S38では、K2で暗号化した検索クエリ(トラップドア)でブロックチェーン上の暗号化インデックスを検索する処理が行われる。その検索を行なった結果、入手したい個人情報があるか否かがS39により判定される。入手したい個人情報がないと判定された場合にはリターンするが、入手したい個人情報があると判定された場合にはS40により、その入手希望個人情報の電子IDが記憶される。
 次に、図6及び図7(A)に基づいて、S29に示されたスマートコントラクト処理のサブルーチンプログラムのフローチャートを説明する。S42により検索希望個人情報があるか否か判定される。この判定は、例えば、未だ検索していない個人情報主のスマートコントラクトと順次交渉して条件が合致した場合にその個人情報主の個人情報を検索希望個人情報と判定する。S42により検索希望個人情報がないと判定された場合は、S46により入手希望個人情報の記憶があるか否か判定され、ないと判定された場合には制御が図7(A)のS55へ進み、PC資源(計算資源)の貸与契約が成立しているか否か判定され、成立していないと判定された場合にはS56により発注契約が成立しているか否か判定され、成立していないと判定された場合にはS57により売買契約が成立しているか否か判定され、成立していないと判定された場合にはリターンする。
 S42により検索希望個人情報があると判定された場合には制御がS43へ進み、共通鍵K2を個人情報主に要求する。具体的には、検索希望個人情報の個人情報主のブロックチェーン上でのアドレス宛てに自身のアドレス及び属性証明書(Attribute Certificate)を送信して共通鍵K2を要求する。S44によりK2の返信があったか否か判定し、あるまで待機する。個人情報主または個人情報主のスマートコントラクトは、送信されてきた属性証明書を確認してK2を返信してよいか否か判定し、返信して良いと判定した場合にK2を返信する。その個人情報主からK2の返信があった段階で制御がS45へ進み、返信されたK2を記憶した後、制御がS54へ移行する。S54では、その成立した契約をトランザクションとしてブロックチェーンに記憶する処理がなされる。この場合は、返信した個人情報主のアドレスから返信を受信したユーザのアドレスへインデックスの暗号化に用いている共通鍵K2が配布された旨の契約がブロックチェーンに記憶される。
 S46により入手希望個人情報の記憶があると判定された場合は制御がS47へ進み、入手希望個人情報を個人情報主に要求する処理が成される。具体的には、入手希望個人情報の個人情報主のブロックチェーン上でのアドレス宛てに自身のアドレス及び属性証明書を送信して入手希望個人情報を要求する。それを受けたパブリックチェーンのユーザ端末では、スマートコントラクトが属性証明書を確認すると共に個人情報の提供条件が合致するか否か判定し、個人情報を提供してよいと判定した場合に(S16でYES)、提供する個人情報の電子ID及び個人情報の提供に合意する署名を返信すると共に、提供する個人情報の暗号化に使用した共通鍵K1を提供相手の公開鍵で暗号化して返信する(S20参照)。
 その返信があった場合には、S48により個人情報主からの返信があったと判定されて制御がS49に進み、返信されてきた暗号化共通鍵であるEPK(K1)を自身の秘密鍵SKで復号化する演算、すなわち、DSK(EPK(K1))を行ってK1を算出する。次に、S50により、個人情報主から返信された電子IDと署名を認定事業者17のサーバ18へ送信する処理が行われる。それを受けた認定事業者17のサーバ18は、送信されてきた署名を確認した上で、受信した電子IDに基づいて個人情報DB29(図2(B)参照)を検索し、受信した電子IDに対応付けて記憶している暗号化個人情報EK1(個人情報)を読出して返信する。
 その返信を受信すればS51によりYESと判定されて制御がS52へ進み、その返信された暗号化個人情報であるEK1(個人情報)をS49で算出されたK1により復号化する演算、すなわち、DK1(EK1(個人情報))を行って平文の個人情報を得る。その個人情報をS53により記憶する。その後S54に進み、その個人情報の提供契約をトランザクションとしてブロックチェーンに記録するための処理がなされる。
 次に、パブリックチェーンのユーザ端末との間でPC資源(計算資源)の貸与契約が成立すれば(S15でYES)、S55によりYESと判定されて制御がS58へ進み、PC資源(計算資源)の借用処理が行われる。その後制御がS54へ移行し、その貸借契約をトランザクションとしてブロックチェーンに記録するための処理がなされる。パブリックチェーンのユーザ端末との間で発注契約が成立すれば(S17でYES)、S56により発注契約が成立したと判定されて制御がS59へ進み、その発注に対する受注を記憶する処理が行われる。その後制御がS54へ移行し、その受注契約をトランザクションとしてブロックチェーンに記録するための処理がなされる。
 パブリックチェーンのユーザ端末との間で売買契約が成立すれば(S15でYES)、S57によりPC資源(計算資源)の貸与契約が成立したと判定されて制御がS60へ進み、販売対象を提供するための処理が行われる。その後制御がS54へ移行し、その売買契約をトランザクションとしてブロックチェーンに記録するための処理がなされる。なお、以上説明したスマートコントラクト処理において、スマートコントラクトに基づいたプライベートチェーンユーザ端末16での判断(例えば、S42、S46、S55、S56、S57)のみに基づいて行為(例えば、S42、S47、S58、S56、S60)を執行するのではなく、当該スマートコントラクトの所有者の同意を得た上で行為を執行するようにしてもよい。この所有者の同意は、以降記載しているスマートコントラクトによる契約の実行に際しても行なうようにしてもよい。
 次に、図7(B)に基づいて、S31に示された機械学習処理のサブルーチンプログラムのフローチャートを説明する。S63により、個人情報主を特定できない形で記憶している膨大な個人情報を学習用データにする処理が行われる。この機械学習に採用されている学習アルゴリズムとしては、例えば、教師あり学習としての回帰や識別、教師なし学習としてのモデル推定やデータマイニング、中間的手法としての強化学習や深層学習等、種々のものが用意されている。
 次に、S64により、借用中のPC資源(計算資源)を利用して学習用データによる機械学習を行う。例えば、教師あり学習としての回帰の場合は、入力情報(ベクトルx)と正解情報yとからなる大量のデータセットを訓練データ(学習用データ)にする。教師あり学習の場合、入力xを正解yに写像する関数ci(x)(ci:x→y)を学習するものであるため、学習済みモデルは関数ciを含むものとなる。なお、機械学習手段34が行う機械学習は、教師あり学習に限定されるものではなく、モデル推定やパターンマイニング(データマイニング)等の教師なし学習、教師あり学習と教師なし学習との中間的手法である半教師あり学習や強化学習や深層学習等、どのようなものであってもよい。
 S64による機械学習によって一般的学習済みモデルが生成され、それを記憶する(S65)。この一般的学習済みモデルは、多数のユーザの個人情報であって個人情報主を特定できない形で記憶している膨大な個人情報を学習用データとしたモデルであり、多数のユーザに広く適用できる平均的な学習済みモデルである。
 次に、S66により受注記憶があるか否か判定され、ない場合にはリターンするが、ある場合にはS67により、人工知能の受注か否か判定される。人工知能の受注でない場合にはリターンするが、人工知能の受注である場合には、S68により、発注者のアドレス宛てに個人情報を要求する処理がなされる。発注者から個人情報の返信があればS69によりYESと判定されてS70に進む。S70では、返信された個人情報に基づいて一般的学習済みモデルをパーソナライズしてパーソナライズド学習済みモデルを生成する処理がなされる。この一般的学習済みモデルをパーソナライズしてパーソナライズド学習済みモデルを生成する処理については、特許第6432859号公報に記載されている。パーソナライズに必要な個人情報は、ブロックチェーンを利用して収集されるため、ブロックチェーンの匿名性を担保して収集されることにより、プライバシーの問題を極力回避できる利点がある。次に、S71により、発注者のアドレス宛てにパーソナライズド学習済みモデルが送信される。
 次に、図8に基づいて、S32に示されたAIスマートコントラクト生成処理のサブルーチンプログラムのフローチャートを説明する。S80により、個人情報主を特定できない形で記憶している膨大な個人情報の中から契約(法律行為)に関する個人情報を抽出して学習用データにする処理がなされる。次に、S81により、借用中のPC資源(計算資源)を利用して学習用データによる機械学習が行われる。S80及びS81の処理は、前述のS63及びS64で説明したものと同様であり、ここでは説明の繰り返しを省略する。
 次に、S82により、一般的AIスマートコントラクトの学習済みモデルを生成して記憶する処理が行われる。次に、S83により、シミュレーション学習処理が実行される。このシミュレーション学習処理は、本来多数の人間同士が行っている契約の検証、条件確認、執行、実行、交渉等の法律行為を、多数のAIスマートコントラクト群に肩代わりさせてコンピュータ内で仮想的に実行(シミュレーション)させ、各AIスマートコントラクトに対し成果に応じた報酬を与えて強化学習を行うものである。現実世界での強化学習ではなくコンピュータ内でのシミュレーションによる強化学習のため、短時間に膨大な強化学習が可能となる利点がある。強化学習とは、ある環境の状態に置かれたエージェントが、行動を選択したときに与えられる報酬をもとに、初期状態からゴールまでの累積報酬を最大化するような方策を獲得する仕組みのことである。強化学習ではAIの一種であるソフトウェアエージェント(以下「エージェント」という)と環境が相互作用することで学習を進めていく。ここにエージェントとはAIの一種であり、ユーザやソフトウェアなどと通信しながら自らがある程度の判断能力を持って自律的にふるまい永続的に活動するソフトウェアのことである。エージェントが環境に対して或る行為aを行うことによりその環境の状態sが変化し或る目的状態に達することにより報酬rがエージェントに与えられる。エージェントは、この報酬rを最大化することを目的として状態sを入力として行為aを出力する関数を学習する。
 強化学習は次の単純なステップを繰り返すことで時間が進行していく。
1 エージェントは環境から受け取った観測o(あるいは直接、環境の状態s)を受け取り、方策πに基いて環境に行為aを返す。
2 環境はエージェントから受け取った行為aと現在の状態sに基いて、次の状態s′に変化し、その遷移に基いて次の観測o′と、報酬rと呼ばれる直前の行動の良し悪しを示す1つの数(スカラー量)をエージェントに返す。
3 時間の進行:t←t+1
 ここで←は代入操作を表す。
 強化学習として、例えば、アルファゼロ型強化学習アルゴリズムを用いてもよい。このアルファゼロ型強化学習アルゴリズムは、DQN(Deep Q-Network)などのアルゴリズムとことなり、探索にモンテカルロ木探索(Monte Carlo tree search,MCTS)を用い、価値(Value)と方策(Policy)をすべてニューラルネットワークに予測させ、木探索によるセルフプレイで得られた経験のみで予測を修正する構成になっている。従来のアルファ碁に比べ、価値を予測するバリューネットワークと方策を予測するポリシーネットワークが1つのニューラルネットワークに統合され、マルチタスク学習により予測精度の向上が図られている。また、ニューラルネットワークの性能向上により、木探索でのプロセッサレイアウト(報酬を貰うまで探索木を伸ばす)処理が不要となり、より高速に探索を行える。さらに、進化計算(evolutionary computation)、遺伝的アルゴリズム(genetic algorithm)、敵対的生成ネットワーク(Generative adversarial networks)を用いるようにしてもよい。
 次にS84により、AIスマートコントラクトの受注記憶があるか否か判定され、ない場合にはリターンする。前述のS59により受注が記憶されている場合にはS84によりYESと判定されて制御がS85へ進み、記憶されている受注がシミュレーション学習済みAIスマートコントラクトの受注であるか否か判定される。シミュレーション学習済みAIスマートコントラクトの受注でない場合には、パーソナライズドAIスマートコントラクト学習済みモデルの受注であり、その場合には制御がS86へ進み、発注者のアドレス宛てに契約(法律行為)に関する個人情報を要求する処理が行われる。発注者から個人情報の返信があった段階でS87によりYESと判定されて制御がS88へ進む。
 S88では、返信された契約(法律行為)に関する個人情報に基づいて一般的AIスマートコントラクトの学習済みモデルをパーソナライズしてパーソナライズドAIスマートコントラクト学習済みモデルを生成する処理が行われる。この一般的AIスマートコントラクトの学習済みモデルをパーソナライズしてパーソナライズドAIスマートコントラクト学習済みモデルを生成する処理については、特許第6432859号公報に記載されている。そのパーソナライズド学習済みモデルがS89により発注者のアドレスへ送信される。
 一方、シミュレーション学習済みAIスマートコントラクトの受注の場合にはS85によりYESと判定されて制御がS90へ進み、シミュレーション学習済みAIスマートコントラクトが発注者のアドレスへ送信される。
 次に、図9(A)に基づいて、S83に示されたシミュレーション学習処理のサブルーチンプログラムのフローチャートを説明する。S334により、シミュレーションの入力があったか否か判定され、ない場合にはリターンする。このシミュレーションは、プライベートチェーン2のユーザ端末によって入力されるものであり、例えば、政府が採用しようとしている政策や法律(例えば、消費増税に伴う軽減税率、改正出入国管理法、イギリスのEU(European Union)からの離脱、ベーシックインカムの部分的または全面的採用、日本国憲法9条の改正等)が採用されたと仮定した場合における、株取引や先物取引等の投資市場での取引シミュレーション、会社経営シミュレーション、または消費行動シミュレーション等である。さらには、新商品(金融商品や生命保険を含む)や新サービスの各種メディアによるプロモーションのシミュレーション等でもよい。S334によりシミュレーションの入力があったと判定されれば制御がS335に進み、AIスマートコントラクト群生成処理が実行される。
 このAIスマートコントラクト群生成処理のサブルーチンプログラムのフローチャートを図9(B)に基づいて説明する。S344により、借用中のPC資源(計算資源)を利用して、入力されたシミュレーションにマッチするペルソナ群を設定する処理が行われる。ペルソナとは、一般的には、企業や商品やサービスの典型的なターゲットとなる人物像を仮想の人物として定義したものである。本実施形態では、ペルソナとは、シミュレーション内容がターゲットとする典型的な人物像を仮想の人物として定義したものである。例えば、前述の消費増税に伴う軽減税率下での消費行動シミュレーションの場合には、一般消費者に相当するペルソナであって、性別、年代別、地域別、年収別等にグルーピングした各グループ毎にペルソナとして設定する。
 設定されるペルソナの数は、グループに属するユーザ数に比例した数にする。例えば、一般消費者の年代別人口分布が10代5%、20代5%、30代10%、40代10%、50代20%、60代20%、70代20%、80代5%、90代5%、の場合に、10代を代表するペルソナ数が1、20代を代表するペルソナ数が1、30代を代表するペルソナ数が2、40代を代表するペルソナ数が2、50代を代表するペルソナ数が4、60代を代表するペルソナ数が4、70代を代表するペルソナ数が4、80代を代表するペルソナ数が1、90代を代表するペルソナ数が1と、設定する。
 次に、S345により、借用中のPC資源(計算資源)を利用して、各ペルソナに属するユーザ群を選定する処理が行われる。次に、S346により、ペルソナ毎に属するユーザ群をグループピングしてグループ毎にユーザ群の取引データをブロックチェーンから収集する処理が行われる。例えば、前述の消費増税に伴う軽減税率下での消費行動シミュレーションの場合には、ユーザ群を、性別、年代別、地域別、年収別等にグルーピングし、そのグループ毎にユーザ群の取引データをブロックチェーンから収集する。このS345、S346におけるユーザ群の選定及びユーザ群の取引データの収集は、例えば、インターネットアンケート調査会社が保有するアンケート回答用モニター会員のデータベースを利用するのが有用である。インターネットアンケート調査会社では、性別,年代別,居住地,未婚,既婚,職業,世帯年収等の属性に対応付けてアンケート回答用モニター会員の連絡先(メールアドレス等)をデータベースに記憶しており、その属性別のモニター会員データを利用する。後述するS145及びS146、S586及びS587、S622及びS623等においても同様に、インターネットアンケート調査会社が保有するアンケート回答用モニター会員のデータベースを利用するのが有用である。次に、S347により、借用中のPC資源(計算資源)を利用して、取引データを学習データとして機械学習を行ってペルソナ毎に学習済みのAIスマートコントラクトを生成する処理が行われる。このAIスマートコントラクトは、対応するペルソナの設定数と同じ数だけ生成される。これにより、シミュレーションを実行するための環境が整い、その環境内でシミュレーションを行う。
 図9(A)に戻り、上記のようにして生成された各AIスマートコントラクトが行為aに従った契約(法律行為)を執行する(S336)。この「行為a」とは、S338による強化学習の結果としての行為aである。次に、S337により、各AIスマートコントラクト同士で成立した契約をブロックチェーンに記録する処理が行われる。
 次に、S338により、借用中のPC資源(計算資源)を利用して、成立した契約内容に基づいて報酬rを算出し、TD学習により最適政策πに従った行為aを求める処理が行われる。例えば、前述の消費増税に伴う軽減税率下での消費行動シミュレーションの場合には、(増税前の出費額-増税後の出費額)が小さい値ほど高い報酬rを与える。そして、S339によりシミュレーションが終了したか否か判定され、未だ終了していない場合には制御がS336へ戻り、S337→S338→S339→S336を繰り返し巡回して強化学習を進行させる。シミュレーションが終了した段階でS339によりYESと判定されて制御がS340へ進み、1番高い報酬rを得たAIスマートコントラクトを記憶した後リターンする。なお、1番高い報酬rを得たAIスマートコントラクトに限定されるものだはなく、例えば上位5%のAIスマートコントラクトを記憶してもよい。また、S337によるブロックチェーンへの記録を必ずしも行わなくてもよく、その場合には、前述した連携タイプにおいては、S335、S336、S340及びS347における「AIスマートコントラクト」を「連携用AI」と変更する。つまり、コンピュータ内でのシミュレーションの場合、現実世界での契約(法律行為)の執行を伴わないため、ブロックチェーンへの記録を行わない場合には、わざわざスマートコントラクトを用いる必要がなく、各連携用AI同士が行為aを実行して強化学習を行えば事足りるためである。強化学習を終了し実際の引用段階では、学習済み連携用AIがスマートコントラクトと連携して契約の執行を行ってブロックチェーンに記録するようにすればよい。
 次に、図10に基づいて、S33に示されたスマートコントラクト信託請負い処理のサブルーチンプログラムのフローチャートを説明する。S94により、スマートコントラクト信託の受注記憶があるか否か判定され、受注記憶がないと判定された場合にはリターンする。前述のS59により記憶されている受注記憶の内容を確認してスマートコントラクト信託の受注である場合にはS94によりYESと判定されて制御がS95へ進む。S95では、発注者のアドレス宛てに契約(法律行為)に関する個人情報を要求し、発注者から個人情報が返信された段階でS96によりYESと判定されて制御がS97へ進む。
 S97では、返信された契約(法律行為)に関する個人情報に基づいて一般的AIスマートコントラクトの学習済みモデルをパーソナライズしてパーソナライズドAIスマートコントラクト学習済みモデルを生成する処理が行われる。この一般的AIスマートコントラクトの学習済みモデルをパーソナライズしてパーソナライズドAIスマートコントラクト学習済みモデルを生成する処理については、特許第6432859号公報に記載されている。
 次に、S98により、発注者のアドレスとパーソナライズドAIスマートコントラクト学習済みモデルとを対応付けて記憶する処理が行われる。この記憶したパーソナライズドAIスマートコントラクト学習済みモデルを用いて発注者に対し信託請負い処理を行う(S99)。次に、S100により、パーソナライズドAIスマートコントラクト学習済みモデルの強化学習処理が実行される。
 図11(A)に基づいて、S100に示されたパーソナライズドAIスマートコントラクト学習済みモデルの強化学習処理のサブルーチンプログラムのフローチャートを説明する。強化学習において、状態stで行為atを行なうときの価値をQ(st,at)とした場合のQ値を推定する方法として、環境をモデル化する知識、すなわち、状態遷移確率と報酬の確率分布が与えられている場合はモデルベースの手法を用いればよいが、環境モデルが未知の場合、TD(Temporal Difference)学習を用いる。先ず、環境の探索が必要なため、ε-greedy法を用いる。探索の初期はいろいろな行為を試し、落ち着いてくると最適な行為を多く選ぶように、温度の概念を導入する。温度をTとして、次の式で表される確率に従って行為を選ぶ。
 P(a|s)={exp(Q(s,a)/T)}/{Σexp(Q(s,b)/T} (なおΣの下にb∈Aが記載されており、上記式ではその記載を省略している)
 ここに、aは行為、Q(s,a)は状態sで行為aを行なうときの価値、
 Tをアニーリング(焼き鈍し)における温度と呼び、高ければ行為を等確率に近い確率で選択し、低ければ最適なものに偏らせる。学習が進むにつれて、Tの値を小さくすることで、学習結果が安定する。このようなQ値の推定方法は、前述した強化学習及び後述する強化学習全てに適用してもよい。また、強化学習等の機械学習を行うコンピュータとしては、ノイマン型の一般的なコンピュータを用いているが、ニューラル・ネット・プロセッサー(NNP)を用いてもよい。NNPのチップ上には本物のニューロンをモデルにした「人工ニューロン」が多数搭載されており、各ニューロンはネットワークでそれぞれ連携し合う。また、「量子アニーリング方式」を採用した量子コンピュータを用いてもよい。特に、「量子アニーリング方式」を採用した量子コンピュータを用いることにより、機械学習における最適化計算の所要時間を大幅に短縮できる。
 S105により、パーソナライズドAIスマートコントラクト学習済みモデルによる信託請負い処理を行った結果に対する評価を信託者から受信する。次に、S106により、受信した評価に基づいて報酬rを算出する処理が行われる。次に、S107により、借用中のPC資源(計算資源)を利用して、TD学習により最適政策πに従った行為aを求める処理が行われる。次に、S108により、行為aに従ったコントラクトを信託者の代理として実行する。その結果に対する評価を信託者から受信することにより(S105)、S106~S108の処理が実行される。
 次に、図11(B)に基づいて、コンソーシアムチェーン3のノードを構成するユーザ端末のメインルーチンプログラムのフローチャートを説明する。S114によりIoTセンサデータ集計処理が実行され、S115によりスマートコントラクト処理が実行され、S116によりシミュレーション処理が実行され、S117によりブロックチェーン処理が実行される。ブロックチェーン処理の具体的内容は、図2(A)に基づいて前述したとおりである。
 次に、図12(A)に基づいて、S114に示されたIoTセンサデータ集計処理のサブルーチンプログラムのフローチャートを説明する。S120により、IoTセンサデータを種類毎、期間毎、地域毎等に分類してグルーピングする処理が行われる。この処理は、IoTセンサデータばかりでなくワイヤレスセンサネットワークからのデータも含めて処理される。次に、S121により、グルーピングされた各データの価値を決定する処理が行われる。この決定された価値に応じて、データの提供に対する対価(トークンの量)が対応するデータ毎にスマートコントラクトとしてコード化される。次に、S122により、グルーピングされた各データをブロックチェーンに記録する処理が行われる。
 次に、図13(B)に基づいて、S115に示されたスマートコントラクト処理のサブルーチンプログラムのフローチャートを説明する。S150により、データの入手希望者との売買契約が成立したか否か判定される。この判定は、スマートコントラクトとしてコード化されたデータの提供に対する対価(トークンの量)について互いの条件が合致することにより、自動的にS150によりYESと判定される。S150によりNOと判定された場合は制御がS151へ進み、PC資源の貸与契約が成立したか否か判定され、成立していない場合にはリターンする。
 S150によりYESと判定された場合は制御がS152へ進み、入手希望者のアドレスにデータを送信し、その対価としてのトークンを取得する処理が行われる。その成立した契約がS153によりトランザクションとしてブロックチェーンに記録される。一方、PC資源(計算資源)の貸与契約が成立した場合には、制御がS154へ進み、PC資源(計算資源)の借用処理を行い、その契約がS153によりトランザクションとしてブロックチェーンに記録される。
 次に、図12(B)に基づいて、S116に示されたシミュレーション処理のサブルーチンプログラムのフローチャートを説明する。このシミュレーション処理は、本来多数の人間同士が行っている契約の検証、条件確認、執行、実行、交渉等の法律行為を、多数のAIスマートコントラクト群に肩代わりさせてコンピュータ内で仮想的に実行(シミュレーション)させ、或る条件下においてどのようなシミュレーション結果になるかを検証するものである。上記「或る条件下」の具体例としては、政府が採用しようとしている政策や法律(例えば、消費増税に伴う軽減税率、改正出入国管理法、イギリスのEU(European Union)からの離脱、ベーシックインカムの部分的または全面的採用、日本国憲法9条の改正等)、マーケティング関連の条件(例えば、新商品(金融商品や生命保険を含む)や新サービスの価格や対価の設定、各種メディアによるプロモーション効果等)、投資市場関連の条件(例えば、先物取引における気象条件、株式市場における金融引き締め政策等)等が、考えられる。
 S134により、シミュレーションの依頼があったか否か判定され、ない場合にはリターンする。S134によりシミュレーションの依頼があったと判定されれば制御がS135に進み、AIスマートコントラクト群生成処理が実行される。
 このAIスマートコントラクト群生成処理のサブルーチンプログラムのフローチャートを図13(A)に基づいて説明する。S144により、借用中のPC資源(計算資源)を利用して、依頼されたシミュレーションにマッチするペルソナ群を設定する処理が行われる。ペルソナとは、一般的には、企業や商品やサービスの典型的なターゲットとなる人物像を仮想の人物として定義したものである。本実施形態では、ペルソナとは、シミュレーション内容がターゲットとする典型的な人物像を仮想の人物として定義したものである。例えば、前述の消費増税に伴う軽減税率のシミュレーションの場合には、一般消費者に相当するペルソナであって、性別、年代別、地域別、年収別等にグルーピングした各グループ毎にペルソナとして設定する。
 設定されるペルソナの数は、グループに属するユーザ数に比例した数にする。例えば、一般大衆の年代別人口分布が10代5%、20代5%、30代10%、40代10%、50代20%、60代20%、70代20%、80代5%、90代5%、の場合に、10代を代表するペルソナ数が1、20代を代表するペルソナ数が1、30代を代表するペルソナ数が2、40代を代表するペルソナ数が2、50代を代表するペルソナ数が4、60代を代表するペルソナ数が4、70代を代表するペルソナ数が4、80代を代表するペルソナ数が1、90代を代表するペルソナ数が1と、設定する。
 次に、S145により、借用中のPC資源(計算資源)を利用して、各ペルソナに属するユーザ群を選定する処理が行われる。次に、S146により、ペルソナ毎に属するユーザ群をグループピングしてグループ毎にユーザ群の取引データをブロックチェーンから収集する処理が行われる。例えば、前述の消費増税に伴う軽減税率のシミュレーションの場合には、ユーザ群を、性別、年代別、地域別、年収別等にグルーピングし、そのグループ毎にユーザ群の取引データをブロックチェーンから収集する。次に、S147により、借用中のPC資源(計算資源)を利用して、取引データを学習データとして機械学習を行ってペルソナ毎に学習済みのAIスマートコントラクトを生成する処理が行われる。このAIスマートコントラクトは、対応するペルソナの設定数と同じ数だけ生成される。これにより、シミュレーションを実行するための環境が整い、その環境内でシミュレーションを行う。
 図12(B)に戻り、上記のようにして生成された各AIスマートコントラクトが行為aに従った契約(法律行為)を執行する(S136)。この「行為a」とは、S138による強化学習の結果としての行為aである。次に、S137により、各AIスマートコントラクト同士で成立した契約をブロックチェーンに記録する処理が行われる。さらに、シミュレーションの進行による状況の変遷状況をブロックチェーンに記録する。例えば、前述の消費増税に伴う軽減税率のシミュレーションの場合には、シミュレーションの進行に伴って内需や景気がどのように変化したかをブロックチェーンに記録する。
 次に、S138により、借用中のPC資源(計算資源)を利用して、成立した契約内容に基づいて報酬rを算出し、TD学習により最適政策πに従った行為aを求める処理が行われる。そして、S139によりシミュレーションが終了したか否か判定され、未だ終了していない場合には制御がS136へ戻り、S137→S138→S139→S136を繰り返し巡回して強化学習を進行させる。シミュレーションが終了した段階でS139によりYESと判定されて制御がS140へ進み、シミュレーション結果を導出する処理が行われた後にリターンする。
 シミュレーション結果を導出する処理の具体例としは、例えば、消費増税に伴う軽減税率の採用に伴う景気変動のシミュレーションの場合には、シミュレーションの結果景気動向指数の各項目がどのように変動したかを導出する。株式市場における金融引き締め政策に伴うシミュレーションの場合には、シミュレーションの結果株式市場がどのように変動したかを導出する。また、消費増税に伴う軽減税率の具体的態様(例えば、なにを軽減税率対象品目にするかや各軽減税率対象品目毎の軽減税率等)を複数態様に変動させながら最適な軽減税率の態様を決定するという、シミュレーション最適化の手法を採用してもよい。この場合、最適な軽減税率の態様として、(税収増加率(%)+景気動向指数としてのディフュージョン・インデックス(DI)/50)を期待値Eとし、その期待値Eを最大化するシミュレーション結果を得るようにする。シミュレーションにおけるコントロールパラメータ(軽減税率の態様)をθとし、シミュレーションの結果をY(θ)とし、maxE[Y(θ)]におけるθを求める。このようなシミュレーションを最適化する具体的手法として、例えば、メタヒューリスティックなアルゴリズムとして粒子群最適化法(Particle Swarm Optimization:PSO)、目的関数の解析的表現が困難な場合や目的関数の微分に関する情報を用いることが出来ない状況下で最適解を求めるDFO(derivative free optimization)等を用いる。なお、S137によるブロックチェーンへの記録を必ずしも行わなくてもよく、その場合には、前述した連携タイプにおいては、S135、S136及びS147における「AIスマートコントラクト」を「連携用AI」と変更する。つまり、コンピュータ内でのシミュレーションの場合、現実世界での契約(法律行為)の執行を伴わないため、ブロックチェーンへの記録を行わない場合には、わざわざスマートコントラクトを用いる必要がなく、各連携用AI同士が行為aを実行して強化学習を行えば事足りるためである。
[変形例]
 (1) 認定事業者17は、ユーザの暗号化個人情報EK1(個人情報)を記憶しているが、それに代えて、暗号化個人情報であるEK1(個人情報)を直接ブロックチェーンに記録するようにしてもよい。
 (2) 図2の取引Cや取引Fのような個人情報以外の取引データも、個人情報と同様に鍵K1等で暗号化してブロックチェーンに記録してもよい。
 (3) 前述の説明では各ブロックチェーンネットワーク2、3、4のノード19の動作処理を示したが、プライベートチェーン2のノード19について示した動作処理を他のブロックチェーンネットワーク3、4のノード19で行なってもよく、コンソーシアムチェーン3のノード19について示した動作処理を他のブロックチェーンネットワーク2、4のノード19で行なってもよく、パブリックチェーン4のノード19について示した動作処理を他のブロックチェーンネットワーク2、3のノード19で行なってもよい。この変形例は、後述する実施態様においても同様に適用してもよい。
 (4) 借用したPC資源(計算資源)を利用してブロックチェーンにおけるマイニング(記帳権の競争)を行なうようにしてもよい。その際、第1実施形態のように時間単価でPC資源(計算資源)を貸与するようにしてもよいが、マイニング(記帳権の競争)に成功したマイナーが得られる利益(トークン等)の何割かをPC資源(計算資源)の貸与者に分配(配当)するようにしてもよい。その配当割合(配当量)は、PC資源(計算資源)の貸与量(PCの貸与台数×貸与時間等)に比例するように制御する。
 (5) 前述したPC資源(計算資源)や自家発電の電力等の貸与(提供)対象を借用(利用)して何らかのプロジェクトを遂行するようにしてもよい。プロジェクトの具体例としては、研究開発(例えば、人工知能開発、機械学習、人ゲノム解析、新製品開発、新薬開発等)、レアメタルや石油や天然ガスや海洋資源等の探査・発掘、宇宙開発等が、考えられる。その際、第1実施形態のように貸与(提供)対象の貸与量(提供量)に応じた対価(トークン等)を貸与者(提供者)が取得するようにしてもよいが、プロジェクトの成功によってプロジェクト遂行者(個人または法人または団体)が得られる利益の何割かを資源貸与者(資源提供者)に分配(配当)するようにしてもよい。その配当割合(配当量)は、資源の貸与量(提供量)に比例するように制御する。
 さらに、資源貸与者(資源提供者)が配当自体を受け取るのではなく、配当を受け取る権利(以下「配当享受権」という)を取得するようにしてもよい。この配当享受権は、例えば、プロジェクト遂行者が発行したトークンの形で貸与者(提供者)が取得するように制御してもよい。そして、貸与者(提供者)は、取得した配当享受権(トークン)を、そのときの相場に応じた価格(トークン)で他人に譲渡できるように制御してもよい。このように構成することにより、配当享受権(トークン)を、あたかも株式市場におけるセカンダリーマーケットでの株取引のように運用することができる。
 (6) S71では生成されたパーソナライズド学習済みモデルを発注者のアドレス宛てに送信して納品しているが、それに加えてまたはその代わりに、生成されたパーソナライズド学習済みモデルを活用して発注者にパーソナライズされたサービスを提供するようにしてもよい。
 (7) 前述の説明ではスマートコントラクトにより契約の検証、条件確認、執行、実行、交渉を自動化しているが、契約(取引等の法律行為)の締結及び執行を行う前にユーザ本人の承諾を求めるように制御してもよい。また、全ての契約(取引等の法律行為)についてユーザ本人の承諾を求めるのではなく、予め定められた重要な契約(取引等の法律行為)か否かを判定し、重要な契約(取引等の法律行為)であると判定された場合にユーザ本人の承諾を求めるように制御してもよい。さらに、締結及び執行が急がれる契約(取引等の法律行為)であるか否かを判定し、急がれる契約(取引等の法律行為)であると判定された場合には、ユーザ本人の承諾を得ることなく契約(取引等の法律行為)の締結及び執行する制御を行い、後からユーザ本人に報告するように制御してもよい。この変形例は、後述する実施態様においても同様に適用してもよい。
 (8) 各ブロックチェーンのノード19を構成するユーザ端末16等及び各種サーバで動作する前述したプログラムは、所定のウェブサイト等からダウンロードしてインストールしてもよいが、例えばCD-ROM99等の記録媒体(非一時的(non-transitory)な記録媒体)に記録させて流通させ、そのCD-ROM99等を購入した者がプログラムをユーザ端末16及び各種サーバにインストールしてもよい(図60参照)。
 (9) 前述の説明では集中型オラクル21を採用しているが、ネットワーク全体で分散して管理される分散型オラクルを採用してもよい。ネットワーク全体で分散している複数のオラクルが収集した情報を寄せ集めて平均的な情報を抽出し、その平均的情報を正しい情報とみなしてブロックチェーン内に取込みスマートコントラクトに用いる。これは、ジェームズ・スロウィッキーが書籍『みんなの意見は案外正しい』で提唱した「集団において情報を寄せ集めることで、その集団が出す結論は集団の中の個人の誰が考えるよりもよい結論を導くことができる」という理論に基づいたものである。そして、平均的情報に近い情報を収集したオラクルに対しトークン等の報酬を与えることにより、分散型オラクルを運用するインセンティブを与える。
 まとめると、ネットワーク上で分散している複数のオラクルが収集した情報を寄せ集めて平均的な情報を抽出する抽出手段と、該抽出手段により抽出された平均的情報を採用する採用手段と、オラクルに対し報酬を与える報酬付与手段とを備え、前記複数のオラクルは、第1オラクルと第2オラクルとを含み、前記報酬付与手段は、前記第1オラクルよりもより前記平均的情報に近い情報を収集した前記第2オラクルにより多くの報酬を付与する。なお、第1オラクルに付与する報酬は0であってもよく、また、マイナスであってもよい。
 (10) 前述のS13のK2配布契約の成立及びS16の個人情報の提供契約の成立のうちの一方または双方の判定について、個人情報主本人の意思を特定する情報(以下「意思特定情報」という)に従って成立させるか否判定する機能を設けてもよい。具体的には、個人情報主が、実店舗や電子ショッピングモール等において自分にマッチする商品やサービスをレコメンドしてもらうときに、自身が所持する携帯端末(スマートフォンまたはICカード等)の特定情報を読取らせると共に契約を成立させてよい旨の暗証番号を入力することによって、特定情報及び暗証番号からなる意思特定情報を当該個人情報主のスマートコントラクトに通知し、その意思特定情報に従ってスマートコントラクが判定する。
 このようにすることにより、ユーザは、SNS等の事業者から取戻して自己管理化に置いた個人情報を自分の意思によって自分のために活用することができる。
[第2実施形態]
 次に、第2実施形態を説明する。この第2実施形態は、ブロックチェーンを利用して記録した個人情報に対し、暗号化技術を応用することにより、自己の個人情報を削除する個人情報削除権(いわゆる忘れられる権利)の必要性に応えるものである。ブロックチェーンは一旦記録した情報が改竄不可能または改竄が極めて困難である点が特徴であり、そのために、一旦記録した情報の削除が不可能または極めて困難である(これを以下「削除不可能性」という)。一方、欧州におけるGDPR(General Data Protection Regulation)では、記録した個人情報をその個人情報主が削除できる個人情報削除権(いわゆる忘れられる権利)を保証することが要求されている。このGDPRの個人情報削除権の要請とブロックチェーンにおける削除不可能性とが真っ向から対立し二律背反するジレンマとなっている。つまり、この第2実施形態は、削除したい情報の削除権を保証する要請と削除不可能性とが二律背反するジレンマを解決するものである。その概要を図14に基づいて説明する。
 図14(A)は削除権を行使していない通常状態を示しており、図14(B)は削除権を行使して情報を解読不能化した状態を示している。図14(A)を参照して、情報保持者(情報主ともいう)40が情報を2つの片割れ共通鍵KAとKBを用いて二重暗号化する。式で表せばEKA(EKB(情報))となる。次に、その暗号化情報であるEKA(EKB(情報))をブロックチェーン等に記録する。なお、片割れ共通鍵KAは秘匿状態で情報保持者40のユーザ端末等に記憶しておく。
 この状態で、情報要求者41が情報主40に対し情報を要求したときには、情報主40が、記録している暗号化情報であるEKA(EKB(情報))を鍵KAで復号する。式で表せば、DKA(EKA(EKB(情報))=EKB(情報)となる。そして、このEKB(情報)と片割れ共通鍵KBとを情報主40が情報要求者41へ送信する。
 それらを受信した情報要求者41は、受信したEKB(情報)を受信した片割れ共通鍵KBで復号する。式で表せば、DKB(EKB(情報))=情報 となる。これにより、情報要求者41は、平文の情報を得ることができる。
 次に、削除権を行使して情報を解読不能化した状態を図14(B)に基づいて説明する。情報主40は、解読不能化したい情報の暗号化に用いた片割れ鍵KAとKBとのうちの一方KAを乱数R(≠KA)に更新する。次に、片割れ共通鍵KBを既に記憶している情報要求者41が情報主40に対し情報を要求したときには、情報主40が、記録している暗号化情報であるEKA(EKB(情報))を鍵R(乱数)で復号する。式で表せば、D(EKA(EKB(情報))となる。そして、このD(EKA(EKB(情報))を情報主40が情報要求者41へ送信する。
 それを受信した情報要求者41は、既に記憶している片割れ共通鍵KBでD(EKA(EKB(情報))を復号する。式で表せば、DKB(D(EKA(EKB(情報))))≠情報 となる。このように、解読不能化状態では、既に片割れ共通鍵KBを記憶している情報要求者41であっても平文の情報を得ることができず、削除したい情報の削除権を保証する要請と削除不可能性とが二律背反するジレンマを解決することができる。なお、ブロックチェーン等に記録する個人情報等の情報をコピー&ペーストできないようにコピー禁止処理を施しておれば、情報の削除権の保証はより完全なものとなる。なお、2つの鍵KA及びKBを用いた二重暗号に限定する必要はなく、3つ以上の鍵(n個の鍵)を用いた多重暗号を用いてもよい。この場合、n個の鍵のうち、少なくともいずれか1つの鍵を乱数Rに置換することにより、解読不能化状態となる。
 以上説明した第2実施形態の概要をより詳細に説明する。第1実施形態との共通点については説明の繰り返しを省略し主に相違点について説明する。図15は第1実施形態における図2に対応するものである。ブロックチェーン内の取引Iを参照し、この第2実施形態では、暗号化個人情報であるEKA(EKB(個人情報))を直接ブロック内に記録している。よって、第2実施形態では認定事業者17は不要である。ここに、KAとKBは片割れ共通鍵である。
 次に、図16を参照し、プライベートチェーン2のノード19を構成しているユーザ端末とパブリックチェーン4のノードを構成しているユーザ端末16とのメインルーチンのフローチャートを説明する。このメインルーチンは、第1実施形態で示した動作処理のフローチャートを省略し、第1実施形態で示した動作処理に対し追加または変更する動作処理のフローチャートのみを示している。パブリックチェーン4のノードを構成しているユーザ端末16では、S160によりブロックチェーンへの個人情報記録処理が行われ、S161により記録解読不能処理が行われ、S162により個人情報提供処理が行われる。ライベートチェーン2のノード19を構成しているユーザ端末では、S170により個人情報入手処理が行われる。
 ブロックチェーンへの個人情報記録処理とは、個人情報をブロックチェーンに記録する処理である。記録解読不能処理とは、削除権を行使して情報を解読不能化にするための処理である。個人情報提供処理とは、パブリックチェーン4のユーザ端末16がプライベートチェーン2のユーザ端末に個人情報を提供する処理である。個人情報入手処理とは、プライベートチェーン2のユーザ端末がパブリックチェーンのユーザ端末16から個人情報を入手する処理である。
 図17(A)に基づいて、ブロックチェーンへの個人情報記録処理のサブルーチンプログラムのフローチャートを説明する。S174により、2つの乱数を生成する処理が行われる。例えば、DESの場合には、56ビットの乱数を2つ生成して、それら56ビット乱数を片割れ共通鍵KA及びKBとする。ADSの場合には、128ビットの乱数を2つ生成して、それら128ビット乱数を片割れ共通鍵KA及びKBとする。
 次に、S177において、EKA(EKB(個人情報))とEK2(インデックス+個人情報提供の対価)と暗号文識別子とをブロックチェーンに記録する処理が行われる。この暗号文識別子は、暗号化個人情報であるEKA(EKB(個人情報))を特定するための識別子であり、第1実施形態における電子IDに相当するものである。
 次に、S183により、KA及びKBと暗号文識別子とを対応付けてユーザ端末16のHDD12に記憶する。
 次に、図17(B)に基づいて、記録解読不能処理のサブルーチンプログラムのフローチャートを説明する。S190により、ブロックチェーンに記録した暗号文(例えば、EKA(EKB(個人情報))等)のうち解読不能にしたい暗号文があるか否か判定される。ない場合にはリターンするが、解読不能にしたい暗号文がある場合には制御がS191に進み、その暗号文の暗号文識別子に対応付けて記憶している片割れ共通鍵KAをHDD12から検索する処理が行われる。
 次に、S192により、乱数Rが生成される。例えば、DESの場合には、56ビットの乱数を生成する。ADSの場合には、128ビットの乱数を生成する。次に、S193により、生成した乱数R=KA であるか否か判定される。生成した乱数RがHDD12に記憶されている片割れ共通鍵KAと同じであれば制御がS192に戻り、再度乱数を生成し直す。S193によりNOと判定されれば制御がS194へ進み、HDD12に記憶されている片割れ共通鍵KAをRに更新する処理が行われる。
 次に、図18に基づいて、個人情報提供処理と個人情報入手処理とのサブルーチンプログラムのフローチャートを説明する。プライベートチェーン2のユーザ端末において、S198により、入手希望個人情報の片割れ共通鍵KBが既に記憶されているか否か判定される。パブリックチェーン4のユーザ端末16からプライベートチェーン2のユーザ端末へ、入手希望個人情報の片割れ共通鍵KBが既に配布されておれば、S198により記憶ありと判定されて制御がS203へ進むが、未だに記憶されていない場合には制御がS199へ進む。
 S199では、入手希望個人情報の暗号文識別子をパブリックチェーン4のユーザ端末16へ送信して片割れ共通鍵KBを要求する処理が行われる。それをS200で受信したパブリックチェーン4のユーザ端末16では、暗号文識別子で指定された個人情報を提供する取引を行うか否かをスマートコントラクトにより判定し(S16参照)、個人情報を提供する取引を行う場合にはS201により、個人情報の提供に合意する署名と暗号文識別子に対応する片割れ共通鍵KBとが返信される。
 それをS202で受信したプライベートチェーン2のユーザ端末では、S203により、署名と入手希望個人情報の暗号文識別子とがパブリックチェーン4のユーザ端末16へ送信される。それをS206で受信したパブリックチェーン4のユーザ端末16では、暗号文識別子で指定された個人情報を提供する取引を行うか否かをスマートコントラクトにより判定し(S16参照)、個人情報を提供する取引を行う場合にはS207により、DKA(暗号化個人情報)またはDR(暗号化個人情報)を演算して返信する処理が行われる。具体的には、ユーザ端末16のHDD12に記憶されている片割れ共通鍵KAが既に乱数Rに更新されている場合にはDR(暗号化個人情報)を演算して返信されるが、未だ乱数Rに更新されていない場合にはDKA(暗号化個人情報)を演算して返信する処理が行われる。
 パブリックチェーン4のユーザ端末16からの返信をS208で受信したプライベートチェーン2のユーザ端末では、S209により、DKB(DKA(暗号化個人情報))=平文 または、DKB(DR(暗号化個人情報))≠平文 を演算する処理が行われる。具体的には、DKA(暗号化個人情報)を受信した場合には、DKB(DKA(暗号化個人情報))=DKB(DKA(EKA(EKB(個人情報))))=平文 を演算して平文の個人情報を得る。一方、(DR(暗号化個人情報))を受信した場合には、DKB(D(暗号化個人情報))=DKB(D(EKA(EKB(個人情報))))≠平文 が演算されることになり、平文の個人情報を得ることができない。これにより、削除したい情報の削除権を保証する要請と削除不可能性とが二律背反するジレンマを解決することができる。
[変形例]
 (1) 前述の説明では、暗号化個人情報であるEKA(EKB(個人情報)をブロックチェーンに直接記録しており、この大量の暗号化個人情報を各ノード(パブリックチェーン4では全てのノード)に記憶させていたのでは、各ノード(ユーザ端末)が膨大な記憶容量を要求されるという不都合が生じる。これを解決する手段として、分割したデータを複数のコンピュータで保存する秘密分散技術を応用する。データを分割して断片化し、各断片化データを複数のノードに分散保存する。また各ノードに保存されるデータを冗長化して(重複して)記憶させる。十分な冗長性を持たせることにより、断片データの一部が失われても復元に支障はなく、かつ、ブロックチェーンとしての改竄の困難性も担保できる。さらに、断片化データの記憶を担う記憶量を各ノードの意思で決めるように制御し、担う記憶量に応じた対価をトークン等の形で各ノードに付与するように制御してもよい。
 (2) 前述の説明では、暗号化個人情報であるEKA(EKB(個人情報)をブロックチェーンに直接記録していたが、図19~図23に示す変形例では、暗号化個人情報EKA(EKB(個人情報))を認定事業者17の個人情報DB29に記憶し、その暗号化個人情報のハッシュ値をブロックチェーンに記録するようにしている。図19(A)に示す取引Iには、EKA(EKB(個人情報))のハッシュ値+EK2(インデックス+2.4トークンで提供)+暗号文識別子と電子署名とが記録されている。また、図19(B)に示す認定事業者17の個人情報DB29には、暗号文識別子に対応付けて暗号化個人情報EKA(EKB(個人情報))が記憶されている。
 図20に基づいて、この変形例でのプライベートチェーン2のノード19を構成しているユーザ端末とパブリックチェーン4のノード19を構成しているユーザ端末16と認定事業者17のサーバ18とのメインルーチンのフローチャートを説明する。認定事業者17のサーバ18は、ノード19としてブロックチェーンに参加している。S215によりブロックチェーンへの個人情報記録処理が実行され、S216により記録解読不能処理が実行され、S217により個人情報提供処理が実行され、S220によりハッシュ値記録処理が実行され、S221により暗号文送信処理が実行され、S224により個人情報入手処理が実行される。
 ブロックチェーンへの個人情報記録処理は、パブリックチェーン4のノード19を構成しているユーザ端末16が認定事業者17のサーバ18に対し、暗号化個人情報EKA(EKB(個人情報))を送信する処理である。ハッシュ値記録処理は、暗号化個人情報EKA(EKB(個人情報))等を受信した認定事業者17のサーバ18がそれを記憶すると共にそのハッシュ値を生成してブロックチェーンに記録する処理である。記録解読不能処理は、解読不能にしたい暗号化個人情報EKA(EKB(個人情報))等の暗号文を解読不能にするための処理である。個人情報提供処理は、パブリックチェーン4のノード19を構成しているユーザ端末16がプライベートチェーン2のノード19を構成しているユーザ端末へ個人情報を提供するために実行する処理である。個人情報入手処理は、プライベートチェーン2のノード19を構成しているユーザ端末が個人情報を入手する処理である。暗号文送信処理は、認定事業者17のサーバ18がプライベートチェーン2のノード19を構成しているユーザ端末に対し暗号化個人情報EKA(EKB(個人情報))等の暗号文を送信する処理である。
 以下に、各処理の詳細を各サブルーチンプログラムのフローチャートに基づいて説明するが、第2実施形態との相違点について主に説明する。
 図21に基づいて、ブロックチェーンへの個人情報記録処理とハッシュ値記録処理とのサブルーチンプログラムのフローチャートを説明する。S231により、EKA(EKB(個人情報))とEK2(インデックス+個人情報提供の対価)とが認定事業者17のサーバ18へ送信される。それをS240で受信したサーバ18では、S241により、EKA(EKB(個人情報))のハッシュ値と暗号文識別子とを生成する処理が行われる。次に、S242により、EKA(EKB(個人情報))のハッシュ値とEK2(インデックス+個人情報提供の対価)と暗号文識別子とをブロックチェーンに記録する処理が行われる。
 次にS243により、暗号文識別子をパブリックチェーン4のユーザ端末16へ送信する処理が行われる。それをS232で受信したパブリックチェーン4のユーザ端末16では、S233により、片割れ鍵KA及びKBと受信した暗号文識別子とを対応付けてHDD12に記憶する処理が行われる。認定事業者17のサーバ18では、S244により、EKA(EKB(個人情報))と暗号文識別子とを対応付けて個人情報DB29に記憶する処理が行われる。
 図22に示す記録解読不能処理は、第2実施形態の図17(B)で既に説明したものおと同じであるため、説明の繰り返しを省略する。
 次に、図23に基づいて、個人情報提供処理と個人情報入手処理と暗号文送信処理とのサブルーチンプログラムのフローチャートを説明する。この変形例では、プライベートチェーン2のユーザ端末は、個人情報の提供に合意する署名と暗号文識別子に対応する片割れ共通鍵KBとをパブリックチェーン4のユーザ端末16から受信すると(S264)、S265により、受信した署名と入手希望個人情報の暗号文識別子とを認定事業者17のサーバ18へ送信する。それをS266により受信した認定事業者17のサーバ18では、S267により、署名を確認した上で暗号文識別子に対応する暗号文を個人情報DB29から検索してパブリックチェーン4のユーザ端末16へ送信する処理が行われる。
 それをS268で受信したパブリックチェーン4のユーザ端末16では、S269により、DKA(暗号化個人情報)またはDR(暗号化個人情報))を演算してプライベートチェーン2のユーザ端末へ返信する処理が行われる。具体的には、ユーザ端末16のHDD12に記憶されている片割れ共通鍵KAが既にRに更新されている場合にはDR(暗号化個人情報)を演算して返信されるが、未だRに更新されていない場合にはDKA(暗号化個人情報)を演算して返信する処理が行われる。
 パブリックチェーン4のユーザ端末16からの返信をS270で受信したプライベートチェーン2のユーザ端末では、S271により、DKB(DKA(暗号化個人情報))=平文 または、DKB(DR(暗号化個人情報))≠平文 を演算する処理が行われる。具体的には、DKA(暗号化個人情報)を受信した場合には、DKB(DKA(暗号化個人情報))=DKB(DKA(EKA(EKB(個人情報))))=平文 を演算して平文の個人情報を得る。一方、(DR(暗号化個人情報))を受信した場合には、DKB(D(暗号化個人情報))=DKB(D(EKA(EKB(個人情報))))≠平文 が演算されることになり、平文の個人情報を得ることができない。これにより、削除したい情報の削除権を保証する要請と削除不可能性とが二律背反するジレンマを解決することができる。
 なお、認定事業者17のサーバ18は、ノード19としてブロックチェーンに参加することなくインターネット1を介してプライベートチェーン2のユーザ端末及びパブックチェーン4のユーザ端末に接続されるものであってもよい。
 (3) 前述の説明では片割れ共通鍵KAを個人情報主が保持(ユーザ端末16のHDD12に記憶)していたが、その代わりに、所定機関(第三者機関)の一例の鍵登録センタ30の鍵DB32に片割れ共通鍵KAを登録しておくようにしてもよい。なお、片割れ共通鍵KAは秘匿状態で鍵DB32に記憶しておく。この変形例を図24~図27に基づいて説明する。
 図24を参照し、鍵登録センタ30のサーバ31がインターネット1に接続されている。そのサーバ31に接続されている鍵DB32には、パブリックチェーン4の各ノード19であるユーザのアドレス毎に、暗号文識別子と片割れ共通鍵KAとが対応付けられて記憶されている。そして、ユーザから記録解読不能化要求があれば、その要求のあった記録に相当する暗号文識別子に対応付けて記憶されている片割れ共通鍵KAを乱数Rに更新する。図24では、アドレス0x6079ddの暗号文識別子307cd4に対応付けて記憶されている片割れ共通鍵が乱数1R2に更新されており、アドレス0x6080ddの暗号文識別子4arb56に対応付けて記憶されている片割れ共通鍵が乱数2Rnに更新されており、アドレス0x6978ddの暗号文識別子e2c87rに対応付けて記憶されている片割れ共通鍵が乱数mR1に更新されている。
 次に図25に基づいて、パブリックチェーン4のユーザ端末16と鍵登録センタ30のサーバ31とプライベートチェーン2のユーザ端末とのメインルーチンのフローチャートを説明する。第2実施形態との共通点については説明の繰り返しを省略し主に相違点について説明する。
 パブリックチェーン4のユーザ端末16では、S468によりブロックチェーンへの個人情報記録処理が実行され、S469により記録解読不能化要求処理が実行され、S470により復号鍵提供処理が実行される。鍵登録センタ30のサーバ31では、S463により鍵登録処理が実行され、S464により記録解読不能処理が実行され、S465によりデータ復号処理が実行される。プライベートチェーン2のユーザ端末では、S460によりデータ入手処理が実行さる。
 次に図26(A)に基づいて、ブロックチェーンへの個人情報記録処理と鍵登録処理とのサブルーチンプログラムのフローチャートを説明する。パブリックチェーン4のユーザ端末16において、S479により、EKA(EKB(個人情報))とEK2(インデックス+個人情報提供の対価)と暗号文識別子とがブロックチェーンに記録され、S480により、片割れ共通鍵KAと暗号文識別子とを鍵登録センタ30へ送信する処理が行われる。
 それをS474で受信した鍵登録センタ30のサーバ31では、S475により、受信した片割れ共通鍵KAと暗号文識別子とを対応付けて鍵DB32に記憶する処理が行われる。
 次に、図26(B)に基づいて、記録解読不能化要求処理と記録解読不能処理とのサブルーチンプログラムのフローチャートを説明する。パブリックチェーン4のユーザ端末16において、S494により、解読不能にしたい暗号文があるか否か判定され、ない場合にはリターンするが、ある場合には、S495により、解読不能を要求する暗号文識別子を鍵登録センタ30のサーバ31へ送信する処理が行われる。
 それをS485で受信した鍵登録センタ30のサーバ31では、受信した暗号文識別子に対応付けて記憶されている片割れ共通鍵KAを鍵DB32から検索する処理が行われる。次にS487により乱数Rを生成し、S488により、その乱数R=KAであるか否か判定される。R=KAの場合にはS487により再度乱数Rを生成し直し、R≠KAとなった段階でS489により、片割れ共通鍵KAをRに更新する処理が行われる。
 次に図27により、片割れ共通鍵提供処理とデータ入手処理とデータ復号処理とのサブルーチンプログラムのフローチャートを説明する。プライベートチェーン2のユーザ端末において、S503により、入手希望データの暗号文識別子を鍵登録センタ30のサーバ31へ送信する処理が行われる。それをS504により受信した鍵登録センタ30のサーバ31では、S505により、暗号文識別子に対応する暗号文(暗号化個人情報等)をブロックチェーンから検索する処理が行われる。次にS506により、暗号文識別子に対応する片割れ共通鍵KAまたはRを検索する処理が行われる。
 次にS507により、DKA(暗号化個人情報)またはDR(暗号化個人情報)をプライベートチェーン2のユーザ端末に返信する処理が行われる。具体的には、鍵登録センタ30の鍵DB32に記憶されている片割れ共通鍵KAが既にRに更新されている場合にはDR(暗号化個人情報)を演算して返信されるが、未だRに更新されていない場合にはDKA(暗号化個人情報)を演算して返信する処理が行われる。
 それをS509で受信したプライベートチェーン2のユーザ端末では、S510により、DKA(DKB(暗号化個人情報))=平文 または、DKA(DR(暗号化個人情報))≠平文 を演算する処理が行われる。具体的には、DKA(暗号化個人情報)を受信した場合には、DKB(DKA(暗号化個人情報))=DKB(DKA(EKA(EKB(個人情報))))=平文 を演算して平文の個人情報を得る。一方、(DR(暗号化個人情報))を受信した場合には、DKB(D(暗号化個人情報))=DKB(D(EKA(EKB(個人情報))))≠平文 が演算されることになり、平文の個人情報を得ることができない。これにより、削除したい情報の削除権を保証する要請と削除不可能性とが二律背反するジレンマを解決することができる。しかも、片割れ共通鍵KAをRに更新する処理が鍵登録センタ30において行われるため、KAをRに更新して削除権が保証されたことの信頼性を担保しやすい。例えば、KAのRへの更新を所定機関による監査の元で行ないやすいという利点がある。
 (4) 削除したい情報の削除権を保証する要請と削除不可能性とが二律背反するジレンマを解決する他の方法として、認定事業者17の個人情報DB29に記憶されている暗号化個人情報であるEKA(EKB(個人情報))を個人情報主の要請に応じて削除するようにしてもよい。その場合は、ブロックチェーン上に個人情報のハッシュ値が記録されているにもかかわらずそれに対応する個人情報が個人情報DB29に記憶されていないという矛盾した状態が生じるが、この矛盾を許容することができるのであれば、個人情報の削除も有効な手段となる。
 (5) 削除権を保証する情報は、個人情報に限らず、例えば、SNSやブログへの投稿情報(投稿写真及び投稿動画のデータを含む)、遺言や任意後見契約などの公正証書、私文書や会社等の定款、その他確定日付が必要なもの等、どのような情報であってもよい。また、第2実施形態では削除権を保証する情報をブロックチェーンを利用して記録していたが、ブロックチェーンは一例に過ぎず、他のものを利用して記録してもよい。
 (6) 各ブロックチェーンのノード19を構成するユーザ端末16等及び各種サーバで動作する前述したプログラムは、所定のウェブサイト等からダウンロードしてインストールしてもよいが、例えばCD-ROM99等の記録媒体(非一時的(non-transitory)な記録媒体)に記録させて流通させ、そのCD-ROM99等を購入した者がプログラムをユーザ端末16及び各種サーバにインストールしてもよい(図60参照)。
 (7) 前述の説明では、片割れ共通鍵KAで1度暗号化したものを片割れ共通鍵KBで再度暗号化するという2度の暗号化を行い、また、片割れ共通鍵KBで1度復号したものを片割れ共通鍵KAで再度復号するという2度の復号により平文にしている。しかし、これに限定されるものだはなく、片割れ共通鍵KAまたはKBでの暗号化を複数回行い、片割れ共通鍵KAまたはKBでの復号を複数回行うものであってもよい。さらに、片割れ共通鍵KA及びKBは2つに限定されるものではなく、3つ以上の片割れ共通鍵を用いてもよい。
 さらには、片割れ共通鍵KA及びKBの排他的論理和(イクスクルーシブオア)を演算して1つの鍵Kを生成し(KA(+)KB=K)、その鍵Kで個人情報を暗号化し(E(個人情報))、片割れ共通鍵KAを鍵登録センタ30の鍵DB32に登録すると共に、個人情報の要求者に片割れ共通鍵KBを配布する。個人情報の要求者からの要求を受けた個人情報主は暗号化個人情報を鍵登録センタ30のサーバ31へ送信し、個人情報の要求者は配布された片割れ共通鍵KBを鍵登録センタ30のサーバ31へ送信する。鍵登録センタ30のサーバ31では、受信した片割れ共通鍵KBと鍵DB32に登録されている片割れ共通鍵KAとの排他的論理和(イクスクルーシブオア)を演算して1つの鍵Kを生成し(KA(+)KB=K)、受信した暗号化個人情報(E(個人情報))をその鍵Kで復号して平文にした上で(D(E(個人情報))=平文)、その平文個人情報を個人情報の要求者へ送信するようにしてもよい。上記(+)は排他的論理和(イクスクルーシブオア)を記号で表現したものである。
 なお、排他的論理和(イクスクルーシブオア)は一例に過ぎず、片割れ共通鍵KA及びKBから1つの鍵Kを生成するものであればどのようなアルゴリズムを用いてもよい。
 また、排他的論理和(イクスクルーシブオア)のような加法群を用いて鍵Kを生成する上記方式の場合には、片割れ共通鍵KA及びKBを定期的に更新してセキュリティを維持できる利点がある。例えば、一方の片割れ共通鍵KAをKCに更新した場合には、他方の片割れ共通鍵KB=K(+)KC となり、演算により求めることができる。このようにして片割れ共通鍵KA及びKBを更新することにより、片割れ共通鍵の漏洩に対抗することができるばかりでなく、1度片割れ共通鍵KBを配布した個人情報要求者が再度ブロックチェーン上の暗号化個人情報を復号できないようにして閲覧を阻止することが可能となる。このような片割れ共通鍵の更新を片割れ共通鍵KBの1度の配布毎に実行することにより、片割れ共通鍵KBの配布を受けた者が他人にその片割れ共通鍵KBを横流ししたとしても、その横流しを受けた者によるブロックチェーン上の暗号化個人情報を復号不能にすることが可能となる。つまり、配布する片割れ共通鍵KBを1度のみ使用可能なワンタイム鍵にすることができる。
 また、共通鍵に限定されるものではなく、RSAや楕円暗号等の公開鍵暗号方式を用いてもよい。
 また、上記の鍵の更新を実現するにおいて、以下のような条件を満たす暗号アルゴリズムを採用してもよい。
 平文をM、その暗号文をC、暗号鍵をKA、KB、KC及びKDと表し、
 EKA(EKB(M))=EKC(EKD(M))=C
の式が成立するアルゴリズム。
 このようなアルゴリズムが共通鍵暗号アルゴリズムの場合には、片割れ共通鍵KA及びKBをKC及びKDに更新した場合に、ブロックチェーンに記録されている暗号文Cを片割れ共通鍵KC及びKDで復号することにより平文Mを得ることができる。一方、公開鍵暗号アルゴリズムの場合には、秘密鍵KA及びKBをKC及びKDに更新した場合に、秘密鍵KC及びKDに対応するペアの公開鍵PKC及びPKDでブロックチェーンに記録されている暗号文Cを復号することにより平文Mを得ることができる。
 (8) 前述の説明では、情報保持者が情報要求者に暗号化個人情報(DKA(暗号化個人情報)またはD(暗号化個人情報))と片割れ共通鍵KBとを送信し(S201、S207)、情報要求者自身が片割れ共通鍵KBを用いて暗号化個人情報を平文にするべく復号していたが(S209)、片割れ共通鍵KBを用いた復号を第三者機関(所定のサービス機関)が担ってもよい。この場合、情報保持者が暗号化個人情報(DKA(暗号化個人情報)またはD(暗号化個人情報))と片割れ共通鍵KBとを第三者機関(所定のサービス機関)へ送信し、第三者機関(所定のサービス機関)で復号して情報要求者へ送信する。
[開示内容の特徴点]
 次に、以上説明した実施形態の開示内容の特徴を以下に列挙する。
(特徴1)
[技術分野]
 特徴1は、例えば、ブロックチェーン等のような改竄や消去が困難な情報記録方式についての処理システムおよびプログラムに関する。
[背景技術]
 改竄や消去が困難な情報記録方式としてブロックチェーンが従来から一般的に知られている。このブロックチェーンを利用して貨物輸送に関する各種情報を記録しているものとして、例えば、特開2018-128723号がある。
[特徴1の概要]
[特徴1が解決しようとする課題]
 しかし、このようなブロックチェーンを利用した情報の記録は、改竄が困難なばかりでなく消去も困難である(以下「消去不可能性」という)。その結果、一旦ブロックチェーンを利用した個人情報の記録を行った場合には、その個人情報主が個人情報を消去したくなっても消去できず個人情報消去権(いわゆる忘れられる権利)が損なわれるという欠点がある。
 つまり、記録された情報の真正の保証とその情報の削除権の保証とが二律背反するジレンマが生じるという欠点が生じる。
 特徴1は、かかる実情に鑑み考え出されたものであり、その目的は、記録された情報の真正の保証とその情報の削除権の保証とが二律背反するジレンマを解消することである。
[課題を解決するための手段]
 特徴1の主題は、例えば以下のような項目として示される。
 (項目1)
 記録対象の情報(例えば、個人情報)を暗号化する暗号化処理を行う暗号化手段(例えば、S174、S177、または、S228、S231、または、S478、S479)と、
 前記暗号化処理を経た後の情報を記録する記録手段(例えば、S177及びブロックチェーン、または、S231、S240、S242、S244、ブロックチェーン及び個人情報DB29、または、S479及びブロックチェーン)と、
 前記記録手段により記録された情報に対し、第1鍵と第2鍵とを用いて復号処理を行って平文の情報にする復号手段(例えば、S201、S202、S207~S209、または、S263~S271、または、S500~S510)と、
 前記記録手段により記録された情報を復号できない復号不能化状態にする復号不能化手段(例えば、S191~S194、または、S250~S254、または、S494、S495、S485~S489)と、を備え、
 前記復号手段は、前記第2鍵(例えば、片割れ共通鍵KA)を秘匿して保持する第2鍵秘匿保持手段(例えば、S194、または、S233、または、S475)を含み、
 前記復号不能化手段は、前記第2鍵秘匿保持手段により保持されている前記第2鍵を他のもの(例えば、乱数R)に更新することにより復号不能化状態にする(例えば、S190~S194、または、S250~S254、または、S494、S495、S485~S489)、処理システム。
 (項目2)
 前記復号手段は、前記第1鍵(例えば、片割れ共通鍵KB)を情報の閲覧希望者に配布する第1鍵配布手段(例えば、S200、S201、または、S2562、S263、または、S500、S501)をさらに含む、項目1に記載の処理システム。
 (項目3)
 前記記録手段により記録された情報を平文にすることなく検索する検索手段(例えば、S37~S40、S42~S45)をさらに備えている、項目1または2に記載の処理システム。
 (項目4)
 前記記録手段により記録された情報は個人情報を含み、
 前記復号不能化手段は、個人情報主の要求に応じて当該個人情報主の個人情報を前記復号不能化状態にする(例えば、S190~S194、または、S250~S254、または、S494、S495、S485~S489)、項目1~3の何れかに記載の処理システム。
 (項目5)
 記録対象の情報(例えば、個人情報)を暗号化する暗号化処理を行うステップ(例えば、S174、S177、または、S228、S231、または、S478、S479)と、
 前記暗号化処理を経た後の情報を記録する記録手段(例えば、S177及びブロックチェーン、または、S231、S240、S242、S244、ブロックチェーン及び個人情報DB29、または、S479及びブロックチェーン)により記録された情報に対し、第1鍵と第2鍵とを用いて復号処理を行って平文の情報にする復号ステップ(例えば、S201、S202、S207~S209、または、S263~S271、または、S500~S510)と、
 前記記録手段により記録された情報を復号できない復号不能化状態にするステップ(例えば、S191~S194、または、S250~S254、または、S494、S495、S485~S489)とを、
コンピュータに実行させ、
 前記復号ステップは、前記第2鍵(例えば、片割れ共通鍵KA)を秘匿して保持するステップ(例えば、S194、または、S233、または、S475)を含み、
 前記復号不能化状態にするステップは、前記保持するステップにより保持されている前記第2鍵を他のもの(例えば、乱数R)に更新することにより復号不能化状態にする(例えば、S190~S194、または、S250~S254、または、S494、S495、S485~S489)、プログラム。
(特徴1の効果)
 特徴1によれば、記録された情報の真正の保証とその情報の削除権の保証とが二律背反するジレンマを極力解消することができる。
(特徴2)
[技術分野]
 特徴2は、例えば、ブロックチェーン等で用いられているスマートコントラクトに関する。
[背景技術]
 スマートコントラクトは、契約のスムーズな検証、条件確認、執行、実行、交渉を意図したコンピュータプロトコルであり、従来からブロックチェーン等で用いられている。このスマートコントラクトは、契約や取引等を自動化するものとして従来から知られている(例えば、特許第6403177号)。
[特徴2の概要]
[特徴2が解決しようとする課題]
 このようなスマートコントラクトの分野においては、売買契約及び貸借契約等で代表される各種契約または各種取引等の法律行為をユーザ自身の代理として実行できる高度なスマートコントラクトが望まれている。
 係る実情に鑑み考え出された特徴2の目的は、ユーザ自身の代理として法律行為を実行できる高度なスマートコントラクトを提供することである。
[課題を解決するための手段]
 特徴2の主題は、例えば以下のような項目として示される。
 (項目1)
 複数の自然人または法人が行った法律行為に関する情報を機械学習用のデータとして入力し一般的モデルを生成する機械学習手段(例えば、S80~S82)と、
 前記一般的なモデルをユーザに適したモデルにパーソナライズ化するための手段であって、当該ユーザが行った法律行為に関する情報に基づいてパーソナライズ化するパーソナライズ化手段(例えば、S86~S88、またはS94~S98)と、
 前記パーソナライズ化されたモデルを用いて当該ユーザの代理として法律行為を実行させるためのスマートコントラクトを生成するスマートコントラクト生成手段(例えば、S86~S88、またはS94~S98)と、を備えている、コンピュータシステム。
 (項目2)
 複数の自然人または法人が行った法律行為に関する情報を機械学習用のデータとして入力して生成された一般的なモデルをユーザに適したモデルにパーソナライズ化するための手段であって、当該ユーザが行った法律行為に関する情報に基づいてパーソナライズ化するパーソナライズ化手段(例えば、S80~S82、S86~S88、またはS94~S98)と、
 前記パーソナライズ化されたモデルを用いて当該ユーザの代理として法律行為を実行させるためのスマートコントラクトを生成するスマートコントラクト生成手段(例えば、S86~S88、またはS94~S98)と、を備えている、コンピュータシステム。
 (項目3)
 複数の自然人または法人が行った法律行為に関する情報を機械学習用のデータとして入力して生成された一般的なモデルをユーザに適したモデルにパーソナライズ化するための手段であって、当該ユーザが行った法律行為に関する情報に基づいてパーソナライズ化するパーソナライズ化手段(例えば、S80~S82、S86~S88、またはS94~S98)と、
 前記パーソナライズ化されたモデルをスマートコントラクトとして用いて当該ユーザの代理として法律行為を実行させるサービスを提供するサービス提供手段(例えば、S99)と、を備えている、コンピュータシステム。
 (項目4)
 前記サービス提供手段(例えば、S99)によるサービスの提供に伴い実行された法律行為に対する報酬を当該実行したモデルに与えることにより該モデルが前記報酬の累積を最大化する方策を学習する強化学習手段(例えば、S105~S108)をさらに備えた、項目3に記載のコンピュータシステム。
 (項目5)
 予め定められたテーマ(例えば、政府が採用しようとしている政策や法律(例えば、消費増税に伴う軽減税率、改正出入国管理法、イギリスのEU(European Union)からの離脱、ベーシックインカムの部分的または全面的採用、日本国憲法9条の改正等)が採用されたと仮定した場合における、株取引や先物取引等の投資市場での取引シミュレーション、会社経営シミュレーション、または消費行動シミュレーション等)のシミュレーションをコンピュータ内で行って強化学習を進行させるコンピュータシステムであって、
 前記シミュレーションのテーマにマッチする複数のペルソナに属するユーザ群を選定する選定手段(例えば、S344、S345)と、
 前記選定手段により選定されたユーザ群を前記複数のペルソナ毎にグルーピングしてグループ毎にユーザ群が行った法律行為に関する情報を収集する収集手段(例えば、S346)と、
 前記取集された法律行為に関する情報を学習データとして機械学習を行ってペルソナ毎に学習済みスマートコントラクトモデル群を生成する生成手段(例えば、S347)と、
 前記生成された学習済みスマートコントラクトモデル群同士で法律行為を行うシミュレーションをコンピュータ内で実行するシミュレーション手段(例えば、S336~S339)と、を備え、
 前記シミュレーション手段は、実行された法律行為に対する報酬を当該実行した学習済みスマートコントラクトモデルに与えることにより該学習済みスマートコントラクトモデルが前記報酬の累積を最大化する方策を学習する強化学習手段(例えば、S336、S338)を含む、コンピュータシステム。
 (項目6)
 シミュレーションをコンピュータ内で行って強化学習を進行させるコンピュータシステムであって、
 機械学習により生成された学習済みスマートコントラクトモデル群同士で法律行為を行うシミュレーションをコンピュータ内で実行し、実行された法律行為に対する報酬を当該実行した学習済みスマートコントラクトモデルに与えることにより該学習済みスマートコントラクトモデルが前記報酬の累積を最大化する方策を学習するシミュレーション強化学習処理を行う強化学習手段(例えば、S336、S338)を備えている、コンピュータシステム。
 (項目7)
 前記学習済みスマートコントラクトモデル群の中から、前記強化学習手段による強化学習結果の成績に基づいて実際に使用する学習済みスマートコントラクトモデルを選抜する選抜手段(例えば、S340)をさらに含む、項目6に記載のコンピュータシステム。
 (注)
 上記一般的なモデル生成用の「機械学習用のデータ」及びパーソナライズ化に用いる「機械学習用のデータ」は、「法律行為に関する情報」が含まれていれば事足り、「法律行為に関する情報」以外の情報(例えば、ウェブサイトへのアクセス履歴、GPS位置情報等)も含まれていてもよい。上記「スマートコントラクト生成手段」は、例えば、法律行為に関する情報により機械学習されたパーソナルアシスタント等の人工知能にスマートコントラクトとしての役割を担わせる場合も包含するものである。
(特徴2の効果)
 特徴2によれば、各種の法律行為をユーザ自身の代理として実行できる高度なスマートコントラクトを提供可能となる。
(特徴3)
[技術分野]
 特徴3は、例えば、政府が採用しようとしている政策や法律(例えば、消費増税に伴う軽減税率、改正出入国管理法、イギリスのEU(European Union)からの離脱、ベーシックインカムの部分的または全面的採用、日本国憲法9条の改正等)、マーケティング関連の条件(例えば、新商品(金融商品や生命保険を含む)や新サービスの価格や対価の設定、各種メディアによるプロモーション効果等)、投資市場関連の条件(例えば、先物取引における気象条件、株式市場における金融引き締め政策等)等の条件を設定し、その条件下でコンピュータ内においてシミュレーションを行い、どのようなシミュレーション結果になるかを事前に予測するコンピュータシステムに関する。
[背景技術]
 この種のコンピュータシステムとして、国民が将来負担するべき負債や将来利用可能な資源を明確にして、政策レベルの意思決定を支援するために、純資産の変動計算書勘定を新たに設定し、当該年度の政策決定による資産変動を明確にするとともに、将来の国民の負担をシミュレーションできる会計処理方法が提案されている(例えば、特開2006-155233)。
[特徴3の概要]
[特徴3が解決しようとする課題]
 このようなシミュレーションの分野においては、実社会における自然人や法人の営みを忠実に模したシミュレーションをコンピュータ内で実行し、現実世界との乖離を極力少なくしたシミュレーション結果を導出し得るコンピュータシステムが望まれる。
 係る実情に鑑み考え出された特徴3の目的は、実社会における自然人や法人の営みを忠実に模したシミュレーションを可能にすることである。
[課題を解決するための手段]
 特徴3の主題は、例えば以下のような項目として示される。
 (項目1)
 予め定められた条件(例えば、政府が採用しようとしている政策や法律(例えば、消費増税に伴う軽減税率、改正出入国管理法、イギリスのEU(European Union)からの離脱、ベーシックインカムの部分的または全面的採用、日本国憲法9条の改正等)、マーケティング関連の条件(例えば、新商品(金融商品や生命保険を含む)や新サービスの価格や対価の設定、各種メディアによるプロモーション効果等)、投資市場関連の条件(例えば、先物取引における気象条件、株式市場における金融引き締め政策等)等の条件)の下でのシミュレーションをコンピュータ内で行うコンピュータシステムであって、
 前記シミュレーションの条件にマッチする複数のペルソナに属するユーザ群を選定する選定手段(例えば、S144、S145)と、
 前記選定手段により選定されたユーザ群を前記複数のペルソナ毎にグルーピングしてグループ毎にユーザ群が行った法律行為に関する情報を収集する収集手段(例えば、S146)と、
 前記取集された法律行為に関する情報を学習データとして機械学習を行ってペルソナ毎に学習済みスマートコントラクトモデル群を生成する生成手段(例えば、S147)と、
 前記生成された学習済みスマートコントラクトモデル群同士で法律行為を行うシミュレーションをコンピュータ内で実行するシミュレーション手段(例えば、S136~S139)と、
 前記シミュレーション手段によるシミュレーションの結果を導出する導出手段(例えば、S140)と、を備え、
 前記シミュレーション手段は、実行された法律行為に対する報酬を当該実行した学習済みスマートコントラクトモデルに与えることにより該学習済みスマートコントラクトモデルが前記報酬の累積を最大化する方策を学習する強化学習手段(例えば、S136、S138)を含む、コンピュータシステム。
 (項目2)
 シミュレーションをコンピュータ内で行うコンピュータシステムであって、
 機械学習(例えば、S144~S146)により生成された学習済みスマートコントラクトモデル群同士で法律行為を行うシミュレーションをコンピュータ内で実行し、実行された法律行為に対する報酬を当該実行した学習済みスマートコントラクトモデルに与えることにより該学習済みスマートコントラクトモデルが前記報酬の累積を最大化する方策を学習する強化学習を進行させる強化学習手段(例えば、S136、S138)と、
 前記強化学習手段による強化学習が進行した学習済みスマートコントラクトモデル群同士で法律行為を行うシミュレーションの結果を導出する導出手段(例えば、S140)と、を備えている、コンピュータシステム。
(特徴3の効果)
 特徴3によれば、実社会における自然人や法人の営みを極力忠実に模したシミュレーションが可能になる。
[第3実施形態]
 次に、第3実施形態を説明する。この第3実施形態は、リアルワールド(現実世界)のデジタルツインから構成されるミラーワールド(サイバー空間)内をシミュレーション環境にしてシミュレーションを行うことにより、例えば、未来を予測した最適解を導き出したり、DAO(Decentralized Autonomous Organization)におけるインセンティブ設計の最適解を導き出したり、AIの機械学習(例えば強化学習)を行ったりするシステムに関する。
 デジタルツインとは、現実世界の実体やシステムをデジタルで表現したものである。ミラーワールドとは、現実の国家、都市、社会、地方自治体、会社等の組織、人々といった、物理世界(リアルワールド)の情報がすべてデジタル化されたデジタルツインで構成される鏡像世界のことである。具体的には、人のデジタルツインを、例えば、当該人の行動(リアルとバーチャル両方の行動)等のライフログを知識として習得し当該人にとって最適な行為をアシスタントするための機械学習(例えばエージェントによる強化学習)を行ったアシスタントAI(以下「パーソナルAI」という)で構成する。この強化学習は、複数のパーソナルAIが協調して強化学習を行うマルチエージェント強化学習である。リアル世界の会社等の組織を構成している人々のパーソナルAIにより当該組織のデジタルツインを構成し、リアル世界の地方自治体を構成している人々のパーソナルAIにより当該地方自治体のデジタルツインを構成し、リアル世界の都市を構成している人々のパーソナルAIにより当該都市のデジタルツインを構成し、リアル世界の国家を構成している人々のパーソナルAIにより当該国家のデジタルツインを構成する。
 この第3実施形態では、シミュレーション環境としてのミラーワールドの構築を、リアルワールドにおける現実の国家、都市、社会、地方自治体、会社等の組織及び人々等が自ら率先して参加して構築に協力する仕組みを用意する。具体的には、ミラーワールド内での各種シミュレーションを行うことによって、そのシミュレーションに参加しているデジタルツインのパーソナルAIを機械学習(例えば強化学習)させ、より高度に学習した学習済みパーソナルAIをリアル世界に還元(フィードバック)させる。このメリットの享受をインセンティブとして、リアルワールドの国家、都市、社会、地方自治体、会社等の組織及び人々等が自ら率先して参加してミラーワールドの構築に協力するように仕向ける。
 図28を参照し、複数台のミラーワールドサーバ(ストレージサーバを含む)46が設置されたデータセンタ45において、ミラーワールドのデータが記憶されている。ミラーワールドサーバ46のハードウェア構成は、図1に示したユーザ端末16のハードウェア構成と同様であるため、ここではその図示及び説明の繰り返しを省略する。リアルワールド47における現実の国家(例えば日本国49)、都市50、社会、地方自治体、会社等の組織、人々及び地球48の情報がすべてデジタル化されたデジタルツイン(現実の国家デジタルツイン(例えば日本国デジタルツイン53)、都市デジタルツイン54、社会、地方自治体、会社等の組織、人々及び地球デジタルツイン52)で構成されたミラーワールド51全体が、デジタルデータとしてデータセンタ45に記憶されている。
 データセンタ45では、このミラーワールド51をシミュレーション環境としてシミュレーションを行い、例えば、シミュレーション最適化により未来を予見した最適解を導き出す。シミュレーションとしては、例えば、前述した、政府が採用しようとしている政策や法律(例えば、消費増税に伴う軽減税率、改正出入国管理法、イギリスのEU(European Union)からの離脱、ベーシックインカムの部分的または全面的採用、日本国憲法9条の改正等)が採用されたと仮定した場合における、株取引や先物取引等の投資市場での取引シミュレーション、会社経営シミュレーション、または消費行動シミュレーション等が考えられる。さらには、新商品(金融商品や生命保険を含む)や新サービスの各種メディアによるプロモーションのシミュレーション等でもよい。シミュレーション最適化によって導き出された最適解をリアルワールドにフィードバック(還元)し、最適解の恩恵をリアルワールドに提供する。また、シミュレーションにより機械学習(例えば強化学習)された学習済みパーソナルAIをリアルワールドに還元し、より高度な学習済みパーソナルAIによるタスクを遂行できるようにする。
 このパーソナルAIとスマートコントラクトとが連携することにより、前述した連携タイプのAIスマートコントラクトが構成される。なお、このデータセンタ45は、図1や図24に示したインターネット1に接続されている。図28では、各種ブロックチェーン2、3、4、SNS19、鍵登録センタ30等は図示を省略している。
 図29は、ミラーワールド51における都市デジタルツイン54の具体例を示している。リアルワールド47の都市50内には、株式会社ABC56、人である太郎55及び太郎の一家56等がある。それらに対応する都市デジタルツイン54にも、株式会社ABCデジタルツイン59、太郎デジタルツイン(太郎のパーソナルAI)57及び太郎の一家デジタルツイン58等がある。これらのデータからなる都市デジタルツインデータがミラーワールドサーバ46に記憶されている。リアルワールド49での株式会社ABC56、人である太郎55及び太郎の一家56等の各種オブジェクトに変更(例えば、会社での人事異動や就職や退職、人についての結婚や出産等)があれば、対応する各種デジタルツインが変更後の内容にアップデートされる。このような都市デジタルツインデータが全ての都市毎にデータセンタ45に記憶されて日本国家49のデジタルツイン53のデータとなり、各国における都市デジタルツインデータが全ての都市毎にデータセンタ45に記憶されて各国国家のデジタルツインデータとなり、それら全てのデジタルツインデータにより、地球48のデジタルツイン52のデータとなる。
 具体例として、ミラーワールドサーバ46には、太郎デジタルツイン(太郎のパーソナルAI)57として、氏名:太郎、AI識別番号:82km9、パーソナルAIデータ、太郎のパーソナルデータ(例えば、ライフログ、プロフィール、嗜好データ、電子カルテデータ、バイタルデータ等)が記憶されている。太郎の一家デジタルツイン58として、氏名:太郎、桜、志郎、家族構成:夫、妻、長男、AI識別番号:82km9、11zk9、gf43yが記憶されている。株式会社ABCデジタルツイン59として、氏名:太郎、花子・・・三郎、役職:代表取締役、専務、部長・・・平社員、AI識別番号:82km9、ba935、2es14、・・・9w1c2が記憶されている。
 ユーザ端末16とミラーワールドサーバ46とのメインルーチンプログラムのフローチャートを、図30~図33に基づいて説明する。図30Aを参照し、ユーザ端末16のCPU10は、シミュレーション環境としてのミラーワールド51への参加登録を依頼するメンバー登録依頼処理S555、シミュレーション準備応答処理S556、シミュレーション応答処理S557を実行する。ミラーワールドサーバ46のCPU10は、メンバー登録処理550、シミュレーション準備処理S551、シミュレーション処理S552を実行する。
 メンバー登録処理とメンバー登録依頼処理とを図30Bに基づいて説明する。これら両処理は、ミラーワールド51をシミュレーション環境としたシミュレーションにデジタルツインとして参加したいメンバーを登録するためのものである。ユーザ端末16のCPU10は、メンバー登録依頼処理において、S560により登録申し込みを行うか否か判定し、登録申し込みを行わないと判定すればこのメンバー登録処理が終了してリターンする。登録申し込みを行うと判定すれば、S561において、登録申し込みに必要な所定事項をミラーワールドサーバ46へ送信すると共に、パーソナルAIを有していない人がいる場合はその旨とその人のブロックチェーンアドレスもミラーワールドサーバ46へ送信する。登録申し込みに必要な所定事項とは、具体的には、人のデジタルツインにおいては、当該人のパーソナルAIのAI識別番号とパーソナルAIデータ、家族のデジタルツインにおいては家族の氏名と家族構成とそれぞれのAI識別番号、会社のデジタルツインにおいては従業員の氏名、役職、それぞれのAI識別番号等である。
 それをS565により受信したミラーワールドサーバ46のCPU10は、S566において、パーソナルAIを所有済みか否か判定する。S561により送信されてきた情報中に「パーソナルAIを有していない旨」の情報が含まれていた場合には制御がS567に進み、パーソナルAIの生成販売処理を行うが、「パーソナルAIを有していない旨」の情報が含まれていない場合には、制御がS568に進み、S562により送られてきたAI識別番号を含む所定事項をミラーワールド51に登録する。
 S567に示されたパーソナルAIの生成販売処理を図31に基づいて説明する。ミラーワールドサーバ46のCPU10は、S573において、S565により受信したブロックチェーンアドレス(パーソナルAIを有していないユーザのブロックチェーンアドレス)に記録されている取引データ及びSNS等の投稿データを、ブロッチェーンから収集する。次に、S574において、取引データ及びSNS等の投稿データを学習データとして機械学習を行って学習済みのパーソナルAIを生成する。次に、S575において、その学習済みのパーソナルAIを対応するユーザに販売する。
 S551に示されたシミュレーション準備処理及びS555に示されたシミュレーション準備応答処理を、図32に基づいて説明する。ミラーワールドサーバ46のCPU10は、S577において、シミュレーションの依頼を受けたか否か判定する。受けていないと判定した場合には、このシミュレーション準備処理が終了してリターンする。シミュレーションの依頼を受けたと判定した場合には制御がS578に進み、依頼されたシミュレーションにマッチするパーソナルAI群及びデジタルツインを割出す処理を行う。例えば、前述の消費増税に伴う軽減税率下での消費行動シミュレーションの場合には、一般消費者に相当するパーソナルAI群であって、性別、年代別、地域別、年収別等の人口統計に従った割合でパーソナルAI群、及び、軽減税率の対象となる消費財のメーカデジタルツインや販売店デジタルツイン等を割出す。次に、その割出されたパーソナルAI群及びデジタルツイン宛にシミュレーションの同意を求める処理を行う。具体的には、割出されたパーソナルAI群及びデジタルツインに対応するユーザ群各々のユーザ端末16へ、シミュレーションの内容を送信して同意するか否かを問う。
 割出されたパーソナルAI群及びデジタルツインに対応するユーザ群各々のユーザ端末16のCPU10は、送信されてきたシミュレーションの内容をS580で受信し、S581において、そのシミュレーションの実行メンバーへの参加に同意するか否か判定する。この判定は、パーソナルAIが判定してもよいが、ユーザ自身が判定してもよい。同意しないと判定した場合には、このシミュレーション準備応答処理が終了してリターンするが、同意すると判定した場合には、S582において、同意する旨をミラーワールドサーバ46へ返信する。
 それをS583により受信したミラーワールドサーバ46のCPU10は、依頼されたシミュレーションを実行するのに必要な量の同意が得られたか否か判定する。得られたと判定した場合にはS584において、同意が得られたAI群及びデジタルツインをコピーしてシミュレーション対象としてミラーワールド51に登録する。その登録された状態が前述の図29に示されている。
 一方、必要なパーソナルAI群及びデジタルツインから同意が得られていないと判定した場合には制御がS585に進み、不足しているパーソナルAI群及びデジタルツインにマッチするペルソナ群(メーカや販売店のデジタルツインに対応するペルソナを含む)を設定する処理を行い、S586において、各ペルソナに属するユーザ群(メーカや販売店に従事するユーザ群を含む)を選定し、S587において、ペルソナ毎に属するユーザ群をグループピングしてグループ毎にユーザ群の取引データ(メーカや販売店としての取引データを含む)をブロッチェーンから収集し、S588において、取引データを学習データとして機械学習を行ってペルソナ毎に学習済みのパーソナルAI群及びデジタルツインを生成して補充した上で、S584に進む。このS585~S588は、図9(B)のS344~S347と同様の処理であり、ここでは詳細な説明の繰り返しを省略する。
 次に、S552に示したシミュレーション処理及びS557に示したシミュレーション応答処理の具体的制御を図33に基づいて説明する。S593~S595は、前述した図9のS336、S338、S339、図12のS136、S138、S139と同様の処理であり、ここでは詳細な説明を省略する。S596において、シミュレーション結果をシミュレーションの依頼者に通知する。具体的には、シミュレーション結果をシミュレーション依頼者のユーザ端末16に送信する。次に、S597において、シミュレーションに用いた各パーソナルAI(会社組織等のデジタルツインに従事するパーソナルAIを含む)を各々の所持者のユーザ端末16に送信する。
 それをS598で受信したユーザ端末16のCPU10は、S599において、受信したパーソナルAIを消去するか否か判定する。受信したパーソナルAIは、シミュレーションに参加して強化学習(機械学習)された学習済みAIであり、その分性能がアップしており高度なタスク処理を実行することが可能である。しかし、シミュレーションの内容によっては、ユーザが望まない強化学習(機械学習)を受けている場合もあるため、そのような場合には、S599によりYESと判定し、S601において、受信したパーソナルAIを消去する。一方、シミュレーションがユーザの望む内容であり、受信したパーソナルAIが望ましい強化学習(機械学習)を受けていると認定した場合には、制御がS600に進み、受信した学習済みパーソナルAIを上書き保存する。その結果、ユーザは、望ましい強化学習(機械学習)を受けて性能がアップしたパーソナルAIを得ることができる利点がある。この利点の享受をインセンティブとして、リアルワールドの国家、都市、社会、地方自治体、会社等の組織及び人々等が自ら率先して参加してミラーワールドの構築に協力するように仕向けることができる。このS600によりパーソナルAIを上書き保存することにより、ミラーワールドサーバ46において、上書き保存された後の新たなパーソナルAIのデジタルツイン及び新たなパーソナルAIからなる組織のデジタルツインにデータがアップデートされる(図29参照)。なお、上書き保存ではなく、既存のパーソナルAIと学習済みパーソナルAIとの両者を共に記憶しておき、必要に応じて使い分けるようにしてもよい。
 次に、ミラーワールド内をシミュレーション環境にしてシミュレーションを行うことにより、DAOにおけるインセンティブ設計の最適解を導き出すシステムを、図34~図59に基づいて説明する。図34(A)は、マルチ役務DAO構築システムの概略図である。例えば、ビットコインはDAOの一種であるが、ノード(マイナー)がマイニング(記帳権の競争)という1種類の役務のみを担っており、マイニングに成功した者にビットコインを付与するといインセンティブを与えることによりブロックが追加され、ビットコインのシステムが自律的に継続される。これに対し、役務が複数種類存在するDAOをマルチ役務DAOという。例えば、会社組織のDAOの場合、資材調達、組立、宣伝、販売等の複数の役務が存在し、それら複数の役務を実行したノードに対しどのような割合でどの程度の報酬を分配すれば最適なインセンティブ設計となるのかが困難な問題となる。このようなマルチ役務DAOにおけるインセンティブ設計の最適解を導き出すシステムを説明する。
 図34(A)を参照し、マルチ役務DAOデータを記憶しているミラーワールドサーバ46が、DAOエージェント61、役務1を行うペルソナエージェント群62、役務2を行うペルソナエージェント群63、・・・役務nを行うペルソナエージェント群64のデータを記憶している。さらに、ミラーワールドサーバ46は、強化学習に伴って各ペルソナエージェント群に与えられる報酬r1、r2、・・・rnの種類も記憶している。
 マルチ役務DAO構築業者の端末16が、DAOエージェント61と、必要なペルソナエージェント群と、報酬r1、r2、・・・rnの種類とを、ミラーワールドサーバ46からダウンロードしてインストールする。端末16は、パブリックチェーン4を構成する各ノード19である。この各ノード19で構成されたパブリックチェーン4で運用されるマルチ役務DAO65のデジタルツイン66を、ミラーワールド51内でシミュレーション強化学習を行い、マルチ役務DAOにおけるインセンティブ設計の最適解を導き出す。そのインセンティブ設計の最適解を、リアルワールド47における実際のマルチ役務DAO65に適用し、最適なインセンティブ設計のマルチ役務DAO65を作り上げる。このミラーワールド51内でのシミュレーション強化学習は、ミラーワールドサーバ46において実行される。その制御を以下に説明する。
 図34(B)を参照し、端末16のCPU10は、S606においてシミュレーション強化学習準備応答処理を行い、S607においてシミュレーション強化学習応答処理を行う。
 ミラーワールドサーバ46のCPU10は、S611においてシミュレーション強化学習準備処理を行い、S612においてシミュレーション強化学習処理を行い、S613においてDAOエージェント強化学習処理を行う。
 S611に示したシミュレーション強化学習準備処理及びS606に示したシミュレーション強化学習準備応答処理の具体的制御を図35に基づいて説明する。シミュレーション強化学習準備応答処理において、端末16のCPU10は、S615において、シミュレーション強化学習を依頼するか否か判定する。依頼しない場合にはこのシミュレーション学習準備応強化答処理が終了してリターンする。依頼する場合は制御がS616に進み、マルチ役務DAOデータをミラーワールドサーバ46へ送信して依頼する。このマルチ役務DAOデータには、役務の種類が含まれている。例えば、図36~図42において後述するイノベーション誘発DAOの場合は、役務が、アイデア発案、改良発案、事業化、侵害発見、トークン購入の5種類存在し、それらの役務を送信する。
 それをS620で受信したミラーワールドサーバ46のCPU10は、S621により、マルチ役務の各々にマッチするペルソナ群を設定する。例えば、上記イノベーション誘発DAOの場合は、アイデア発案及び改良発案のペルソナ群として発明をよく考え出す人々、事業化のペルソナ群として事業化に興味のある人々、侵害発見のペルソナ群として特許法や著作権法に詳しい人々、トークン購入のペルソナ群として投資に興味のある人々等が考えられる。
 次に、S622において、各ペルソナに属するユーザ群を選定する。例えば、上記イノベーション誘発DAOの場合は、アイデア発案及び改良発案のペルソナ群に属するユーザ群として特許出願の発明者として掲載されているユーザ群、事業化のペルソナ群に属するユーザ群として会社の経営者のユーザ群、侵害発見のペルソナ群に属するユーザ群として弁理士や弁護士のユーザ群、トークン購入のペルソナ群に属するユーザ群としてビットコイン等の仮想通貨を購入したことのあるユーザ群等が考えられる。
 次に、S623において、ペルソナ毎に属するユーザ群をグループピングしてグループ毎にユーザ群の取引データをブロッチェーンから収集し、S624において、取引データを学習データとして機械学習を行ってペルソナ毎に学習済みのペルソナエージェント群を生成する。これら両制御は、前述した図9(B)のS346、S347と同様の処理であり、ここでは詳細な説明の繰り返しを省略する。次に、S625において、ペルソナエージェント群をマルチ役務DAO65内に配備してマルチ役務DAOデジタルツイン66を生成し、シミュレーション対象としてミラーワールド51に登録する。その状態が図36に示されている。
 図36を参照し、パブリックチェーンからなるマルチ役務DAO65のデジタルツイン66をミラーワールド51に構築する。マルチ役務DAOデジタルツイン66には、上記S625においてペルソナエージェント群が配備されて各ノード毎に1つずつペルソナエージェントが配備された状態となっている。それらペルソナエージェントの識別番号が、各役務(アイデア発案、改良発案、事業化、侵害発見、トークン購入)毎に分類されてミラーワールドサーバ46に記憶されている。例えば、アイデア発案役務のペルソナエージェントの識別番号として、kc29m,1w13a,・・・9nad8がミラーワールドサーバ46に記憶されている。このマルチ役務DAO65は、前述したイノベーション誘発DAOであり、以降、イノベーション誘発DAOを例としてマルチ役務DAOを説明する。
 さらに、ミラーワールドサーバ46には、各ペルソナエージェントの行為に対し報酬(インセンティブ)を与えるDAOエージェントも記憶されている。このDAOエージェントが、与える報酬の分配割合や報酬額を強化学習(機械学習)することにより、インセンティブ設計の最適解を導き出す。その強化学習(機械学習)の概略システムを図37に示す。
 図37を参照し、ペルソナエージェント群がオリジンのアイデア投稿をアクションa11、a12、・・・a1nとして行えば、環境の状態S1がDAOエージェント61に入力され、それらアイデア発案役務を行ったペルソナエージェント群67に対し報酬r11、r12、・・・r1nが与えられる。このアイデア発案役務は、夢やアイデア、ビジネスプラン、技術思想、著作物等の発案を包含する広い概念である。環境の状態S1は、アイデア発案役務を行ったペルソナエージェント群67にも与えられる。この環境の状態S1は、例えば、オリジンアイデア投稿内容、アイデア発案役務を行ったペルソナエージェント68各々に報酬として与えられたトークンA1の変動相場の価格等である。
 上記オリジンのアイデアに対しペルソナエージェント群68が改良案の投稿等のアクションa21、a22、・・・a2を行えば、環境の状態S2がDAOエージェント61に入力され、それら改良案役務を行ったペルソナエージェント群68に対し報酬r21、r22、・・・r2nが与えられる。環境の状態S1は、改良案役務を行ったペルソナエージェント群68にも与えられる。この環境の状態S2は、例えば、改良案投稿内容、改良案投稿に付与された「いいね!」の数等である。この「いいね!」を付与する主体は、例えば上記オリジンアイデアの投稿に対し報酬として付与されたトークンA1を購入した者(ペルソナエージェント群71)のみに限定している。このように、「いいね!」の付与主体を利害関係人(ステークフォルダ)に限定(制限)する理由は、不正行為を防止するためである。「いいね!」の付与主体を無制限に広げた場合、例えば、改良案の投稿を行った者(ペルソナエージェント群68)が多数の者(ペルソナエージェント)と結託して多数の「いいね!」を付けてもらう等の不正行為を防止するためである。事業化役務を行ったペルソナエージェント群69及び侵害対処役務を行ったペルソナエージェント群70への「いいね!」の付与主体も、同様の理由により、トークンA1を購入した者(ペルソナエージェント群71)のみに限定している。
 上記オリジンのアイデアに対し事業化役務を行ったペルソナエージェント群69がアクションa31、a32、・・・a3nを行えば、環境の状態S3がDAOエージェント61に入力され、それら事業化役務を行ったペルソナエージェント群69に対し報酬r31、r32、・・・r3nが与えられる。ペルソナエージェント群69のアクションa31、a32、・・・a3nとしては、例えば、事業計画書の投稿、事業化の進行状況の投稿、実際の事業化遂行の状況の投稿、事業化された事業による収益額の投稿等が考えられる。環境の状態S3は、事業化役務を行ったペルソナエージェント群69にも与えられる。この環境の状態S3は、例えば、事業計画書の投稿や事業化の進行状況の投稿、事業化された事業による収益額の投稿等に付与された「いいね!」の数等である。
 上記オリジンのアイデアに対し侵害対処役務を行ったペルソナエージェント群70がアクションa41、a42、・・・a4nを行えば、環境の状態S4がDAOエージェント61に入力され、それら侵害対処役務を行ったペルソナエージェント群70に対し報酬r41、r42、・・・r4nが与えられる。ペルソナエージェント群70のアクションa31、a32、・・・a3nとしては、例えば、侵害発見の報告投稿、侵害対処報告投稿、ライセンス交渉報告投稿等が考えられる。さらには、これら役務の前提となる特許出願の報告投稿やその権利化の報告投稿役務も含めてもよい。環境の状態S4は、侵害対処役務を行ったペルソナエージェント群70にも与えられる。この環境の状態S4は、例えば、侵害発見の報告投稿、侵害対処報告投稿、ライセンス交渉報告投稿等に付与された「いいね!」の数等である。
 ペルソナエージェント群が上記オリジンのアイデア発案役務に対し付与されたトークンA1を購入する役務をアクションa51、a52、・・・a5nとして行えば、環境の状態S5がDAOエージェント61に入力され、それらトークン購入役務を行ったペルソナエージェント群71に対し報酬r51、r52、・・・r5nが与えられる。環境の状態S5は、トークン購入役務を行ったペルソナエージェント群71にも与えられる。この環境の状態S5は、例えば、トークンの購入数(または購入金額)等である。ペルソナエージェント群71は、仮想通貨(例えばEthereumのETH等)を消費してトークンA1を購入する。なお、購入したトークンは、変動相場での価格に従って仮想通貨に変換(換金)でき、その仮想通貨は、変動相場での価格に従って円やドル等の法定通貨に変換(換金)できる。
 各ペルソナエージェント群に付与する報酬r1~r5は、DAOエージェント61が報酬テーブル(図39(A)参照)に基づいて決定する。アイデア発案役務を行ったペルソナエージェントに対しては、r1=A1+B1・b+G1・g、改良役務を行ったペルソナエージェンに対しては、r2=A2・e+B2・b+G2・g、事業化役務を行ったペルソナエージェントに対しては、r3=A3・e+B3・b、侵害対処役務を行ったペルソナエージェントに対しては、r4=A4・e+B4・b+G4・g、トークン購入役務を行ったペルソナエージェントに対しては、r5=B5・b+G5・gと、決定する。
 ここに、A2~A4,B1~B5,G1,G2,G4,G5は、係数であり、DAOエージェント61が強化学習により最適なものに収束させる。A1はトークン、gはライセンス収入、eは「いいね!」の数、bは事業化収益である。
 なお、各ペルソナエージェント群68~71が役務を行った後に発生したライセンス収入gまたは事業化収益bのみが報酬r2~r5として考慮される。ライセンス収入gまたは事業化収益bが既に発生しているオリジンアイデアに対し後から改良役務やトークン購入役務を行うという不正行為を防止するためである。
 また、改良役務、事業化役務、または侵害対処役務を行ったペルソナエージェント群が併せてトークン購入役務を行ってもよい。さらに、アイデア発案役務を行ったペルソナエージェント群67が、併せて改良役務、事業化役務、または侵害対処役務を行ってもよい。
 S613に示したDAOエージェント強化学習処理の詳細を図38に基づいて説明する。この処理は、DAOエージェント61が自ら強化学習を行い報酬r1~r5の最適化を図るものである。DAOエージェント61は、S630において、ペルソナエージェント群の各行為aを受信したか否か判定する。受信していない場合はS632へ進むが、受信していると判定した場合には制御がS631へ進み、受信した各行為aを記憶する。
 S632において、「いいね!」が付与されたか否か判定し、付与されていない場合にはS634へ進むが、付与されていると判定した場合にはS633において、ペルソナエージェント毎にいいね!eを記憶する。S634において、事業化収益があったか否か判定し、ない場合にはS636へ進むが、あったと判定した場合にはS635において、事業化収益bを記憶する。S636において、ライセンス利益gがあったか否か判定し、ない場合にはS638に進むが、あったと判定した場合には、S637において、ライセンス利益gを記憶する。
 S638において、報酬算出時期になったか否か判定し、なっていない場合にはS640に進むがなったと判定した場合には、S639において、報酬テーブル(図39(A))を参照して各報酬r1~r5を算出して該当するペルソナエージェントへ付与する。S640において、学習更新時期になったか否か判定し、なっていない場合にはこのDAOエージェント強化学習処理が終了してリターンする。学習更新時期になったと判定した場合にはS641において、報酬として付与したトークンA1のトータル付与価格TTと付与したトークンの変動相場における現時点のトータル価格TBとを算出し、S642において、TB/TTの値からDAOエージェントの報酬Rを算出する。例えば、前回の学習更新時におけるTB/TTの値と今回の学習更新時におけるTB/TTの値とを比較し、今回の学習更新時におけるTB/TTの値の方が大きい場合に大きな報酬Rにし、小さい場合に小さな報酬Rにする。その結果、DAOエージェント61が得ることのできる報酬Rは、トークンの変動相場におけるトータル価格TBが高騰すれば大きくなり、トークンの変動相場におけるトータル価格TBが下落すれば小さくなる。
 次に、S643において、報酬Rに基づいて、TD学習により最適政策πに従った行為A1~A4,B1~B5,G1,G2,G4,G5を求める処理が行われ、S644において、報酬テーブルのA1~A4,B1~B5,G1,G2,G4,G5を、求められた行為A1~A4,B1~B5,G1,G2,G4,G5に更新する。その結果、DAOエージェント61は、トークンの変動相場におけるトータル価格TBを高騰させるための最適な行為A1~A4,B1~B5,G1,G2,G4,G5を学習することになる。なお、この学習目標は一例に過ぎず、学習目標としては、他に、オリジンアイデアの投稿数を増加させること、オリジンアイデアと改良案との投稿合計数を増加させること、事業化件数を増加させること、事業化収益合計を増加させること等であってもよい。
 次に、S645において、強化学習が完了したか否か判定し、未だ完了していない場合はリターンする。完了したと判定した場合にはS646において、シミュレーション強化学習の依頼者に学習済みマルチ役務DAOを送信する。
 シミュレーション強化学習の依頼者は、インセンティブ設計が最適化された学習済みのマルチ役務DAO(イノベーション誘発DAO)65をリアルワールド47で運用することができる。その結果、このマルチ役務DAO(イノベーション誘発DAO)65では、図37に示した「各ペルソナエージェント群67~71」が、実際のユーザ群となり、各役務を行うユーザ群に対し、学習済みDAOエージェント61により最適設計された報酬(インセンティブ)が分配される。このリアルワールド47での実際の運用の段階では、各投稿内容等の役務やトークンの売買取引内容等をブロックチェーンにタイムスタンプ付きで記録させる。その結果、ブロックチェーンが、オリジンアイデア投稿内容や改良案投稿内容に対する公証人の役目を果たしてくれ、新規性喪失の例外適用(特許法30条)や冒認出願対策(特許法49条1項7行、74条、123条1項2号)も行いやすくなる。
 また、マルチ役務DAO(イノベーション誘発DAO)65をリアルワールド47で運用する段階においても、DAOエージェント61により引き続き機械学習(強化学習)を続行させ、自際の運用状況にマッチしたより一層最適にインセンティブ設計されたものになるようにしてもよい。なお、学習済みの各ペルソナエージェント群67~71(図40(A)(B)及び図41(A)(B)による学習済みのペルソナエージェント群)もマルチ役務DAO(イノベーション誘発DAO)65に含めてシミュレーション強化学習の依頼者に送信し、各役務を行うユーザ群に対し各ペルソナエージェント群67~71が相談役として機能させてもよい。さらには、マルチ役務DAO(イノベーション誘発DAO)65をリアルワールド47で運用する段階において、各役務をユーザ群と各ペルソナエージェント群67~71との両者が実行する混在型のマルチ役務DAO65にしてもよく、また、各役務を各ペルソナエージェント群67~71のみが実行するペルソナエージェント運用型のマルチ役務DAO(イノベーション誘発DAO)65にしてもよい。なお、このイノベーション誘発DAOは、前述のミラーワールドでのシミュレーション強化学習を経て生成されるものに限定されず、他の方法、例えば人為的な設計に基づいて人為的に生成されるものであってもよく、さらには、DAOに限らず、特定の管理者や主体を持った組織(例えば通常の株式会社等)であってもよい。
 次に、図39(B)に基づいてペルソナエージェントが強化学習を行う処理のメインルーチンを説明する。S648において、アイデア発案役務実行処理が行われ、S649において、改良役務実行処理が行われ、S650において、事業化役務実行処理が行われ、S651において、侵害対処役務実行処理が行われ、S652において、トークン購入役務実行処理が行われる。
 S648に示したアイデア発案役務実行処理の詳細を図40(A)に基づいて説明する。S655において、アイデア発案を行うか否か判定し行わない場合にはリターンする。行うと判定した場合には、S656において、アイデアを創出する処理を行う。このアイデアの創出は、例えばDABUSというAIを利用する。例えば、ペルソナエージェント67とDABUSとが協働してアイデアの創出を行う。S657において、アイデア発案の投稿内容を生成し、S658において、アイデア発案投稿行為a1iを実行する。
 S659において、DAOエージェント61から報酬r1iを受信したか否か判定し、受信していない場合にはリターンする。受信したと判定した場合には、S660において、報酬r1iに基づいて、TD学習により最適政策πに従った行為aを求める。この行為aは、受け取った報酬r1iが満足できるものであればアイデア発案の行為を繰り返し継続することになるが、報酬r1iが満足できるものでなければ、他の行為(例えば、改良役務、事業化役務、侵害対処役務、トークン購入役務、あるいはなにも役務を行わない)を選択することとなる。
 S649に示された改良役務実行処理の詳細を図40(B)に基づいて説明する。S664において、改良案を投稿するか否か判定し、投稿しない場合にはリターンする。投稿すると判定した場合にはS665において改良案を創出する処理を行う。改良案の創出は、例えばDABUSというAIを利用する。例えば、ペルソナエージェント68とDABUSとが協働して改良案を創出する処理を行う。S666において改良案投稿内容を生成し、S667において、改良案投稿行為a2iを実行する。
 S668において、DAOエージェント61から報酬r2iを受信したか否か判定し、受信していない場合にはリターンする。受信したと判定した場合には、S669において、報酬r2iに基づいて、TD学習により最適政策πに従った行為aを求める。この行為aは、受け取った報酬r2iが満足できるものであれば改良案投稿の行為を繰り返し継続することになるが、報酬r2iが満足できるものでなければ、他の行為(例えば、アイデア発案役務、事業化役務、侵害対処役務、トークン購入役務、あるいはなにも役務を行わない)を選択することとなる。
 S650に示された事業化役務実行処理の詳細を図41(A)に基づいて説明する。S674において、事業化するか否か判定し、事業化しない場合はリターンする。事業化すると判定した場合は、S675において、事業計画書を生成し、S676において、事業計画書の投稿行為a3iを実行し、S677において、事業化役務を遂行し、S678において、遂行状況投稿行為a3iを実行する。この遂行状況投稿行為a3iには、前述した事業化により得た収益の投稿等も含まれる。
 S679において、DAOエージェント61から報酬r3iを受信したか否か判定し、受信していない場合はリターンする。受信していると判定した場合はS680において、受信した報酬r3iに基づいて、TD学習により最適政策πに従った行為aを求める。この行為aは、受け取った報酬r3iが満足できるものであれば事業化役務の行為を繰り返し継続することになるが、報酬r3iが満足できるものでなければ、他の行為(例えば、アイデア発案役務、改良役務、侵害対処役務、トークン購入役務、あるいはなにも役務を行わない)を選択することとなる。
 S651に示した侵害対処役務実行処理の詳細を図41(B)に基づいて説明する。S684において、侵害対処役務を実行するか否か判定する。実行しない場合にはリターンするが、実行すると判定した場合にはS685において、侵害行為の捜査を行い、S686において、侵害行為を発見したか否か判定する。なお、侵害行為の捜査を行う前に、前述したように、特許出願やその権利化の行為を行ってもよい。侵害行為を発見しなかった場合にはリターンするが、侵害行為を発見したと判定した場合には、S687において、被疑侵害者への警告書を生成し、S688において、警告書投稿行為a4iを実行し、S689において、被疑侵害者との交渉等、侵害対処行為a4iを遂行し、S690において、遂行状況投稿行為a4iを実行する。
 次に、S691において、DAOエージェント61から報酬r4iを受信したか否か判定し、受信していない場合はリターンする。受信していると判定した場合はS692において、受信した報酬r4iに基づいて、TD学習により最適政策πに従った行為aを求める。この行為aは、受け取った報酬r4iが満足できるものであれば事業化役務の行為を繰り返し継続することになるが、報酬r4iが満足できるものでなければ、他の行為(例えば、アイデア発案役務、改良役務、事業化役務、トークン購入役務、あるいはなにも役務を行わない)を選択することとなる。
 次に、S652に示されたトークン購入役務実行処理の詳細を図42(A)に基づいて説明する。S969において、トークンを購入するか否か判定し、購入しない場合にはリターンする。購入すると判定した場合には、S697において、トークン購入行為a5iを実行する。次に、S698において、DAOエージェント61から報酬r5iを受信したか否か判定し、受信していない場合はリターンする。受信していると判定した場合はS699において、受信した報酬r5iに基づいて、TD学習により最適政策πに従った行為aを求める。この行為aは、受け取った報酬r5iが満足できるものであれば事業化役務の行為を繰り返し継続することになるが、報酬r5iが満足できるものでなければ、他の行為(例えば、アイデア発案役務、改良役務、事業化役務、侵害対処役務、あるいはなにも役務を行わない)を選択することとなる。
 図42(B)に基づいて、ペルソナエージェント群71によるトークン購入に伴うトークン72の変動相場での価格変動を説明する。アイデア発案役務を行ったペルソナエージェント67に報酬A1として50トークン(時価総額5万円)72が付与されており、そのトークン72の一部(10トークン)を1万円相当の仮想通貨を支払ってペルソナエージェント71aが購入した。次に、その10トークンを1万5千円相当の仮想通貨を支払ってペルソナエージェント71bが購入した。その結果、10トークンが1万5千円に価値が高騰する。それをペルソナエージェント71cが2万円相当の仮想通貨を支払って購入した。その結果、10トークンが2万円に価値が高騰する。それをペルソナエージェント71dが2万5千円相当の仮想通貨を支払って購入した。その結果、10トークンが2万5千円に価値が高騰する。それをペルソナエージェント71eが3万円相当の仮想通貨を支払って購入した。その結果、10トークンが3万円に価値が高騰する。
 これにより、ペルソナエージェント67の手持ちの40トークン(時価総額4万円)が時価総額12万円に高騰する。このトークンは期待値に正比例して高騰するのであり、人気のあるオリジンアイデアほど高くなり、人気のある(いいね!の多い)改良案が投稿されるほど高くなり、人気のある(いいね!の多い)事業化が投稿されるほど高くなり、人気のある(いいね!の多い)侵害対処が投稿されるほど高くなる。
 マルチ役務DAO65をリアルワールド47で実際に運用する段階では、前述したように、図37の「各ペルソナエージェント群67~71」がリアルワールドにおけるユーザ群となる。その場合に、アイデア発案役務を行ったユーザ群に与えられたトークン72ばかりでなく、各種役務を行うユーザ自身のトークン(以下「マイトークン」という)も売買させてもよい。その投稿された役務内容を閲覧した他のユーザが当該投稿者に期待して当該投稿者自身のマイトークンを購入することにより、変動相場でのマイトークンの価格が高騰する。この場合に、投稿者の所得の一部を、マイトークン購入者に購入量に応じた割合で配当してもよい。このマイトークンは、マルチ役務DAO65内で発行してもよいが、マイトークンを発行・流通させる専門業者がユーザに対し発行したマイトークンとリンクさせ、その専門業者発行のマイトークンをマルチ役務DAO65のユーザが売買できるようにしてもよい。マイトークンを発行・流通させる専門業者としては、現在、株式会社VALUがある。
 次に、複数の機能エレメントが協働して統制のとれた1つのDAOを構築するシステムを図43~図59に基づいて説明する。このようなDAOを以下「エレメント統合DAO」と称する。
 図43を参照し、このエレメント統合DAOは、リアルワールド47において既に存在する会社組織等をDAOで簡単に構築できるようにするものであり、その機能エレメント毎に予めエレメントDAOが生成され用意されている。つまり、機能エレメント毎にモジュール化されたエレメントDAOが用意されており、必要となるエレメントDAOを選んで組み合わせることにより、簡単に所望のエレメント統合DAOを構築できるように構成されている。エレメントDAO提供業者73には、サーバ74とエレメントDAOプロトコルDB75とが設けられている。エレメントDAOプロトコルDB75には、例えば、会社関係に必要な機能エレメント毎に用意されたエレメントDAO、NPO(Nonprofit Organization)関係に必要な機能エレメント毎に用意されたエレメントDAO、地方自治体に必要な機能エレメント毎に用意されたエレメントDAO等が記憶されている。
 エレメント統合DAO構築業者は、依頼者からエレメント統合DAO構築の注文を受けて、必要となる機能エレメントに相当するエレメントDAOを、サーバ74を経由してPC端末76にインストールする。図43の例では、A1エレメントDAO(A1エレメントエージェント含む)、A2エレメントDAO(A2エレメントエージェント含む)、A5エレメントDAO(A5エレメントエージェント含む)、A9エレメントDAO(A9エレメントエージェント含む)がインストールされている。A1~A9の各エレメントエージェントとは、対応する各エレメントDAOが最高のパフォーマンスを発揮できるように強化学習(機械学習)するためのAIである。
 また、PC端末76には、統括エージェントもインストールされる。この統括エージェントは、各エレメントDAOのエレメントエージェントを統括してエレメント統合DAO全体が最適化されるように制御するものであり、統括エージェント自身も強化学習(機械学習)を行って全体最適化を達成する。各エレメントエージェントは、担当するエレメントDAOのパフォーマンスを最大化するためのものであるため、エレメントエージェントのみでは部分最適化に陥り、エレメント統合DAOの全体最適化が達成できない虞がある。そこで、エレメント統合DAO全体が最適化されるように制御する統括エージェントが必要となる。これは、例えば、不完全情報ゲームにおけるパレート最適解探しと同じといえる。
 PC67にインストールされたエレメント統合DAOを、ミラーワールド51をシミュレーション環境としてシミュレーション強化学習を行うために、複数の端末16にインストールし、それら端末16をノード19とするプライベートチェーン2からなるブロックチェーンのデジタルツイン2Tを、ミラーワールド51内に生成する。
 このエレメント統合DAOのシミュレーション強化学習のメインルーチンを図44(A)に基づいて説明する。エレメント統合DAOのシミュレーション強化学習を依頼する依頼者のユーザ端末16のCPU10は、S674においてシミュレーション強化学習準備応答処理を行い、S675においてシミュレーション強化学習応答処理を行う。ミラーワールドサーバ46のCPU10は、S679においてシミュレーション強化学習準備処理を行い、S680においてシミュレーション強化学習処理を行う。
 S674に示されたシミュレーション強化学習準備応答処理及びS679に示されたシミュレーション強化学習準備処理の詳細を、図44(B)に基づいて説明する。シミュレーション強化学習準備応答処理においてユーザ端末16のCPU10は、S679において、シミュレーション強化学習を依頼するか否か判定し、依頼しない場合はリターンする。依頼すると判定した場合は、S680において、DAOデータとパーソナルAI群とを送信して依頼する。DAOデータとは、シミュレーション強化学習してもらいたい組織の機能エレメントである。例えば、家具組立販売会社の場合は、資材調達エレメント、組立エレメント、宣伝エレメント、販売エレメントである。パーソナルAI群とは、リアルワールド47において実際にエレメント統合DAOに従事する人々のパーソナルAIである。パーソナルAIを有していない従事者がいる場合、及び、未だに従事者が決まっていない場合には、前述のS561、S565~S568、S562、S573~S575に基づいて説明したように、シミュレーション強化学習対象のエレメント統合DAOにマッチするパーソナルAIを生成して準備する。
 シミュレーション強化学習準備処理において、ミラーワールドサーバ46のCPU10は、S683において、シミュレーション強化学習の依頼があったか否か判定し、ない場合にはリターンする。シミュレーション強化学習の依頼があったと判定した場合には、S684において、パーソナルAI群をコピーしてエレメント統合DAO内に配備してエレメント統合DAOデジタルツインを生成し、シミュレーション対象としてミラーワールド51に登録する。
 その状態を図45に示している。リアルワールド47のエレメント統合DAO77のデジタルツイン78がミラーワールド51に登録されている。図45に示すエレメント統合DAOデジタルツイン78は、例えば家具組立販売会社のエレメント統合DAOデジタルツイン78であり、資材調達、組立、宣伝、販売の、各機能エレメントを有し、その各機能エレメントに従事する者たちのパーソナルAI群の識別番号が、ミラーワールドサーバ46に記憶されている。
 このエレメント統合DAOデジタルツイン78について、シミュレーション強化学習により最適なインセンティブ設計を導き出す。その強化学習(機械学習)の概略システムを図46に示す。
 図46を参照し、エレメント統合DAOデジタルツイン78では、資材調達、組立、宣伝、販売の、各機能エレメントに対応して、資材調達エレメントエージェント80及び資材調達担当のパーソナルAI群84、組立エレメントエージェント81及び組立担当のパーソナルAI群85、宣伝エレメントエージェント82及び宣伝担当のパーソナルAI群86、資材調達エレメントエージェント80及び資材調達担当のパーソナルAI群84、販売エレメントエージェント83及び販売担当のパーソナルAI群87が、形成されている。それら各エレメントエージェント80~83を統括エージェント79が統括する。
 資材調達担当のパーソナルAI群84が内部打合せにおいて提案等の行為a11,a12,・・・a1nを行い、最終的にまとまった行為a1を資材提供業者のデジタルツイン群88に対して実行する。その行為a1に対する資材提供業者のデジタルツイン群88の状態S1が資材調達エレメントエージェント80及び資材調達担当のパーソナルAI群84に入力される。この状態S1は、例えば、資材要求数及び価格交渉の行為a1に対しての返答資材数及び返答価格等である。なお、資材調達担当のパーソナルAI群84の各行為a11,a12,・・・a1nは資材調達エレメントエージェント80にも入力され、まとまった行為a1は、統括エージェント79及び資材調達エレメントエージェント80にも入力される。
 資材調達エレメントエージェント80は、行為a1及び状態S1に基づいて、資材調達担当のパーソナルAI群84によるパフォーマンスp1を算出し、そのパフォーマンスp1を統括エージェント79に送信する。統括エージェント79は、そのパフォーマンスp1に基づいて報酬r1を決定し、その報酬r1を資材調達エレメントエージェント80へ送信する。資材調達エレメントエージェント80は、資材調達担当のパーソナルAI群84の各行為a11,a12,・・・a1nに基づいて報酬分配率を決定し、その報酬分配率に従って報酬r1を各資材調達担当のパーソナルAI84に分配する。
 組立担当のパーソナルAI群85が内部打合せにおいて提案等の行為a21,a22,・・・a2iを行い、最終的にまとまった行為a2を組立設備のデジタルツイン群89に対して実行する。その行為a2に対する組立設備のデジタルツイン群89の状態S2が組立エレメントエージェント81及び組立担当のパーソナルAI群85に入力される。この状態S1は、例えば、組立設備デジタルツイン群89の消費電力及び組立設備デジタルツイン群89に従事した組立担当のパーソナルAI群85の総労働時間等である。なお、組立担当のパーソナルAI群84の各行為a21,a22,・・・a2iは組立エレメントエージェント81にも入力され、まとまった行為a2は、統括エージェント79及び組立エレメントエージェント81にも入力される。
 組立エレメントエージェント81は、行為a2及び状態S2に基づいて、組立担当のパーソナルAI群85によるパフォーマンスp2を算出し、そのパフォーマンスp2を統括エージェント79に送信する。統括エージェント79は、そのパフォーマンスp2に基づいて報酬r2を決定し、その報酬r2を組立エレメントエージェント81へ送信する。組立エレメントエージェント81は、組立担当のパーソナルAI群85の各行為a21,a22,・・・a2iに基づいて報酬分配率を決定し、その報酬分配率に従って報酬r2を組立担当のパーソナルAI85に分配する。
 宣伝担当のパーソナルAI群86が内部打合せにおいて提案等の行為a51,a52,・・・a5jを行い、最終的にまとまった行為a5を消費者のパーソナルAI群90に対して実行する。その行為a5に対する消費者のパーソナルAI群90の状態S5が宣伝エレメントエージェント82及び宣伝担当のパーソナルAI群86に入力される。この状態S5は、例えば、消費者への商品レコメンド行為a5に対しての当該消費者の当該商品購入の有無や購入金額等である。なお、宣伝担当のパーソナルAI群86の各行為a51,a52,・・・a5jは宣伝エレメントエージェント82にも入力され、まとまった行為a5は、統括エージェント79及び宣伝エレメントエージェント82にも入力される。
 宣伝エレメントエージェント82は、行為a5及び状態S5に基づいて、宣伝担当のパーソナルAI群86によるパフォーマンスp5を算出し、そのパフォーマンスp5を統括エージェント79に送信する。統括エージェント79は、そのパフォーマンスp5に基づいて報酬r5を決定し、その報酬r5を宣伝エレメントエージェント82へ送信する。宣伝エレメントエージェント82は、宣伝担当のパーソナルAI群86の各行為a51,a52,・・・a5jに基づいて報酬分配率を決定し、その報酬分配率に従って報酬r5を宣伝担当のパーソナルAI86に分配する。
 販売担当のパーソナルAI群87が内部打合せにおいて提案等の行為a91,a92,・・・a9mを行い、最終的にまとまった行為a9を店舗及び消費者のデジタルツイン群91に対して実行する。その行為a9に対する店舗及び消費者のデジタルツイン群91の状態S9が販売エレメントエージェント83及び販売担当のパーソナルAI群87に入力される。この状態S9は、例えば、店舗での総販売金額等である。販売エレメントエージェント83には、上記行為a5に対する資材提供業者のデジタルツイン88の状態S5も入力される。なお、販売担当のパーソナルAI群87の各行為a91,a92,・・・a9mは販売エレメントエージェント83にも入力され、まとまった行為a9は、統括エージェント79及び販売エレメントエージェント83にも入力される。
 販売エレメントエージェント83は、行為a9及び状態S5,S9に基づいて、販売担当のパーソナルAI群87によるパフォーマンスp9を算出し、そのパフォーマンスp9を統括エージェント79に送信する。統括エージェント79は、そのパフォーマンスp9に基づいて報酬r9を決定し、その報酬r9を販売エレメントエージェント83へ送信する。販売エレメントエージェント83は、販売担当のパーソナルAI群87の各行為a91,a92,・・・a9mに基づいて報酬分配率を決定し、その報酬分配率に従って報酬r9を販売担当のパーソナルAI87に分配する。
 上記各パフォーマンスp1~p9と各報酬分配率との算出方法を、図47(A)(B)(C)、図48(A)に基づいて説明する。資材調達エレメントエージェント80は、パフォーマンスp1と分配率との算出アルゴリズムを知識として記憶している。このパフォーマンスp1と分配率との算出アルゴリズムを図47(A)に基づいて説明する。資材調達エレメントエージェント80は、今回(S689による前回のYES時点から今回のYES時点までの間)の資材購入金額uと現在の在庫数zとを状態S1とし、パフォーマンスp1={2(平均購入金額/u)+(z/平均在庫数)}/3 の計算式でパフォーマンスp1を算出する。平均購入金額とは、シミュレーション強化学習開始時点から現在までの資材の平均購入金額である。平均在庫数とは、シミュレーション強化学習開始時点から現在までの資材の平均購在庫数である。この計算式の結果、今回の資材購入金額uが安くなればパフォーマンスp1が大きくなり、現在の在庫数zが多くなればパフォーマンスp1が小さくなる。
 また、報酬分配率は、p1≧1の場合、まとまった行為a1への賛成度合いに比例して算出し、逆に、p1<1の場合は、まとまった行為a1への賛成度合いに反比例して算出する。ここに、「賛成度合い」の一乗に比例または反比例するものに限らず、「賛成度合い」のn乗に比例または反比例するもの等も含まれ、最適な比例関数または反比例関数を資材調達エレメントエージェント80が強化学習(機械学習)を行うことにより求める。また、「賛成度合い」は、まとまった行為a1自体を提案したパーソナルAIが1番高い賛成度合いとなり、パーソナルAIの各行為a11,a12,・・・a1nに基づいて資材調達エレメントエージェント80が各パーソナルAIの賛成度合いを判断する(算出する)。
 組立エレメントエージェント81が知識として記憶しているパフォーマンスp2と分配率との算出アルゴリズムを、図47(B)に基づいて説明する。組立エレメントエージェント81は、組立設備の今回(S710による前回のYES時点から今回のYES時点までの間)の消費電力eと今回の組立作業員総動労時間tとを状態S2とし、パフォーマンスp2={(平均消費電力/e)+(平均総労働時間/t)}/2 の計算式でパフォーマンスp2を算出する。今回の組立作業員総動労時間tとは、今回の組立設備デジタルツイン群89に従事した組立担当のパーソナルAI群85の総労働時間である。平均消費電力とは、シミュレーション強化学習開始時点から現在までの組立設備の消費電力の平均である。平均総労働時間とは、シミュレーション強化学習開始時点から現在までの組立作業員総動労時間の平均である。この計算式の結果、組立設備の今回の消費電力eが少なくなればパフォーマンスp2が大きくなり、今回の組立作業員総動労時間tが多くなればパフォーマンスp2が小さくなる。
 また、報酬分配率は、p2≧1の場合、まとまった行為a2への賛成度合いに比例して算出し、逆に、p2<1の場合は、まとまった行為a2への賛成度合いに反比例して算出する。ここに、「賛成度合い」の一乗に比例または反比例するものに限らず、「賛成度合い」のn乗に比例または反比例するもの等も含まれ、最適な比例関数または反比例関数を組立エレメントエージェント81が強化学習(機械学習)を行うことにより求める。また、「賛成度合い」は、まとまった行為a2自体を提案したパーソナルAIが1番高い賛成度合いとなり、パーソナルAIの各行為a21,a22,・・・a2iに基づいて組立エレメントエージェント81が各パーソナルAIの賛成度合いを判断する(算出する)。
 宣伝エレメントエージェント82が知識として記憶しているパフォーマンスp5と分配率との算出アルゴリズムを、図47(C)に基づいて説明する。宣伝エレメントエージェント82は、レコメンドした消費者パーソナルAIの今回(S728による前回のYES時点から今回のYES時点までの間)の総購入金額kを状態S5とし、パフォーマンスp5=k/レコメンドした消費者パーソナルAIの平均総購入金額K の計算式でパフォーマンスp5を算出する。平均総購入金額Kとは、シミュレーション強化学習開始時点から現在までのレコメンドした消費者パーソナルAI群90の総購入金額の平均である。この計算式の結果、レコメンドした消費者パーソナルAIの今回の総購入金額k今が高くなればパフォーマンスp5が大きくなる。
 また、報酬分配率は、p5≧1の場合、まとまった行為a5への賛成度合いに比例して算出し、逆に、p5<1の場合は、まとまった行為a5への賛成度合いに反比例して算出する。ここに、「賛成度合い」の一乗に比例または反比例するものに限らず、「賛成度合い」のn乗に比例または反比例するもの等も含まれ、最適な比例関数または反比例関数を宣伝エレメントエージェント82が強化学習(機械学習)を行うことにより求める。また、「賛成度合い」は、まとまった行為a5自体を提案したパーソナルAIが1番高い賛成度合いとなり、パーソナルAIの各行為a51,a52,・・・a5jに基づいて宣伝エレメントエージェント82が各パーソナルAIの賛成度合いを判断する(算出する)。
 販売エレメントエージェント83が知識として記憶しているパフォーマンスp5と分配率との算出アルゴリズムを、図48(A)に基づいて説明する。販売エレメントエージェント83は、店舗での今回(S749による前回のYES時点から今回のYES時点までの間)の総販売金額hと平均総販売金額Hを状態S9とし、この状態S9と上記状態S5とにより、パフォーマンスp9=(h-k)/(H-K) の計算式でパフォーマンスp9を算出する。平均総販売金額Hとは、シミュレーション強化学習開始時点から現在までの店舗での総販売金額の平均である。また、kは、レコメンドした消費者パーソナルAIの今回の総購入金額であり、Kは、シミュレーション強化学習開始時点から現在までのレコメンドした消費者パーソナルAI群90の総購入金額の平均である(図47(C)及びその説明参照)。この計算式の結果、店舗での今回の総販売金額hからレコメンドした消費者パーソナルAIの今回の総購入金額kを減算した値が大きくなればパフォーマンスp9が大きくなる。レコメンドした消費者パーソナルAIの今回の総購入金額kは、宣伝担当のパーソナルAI群86の手柄であり、販売担当のパーソナルAI群87のみの手柄は、店舗での今回の総販売金額hからレコメンドした消費者パーソナルAIの今回の総購入金額kを減算した値となるためである。
 また、報酬分配率は、p9≧1の場合、まとまった行為a9への賛成度合いに比例して算出し、逆に、p9<1の場合は、まとまった行為a9への賛成度合いに反比例して算出する。ここに、「賛成度合い」の一乗に比例または反比例するものに限らず、「賛成度合い」のn乗に比例または反比例するもの等も含まれ、最適な比例関数または反比例関数を宣伝エレメントエージェント83が強化学習(機械学習)を行うことにより求める。また、「賛成度合い」は、まとまった行為a9自体を提案したパーソナルAIが1番高い賛成度合いとなり、パーソナルAIの各行為a91,a92,・・・a9mに基づいて販売エレメントエージェント83が各パーソナルAIの賛成度合いを判断する(算出する)。
 次に、統括エージェント79が知識として記憶している報酬テーブル92を、図48(B)に基づいて説明する。この報酬テーブル92には、統括エージェント79が各エレメントエージェント80~83に分配する報酬の算出式が記憶されている。分配する報酬は、係数×(今期の利益)×(対象のエレメントエージェントから送られてきたパフォーマンス)÷(全エレメントエージェントから送られてきたパフォーマンスの合計) で算出される。ここに、「今期」とは、S675による前回のYES時点から今回のYES時点までの間のことである。
 具体的には、資材調達エレメントエージェント80に分配する報酬r1は、r1=A1・Lt・p1/(p1+p2+p5+p9)。組立エレメントエージェント81に分配する報酬r2は、r2=A2・Lt・p2/(p1+p2+p5+p9)。宣伝エレメントエージェント82に分配する報酬r5は、r5=A5・Lt・p5/(p1+p2+p5+p9)。販売エレメントエージェント83に分配する報酬r9は、r9=A9・Lt・p9/(p1+p2+p5+p9)である。ここに、Ltは今期の利益、A1,A2,A5,A9は、統括エージェント79が決定した行為としての係数である。
 次に、S680に示したシミュレーション強化学習処理の具体的内容を図49に基づいて説明する。S687により統括エージェント強化学習処理を実行し、S688により資材調達エレメントエージェント強化学習処理を実行し、S689により組立エレメントエージェント強化学習処理を実行し、S690により宣伝エレメントエージェント強化学習処理を実行し、S691により販売エージェント強化学習処理を実行し、S692により資材調達担当パーソナルAI強化学習処理を実行し、S693により組立担当パーソナルAI強化学習処理を実行し、S694により宣伝担当パーソナルAI強化学習処理を実行し、S695により販売担当パーソナルAI強化学習処理を実行する。
 S687に示した統括エージェント強化学習処理の詳細を図50に基づいて説明する。統括エージェント79は、S699において、各エレメントエージェント80~83から送られてくる各パフォーマンスpを受信したか否か判定する。受信していない場合には制御がS671に進むが、受信していると判定した場合はS670において、受信した各パフォーマンスpを記憶する。
 次に、S671において、各行為a1~a9を受信したか否か判定し、受信していない場合は制御がS673に進む。受信していると判定した場合にはS672において、受信した各行為a1~a9を記憶する。次に、S673において、店舗及び消費者のパーソナルAI群91から送られてくる状態S9の入力があったか否か判定し、ない場合には制御がS675に進む。入力があったと判定した場合にはS674において、売上=ΣS9 を算出する。
 次に、S675において、報酬算出時期になったか否か判定し、なっていない場合には制御がS677に進むが、なっていると判定した場合には、S676において、報酬テーブル92を参照して報酬r1,r2,r3,r5,r9を算出して該当するエレメントエージェント80~83へ送信する。
 次に、S677において、強化学習(機械学習)の更新時期になったか否か判定し、なっていない場合にはリターンする。更新時期になったと判定した場合にはS687において、今期の利益Lt=売上-経費 を算出する。次に、S679において、各報酬r1,r2,r5,r9を算出して対応するエレメントエージェント80~83に配布する。
 次に、S680において、利益Ltから統括エージェント79の報酬Rを算出する。この報酬Rは、利益Ltに比例する。次に、S681において、上記報酬Rに基づいて、TD学習により最適政策πに従った行為(係数)A1,A2,A5,A9を求める。次にS682において、報酬テーブル92のA1,A2,A5,A9を、S681で求めた行為(係数)A1,A2,A5,A9に更新する。この結果、統括エージェント79は、利益Ltが最大となる行為(係数)A1,A2,A5,A9を学習することになる。
 S688に示した資材調達エレメントエージェント強化学習処理の詳細を図51に基づいて説明する。資材調達エレメントエージェント80は、S684において、クローラによる情報収集処理を行う。クローラとは、ウェブ上の文書や画像などを周期的に取得し、自動的にデータベース化するプログラムである。「ボット(Bot)」、「スパイダー」、「ロボット」などとも呼ばれる。
 このクローラによる情報収集処理の詳細を図52(A)に基づいて説明する。資材調達エレメントエージェント80は、S702において、クローラがネット上を巡回して収集した情報を受信する。次に、S703において、その受信した情報を資材調達DB93に格納する。
 その資材調達DB93に格納された情報を図52(B)に示す。資材調達DB93には、図示するように、経済情報、社会情報、気象情報、在庫情報、市場情報、・・・仕入先情報等の、資材調達業務に必要となる各種情報が格納されている。
 図51に戻り、資材調達エレメントエージェント80は、S685において、パーソナルAI群84からの行為a11,a12,・・・a1nを受信したか否か判定する。受信していない場合には制御がS687に進むが、受信したと判定した場合にはS686において、受信した各行為a11,a12,・・・a1nを記憶する。S687において、資材供給業者のデジタルツイン群88からの状態S1を受信したか否か判定し、受信していない場合は制御がS689に進む。受信したと判定した場合はS688において、受信したS1を記憶する。
 S689において、パフォーマンスp1の算出時期であるか否か判定し、算出時期でない場合には制御がS692に進む。算出時期と判定した場合には、S690において、パフォーマンスp1={2(平均購入金額/u)+(z/平均在庫数)}/3 を算出する。そのパフォーマンスp1を統括エージェント79へ送信する(S691)。
 S692において、統括エージェント79から送信された報酬r1を受信したか否か判定し、受信していない場合にはリターンする。受信したと判定した場合には、図47(A)に示した報酬分配率のアルゴリズムに基づいて報酬分配率を算出する(S693)。S694において、報酬に各分配率を乗じて各報酬r11,r12…r1nを算出し、S695において、各報酬r11,r12…r1nを各資材調達担当パーソナルAI群84に付与する。S696において、受信した報酬r1にもとづいて、TD学習により最適政策πに従った行為(比例関数または反比例関数)を求める。S697において、比例関数または反比例関数を、S696で求めたものに更新する。その結果、資材調達エレメントエージェント80は、上記パフォーマンスp1を最大にする比例関数または反比例関数を学習することになる。
 次に、S689に示した組立エレメントエージェント強化学習処理の詳細を図53に基づいて説明する。組立エレメントエージェント81は、S706において、パーソナルAI群85からの行為a21,a22,・・・a2nを受信したか否か判定する。受信していない場合には制御がS708に進むが、受信したと判定した場合にはS707において、受信した各行為a21,a22,・・・a2nを記憶する。S708において、組立設備のデジタルツイン群89からの状態S2を受信したか否か判定し、受信していない場合は制御がS710に進む。受信したと判定した場合はS709において、受信した状態S2を記憶する。
 S710において、パフォーマンスp2の算出時期であるか否か判定し、算出時期でない場合には制御がS713に進む。算出時期と判定した場合には、S711において、パフォーマンスp2={(平均消費電力/e)+(平均総労働時間/t)}/2 を算出する。そのパフォーマンスp2を統括エージェント79へ送信する(S712)。
 S713において、統括エージェント79から送られてくる報酬r2を受信したか否か判定し、受信していない場合にはリターンする。受信したと判定した場合には、図47(B)に示した報酬分配率のアルゴリズムに基づいて報酬分配率を算出する(S714)。S715において、報酬に各分配率を乗じて各報酬r11,r12…r1nを算出し、S695において、各報酬r21,r22…r2iを組立て担当パーソナルAI群86に付与する。S717において、受信した報酬r2にもとづいて、TD学習により最適政策πに従った行為(比例関数または反比例関数)を求める。S718において、比例関数または反比例関数を、S717で求めたものに更新する。その結果、組立エレメントエージェント81は、上記パフォーマンスp2を最大にする比例関数または反比例関数を学習することになる。
 S690に示した宣伝エレメントエージェント強化学習処理の詳細を図54に基づいて説明する。宣伝エレメントエージェント83は、S723において、クローラによる情報収集処理を行う。この処理の詳細を図55(A)に基づいて説明する。宣伝エレメントエージェント83は、S740において、クローラがネット上を巡回して収集した情報を受信し、S741において、受信した情報を宣伝DB94に格納する。
 その宣伝DB94に格納された収集データを図55(B)に示す。宣伝DB94には、消費者である太郎、次郎、・・・花子等の各種行動データが格納されている。例えば太郎の場合、「一戸建てを注文した」という情報から家具を購入する可能性が高いと判断し、太郎に対し家具の宣伝を行う。次郎の場合、「夫婦じゃわん購入」という情報から、近々結婚するために新居で家具を購入する可能性が高いと判断し、次郎に対し家具の宣伝を行う。
 図54に戻り、宣伝エレメントエージェント83は、S742において、各パーソナルAI群86からの行為を受信したか否か判定する。受信していない場合は制御がS726に進むが、受信していると判定した場合にはS725において、受信した各行為を記憶する。S726において、消費者のパーソナルAI群90から送られてくる状態S5を受信したか否か判定し、未だ受信していない場合には制御がS728に進む。受信したと判定した場合にはS727において、受信した状態S5を記憶する。
 S728において、パフォーマンスp5の算出時期であるか否か判定し、パフォーマンスp5の算出時期でない場合には制御がS731に進む。パフォーマンスp5の算出時期であると判定した場合にはS729において、パフォーマンスp5=k/レコメンドした消費者パーソナルAIの平均総購入金額K を算出する。次にS730において、パフォーマンスP5を統括エージェント79へ送信する。
 S731において、統括エージェント79から送られてくる報酬r5を受信したか否か判定し、未だ受信していない場合はリターンする。受信したと判定した場合にはS732において、図47(C)に示した報酬分配率のアルゴリズムに基づいて報酬分配率を算出する(S732)。S733において、報酬に各分配率を乗じて各報酬r51,r52…r5jを算出し、S734において、各報酬r51,r52…r5jを宣伝担当パーソナルAI群87に付与する。S735において、受信した報酬r5にもとづいて、TD学習により最適政策πに従った行為(比例関数または反比例関数)を求める。S736において、比例関数または反比例関数を、S735で求めたものに更新する。その結果、宣伝エレメントエージェント82は、上記パフォーマンスp5を最大にする比例関数または反比例関数を学習することになる。
 次に、S691に示した販売エレメントエージェント強化学習処理の詳細を図56にもとづいて説明する。販売エレメントエージェント84は、S744において、クローラによる情報収集処理を行う。この処理の詳細を図57(A)に基づいて説明する。販売エレメントエージェント84は、S760において、クローラがネット上を巡回して収集した情報を受信し、S761において、受信した情報を販売DB95に格納する。さらに、S762において、店舗におけるPOSデータを販売DB95に格納する。
 その販売DB95に格納された収集データを図57(B)に示す。販売DB95には、気象データやPOSデータ等の各種データが格納されている。気象情報における「日付別」とは、曜日別を含む概念である。気象情報(日付別時間別天候気温データ)とPOSデータ(日付別時間別販売商品データ)とに基づいて、例えば、曜日と時間と気象状況とを考慮した陳列商品の配置替え等を行うことができる。
 図56に戻り、販売エレメントエージェント84は、S745において、各パーソナルAI群87からの行為を受信したか否か判定する。受信していない場合は制御がS747に進むが、受信していると判定した場合にはS746において、受信した各行為を記憶する。S747において、販売店及び消費者のパーソナルAI群91から送られてくる状態S9を受信したか否か判定し、未だ受信していない場合には制御がS749に進む。受信したと判定した場合にはS748において、受信した状態S9を記憶する。
 S749において、パフォーマンスp9の算出時期であるか否か判定し、パフォーマンスp9の算出時期でない場合には制御がS752に進む。パフォーマンスp9の算出時期であると判定した場合にはS750において、パフォーマンスp9=(h-k)/(H-K) を算出する。次にS751において、パフォーマンスp9を統括エージェント79へ送信する。
 S752において、統括エージェント79から送られてくる報酬r9を受信したか否か判定し、未だ受信していない場合はリターンする。受信したと判定した場合にはS753において、図48(A)に示した報酬分配率のアルゴリズムに基づいて報酬分配率を算出する(S753)。S754において、報酬に各分配率を乗じて各報酬r91,r92…r9mを算出し、S755において、各報酬r91,r92…r9mを販売担当パーソナルAI群88に付与する。S756において、受信した報酬r9にもとづいて、TD学習により最適政策πに従った行為(比例関数または反比例関数)を求める。S757において、比例関数または反比例関数を、S756で求めたものに更新する。その結果、販売エレメントエージェント83は、上記パフォーマンスp9を最大にする比例関数または反比例関数を学習することになる。
 次に、S692に示した資材調達担当パーソナルAI強化学習処理の詳細を図58(A)に基づいて説明する。資材調達担当パーソナルAI群84は、S765において、資材供給業者のデジタルツイン群88と交渉するか否か判定し、交渉しない場合は制御がS770に進む。交渉すると判定した場合はS766において、資金調達DB93の格納データを閲覧し、格納データを参考にして内部打合せを行いながら行為a1を決定し(S767)、資材供給業者のデジタルツイン群88と交渉する(S768)。S769において、交渉が終了いたか否か判定し、未だ終了していない場合にはS766に戻り、S767→S768→S769→S766のループを巡回する。S769において交渉が終了したと判定した段階で制御がS770に進む。
 S770において、資材調達エレメントエージェント80から報酬r11,r12・・・r1nを受信したか否か判定し、受信していない場合にはリターンする。報酬を受信したと判定した場合にはS771において、受信した報酬に基づいて、TD学習により最適政策πに従った行為(a11,a12・・・a1n)を求める。この行為a1iは、受け取った報酬r1iが満足できるものでなければ、他の会社DAOデジタルツイン(例えば、図45の株式会社ABCのDAOデジタルツイン59)に移る(転職する)ものも含む。この強化学習の結果、資材調達担当パーソナルAIの各々は、前述のパフォーマンスp1を増加させる行為を学習することになる。
 次に、S693に示した組立担当パーソナルAI強化学習処理の詳細を図58(B)に基づいて説明する。組立担当パーソナルAI群85は、S775において、内部打合せするか否か判定し、しない場合は制御がS779に進む。打合せすると判定した場合はS776において、各組立担当パーソナルAIが内部打合せを行いながら行為a2を決定する。次に、S777において、行為a2に従って、組立設備デジタルツイン群89を試運転し、行為a2の妥当性を検証する。S778において、打合せが終了いたか否か判定し、未だ終了していない場合にはS776に戻り、S777→S778→S776のループを巡回する。S777の試運転の結果行為a2が妥当である場合にはS778により打合せ終了と判定され、制御がS779に進む。
 S779において、組立エレメントエージェント81から報酬r21,r22・・・r2nを受信したか否か判定し、受信していない場合にはリターンする。報酬を受信したと判定した場合にはS780において、受信した報酬に基づいて、TD学習により最適政策πに従った行為(a21,a22・・・a2i)を求める。この行為a2iは、受け取った報酬r2iが満足できるものでなければ、他の会社DAOデジタルツイン(例えば、図45の株式会社ABCのDAOデジタルツイン59)に移る(転職する)ものも含む。この強化学習の結果、組立担当パーソナルAIの各々は、前述のパフォーマンスp2を増加させる行為を学習することになる。
 次に、S694に示した宣伝担当パーソナルAI強化学習処理の詳細を図59(A)に基づいて説明する。宣伝担当パーソナルAI群86は、S784において、内部打合せするか否か判定し、しない場合は制御がS789に進む。打合せすると判定した場合はS785において、各宣伝担当パーソナルAIが内部打合せを行いながら行為a5を決定する。次に、S787において、消費者への行為a2を実行する。S788において、打合せが終了いたか否か判定し、未だ終了していない場合にはS785に戻り、S786→S787→S788のループを巡回する。S788により打合せ終了と判定された段階で制御がS789に進む。
 S789において、宣伝エレメントエージェント82から報酬r51,r52・・・r5jを受信したか否か判定し、受信していない場合にはリターンする。報酬を受信したと判定した場合にはS790において、受信した報酬に基づいて、TD学習により最適政策πに従った行為(a51,a52・・・a5j)を求める。この行為a5iは、受け取った報酬r5iが満足できるものでなければ、他の会社DAOデジタルツイン(例えば、図45の株式会社ABCのDAOデジタルツイン59)に移る(転職する)ものも含む。この強化学習の結果、宣伝担当パーソナルAIの各々は、前述のパフォーマンスp5を増加させる行為を学習することになる。
 次に、S695に示した販売担当パーソナルAI強化学習処理の詳細を図59(B)に基づいて説明する。販売担当パーソナルAI群87は、S791において、内部打合せするか否か判定し、しない場合は制御がS795に進む。打合せすると判定した場合はS792において、各販売担当パーソナルAIが内部打合せを行いながら行為a9を決定する。次に、S793において打合せが終了いたか否か判定し、未だ終了していない場合にはS792に戻り、S792→S793→S792のループを巡回する。S793により打合せ終了と判定された段階で制御がS794に進む。S794において、上記打合せで決定された行為を消費者及び店舗に対し実行する。
 次に、S795において、販売エレメントエージェント83から報酬r91,r92・・・r9mを受信したか否か判定し、受信していない場合にはリターンする。報酬を受信したと判定した場合にはS796において、受信した報酬に基づいて、TD学習により最適政策π*に従った行為(a91,a92・・・a9m)を求める。この行為a9iは、受け取った報酬r9iが満足できるものでなければ、他の会社DAOデジタルツイン(例えば、図45の株式会社ABCのDAOデジタルツイン59)に移る(転職する)ものも含む。この強化学習の結果、販売担当パーソナルAIの各々は、前述のパフォーマンスp9を増加させる行為を学習することになる。
 シミュレーション強化学習が終了したエレメント統合DAOは、リアルワールド47において実際の組織として運用される。その段階では、図46の「各パーソナルAI群84~87」をリアルワールドにおける実際の人間(ユーザ)が担当することとなる。その際に、シミュレーション強化学習済みの各パーソナルAI群84~87が実際の人間(ユーザ)の相談役となり、シミュレーション強化学習によって得た知識・経験・ノウハウを実際の人間(ユーザ)に提供することができる。
 以上説明したエレメント統合DAOの構築は、会社やNPOや地方自治体等の組織全体を、機能別のエレメントDAOの組み合わせで作成するものを示したが、組織全体ではなく組織の一部(例えば資材調達)のみをエレメントDAOで構築するようにしてもよい。
 ユーザ端末16等及び各種サーバで動作する前述したプログラムは、所定のウェブサイト等からダウンロードしてインストールしてもよいが、例えばCD-ROM99等の記録媒体(非一時的(non-transitory)な記録媒体)に記録させて流通させ、そのCD-ROM99等を購入した者がプログラムをユーザ端末16及び各種サーバにインストールしてもよい(図60参照)。
[変形例]
 (1) 例えば、図29に示したデジタルツインデータにおける太郎、次郎、桜、三郎等の氏名は、個人情報保護の観点から仮名(匿名)を用い、同一人物であるとの同定はできるが特定の個人を特定できないようにしてもよい。その場合に、AI識別番号またはブロックチェーンアドレスを仮名(匿名)として用いてもよい。同様に、株式会社ABC等のデジタルツインも、会社名(組織名)に仮名(匿名)を用い、同一会社(同一組織)であるとの同定はできるが特定の会社(組織)を特定できないようにしてもよい。また、人間のデジタルツインは、1人の人間に対し複数のパーソナルAIによる複数のデジタルツインを用意してもよい。さらには、1人の人間における1つのデジタルツインを複数のパーソナルAIの集合(例えば、各種分野における専門的パーソナルAIの集合等)で構成してもよい。
 (2) 図34~図59では、役務が複数種類存在するマルチ役務DAOを例にしてシミュレーションを行うことにより、DAOにおけるインセンティブ設計の最適解を導き出すシステムを説明したが、マルチ役務DAOに限らず、役務が1種類しか存在しないDAOについて、シミュレーションによるインセンティブ設計の最適解を導き出すシステムであってもよい。
 (3) 図35では、ペルソナ毎に学習済みのペルソナエージェント群を生成しているが、ペルソナ毎に属するユーザ群の各のパーソナルAIを、ミラーワールド51に登録されている既存のパーソナルAI群の中から選んでペルソナエージェント群として用いてもよい。この場合は、ペルソナ毎に属するユーザ群に対し、パーソナルAIをシミュレーションに用いてもよいか否か問合わせ、用いてもよいとの承諾を得ておく必要がある。承諾を得たユーザ群の各パーソナルAIをコピーしてシミュレーションに用い、シミュレーション完了後の学習済みパーソナルAI群を該当する各ユーザに送信する。それを受信した各ユーザは、学習済みパーソナルAIが有用(必要)であると判断した場合に、既存のパーソナルAIに対し学習済みパーソナルAIを上書き保存する。なお、既存のパーソナルAIと学習済みパーソナルAIとの両者を共に記憶しておき、必要に応じて使い分けるようにしてもよい。
 (4) マルチエージェント強化学習として、全体最適化を担う統括エージェント(マスターエージェント)が各エージェントに報酬の配分を行うと共に統括エージェント自身も強化学習を行って報酬配分の行為を最適なものに収束させるマスターエージェント方式を示した。しかし、マルチエージェント強化学習としては、これに限定されるものではなく、例えば、マルコフ決定過程の下で最適解に収束することができるD-learning、あるいは、Classifier Systemにおける強化学習アルゴリズムとしてのBucket BrigadeやProfit Sharingを用いてもよい。
 (5) デジタルツインを用いたシミュレーションとしては、人または人によって構成された組織(例えば株式会社やNPO等)のデジタルツインに限定されない。例えば、AI搭載の機械や電気製品等のオブジェクト(例えばAI搭載掃除機)において、当該オブジェクトが動作する環境(例えば、自立して移動するAI搭載掃除機が動作するユーザ宅の室内)のデジタルツインをサイバー空間内に生成し、その環境デジタルツイン内でオブジェクトに搭載されているAIを事前にシミュレーションして強化学習(機械学習)させ、そのカスタマイズ(パーソナライズ)された学習済みAI搭載のオブジェクトを該当するユーザに提供するようにしてもよい。
 記録された情報の真正の保証とその情報の削除権の保証とが二律背反するジレンマを極力解消することができるため、ブロックチェーン等の消去不可能性を有する情報記録方式に対し利用できる。
1 インターネット
2 プライベートチェーン
3 コンソーシアムチェーン
4 パブリックチェーン
12 HDD
16 ユーザ端末
19 ノード
30 鍵登録センタ
32 鍵DB
46 ミラーワールドサーバ
51 ミラーワールド
52 地球デジタルツイン
53 日本デジタルツイン
54 町デジタルツイン
57 太郎デジタルツイン
58 太郎一家デジタルツイン
59 株式会社ABCデジタルツイン
61 DAOエージェント
72 トークン
78 DAOデジタルツイン
79 統括エージェント。

Claims (5)

  1.  記録対象の情報を暗号化する暗号化処理を行う暗号化手段と、
     前記暗号化処理を経た後の情報を記録する記録手段と、
     前記記録手段により記録された情報に対し、第1鍵と第2鍵とを用いて復号処理を行って平文の情報にする復号手段と、
     前記記録手段により記録された情報を復号できない復号不能化状態にする復号不能化手段と、を備え、
     前記復号手段は、前記第2鍵を秘匿して保持する第2鍵秘匿保持手段を含み、
     前記復号不能化手段は、前記第2鍵秘匿保持手段により保持されている前記第2鍵を他のものに更新することにより復号不能化状態にする、処理システム。
  2.  前記復号手段は、前記第1鍵を情報の閲覧希望者に配布する第1鍵配布手段をさらに含む、請求項1に記載の処理システム。
  3.  前記記録手段により記録された情報を平文にすることなく検索する検索手段をさらに備えている、請求項1または2に記載の処理システム。
  4.  前記記録手段により記録された情報は個人情報を含み、
     前記復号不能化手段は、個人情報主の要求に応じて当該個人情報主の個人情報を前記復号不能化状態にする、請求項1~3の何れかに記載の処理システム。
  5.  記録対象の情報を暗号化する暗号化処理を行うステップと、
     前記暗号化処理を経た後の情報を記録する記録手段により記録された情報に対し、第1鍵と第2鍵とを用いて復号処理を行って平文の情報にする復号ステップと、
     前記記録手段により記録された情報を復号できない復号不能化状態にするステップとを、
    コンピュータに実行させ、
     前記復号ステップは、前記第2鍵を秘匿して保持するステップを含み、
     前記復号不能化状態にするステップは、前記保持するステップにより保持されている前記第2鍵を他のものに更新することにより復号不能化状態にする、プログラム。
PCT/JP2019/047339 2019-01-06 2019-12-04 処理システムおよびプログラム WO2020141584A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020563862A JP7446621B2 (ja) 2019-01-06 2019-12-04 コンピュータシステム及び個人情報提供方法
JP2024023394A JP2024045636A (ja) 2019-01-06 2024-02-20 処理システムおよびプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-000371 2019-01-06
JP2019000371 2019-01-06

Publications (1)

Publication Number Publication Date
WO2020141584A1 true WO2020141584A1 (ja) 2020-07-09

Family

ID=71406834

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/047339 WO2020141584A1 (ja) 2019-01-06 2019-12-04 処理システムおよびプログラム

Country Status (2)

Country Link
JP (2) JP7446621B2 (ja)
WO (1) WO2020141584A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559627A (zh) * 2020-12-11 2021-03-26 东北大学 一种基于联盟链的链上-链下协同电子病历数据共享方法
WO2022102106A1 (ja) * 2020-11-13 2022-05-19 日本電信電話株式会社 最適化装置、最適化方法、及び最適化プログラム
JP7079539B1 (ja) 2022-01-05 2022-06-02 株式会社Fuel Hash 情報処理方法、情報処理装置及びプログラム
JP7108765B1 (ja) * 2021-08-10 2022-07-28 金子 賢一 情報処理方法、情報処理装置、情報処理システム、及びプログラム
WO2022230177A1 (ja) * 2021-04-30 2022-11-03 株式会社KPMG Ignition Tokyo 管理装置及び管理方法
WO2023058132A1 (ja) * 2021-10-05 2023-04-13 日本電信電話株式会社 シミュレーションレイヤ選択装置、シミュレーションレイヤ選択方法およびシミュレーションレイヤ選択プログラム
CN117521114A (zh) * 2024-01-04 2024-02-06 金网络(北京)数字科技有限公司 数据交易方法、系统和计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995009410A1 (fr) * 1993-09-29 1995-04-06 Pumpkin House Incorporated Dispositif et procede de chiffrement/dechiffrement et systeme de communication a chiffrement/dechiffrement

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003316965A (ja) * 2002-04-19 2003-11-07 Omron Corp 情報収集システム,情報提供装置,仲介処理装置,情報匿名化装置,情報提供処理用のプログラム,情報中継処理用のプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995009410A1 (fr) * 1993-09-29 1995-04-06 Pumpkin House Incorporated Dispositif et procede de chiffrement/dechiffrement et systeme de communication a chiffrement/dechiffrement

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022102106A1 (ja) * 2020-11-13 2022-05-19 日本電信電話株式会社 最適化装置、最適化方法、及び最適化プログラム
CN112559627A (zh) * 2020-12-11 2021-03-26 东北大学 一种基于联盟链的链上-链下协同电子病历数据共享方法
CN112559627B (zh) * 2020-12-11 2023-08-04 东北大学 一种基于联盟链的链上-链下协同电子病历数据共享方法
WO2022230177A1 (ja) * 2021-04-30 2022-11-03 株式会社KPMG Ignition Tokyo 管理装置及び管理方法
JP7108765B1 (ja) * 2021-08-10 2022-07-28 金子 賢一 情報処理方法、情報処理装置、情報処理システム、及びプログラム
WO2023058132A1 (ja) * 2021-10-05 2023-04-13 日本電信電話株式会社 シミュレーションレイヤ選択装置、シミュレーションレイヤ選択方法およびシミュレーションレイヤ選択プログラム
JP7079539B1 (ja) 2022-01-05 2022-06-02 株式会社Fuel Hash 情報処理方法、情報処理装置及びプログラム
JP2023100174A (ja) * 2022-01-05 2023-07-18 株式会社Fuelhash 情報処理方法、情報処理装置及びプログラム
CN117521114A (zh) * 2024-01-04 2024-02-06 金网络(北京)数字科技有限公司 数据交易方法、系统和计算机可读存储介质
CN117521114B (zh) * 2024-01-04 2024-05-10 金网络(北京)数字科技有限公司 数据交易方法、系统和计算机可读存储介质

Also Published As

Publication number Publication date
JPWO2020141584A1 (ja) 2021-11-11
JP2024045636A (ja) 2024-04-02
JP7446621B2 (ja) 2024-03-11

Similar Documents

Publication Publication Date Title
JP7446621B2 (ja) コンピュータシステム及び個人情報提供方法
US11860983B2 (en) System and method for implementing user watermarks
Brophy Blockchain and insurance: a review for operations and regulation
US20190279240A1 (en) Web content generation and storage via blockchain
Goanta Selling LAND in Decentraland: The regime of non-fungible tokens on the Ethereum blockchain under the digital content directive
WO2019100084A1 (en) Decentralized autonomous evaluation engine for intellectual property assets
KR101941200B1 (ko) 아이디어 거래가 가능한 블록체인 기반의 소셜 네트워크 시스템
US20080270248A1 (en) System and device for social shopping on-line
CN102870086A (zh) 具有隐私保护控制的个人属性、倾向、推荐行为和历史事件的数字简档系统
WO2020177298A1 (zh) 数字资产价值管理及运营方法、装置、介质和计算设备
Thakur A reputation management mechanism that incorporates accountability in online ratings
Barkel et al. Blockchain in the hospitality and tourism industry
WO2020177297A1 (zh) 知识产权价值管理及运营方法、装置、介质和计算设备
Aljohani et al. A framework for a blockchain-based decentralized data marketplace
Yang et al. Accountancy for E-Business Enterprises based on cyber security
Szabo Winning strategies for Smart contracts
Senthilnayaki et al. A Secure E-Governance System Using Blockchain Techniques
Sharma et al. Blockchain-based Feedback System using NFT in e-Commerce
Khan et al. Towards Industry 5.0: Empowering SMEs with Blockchain-Based Supplier Collaboration Network
Kochetkova BLOCKCHAIN IN THE ART MARKET: Opportunities and Challenges
US12026724B2 (en) Tokenizing scarce goods with provenance history bound to biological fingerprints
KR102648915B1 (ko) 블록체인 기반 자산 거래 시스템 및 이의 제어방법
US11574320B1 (en) Tokenizing scarce goods with provenance history bound to biological fingerprints
US20240163101A1 (en) Tokenized commodity tendering on a distributed platform
Naman et al. Secure event ticket booking using decentralized system

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19906829

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020563862

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19906829

Country of ref document: EP

Kind code of ref document: A1