TWI510939B - Gene information memory device, gene information retrieval device, gene information memory program product, gene information retrieval program product, gene information memory method, gene information retrieval method and gene information retrieval system - Google Patents

Gene information memory device, gene information retrieval device, gene information memory program product, gene information retrieval program product, gene information memory method, gene information retrieval method and gene information retrieval system Download PDF

Info

Publication number
TWI510939B
TWI510939B TW103106205A TW103106205A TWI510939B TW I510939 B TWI510939 B TW I510939B TW 103106205 A TW103106205 A TW 103106205A TW 103106205 A TW103106205 A TW 103106205A TW I510939 B TWI510939 B TW I510939B
Authority
TW
Taiwan
Prior art keywords
information
gene
encrypted
difference information
difference
Prior art date
Application number
TW103106205A
Other languages
English (en)
Other versions
TW201506653A (zh
Inventor
Shigeki Tanishima
Nori Matsuda
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Publication of TW201506653A publication Critical patent/TW201506653A/zh
Application granted granted Critical
Publication of TWI510939B publication Critical patent/TWI510939B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/40Encryption of genetic data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0816Key establishment, i.e. cryptographic processes or cryptographic protocols whereby a shared secret becomes available to two or more parties, for subsequent use
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09CCIPHERING OR DECIPHERING APPARATUS FOR CRYPTOGRAPHIC OR OTHER PURPOSES INVOLVING THE NEED FOR SECRECY
    • G09C1/00Apparatus or methods whereby a given sequence of signs, e.g. an intelligible text, is transformed into an unintelligible sequence of signs by transposing the signs or groups of signs or by replacing them by others according to a predetermined system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2209/00Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
    • H04L2209/24Key scheduling, i.e. generating round keys or sub-keys for block encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Genetics & Genomics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Description

基因資訊記憶裝置、基因資訊檢索裝置、基因資訊記憶程式產品、基因資訊檢索程式產品、基因資訊記憶方法、基因資訊檢索方法以及基因資訊檢索系統
本發明係關於將DNA序列解析後所得到之基因體或基因的解析資訊之基因資訊加密並記憶在記憶裝置的記憶技術。另外,本發明係關於在已加密的狀態下,檢索由上述記憶技術所記憶的基因資訊的技術。
近年來生命工程非常發達,基因體序列的讀取能力也相當發達。因此,解讀一個人類的全基因體序列的成本下降,而能夠使得多數人的基因體序列能夠被解讀。
包含個人的基因體序列或其發現資訊等的相關資訊的基因資訊可稱之為終極的個人資訊,必須要安全地執行對於本人以外的資訊揭示。對於從基因體DNA及RNA序列的讀取裝置輸出及解析後成為有意義的資訊的基因資訊,必須要迅速地加密,並且成為若無持有人的同意即無法解讀的狀態。
有一種隱蔽檢索方式,其在資料庫中積存的資料和檢索關鍵字已加密的狀態下,能夠從積存在資料庫中的資料中檢索出包含檢索關鍵字的資料(參照非專利文獻1)。
在此隱蔽檢索方式中,將資料積存在資料庫時,事先將檢 索該資料時可能會使用的關鍵字抽出作為標籤。繼之,分別將資料和標籤加密,將已加密的標籤附加於已加密的資料並將之積存於資料庫中。
從積存在資料庫中的資料中檢索出包含檢索關鍵字的資料時,輸入已加密的檢索關鍵字。繼之,檢索出對應於已加密的檢索關鍵字的已加密標籤。若有找到與檢索關鍵字對應之標籤,則附加了該標籤的資料被界定為包含檢索關鍵字的資料。
先行技術文獻
專利文獻
非專利文獻1:Boneh、Di Crescenzo、Ostrovski、and Persiano“Public key encryption with keyword search”EUROCRYPT 2004、pp506-522。
非專利文獻2:Allison Lewko、Tatsuaki Okamoto、Amit Sahai、Katsuyuki Takashima、Brent Waters、“Fully Secure Functional Encryption:Attribute-Based Encryption and (Hierarchical) Inner Product Encryption”、EUROCRYPT2010、Lecture Notes In Computer Science、2010、Volume 6110/2010。
目前為止,要檢索已加密的基因資訊的情況下,在執行檢索時,係暫時將基因資訊解密以進行檢索。
在使用隱蔽檢索方式的情況下,也是將產生為明文的檢索索引附加於已加密的基因資訊,並使用該檢索索引進行檢索。另外,大量的檢索索引附加於1個基因資訊,使得檢索需花費 大量的時間。
因此,若為積存了基因資訊的電腦的特權使用者,就能夠於解密的時間或檢索索引中自由存取。因此,基因資訊稱不上是處於對於第三者完全隱密的狀態。
本發明目的在於能夠在對於第三者完全隱密的狀態下檢索基因資訊。
本發明的基因資訊記憶裝置,其係為使記憶裝置記憶基因資訊的基因資訊記憶裝置,其包括:基準基因取得部,其取得既定之基因資訊的基準基因;輸入對象基因的基因輸入部,該對象基因為該記憶裝置所記憶的基因資訊;差異產生部,其係比較該基準基因取得部所取得的基準基因、以及該基因輸入部所輸入的對象基因,以產生差異資訊;資料加密部,將該對象基因加密以產生加密基因;加密標籤產生部,其產生將該差異產生部產生的差異資訊嵌入的加密標籤;及資料記憶部,其將該資料加密部產生的加密基因、和該加密標籤產生部產生的加密標籤關聯地記憶在該記憶裝置中。
其中,該差異資訊包含複數種類的資訊;該基因資訊記憶裝置更包括差異資訊置換部,其針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異產生部產生的差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊;其中該加密標籤產生部,將該差異資訊置換部置換後的差異資訊加密以產生加密標籤。
該差異資訊置換部,將該種類可取得的值分為複 數個區塊,使得屬於各區塊的值的一部份也屬於其他區塊,將該差異產生部產生的差異資訊中的該種類的值置換為識別該值所屬的各區塊的識別資訊。
該加密標籤產生部,當設定於加密資料的加密屬性和設定於秘密金鑰的金鑰屬性不對應的情況下,基於無法用該秘密金鑰解碼該加密資料的加密方式,將能檢索該加密基因的使用者的屬性資訊和差異資訊設定為該加密屬性,並將亂數值加密以產生該加密標籤。
基於該加密方式,將能解碼該加密基因的使用者的屬性資訊設定為該加密屬性,並將該對象基因加密產生該加密基因。
本發明之基因資訊檢索裝置,其係為檢索記憶在資料管理裝置所管理的記憶裝置中的基因資訊的基因資訊檢索裝置,其包括:差異資訊輸入部,其輸入欲檢索的基因資訊和既定之基因資訊的基準基因的差異資訊;檢索詢問產生部,其產生將該差異資訊輸入部所輸入的差異資訊嵌入的檢索詢問;基因資訊取得部,其將該檢索詢問產生部所產生的檢索詢問傳送至該資料管理裝置,以取得包含該差異資訊的基因資訊。
該差異資訊包含複數種類的資訊;該基因資訊檢索裝置更包括差異資訊置換部,其針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊;其中該檢索詢問產生部,其產生將該差異資訊置換部置換後的差 異資訊嵌入的檢索詢問。
該差異資訊置換部將該種類可取得的值分為複數個區塊,使得屬於各區塊的值的一部份也屬於其他區塊,將差異資訊中的該種類的值置換為識別該值所屬的各區塊的識別資訊。
該基因資訊檢索裝置,更包括管理秘密金鑰的使用者秘密金鑰管理部,該秘密金鑰為,當設定於加密資料的加密屬性和設定於秘密金鑰的金鑰屬性不對應的情況下,在無法用該秘密金鑰解碼該加密資料的加密方式中的該秘密金鑰,其中使用者的屬性資訊被設定為該金鑰屬性。
上述檢索詢問產生部,追加該差異資訊並產生該檢索詢問以作為該使用者秘密金鑰管理部所管理的秘密金鑰的金鑰屬性。
該基因資訊取得部,基於該加密方式,將能解碼的使用者的屬性資訊設定為該加密屬性,並取得該基因資訊加密後的加密基因作為包含該差異資訊的基因資訊,該基因資訊檢索裝置更包括解密部,其依據該使用者秘密金鑰管理部所管理的秘密金鑰將該加密基因解密。
基因資訊記憶程式產品,其係為使記憶裝置記憶基因資訊的基因資訊記憶程式產品,其使電腦執行後述處理:基準基因取得處理,其取得作為既定之基因資訊的基準基因;輸入對象基因的基因輸入處理,該對象基因為記憶於該記憶裝置的基因資訊;差異產生處理,其係比較該基準基因取得處理所取得的基準基因、以及該基因輸入處理所輸入的對象基因, 以產生差異資訊;資料加密處理,將該對象基因加密以產生加密基因;加密標籤產生處理,其產生將該差異產生處理所產生的差異資訊嵌入的加密標籤;資料記憶處理,其將該資料加密處理所產生的加密基因、和該加密標籤產生處理所產生的加密標籤關聯地記憶在該記憶裝置中。
該差異資訊中包含複數種類的資訊;該基因資訊記憶程式產品更使電腦執行差異資訊置換處理,其針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異產生處理產生的差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊;其中該加密標籤產生處理,將該差異資訊置換處理置換後的差異資訊加密以產生加密標籤。
該差異資訊置換處理中,將該種類可取得的值分為複數個區塊,使得屬於各區塊的值的一部份也屬於其他區塊,將該差異產生處理產生的差異資訊中的該種類的值置換為識別該值所屬的各區塊的識別資訊。
在該加密標籤產生處理中,當設定於加密資料的加密屬性和設定於秘密金鑰的金鑰屬性不對應的情況下,基於無法用該秘密金鑰解碼該加密資料的加密方式,將能檢索該加密基因的使用者的屬性資訊和差異資訊設定為該加密屬性,並將亂數值加密以產生該加密標籤。
其係基於該加密方式,將能解碼該加密基因的使用者的屬性資訊設定為該加密屬性,並將該對象基因加密產生該加密基因。
本發明的基因資訊檢索程式產品,其係為檢索記憶在資料管理裝置所管理的記憶裝置中的基因資訊的基因資訊檢索程式產品,其使電腦執行後述處理:差異資訊輸入處理,其輸入欲檢索的基因資訊和既定之基因資訊的基準基因的差異資訊;檢索詢問產生處理,其產生將該差異資訊輸入部所輸入的差異資訊嵌入的檢索詢問;基因資訊取得處理,其將該檢索詢問產生處理所產生的檢索詢問傳送至該資料管理裝置,以取得包含該差異資訊的基因資訊。
該差異資訊包含複數種類的資訊;該基因資訊檢索程式產品更使電腦執行差異資訊置換處理,其針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊;在該檢索詢問產生處理中,產生將該差異資訊置換處理中置換後的差異資訊嵌入的檢索詢問。
在該差異資訊置換處理中,將該種類可取得的值分為複數個區塊,使得屬於各區塊的值的一部份也屬於其他區塊,將差異資訊中的該種類的值置換為識別該值所屬的各區塊的識別資訊。
基因資訊檢索程式產品,更使電腦執行管理秘密金鑰的使用者秘密金鑰管理處理,該秘密金鑰為,當設定於加密資料的加密屬性和設定於秘密金鑰的金鑰屬性不對應的情況下,在無法用該秘密金鑰解碼該加密資料的加密方式中的該秘密金鑰,其中使用者的屬性資訊被設定為該金鑰屬性。
上述檢索詢問產生處理中,追加該差異資訊並產生該檢索 詢問以作為該使用者秘密金鑰管理處理中所管理的秘密金鑰的金鑰屬性。
該基因資訊取得處理中,使電腦基於該加密方式,將能解碼的使用者的屬性資訊設定為該加密屬性,並取得該基因資訊加密後的加密基因作為包含該差異資訊的基因資訊,該基因資訊檢索程式產品更使電腦執行解密處理,其依據該使用者秘密金鑰管理處理所管理的秘密金鑰將該加密基因解密。
本發明的基因資訊記憶方法,其係為使記憶裝置記憶基因資訊的基因資訊記憶方法,其包括:處理裝置取得既定之基因資訊的基準基因的基準基因取得步驟;輸入裝置輸入對象基因的基因輸入步驟,該對象基因為記憶於該記憶裝置的基因資訊;處理裝置比較該基準基因取得步驟所取得的基準基因、以及該基因輸入步驟所輸入的對象基因,以產生差異資訊的差異產生步驟;處理裝置將該對象基因加密以產生加密基因的資料加密步驟;處理裝置產生將該差異產生步驟產生的差異資訊嵌入的加密標籤的加密標籤產生步驟;處理裝置將該資料加密步驟產生的加密基因、和該加密標籤產生步驟產生的加密標籤關聯地記憶在該記憶裝置中的資料記憶步驟。
本發明的基因資訊檢索方法,其係為檢索記憶在資料管理裝置所管理的記憶裝置中的基因資訊的基因資訊檢索方法,其包括:輸入裝置輸入欲檢索的基因資訊和既定之基因資訊的基準基因的差異資訊的差異資訊輸入步驟;處理裝置產生將該差異資訊輸入步驟所輸入的差異資訊嵌入的檢索詢 問的檢索詢問產生步驟;處理裝置將該檢索詢問產生部所產生的檢索詢問傳送至該資料管理裝置,以取得包含該差異資訊的基因資訊的基因資訊取得步驟。
本發明的基因資訊檢索系統,其包括:使資料管理裝置所管理的記憶裝置記憶基因資訊的基因資訊記憶裝置;及從該基因資訊記憶裝置所記憶的基因資訊中檢索包含檢索關鍵字的基因資訊的基因資訊檢索裝置。該基因資訊記憶裝置包括:基準基因取得部,其取得既定之基因資訊的基準基因;輸入對象基因的基因輸入部,該對象基因為該記憶裝置所記憶的基因資訊;差異產生部,其係比較該基準基因取得部所取得的基準基因、以及該基因輸入部所輸入的對象基因,以產生差異資訊;資料加密部,將該對象基因加密以產生加密基因;加密標籤產生部,其產生將該差異產生部產生的差異資訊嵌入的加密標籤;及資料記憶部,其將該資料加密部產生的加密基因、和該加密標籤產生部產生的加密標籤關聯地記憶在該記憶裝置中。該基因資訊檢索裝置包括:差異資訊輸入部,其輸入欲檢索的基因資訊和既定之基因資訊的基準基因的差異資訊作為檢索關鍵字;檢索詢問產生部,其產生將該差異資訊輸入部所輸入的差異資訊嵌入的檢索詢問;及基因資訊取得部,其將該檢索詢問產生部所產生的檢索詢問傳送至該資料管理裝置,以取得包含該差異資訊的基因資訊。
依據本發明,在積存於資料庫中的基因資訊及作為檢索索引的標籤、及使用作為檢索關鍵字的基因資訊都是已 加密的狀態下,能夠從資料庫中擷取包含檢索關鍵字的基因資訊。因此,能夠在基因資訊處於對第三者完全隱密的狀態下。
尤其是,依據本發明,將和基準基因的差異資訊作為檢索索引及檢索關鍵字。因此,少量的檢索索引即可,而能夠快速進行檢索。
10‧‧‧基因檢索系統
100‧‧‧金鑰管理伺服器
110‧‧‧主金鑰產生部
120‧‧‧金鑰記憶部
130‧‧‧使用者秘密金鑰產生部
140‧‧‧資料收發部
150‧‧‧使用者ID記憶部
200‧‧‧加密裝置
210‧‧‧基準基因取得部
220‧‧‧對象基因輸入部
230‧‧‧公開參數記憶部
240‧‧‧差異資訊產生部
250‧‧‧差異資訊編碼部
260‧‧‧資料加密部
270‧‧‧加密標籤產生部
280‧‧‧附標籤加密資料產生部
300‧‧‧檢索裝置
310‧‧‧差異資訊輸入部
320‧‧‧使用者秘密金鑰記憶部
330‧‧‧差異資訊編碼部
340‧‧‧檢索詢問產生部
350‧‧‧基因資訊取得部
360‧‧‧資料解密部
400‧‧‧資料中心
410‧‧‧保管要求處理部
420‧‧‧加密資料記憶部
430‧‧‧加密標籤記憶部
440‧‧‧檢索要求處理部
450‧‧‧公開參數記憶部
460‧‧‧存取權限記憶部
500‧‧‧網路
901‧‧‧LCD(Liquid Crystal Display)
902‧‧‧鍵盤(K/B)
911‧‧‧CPU
912‧‧‧匯流排
913‧‧‧ROM
914‧‧‧RAM
915‧‧‧通信板
920‧‧‧磁碟裝置
921‧‧‧作業系統(OS)
922‧‧‧視窗系統
923‧‧‧程式群
924‧‧‧檔案群
第1圖為基因檢索系統10的構成圖。
第2圖為金鑰管理伺服器100的構成圖。
第3圖為加密裝置200的構成圖。
第4圖為檢索裝置300的構成圖。
第5圖為資料中心400的構成圖。
第6圖為使用階層式內積述語加密的加密方式的說明圖。
第7圖為使用階層式內積述語加密的隱蔽檢索方式的說明圖。
第8圖為顯示初期設定處理的流程的流程圖。
第9圖為顯示已編碼的SNV資訊的構成圖。
第10圖為顯示SNV資訊中的位置資訊的區塊化的說明圖。
第11圖為顯示SNV資訊中的信賴度的區塊化的說明圖。
第12圖為顯示已編碼的SV資訊的構成圖。
第13圖為顯示SV資訊中CNV增益的區塊化的說明圖。
第14圖為顯示已編碼的NC資訊的構成圖。
第15圖為標籤ID的階層構造的說明圖。
第16圖為解密者ID的階層構造的說明圖。
第17圖為使用者ID資訊資料庫的說明圖。
第18圖為顯示使用者秘密金鑰發行處理流程的流程圖。
第19圖為顯示患者基因體序列的加密處理流程的流程圖。
第20圖為附標籤加密資料的說明圖。
第21圖為顯示加密資料的保管例的圖。
第22圖為顯示患者之電子病歷的加密處理流程的流程圖。
第23圖為顯示檢索處理的流程的流程圖。
第24圖為存取權限管理表的說明圖。
第25圖為金鑰管理伺服器100、加密裝置200、檢索裝置300、資料中心400之硬體構成之一例的圖。
實施形態1
第1圖為基因檢索系統10的構成圖。
基因檢索系統10包括:金鑰管理伺服器100、複數台加密裝置200、複數台檢索裝置300、及資料中心400(資料管理裝置)。金鑰管理伺服器100、加密裝置200、檢索裝置300、及資料中心400透過網路500連接。
金鑰管理伺服器100,為產生加密用使用者秘密金鑰或隱蔽檢索用使用者秘密金鑰等的使用者秘密金鑰,並將其提供給加密裝置200或檢索裝置300的伺服器。另外,加密用使用者秘密金鑰為加密資料解密時所用的金鑰,隱蔽檢索用使用者秘密金鑰為隱蔽檢索所使用的金鑰。
加密裝置200,為用以將保管在資料中心400的資訊加密的終端裝置。加密裝置200主要是由醫院的醫生、基因體解讀中 心的員工或患者等的使用者所使用的終端裝置。
檢索裝置300,為用於檢索並取得保管在資料中心400的資訊的終端裝置。檢索裝置300主要是由製藥公司等的研究者、或醫院的醫生等的使用者所使用。
資料中心400,為保管從患者收集來的基因體資訊、或記載患者病歷的電子病歷等的伺服器。資料中心400依據患者、醫生、研究者等的使用者的要求,提供基因體資訊或電子病歷等的檢索及閱覽的服務。
網路500為例如網際網路的公眾網路。
第2圖為金鑰管理伺服器100的構成圖。
金鑰管理伺服器100包括:主金鑰產生部110、金鑰記憶部120、使用者秘密金鑰產生部130、資料收發部140、使用者ID記憶部150。
主金鑰產生部110,藉由處理裝置,產生利用隱蔽檢索的所有使用者共用的公開參數,並產生作為使用者秘密金鑰產生的基礎的主金鑰。
金鑰記憶部120,將主金鑰產生部110產生的主金鑰或公開參數記憶在記憶裝置中。
使用者秘密金鑰產生部130,藉由處理裝置,使用唯一分配給使用者的使用者ID,從主金鑰產生使用者秘密金鑰。
資料收發部140,透過網路500將公開參數傳送給加密裝置200、檢索裝置300、資料中心400。另外,資料收發部140透過網路500將使用者秘密金鑰傳送至檢索裝置300。另外,資料收發部140,因應使用者的要求,將使用者ID傳送給加密裝置 200、檢索裝置300、資料中心400的使用者。
使用者ID記憶部150將各使用者的使用者ID記憶在記憶裝置中。使用者ID為使用者姓名、隸屬、登入ID、電子郵件帳號等的屬性資訊。使用者ID記憶部150不僅記憶目前的屬性資訊,還可以將過去的屬性資訊也記憶做為履歷。
第3圖為加密裝置200的構成圖。
加密裝置200包括:基準基因取得部210、對象基因輸入部220、公開參數記憶部230、差異資訊產生部240、差異資訊編碼部250、資料加密部260、加密標籤產生部270、附標籤加密資料產生部280。
基準基因取得部210取得通常公開的既定的基因體序列作為基準基因體序列(基準基因)。
對象基因輸入部220,取得保管於資料中心400的患者基因體序列(對象基因)。另外,對象基因輸入部220取得患者基因體序列,還一起取得表示該患者基因體序列的患者之患者ID。
公開參數記憶部230,接收由金鑰管理伺服器100產生的公開參數並將其記憶於記憶裝置。
差異資訊產生部240,藉由處理裝置,比較患者基因體序列和基準基因體序列,並產生複數個差異資訊。
差異資訊編碼部250,藉由處理裝置,將差異資訊產生部240所產生的各差異資訊編碼為適合在加密著的狀態下進行檢索的形式,以產生編碼差異資訊。關於適合在加密著的狀態下進行檢索的形式如後述。
資料加密部260,藉由處理裝置,將對象基因輸入部220輸入的患者基因體序列加密,以產生加密資料(加密基因)。
加密標籤產生部270藉由處理裝置,將差異資訊編碼部250產生的編碼差異資訊加密,以產生加密標籤。
附標籤加密資料產生部280,藉由處理裝置,結合資料加密部260產生的加密資料、加密標籤產生部270產生的複數個加密標籤、及患者ID,產生附標籤加密資料。附標籤加密資料產生部280委託資料中心400保管所產生的附標籤加密資料。
第4圖為檢索裝置300的構成圖。
檢索裝置300包括:差異資訊輸入部310、使用者秘密金鑰記憶部320、差異資訊編碼部330、檢索詢問產生部340、基因資訊取得部350、資料解密部360。
差異資訊輸入部310,藉由輸入裝置,輸入包含和基準基因體序列之間的差異資訊以作為關鍵字的檢索要求。
使用者秘密金鑰記憶部320,將金鑰管理伺服器100對使用者個別發行的使用者秘密金鑰和公開參數記憶在記憶裝置中。
差異資訊編碼部330之功能和差異資訊編碼部250相同。差異資訊編碼部330,藉由處理裝置,將差異資訊輸入部310所輸入的檢索要求中包含的差異資訊編碼為適合在加密著的狀態下進行檢索的形式,以產生編碼差異資訊。
檢索詢問產生部340,藉由處理裝置,由使用者秘密金鑰記憶部320所記憶的使用者秘密金鑰及公開參數、及差異資訊編碼部330所產生的編碼差異資訊產生檢索詢問。
基因資訊取得部350,透過網路500,將檢索詢問產生部340 所產生的檢索詢問傳送至資料中心400。而且,基因資訊取得部350,透過網路500,從資料中心400接收含有檢索要求中所具有的差異資訊(或者,具有類似的差異資訊)的患者基因體序列加密後的加密資料。另外,基因資訊取得部350,在接收加密資料時,一併接收患者ID。
資料解密部360,藉由處理裝置,使用使用者秘密金鑰記憶部320所記憶的使用者秘密金鑰,將從資料中心400接收的加密資料解密,取得患者基因體序列。
第5圖為資料中心400的構成圖。
資料中心400包括:保管要求處理部410、加密資料記憶部420、加密標籤記憶部430、檢索要求處理部440、公開參數記憶部450、存取權限記憶部460。
保管要求處理部410從加密裝置200接收附標籤加密資料。保管要求處理部410,解析已接收的附標籤加密資料,將其分解為加密資料、複數個加密標籤、及患者ID。保管要求處理部410,將共用的管理號碼分配給分解後的加密資料和各加密標籤,將加密資料連同患者ID和管理號碼一起傳送至加密資料記憶部420,將各加密標籤連同患者ID和管理號碼一起傳送至加密標籤記憶部430。
加密資料記憶部420,將接收自保管要求處理部410的加密資料與患者ID和管理號碼關聯地記憶在記憶裝置中。
加密標籤記憶部430,將接收自保管要求處理部410的加密標籤與患者ID和管理號碼關聯地記憶在記憶裝置中。
檢索要求處理部440,從檢索裝置300接收檢索詢問。檢索 要求處理部440,藉由處理裝置,執行已接收的檢索詢問和加密標籤記憶部430記憶的加密標籤之比較處理。藉由此比較處理,判斷包含於加密標籤中的患者基因體序列的差異資訊,是否符合由包含於檢索詢問中的患者基因體序列的差異資訊(檢索要求)所指定的條件。之後,檢索要求處理部440,從加密資料記憶部420取得檢索符合的加密標籤關聯的加密資料,並將之送回檢索裝置300。另外,關聯於加密標籤的加密資料,係為和加密標籤有同樣的管理號碼的加密資料。
公開參數記憶部450,接收金鑰管理伺服器100所產生的公開參數,並將之記憶在記憶裝置。
存取權限記憶部460,其管理患者要許可其患者基因體序列對何人揭示。
茲說明基因檢索系統10中所利用的加密方式。
在基因檢索系統10中,使用如非專利文獻2等記載的稱之為階層式內積述語加密的加密方式、及一樣使用階層式內積述語加密而加密著的狀況下可以進行關鍵字檢索的隱蔽檢索方式。
第6圖為使用階層式內積述語加密的加密方式的說明圖。
此加密方式由下列構成:主金鑰產生演算法、秘密金鑰產生演算法、委讓金鑰產生演算法、加密演算法、及解密演算法。
一開始,先使用主金鑰產生演算法,產生加密用主金鑰和加密用公開參數。加密用主金鑰係為用以產生解密使用者的加密用使用者秘密金鑰的秘密金鑰。加密用公開參數, 為加密時所使用的公開資訊,其被廣為散布給加密使用者。
另外,在此處理時,事前先決定條件式的構成,必須給定該條件式以作為參數。在非專利文獻2等的現有的階層式內積述語加密的文獻中記載為,並不給定條件式的構成,而是給定將條件式記述為向量時的維度,不過為了容易理解,在此係給定條件式。下文中亦為如此。
繼之,使用秘密金鑰產生演算法,由加密用條件式發行對解密使用者散布的加密用使用者秘密金鑰。加密用條件式決定解密使用者能夠解密具有何種屬性的檔案,該條件記述為使用及/或(and/or)的邏輯演算的條件式。
繼之,使用加密演算法,將資料加密。此時,指定附加於加密資料的加密用屬性,並將之嵌入加密資料中。
最後,使用解密演算法,將加密資料解密。在解密時,雖指定了加密用使用者秘密金鑰,但僅能解密具有滿足嵌入於加密用使用者秘密金鑰中的條件式的加密用屬性的加密資料。至於無法滿足條件式的加密資料,則完全無法解密。
另外,在階層式內積述語加密中,還有稱之為金鑰委讓的特徵。此係為在產生加密用使用者秘密金鑰時僅有一部份的條件式被設定,而有部分的條件式為未指定的狀態。委讓金鑰,為在此未指定的條件式中追加設定條件式的構成。
具體言之,使用委讓金鑰產生演算法,對加密用使用者秘密金鑰指定追加設定的加密用追加條件式,以產生加密用委讓秘密金鑰。此加密用委讓秘密金鑰,和加密用使用者秘密金鑰一樣能夠用於加密資料的解密。
換言之,在秘密金鑰產生演算法中,發行將解密使用者的屬性資訊設定為金鑰屬性的加密用使用者秘密金鑰。另外,在加密演算法中,產生將可解密的使用者之屬性資訊設定為加密屬性的加密資料。而且,僅有在設定於加密用使用者秘密金鑰的金鑰屬性、和設定於加密資料的加密屬性彼此對應的情況下,在解密演算法中才能夠用加密用使用者秘密金鑰將加密資料解密。
另外,委讓金鑰產生演算法中,再將屬性資訊追加設定於加密用使用者秘密金鑰中,產生下位的加密用使用者秘密金鑰,其只能解密用該加密用使用者秘密金鑰可解密之加密資料的一部份。
第7圖為使用階層式內積述語加密的隱蔽檢索方式的說明圖。
此隱蔽檢索方式由下列構成:主金鑰產生演算法、秘密金鑰產生演算法、委讓金鑰產生演算法、加密標籤產生演算法、及一致判斷演算法。
最先,使用主金鑰產生演算法,產生隱蔽檢索用主金鑰和隱蔽檢索用公開參數。隱蔽檢索用主金鑰係為用以產生檢索使用者的隱蔽檢索用使用者秘密金鑰的秘密金鑰。隱蔽檢索用公開參數,為檢索時所使用的公開資訊,其被廣為散布給檢索使用者。
另外,關於條件式的記述,則與加密方式相同。
繼之,使用秘密金鑰產生演算法,由隱蔽檢索用條件式發行對檢索使用者散布的隱蔽檢索用使用者秘密金 鑰。隱蔽檢索用條件式決定檢索使用者能夠檢索具有何種屬性的檔案,而且決定用怎樣的條件式能夠指定檢索關鍵字的框架,該條件記述為使用及/或(and/or)的邏輯演算的條件式。檢索關鍵字本身在之後可以用委讓金鑰產生演算法設定。
繼之,使用加密標籤產生演算法,產生用於檢索處理的加密標籤。一開始先產生任意的亂數值,為了限制許可檢索的使用者而決定屬性,並決定關鍵字。以亂數值、屬性、及關鍵字作為輸入,使用加密標籤產生演算法產生加密標籤。具體言之,用加密演算法將亂數值加密,並將加密亂數及亂數值的組合作為加密標籤。
繼之,使用委讓金鑰產生演算法,產生檢索詢問。具體言之,隱蔽檢索用使用者秘密金鑰中,對於為了在之後能夠指定關鍵字而未指定值的部分,嵌入檢索關鍵字,藉此產生檢索詢問。該檢索詢問,係對應於加密方式的加密委讓秘密金鑰。
最後,使用一致判斷演算法,判斷已接收的檢索詢問和加密標籤中所包含的關鍵字是否為一致。具體言之,從加密標籤中取出加密亂數,使用相當於加密委讓秘密金鑰的檢索詢問以進行解密。而且,在解密的結果和加密標籤中包含的亂數值為一樣的情況下,亦即檢索詢問被正確解密的情況下,判斷為關鍵字一樣。此係因為,包含於檢索詢問(相當於加密委讓秘密金鑰)中的關鍵字必須相同於產生加密亂數時指定的關鍵字,才能夠正確解密亂數值。
和上述加密方式一樣稍微換一種說法,在秘密金 鑰產生演算法中,發行檢索使用者的屬性資訊被設定為金鑰屬性的隱蔽檢索用使用者秘密金鑰。另外,在加密演算法中,產生將能檢索的使用者的屬性資訊及關鍵字設定為加密屬性的加密資料。在委讓金鑰產生演算法中,將檢索關鍵字追加設定於隱蔽檢索用使用者秘密金鑰中作為金鑰屬性,以產生檢索詢問。
繼之,只有在設定於檢索詢問的金鑰屬性資訊、和設定於加密標籤中的屬性資訊對應的情況下,在解密演算法中,才能從加密標籤將亂數值解密。亦即,只有在設定於檢索詢問的使用者的屬性資訊、和設定於加密標籤的使用者的屬性資訊彼此對應,且設定於檢索詢問的檢索關鍵字、和設定於加密標籤的關鍵字彼此對應的情況下,才能從加密標籤將亂數值解密。
茲說明基因檢索系統10的處理。
基因檢索系統10,執行初期設定處理、使用者秘密金鑰發行處理、加密處理、檢索處理。另外,在加密處理中,包含:患者基因體序列的加密處理、患者的電子病歷的加密處理。
第8圖為顯示初期設定處理的流程的流程圖。
初期設定處理係為由金鑰管理伺服器100所執行的處理,為使用基因檢索系統10之前要執行1次的處理。
(S101:編碼方法決定處理)
主金鑰產生部110,藉由處理裝置,決定將患者基因體序列的差異資訊編碼的方法。在決定該編碼方法時,也要考慮要用怎樣的方法檢索之檢索式。
主要的差異資訊為:SNV(Single Nucleotide Variant)、 SV(Structural Variants)、或NC(Novel Contig)。茲以此3種差異資訊為例,說明其編碼方法和檢索方法。
第9圖為顯示已編碼的SNV資訊的構成圖。
SNV資訊,表示在基因體序列中1個鹼基改變。SNV資訊由患者ID、染色體號碼、位置資訊、置換資訊1、置換資訊2、信賴度所構成。
患者ID,係為了和另行管理的電子病歷對應而分配的識別號碼。患者ID只要是對應於病歷的號碼即可,所以其不僅可以為醫院中賦予患者的識別號碼,也可是在保管病歷時賦予其隨機的號碼以設定其值。
染色體號碼為檢出SNV的染色體的號碼。若為人類基因體,則設定為例如1、2...22、X、Y、M等的值。
位置資訊為關於檢出SNV的位置之資訊。位置係表示為鹼基序列的第幾個的數值,若為人類基因體,則為1至30億左右的值。一般來說,位置等的數值資訊的檢索,係指定範圍以進行檢索。但是,在上述的隱蔽檢索方式中難以進行範圍檢索,所以藉由將其區塊化以期能高速化。例如,第10圖顯示檢索時指定的範圍控制在5000以下的情況下的編碼方法。在位置7777檢出SNV時,等當於區塊1和區塊2的位置,「1」和「2」兩個值設定為位置資訊。
置換資訊1和置換資訊2為表示基因體資訊的變化之資訊。其係設定為,例如G鹼基插入之SNV表示為「G追加」、A鹼基消失表示為「A刪除」等。之所以有兩個置換資訊,是為了在例如G鹼基變化為A鹼基時,在置換資訊1表示為G刪除, 而在置換資訊2表示為A追加等。
信賴度,為表示該SNV資訊的信賴性的資訊,其以0到100的實數表示。和位置資訊一樣,信賴度也區塊化以圖檢索的高速化。例如第11圖所示,以10%為單位分割信賴度,並設定其對應的值。例如,信賴度為7.44%時,對應區塊的值設定為0。
在檢索時,從上述的患者ID到信賴度的值當中,指定數個想要指定作為條件的,在未指定的地方則指定為不論是何值都視為一致的「*」(萬用牌),以產生差異資訊(檢索要求)。繼之,決定規則,例如關於SNV資訊的各要素,當加密標籤和檢索詢問之間完全一致時則為檢索符合。
另外,也決定各要素在何種情況下為一致。
例如,有指定患者ID時,患者ID一樣的就視為一致。染色體號碼也是一樣,指定想要檢索的染色體號碼,染色體號碼一樣的就視為一致。若為位置資訊,例如想要檢索7000~12000的範圍時,界定出區塊2作為包含此範圍的區塊,在檢索式中指定「2」。繼之,設定作為SNV資訊的位置資訊為2個值當中的任何一者為一樣時,則視為一致。若為置換資訊,以相同於SNV資訊指定的值的規則設定想檢索的值,當兩者一樣時就視為一致。信賴度也一樣,在指定了相同的值時則視為一致。
如上述,決定SNV資訊的編碼方法、及能夠如何實施檢索的方法。
第12圖為顯示已編碼的SV資訊的構成圖。
SNV資訊表示1個鹼基改變的情況,SV資訊則表示連續的複數個鹼基序列改變的情況。SV資訊由下列構成:患者ID、染 色體號碼、開始位置資訊、結束位置資訊、變異種別、CNV增益、重組染色體號碼、重組染色體開始位置資訊、重組染色體結束位置資訊、分類ID(插入序列)、版本(version)(插入序列)、染色體號碼(插入序列)、開始位置資訊(插入序列)、結束位置資訊(插入序列)。
患者ID、染色體號碼,和第9圖所示的SNV一樣,故省略其說明。
開始位置資訊為表示變化開始的位置之資訊。使用SNV資訊的位置資訊一樣的步驟將位置資訊區塊化,並設定表示區塊的值。
結束位置資訊為表示變化結束的位置之資訊。使用SNV資訊的位置資訊一樣的步驟將位置資訊區塊化,並設定表示區塊的值。
變異種別為表示SV的種類的資訊。例如,可設定為表示基因序列的重複次數的追加/刪減的「CNV增益」或「CNV減少」、表示鹼基序列的反轉的「Inversion」、表示鹼基序列的大規模插入的「Insertion」、表示鹼基序列的大規模缺損的「Deletion」、表示和其他染色體的重組的「重組」等的值。
CNV增益用於設定「CNV增益」和「CNV減少」為變位種別的情況下。在「CNV增益」被設定作為變異種別的情況下,CNV增益設定為表示重複次數增加幾次的資訊;在設定「CNV減少」的情況下,則表示重複次數減少幾次的資訊。由於此值亦包含整數值,所以將其區塊化以設定其值。例如,設定了如第13圖所示的方式區塊化的規則,CNV增益為15時,所對應的 區塊的號碼設定為「3」。
重組染色體號碼用於指定「重組」為變異種別的情況。重組染色體號碼設定為被重組的另一個染色體的號碼。可以設定的值和染色體號碼一樣。
重組染色體開始位置資訊和重組染色體結束位置資訊用於指定「重組」為變異種別的情況。重組染色體開始位置資訊和重組染色體結束位置資訊為,為了顯示和其他染色體的哪一個鹼基序列發生重組,表示在其他染色體中重組的開始位置和結束位置的資訊。可以設定的值和開始位置資訊及結束位置資訊一樣。
分類ID(插入序列)用於指定「Insertion」為變異種別的情況。分類ID(插入序列)設定為表示所插入的鹼基序列為其他的哪一種生物的序列的號碼。
版本(version)(插入序列),為用以表示決定上述的分類ID時所使用的基因體資料庫的版本之數值。
染色體號碼(插入序列)、開始位置資訊(插入序列)、結束位置資訊(插入序列),為表示其他生物的哪一部份的鹼基序列被插入的資訊,使用和染色體號碼或開始位置資訊或結束位置資訊一樣的方式將其所設定的值編碼。不過,基因體序列的長度隨著生物種而異,所以針對每個分類ID準備其劃分區塊的方式為佳。
另外,在檢索時,從上述的患者ID到結束位置資訊(插入序列)的值當中,指定數個想要指定作為條件的,在未指定的地方則指定為不論是何值都視為一致的「*」(萬用 牌),並據以產生差異資訊(檢索要求),並以此產生檢索詢問。繼之,決定規則,例如關於SV資訊的各要素,當加密標籤和檢索詢問之間完全一致時則為檢索符合。
另外,也決定各要素在何種情況下為一致。
患者ID、染色體號碼和SNV資訊的情況相同。開始位置資訊、結束位置資訊、重組染色體開始位置資訊、重組染色體結束位置資訊、開始位置資訊(插入序列)、結束位置資訊(插入序列),可以用相同於SNV資訊的位置資訊相同的方式處理。變異種別,為在檢索詢問中指定想要檢索哪一種類的變異種別,並將設定為同樣的值的SV資訊視為一致。CNV增益,例如若想檢索在10到30之間的,則將其對應的區塊號碼指定為「3」。而且,SV資訊中包含的CNV增益相同時,則視為一致。重組染色體號碼、染色體號碼(插入序列),可以用相同於染色體號碼的方式處理。分類ID、版本,係將想要檢索的分類ID和版本包含在檢索詢問中,其和SV資訊相同時則視為一致。
如上述,決定SV資訊的編碼方法、及能夠如何實施檢索的方法。
第14圖為顯示已編碼的NC資訊的構成圖。
NC資訊表示和基準基因體無法映對的鹼基。鹼基無法和基準基因體映對,在大部分的情況是因為病毒感染等而檢知到特殊的基因體的情況。因此,NC資訊,由患者ID,以及分類ID(插入序列)、版本(version)(插入序列)、染色體號碼(插入序列)、開始位置資訊(插入序列)、結束位置資訊(插入序列)所構成。
各值的設定方法及檢索方法和SV資訊相同,故省略其說明。
(S102:方式決定處理)
主金鑰產生部110,藉由處理裝置,決定所利用的隱蔽檢索方式、或加密資料本體的加密方式。在此,能夠指定複數個檢索關鍵字的隱蔽檢索方式是必要的,所以,採用使用上述的階層式內積述語加密的隱蔽檢索方式。同樣地,加密方式也採用使用上述的階層式內積述語加密的加密方式。
繼之,主金鑰產生部110,決定隱蔽檢索方式的利用方法。在此,決定標籤ID的階層構造。例如第15圖所示,標籤ID為下列3個要素構成:儲存可以檢索的使用者所屬團體的團體名稱的團體名稱欄、儲存姓名等的使用者名稱欄、儲存患者基因體序列的差異資訊的差異資訊欄。在檢索時的規則為:只有判斷為團體名稱、使用者名稱、及差異資訊所有都符合的時候,才視為檢索符合。
同樣地,主金鑰產生部110,決定用以加密資料本體的加密方式的利用方法。在此,決定解密者ID的階層構造。例如第16圖所示,解密者ID為下列2個要素構成:儲存可以解密的使用者所屬團體的團體名稱的團體名稱欄、儲存姓名等的使用者名稱欄。在解密時的規則為:只有判斷為團體名稱及使用者名稱都符合的時候,才能夠解密。
(S103:使用者ID的記憶處理)
使用者ID記憶部150,建構存放使用者ID的使用者ID資訊資料庫。使用者ID資訊資料庫係記憶用以產生使用者秘密金鑰 所需要的資訊、以及加密裝置200將資料加密時,用以界定對方的團體名稱及使用者名稱的必要資訊。
例如第17圖所示,在使用者ID資訊資料庫中,儲存了作為團體名稱的公司名稱、作為使用者名稱的姓名、所屬資訊、有效期間等。另外,在使用者ID資訊資料庫中不只是記憶最新的狀況,還可以儲存所有的過去履歷。
(S104:主金鑰產生處理)
主金鑰產生部110,藉由處理裝置,執行隱蔽檢索方式的主金鑰產生演算法,產生隱蔽檢索用主金鑰及隱蔽檢索用公開參數。同樣地,主金鑰產生部110,藉由處理裝置,執行加密方式的主金鑰產生演算法,產生加密用主金鑰和加密用公開參數。
之後,將隱蔽檢索用主金鑰和加密用主金鑰統稱為主金鑰,將隱蔽檢索用公開參數和加密用公開參數統稱為公開參數。
(S105:主金鑰記憶處理)
金鑰記憶部120,將主金鑰產生部110所產生的主金鑰和公開參數記憶在記憶裝置中。
(S106:公開參數公開處理)
資料收發部140,透過網路500,將金鑰記憶部120所記憶的公開參數對加密裝置200、檢索裝置300、及資料中心400公開。
另外,被公開的公開參數,在加密裝置200中記憶於公開參數記憶部230;在檢索裝置300中記憶於使用者秘密金鑰記憶 部320;而在資料中心400中記憶於公開參數記憶部450。
依據上述步驟,基因檢索系統10的設定完成。
另外,在S103中產生的使用者ID資訊資料庫,在系統的運用中,每當使用者人事異動、新進公司、離職等的時候,都會更新其內容。
第18圖為顯示使用者秘密金鑰發行處理流程的流程圖。使用者秘密金鑰發行處理,為主要由金鑰管理伺服器100和檢索裝置300執行的處理。在新使用者加入時、或使用者所屬的團體名稱改變時等情況執行此處理。
(S201:使用者ID取得處理)
使用者秘密金鑰產生部130,從使用者ID記憶部150維持的使用者ID資訊資料庫中,取得發行使用者秘密金鑰的使用者的團體名稱和使用者名稱。
(S202:使用者秘密金鑰產生處理)
使用者秘密金鑰產生部130,藉由處理裝置,產生用以產生檢索詢問的隱蔽檢索用使用者秘密金鑰、及用以解密加密資料的加密用使用者秘密金鑰。
在隱蔽檢索方式中,於產生隱蔽檢索用使用者秘密金鑰時必須指定標籤ID階層構造。在此,將S201中取得的團體名稱設定於團體名稱欄中,同樣地,將使用者名稱設定為使用者名稱,差異資訊指定為可委讓的要素以使得之後檢索的使用者能夠設定,藉此,能夠產生隱蔽檢索用使用者秘密金鑰。
同樣地,在加密方式中,於產生加密用使用者秘密金鑰時必須指定解密者ID階層構造。在此,將S201中取得的團體名稱 設定於團體名稱欄中,同樣地,將使用者名稱設定為使用者名稱,藉此,能夠產生加密用使用者秘密金鑰。
上述所產生的隱蔽檢索用使用者秘密金鑰、加密用使用者秘密金鑰統稱之為使用者秘密金鑰。
(S203:使用者秘密金鑰傳送處理)
資料收發部140,將S202中所產生的使用者秘密金鑰傳送給檢索裝置300。
(S204:使用者秘密金鑰接收處理)
使用者秘密金鑰記憶部320,接收在S203中所傳送的使用者秘密金鑰,並將之記憶在記憶裝置中。
第19圖為顯示患者基因體序列的加密處理流程的流程圖。
患者基因體序列的加密處理,為主要由加密裝置200和資料中心400所執行的處理,將患者基因體序列加密並存放於資料中心400時執行此處理。
(S301:差異資訊抽出處理)
基準基因取得部210,取得例如在網路公開的基準基因體序列。另外,對象基因輸入部220,藉由輸入裝置,輸入患者基因體序列。
差異資訊產生部240,藉由處理裝置,比較患者基因體序列和基準基因體序列,藉此產生SNV、SV、或NC等的差異資訊。產生此差異資訊的方法已知有ChIP-seq法、RNA-seq法、MeDIP-seq法、變異解析法、或者亞硫酸鹽定序法(Bisulfite sequencing)等,在此採用這些一般的方法。
(S302:使用者決定處理)
資料加密部260,使得操作加密裝置200的使用者輸入可解密加密資料的使用者的團體名稱及使用者名稱。同樣地,加密標籤產生部270,使其輸入可檢索加密資料的使用者的團體名稱及使用者名稱。
在此所輸入的團體名稱或使用者名稱不必然是一個,在有複數個可解密或檢索的使用者的情況下,也可以輸入複數個。另外,在此利用的隱蔽檢索或加密方式,也可以接受以表示任何人都可以的萬用牌作為團體名稱或使用者名稱。
(S303:資料加密處理)
資料加密部260,藉由處理裝置,使用S302中輸入的可解密的團體名稱及使用者名稱,將S301中輸入的患者基因體序列加密。
具體言之,資料加密部260,隨機地產生交談金鑰(Session Key),藉由該交談金鑰使用AES或Camellia(登錄商標)等的共通密鑰加密將患者基因體序列加密,以產生加密資料本體。繼之,資料加密部260,分別將S302中輸入的可解密的團體名稱及使用者名稱指定為解密者ID階層構造的團體名稱和使用者名稱,並以其為加密用公開金鑰,使用S102中決定的加密方式將交談金鑰加密,以產生加密交談金鑰。繼之,資料加密部260將前述的2個加密結果(加密資料本體和加密交談金鑰)組合以產生加密資料。
所產生的加密資料的資料構造顯示於第20圖的符號603部分。另外,在S302中接收複數個團體名稱及使用者名稱時,必 須對於各組的團體名稱和使用者名稱產生加密交談金鑰。
(S304:差異資訊編碼處理)
差異資訊編碼部250,藉由處理裝置,依據S101決定的編碼方法,將S301中產生的各差異資訊編碼,以產生編碼差異資訊。另外,差異資訊編碼部250,使得使用者輸入患者ID,並將之包含於編碼差異資訊中。
(S305:加密標籤產生處理)
加密標籤產生部270,將編碼差異資訊加密以產生加密標籤。
具體言之,加密標籤產生部270,藉由處理裝置,將S302中輸入的可檢索的團體名稱及使用者名稱指定為標籤ID階層構造的團體名稱和使用者名稱,將S304中編碼的編碼差異資訊指定在差異資訊欄中,以隱蔽檢索方式將亂數值加密以產生加密標籤。另外,加密標籤產生部270,將亂數值維持為明文並將之包含於加密標籤中。
再者,上述處理係為對於1筆差異資訊的處理,對於各編碼差異資訊執行此處理。例如,對於SNV、SV、NC之各編碼差異資訊執行。另外,在S302中接收複數個團體名稱及使用者名稱時,必須對於各組的團體名稱和使用者名稱產生加密標籤。
(S306:保管委託處理)
附標籤加密資料產生部280,藉由處理裝置,將S303中產生的加密資料、S305中產生的加密標籤、S304中輸入的患者ID結合,以產生附標籤加密資料(第20圖的符號601)。繼之, 附標籤加密資料產生部280,將所產生的附標籤加密資料傳送給資料中心400,並委託其保管。
此時,為了容易在資料中心400中保管附標籤加密資料,附標籤加密資料產生部280,將S302中輸入的可解密的團體名稱及使用者名稱、連同可檢索的團體名稱及使用者名稱一起傳送。第20圖所示的附標籤加密資料的構成中,在附標籤加密資料中包含可解密的團體名稱及使用者名稱、以及可檢索的團體名稱及使用者名稱。
(S307:加密資料保管處理)
保管要求處理部410,藉由處理裝置,分解從加密裝置200接收的附標籤加密資料,擷取加密資料、複數個加密標籤、及患者ID。繼之,保管要求處理部410,將加密資料連同患者ID一起保管在加密資料記憶部420中。
另外,加密資料記憶部420,針對各個包含於附標籤加密資料中的團體名稱及使用者名稱分配加密資料並加以保管,在對保管著的加密資料附加管理號碼,使得之後能從管理號碼專一地界定出加密資料。在加密資料關聯於複數的團體名稱及使用者名稱時,將加密資料關聯於各團體名稱及使用者名稱保管。關聯於複數的團體名稱及使用者名稱的情況下,只儲存1個加密資料,其他的則僅保管參照資訊,以節省索引容量。
第21圖為顯示加密資料的保管例的圖。如第21圖所示,保管要求處理部410,將團體名稱為「A製藥公司」且使用者名稱為「*」(萬用牌)的加密資料、患者ID、及管理號碼整合管理,並將團體名稱為「B醫院」且使用者名稱為「*」(萬用 牌)的加密資料、患者ID、及管理號碼整合管理。另外,若為對於A製藥公司和B醫院兩者都公開的資料,則在管理號碼000001中關聯地保管患者ID和加密資料本體,在管理號碼100002中除了患者ID之外,保管參照管理號碼000001的指標作為加密資料。
(S308:加密標籤保管處理)
保管要求處理部410,將S307中擷取的複數個加密標籤,連同對應的加密資料的保管號碼及患者ID保管於加密標籤記憶部430中。加密標籤記憶部430,針對附標籤加密資料中包含的各個團體名稱及使用者名稱,分別保管其加密標籤、管理號碼、及患者ID。
第22圖為顯示患者之電子病歷的加密處理流程的流程圖。
患者之電子病歷的加密處理,為主要由加密裝置200和資料中心400執行之處理,係於在將電子病歷加密後保管在資料中心400中時執行。
(S401:使用者決定處理)
資料加密部260,使得操作加密裝置200的使用者輸入可解密電子病歷的使用者的團體名稱及使用者名稱。
在此輸入的團體名稱及使用者名稱不必然是一個,在有複數個可解密的使用者的情況下,也可以輸入複數個。
(S402:資料加密處理)
資料加密部260,使得使用者輸入患者ID和電子病歷。繼之,資料加密部260,藉由處理裝置,使用S401中輸入的團體 名稱及使用者名稱,將電子病歷加密。具體的加密方法和S303中加密患者基因體序列的流程一樣,故省略其細節。
(S403:保管委託處理)
資料加密部260,將S402中產生的加密資料,連同表示是哪一個人的電子病歷的患者ID、及可解密的團體名稱及使用者名稱,一起傳送至資料中心400,並委託其加以保管。
(S404:加密資料保管處理)
保管要求處理部410,將從加密裝置200接收的加密資料與患者ID關聯,並使加密資料記憶部420保管之。
第23圖為顯示檢索處理的流程的流程圖。
檢索處理,為主要由檢索裝置300和資料中心400執行的處理,在取得保管於資料中心400中的加密患者基因體序列時執行。
(S501:差異資訊輸入處理)
差異資訊輸入部310,使得操作檢索裝置300的使用者,輸入包含和基準基因體序列的差異資訊作為檢索關鍵字的檢索要求。
在此所輸入的差異資訊,是像從患者基因體中抽出的差異資訊那樣不需要指定所有的要素,例如可以為僅指定染色體號碼的資訊、或僅指定位置資訊的資訊。
(S502:差異資訊編碼處理)
差異資訊編碼部330,藉由處理裝置,將S501中輸入的差異資訊編碼,以產生編碼差異資訊。此處理和步驟S304的處理一樣,故省略其細節。不過,必須注意必須將未指定的要素標 記為「*」。
(S503:檢索詢問產生處理)
檢索詢問產生部340,藉由處理裝置,使用S502中產生的編碼差異資訊、及由使用者秘密金鑰記憶部320記憶的使用者秘密金鑰,產生檢索詢問。繼之,檢索詢問產生部340,將所產生的檢索詢問傳送至資料中心400。
此時,也傳送使用者本身的團體名稱及使用者名稱。另外,為了檢驗團體名稱、使用者名稱的信賴性,也執行操作檢索終端裝置的使用者的使用者認證。
(S504:加密標籤抽出處理)
檢索要求處理部440,藉由處理裝置,從記憶於加密標籤記憶部430中的所有的加密標籤中,取得用S503中和檢索詢問一起傳送的團體名稱和使用者名稱可以檢索的所有的加密標籤。另外,檢索要求處理部440,從存取權限記憶部460中取得該團體名稱及使用者名稱的使用者可以存取的患者ID的列表,從已取得的加密標籤中篩選出對應於該患者ID的加密標籤。
另外,存取權限記憶部460,具有如第24圖所示的存取權限管理表,以團體名稱及使用者名稱為存取者資訊,界定出能夠檢索的患者基因體序列所對應的患者ID,並輸出該患者ID所對應的加密標籤。
(S505:一致判斷處理)
檢索要求處理部440,藉由處理裝置,對於S504中篩選出的加密標籤執行隱蔽檢索方式的一致判斷處理,判斷包含於加 密標籤中的差異資訊是否符合S503中傳送的檢索詢問中所包含的差異資訊指定的條件。
隱蔽檢索方式的一致判斷處理,只能藉由1個加密標籤和1個檢索詢問比較來實施。因此,對於S504中取得的所有的加密標籤執行一致判斷處理。而且,判斷處理的結果界定出判斷為一致的加密標籤所關聯的管理號碼。
(S506:加密資料取得處理)
檢索要求處理部440,從加密資料記憶部420取得所有的對應於S505中界定的管理號碼的加密資料,並連同其所對應的患者ID一起傳送至檢索裝置300。
(S507:加密資料解密處理)
資料解密部360,藉由處理裝置,執行加密方式的解密處理,使用記憶在使用者秘密金鑰記憶部320的加密用使用者秘密金鑰,將S506中從資料中心400接收的加密資料解密,資料解密部360,對已接收的所有的加密資料執行此處理。
依據上述程序,檢索裝置300接收使用者想要檢索的差異資訊,從資料中心400取得與該差異資訊一致的加密資料,並將其解密,以使得能夠閱覽患者基因體序列。另外,可以因應需要,將加密資料所對應的患者ID傳送至資料中心400,以使得能夠獲致對應的電子病歷等。
如上述,在實施形態1中的基因檢索系統10中,使用隱蔽檢索方式將患者基因體加密並保管於資料中心400中,還用隱蔽檢索技術將檢索要求也加密並委託資料中心400檢索。因此,在資料中心400中,即使在完全未得知患者基因體 的內容的情況下,也能提供檢索的服務。
另外,人類基因體是由30億個鹼基構成的非常大量的資料。所以,若將人類基因體完全整理為標籤的話,則加密後資料量會再增加,而對硬碟容量或網路容量造成壓迫。
但是,在實施形態1中的基因檢索系統10中,僅對於和一般公開的基準基因體序列的差異資訊做成標籤,所以能夠大量減少硬碟使用量或網路容量。
另外,在實施形態1中的基因檢索系統10中,將SNV的位置資訊或信賴度等的數值資訊區塊化,藉此能夠用一致檢索來實現在隱蔽檢索中難以實現的範圍檢索。因此,也能因應基因體檢索中所使用的範圍檢索。
尤其是在第10圖所示的SNV的位置資訊中,各區塊有重複。亦即,區塊1和區塊2中,從位置5000到10000是重複的,區塊2和區塊3中,從位置10000到15000是重複的。藉此,檢索時所指定的範圍在5000以下的情況下,使用所有的區塊進行檢索,在檢索時所指定的範圍在10000以下的情況下,僅使用奇數的區塊進行檢索,如此可以更快速地進行處理。
另外,在實施形態1中的基因檢索系統10中,使在指定染色體號碼或位置資訊等的複數個檢索條件時,不是個別地進行條件的一致判斷,而是使用內積述語加密而一併判斷所有的檢索條件是否成立。因此,伺服器並不能得知部分的檢索符合的事實,而提高了安全性。
另外,在實施形態1中的基因檢索系統10中,包含加密資料及患者ID。因此,從作為檢索結果而得出的患者ID, 能夠得到關聯的電子病歷等的資訊。因此,在發生該鹼基變異時,也能夠研究其和怎樣的疾病有關聯。
另外,在實施形態1中的基因檢索系統10中,在將患者基因體序列的差異資訊加密時,使得標籤ID階層構造或解密者ID階層構造包含團體名稱或使用者名稱。因此,能夠限制可以檢索或解密的研究者或醫生。例如,若指定團體名稱為「A製藥公司」且使用者名稱為「*」,則則可以將該患者的資訊限制在A製藥公司的員工。另外,團體名稱及使用者名稱都可以指定為「*」(萬用牌)並將以加密,藉此,在此系統有登錄的醫生或研究者都可以利用此患者的資訊。
另外,在實施形態1中的基因檢索系統10中,和使用密碼的存取控制不同,資料中心400保管了存取權限管理表,並執行基於此資訊的存取控制。因此,能夠依照患者的希望,細緻地進行「只能閱覽基因體序列」、「只能閱覽病歷」等的管理。亦即,基於此資訊,判斷是否許可患者基因體序列的檢索要求,所以能夠執行細緻的存取控制。
另外,在實施形態1中的基因檢索系統10中,檢索者的使用者秘密金鑰也包含團體名稱或使用者名稱。因此,能夠藉由確認由此使用者秘密金鑰所產生的檢索詢問中所包含的團體名稱或使用者名稱,以執行認證。
另外,在上述說明中,係表示以公司單位執行存取限制的例子。不過,此存取控制的單位僅為一例。例如,也可以加入醫生或護士等的國家資格的條件,也可以設置是否為國家計畫的參加者的旗標。這些ID階層構造係為一例,因此能 夠追加或刪除各種的要素。
另外,在上述說明中,係假設為:國家管理唯一的金鑰管理伺服器100,代替醫生執行基因體分析的定序器操作者利用加密裝置200的情況。不過,可以因應利用系統,而有彈性地變更系統的構成。例如,由定序器操作者接收檢知結果的醫生操作加密裝置200,以將患者基因體序列加密亦可。
另外,在上述說明中,使檢索裝置300保管使用者秘密金鑰、並執行檢索詢問產生或加密資料的解密。但是,為了更提高安全性,可以不用檢索裝置300執行使用者秘密金鑰的保管,而使用IC卡等的裝置來執行。在此情況下,使用者秘密金鑰被安全地用IC卡管理,而能夠提高安全性。
另外,在上述說明中,檢索終端裝置中使用的隱蔽檢索用使用者秘密金鑰,係產生作為SNV資訊、SV資訊、或NC資訊等的檢索中共用的金鑰。但是,由於各差異資訊的長度相異,所以也可以不使用共用的隱蔽檢索用使用者秘密金鑰,而使用因應其用途而個別產生的隱蔽檢索用使用者秘密金鑰,例如SNV資訊隱蔽檢索用使用者秘密金鑰、SV資訊隱蔽檢索用使用者秘密金鑰、或NC資訊隱蔽檢索用使用者秘密金鑰等。在此情況下,隱蔽檢索用使用者秘密金鑰的長度為因應各資訊的長度而最適化之後的長度,能夠使計算時間高速化。
另外,在上述說明中,在顯示團體名稱或使用者名稱時使用「A製藥公司」或「田中」等的文字列來表現。此係為了作為實施例要以容易理解為優先考量的關係,實際上可以不僅可以用文字列還可以用號碼等的ID。染色體號碼等的其 他的要素也是一樣。
另外,在上述說明中,係例示使用階層式內積述語加密作為隱蔽檢索方式或加密方式的情況。如果是具有同樣功能的加密,並不一定限制於階層式內積述語加密。另外,也可以利用不同的方式作為隱蔽檢索方式或加密方式。
另外,在上述說明中,在使用者ID記憶部150中,也可以管理使用者過去的屬性資訊。這可以在管理上有需要的情況下實施,可以僅管理目前的屬性資訊。
另外,在上述說明中,係假設全員都共用1個基準基因體序列以實施的情況。但是,也可以使用不同的基準基因體來實施。在此情況下,在加密時對於所有的基準基因體序列產生差異資訊,在檢索時以和任何一個基準基因體序列的差異資訊作為檢索詢問,或者在加密時產生和一個基準基因體序列的差異資訊,在檢索時以其和所有的基準基因體序列的差異資訊作為檢索詢問。
另外,在上述說明中,關於位置資訊、信賴度、或CNV增益等範圍檢索所必須的資訊,係藉由區塊化,使得能夠判斷其與關鍵字的完全一致。不過,由於想檢索的範圍會隨著用途而異,所以未必需要能夠用完全一致來檢索。例如,可以在加密時指定屬於區塊10,而在檢索時指定例如區塊10或區塊11的複數個區塊作為檢索範圍。
另外,在上述說明中,係設想為只有1台的金鑰管理伺服器100的情況。不過,使用作為隱蔽檢索方式或加密方式的階層式內積述語加密,也可以將金鑰管理伺服器100階層 化並分散為複數個後再運用。因此,在此也可以將金鑰管理伺服器100階層化為複數個後再運用。
另外,在上述說明中,係例示將SNV資訊、SV資訊、或NC資訊加密作為差異資訊。不過,也可以藉由同樣的作法,將上述以外的差異資訊加密。
第25圖為金鑰管理伺服器100、加密裝置200、檢索裝置300、資料中心400之硬體構成之一例的圖。
如第25圖所示,金鑰管理伺服器100、加密裝置200、檢索裝置300、資料中心400具有執行程式的CPU 911(Central Process Unit,亦稱之為中央處理裝置、處理裝置、計算裝置、微處理器、微電腦、處理器)。CPU 911透過匯流排912連接ROM 913、RAM 914、LCD 901(Liquid Crystal Display)、鍵盤902(K/B)、通信板915、磁碟裝置920,並控制這些硬體裝置。也可以用光碟裝置、記憶卡讀寫裝置等的記憶裝置,取代磁碟裝置920(固定磁碟裝置)。磁碟裝置920係透過既定的固定磁碟介面連接。
ROM 913、磁碟裝置920為非揮發性記憶體之一例。RAM 914為揮發性記憶體之一例。ROM 913、RAM 914、及磁碟裝置920為記憶裝置(記憶體)之一例。另外,鍵盤902及通信板915為輸入裝置之一例。另外,通信板915為通信裝置之一例。另外,LCD 901為顯示裝置之一例。
在磁碟裝置920或ROM 913中,記憶了作業系統(OS)921、視窗系統922、程式群923、檔案群924。程式群923的程式,係由CPU 911、作業系統(OS)921、及視窗系統922 執行。
程式群923記憶了執行在上述說明中說明為「主金鑰產生部110」、「使用者秘密金鑰產生部130」、「資料收發部140」、「基準基因取得部210」、「對象基因輸入部220」、「差異資訊產生部240」、「差異資訊編碼部250」、「資料加密部260」、「加密標籤產生部270」、「附標籤加密資料產生部280」、「差異資訊輸入部310」、「差異資訊編碼部330」、「檢索詢問產生部340」、「基因資訊取得部350」、「資料解密部360」、「保管要求處理部410」、「檢索要求處理部440」等的軟體或程式或其他的程式。程式係由CPU 911讀取並執行。
檔案群924中,將在上述說明中由「金鑰記憶部120」、「使用者ID記憶部150」、「公開參數記憶部230」、「使用者秘密金鑰記憶部320」、「加密資料記憶部420」、「加密標籤記憶部430」、「公開參數記憶部450」、「存取權限記憶部460」等記憶的資訊、資料、信號值、變數值、或參數記憶為「檔案」或「資料庫」的各項目。「檔案」或「資料庫」記憶在磁碟或記憶體等的記憶媒體中。記憶在磁碟或記憶體等的記憶媒體中的資訊、資料、信號值、變數值、或參數,係透過讀寫回路而為CPU 911讀取至主記憶體或暫存記憶體,並用於抽出、檢索、參照、比較、演算、計算、處理、輸出、印刷、顯示等的CPU 911的動作。在抽出、檢索、參照、比較、演算、計算、處理、輸出、印刷、顯示等的CPU 911的動作之間,資訊、資料、信號值、變數值、或參數係暫時記憶在主記憶體或暫存記憶體或緩衝記憶體中。
另外,上述說明中的流程圖的箭頭的部分主要表示資料或信號的輸出入,資料或信號值係記憶於RAM 914的記憶體、其他的光碟等的記憶媒體或IC晶片中。另外,資料或信號係藉由信號線或纜線或其他的傳送媒體或電波等線上傳送。
另外,上述說明中說明為「~部」的,也可以為「~回路」、「~裝置」、「~機器」、「~手段」、「~功能」,另外,也可以為「~步驟」、「~程序」、「~處理」。另外,說明為「~裝置」的,也可以為「~回路」、「~機器」、「~手段」、「~功能」,另外,也可以為「~步驟」、「~程序」、「~處理」。另外,說明為「~處理」的,也可以為「~步驟」。亦即,說明為「~部」的,可以用記憶於ROM 913的韌體實現。或者,也可以藉由下列來實施:僅有軟體;或僅有元件、裝置、基板、配線等的硬體;或者軟體和硬體的組合;或更和韌體組合。韌體和軟體係記憶在ROM 913等的記錄媒體中作為程式。程式由CPU 911讀取,並由CPU 911執行。亦即,程式,使得電腦等發揮上述記載的「~部」的功能。或使得電腦執行上述記載的「~部」的程序或方法。
另外,電腦程式產品(亦簡單稱之為程式產品)不限於外觀形式的物,其係為載有電腦可讀取的程式之物。
10‧‧‧基因檢索系統
100‧‧‧金鑰管理伺服器
200‧‧‧加密裝置
300‧‧‧檢索裝置
400‧‧‧資料中心
500‧‧‧網路

Claims (19)

  1. 一種基因資訊記憶裝置,其係為使記憶裝置記憶基因資訊的基因資訊記憶裝置,其包括:基準基因取得部,其取得既定之基因資訊的基準基因;輸入對象基因的基因輸入部,該對象基因為該記憶裝置所記憶的基因資訊;差異產生部,其係比較該基準基因取得部所取得的基準基因、以及該基因輸入部所輸入的對象基因,以產生差異資訊;資料加密部,將該對象基因加密以產生加密基因;加密標籤產生部,其產生將該差異產生部產生的差異資訊嵌入的加密標籤,資料記憶部,其將該資料加密部產生的加密基因、和該加密標籤產生部產生的加密標籤關聯地記憶在該記憶裝置中,其中該差異資訊包含複數種類的資訊;及差異資訊置換部,其針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異產生部產生的差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊,其中該加密標籤產生部,將該差異資訊置換部置換後的差異資訊加密以產生加密標籤。
  2. 如申請專利範圍第1項所述之基因資訊記憶裝置,該差異資訊置換部,將該種類可取得的值分為複數個區塊,使得屬於各區塊的值的一部份也屬於其他區塊,將該差異產生部產生的差異資訊中的該種類的值置換為識別該值所屬的各 區塊的識別資訊。
  3. 如申請專利範圍第1項所述之基因資訊記憶裝置,該加密標籤產生部,當設定於加密資料的加密屬性和設定於秘密金鑰的金鑰屬性不對應的情況下,基於無法用該秘密金鑰解碼該加密資料的加密方式,將能檢索該加密基因的使用者的屬性資訊和差異資訊設定為該加密屬性,並將亂數值加密以產生該加密標籤。
  4. 如申請專利範圍第3項所述之基因資訊記憶裝置,其係基於該加密方式,將能解碼該加密基因的使用者的屬性資訊設定為該加密屬性,並將該對象基因加密產生該加密基因。
  5. 一種基因資訊檢索裝置,其係為檢索記憶在資料管理裝置所管理的記憶裝置中的基因資訊的基因資訊檢索裝置,其包括:差異資訊輸入部,其輸入欲檢索的基因資訊和既定之基因資訊的基準基因的差異資訊;檢索詢問產生部,其產生將該差異資訊輸入部所輸入的差異資訊嵌入的檢索詢問;基因資訊取得部,其將該檢索詢問產生部所產生的檢索詢問傳送至該資料管理裝置,以取得包含該差異資訊的基因資訊,其中該差異資訊包含複數種類的資訊;及差異資訊置換部,其針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊,其中該檢索詢問產生部,其產生將該差異資訊置換部置換 後的差異資訊嵌入的檢索詢問。
  6. 如申請專利範圍第5項所述之基因資訊檢索裝置,該差異資訊置換部將該種類可取得的值分為複數個區塊,使得屬於各區塊的值的一部份也屬於其他區塊,將差異資訊中的該種類的值置換為識別該值所屬的各區塊的識別資訊。
  7. 如申請專利範圍第5項所述之基因資訊檢索裝置,更包括管理秘密金鑰的使用者秘密金鑰管理部,該秘密金鑰為,當設定於加密資料的加密屬性和設定於秘密金鑰的金鑰屬性不對應的情況下,在無法用該秘密金鑰解碼該加密資料的加密方式中的該秘密金鑰,其中使用者的屬性資訊被設定為該金鑰屬性,上述檢索詢問產生部,追加該差異資訊並產生該檢索詢問以作為該使用者秘密金鑰管理部所管理的秘密金鑰的金鑰屬性。
  8. 如申請專利範圍第7項所述之基因資訊檢索裝置,該基因資訊取得部,基於該加密方式,將能解碼的使用者的屬性資訊設定為該加密屬性,並取得該基因資訊加密後的加密基因作為包含該差異資訊的基因資訊,該基因資訊檢索裝置更包括解密部,其依據該使用者秘密金鑰管理部所管理的秘密金鑰將該加密基因解密。
  9. 一種基因資訊記憶程式產品,其係為使記憶裝置記憶基因資訊的基因資訊記憶程式產品,其使電腦執行後述處理:基準基因取得處理,其取得作為既定之基因資訊的基準基因; 輸入對象基因的基因輸入處理,該對象基因為記憶於該記憶裝置的基因資訊;差異產生處理,其係比較該基準基因取得處理所取得的基準基因、以及該基因輸入處理所輸入的對象基因,以產生差異資訊;資料加密處理,將該對象基因加密以產生加密基因;加密標籤產生處理,其產生將該差異產生處理所產生的差異資訊嵌入的加密標籤;資料記憶處理,其將該資料加密處理所產生的加密基因、和該加密標籤產生處理所產生的加密標籤關聯地記憶在該記憶裝置中,其中該差異資訊中包含複數種類的資訊;及資訊置換處理,其針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異產生處理產生的差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊,其中該加密標籤產生處理,將該差異資訊置換處理置換後的差異資訊加密以產生加密標籤。
  10. 如申請專利範圍第9項所述之基因資訊記憶程式產品,該差異資訊置換處理中,將該種類可取得的值分為複數個區塊,使得屬於各區塊的值的一部份也屬於其他區塊,將該差異產生處理產生的差異資訊中的該種類的值置換為識別該值所屬的各區塊的識別資訊。
  11. 如申請專利範圍第9項所述之基因資訊記憶程式產品,在該加密標籤產生處理中,當設定於加密資料的加密屬性和設定於秘密金鑰的金鑰屬性不對應的情況下,基於無法用該 秘密金鑰解碼該加密資料的加密方式,將能檢索該加密基因的使用者的屬性資訊和差異資訊設定為該加密屬性,並將亂數值加密以產生該加密標籤。
  12. 如申請專利範圍第11項所述之基因資訊記憶程式產品,其係基於該加密方式,將能解碼該加密基因的使用者的屬性資訊設定為該加密屬性,並將該對象基因加密產生該加密基因。
  13. 一種基因資訊檢索程式產品,其係為檢索記憶在資料管理裝置所管理的記憶裝置中的基因資訊的基因資訊檢索程式產品,其使電腦執行後述處理:差異資訊輸入處理,其輸入欲檢索的基因資訊和既定之基因資訊的基準基因的差異資訊;檢索詢問產生處理,其產生將該差異資訊輸入部所輸入的差異資訊嵌入的檢索詢問;基因資訊取得處理,其將該檢索詢問產生處理所產生的檢索詢問傳送至該資料管理裝置,以取得包含該差異資訊的基因資訊,其中該差異資訊包含複數種類的資訊;及差異資訊置換處理,其針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊,其中在該檢索詢問產生處理中,產生將該差異資訊置換處理中置換後的差異資訊嵌入的檢索詢問。
  14. 如申請專利範圍第13項所述之基因資訊檢索程式產品,在該差異資訊置換處理中,將該種類可取得的值分為複數個 區塊,使得屬於各區塊的值的一部份也屬於其他區塊,將差異資訊中的該種類的值置換為識別該值所屬的各區塊的識別資訊。
  15. 如申請專利範圍第13項所述之基因資訊檢索程式產品,更使電腦執行管理秘密金鑰的使用者秘密金鑰管理處理,該秘密金鑰為,當設定於加密資料的加密屬性和設定於秘密金鑰的金鑰屬性不對應的情況下,在無法用該秘密金鑰解碼該加密資料的加密方式中的該秘密金鑰,其中使用者的屬性資訊被設定為該金鑰屬性,上述檢索詢問產生處理中,追加該差異資訊並產生該檢索詢問以作為該使用者秘密金鑰管理處理中所管理的秘密金鑰的金鑰屬性。
  16. 如申請專利範圍第15項所述之基因資訊檢索程式產品,該基因資訊取得處理中,使電腦基於該加密方式,將能解碼的使用者的屬性資訊設定為該加密屬性,並取得該基因資訊加密後的加密基因作為包含該差異資訊的基因資訊,該基因資訊檢索程式產品更使電腦執行解密處理,其依據該使用者秘密金鑰管理處理所管理的秘密金鑰將該加密基因解密。
  17. 一種基因資訊記憶方法,其係為使記憶裝置記憶基因資訊的基因資訊記憶方法,其包括:處理裝置取得既定之基因資訊的基準基因的基準基因取得步驟;輸入裝置輸入對象基因的基因輸入步驟,該對象基因為記 憶於該記憶裝置的基因資訊;處理裝置比較該基準基因取得步驟所取得的基準基因、以及該基因輸入步驟所輸入的對象基因,以產生差異資訊的差異產生步驟;處理裝置將該對象基因加密以產生加密基因的資料加密步驟;處理裝置產生將該差異產生步驟產生的差異資訊嵌入的加密標籤的加密標籤產生步驟;處理裝置將該資料加密步驟產生的加密基因、和該加密標籤產生步驟產生的加密標籤關聯地記憶在該記憶裝置中的資料記憶步驟其中該差異資訊包含複數種類的資訊;及處理裝置針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異產生部產生的差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊的差異資訊置換步驟,其中在該加密標籤產生步驟中,將該差異資訊置換部置換後的差異資訊加密以產生加密標籤。
  18. 一種基因資訊檢索方法,其係為檢索記憶在資料管理裝置所管理的記憶裝置中的基因資訊的基因資訊檢索方法,其包括:輸入裝置輸入欲檢索的基因資訊和既定之基因資訊的基準基因的差異資訊的差異資訊輸入步驟;處理裝置產生將該差異資訊輸入步驟所輸入的差異資訊嵌入的檢索詢問的檢索詢問產生步驟; 處理裝置將該檢索詢問產生步驟所產生的檢索詢問傳送至該資料管理裝置,以取得包含該差異資訊的基因資訊的基因資訊取得步驟,其中該差異資訊包含複數種類的資訊;及處理裝置針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊的差異資訊置換步驟,其中在該檢索詢問產生步驟,其產生將該差異資訊置換部置換後的差異資訊嵌入的檢索詢問。
  19. 一種基因資訊檢索系統,其包括:使資料管理裝置所管理的記憶裝置記憶基因資訊的基因資訊記憶裝置;及從該基因資訊記憶裝置所記憶的基因資訊中檢索包含檢索關鍵字的基因資訊的基因資訊檢索裝置,其中:該基因資訊記憶裝置包括:基準基因取得部,其取得既定之基因資訊的基準基因;輸入對象基因的基因輸入部,該對象基因為該記憶裝置所記憶的基因資訊;差異產生部,其係比較該基準基因取得部所取得的基準基因、以及該基因輸入部所輸入的對象基因,以產生差異資訊;資料加密部,將該對象基因加密以產生加密基因;加密標籤產生部,其產生將該差異產生部產生的差異資訊嵌入的加密標籤;及資料記憶部,其將該資料加密部產生的加密基因、和該加 密標籤產生部產生的加密標籤關聯地記憶在該記憶裝置中,其中該差異資訊包含複數種類的資訊;及差異資訊置換部,其針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異產生部產生的差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊,其中該加密標籤產生部,將該差異資訊置換部置換後的差異資訊加密以產生加密標籤;該基因資訊檢索裝置包括:差異資訊輸入部,其輸入欲檢索的基因資訊和該基準基因的差異資訊作為該檢索關鍵字;檢索詢問產生部,其產生將該差異資訊輸入部所輸入的差異資訊嵌入的檢索詢問;及基因資訊取得部,其將該檢索詢問產生部所產生的檢索詢問傳送至該資料管理裝置,以取得包含該差異資訊的基因資訊;及差異資訊置換部,其針對包含於該差異資訊中的既定種類,將該種類可取得的值分為複數個區塊,將該差異資訊中的該種類的值置換為識別該值所屬的區塊的識別資訊,其中該檢索詢問產生部,其產生將該差異資訊置換部置換後的差異資訊嵌入的檢索詢問。
TW103106205A 2013-03-28 2014-02-25 Gene information memory device, gene information retrieval device, gene information memory program product, gene information retrieval program product, gene information memory method, gene information retrieval method and gene information retrieval system TWI510939B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013067770A JP6054790B2 (ja) 2013-03-28 2013-03-28 遺伝子情報記憶装置、遺伝子情報検索装置、遺伝子情報記憶プログラム、遺伝子情報検索プログラム、遺伝子情報記憶方法、遺伝子情報検索方法及び遺伝子情報検索システム

Publications (2)

Publication Number Publication Date
TW201506653A TW201506653A (zh) 2015-02-16
TWI510939B true TWI510939B (zh) 2015-12-01

Family

ID=51623401

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103106205A TWI510939B (zh) 2013-03-28 2014-02-25 Gene information memory device, gene information retrieval device, gene information memory program product, gene information retrieval program product, gene information memory method, gene information retrieval method and gene information retrieval system

Country Status (7)

Country Link
US (1) US10311239B2 (zh)
EP (1) EP2980718A4 (zh)
JP (1) JP6054790B2 (zh)
CN (1) CN105190636A (zh)
HK (1) HK1219324A1 (zh)
TW (1) TWI510939B (zh)
WO (1) WO2014156400A1 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9194838B2 (en) 2010-03-03 2015-11-24 Osaka University Method and device for identifying nucleotide, and method and device for determining nucleotide sequence of polynucleotide
CA2929929A1 (en) 2013-09-18 2015-03-26 Quantum Biosystems Inc. Biomolecule sequencing devices, systems and methods
JP2015077652A (ja) 2013-10-16 2015-04-23 クオンタムバイオシステムズ株式会社 ナノギャップ電極およびその製造方法
US10438811B1 (en) 2014-04-15 2019-10-08 Quantum Biosystems Inc. Methods for forming nano-gap electrodes for use in nanosensors
WO2015170782A1 (en) 2014-05-08 2015-11-12 Osaka University Devices, systems and methods for linearization of polymers
US9875375B2 (en) * 2015-05-29 2018-01-23 Panasonic Intellectual Property Corporation Of America Method for performing similar-information search while keeping content confidential by encryption
JP6582930B2 (ja) * 2015-11-30 2019-10-02 コニカミノルタ株式会社 データ送受信システム、情報処理装置、データ送受信方法およびデータ送受信プログラム
WO2017122326A1 (ja) * 2016-01-14 2017-07-20 三菱電機株式会社 秘匿検索システム、秘匿検索方法及び秘匿検索プログラム
EP3392865B1 (en) 2016-01-15 2021-06-02 Mitsubishi Electric Corporation Encryption device, encryption method, and encryption program
US10339325B2 (en) * 2016-03-03 2019-07-02 JJD Software LLC Multi-level security model for securing access to encrypted private data
JP2019517056A (ja) * 2016-04-11 2019-06-20 クオンタムバイオシステムズ株式会社 生体データ管理のシステム及び方法
EP3479272A1 (en) * 2016-06-29 2019-05-08 Koninklijke Philips N.V. Disease-oriented genomic anonymization
BR112019007359A2 (pt) * 2016-10-11 2019-07-16 Genomsys Sa método e sistema para acesso seletivo dos dados bioinformáticos armazenados ou transmitidos
SG11201903269QA (en) * 2016-10-11 2019-05-30 Genomsys Sa Method and apparatus for the access to bioinformatics data structured in access units
US20210173957A1 (en) * 2017-01-12 2021-06-10 Mitsubishi Electric Corporation Encrypted tag generation device, search query generation device, and searchable encryption system
CN110546631A (zh) * 2017-04-25 2019-12-06 三菱电机株式会社 检索装置、检索系统、检索方法和检索程序
CN107506615A (zh) * 2017-08-21 2017-12-22 为朔医学数据科技(北京)有限公司 一种基因组学数据管理方法、服务器和系统
US11038691B2 (en) * 2018-01-03 2021-06-15 JJD Software LLC Database platform for maintaining secure data
US11899812B2 (en) 2018-01-03 2024-02-13 JJD Software LLC Compound platform for maintaining secure data
CN108810570A (zh) * 2018-06-08 2018-11-13 安磊 人工智能视频基因加密方法、装置及设备
US11611539B2 (en) * 2018-12-16 2023-03-21 Auth9, Inc. Method, computer program product and apparatus for encrypting and decrypting data using multiple authority keys
WO2020240816A1 (ja) * 2019-05-31 2020-12-03 三菱電機株式会社 暗号システム、暗号方法および暗号プログラム
WO2020259847A1 (en) 2019-06-28 2020-12-30 Geneton S.R.O. A computer implemented method for privacy preserving storage of raw genome data
JP6987330B1 (ja) * 2020-01-14 2021-12-22 三菱電機株式会社 登録装置、検索操作装置、データ管理装置、登録プログラム、検索操作プログラムおよびデータ管理プログラム
CN111540409B (zh) * 2020-04-20 2023-06-27 中南大学 基于隐私保护的基因相似度计算方法及基因信息获取方法
CN117711501B (zh) * 2023-10-26 2024-06-11 安徽溯远分析仪器有限公司 一种基因测序数据管理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1426173A (zh) * 2001-12-10 2003-06-25 精工爱普生株式会社 差分通信系统、差分通信装置与差分通信程序及方法
TW200405972A (en) * 2002-10-11 2004-04-16 Ibm Method and apparatus for deriving the genome of an individual
JP2012073693A (ja) * 2010-09-28 2012-04-12 Mitsubishi Space Software Kk 遺伝子情報検索システム、遺伝子情報記憶装置、遺伝子情報検索装置、遺伝子情報記憶プログラム、遺伝子情報検索プログラム、遺伝子情報記憶方法及び遺伝子情報検索方法
TW201246111A (en) * 2011-04-01 2012-11-16 Life Corp Information processing device, method and program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1314473B1 (en) * 1997-06-30 2007-03-21 Dow Global Technologies Inc. Catalyst composition and process for the direct oxidation of propylene to propylene oxide
US20040153255A1 (en) * 2003-02-03 2004-08-05 Ahn Tae-Jin Apparatus and method for encoding DNA sequence, and computer readable medium
JP5154832B2 (ja) 2007-04-27 2013-02-27 株式会社日立製作所 文書検索システム及び文書検索方法
JP2011203943A (ja) * 2010-03-25 2011-10-13 Nippon Telegr & Teleph Corp <Ntt> メタデータ生成装置およびメタデータ生成方法
JP5420085B2 (ja) * 2011-01-13 2014-02-19 三菱電機株式会社 データ処理装置及びデータ保管装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1426173A (zh) * 2001-12-10 2003-06-25 精工爱普生株式会社 差分通信系统、差分通信装置与差分通信程序及方法
TW200405972A (en) * 2002-10-11 2004-04-16 Ibm Method and apparatus for deriving the genome of an individual
JP2012073693A (ja) * 2010-09-28 2012-04-12 Mitsubishi Space Software Kk 遺伝子情報検索システム、遺伝子情報記憶装置、遺伝子情報検索装置、遺伝子情報記憶プログラム、遺伝子情報検索プログラム、遺伝子情報記憶方法及び遺伝子情報検索方法
TW201246111A (en) * 2011-04-01 2012-11-16 Life Corp Information processing device, method and program

Also Published As

Publication number Publication date
TW201506653A (zh) 2015-02-16
US20160048690A1 (en) 2016-02-18
EP2980718A4 (en) 2016-11-23
EP2980718A1 (en) 2016-02-03
HK1219324A1 (zh) 2017-03-31
JP6054790B2 (ja) 2016-12-27
US10311239B2 (en) 2019-06-04
JP2014191670A (ja) 2014-10-06
CN105190636A (zh) 2015-12-23
WO2014156400A1 (ja) 2014-10-02

Similar Documents

Publication Publication Date Title
TWI510939B (zh) Gene information memory device, gene information retrieval device, gene information memory program product, gene information retrieval program product, gene information memory method, gene information retrieval method and gene information retrieval system
Akgün et al. Privacy preserving processing of genomic data: A survey
Ayday et al. Protecting and evaluating genomic privacy in medical tests and personalized medicine
Ayday et al. Privacy-preserving processing of raw genomic data
US9449191B2 (en) Device, system and method for securing and comparing genomic data
EP3016011A1 (en) Method for privacy-preserving medical risk tests
US10013575B2 (en) Method to manage raw genomic data in a privacy preserving manner in a biobank
EP2525340A1 (en) Confidential search system and encryption processing system
CN107209787A (zh) 提高专用加密数据的搜索能力
US20170005787A1 (en) Device, system and method for securing and comparing genomic data
JP6619401B2 (ja) データ検索システム、データ検索方法およびデータ検索プログラム
KR20140029984A (ko) 의료정보 데이터베이스 운영 시스템의 의료정보 관리 방법
US20170083713A1 (en) Data encryption scheme using symmetric keys
Siddique et al. A survey of big data security solutions in healthcare
Cassa et al. A novel, privacy-preserving cryptographic approach for sharing sequencing data
Rai et al. Pseudonymization techniques for providing privacy and security in EHR
Ayday Cryptographic solutions for genomic privacy
JP4822842B2 (ja) 匿名化識別情報生成システム、及び、プログラム。
Nadpara et al. A Survey of Cryptographic Techniques to Secure Genomic Data
WO2020259847A1 (en) A computer implemented method for privacy preserving storage of raw genome data
JP2003296453A (ja) 医療データ通信システム
JP2021018517A (ja) 秘密情報管理プログラム、秘密情報管理方法、および秘密情報管理システム
US20240126915A1 (en) Search execution device, search execution method, computer readable medium and searchable encryption system
Ragavan et al. Evaluation of cryptographic key generation performance using evolutionary algorithm
Quantin et al. Epidemiological and statistical secured matching in France

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees