WO2004008361A1 - 塩基配列関連情報を用いた情報処理システム - Google Patents

塩基配列関連情報を用いた情報処理システム Download PDF

Info

Publication number
WO2004008361A1
WO2004008361A1 PCT/JP2003/008971 JP0308971W WO2004008361A1 WO 2004008361 A1 WO2004008361 A1 WO 2004008361A1 JP 0308971 W JP0308971 W JP 0308971W WO 2004008361 A1 WO2004008361 A1 WO 2004008361A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
polymorphism
base sequence
semantic
semantic information
Prior art date
Application number
PCT/JP2003/008971
Other languages
English (en)
French (fr)
Inventor
Takamasa Katoh
Takeo Morimoto
Original Assignee
Hitachi, Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi, Ltd. filed Critical Hitachi, Ltd.
Priority to AU2003281108A priority Critical patent/AU2003281108A1/en
Priority to US10/521,351 priority patent/US7747394B2/en
Priority to EP03741402A priority patent/EP1553512A4/en
Priority to CA002492658A priority patent/CA2492658A1/en
Publication of WO2004008361A1 publication Critical patent/WO2004008361A1/ja
Priority to US12/785,188 priority patent/US8364416B2/en

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2299/00Coordinates from 3D structures of peptides, e.g. proteins or enzymes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Definitions

  • the present invention relates to, for example, an information processing system for providing information via a communication network.
  • genomic nucleotide sequences of various organisms including humans are being rapidly determined, and genomic nucleotide sequence information is accumulated in various databases.
  • a system is being constructed that allows various research institutions and researchers to use genomic base sequence information stored in a database via an information communication network such as the Internet.
  • genomic drug discovery research and analysis of genetic information have been actively conducted using the nucleotide sequences contained in such genomic nucleotide sequence information. Attention has been paid to differences in base sequences.
  • differences in the nucleotide sequence between individuals are defined as polymorphisms defined as having a given base difference at a frequency of 1% or more in an individual species, and having a given base difference of 1% in an individual species.
  • polymorphisms include single nucleotide polymorphism (SNP; Single Nucleotide Polymorphism), which is a single base difference between individuals, and deletion or insertion of one to several tens of bases (sometimes several thousand bases).
  • SNP Single nucleotide polymorphism
  • VNTR Very Number of Tandem Repeat
  • microsatellite polymorphism replicateated sequence of about 2 to 4 bases
  • Such polymorphisms may affect the amino acid sequence of a protein between individuals or the expression efficiency of a given gene between individuals. Due to such effects, for example, it is known that the susceptibility to a predetermined disease differs among individuals, and that the sensitivity to a predetermined drug differs between individuals. However, there is no system that effectively utilizes the difference in nucleotide sequence information between individuals such as polymorphisms and provides useful semantic information to each individual. It is the current situation. Disclosure of the invention
  • the present invention can provide useful semantic information for each individual and / or information related to the semantic information by effectively utilizing differences in base sequence information between individuals,
  • the goal is to build a highly secure information processing system.
  • the information processing method for a nucleotide sequence according to the present invention includes a method for providing semantic information and / or information related to the semantic information, the method for providing the semantic information and And / or information related to the semantic information and position information corresponding to the semantic information and / or the information related to the semantic information, and transmitted.
  • the side that sends out the base sequence-related information may be configured such that the side that sends out the base sequence-related information has meaning information that means the sent base sequence-related information, And the position information corresponding to the semantic information and / or the information related to the semantic information.
  • the information processing method for a base sequence according to the present invention can be realized as a program that causes a computer including hardware such as a control device, a transmission / reception device, and a storage device to execute each step. Further, the information processing method for a base sequence according to the present invention is realized as a recording medium recording a program for causing a computer including hardware such as a control device, a transmission / reception device, and a storage device to execute each step. You can also.
  • the information processing method relating to a base sequence according to the present invention can be realized as an information processing device including hardware such as a control device that executes each step, a transmitting / receiving device, and a storage device.
  • This description includes part or all of the contents as disclosed in the description and / or drawings of Japanese Patent Application No. 2002-205550, which is a priority document of the present application.
  • FIG. 1 is a schematic configuration diagram schematically showing a configuration of an information processing system to which the present invention is applied.
  • FIG. 2 is a schematic configuration diagram schematically showing the configuration of a shared computer.
  • FIG. 3 is a configuration diagram showing an example of data recorded in the main DB.
  • FIG. 4 is a schematic configuration diagram schematically showing the configuration of a personal computer.
  • FIG. 5 is a configuration diagram showing an example of data recorded on a genome-related information recording medium.
  • FIG. 6 is a flowchart showing a process performed by a shared computer and a personal computer in a system for providing a morbidity of a predetermined disease.
  • FIG. 7 is a continuation of FIG. 6, and is a flow chart showing processing on a shared computer and a personal computer in a system for providing morbidity for a predetermined disease.
  • an information processing system for providing a user with a possibility of a predetermined disease will be described.
  • a case where the user requests that he / she want to know his / her morbidity with respect to a predetermined disease as the “request for goods and / or services” will be described as an example.
  • an information processing system capable of recognizing illegal use and collection of nucleotide sequence-related information will be described, but for convenience of description, a simplified model will be described.
  • the “goods and / or services” are not limited to this, and may be, for example, suitable for the constitution of an individual (individual). This includes services such as combined medicines, foods and luxury goods, and information and other information that are suited to the constitution and characteristics of the individual (individual).
  • the information processing system includes a communication network 1 such as the Internet, a shared computer 2 connected to the communication network 1, and a plurality of personal computers 3 connected to the communication network 1. To enable data communication between the shared computer 2 and the personal computer 3 via the communication network 1.
  • a communication network 1 such as the Internet
  • shared computer 2 connected to the communication network 1
  • personal computers 3 connected to the communication network 1.
  • the shared computer 2 includes, as shown in FIG. 2, a CPU 4 for controlling all operations of the shared computer 2, an input device 5 such as a keyboard and a mouse for inputting information and a program execution instruction, and a display device.
  • Display device 6 a memory 7 for storing temporary information and non-rewritable information, etc., a database 8 storing various data, and writing predetermined information to these memories 7 and database 8. It comprises a recording device 9 and a transmitting / receiving device 17 for transmitting / receiving information to / from the personal computer 3 via the communication network 1.
  • the memory 7 of the shared computer 2 includes a memory section A 10 and a memory section B 11 for recording different types of information, respectively, and a screen memory 1 2 for recording image data to be displayed on the personal computer 3 and the display device 6, for example. And a processing program 13 for operating the present system.
  • the shared computer 2 does not have the screen memory 12 and the processing program 13 etc. in the internal memory 7, but has an external storage device (not shown) connected to the shared computer 2 via the communication network 1. Zu) may be included.
  • the database 8 (storage device) in the shared computer 2 includes a main DB 14 in which polymorphism addresses, polymorphism patterns, and semantic information are recorded, and a storage DB that stores information recorded in the memory unit A 10- 15 and a storage DB-B 16 for storing the information recorded in the memory section B 11.
  • the main DB 14 records the polymorphism address, a plurality of possible polymorphism patterns at the polymorphism address, and semantic information indicating each of the plurality of polymorphism patterns in association with each other. Have been.
  • the main DB 14 may record semantic information indicating a combination of polymorphism patterns at a plurality of polymorphism addresses (for example, a haplotype).
  • polymorphism address means at least the position where the polymorphism exists in the nucleotide sequence.
  • a polymorphism is, for example, a so-called SNP (si Includes nanonucleotide polymorphism, RFLP (restriction fragment length of polymorphism), YNTR (variable number of tandem repeat) ⁇ microsatellite, etc.
  • SNP includes nanonucleotide polymorphism
  • RFLP restriction fragment length of polymorphism
  • YNTR variable number of tandem repeat
  • polymorphism address is meant to include bases that occur only at a frequency of less than 1% in an individual species and base sequence changes that indicate changes in the base sequence. That is, the “polymorphism address” indicates a position indicating a polymorphism or the like by combining numerical values, characters, symbols, and the like.
  • the polymorphism address is not particularly limited.
  • the polymorphism number can be represented by a combination of a chromosome number, a symbol indicating the gene in which the polymorphism exists, and a numerical value indicating the location of the polymorphism in the gene, or a polymorphism. May be a combination of a symbol indicating a gene in which is present and a numerical value indicating the location of a polymorphism in the gene.
  • the polymorphism address may be a polymorphism-specific notation assigned to each polymorphism.
  • a polymorphism-specific notation is used as the polymorphism address, the polymorphism address does not directly indicate the position in the nucleotide sequence, but the position can be indirectly known based on the polymorphism-specific notation. Therefore, "polymorphism address" is meant to include notations specific to polymorphism.
  • Polymorphism pattern is information on a base sequence that differs between individuals, and includes at least the base or base sequence pattern in the polymorphism. Further, the term “polymorphism pattern” is not limited to polymorphism, but also includes patterns of bases and base sequences that are present at a frequency of less than 1% in an individual species. For example, at a polymorphism address known to take A or G, the “polymorphism pattern” is represented by either “A” or “G”.
  • the “polymorphism pattern” may indicate a heterozygote or a homozygote in a homologous chromosome.
  • the “polymorphism pattern” can be represented by any of “AA”, “GG”, and “AG”.
  • the “polymorphism pattern” does not directly represent a pattern that can be taken at a predetermined polymorphism address, but may be an indirect representation.
  • a “polymorphism pattern” is, for example, “allele 1” when taking “A” at a polymorphism address known to take A or G, and “allele 2” when taking “G”. Notation May be.
  • the “polymorphism pattern” can be represented by any of “AA”, “GG” and “AG” as described above, for example, when it can be represented by “AA”, it is represented by “HI” and “GG” When it can be expressed, it may be expressed as “” or when expressed as “AG”, it may be expressed as “ ⁇ ”.
  • the polymorphism pattern may be encrypted or unencrypted.
  • polymorphism pattern examples are numerical values representing the “number of repetitions” when the polymorphism is a microsatellite, and “present / absent” when the polymorphism is a deletion type. It may be represented by a symbol.
  • the “polymorphism pattern” at each polymorphism address may be described as, for example, “polymorphism 1”, “polymorphism 2”, or “polymorphism 3” in accordance with predetermined regulations and rules.
  • polymorphism 1”, “polymorphism 2”, and “polymorphism 3” can be described in descending order of the possible frequency of “polymorphism pattern”.
  • each “polymorphism 1” at each polymorphism address does not necessarily represent the same content. That is, for example, "Polymorphism 1" of one polymorphism address represents " ⁇ ⁇ ", which is the most likely frequency, and another "Polymorphism 1" is the most likely frequency, "GG”. Will be.
  • the “semantic information” is information associated with the “polymorphism pattern”, and includes, for example, responsiveness to a drug, side effects to a drug, risk for a disease or a disorder, constitution, nature, constitution, nature, and the like. It refers to various information resulting from differences in "polymorphism patterns", such as lifestyle-based adipices and protein interactions. As the “meaning information”, various information resulting from the difference in the “polymorphism pattern” may be directly represented, or may be indirectly represented by using a symbol or the like indicating the information. “Semantic information” is information of a type that will increase and be corrected as research on genomes and genes progresses, and it is preferable to always keep up with the version. In other words, “semantic information” becomes more accurate by increasing / decreasing the amount of accumulation by updating the database using the results of genomic / gene research.
  • the semantic information is stored in the main DB 14 at least as “annotation information for the polymorphism pattern” associated with the predetermined “polymorphism address” and “polymorphism pattern”. Has been recorded.
  • the semantic information is associated with “polymorphism classification” and “classification (disease name)” corresponding to a predetermined “polymorphism address”. That is, when the predetermined “polymorphism address” is the predetermined “polymorphism pattern”, it is possible to obtain annotation information (semantic information) indicating the type of the disease name and the likelihood of being affected by the disease.
  • the semantic information can be correlated with a combination of each polymorphism pattern corresponding to a plurality of polymorphism addresses (for example, a haplotype). That is, for each combination of polymorphism patterns at a plurality of polymorphism addresses, it is possible to associate annotation information (semantic information) indicating a different morbidity of a predetermined disease. In this case, when a plurality of polymorphism addresses are a combination of predetermined polymorphism patterns, it is possible to obtain annotation information (semantic information) indicating the possibility of illness for a predetermined disease.
  • the “public level” determined based on a predetermined standard can be associated with the semantic information.
  • the criteria for determining the “disclosure level” consider semantic information, that is, the unexpected disadvantage to an individual by disclosing the likelihood of “classification (disease name)” here. Can be determined.
  • the public computer 2 determines the ⁇ disclosure level '' so that semantic information that is not appropriate to be disclosed is not disclosed in view of laws, regulations, own standards of conduct, contracts with users, etc. can do.
  • the system does not disclose to the user the annotation information that indicates the likelihood of morbidity that is associated with the “disclosure level,” which means that disclosure is not possible.
  • the semantic information includes information about the source of the semantic information.
  • the “information source” indicates the source of the semantic information, such as the organization that created the semantic information and the organization that provided the semantic information to the shared computer 2. By associating the “information source” with the semantic information, the credibility of the semantic information can be determined.
  • the database 8 in the storage DB-B16, for example, data including base sequence-related information, which is genetic information of a requester who uses the present system, can be recorded.
  • the storage DB-A 15 can record data such as, for example, information for identifying a requester who uses the system. In this way, by recording the genetic information of the individual and the information identifying the individual separately in the storage DB-A 15 and the storage DB-B 16, the genetic information of the requester and the requester can be obtained. It is difficult to associate with the data that specifies
  • the shared computer 2 is not limited to the one having the database 8 therein, and may have an external database (not shown) connected to the shared computer 2 via the communication network 1.
  • the shared computer 2 may have a plurality of databases 8 therein, or may have the internal database 8 and an external database connected to the shared computer 2 via the communication network 1. May be.
  • the personal computer 3 includes a CPU 20 for controlling all the operations of the personal computer 3 and an input device 2 such as a keyboard and a mouse for inputting information and a program execution instruction.
  • a display device such as a display device 22; a memory 23 for storing temporary information and rewritable information; a reading device 25 for reading data from a genome-related information recording medium 24;
  • a transmission / reception device 29 for transmitting / receiving information to / from the shared computer 2 via the communication network 1.
  • the personal computer 3 is not limited to a normal computer, but may be in any form such as a mobile phone, a personal mobile terminal, and other mobile communication devices.
  • the memory 23 of the personal computer 3 has a memory unit 26 for recording information and the like from the genome-related information recording medium 24, and a processing program 27 for operating the information processing system is recorded.
  • the genome-related information recording medium 24 stores the genome-related information 28 of an individual.
  • Examples of the genome-related information recording medium 24 include a magnetic recording medium such as a magnetic disk and a magnetic card, an optical recording medium to which a magneto-optical recording method and a phase change recording method are applied, a semiconductor memory, and the like.
  • the genome-related information recording medium 24 may be in the form of a card, a disk, a stick, a tape, a drum, or the like. May be used. Further, the genome-related information recording medium 24 may be a recording of the genome-related information 28 of a single individual (individual), but may be a plurality of genome-related information 2 of a plurality of individuals (individuals). 8 may be recorded.
  • the genome-related information 28 included in the genome-related information recording medium 24 is at least a “polymorphism address” and a “polymorphism pattern” at a predetermined polymorphism address obtained as a result of analyzing the base sequence of an individual (individual). Means.
  • the genome-related information 28 may include various types of information such as preexisting diseases, characteristics, medical record information, and health check results.
  • the genome-related information recording medium 24 as the genome-related information 28, for example, as shown in FIG. 5, as the data I, an individual number “Gno. It records personal information such as days, records polymorphism addresses and polymorphism patterns as data II, records existing illness as data III, records characteristics as data IV, and records medical record information as data V.
  • the genome-related information 28 consists of data I, data II, data I II, data IV and data V. Data I and data II contain essential information, and data III and data Data IV and Data V consist of additional information.
  • the “polymorphism address” corresponding to the position on the base sequence and the “polymorphism pattern” at the polymorphism address are linked and recorded. Further, in the data II, additional information at a predetermined polymorphism address may be recorded as a “comment” linked to the “polymorphism address”. In addition, the entire base sequence of a predetermined individual may be recorded in the data II. Even when the entire base sequence is recorded in Data II, “Polymorphism address” and “Polymorphism pattern” are included in Data II.
  • the personal computer 3 and the genome-related information recording medium 2 are identical to the personal computer 3 and the genome-related information recording medium 2
  • the genome-related information recording medium includes a memory unit having a processing program
  • the personal computer uses the genome-related information recording medium.
  • a configuration in which the processing program is operated by being attached may be employed.
  • the personal computer can operate in accordance with the processing program recorded in the memory of the genome-related information recording medium.
  • the processing program 13 recorded in the memory 7 of the shared computer 2 and the memory of the personal computer 3 The processing program 27 recorded in step 23 performs an information processing operation in accordance with, for example, flowcharts as shown in FIGS.
  • the steps described as “(shared)” mean the processing in the shared computer 2
  • the steps described as “()” are the processing in the personal computer 3. Meaning.
  • each individual possessing the genome-related information recording medium 24 accesses the shared computer 2 through the communication network 1 using the personal computer 3 and records the information in the main DB 14 of the shared computer 2 It is a system that uses the semantic information that has been used.
  • the information processing system uses a genome-related information recording medium 24 on which genome-related information 28 of a plurality of persons is recorded, and each individual accesses the genome-related information recording medium 24. It may be.
  • An individual who uses this system is, for example, a person who has a genome-related information recording medium 24.
  • the individual using the system (hereinafter referred to as “requester”) starts the processing program 27 recorded in the memory 23 at step Al (SA1) and reads the personal computer 3
  • the device 25 is driven to access the genome-related information recording medium 24, and “Gno.” Recorded as data I on the genome-related information recording medium 24 is read.
  • the read “Gno.” Is stored in memory part 26.
  • step A2 based on the screen image displayed on the display device 22 by the processing program 27, information requested by the requester to be provided, for example, "possibility of colon cancer" (Request information) is input to the personal computer 3 and from the personal computer 3 to the shared computer 2 via the communication network 1.
  • Request information information requested by the requester to be provided, for example, "possibility of colon cancer"
  • Step A3 the shared computer 2 receives “Possibility of colon cancer” and “Gno.”.
  • the received “colorectal cancer morbidity” and “Gno.” are stored as request information in the memory unit A10.
  • step A4 when the request information is received, the processing program 13 recorded in the memory 7 is started to access the main DB 14.
  • the processing program 13 performs processing in the shared computer 2.
  • step A5 according to the processing program 13, the “classification (disease name)” recorded in the main DB 14 is searched, and the requested “possibility of colon cancer” ( ) Is extracted.
  • step A6 the data associated with “Classification (disease name)” (colorectal cancer) consistent with “possibility of colorectal cancer” from the data recorded in the main DB14 Read the “polymorphism address”.
  • the read “polymorphism address” is stored in the memory unit A 10 as position information associated with the request information. That is, the “possibility of colon cancer” and the “polymorphism address” for the predetermined “Gno.” Are recorded in the memory unit A 10.
  • step A7 the “Gno.” And “polymorphism address” recorded in the memory section A10 are transmitted to the personal computer 3, and the “polymorphism address” to be transmitted is corresponded.
  • Yes Send the instruction information to submit the “polymorphism pattern” to the personal computer 3.
  • it may be necessary to order the submission of additional information such as pre-existing illnesses and characteristics as needed.
  • step A8 “Gno.”, “Polymorphism address” and instruction information transmitted from shared computer 2 are received.
  • the received “Gno.” And “polymorphism address” are recorded in the memory part 26.
  • step A9 the data II recorded on the genome-related information recording medium 24 is accessed according to the received instruction information.
  • step A10 the data II recorded on the genome-related information recording medium 24 is searched according to the processing program 27, and the polymorphism pattern of the instructed polymorphism address is read. The information is stored in the memory unit 26 in association with the polymorphism pattern. At this time, it is preferable to access data I and confirm whether or not the “Gno.” Received in step A8 is correct.
  • step A10 in addition to the polymorphism pattern, additional information recorded in data III, data IV, and data V may be read at the same time, and may be recorded in the memory unit 26 as necessary. .
  • Step All the polymorphism pattern associated with the polymorphism address temporarily recorded in the memory unit 26 and the additional information recorded as necessary together with the "Gno.” Output to the shared computer 2 via the communication network 1.
  • step A12 the polymorphism pattern associated with the polymorphism address and the necessary The additional information recorded according to is received by the shared computer 2, and the received polymorphism pattern is recorded in the memory unit A10 in association with the polymorphism address.
  • step A7 the shared computer 2 sends instruction information for instructing the submission of the “polymorphism pattern”, and in step A10, the personal computer 3 multiplexes according to the instruction information.
  • the pattern is read from the genome-related information recording medium 24.
  • the present system may be a system that does not transmit the command information in step A7.
  • step A10 the personal computer 3 searches the data ⁇ based on the polymorphism address received in step A8 according to the processing program 27, and searches the received polymorphism pattern for the polymorphism pattern. read out. Then, the personal computer 3 outputs the polymorphism pattern and the like to the shared computer 2 in step A11.
  • the shared computer 2 obtains the polymorphism pattern of the “polymorphism address” associated with the “classification (disease name)” corresponding to the “possibility of colorectal cancer” in step A12. Can be.
  • step A13 the main DB 14 is accessed to search for a received polymorphism address and a pattern that matches the polymorphism pattern.
  • the main DB 14 a plurality of polymorphism patterns are recorded for one polymorphism address, and the received polymorphism address and its polymorphism pattern are stored in the main DB 14. Search for a match.
  • step A14 the morbidity (semantic information) for colorectal cancer associated with the received polymorphism pattern is read out. That is, in step A14, the requester's morbidity for colorectal cancer can be read out according to the polymorphism address and polymorphism pattern submitted by the requester.
  • the read morbidity is stored in the memory unit A10 in association with the requester's "Gno.”, "Polymorphism address" and "polymorphism pattern”.
  • the likelihood of colorectal cancer may be stored in a form captured with additional information, or other information obtained from the additional information may be associated with the requester's ⁇ Gno. '' May be stored.
  • step A15 the morbidity stored in the memory unit A10 and the polymorphism address used when reading out the morbidity from the main DB 14 are associated with each other.
  • the requester requests the personal computer 3 via the communication network 1. Sent with "Gno.” That is, in step A15, the morbidity read out in step A14 and the polymorphism address corresponding to the morbidity are linked and transmitted as a set. In step A15, in addition to "Gno.” And the set of morbidity and polymorphism addresses corresponding to the morbidity, the "information source" recorded in the main DB 14 is added. It may be transmitted in association with the morbidity and a set of polymorphism addresses corresponding to the morbidity.
  • the requester By transmitting the information source, the requester evaluates the credibility of the morbidity based on the information source and the polymorphism address corresponding to the morbidity and the polymorphism pattern corresponding to the polymorphism address. can do. That is, in addition to the information source received and the morbidity and the set of polymorphism addresses corresponding to the morbidity, the requester side receives the information transmitted by himself in step A11 in step A19 below. By associating the pattern patterns with each other and outputting them on the display device 22 of the personal computer 3 or on paper, the requester can determine that the organization described in the information source is a polymorphism pattern associated with the polymorphism address.
  • the fact that the information about the morbidity has been prepared by using the information can be used to evaluate the reliability of the information about the morbidity. Also, on the information provider side, the requester will provide responsible services because the reliability is evaluated. If the requester has previously confirmed the polymorphism pattern associated with the polymorphism address provided by himself / herself through the informed consent, the informed consent confirmation information and the output information are not included. Whether they match can also be checked visually.
  • step A16 the personal computer 3 receives the requester's "Gno. J” and a set of morbidity I "students and a polymorphism address corresponding to the morbidity. .
  • the received morbidity and the set of polymorphism addresses corresponding to the morbidity are recorded in the memory section 26.
  • step A17 the polymorphism address associated with the polymorphism pattern transmitted to shared computer 2 in step Al1, the morbidity received in step A16, and the It is determined whether or not a polymorphism address included in the set of polymorphism addresses corresponding to the morbidity (hereinafter referred to as “the polymorphism address received in step A16”) matches.
  • the polymorphism address transmitted in step A11 and the polymorphism address received in step A16 completely match, it is determined as "yes", and the polymorphism number transmitted in step A11 is determined.
  • step A 16 If not, judge as “noj.” If the polymorphism address transmitted in step A11 does not match the polymorphism address received in step A16, for example, transmit in step A11
  • the polymorphism address transmitted in step A11 does not match the polymorphism address received in step A16, for example, transmit in step A11
  • the notational match of the polymorphism address means that the notation at a predetermined position on the base sequence is the same.
  • substantial match of polymorphism addresses means, for example, a case where the same position in the nucleotide sequence is directly or indirectly indicated even if the notation does not match.
  • step A17 if the determination is "no”, the flow proceeds to step Al8 (SA18). If the determination is "yes”, the flow proceeds to step Al9 (SA19).
  • step A18 all of the polymorphism patterns associated with the polymorphism address transmitted in step A11 in step A17 are used by shared computer 2 to acquire morbidity (semantic information). Since it is determined that this is not the case, a warning to that effect is displayed on the display device 22, and a warning to that effect is transmitted to the shared computer 2. After step A18, the process proceeds to step A19 described later, and the process is continued.
  • warning refers to a command based on the judgment that the probability of unauthorized use 'collection is high, a notification that not all of the transmitted polymorphism patterns have been used, or all of the transmitted polymorphism patterns This includes a notice to notify a third party that the was not used.
  • step A 19 the possibility of illness for colorectal cancer is displayed on the display device 22 from the semantic information recorded in the memory part 26 according to the processing program 27.
  • the requester can obtain the possibility of morbidity for colorectal cancer using the genome-related information 28 recorded on the genome-related information recording medium 24. If “yes” is determined in step A 17, all of the polymorphism patterns associated with the polymorphism address transmitted in step A 1 determine the morbidity (semantic information) on shared computer 2. Perform step A 19 following step A 17 because it was found to be used to obtain.
  • the “information related to semantic information” is further derived from the “semantic information” read in step A14, and in step A15, the “information related to semantic information” is derived together with the “semantic information”.
  • step A3 in addition to the “possibility of colorectal cancer” desired by the requester, for example, when the possibility of occurrence exceeds Of the functional food that will prevent the disease as additional request information, together with information about the requester's morbidity of colorectal cancer, and the requested function if the morbidity exceeds a predetermined level. It is also possible to provide sex foods.
  • Steps A3 to A7 and steps A12 and steps A12 to A15 in shared computer 2 may be performed by different organizations. In this case, the steps in the shared computer 2 are divided into two.
  • the semantic information recorded in the main DB 14 is used to convert the polymorphism address by using the genome-related information recording medium 24 in which the individual polymorphism pattern is recorded in association with the polymorphism address. It can be used by individuals with intervention. In other words, individuals using this system do not need to record semantic information on the genome-related information recording medium, but only possess genome-related information 28 that associates polymorphism addresses with polymorphism patterns. Can get various semantic information.
  • step A 16 a set of the morbidity and the polymorphism address corresponding to the morbidity is received from the shared computer 2. Then, in step A17, based on the polymorphism address received in step A16, all of the polymorphism patterns associated with the polymorphism address transmitted in step A11 are affected by shared computer 2. Confirmed whether it was used to acquire the possibility (semantic information).
  • the requester determines whether the shared computer 2 has used all the polymorphism patterns associated with the polymorphism address transmitted in step A l 1 to acquire semantic information, or whether or not the shared computer 2 has used it. You can check. For example, in the shared computer 2, when the polymorphism pattern associated with the polymorphism address transmitted in step A11 is used for a purpose other than the request of the requester or when it is simply collected, Requesters can find use other than the intended purpose. If the shared computer 2 uses or collects the polymorphism pattern associated with the polymorphism address for a purpose other than the original purpose of presenting the requested morbidity, it should be concealed from the requester. In I can't.
  • this system can be a deterrent to illegal use and collection of polymorphism addresses and polymorphism patterns recorded on the genome-related information recording medium 24 in the shared computer 2.
  • step A18 all of the polymorphism patterns associated with the polymorphism address transmitted in step A11 were not used by shared computer 2 to acquire semantic information.
  • the content of the warning is displayed on the display device 22 and a warning is transmitted to the shared computer 2.
  • a warning is sent to shared computer 2 and the third party other than shared computer 2 is notified of the shared computer. It is preferable to disclose information on (2).
  • the third party has a database for storing information from the personal computer 3 and a transmitting and receiving device for transmitting and receiving information to and from the personal computer 3 and the shared computer 2 via the communication network 1.
  • the third party organization there is an organization that monitors compliance with the rules regarding transmission and reception of genome-related information via the communication network 1.
  • the third party organization may be a public organization or a private organization.
  • the third party accumulates information about the shared computer 2 received from the personal computer 3 in a database.
  • a third-party organization may disclose the accumulated information on the shared computer 2 to the general public through the transmission / reception device, or warn about unauthorized use / collection of the polymorphism pattern associated with the polymorphism address May be transmitted to the shared computer 2.
  • a storage medium having only the data I and additionally data III to V, which is obtained by removing the information included in the data II from the genome-related information recording medium may be used.
  • the information contained in the data II is recorded in an external database (genome-related information recording medium) connected to the personal computer 3 via the communication network 1.
  • an error is sent to an external database via the communication network 1.
  • the requester can obtain semantic information as in the flowcharts shown in FIGS.
  • the requester has neither the genome-related information recording medium 24 nor the recording medium except for the information included in the data II from the genome-related information recording medium, and the communication network 1 It may be provided with a genomic-related information recording medium 24 connected to the personal computer 3 via a personal computer.
  • the requester accesses the genome-related information recording medium 24 via the communication network 1 and obtains the “polymorphism address” and “polymorphism pattern” recorded on the genome-related information recording medium 24.
  • the genome-related information recording medium 24 may be a medium in which genome-related information on a plurality of individuals is recorded for each individual (for each “Gno. J”).
  • the present invention is not limited to a configuration in which the shared computer 2 has the main DB 14 as described above.
  • the main DB 14 connected to the shared computer 2 via the communication network 1
  • the shared computer 2 accesses the main DB 14 via the communication network 1 in the flowcharts shown in FIGS.
  • the requester can obtain desired semantic information according to the flowcharts shown in FIGS.
  • the shared computer 2 accesses a plurality of main DBs 14 of different organizations or organizations via the communication network 1 and uses the semantic information included in the plurality of main DBs 14.
  • information can be provided to the requestor. That is, in the information processing system, in step A4 in the flowcharts shown in FIGS. to access.
  • the requester can obtain information on the possibility of colorectal cancer based on the information contained in the various main DBs 14.
  • the shared computer 2 sends at least a personal computer to a so-called agent.
  • the request information received from the third party may be transmitted to obtain the semantic information (in this example, “possibility of colon cancer”) via the agent.
  • the polymorphism pattern may be encrypted or unencrypted.
  • an encrypted polymorphism pattern may be received from among the encrypted polymorphism patterns associated with the polymorphism address, or may be decrypted from among the encrypted polymorphism patterns and then multiplied.
  • the type pattern may be received, or the polymorphic pattern may be received after being encrypted from among the unencrypted polymorphic patterns.
  • an encrypted polymorphism pattern may be acquired and a polymorphism pattern may be transmitted in an encrypted state, or an encrypted polymorphism pattern may be acquired and decrypted before the polymorphism pattern is acquired. May be transmitted, or a non-encrypted polymorphism pattern may be acquired and encrypted before being transmitted.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

個体間における塩基配列情報の相違を有効に利用して各個体にとって有益な意味情報及び/又は当該意味情報に関連する情報を提供でき、且つ安全性の高い情報処理システムを構築する。 物品及び/又はサービスの要求情報を受け取るステップaと、塩基配列における位置を意味する位置情報が記憶されている記憶装置から、前記要求情報に応じた位置情報を取得し、取得した位置情報を送出するステップbと、位置情報に関連付けられた塩基配列関連情報のなかから、前記ステップbで送出した位置情報に対応する塩基配列関連情報を受け取った後、受け取った塩基配列関連情報を意味づける意味情報及び/又は当該意味情報に関連する情報を取得するステップcと、前記ステップcで取得した意味情報及び/又は当該意味情報に関連する情報と、当該意味情報及び/又は当該意味情報に関連する情報に対応する位置情報とを関連付けた状態で、前記ステップbで位置情報を送出した先へ送出するステップdとを有する。

Description

塩基配列関連情報を用レ、た情報処理 技術分野
本発明は、 例えば通信回線網を介して情報を提供する情報処理システムに関す る。 背景技術
現在、 ヒ トを始めとする各種生物のゲノム塩基配列が急速に決定されており、 様々なデータベースにゲノム塩基配列情報が蓄積されている。 例えば、 インター ネット等の情報通信網を介して、 各種研究機関や研究者がデータベースに蓄積さ れたゲノム塩基配列情報を利用できるようなシステムの構築がなされつつある。 同時に、 このようなゲノム塩基配列情報に含まれる塩基配列を用いて、 ゲノム 創薬の研究や遺伝情報の解析等が盛んに行われており、 一塩基多型に代表される ような個体間における塩基配列の相違が注目されている。 一般に、 個体間におけ る塩基配列の相違とは、 所定の塩基の相違が個体種中 1 %以上の頻度で存在する と定義される多型と、 所定の塩基の相違が個体種中 1 %未満であるバリエ一ショ ンとを意味している。 特に、 多型には、 個体間における 1個の塩基の相違である 一塩基多型 (SNP; Single Nucleotide Polymorphism) 、 1から数十塩基 (数千 塩基の場合もある) が欠失又は挿入している挿入/欠失多型、 2から数十塩基を 1単位とする配列の繰り返し回数が相違する VNTR (Variable Number of Tandem Repeat) やマイクロサテライ ト多型 (繰り返し配列が 2〜 4塩基程度のもの) が 知られている。
このような多型は、 個体間におけるタンパク質のアミノ酸配列の相違や、 個体 間における所定の遺伝子に関する発現効率の相違等に影響を及ぼすことがある。 このような影響により、 例えば、 所定の疾病に対する罹患可能性が個体間で異な つたり、 所定の薬剤に対する感受性が個体間で異なることが知られている。 ところが、 多型等の個体間における塩基配列情報の相違を有効に利用して、 各 個体にとって有益な意味情報を提供するようなシステムは構築されていないのが 現状である。 発明の開示
そこで、 本発明は、 このような現状に鑑み、 個体間における塩基配列情報の相 違を有効に利用して各個体にとって有益な意味情報及び/又は当該意味情報に関 連する情報を提供でき、 且つ安全性の高い情報処理システムを構築することを目 的とする。
上述した目的を達成した本発明に係る塩基配列に関する情報処理方法は、 意味 情報及び/又は当該意味情報に関連する情報を提供する側が、 塩基配列関連情報 を提示した側に対して、 意味情報及び/又は当該意味情報に関連する情報と、 当 該意味情報及び/又は当該意味情報に関連する情報に対応する位置情報とを関連 付けた状態で送出するものである。
また、 上述した目的を達成した本発明に係る塩基配列に関する情報処理方法は、 塩基配列関連情報を送出する側が、 送出した塩基配列関連情報を意味づける意味 情報及び/又は当該意味情報に関連する情報と、 当該意味情報及び/又は当該意味 情報に関連する情報に対応する位置情報とを関連付けてた状態で受け取るもので ある。 特に、 本方法では、 受け取った位置情報と、 送出した位置情報とに一致性 があるか否かを判断することが好ましい。 さらに、 本方法においては、 受け取つ た位置情報と送出した位置情報とに一致性がないと判断した場合に、 塩基配列関 連情報を受け取った側に対して警告してもよい。 さらにまた、 本方法においては、 受け取った位置情報と送出した位置情報とに一致性がないと判断した場合に、 塩 基配列関連情報を受け取った側に関する情報を第三者機関に開示してもよい。 なお、 本発明に係る塩基配列に関する情報処理方法は、 制御装置、 送受信装置 及び記憶装置等のハードウエアを備えるコンピュータに、 各ステップを実行させ るプログラムとして実現することができる。 また、 本発明に係る塩基配列に関す る情報処理方法は、 制御装置、 送受信装置及び記憶装置等のハードウェアを備え るコンピュータに、 各ステップを実行させるプログラムを記録した記録媒体とし て実現することもできる。 さらに、 本発明に係る塩基配列に関する情報処理方法 は、 各ステップを実行する制御装置、 送受信装置及び記憶装置等のハードウ ア を備える情報処理装置として実現することもできる。 本明細書は本願の優先権の基礎である日本国特許出願 2 0 0 2 - 2 0 5 5 0 5号 の明細書および/また図面に記載される内容を包含する。 図面の簡単な説明
図 1は、 本発明を適用した情報処理システムの構成を概略的に示す概略構成図 である。
図 2は、 共用コンピュータの構成を概略的に示す概略構成図である。
図 3は、 メイン DBに記録されたデータの一例を示す構成図である。
図 4は、 個人用コンピュータの構成を概略的に示す概略構成図である。
図 5は、 ゲノム関連情報記録媒体に記録されたデータの一例を示す構成図であ る。
図 6は、 所定の疾病に対する罹患可能性を提供するシステムにおいて、 共用コ ンピュータ及ぴ個人用コンピュータでの処理を示すフローチャートである。 図 7は、 図 6の続きであり、 所定の疾病に対する罹患可能性を提供するシステ ムにおいて、 共用コンピュータ及び個人用コンピュータでの処理を示すフローチ ヤートである。 符号の説明
1…通信回線網、 2…共用コンピュータ、 3…個人用コンピュータ 発明を実施するための最良の形態
以下、 図面を参照して本発明を詳細に説明する。
本発明を適用した実施の形態として、 利用者に対して所定の疾病の罹患可能性 を提供する情報処理システムを説明する。 すなわち、 利用者が 「物品及び/又は サービスの要求」 として、 例えば、 所定の疾病に関する自分の罹患可能性を教え て欲しいと要求する場合を例示して説明する。 特に、 本実施の形態においては、 塩基配列関連情報の不正使用 ·収集を認知できる情報処理システムについて説明 するが、 説明の都合上、 簡略化したモデルとして説明する。 なお、 「物品及び/ 又はサービス」 としては、 これに限定されず、 例えば、 個人 (個体) の体質に適 合した医薬品、 食品及び嗜好品等の物品や、 個人 (個体) の体質 ·性質に適合し た情報等のサービスを含む意味である。
情報処理システムは、 図 1に示すように、 インターネット等の通信回線網 1と、 通信回線網 1に接続された共用コンピュータ 2と、 通信回線網 1に接続された複 数の個人用コンピュータ 3とを備え、 通信回線網 1を介して共用コンピュータ 2 と個人用コンピュータ 3との間のデータ通信を可能としている。
共用コンピュータ 2は、 図 2に示すように、 当該共用コンピュータ 2の動作を 全て制御する CPU 4と、 情報及びプログラムの実行指示等を入力できるキーボー ド及びマウス等の入力装置 5と、 ディスプレイ装置等の表示装置 6と、 一時的な 情報及び書き換え不可能な情報等が記録されるメモリー 7と、 各種データを格納 しているデータベース 8と、 これらメモリー 7及びデータベース 8に対して所定 の情報を書き込む記録装置 9と、 通信回線網 1を介して個人用コンピュータ 3と の間で情報の送受信を行う送受信装置 1 7とから構成されている。
共用コンピュータ 2におけるメモリー 7は、 それぞれ異なる種類の情報を記録 するメモリー部 A 1 0及びメモリー部 B 1 1と、 例えば個人用コンピュータ 3や 表示装置 6に表示させる画像データを記録した画面メモリー 1 2と、 本システム を動作させるための処理プログラム 1 3とから構成されている。 なお、 共用コン ピュータ 2においては、 画面メモリー 1 2及び処理プログラム 1 3等を内部のメ モリー 7に有さず、 通信回線網 1を介して共用コンピュータ 2と接続された外部 記憶装置 (図示せず) に有するものであってもよい。
共用コンピュータ 2におけるデータベース 8 (記憶装置) は、 多型番地、 多型 パターン及び意味情報が記録されたメイン DB 1 4と、 メモリー部 A 1 0に記録さ れた情報を保存する保管用 DB - 1 5と、 メモリー部 B 1 1に記録された情報を保 存する保管用 DB-B 1 6とから構成されている。 メイン DB 1 4は、 図 3に示すよう に、 多型番地と、 当該多型番地で取り うる複数の多型パターンと、 当該複数の多 型パターンそれぞれを意味づける意味情報とが関連付けられて記録されている。 また、 メイン DB 1 4には、 複数の多型番地における多型パターンの組合せ (例え ば、 ハプロタイプ) を意味づける意味情報が記録されていても良い。
ここで、 「多型番地 (位置情報) 」 とは、 少なくとも、 塩基配列における多型 が存在する位置を意味する。 なお、 一般的に多型とは、 例えば、 いわゆる SNP(si ngle nucleotide polymorphism)、 RFLP( restrict ion fragment length of polym orphism)、 YNTR( variable number of tandem repeat) ^ マイクロサテライ ト等を 含んでいる。 しかし、 本明細書において使用する 「多型」 は、 これらに限定され ず、 個体種中 1 %未満の頻度でしか存在しない塩基及び塩基配列の変化 (パリェ ーシヨン) も含む意味とする。 したがって、 「多型番地」 は、 個体種中 1 %未満 の頻度でしか存在しない塩基及び塩基配列の変化を示す、 塩基配列における位置 も含む意味である。 すなわち、 「多型番地」 とは、 数値、 文字及び記号等を組み 合わせて、 多型等を示す位置を表すものである。 多型番地は、 特に限定されない 力 例えば、 染色体番号と多型が存在する遺伝子を表す記号と当該遺伝子におけ る多型の存在位置を示す数値との組み合わせにより表記することもできるし、 多 型が存在する遺伝子を示す記号と当該遺伝子における多型の存在位置を示す数値 との組み合わせであってもよい。
また、 多型番地は、 多型毎に付与される多型固有の表記であっても良い。 多型 番地として多型固有の表記を使用する場合、 多型番地は塩基配列中の位置を直接 的には示さないが、 多型固有の表記に基づいて間接的に位置を知ることができる。 したがって、 「多型番地」 は、 多型固有の表記も含む意味である。
「多型パターン (塩基配列関連情報) 」 とは、 個体間において相違する塩基配 列の情報であり、 少なくとも、 多型における塩基又は塩基配列のパターンを含む 意味である。 さらに 「多型パターン」 は、 多型に限らず、 個体種中 1 %未満の頻 度でしか存在しない塩基及び塩基配列のパターンも含む意味である。 例えば、 A 又は Gを取ることが知られている多型番地において、 「多型パターン」 は、 「A」 及び 「G」 のいずれかで表される。
また、 「多型パターン」 は、 相同染色体におけるヘテロ接合体又はホモ接合体 を示すものであってもよい。 この場合、 例えば、 A又は Gを取ることが知られて いる多型番地において、 「多型パターン」 は、 「A A」 、 「G G」 及び 「A G」 のいずれかで表現できる。
さらに、 「多型パターン」 は、 所定の多型番地で取りうるパターンを直接的に 表記するものではなく、 間接的に表記するものであっても良い。 すなわち、 「多 型パターン」 は、 例えば、 A又は Gを取ることが知られている多型番地において 「A」 を取る場合に 「アレル 1」 とし、 「G」 を取る場合に 「アレル 2」 と表記 してもよい。 また、 「多型パターン」 が上述したように 「A A」 、 「G G」 及び 「A G」 のいずれかで表現できる場合、 例えば、 「A A」 で表現できるときに 「ひ」 、 「G G」 で表現できるときに 「 」 、 「A G」 で表現できるときに 「γ」 と表記してもよい。 ところで、 本システムにおいては、 多型パターンは、 暗号化されていても暗号化されていなくても差し支えない。
その他 「多型パターン」 の表記例としては、 多型がマイクロサテライトの場合 には 「繰り返し数」 を表す数値で、 多型が揷入、 欠失型の場合には 「有/無」 を 表す記号で表記してもよい。 また更に、 各多型番地における 「多型パターン」 は、 所定の規制や取り決めに従って、 例えば、 「多型 1」 、 「多型 2」 、 「多型 3」 と表記されても良い。 例えば、 各多型番地において、 「多型パターン」 がとり得 る頻度の高い順に、 「多型 1」 、 「多型 2」 、 「多型 3」 と表記できる。 この場 合、 例えば、 各多型番地におけるそれぞれの 「多型 1」 は必ずしも同じ内容を表 すものではない。 すなわち、 例えば、 ある多型番地の 「多型 1」 は最もとり得る 頻度が高い 「Α Α」 を表し、 別の多型番地 「多型 1」 は最もとり得る頻度が高い 「G G」 を表すことになる。
ここで、 「意味情報」 とは、 「多型パターン」 に関連づけられた情報であり、 例えば、 薬剤に対する応答性、 薬剤に対する副作用、 疾患及び障害に対するリス ク、 体質 ·性質、 体質 ·性質等に基づく生活習慣ァドパイス、 タンパク質相互作 用など、 「多型パターン」 の相違に起因する様々な情報を意味する。 なお、 「意 味情報」 としては、 「多型パターン」 の相違に起因する様々な情報を直接表して も良く、 また、 当該情報を意味する記号などを用いて間接的に表しても良い。 「意味情報」 は、 ゲノム ·遺伝子に関する研究が進むことにより種類が増加する とともに訂正が行われる種類の情報であり、 常にパージョンァップすることが好 ましい。 すなわち、 「意味情報」 は、 ゲノム ·遺伝子の研究成果を用いてデータ ベースを更新することによって、 蓄積量が増加 ·減少してより精度の高いものと なる。
なお、 直接 「多型パターン」 には関連づけられていないが 「意味情報」 から更 に導き出される情報は、 「意味情報に関連する情報」 である。 「意味情報」 が
「疾患に対するリスク」 である場合、 当該リスクがある一定の水準を超えたとき に、 例えば特定の 「健康診断検査項目」 が導き出される。 この特定の 「健康診断 検査項目」 が 「意味情報に関連する情報」 である。
本実施の形態において意味情報は、 図 3に示すように、 少なくとも、 所定の 「多型番地」 及び 「多型パターン」 に関連づけられた 「多型パターンに対する注 釈情報」 としてメイン DB 1 4に記録されている。 また、 意味情報には、 所定の 「多型番地」 に対応する 「多型分類」 及び 「分類 (疾患名) 」 等が関連づけられ ている。 すなわち、 所定の 「多型番地」 が所定の 「多型パターン」 である場合、 疾患名の種類と当該疾患に対する罹患可能性を示す注釈情報 (意味情報) を得る ことができる。 したがって、 例えば、 意味情報は、 複数の多型番地に対応するそ れぞれの多型パターンの組み合わせ (例えば、 ハプロタイプ) に対して関違付け ることもできる。 すなわち、 複数の多型番地における多型パターンの組み合わせ 毎に、 所定の疾患に対する異なる罹患可能性を示す注釈情報 (意味情報) を関連 付けることができる。 この場合、 複数の多型番地が所定の多型パターンの組み合 わせである場合、 所定の疾患に対する罹患可能性を示す注釈情報 (意味情報) を 得ることができる。
また、 意味情報には、 所定の基準で決定した 「公開レベル」 を関連づけること もできる。 例えば、 「公開レベル」 を決定する際の基準としては、 意味情報、 す なわちここでは 「分類 (疾患名) 」 の罹患可能性を公開することによる個人に対 する不測の不利益等を考慮して定めることができる。 詳細には、 共用コンビユー タ 2において、 法律、 規則又は自らの行動基準若しくは利用者との契約等に鑑み て、 公開することが相応しくない意味情報については、 公開しないような 「公開 レベル」 を決定することができる。 この場合、 本システムでは、 公開不可を意味 する 「公開レベル」 に関連付けられた罹患可能性を示す注釈情報については、 利 用者に対して開示することはない。 これにより、 利用者に対して不測の不利益と なりうる意味情報を与えることや、 契約者以外に意味情報が開示されることを防 止できる。
また、 意味情報には、 図 3に示すように、 意味情報の情報源に関する情報が
「情報ソース」 として関連付けられている。 この 「情報ソース」 は、 意味情報を 作成した機関や意味情報を共用コンピュータ 2に対して提供した機関といった、 意味情報の出所を示している。 意味情報に 「情報ソース」 を関連付けることによ り、 意味情報の信憑性等を判断することができる。 なお、 データベース 8において、 保管用 DB- B 1 6には、 例えば、 本システムを 利用する要求者個人の遺伝情報である塩基配列関連情報といつたデータを記録す ることができる。 また、 保管用 DB- A 1 5には、 例えば、 本システムを利用する要 求者を特定する情報といったデータを記録することができる。 このように、 保管 用 DB - A 1 5及び保管用 DB-B 1 6に、 個人の遺伝情報と個人を特定する情報とを分 けて記録することによって、 要求者の遺伝情報と、 要求者を特定するデータとを 関連付け難くなる。
なお、 共用コンピュータ 2は、 データベース 8を内部に有するものに限定され ず、 通信回線網 1を介して共用コンピュータ 2に接続された外部データベース (図示せず) を有するものであってもよい。 また、 共用コンピュータ 2は、 内部 に複数のデータベース 8を有するものであってもよいし、 内部のデータベース 8 と通信回線網 1を介して共用コンピュータ 2に接続された外部データベースとを 有するものであっても良い。
個人用コンピュータ 3は、 図 4に示すように、 当該個人用コンピュータ 3の動 作を全て制御する CPU 2 0と、 情報及びプログラムの実行指示等を入力できるキ 一ボード及びマウス等の入力装置 2 1と、 ディスプレイ装置等の表示装置 2 2と、 一時的な情報及び書き換え可能な情報等が記録されるメモリー 2 3と、 ゲノム関 連情報記録媒体 2 4からデータを読み取る読取り装置 2 5と、 通信回線網 1を介 して共用コンピュータ 2との間で情報の送受信を行う送受信装置 2 9とから構成 されている。 なお、 個人用コンピュータ 3は、 通常のコンピュータに限定されず、 例えば、 携帯電話、 個人携帯端末及びその他の移動体通信機器等、 いかなる形態 であってもよレヽ。
個人用コンピュータ 3におけるメモリー 2 3は、 ゲノム関連情報記録媒体 2 4 からの情報等を記録するメモリー部 2 6を有し、 本情報処理システムを動作させ る処理プログラム 2 7が記録されている。
ゲノム関連情報記録媒体 2 4には、 個人のゲノム関連情報 2 8が記録されてい る。 ゲノム関連情報記録媒体 2 4としては、 例えば、 磁気ディスクや磁気カード 等の磁気記録媒体、 光磁気記録方式や相変化記録方式等を適用した光学式記録媒 体、 半導体メモリー等を挙げることができる。 また、 このゲノム関連情報記録媒 体 2 4は、 カード状、 ディスク状、 スティック状、 テープ状又はドラム状等いか なる形態であってもよい。 さらに、 このゲノム関連情報記録媒体 2 4は、 単一の 個人 (個体) のゲノム関連情報 2 8を記録したものであってもよいが、 複数の個 人 (個体) に関する複数のゲノム関連情報 2 8を記録したものであってもよい。 ゲノム関連情報記録媒体 2 4に含まれるゲノム関連情報 2 8とは、 少なくとも、 「多型番地」 及び個人 (個体) の塩基配列を解析した結果として得られる所定の 多型番地における 「多型パターン」 を意味する。 また、 ゲノム関連情報 2 8には、 既往症、 特徴、 カルテ情報、 健康診断結果といった各種情報を含んでいてもよレ、。 ゲノム関連情報記録媒体 2 4には、 ゲノム関連情報 2 8として、 例えば、 図 5 に示すように、 データ Iとしてゲノム関連情報 2 8に固有の個別番号 「Gno. J (ジーナンバー) 及び生年月日等の個人情報を記録し、 データ I Iとして多型番地 及び多型パターンを記録し、 データ I I Iとして既往症を記録し、 データ IVとして 特徴を記録し、 データ Vとしてカルテ情報等を記録する。 すなわち、 ゲノム関連 情報 2 8は、 データ I、 データ II、 データ I II、 データ IV及びデータ Vから構成さ れている。 データ I及びデータ I Iには必須の情報が含まれており、 データ I I I、 デ ータ IV及びデータ Vには付加的な情報から構成されている。
ゲノム関連情報 2 8においては、 塩基配列上の位置に対応する 「多型番地」 と、 当該多型番地における 「多型パターン」 とをリンクさせて記録している。 また、 データ I Iには、 所定の多型番地における付加的な情報を 「コメント」 として、 「多型番地」 にリンクさせて記録していてもよい。 なお、 データ I Iには、 所定の 個体に関する全塩基配列を記録しても良い。 データ IIに全塩基配列を記録した場 合であっても、 データ I I内に 「多型番地」 及び 「多型パターン」 が含まれること となる。
なお、 本発明において、 個人用コンピュータ 3及びゲノム関連情報記録媒体 2
4は、 それぞれ図 4及び図 5に示したような構成に限定されず、 例えば、 ゲノム 関連情報記録媒体が処理プログラムを有するメモリー部を備え、 個人用コンビュ ータが当該ゲノム関連情報記録媒体を装着して処理プログラムを動作させるよう な構成であってもよい。 この場合、 個人用コンピュータは、 ゲノム関連情報記録 媒体のメモリー部に記録された処理プログラムに従って動作できる。
以上のように構成された情報処理システムにおいては、 共用コンピュータ 2の メモリー 7に記録された処理プログラム 1 3及び個人用コンピュータ 3のメモリ 一 2 3に記録された処理プログラム 2 7が例えば、 図 6及び図 7に示すようなフ ローチャートに従って情報処理動作する。 なお、 図 6及び図 7に示すフローチヤ ートにおいて、 「 (共) 」 と記載したステップは共用コンピュータ 2における処 理を意味し、 「 (個) 」 と記載したステップは個人用コンピュータ 3における処 理を意味している。
本情報処理システムは、 ゲノム関連情報記録媒体 2 4を所持する各個人が個人 用コンピュータ 3を用いて通信回線網 1を介して共用コンピュータ 2にアクセス し、 共用コンピュータ 2のメイン DB 1 4に記録されている意味情報を利用するシ ステムである。 なお、 本情報処理システムは、 複数人のゲノム関連情報 2 8がそ れぞれ記録されたゲノム関連情報記録媒体 2 4を用い、 各個人がゲノム関連情報 記録媒体 2 4にアクセスするようなシステムであってもよい。
本システムを利用する個人は、 例えばゲノム関連情報記録媒体 2 4を保有する 者である。 本システムを利用する個人 (以下、 要求者と称する) は、 先ず、 ステ ップ A l (SA1) で、 メモリー 2 3に記録されている処理プログラム 2 7を起動し、 個人用コンピュータ 3の読取り装置 2 5を駆動してゲノム関連情報記録媒体 2 4 にアクセスし、 ゲノム関連情報記録媒体 2 4においてデータ Iとして記録され ている 「Gno.」 を読み出す。 読み出した 「Gno.」 は、 メモリ一部 2 6に格納する。 次に、 ステップ A 2 (SA2) では、 処理プログラム 2 7によって表示装置 2 2に 表示された画面イメージに基づいて、 要求者が提供を受けたい情報、 例えば、 「大腸がんの罹患可能性」 (要求情報) を個人用コンピュータ 3に入力するとと もに、 個人用コンピュータ 3から通信回線網 1を経由して共用コンピュータ 2に
「大腸がんの罹患可能性」 及び 「Gno.」 を送信する。 或いは、 個人用コンビユー タ 3から通信回線網 1を経由して共用コンピュータ 2に対して、 「大腸がんの罹 患可能性」 及び 「Gno.」 を書き込む。
次に、 ステップ A 3 (SA3) では、 共用コンピュータ 2が 「大腸がんの罹患可能 性」 及び 「Gno.」 を受信する。 受信した 「大腸がんの罹患可能性」 及び 「Gno.」 は、 メモリー部 A 1 0に要求情報として格納する。
次に、 ステップ A 4 (SA4) では、 要求情報を受信すると、 メモリー 7に記録さ れている処理プログラム 1 3を起動してメイン DB14にアクセスする。 なお、 この 処理プログラム 1 3は、 共用コンピュータ 2における処理を行うものである。 次に、 ステップ A 5 (SA5) では、 処理プログラム 1 3に従って、 メイン DB14に 記録されている 「分類 (疾患名) 」 を検索し、 要求された 「大腸がんの罹患可能 性」 (大腸がん) と一致するものを抽出する。
ステップ A 6 (SA6) では、 メイン DB14に記録されているデータのなかから 「大 腸がんの罹患可能性」 と一致した 「分類 (疾患名) 」 (大腸がん) に関連づけら れた 「多型番地」 を読み出す。 読み出した 「多型番地」 は、 メモリー部 A 1 0に 要求情報に関連づけた位置情報として格納する。 すなわち、 メモリー部 A 1 0に は、 所定の 「Gno.」 に対して 「大腸がんの罹患可能性」 及び 「多型番地」 が記録 されることとなる。
次に、 ステップ A 7 (SA7) では、 メモリー部 A 1 0に記録されている 「Gno.」 及び 「多型番地」 を個人用コンピュータ 3に送信するとともに、 送信する 「多型 番地」 に対応する 「多型パタ一ン」 を提出する命令情報を個人用コンピュータ 3 に送信する。 また、 このとき、 要求情報の種類によっては、 必要に応じて既往症 や特徴等の付加的な情報の提出を命令してもよい。
次に、 ステップ A 8 (SA8) では、 共用コンピュータ 2から送信された 「Gno.」 、 「多型番地」 及び命令情報を受信する。 受信した 「Gno.」 及び 「多型番地」 は、 メモリ一部 2 6に記録される。
次に、 ステップ A 9 (SA9) では、 受信した命令情報に従って、 ゲノム関連情報 記録媒体 2 4に記録されているデータ I Iにアクセスする。 ステップ A 1 0 (SA1 0) では、 処理プログラム 2 7に従ってゲノム関連情報記録媒体 2 4に記録され ているデータ I Iを検索し、 命令された多型番地の多型パターンを読み出し、 多型 番地と多型パターンとを関連づけてメモリー部 2 6に記録する。 このとき、 デー タ Iに対してアクセスし、 ステップ A 8で受信した 「Gno.」 が正しいか否かを確認 することが好ましい。 また、 ステップ A 1 0では、 多型パターンのほかにデータ I I I、 データ IV及びデータ Vに記録されている付加的な情報も同時に読み出し、 必 要に応じてメモリー部 2 6に記録してもよい。
次に、 ステップ A l l (SA11) では、 メモリー部 2 6に一時的に記録した多型 番地に関連付けられた多型パターン及び必要に応じて記録された付加的な情報を、 「Gno.」 とともに通信回線網 1を介して共用コンピュータ 2に対して出力する。 ステップ A 1 2 (SA12) では、 多型番地に関連付けられた多型パターン及び必要 に応じて記録された付加的な情報を共用コンピュータ 2で受信し、 受信した多型 パターンを多型番地と関連付けてメモリー部 A 1 0に記録する。
また、 本例では、 ステップ A 7において、 共用コンピュータ 2が 「多型パター ン」 の提出を命令する命令情報を送出し、 ステップ A 1 0において、 個人用コン ピュータ 3は命令情報に従つて多型パターンをゲノム関連情報記録媒体 2 4から 読み出している。 しかしながら、 本システムは、 ステップ A 7において当該命令 情報を送出しないシステムであってもよい。 この場合、 ステップ A 1 0において、 個人用コンピュータ 3は、 処理プログラム 2 7に従って、 ステップ A 8で受信し た多型番地に基づいてデータ Πを検索し、 受信した多型番地の多型パターンを読 み出す。 そして、 個人用コンピュータ 3は、 ステップ A l 1で多型パターン等を 共用コンピュータ 2に対して出力する。 この場合でも、 共用コンピュータ 2は、 ステップ A 1 2において、 「大腸がんの罹患可能性」 と一致した 「分類 (疾患 名) 」 に関連づけられた 「多型番地」 の多型パターンを得ることができる。
次に、 ステップ A 1 3 (SA13) では、 メイン DB 1 4にアクセスし、 受信した多 型番地及び多型パターンと一致するものを検索する。 具体的には、 メイン DB 1 4 において、 一つの多型番地に対して複数の多型パターンが記録されており、 受信 した多型番地及びその多型パターンがメイン DB 1 4においてどの多型パターンに 一致しているのかを検索する。
次に、 ステップ A 1 4 (SA14) では、 処理プログラム 1 3に従って、 受信した 多型パターンと一致した多型パターンに関連づけられている大腸がんに対する罹 患可能性 (意味情報) を読み出す。 すなわち、 ステップ A 1 4では、 要求者が提 出した多型番地及び多型パターンに従って、 要求者の大腸がんに対する罹患可能 性を読み出すことができる。 読み出した罹患可能性は、 要求者の 「Gno.」 と 「多 型番地」 及び 「多型パターン」 とに関連づけてメモリー部 A 1 0に格納する。 こ のとき、 大腸がんに対する罹患可能性を、 付加的な情報により捕正したかたちで 格納してもよいし、 付加的な情報から得られるその他の情報を要求者の 「Gno.」 に関連づけて格納しても良い。
次に、 ステップ A 1 5 (SA15) では、 メモリー部 A 1 0に格納した、 罹患可能 性と当該罹患可能性をメイン DB 1 4から読み出す際に利用した多型番地とをそれ ぞれ関連付けて、 通信回線網 1を介して個人用コンピュータ 3に対して要求者の 「Gno.」 とともに送信する。 すなわち、 ステップ A 1 5では、 ステップ A 1 4にお いて読み出した罹患可能性と、 その罹患可能性に対応する多型番地とをリンクさ せてセットで送信する。 なお、 ステップ A 1 5では、 「Gno.」 と、 罹患可能性及 び当該罹患可能性に対応する多型番地のセットとに加えて、 メイン DB 1 4に記録 されている 「情報ソース」 を罹患可能性及び当該罹患可能性に対応する多型番地 のセットに関連付けて送信してもよい。 情報ソースを送信することによって、 要 求者側は、 罹患可能性の信憑性を、 情報ソースと罹患可能性に対応する多型番地 と当該多型番地に対応する多型パターンとに基づいて評価することができる。 す なわち、 要求者側では、 受信した情報ソースと罹患可能性及び当該罹患可能性に 対応する多型番地のセットとに加え、 下記のステップ A 1 9においてステップ A 1 1で自ら送信した多型パターンを、 それぞれ関連付けて個人用コンピュータ 3の 表示装置 2 2上や紙にて出力すること等により、 要求者は当該情報ソースに記載 された機関が当該多型番地に関連付けられた多型パターンを使って当該罹患可能 性に関する情報を用意したことを知るため、 当該罹患可能性に関する情報の信頼 性を評価できる。 また、 情報を提供する側では、 要求者側が信頼性を評価するた め、 責任を持ったサービスを提供することになる。 また、 要求者が予め自らが提 供する多型番地に関連付けられた多型パターンをィンフォームドコンセントを通 して確認している場合には、 当該ィンフォームドコンセント確認情報と出力した 情報とが一致しているか否かも目視で確認できる。
次に、 ステップ A 1 6 (SA16) では、 個人用コンピュータ 3が要求者の 「Gn o. J と、 罹患可能 I"生及び当該罹患可能性に対応する多型番地のセットとを受信す る。 受信した罹患可能性及び当該罹患可能性に対応する多型番地のセットは、 メ モリー部 2 6に記録される。
次に、 ステップ A 1 7 (SA17) では、 ステップ A l 1で共用コンピュータ 2に対 して送信した多型パターンに関連付けられた多型番地と、 ステップ A 1 6で受信 した罹患可能性及び当該罹患可能性に対応する多型番地のセットに含まれる多型 番地 (以下、 「ステップ A 1 6で受信した多型番地」 と称する。 ) とが一致して いるか否かを判定する。 ステップ A 1 7では、 ステップ A l 1で送信した多型番地 とステップ A 1 6で受信した多型番地とが完全に一致する場合 「yes」 と判断し、 ステップ A 1 1で送信した多型番地とステップ A 1 6で受信した多型番地とがー致 しない場合 「noj と判断する。 なお、 ステップ A l 1で送信した多型番地とステ ップ A 1 6で受信した多型番地とがー致しない場合とは、 例えば、 ステップ A 1 1 で送信した多型番地が複数あるときに、 少なくとも 1以上の多型番地が一致しな い場合も含む意味である。 ここで、 「一致」 とは、 多型番地の表記上の一致、 及 び多型番地の実質的な一致を含む意味である。 多型番地の表記上の一致とは、 塩 基配列上の所定の位置に関する表記が同一である場合を意味する。 また、 多型番 地の実質的な一致とは、 例えば、 表記上は一致していなくても、 塩基配列におけ る同じ位置を直接又は間接に示している場合を意味する。
ステップ A 1 7において、 「no」 と判断した場合にはステップ A l 8 (SA18) に 進み、 「yes」 と判断した場合にはステップ A l 9 (SA19) に進む。 ステップ A 1 8では、 ステップ A 1 7においてステップ A l 1で送信した多型番地に関連付けら れた多型パターンの全てが共用コンピュータ 2で罹患可能性 (意味情報) を取得 するために使用された訳ではないことが判明したため、 その旨の警告内容を表示 装置 2 2に表示するとともに、 その旨の警告を共用コンピュータ 2に対して送信 する。 なお、 ステップ A 1 8の後、 後述するステップ A 1 9に進み、 処理を続行す る。 ここで 「警告」 とは、 不正使用 '収集の蓋然性が高いとの判断に基づく戒め、 送信した多型パターンの全てが使用された訳ではないことの通知、 或いは、 送信 した多型パターンの全てが使用された訳ではないことを第三者に対して通知する 旨の告知等を含む意味である。
一方、 ステップ A 1 9では、 処理プログラム 2 7に従って、 メモリ一部 2 6に 記録された意味情報から大腸がんに対する罹患可能性を表示装置 2 2に表示する。 これにより、 要求者は、 ゲノム関連情報記録媒体 2 4に記録したゲノム関連情報 2 8を用いて大腸がんに対する罹患可能性を得ることができる。 ステップ A 1 7において 「yes」 と判断した場合には、 ステップ A l 1で送信した多型番地に関 連付けられた多型パターンの全てが共用コンピュータ 2で罹患可能性 (意味情 報) を取得するために使用されことが判明したため、 ステップ A 1 7に続いてス テツプ A 1 9を実行する。
なお、 ステップ A 1 4で読み出された 「意味情報」 から、 更に、 当該 「意味情 報に関連する情報」 が導き出され、 ステップ A 1 5で 「意味情報」 とともに当該 「意味情報に関連する情報」 を多型番地と関連付けて送信し、 ステップ A 1 6で それらを受信した場合においても、 ステップ A 1 7以降は同様に行われ、 ステツ プ A 1 9で 「意味情報」 と当該 「意味情報に関連する情報」 が表示される。
また、 本システムにおいては、 ステップ A 3において、 要求者が所望する 「大 腸がんの罹患可能性」 の他'に、 例えば、 罹患可能性が所定の水準を超えた場合に 「大腸がんを予防する機能性食品」 の提供を更なる要求情報として受信し、 要求 者の大腸がんの罹患可能性に関する情報とともに、 罹患可能性が所定の水準を超 えていた場合に、 要求された機能性食品を提供することも可能である。
なお、 共用コンピュータ 2におけるステップ A 3〜A 7及びステップ A 1 2まで と、 ステップ A l 2〜A 1 5までとを異なる機関で行ってもよい。 この場合には、 共用コンピュータ 2におけるステップが 2分割されていることになる。
以上のように、 本システムにおいては、 個人の多型パターンを多型番地と関連 づけて記録したゲノム関連情報記録媒体 2 4を用いることによって、 メイン DB14 に記録された意味情報を多型番地を介在させて個人が利用することができる。 言 い換えれば、 本システムを利用する個人は、 意味情報をゲノム関連情報記録媒体 に記録しておく必要はなく、 多型番地と多型パターンとを関連づけたゲノム関連 情報 2 8を所有するだけで、 様々な意味情報を得ることができる。
特に、 本システムにおいては、 ステップ A 1 6で、 共用コンピュータ 2から罹 患可能性と当該罹患可能性に対応する多型番地とのセットを受信している。 そし て、 ステップ A 1 7において、 ステップ A 1 6で受信した多型番地に基づいて、 ス テツプ A l 1で送信した多型番地に関連付けられた多型パターンの全てが共用コ ンピュータ 2で罹患可能性 (意味情報) を取得するために使用されたか否かを確 認している。
すなわち、 要求者は、 ステップ A l 1で送信した多型番地に関連付けられた多 型パターンの全てを共用コンピュータ 2が意味情報を取得するために使用したの 力、 或いは、 使用していないのかを確認することができる。 例えば、 共用コンビ ュ一タ 2において、 ステップ A 1 1で送信した多型番地に関連付けられた多型パ ターンを要求者の要求以外の目的に使用した場合及び単に収集した場合等その本 来の目的以外の使用を要求者が見出すことができる。 共用コンピュータ 2は、 要 求された罹患可能性を提示するという本来の目的以外の目的で多型番地に関連付 けられた多型パターンを使用、 収集した場合、 要求者に対して隠蔽することがで きない。
したがって、 本システムは、 共用コンピュータ 2におけるゲノム関連情報記録 媒体 2 4に記録された多型番地及び多型パターンの不正使用 ·収集に対する抑止 力となりうる。
ところで、 本システムでは、 ステップ A 1 8において、 ステップ A 1 1で送信し た多型番地に関連付けられた多型パターンの全てが共用コンピュータ 2で意味情 報を取得するために使用されていなかったことの警告内容を表示装置 2 2に表示 するとともに、 警告を共用コンピュータ 2に対して送信している。 しかしながら、 本システムにおいては、 ステップ A 1 7で 「no」 と判断した場合、 共用コンビ ユータ 2に対して警告を送信するとともに、 共用コンピュータ 2以外の第三者機 関に対して、 当該共用コンピュータ 2に関する情報を開示することが好ましい。 第三者機関は、 個人用コンピュータ 3からの情報を蓄積するデータベースと、 通信回線網 1を介して個人用コンピュータ 3や共用コンピュータ 2との間で情報 の送受信を行う送受信装置とを備える。 第三者機関としては、 通信回線網 1を介 したゲノム関連情報の送受信に関する規則遵守を監視する機関を挙げることがで きる。 第≡者機関としては、 公的な機関であっても私的機関であってもよい。 第三者機関は、 個人用コンピュータ 3から受信した共用コンピュータ 2に関す る情報をデータベースに蓄積する。 また、 第三者機関は、 蓄積した共用コンビュ ータ 2に関する情報を、 送受信装置で一般に対して開示してもよいし、 多型番地 に関連付けられた多型パターンの不正使用 ·収集等に関する警告を共用コンビュ ータ 2に対して送信してもよい。
このように、 第三者機関を有する情報処理システムにおいては、 多型番地に関 連付けられた多型パターンの共用コンピュータ 2における不正使用 ·収集をより 効果的に抑制することができる。
なお、 本情報処理システムにおいては、 ゲノム関連情報記録媒体からデータ I I に含まれる情報を除いたもの、 すなわちデータ I及び付加的にデータ I I I〜Vのみ を有する記憶媒体を用いても良い。 この場合、 データ I Iに含まれる情報は、 通信 回線網 1を介して個人用コンピュータ 3と接続された外部のデータベース (ゲノ ム関連情報記録媒体) に記録しておく。 このようなシステムの場合、 例えば、 上 述したステップ A 1 0において、 通信回線網 1を介して外部のデータベースにァ クセスし、 命令された多型番地の多型パターンを読み出し、 多型番地と多型パタ
—ンとを関連づけてメモリー部 2 6に記録することができる。 したがって、 この ようなシステムであっても、 図 6及び図 7に示したフローチャートと同様に、 要 求者は意味情報を得ることができる。
さらに、 本情報処理システムにおいては、 要求者がゲノム関連情報記録媒体 2 4及び前記ゲノム関連情報記録媒体からデータ IIに含まれる情報を除いた記録媒 体のいずれも有さず、 通信回線網 1を介して個人用コンピュータ 3と接続したゲ ノム関連情報記録媒体 2 4を備えるものであっても良い。 このようなシステムの 場合、 要求者は、 通信回線網 1を介してゲノム関連情報記録媒体 2 4にアクセス し、 ゲノム関連情報記録媒体 2 4に記録された 「多型番地」 及び 「多型パター ン」 等の情報を個人用コンピュータ 3にダウンロードできる。 なお、 この場合、 ゲノム関連情報記録媒体 2 4は、 複数の個人に関するゲノム関連情報を個人毎 ( 「Gno. J 毎) に記録したものであっても良い。
さらにまた、 本発明は、 上述したような共用コンピュータ 2がメイン DB 1 4を 有するような構成に限定されず、 例えば、 共用コンピュータ 2と通信回線網 1を 介して接続されたメイン DB 1 4を備える情報処理システムにも適用される。 この 場合、 共用コンピュータ 2は、 図 6及び図 7に示したフローチャートにおいて、 メイン DB 1 4に対して通信回線網 1を介してアクセスする。 この場合でも、 本情 報処理システムによれば、 図 6及び図 7に示したフローチャートに従って要求者 が所望の意味情報を得ることができる。
特に、 この場合、 共用コンピュータ 2は、 異なる機関又は団体が有する複数の メイン DB 1 4に対して通信回線網 1を介してアクセスし、 これら複数のメイン DB 1 4に含まれる意味情報を使用して、 要求者に対する情報提供を行うことが可能 となる。 すなわち、 本情報処理システムにおいては、 図 6及び図 7に示したフロ 一チャートにおけるステップ A 4で共用コンピュータ 2が大腸がんの罹患可能性 に関する情報を意味情報として有する様々なメイン DB 1 4にアクセスする。 これ により、 本情報処理システムによれば、 要求者は、 様々なメイン DB 1 4に含まれ る情報に基づいて、 大腸がんの罹患可能性に関する情報を得ることができる。 また、 本システムは、 図 6及び図 7に示したフローチャートにおいて、 共用コ ンピュータ 2が、 いわゆるエージェントに対して、 少なくとも個人用コンビユー タ 3から受け取った要求情報を送信し、 意味情報 (本例においては、 「大腸がん に関する罹患可能性」 ) を、 当該エージェントを介して得るものであってもよい。 なお、 本システムにおいて、 多型パターンは、 暗号化されていても暗号化され ていなくても差し支えない。
例えば、 多型番地に関連付けられた暗号化された多型パターンのなかから暗号 化された多型パターンを受け取っても良いし、 暗号化された多型パターンのなか から復号化されたうえで多型パターンを受け取っても良いし、 暗号化されていな い多型パターンのなかから暗号化されたうえで多型パターンを受け取っても良い。 また例えば、 暗号化された多型パターンを取得し暗号化された状態で多型パタ ーンを送出しても良いし、 暗号化された多型パターンを取得し復号化したうえで 多型パターンを送出しても良いし、 暗号化されていない多型パターンを取得し暗 号化したうえで多型パターンを送出しても良い。
本明細書で引用した全ての刊行物、 特許および特許出願をそのまま参考として本 明細書にとり入れるものとする。 産業上の利用の可能性
以上、 詳細に説明したように、 本発明によれば、 個体間における塩基配列情報 の相違を有効に利用して各個体にとって有益な意味情報及び/又は当該意味情報 に関連する情報を提供でき、 且つ安全性の高い情報処理システムを構築すること ができる。

Claims

請求の範囲
1 . 物品及び/又はサービスの要求情報を受け取るステップ aと、
塩基配列における位置を意味する位置情報が記憶されている記憶装置から、 前 記要求情報に応じた位置情報を取得し、 取得した位置情報を送出するステップ b と、
位置情報に関連付けられた塩基配列関連情報のなかから、 前記ステツプ bで送 出した位置情報に対応する塩基配列関違情報を受け取った後、 受け取った塩基配 列関連情報を意味づける意味情報及び/又は当該意味情報に関連する情報を取得 するステップ cと、
前記ステップ cで取得した意味情報及び/又は当該意味情報に関連する情報と、 当該意味情報及び/又は当該意味情報に関連する情報に対応する位置情報とを関 連付けた状態で、 前記ステップ bで位置情報を送出した先へ送出するステップ d と
を有する塩基配列に関する情報処理方法。
2 . 物品及び/又はサービスの要求情報に応じた、 塩基配列における位置を 意味する位置情報に関連付けられた塩基配列関連情報を受け取るステツプ aと、 ステップ aで受け取つた塩基配列関連情報を意味づける意味情報及び/又は当 該意味情報に関連する情報を取得するステップ bと、
前記ステップ bで取得した意味情報及び/又は当該意味情報に関連する情報と、 当該意味情報及び/又は当該意味情報に関連する情報に対応する位置情報とを関 連付けた状態で、 前記ステップ aで塩基配列関連情報を出した側、 前記要求情報 を出した側及び前記意味情報及び/又は当該意味情報に関連する情報を利用する 側からなる群から選ばれる少なくとも 1つに対して送出するステップ cと
を有する塩基配列に関する情報処理方法。
3 . 物品及び Z又はサービスの要求に応じた、 塩基配列における位置を意味 する位置情報を受け取るステップ aと、
位置情報に関連付けらた塩基配列関連情報のなかから、 前記ステツプ aで受け 取った位置情報に対応する位置情報に関連付けられた塩基配列関連情報を取得す るステップ b と、 前記ステツプ bで取得した塩基配列関連情報を送出するステツプ cと、 前記ステップ cで送出した塩基配列関連情報を意味づける意味情報及び/又は 当該意味情報に関連する情報と、 当該意味情報及び Z又は当該意味情報に関連す る情報に対応する位置情報とを関連付けた状態で受け取るステップ dと
を有する塩基配列に関する情報処理方法。
4 . 前記ステップ dで受け取った位置情報と、 前記ステップ cで送出した塩 基配列関連情報に関連付けられた位置情報とに一致性があるか否かを判断するス テップ eを更に有することを特徴とする請求項 3記載の情報処理方法。
5 . 前記ステップ eで、 前記ステップ dで受け取った位置情報と、 前記ステ ップ cで送出した塩基配列関連情報に関連付けられた位置情報とに一致性がない と判断した場合に、 前記ステップ cで送出した塩基配列関連情報を受け取った側 に対して警告することを特徴とする請求項 4記載の情報処理方法。
6 . 前記ステップ eで、 前記ステップ dで受け取った位置情報と、 前記ステ ップ cで送出した塩基配列関連情報に関連付けられた位置情報とに一致性がない と判断した場合に、 前記ステップ cで送出した塩基配列関連情報を受け取った側 に関する情報を、 第三者機関に開示することを特徴とする請求項 4記載の情報処 理方法。
PCT/JP2003/008971 2002-07-15 2003-07-15 塩基配列関連情報を用いた情報処理システム WO2004008361A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
AU2003281108A AU2003281108A1 (en) 2002-07-15 2003-07-15 Information processing system using base sequence relevant information
US10/521,351 US7747394B2 (en) 2002-07-15 2003-07-15 Information processing system using base sequence relevant information
EP03741402A EP1553512A4 (en) 2002-07-15 2003-07-15 INFORMATION PROCESSING SYSTEM USING INFORMATION RELATING TO BASIC SEQUENCES
CA002492658A CA2492658A1 (en) 2002-07-15 2003-07-15 Information processing system using base sequence relevant information
US12/785,188 US8364416B2 (en) 2002-07-15 2010-05-21 Information processing system using base sequence relevant information

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002-205505 2002-07-15
JP2002205505A JP3677258B2 (ja) 2002-07-15 2002-07-15 塩基配列関連情報を用いた情報処理システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US12/785,188 Continuation US8364416B2 (en) 2002-07-15 2010-05-21 Information processing system using base sequence relevant information

Publications (1)

Publication Number Publication Date
WO2004008361A1 true WO2004008361A1 (ja) 2004-01-22

Family

ID=30112767

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/008971 WO2004008361A1 (ja) 2002-07-15 2003-07-15 塩基配列関連情報を用いた情報処理システム

Country Status (7)

Country Link
US (2) US7747394B2 (ja)
EP (1) EP1553512A4 (ja)
JP (1) JP3677258B2 (ja)
AU (1) AU2003281108A1 (ja)
CA (1) CA2492658A1 (ja)
TW (1) TWI289264B (ja)
WO (1) WO2004008361A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2387277C (en) * 2001-05-25 2015-03-03 Hitachi, Ltd. Information processing system using nucleotide sequence-related information

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000067139A (ja) * 1998-08-25 2000-03-03 Hitachi Ltd 電子カルテシステム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5985559A (en) 1997-04-30 1999-11-16 Health Hero Network System and method for preventing, diagnosing, and treating genetic and pathogen-caused disease
US5479513A (en) 1994-11-18 1995-12-26 Martin Marietta Energy Systems, Inc. Fast and secure encryption-decryption method based on chaotic dynamics
US5917913A (en) 1996-12-04 1999-06-29 Wang; Ynjiun Paul Portable electronic authorization devices and methods therefor
US5970500A (en) 1996-12-12 1999-10-19 Incyte Pharmaceuticals, Inc. Database and system for determining, storing and displaying gene locus information
US6537747B1 (en) 1998-02-03 2003-03-25 Lucent Technologies Inc. Data transmission using DNA oligomers
US6304262B1 (en) * 1998-07-21 2001-10-16 Raytheon Company Information security analysis system
EP1208421A4 (en) * 1999-06-25 2004-10-20 Genaissance Pharmaceuticals PROCESS FOR MAINTAINING AND USING HAPLOTYPE DATA
AU1367201A (en) 1999-10-01 2001-05-10 Orchid Biosciences, Inc. Method and system for providing genotype clinical information over a computer network
CA2387780C (en) 1999-10-15 2011-10-11 W. Jean Dodds Animal health diagnosis
GB2363874B (en) * 1999-11-06 2004-08-04 Dennis Sunga Fernandez Bioinformatic transaction scheme
EP1250676A2 (en) 1999-12-22 2002-10-23 Neurografix System, method and article of manufacture for managing a medical services network
US20030208454A1 (en) 2000-03-16 2003-11-06 Rienhoff Hugh Y. Method and system for populating a database for further medical characterization
US6874085B1 (en) 2000-05-15 2005-03-29 Imedica Corp. Medical records data security system
US20020010552A1 (en) 2000-05-26 2002-01-24 Hugh Rienhoff System for genetically characterizing an individual for evaluation using genetic and phenotypic variation over a wide area network
US6300872B1 (en) * 2000-06-20 2001-10-09 Philips Electronics North America Corp. Object proximity/security adaptive event detection
WO2002017190A1 (en) 2000-08-22 2002-02-28 Varro Technologies, Inc. Method and system for sharing biological information
JPWO2002025519A1 (ja) * 2000-09-20 2004-01-29 株式会社東芝 遺伝子による診療情報提供方法、診療情報提供端末及び診療情報受給端末
WO2002025528A1 (en) 2000-09-21 2002-03-28 Theradoc.Com, Inc. Systems and methods for manipulating medical data via a decision support system
US6931604B2 (en) * 2000-12-18 2005-08-16 Derek Graham Lane Method of navigating a collection of interconnected nodes

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000067139A (ja) * 1998-08-25 2000-03-03 Hitachi Ltd 電子カルテシステム

Also Published As

Publication number Publication date
US20100292975A1 (en) 2010-11-18
TWI289264B (en) 2007-11-01
TW200401218A (en) 2004-01-16
JP3677258B2 (ja) 2005-07-27
EP1553512A1 (en) 2005-07-13
US20060147917A1 (en) 2006-07-06
AU2003281108A1 (en) 2004-02-02
CA2492658A1 (en) 2004-01-22
EP1553512A4 (en) 2006-06-28
US7747394B2 (en) 2010-06-29
US8364416B2 (en) 2013-01-29
JP2004046696A (ja) 2004-02-12

Similar Documents

Publication Publication Date Title
TWI363309B (en) Genetic analysis systems, methods and on-line portal
Madera et al. The SUPERFAMILY database in 2004: additions and improvements
US8571810B2 (en) Information processing system using nucleotide sequence-related information
Schaafsma et al. V ari SNP, a benchmark database for variations from db SNP
US20090240441A1 (en) System and method for analysis and presentation of genomic data
Singh et al. From the reference human genome to human pangenome: Premise, promise and challenge
JP3888999B2 (ja) 塩基配列関連情報を用いた情報処理システム
WO2004008361A1 (ja) 塩基配列関連情報を用いた情報処理システム
Sanchez-Villeda et al. DNAAlignEditor: DNA alignment editor tool
Ouellette Internet resources for the clinical geneticist
US7337071B2 (en) Information processing system using base sequence-related information
JP4365822B2 (ja) 塩基配列関連情報を用いた情報処理システム
JP3677275B2 (ja) 塩基配列関連情報を用いた情報処理システム
Alzu'bi A personal genomic information analysis and management system for healthcare purposes
JP4266008B2 (ja) 塩基配列関連情報を用いた情報処理システム
JP2024080945A (ja) 意思決定支援システム、方法およびプログラム
Xu et al. SNPTrack TM: an integrated bioinformatics system for genetic association studies
WO2004111909A1 (ja) 塩基配列関連情報を用いた情報処理システム

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
ENP Entry into the national phase

Ref document number: 2006147917

Country of ref document: US

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 10521351

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2492658

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2003741402

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2003741402

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 10521351

Country of ref document: US

WWW Wipo information: withdrawn in national office

Ref document number: 2003741402

Country of ref document: EP