WO2004046997A1 - 塩基配列関連情報を用いた情報処理システム - Google Patents

塩基配列関連情報を用いた情報処理システム Download PDF

Info

Publication number
WO2004046997A1
WO2004046997A1 PCT/JP2003/014733 JP0314733W WO2004046997A1 WO 2004046997 A1 WO2004046997 A1 WO 2004046997A1 JP 0314733 W JP0314733 W JP 0314733W WO 2004046997 A1 WO2004046997 A1 WO 2004046997A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
related information
polymorphism
individual
base sequence
Prior art date
Application number
PCT/JP2003/014733
Other languages
English (en)
French (fr)
Inventor
Takamasa Kato
Takeo Morimoto
Hitoshi Matsuo
Hideyuki Ban
Toru Hisamitsu
Takuya Kamiyama
Original Assignee
Hitachi, Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi, Ltd. filed Critical Hitachi, Ltd.
Priority to US10/535,407 priority Critical patent/US20060041389A1/en
Priority to EP03774053A priority patent/EP1569154A4/en
Priority to JP2004553203A priority patent/JP4266008B2/ja
Publication of WO2004046997A1 publication Critical patent/WO2004046997A1/ja

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Definitions

  • the present invention relates to an information processing system for providing information via a communication network, for example.
  • genomic nucleotide sequences of various organisms including humans are being rapidly determined, and genomic nucleotide sequence information is accumulated in various databases.
  • genomic nucleotide sequence information is accumulated in various databases.
  • Internet for example,
  • a system is being constructed that allows various research institutions and researchers to use genomic base sequence information stored in the database through information and communication networks such as computers.
  • genomic drug discovery research and genetic information analysis are being actively conducted using such base sequences contained in genomic base sequence information.
  • differences in nucleotide sequences between individuals are defined as polymorphisms in which a given base difference exists at a frequency of 1% or more in an individual species, and a given base difference of less than 1% in an individual species. It means variation.
  • polymorphisms include single nucleotide polymorphism (SNP; Single Nucleotide Polymorphism), which is a single base difference between individuals, and one to several tens of bases (sometimes several thousand bases) are deleted or deleted.
  • VNTR Very Number of Tandem Repeat
  • microsatellite polymorphism peerated sequence of about 2 to 4 bases in which the number of insertion / deletion polymorphisms inserted and the number of repetitions of a sequence consisting of 2 to several tens of bases as one unit are different Is known.
  • Such polymorphism may affect the amino acid sequence of a protein between individuals, the expression efficiency of a given gene between individuals, and the like. Due to such effects, it is known that, for example, the susceptibility to a predetermined disease differs among individuals, and the susceptibility to a predetermined drug differs between individuals.
  • the present invention provides a system for providing useful semantic information and / or information related to the semantic information to each individual by effectively utilizing differences in base sequence information between individuals.
  • the purpose is to build.
  • the information processing method relating to a base sequence comprises, after receiving base sequence-related information about a predetermined individual, receiving the base sequence from a storage device having a base sequence-related information group for each individual.
  • This is a method of specifying a base sequence related information group including base sequence related information that is consistent with the related information.
  • the individual to which the received base sequence-related information belongs can also be specified by specifying the base sequence-related information group.
  • the information processing method relating to a base sequence includes receiving individual related information relating to a predetermined individual, storing the identified base sequence related information group or individual in association with the received individual related information, and storing the information.
  • the individual-related information can be associated with a base sequence-related information group relating to the individual.
  • the method includes receiving base sequence-related information on a predetermined individual, and performing base sequence-related information including base sequence-related information that is consistent with the received base sequence-related information.
  • the identification of the information group can be repeated until the unique nucleotide sequence-related information group is identified.
  • the information processing method relating to the base sequence comprises: constructing a database that associates the base sequence-related information group and the individual-related information relating to the predetermined individual by receiving the individual-related information regarding the predetermined individual. You can also.
  • the information processing method relating to the base sequence is characterized in that the base sequence-related information is obtained by statistically processing a plurality of individual-related information relating to a plurality of individuals and a base sequence-related information group relating to a plurality of individuals included in the database. And / or information related to the semantic information can be created.
  • the base sequence-related information group to be used may or may not be included in the database.
  • semantic information and / or information related to the semantic information may be created by further statistically processing using a result of the statistical processing and a plurality of individual-related information regarding a plurality of individuals.
  • the information processing method relating to the base sequence includes receiving the semantic information meaning the created base sequence related information and / or the information related to the semantic information, and receiving the received semantic information and / or the semantic information Using the information related to the information, it is also possible to construct the storage content of the storage device for providing the semantic information according to the request information of the goods and / or services and / or the information related to the semantic information. .
  • the information processing method for a base sequence according to the present invention can be realized as a program that causes a computer including hardware such as a control device, a transmission / reception device, and a storage device to execute each step. Further, the information processing method for a base sequence according to the present invention can be realized as a recording medium in which a program that causes a computer including hardware such as a control device, a transmission / reception device, and a storage device to execute each step is recorded. Further, the information processing method relating to the base sequence according to the present invention can be realized as an information processing device including hardware such as a control device, a transmission / reception device, and a storage device that execute each step.
  • FIG. 1 is a schematic configuration diagram schematically showing the configuration of an information processing system to which the present invention is applied.
  • FIG. 2 is a schematic configuration diagram schematically showing the configuration of a shared computer.
  • FIG. 3 is a configuration diagram showing an example of data recorded in the main DB.
  • FIG. 4 is a schematic configuration diagram schematically showing the configuration of a computer for statistical analysis.
  • FIG. 5 is a configuration diagram showing an example of data recorded in the genome-related information DB.
  • FIG. 6 is a configuration diagram illustrating an example of data recorded in the individual-related information DB.
  • FIG. 7 is a schematic configuration diagram schematically showing the configuration of a personal computer.
  • FIG. 8 is a configuration diagram illustrating an example of data recorded on a genome-related information recording medium.
  • FIG. 9 is a flowchart showing a process performed by a statistical analysis computer and a personal computer in an information processing system that links individual-related information with genome-related information.
  • FIG. 10 is a plane image shown as an example of the individual-related information collection screen.
  • FIG. 11 is a configuration diagram showing an example of data obtained by calculating the appearance frequency of each polymorphism pattern at a polymorphism address from all the data of the genome-related information DB.
  • FIG. 12 is a configuration diagram showing an example of data obtained by calculating the appearance frequency of each polymorphism pattern for each polymorphism address for the individual-related information using the genome-related information DB and the individual-related information DB.
  • FIG. 13 is a configuration diagram showing an example of data obtained by calculating a ratio value of each polymorphism pattern for each polymorphism address in the individual-related information from the data shown in FIGS. 11 and 12.
  • FIG. 14 is a configuration diagram showing an example of data obtained by calculating relative values of each polymorphism pattern for each polymorphism address for the individual-related information from the data shown in FIG.
  • FIG. 15 is a flowchart showing the processing performed by the shared computer and the personal computer in the system for providing the morbidity of a predetermined disease.
  • FIG. 16 is a continuation of FIG. 15 and is a flowchart showing processing on a shared computer and a personal computer in a system for providing a morbidity to a predetermined disease.
  • FIG. 17 is a flowchart showing another process performed by the shared computer and the personal computer in the system for providing the morbidity of a predetermined disease.
  • FIG. 18 is a flowchart showing still another process performed by the shared computer and the personal computer in the system for providing the morbidity of a predetermined disease. Explanation of reference numerals
  • the information processing system is a system that creates semantic information, such as morbidity, provided to users from information on individuals (hereinafter, individual-related information).
  • the information processing system includes a communication network 1 such as the Internet, a shared computer 2 connected to the communication network 1, and at least one personal computer connected to the communication network 1. 3 and a statistical analysis computer ST connected to the communication network 1 to enable data communication between the shared computer 2, the personal computer 3 and the statistical analysis computer ST via the communication network 1. I have.
  • the shared computer 2 includes, as shown in FIG. 2, a CPU 4 for controlling all operations of the shared computer 2, an input device 5 such as a keyboard and a mouse for inputting information and an instruction to execute a program, and a display device.
  • Display device 6 a memory 7 for storing temporary information and non-rewritable information, etc., a database 8 for storing various data, and predetermined information for the memory 7 and the database 8.
  • a transmitting / receiving device 17 for transmitting / receiving information to / from the personal computer 3 via the communication network 1.
  • the memory 7 in the shared computer 2 includes a memory section A 10 and a memory section B 11 for recording different types of information, respectively, and a screen memory 1 for recording image data to be displayed on, for example, a personal computer 3 or a display device 6. 2 and a processing program 13 for operating the present system.
  • the shared computer includes a memory section A 10 and a memory section B 11 for recording different types of information, respectively, and a screen memory 1 for recording image data to be displayed on, for example, a personal computer 3 or a display device 6. 2 and a processing program 13 for operating the present system.
  • the shared computer includes a memory section A 10 and a memory section B 11 for recording different types of information, respectively, and a screen memory 1 for recording image data to be displayed on, for example, a personal computer 3 or a display device 6. 2 and a processing program 13 for operating the present system.
  • the shared computer includes a memory section A 10 and a memory section B 11 for recording different types of information, respectively, and a screen memory 1 for recording image data to be displayed
  • the screen memory 12 and the processing program 13 are not stored in the internal memory 7 but are stored in an external storage device (not shown) connected to the shared computer 2 via the communication network 1. It may be.
  • the database 8 (storage device) in the shared computer 2 stores the polymorphism address and polymorphism Main DB 14 in which turn and semantic information is recorded, DB-A 15 for storing information recorded in memory A 10, and storage for storing information recorded in memory B 11 DB-B16.
  • the main DB 14 records the polymorphism address, a plurality of polymorphism patterns that can be taken at the polymorphism address, and semantic information that means each of the plurality of polymorphism patterns. Have been. Further, the main DB 14 may record semantic information indicating a combination (for example, haplotype) of a polymorphism pattern at a plurality of polymorphism addresses.
  • polymorphism address means at least the position where the polymorphism exists in the nucleotide sequence.
  • polymorphism generally includes, for example, so-called SNP (single nucleotide polymorphism; RFLP (restriction fragment length or polymorphism) VNTR (variable number of tandem repeat), microsatellite, etc.
  • SNP single nucleotide polymorphism
  • RFLP restriction fragment length or polymorphism
  • VNTR variable number of tandem repeat
  • microsatellite etc.
  • the term “polymorphism” used herein is not limited to these, but also includes bases that occur at a frequency of less than 1% in an individual species and changes (variations) in the base sequence.
  • polymorphism address refers to a change in a base sequence that indicates a change in a base sequence or a base sequence that occurs only at a frequency of less than 1% in an individual species.
  • a combination indicates a position indicating a polymorphism, etc.
  • the polymorphism address is not particularly limited, but includes, for example, a chromosome number, a symbol indicating a gene having the polymorphism, and the gene It can be expressed by a combination of a numerical value indicating the location of the polymorphism in the gene, or a combination of a symbol indicating the gene in which the polymorphism exists and a numerical value indicating the location of the polymorphism in the gene.
  • polymorphism address may be a polymorphism-specific notation assigned to each polymorphism.
  • polymorphism address is located in the nucleotide sequence Is not shown directly, but the position can be known indirectly based on the polymorphism-specific notation, so "polymorphism address" is meant to include the polymorphism-specific notation.
  • Polymorphism pattern is information on a base sequence that differs between individuals, and includes at least a base or base sequence pattern in a polymorphism. Further, “polymorphism pattern” is meant to include not only polymorphism but also patterns of nucleotides and nucleotide sequences which are present only at a frequency of less than 1% in an individual species.
  • polymorphism pattern may indicate a heterozygote or homozygote on a homologous chromosome.
  • the “polymorphism pattern” can be represented by any of “AA”, “GG” and “AG”.
  • the “polymorphism pattern” does not directly represent a pattern that can be taken at a predetermined polymorphism address, but may be an indirect representation.
  • the “polymorphism pattern” is, for example, “allele 1” when taking “A” at a polymorphism address known to take A or G, and “allele 2” when taking “G”. It may be written. Also, when the “polymorphism pattern” can be represented by any of “AA”, “GG” and “AG” as described above, for example, when it can be represented by “AA”, it can be represented by “HI” or “GG”. When it can be expressed by “i3” or “AG”, it may be expressed by “ ⁇ /”.
  • polymorphism pattern is numerical values that indicate “repetition count” when the polymorphism is microsatellite, and “present / absent” when the polymorphism is deletion type. It may be indicated by a symbol.
  • the “polymorphism pattern” at each polymorphism address may be described as, for example, “polymorphism 1”, “polymorphism 2”, “polymorphism 3”, etc., according to a predetermined rule or agreement.
  • “polymorphism 1”, “polymorphism 2”, and “polymorphism 3” can be described in descending order of the possible frequency of “polymorphism pattern”. In this case, for example, each “polymorphism 1” at each polymorphism address does not necessarily represent the same content.
  • polymorphism 1 at one polymorphism address represents “ ⁇ ⁇ ”, which is most likely to occur, and another polymorphism address “polymorphism 1” is “GG”, which is most likely. Will be represented.
  • a method of expressing “polymorphism pattern” by any one of “polymorphism 1”, “polymorphism 2”, “polymorphism 3 j”, etc. is used.
  • the polymorphism pattern can be encrypted or unencrypted, where “semantic information” is information associated with the “polymorphism pattern”, for example, Means various information resulting from differences in ⁇ polymorphism patterns '', such as responsiveness to drugs, side effects to drugs, risks for diseases and disorders, constitutional / characteristics, lifestyle advice based on constitutional / characteristics, protein interaction, etc. .
  • “semantic information” various information resulting from the difference of “polymorphism pattern” The information may be directly represented, or may be represented indirectly using a symbol or the like that means the information.
  • “Semantic information” is information of a type that is increased and corrected as the research on genomes and genes progresses, and it is preferable to always purging up. In other words, “semantic information” increases and decreases the amount of storage by updating the database using the results of genomic and gene research, and becomes more accurate.
  • Information that is not directly related to “polymorphism pattern” but is further derived from “semantic information” is “information related to semantic information”. If the “semantic information” is “risk for disease”, when the risk exceeds a certain level, for example, a specific “medical examination item” is derived. This specific “medical examination item” is “information related to semantic information”.
  • the semantic information is, as shown in FIG. 3, at least in the main DB 14 as “annotation information for the polymorphism pattern” associated with the predetermined “polymorphism address” and “polymorphism pattern”. Has been recorded.
  • the semantic information is associated with “polymorphism classification” and “classification (disease name)” corresponding to a predetermined “polymorphism address”. That is, when the predetermined “polymorphism address” is the predetermined “polymorphism pattern”, it is possible to obtain annotation information (semantic information) indicating the type of the disease name and the likelihood of illness for the disease.
  • semantic information can be associated with each polymorphism pattern combination (eg, haplotype) corresponding to multiple polymorphism addresses.
  • annotation information indicating different morbidity for a given disease
  • semantic information can be associated.
  • a plurality of polymorphism addresses are a combination of a predetermined polymorphism pattern, it is possible to obtain annotation information (semantic information) indicating the possibility of morbidity for a predetermined disease.
  • the semantic information can also be associated with a "disclosure level" determined according to a predetermined standard.
  • the criteria for determining the "disclosure level” are to take into account semantic information, that is, the unexpected disadvantage to individuals by disclosing the likelihood of categorization (disease name). Can be determined.
  • the public computer 2 does not disclose semantic information that is not appropriate to the public in view of the law, regulations, own standards of conduct, contracts with users, etc. Decide Can be specified.
  • the system does not disclose to the user the annotation information that indicates the likelihood of morbidity that is associated with the “disclosure level,” which means that disclosure is not possible.
  • the user is permitted to disclose semantic information related to the specified “public level” through informed consent, etc., and the meaning that the specified “public level” is associated with the user A system that publishes information may be used.
  • the “disclosure level” can be set as three or more stages such as “1, 2, 3,...” Or “a, b, c,.
  • the level can be set according to the type of user, such as the age, qualifications of the user, and whether or not there is a contract with the user, etc. on the shared computer 2.
  • the specified disclosure is provided by informed consent, etc.
  • the user may also select the level of disclosure so that only annotation information indicating the likelihood associated with the level above (or below) the level of disclosure is provided to the user.
  • the storage DB-B16 for example, data such as base sequence-related information which is genetic information of a requester who uses the present system can be recorded. Further, the storage DB-A 15 can record data such as information for identifying a requester who uses the system. In this way, by recording the genetic information of the individual and the information identifying the individual separately in the DB-A 15 for storage and the DB-B 16 for storage, the genetic information of the requester and the request It becomes difficult to associate with the data that identifies the person.
  • the shared computer 2 is not limited to the one having the database 8 therein, and may have an external database (not shown) connected to the shared computer 2 via the communication network 1.
  • the shared computer 2 may have a plurality of databases 8 therein, or may have an internal database 8 and an external database connected to the shared computer 2 via the communication network 1. You can.
  • the prayer computer ST is used for the statistical analysis computer.
  • CPU 30 that controls all ST operations, and information and program execution instructions can be input.
  • Input device 31 such as a keyboard and a mouse
  • a display device 32 such as a display device
  • a memory 33 for storing temporary information, rewritable information and non-rewritable information, and various data.
  • the database 34 storing the data
  • the recording device 35 for writing predetermined information to the memory 33 and the database 34.
  • a transmission / reception device 36 for transmitting / receiving information between them.
  • a memory 33 in the statistical analysis computer ST includes a memory section 37 for temporarily recording a polymorphism pattern and the like sent from the personal computer 3 and for recording a statistical analysis result and the like. 3 and a shared computer 2 and a display device 3 2 A screen memory 3 8 that records image data to be displayed on the system 2, and this system is operated to provide “individual-related information” for multiple individuals (individuals) and for multiple individuals (individuals).
  • a processing program 39 for creating semantic information such as annotation information indicating the likelihood of illness for a predetermined disease is recorded.
  • “genome-related information” regarding a plurality of individuals (individuals) and “individual-related information” regarding a plurality of individuals (individuals) are accumulated, and then the “genome-related information” is collected.
  • “genome-related information” is collected.
  • “individual-related information” is collected.
  • “individual-related information” is collected.
  • “individual-related information” is collected.
  • annotation information semantic information
  • the statistical analysis computer ST does not have the processing program 39 or the memory section 37 in the internal memory 33, but has an external storage device connected to the statistical analysis computer ST via the communication network 1. (Not shown).
  • individual-related information refers to all information about a given individual, such as the nature, psychological state, constitution, physical condition, health state, medical history, lifestyle, behavior / thinking pattern, habits and preferences of the individual. included.
  • the individual-related information may be information obtained from an individual (individual) such as a user answering a prepared question or the like. Include information obtained by undergoing the inspection.
  • the “genome-related information” is a group of data (base sequence-related information group) in which a plurality of “polymorphism patterns” relating to a predetermined individual are each associated with a predetermined “polymorphism address”.
  • the database 34 (storage device) in the computer for statistical analysis ST It has a “genome-related information DB 40” (shown in Fig. 5) that records “genome-related information” for each individual (individual). It is desirable that the “genome-related information” recorded in the “genome-related information DB 40” be anonymized so as not to be directly linked to information that specifies an individual (individual).
  • the database 34 has “individual-related information DB 41” (shown in FIG. 6) in which “individual-related information” received from the personal computer 3 is recorded for each individual (individual). It is desirable that the “individual-related information” recorded in the “individual-related information DB 41” be anonymized so as not to be directly linked to information that specifies an individual (individual).
  • the computer ST for statistical analysis is not limited to the one having the database 34 therein, and may be connected to an external database (not shown) connected to the computer ST for statistical analysis via the communication network 1. It may be accessed.
  • the personal computer 3 includes, as shown in FIG. 7, a CPU 20 for controlling all operations of the personal computer 3, and an input device such as a keyboard and a mouse for inputting information and an instruction to execute a program. 21; a display device 22 such as a display device; a memory 23 in which temporary information and rewritable information are recorded; a reading device 25 that reads data from a genome-related information recording medium 24; The transmission / reception device 29 transmits / receives information to / from the shared computer 2 via the communication network 1.
  • the personal computer 3 is not limited to a normal computer, and may be in any form, such as a mobile phone, a personal mobile terminal, and other mobile communication devices.
  • the memory 23 in the personal computer 3 has a memory unit 26 for recording information and the like from the genome-related information recording medium 24, and stores a processing program 27 for operating the information processing system. .
  • the genome-related information recording medium 24 stores genome-related information 28 of an individual.
  • Examples of the genome-related information recording medium 24 include a magnetic recording medium such as a magnetic disk and a magnetic card, an optical recording medium to which a magneto-optical recording method and a phase change recording method are applied, a semiconductor memory, and the like. Can be.
  • the genome-related information recording medium 24 may be in any form such as a card, a disk, a stick, a tape, or a drum.
  • this genome-related information recording medium 24 is a single individual (individual). It may be a record of the genome-related information 28, or may be a record of a plurality of genome-related information 28 for a plurality of individuals (individuals).
  • the genome-related information 28 contained in the genome-related information recording medium 24 is at least a “polymorphism address” and a “polymorphism pattern” at a predetermined polymorphism address obtained as a result of analyzing the base sequence of an individual (individual). Means.
  • the genome-related information 28 may include various kinds of information such as a history of the disease, characteristics, medical record information, and a result of a health check.
  • the genome-related information recording medium 24 as the genome-related information 28, for example, as shown in FIG.
  • Genomic 8 an individual number “Gno.” (Genamper) unique to the genome-related information 28 Record personal information such as date and time, record polymorphism address and polymorphism pattern as data II, record an existing disease as data III, record characteristics as data IV, record medical record information as data V . That is, the genome-related information 28 is composed of data I, data II, data III, data IV, and data V. Data I and Data II contain essential information, while Data III, Data IV and Data V consist of additional information.
  • the “polymorphism address” corresponding to the position on the nucleotide sequence and the “polymorphism pattern” at the polymorphism address are linked and recorded. Further, in the data II, additional information at a predetermined polymorphism address may be recorded as a “comment” by linking to the “polymorphism address”. In addition, the data II may record the entire base sequence of a predetermined individual. Even when the entire base sequence is recorded in Data II, “Polymorphism address” and “Polymorphism pattern” are included in Data II.
  • the personal computer 3 and the genome-related information recording medium 24 are not limited to the configurations as shown in FIGS. 7 and 8, respectively.
  • the genome-related information recording medium may be a memory having a processing program.
  • the personal computer can operate according to the processing program recorded in a part of the memory of the genome-related information recording medium.
  • the processing program 39 stored in the memory 33 of the ST and the processing program 27 recorded in the memory 23 of the personal computer 3 are, for example, flow charts as shown in FIG.
  • the information processing operation is performed according to the protocol.
  • steps described as “(to)” mean processing in the statistical analysis computer ST
  • steps described as “()” mean processing in the personal computer 3. I have.
  • each individual possessing the genome-related information recording medium 24 accesses the statistical analysis computer ST via the communication network 1 using the personal computer 3 to obtain information on each individual (individual).
  • This is a system that registers “individual-related information” in the “individual-related information DB 41” of the statistical analysis computer ST in association with the genome-related information in the “genome-related information DB 40”.
  • This information processing system is a system in which each individual accesses the genome-related information recording medium 24 using the genome-related information recording medium 24 on which the genome-related information 28 of a plurality of persons is recorded. Is also good.
  • step 1 the requester accesses the computer ST for statistical analysis via the communication network 1 and registers the individual-related information in the computer ST for statistical analysis. Indication of intention.
  • the intention display may be performed by accessing the homepage provided by the statistical analysis combinator ST, or the intention display may be performed by accessing the statistical analysis computer ST using e-mail or the like. May be performed.
  • the requester registers its own individual-related information is described.
  • the present invention is not limited to this.
  • the requester may register the individual-related information regarding an individual (individual) other than his / her own. it can.
  • the statistical analysis computer ST reads “individual-related information collection information” as shown in FIG. 10 from the screen memory 38 in step 2 (S 2). Is read out and displayed on the display device 22 of the personal computer 3.
  • the individual-related information collection screen may be displayed while the personal computer 3 accesses the web page provided by the statistical analysis computer ST, or the individual-related information collection screen transmitted to the personal computer 3 may be displayed. It may be displayed on the display device 22 of the personal computer 3 based on the screen data.
  • step 3 the personal computer 3 inputs the individual-related information of the requester according to the individual-related information collection screen.
  • the requester answers the questions displayed on the individual-related information collection screen, and Enter your answer.
  • the requester may input the answer to the question displayed on the individual-related information collection screen on an answer screen different from the individual-related information collection screen.
  • information obtained by a user (requester) or the like undergoing a test at a medical institution or a testing institution may be input as individual-related information.
  • Step 4 the personal computer 3 transmits a response (individual-related information) to the question displayed on the individual-related information collection screen to the statistical analysis computer ST.
  • the response to the question is transmitted to the statistical analysis computer ST by transmitting the individual-related information collection screen data to which the answer is input or the screen data for the answer to which the answer is input via the communication network 1. Can be sent.
  • information obtained by the user (requester) or the like undergoing a test at a medical institution or a testing institution can be transmitted to the statistical computer ST as individual-related information. .
  • the statistical analysis computer ST transmits a plurality of polymorphism addresses to the personal computer 3 in step 5 (S 5).
  • the plurality of polymorphism addresses transmitted in step 5 may be the default polymorphism addresses or may be randomly selected polymorphism addresses! / ,.
  • the personal computer 3 drives the reader 25 in step 6 (S6) to store it in the genome-related information recording medium 24. to access.
  • step 7 (S7) the personal computer 3 reads out a corresponding polymorphism pattern for each of the plurality of polymorphism addresses received from the statistical analysis computer ST.
  • step 8 (S8) the personal computer 3 associates the polymorphism pattern read out in step 7 with the corresponding polymorphism address and transmits it to the statistical analysis computer ST. That is, in step 8, for each of the plurality of polymorphism addresses received from the statistical analysis computer ST, the corresponding polymorphism pattern is transmitted in association with each other. Note that in Step 8
  • the polymorphism address transmitted by the statistical analysis computer ST in step 5 is received by the personal computer 3, and the polymorphism corresponding to the received polymorphism address is received.
  • the personal computer 3 transmits the pattern to the statistical analysis computer ST.
  • the present invention is not limited to this.
  • the personal computer 3 transmits the “individual-related information” to the statistical analysis computer ST, and also determines the predetermined polymorphism address and the number corresponding to the polymorphism address.
  • the pattern pattern may be spontaneously transmitted to the statistical analysis computer ST.
  • steps 5 to 8 described above are not performed, and after step 4, steps 9 and following are performed in the same manner.
  • step 9 After receiving the polymorphism address and the polymorphism pattern from the personal computer 3, the statistical analysis computer ST accesses the genome-related information DB 40 in step 9 (S9).
  • the statistical analysis computer ST if the statistical analysis computer ST does not have the genome-related information DB 40 and the external institution has the genome-related information DB 40, the external institution is connected via the communication network 1. Access the genome-related information DB 40 of the database.
  • step 10 the statistical analysis computer ST searches the genome-related information DB 40 based on a combination of a plurality of polymorphism addresses and polymorphism patterns received from the personal computer 3. Then, from the genome-related information stored in the genome-related information DB 40, the genome-related information on the individual (individual) having the combination of the received polymorphism addresses and polymorphism patterns is specified.
  • the requester an individual related to the “individual-related information” transmitted by the requester
  • the requester is selected from a plurality of genome-related information about a plurality of individuals (individuals) registered in the genome-related information DB 40. (Individual)) Identify genome related information.
  • a “rearrangement number” may be assigned to genome-related information on the specified requester, that is, an individual (individual).
  • the genome-related information DB4 may be assigned to genome-related information on the specified requester, that is, an individual (individual).
  • An “arrangement number” assigned in advance to genome-related information on an individual (individual) registered in 0 may be extracted.
  • step 11 (S11) In step 11 (S11),
  • Step 10 Associate the genome-related information about the requester (the individual (individual) related to the “individual-related information” transmitted by the requester) identified with 10 with the individual-related information received from the personal computer 3. Specifically, the requester identified in Step 10 (the requester Was added to genome-related information on individuals (individuals) related to "individual-related information”.
  • step 10 if the statistical analysis computer ST has the genome-related information DB 40, the requester (the “individual-related information” transmitted by the requester) stored in the genome-related information DB 40.
  • the individual-related information received from the personal computer 3 may be directly associated with the genome-related information on the related individual (individual) and stored.
  • the statistical analysis computer ST has individual-related information on a plurality of individuals (individuals).
  • the computer for statistical analysis ST can create a database in which genome-related information on a plurality of individuals is stored in association with the individual-related information.
  • the genome-related information previously anonymized and recorded in the “genome-related information DB 40” of the statistical analysis computer S was anonymized later. Even when the individual-related information is transmitted to the statistical analysis computer ST, the genome-related information and the individual-related information can be linked.
  • the computer ST for statistical analysis receives a polymorphism pattern from the personal computer 3 for the plurality of polymorphism addresses transmitted in step 5, Related Information
  • genomic related information on the requester (individual (individual) related to the “individual related information” transmitted by the requester) is specified.
  • the present information processing system is not limited to this method when identifying genomic-related information regarding a requester (an individual (individual) related to the “individual-related information” transmitted by the requester).
  • the combination of the “polymorphism pattern” and the “polymorphism pattern” may be sequentially transmitted from the personal computer 3 to the statistical analysis computer ST, and the statistical analysis computer ST may specify the requester.
  • the combination of the predetermined “polymorphism address” and the “polymorphism pattern” may be sequentially and voluntarily transmitted from the personal computer 3 to the statistical analysis computer ST.
  • the ST sequentially requests the personal computer 3 to submit a “polymorphism pattern” corresponding to the predetermined “polymorphism address”, and the personal computer 3 changes the “polymorphism pattern” corresponding to the request to “ It may be transmitted sequentially in association with the “polymorphism address”.
  • the computer for statistical analysis ST receives the combination of one or more “polymorphism addresses” and “polymorphism patterns” concerning the requester, and receives the received “polymorphism addresses” and “polymorphism patterns”.
  • the predetermined information included in the genome-related information DB 40 can be obtained.
  • Requester of genome-related information on an individual (individual) Genome-related information on an individual (individual) related to the "individual-related information" sent by the requester Can be specified as
  • the statistical analysis computer ST uses the individual-related information DB 41, which stores a plurality of individual-related information about a plurality of individuals in association with the genomic-related information included in the genome-related information DB 40, and stores the plurality of individual-related information.
  • the individual-related information DB 41 stores a plurality of individual-related information about a plurality of individuals in association with the genomic-related information included in the genome-related information DB 40, and stores the plurality of individual-related information.
  • the statistical process means a process to which a method known as a genetic statistical method is applied, and can be performed by applying various conventionally known programs and algorithms.
  • the individual-related information DB 41 for example, “Preference a (eg: I prefer blue to red)” (with “ ⁇ ” in the result column) . ”Is extracted, and the“ rearrangement No. ”extracted above is searched from the genome-related information 40, and among the searched data, for each polymorphism address, the number that can be taken at the polymorphism address is determined. Calculate the appearance frequency of each pattern. For example, as shown in Fig. 12, the calculation result is a matrix in which polymorphism addresses are arranged in the row direction for each individual-related information (for each "preference"), and the occurrence frequency of each polymorphism pattern is arranged in the column direction. It is expressed as In addition, in FIG. 12, when “preference a” is applicable, the appearance frequency of the polymorphism pattern “polymorphism 1” at the polymorphism address “000001” is 45 out of 50 people.
  • Preference a eg: I prefer blue to red
  • the occurrence frequency of the polymorphism pattern “polymorphism 1” at the polymorphism address “000001” in the case of “preference a” is as follows.
  • the value of 45 people, which is represented as 45 out of 50 people, is the result of the frequency of appearance shown in Fig. 11.
  • the frequency of occurrence of the polymorphism pattern “polymorphism 1” at the polymorphism address “000001” in all attached data) is the relative value (90%) obtained by dividing by 50 out of 50 out of 100 individuals. Obtain as a value.
  • the result is expressed as a matrix which indicates the polymorphism addresses in the row direction for each individual-related information and the ratio values for each polymorphism pattern in the column direction.
  • an external organization other than the statistical analysis computer ST calculated (statistically processed) For each polymorphism address, data indicating the appearance frequency of each of the possible polymorphism patterns at the polymorphism address or original data for calculating the appearance frequency may be used.
  • the individuals related to the genome-related information based on which the external organization obtains the appearance frequency are included. May not be included.
  • a relative value of each polymorphism pattern that can be taken at the polymorphism address is calculated.
  • the ratio value of the polymorphism pattern “polymorphism 1” of the polymorphism address “000001” is 90%
  • the polymorphism pattern “ The percentage value for “polymorphism 2” is 12 °.
  • the percentage value for polymorphism pattern “polymorphism 3” is expressed as 8%, but the polymorphism pattern showing the smallest percentage value
  • the polymorphism addresses are arranged in the row direction for each individual-related information, and the relative values for each polymorphism pattern are arranged in the column direction.
  • magnification (relative value) should show a value close to 1.0 in any of “polymorphism 1”, “polymorphism 2”, and “polymorphism 3”. is there. It is statistically known that this tendency becomes more pronounced as the parameter used to calculate the frequency of appearance shown in FIGS. 11 and 12 increases.
  • the difference between the polymorphism patterns at the polymorphism address indicating the relative value and the predetermined individual-related information Or not) is determined to be related.
  • the magnification relative value
  • a polymorphism address indicating the magnification and the magnification are extracted and output.
  • the threshold value can be calculated statistically, for example, after overviewing all the relative values in the case of the predetermined individual-related information shown in FIG.
  • the predetermined individual-related information May be determined to be relevant (whether or not).
  • the difference in the polymorphism pattern at the polymorphism address indicating the extracted magnification is larger than the predetermined individual-related information (whether or not the polymorphism pattern is applicable). It can be assumed that they are strongly related. That is, it is presumed that the predetermined individual-related information has a strong (inherited or not) innate (genetic) factor.
  • the results shown in Fig. 14 are obtained from the frequencies of appearance shown in Figs. 11 and 12, and processing is performed until the judgment is derived from the results. ) It is possible to examine whether or not individual-related information that was considered to have a low association with effects is also affected by genetic effects. In other words, by using various types of individual-related information obtained from individuals (individuals), it is possible to determine the relationship between inheritance (genetic) effects and genetics of individuals, which have been considered to be rarely related to congenital (genetic) effects. Relevance can be estimated. Also, the process from obtaining the results shown in Fig. 14 from the appearance frequencies shown in Figs. 11 and 12 and deriving a judgment from the results does not correspond to the specified individual-related information (attribute).
  • the calculated frequency of occurrence for each polymorphism pattern is assumed to be the parameter (Fig. 11), so it is necessary to quantitatively express how much genetic information has affected the individual-related information (attributes).
  • a group corresponding to the individual-related information (attribute) is compared with a group that does not correspond to the individual-related information (attribute). It is difficult to indicate the degree of genetic effect when the genetic effect seems to be relatively small.
  • individual-related information (attributes) such as a person's personality, it is necessary to determine whether or not the individual's desire to be safe is the cause of the individual-related information (attributes). This is because the parameters themselves are difficult, and the parameters may contain errors, making accurate comparisons difficult.
  • the statistical analysis computer ST uses the polymorphism address extracted from the results shown in Fig. 14 and the magnification and / or the original numerical value extracted together with the polymorphism address to obtain a predetermined individual-related It is possible to obtain the knowledge that the correlation between the information and the predetermined polymorphism address and the difference in the influence on the predetermined individual-related information depending on the type of the polymorphism pattern. Then, the statistical analysis computer ST uses the obtained knowledge to provide semantic information and / or
  • Information related to the semantic information can be created.
  • “magnification” extracted from the results shown in FIG. 14 can be used as it is as semantic information.
  • the computer ST for statistical analysis uses the calculation result of the magnification (relative value) shown in FIG. 14 and / or the semantic information and Z created based on the knowledge derived from the calculation result shown in FIG.
  • a database hereinafter referred to as a reference DB in which information related to the semantic information is sequentially recorded can be constructed.
  • the association between the predetermined property and another property means that the probability that an individual exhibiting the predetermined property exhibits the other property is a predetermined value, for example, 80% or more.
  • the relevancy can be derived, for example, from the results of a questionnaire that includes predetermined properties and other properties. For example, if more than 80% of respondents who answered that they have a certain property have more than 80% of respondents, there is a relationship between the given property and another property. Can be considered.
  • the statistical analysis computer ST can provide the shared computer 2 with the created semantic information and / or information related to the semantic information.
  • the shared computer 2 is based on the semantic information provided from the statistical analysis computer ST.
  • the statistical analysis computer ST successively records the semantic information created as described above and / or information related to the semantic information and constructs a “reference DB”, and stores the “reference DB”. By using it as the main DB 14, it can operate as a shared computer 2 itself.
  • the shared computer 2 can provide the user with semantic information such as the possibility of illness of a predetermined disease by using the constructed main DB 14 as follows.
  • the shared computer 2 sets the morbidity as a "request for goods and / or services", for example, when the user requests that the person be told about his / her morbidity with respect to a predetermined disease. Etc. can be provided.
  • the “goods and / or services” are not limited to the morbidity of a prescribed disease, but include, for example, pharmaceuticals, foods, and luxury goods that match the constitution of an individual (individual). This includes services such as goods and information that is appropriate to the constitution and characteristics of the individual (individual).
  • the processing program 13 recorded in the memory 7 of the shared computer 2 and the memory 2 of the personal computer 3 performs an information processing operation according to, for example, the flowcharts shown in FIGS.
  • steps described as “(shared)” mean processing in shared computer 2
  • steps described as “(unit)” are processing in personal computer 3.
  • each individual possessing the genome-related information recording medium 24 accesses the shared computer 2 via the communication network 1 using the personal computer 3 and records the information in the main DB 14 of the shared computer 2. It is a system that uses the semantic information provided.
  • the information processing system uses a genome-related information storage medium 24 on which genome-related information 28 of a plurality of persons is recorded, and each individual uses the genome-related information storage medium 2.
  • a system that accesses 4 may be used.
  • step A1 the requester
  • the processing program 27 recorded in the memory 23 is started.
  • the processing program 27 drives the reader 25 of the personal computer 3 to access the genome-related information recording medium 24, and the ⁇ Gno. Is read.
  • the read “Gno. J” is stored in the memory 26.
  • step A2 based on the screen image displayed on the display device 22 by the processing program 27, information requested by the requester, for example, "Possibility of colorectal cancer (Request information) to the personal computer 3 and transmit “Possibility of colorectal cancer” and “Gno.” From the personal computer 3 to the shared computer 2 via the communication network 1. . Alternatively, the “possibility of colon cancer” and “Gno.” Are written from the personal computer 3 to the shared computer 2 via the communication network 1.
  • step A3 the shared computer 2 receives the “possibility of colon cancer” and “Gno.”.
  • the received “colorectal cancer morbidity” and “Gno.” are stored as request information in the memory part A10.
  • step A4 when the request information is received, the processing program 13 recorded in the memory 7 is started to access the main DB 14. The processing program 13 performs processing in the shared computer 2.
  • step A5 the “classification (disease name)” recorded in the main DB14 is searched according to the processing program 13, and the requested “possibility of colon cancer” ( Cancer).
  • Step A6 among the data recorded in the main DB14, the “polymorphism number” associated with “Classification (disease name)” (colorectal cancer) that matches “Possibility of colorectal cancer” The ground.
  • the read “polymorphism address” is stored in the memory section A 10 as position information associated with the request information. In other words, “possibility of colon cancer” and “polymorphism address” for the predetermined “Gno.” Are recorded in the memory unit A 10.
  • step A7 the “Gno.” And “polymorphism address” recorded in the memory section A10 are transmitted to the personal computer 3 and the “polymorphism number” to be transmitted is transmitted.
  • the instruction information for submitting the “polymorphism pattern” corresponding to the “ground” is transmitted to the personal computer 3.
  • it may be ordered to submit additional information such as a history of a disease or a feature as needed.
  • step A8 “Gno.”, “Polymorphism address” and instruction information transmitted from shared computer 2 are received.
  • the received “Gno.” And “polymorphism address” are recorded in the memory part 26.
  • Step A9 the data II recorded on the genome-related information recording medium 24 is accessed according to the received instruction information.
  • step A10 the data II recorded on the genome-related information recording medium 24 is searched according to the processing program 27, and the polymorphism pattern of the instructed polymorphism address is read. The pattern is associated with the pattern and recorded in the memory unit 26. At this time, it is preferable to access the data I and confirm whether the “Gno.” Received in step A8 is correct.
  • step A10 in addition to the polymorphism pattern, additional information recorded in data III, data IV, and data V may be read at the same time, and may be recorded in the memory unit 26 as necessary.
  • step A11 the polymorphism pattern associated with the polymorphism address temporarily recorded in the memory unit 26 and the additional information recorded as necessary are
  • step A12 the shared computer 2 receives the polymorphism pattern associated with the polymorphism address and additional information recorded as necessary, and identifies the received polymorphism pattern with the polymorphism address. It is recorded in the memory part A10 in association with it.
  • step A7 the shared computer 2 sends instruction information for instructing the submission of the “polymorphism pattern”, and in step A10, the personal computer
  • the present system may be a system that does not transmit the command information in step A7.
  • the personal computer 3 searches the data II based on the polymorphism address received in step A8 according to the processing program 27, and searches the received polymorphism pattern for the polymorphism pattern. read out. Then, the personal computer 3 transmits the polymorphism pattern and the like to the shared computer 2 in step A 1 1. Output. Even in this case, the shared computer 2 obtains the polymorphism pattern of the “polymorphism address” associated with the “classification (disease name)” corresponding to the “probability of colon cancer” in step A12. Can be.
  • step A13 the main DB 14 is accessed to search for the received polymorphism address and the one that matches the polymorphism pattern.
  • the main DB 14 a plurality of polymorphism patterns are recorded for one polymorphism address, and the received polymorphism address and the number of the polymorphism pattern are stored in the main DB 14. Search for a match with the type pattern.
  • step A14 (SA14), according to the processing program 13, the likelihood of colon cancer associated with the received polymorphism pattern and the polymorphism pattern is read out. That is, in step A14, the susceptibility of the requester to colorectal cancer can be read out according to the polymorphism address and polymorphism pattern submitted by the requester. The retrieved morbidity is stored in the memory unit A10 in association with the requester's "Gno.” At this time, the likelihood of colorectal cancer may be stored in a form corrected with the additional information, or other information obtained from the additional information may be associated with the requester's ⁇ Gno. '' It may be stored.
  • step A15 the requester stored in memory
  • step A16 the personal computer 3 receives the requester's "Gno.” And morbidity (semantic information). The received semantic information is recorded in the memory unit 26.
  • step A 17 (SA17), according to the processing program 27, the memory unit 2
  • the shared computer 2 reads out (creates) a screen displaying semantic information according to the processing program 13 and displays it on the personal computer 3 via the communication network 1. It can also be displayed on the device 22. Also in this case, it is assumed that semantic information has been transmitted from the shared computer 2 to the personal computer 3. As a result, the requester can obtain the morbidity for colorectal cancer using the genome-related information 28 recorded on the genome-related information recording medium 24. it can.
  • the semantic information recorded in the main DB 14 is used as the polymorphism number by using the genome-related information recording medium 24 in which the individual polymorphism pattern is recorded in association with the polymorphism address. It can be used by individuals through the earth. In other words, individuals using this system need not record semantic information on the genome-related information recording medium, but only possess genome-related information 28 that associates polymorphism addresses with polymorphism patterns. However, various semantic information can be obtained.
  • updating the main DB 14 increases the accuracy and includes a wide range of information.
  • the individual can use the latest semantic information by updating the main DB 14 according to the increase and correction of the semantic information.
  • the user does not have to perform a test for obtaining the genome-related information every time the system is used. That is, if the user creates the genome-related information recording medium 24, the user can subsequently obtain the latest semantic information using the present system. If the user owns the genome-related information recording medium 24 on which the genome-related information 28 is recorded, anxiety when entrusting the individual's genome-related information 28 to an external institution and storing it, and unauthorized access to the institution By doing so, it is possible to avoid the danger when the genome-related information 28 is leaked.
  • the processing program 27 of the personal computer 3 is combined with a card drive or the like in which the genome-related information recording medium 24 is mounted. Standardization becomes easier.
  • the processing program 13 recorded in the memory 7 of the shared computer 2 and the processing program 27 recorded in the memory 23 of the personal computer 3 are, for example, as shown in FIG.
  • the information processing operation may be performed according to a simple flowchart.
  • the steps described as “(shared)” mean the processing in the shared computer 2
  • the steps described as “(pieces)” indicate the processing in the personal computer 3. You.
  • step B1 the requester activates the processing program 27 recorded in the memory 23 when using the present system.
  • the processing program 27 drives the reader 25 of the personal computer 3 to access the genome-related information recording medium 24, and the ⁇ Gno. Is read.
  • the read "Gno.” Is stored in the memory unit 26.
  • step B2 based on the screen image displayed on the display device 22 by the processing program 27, the requester wants to receive information, for example, "Possibility of colorectal cancer. (Request information) to the personal computer 3 and transmit “Possibility of colon cancer” and “Gno.” From the personal computer 3 to the shared computer 2 via the communication network 1.
  • the “Classification (disease name)” of the main DB14 is “Polymorphic address” with colorectal cancer and all associated with the “Polymorphic address”.
  • step B2 the requester sets the main DB14
  • the “classification (disease name)” of “colorectal cancer” means “polymorphism address”, all “polymorphism patterns” associated with the “polymorphism address”, and all the “polymorphism patterns”. Request for information consisting of “possibility”.
  • step B3 shared computer 2 receives the request information.
  • shared computer 2 starts processing program 13.
  • step B4 the main DB 14 is accessed according to the processing program 13.
  • step B5 the “classification (disease name)” recorded in the main DB14 is searched according to the processing program 13, and the requested “possibility of colorectal cancer” (colorectal cancer ) Is extracted.
  • step B6 according to the processing program 13, the main DB14 is accessed, and the “polymorphism number” associated with the “classification (disease name)” (colorectal cancer) corresponding to “possibility of colorectal cancer” is obtained. Read out all “polymorphism patterns” associated with the polymorphism address and “morbidity” in all polymorphism patterns.
  • the read “polymorphism address”, “polymorphism pattern”, and “possibility of disease” are stored in the memory unit A10 in association with the request information. That is, “polymorphism address”, “polymorphism pattern”, and “possibility of morbidity” for a predetermined “Gno.” Are recorded in the memory unit A 10.
  • step B7 the "Gno.”, “Polymorphism address”, “polymorphism pattern” and “possibility” recorded in the memory section A10 are transmitted to the communication network 1.
  • step B8 “Gno.”, “Polymorphism address”, “polymorphism pattern”, and “possibility of morbidity” transmitted from the shared computer 2 are received.
  • the received “Gno.”, “Polymorphism address”, “polymorphism pattern” and “possibility of morbidity” are recorded in the memory 26.
  • step B9 the data II recorded on the genome-related information recording medium 24 is accessed according to the processing program 27. At this time, it is preferable to access the data I recorded on the genome-related information recording medium 24 to confirm whether the received “Gno.” Is correct.
  • step BIO SB10, according to the processing program 27, genome-related information
  • step BIO Extract polymorphism patterns at polymorphism addresses that match the received polymorphism addresses from 8 I do.
  • step BIO SB10
  • step BIO SB10
  • step BIO SB10
  • step BIO SB10
  • step BIO SB10
  • step BIO SB10
  • step BIO SB10
  • step BIO SB10
  • step BIO SB10
  • step BIO SB10
  • step BIO SB10
  • step BIO SB10
  • step B11 among all the “polymorphism patterns” associated with the received polymorphism address, the “morbidity” associated with the matched polymorphism pattern is extracted, and the extracted “ "Possibility” is output.
  • step B11 additional information recorded in data III, data IV, and data V is also read out at the same time, and the likelihood of colorectal cancer is output in a form corrected with the additional information. Good.
  • the genome-related information 28 recorded on the genome-related information recording medium 24 is not output to the outside of the personal computer 3 at all. That is, the genome-related information 28 is exchanged only between the genome-related information recording medium 24 and the personal computer 3. Therefore, according to this system, it is possible to more reliably prevent leakage of highly confidential individual-specific genome-related information 28.
  • the processing program 13 recorded in the memory 7 of the shared computer 2 and the processing program 27 recorded in the memory 23 of the personal computer 3 are, for example, as shown in FIG.
  • the information processing operation may be performed according to a simple flowchart.
  • the steps described as “(shared)” mean the processing in the shared computer 2 and the steps described as “(pieces)” indicate the processing in the personal computer 3. You.
  • step CI when the requester uses the present system, the processing program 27 recorded in the memory 23 is started.
  • the processing program 27 drives the reading device 25 of the personal computer 3 to access the genome-related information recording medium 24, and the ⁇ Gno. ”And all“ polymorphism addresses ”and“ polymorphism patterns ”recorded as data II.
  • the read “Gno.”, “Polymorphism address” and “polymorphism pattern” are stored in the memory unit 26.
  • step C2 based on the screen image displayed on the display device 22 by the processing program 27, the information that the requester wants to provide, for example, "Possibility of colorectal cancer (Request information) is input to the personal computer 3 and recorded from the personal computer 3 via the communication network 1 to the shared computer 2 as “Possibility of colon cancer” in the memory 26. "Gno.”, "Polymorphism address” and “polymorphism pattern" are transmitted.
  • step C3 the shared computer 2 receives the “possibility of colon cancer”, “Gno.”, “Polymorphism address”, and “polymorphism pattern”.
  • the received “Possibility of colorectal cancer” is recorded in the memory part A10 as request information, and “Gno.”, “Polymorphism address” and “polymorphism pattern” are also stored in the memory part A10. Is stored.
  • the shared computer 2 starts the processing program 13.
  • step C4 according to the processing program 13
  • the main DB 14 is accessed.
  • step C5 according to the processing program 13, the “classification (disease name)” recorded in the main DB 14 is searched, and the requested “possibility of colon cancer” (colorectal cancer ) Is extracted.
  • step C6 the main DB 14 is accessed in accordance with the processing program 13, the “polymorphism address” classified as “colorectal cancer” from the main DB 14, and all the polymorphism addresses for the polymorphism address are accessed.
  • the read “polymorphism address”, “polymorphism pattern”, and “possibility” are stored in the memory unit A10.
  • step C7 the data stored in the memory unit A10 in step C6 is searched based on the "polymorphism address" and the "polymorphism pattern” received in step C3.
  • the morbidity associated with the polymorphism pattern that matches the “polymorphism pattern” is extracted from the memory unit A 10.
  • step C8 the disease extracted based on the result of step C7, that is, the polymorphism pattern included in the information received in step C3 matches the main polymorphism pattern in main DB 14
  • the possibility is transmitted to the personal computer 3 via the communication network 1.
  • the shared computer 2 sends the extracted morbidity to the requestor. Sent with "Gno.”
  • step C9 “Gno.” And “possibility of morbidity” (semantic information) transmitted from shared computer 2 are received.
  • the received “Gno.” And “possibility” are recorded in the memory unit 26.
  • step CIO the possibility of colon cancer is displayed on the display device 22 from the semantic information recorded in the memory unit 26 according to the processing program 27.
  • shared computer 2 reads out (creates) a screen displaying semantic information in accordance with processing program 13, and sends the screen to personal computer 3 via communication network 1. It can also be displayed on the display device 22. Also in this case, it is assumed that semantic information has been transmitted from the shared computer 2 to the personal computer 3. As a result, the requester can obtain the possibility of morbidity for colorectal cancer using the genome-related information 28 recorded on the genome-related information recording medium 24.
  • a third party or a third party can easily monitor and manage the shared computer 2 by checking the main DB 14. Therefore, the present system can perform, for example, administrative management on the side that provides semantic information, and can perform soundness and ethical management on the side that provides semantic information.
  • a storage medium having only the data I and additionally data III to V, which is obtained by removing the information included in the data II from the genome-related information recording medium may be used.
  • the information included in the data II is recorded in an external database (genome-related information recording medium) connected to the personal computer 3 via the communication network 1.
  • an external database is accessed via the communication network 1 to read out the polymorphism pattern of the instructed polymorphism address.
  • the polymorphism pattern can be stored in the memory unit 26 in association with the polymorphism pattern. Therefore, even in such a system, the requester can transmit semantic information in the same manner as the flowcharts shown in FIGS. 15 and 16 and the flowcharts shown in FIGS. 17 and 18. Obtainable.
  • the requester has neither the genome-related information recording medium 24 nor the recording medium except for the information included in the data II from the genome-related information recording medium, and the communication network 1 It may have a genome-related information recording medium 24 connected to the personal computer 3 via the personal computer 3.
  • the requester accesses the genome-related information recording medium 24 via the communication network 1 and obtains the “polymorphism address” and “polymorphism” recorded on the genome-related information recording medium 24.
  • Information such as "patterns” can be downloaded to the personal computer 3.
  • the genome-related information recording medium 24 may be a medium in which genome-related information on a plurality of individuals is recorded for each individual (for each “Gno.”).
  • the present invention is not limited to the configuration in which the shared computer 2 has the main DB 14 as described above.
  • the main DB 14 connected to the shared computer 2 via the communication network 1
  • the shared computer 2 connects the communication network 1 to the main DB 14 in the flowcharts shown in FIGS. 15 and 16, the flowchart shown in FIG. 17 or the flowchart shown in FIG. 18. Access via Even in this case, according to the present information processing system, the requester can obtain the desired semantic information according to the flowcharts shown in FIGS. 15 and 16, the flowchart shown in FIG. 17 or the flowchart shown in FIG. 18. Obtainable.
  • the shared computer 2 accesses a plurality of main DBs 14 owned by different organizations or organizations through the communication network 1 and uses semantic information included in the plurality of main DBs 14.
  • the shared computer 2 accesses various main DBs 14 having information on the possibility of colorectal cancer as semantic information.
  • the requester can obtain information on the possibility of colorectal cancer, based on information contained in various main DBs 14.
  • the flowchart shown in FIG. 15 and FIG. 16 the flowchart shown in FIG. 17 or the flowchart shown in FIG.
  • at least the request information received from the personal computer 3 may be transmitted, and semantic information (in this example, “possibility of colon cancer”) may be obtained via the agent.
  • useful information for each individual and / or information related to the semantic information is provided by effectively utilizing a difference in nucleotide sequence information between individuals. It is possible to construct an information processing system capable of creating such semantic information.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

個体間における塩基配列情報の相違を有効に利用して各個体にとって有益な意味情報及び/又は当該意味情報に関連する情報を提供するシステムを構築する。 所定の個体に関する塩基配列関連情報を受け取るステップaと、塩基配列における位置を意味する位置情報及び当該位置情報に対応する塩基配列関連情報が互いに関連付けられたセットが複数含まれた塩基配列関連情報群が個体毎に格納された記憶装置から、前記受け取った塩基配列関連情報と一致性がある塩基配列関連情報を含んだ塩基配列関連情報群を特定するステップbとを有する。

Description

塩基配列関連情報を用いた情報処理システム 技術分野
本発明は、 例えば通信回線網を介して情報を提供する情報処理システムに関する。 背景技術 明
現在、 ヒ トを始めとする各種生物のゲノム塩基配列が急速に決定されており、 様々なデータベースにゲノム塩基配列情報が蓄積されている。 例えば、 インターネ 書
ット等の情報通信網を介して、 各種研究機関や研究者がデータベースに蓄積された ゲノム塩基配列情報を利用できるようなシステムの構築がなされつつある。
同時に、 このようなゲノム塩基配列情報に含まれる塩基配列を用いて、 ゲノム創 薬の研究や遺伝情報の解析等が盛んに行われており、 一塩基多型に代表されるよう な個体間における塩基配列の相違が注目されている。 一般に、 個体間における塩基 配列の相違とは、 所定の塩基の相違が個体種中 1 %以上の頻度で存在すると定義さ れる多型と、 所定の塩基の相違が個体種中 1 %未満であるバリエーションとを意味 している。 特に、 多型には、 個体間における 1個の塩基の相違である一塩基多型 (SNP; Single Nucleotide Polymorphism) 、 1力 ら数十塩基 (数千塩基の場合もあ る) が欠失又は挿入している挿入/欠失多型、 2から数十塩基を 1単位とする配列の 繰り返し回数が相違する VNTR (Variable Number of Tandem Repeat) やマイクロサ テライト多型 (繰り返し配列が 2〜 4塩基程度のもの) が知られている。
このような多型は、 個体間におけるタンパク質のアミノ酸配列の相違や、 個体間 における所定の遺伝子に関する発現効率の相違等に影響を及ぼすことがある。 この ような影響により、 例えば、 所定の疾病に対する罹患可能性が個体間で異なったり、 所定の薬剤に対する感受性が個体間で異なることが知られている。
ところが、 多型等の個体間における塩基配列情報の相違を有効に利用して、 各個 体にとって有益な意味情報を提供するようなシステムは構築されていないのが現状 である。 発明の開示
そこで、 本発明は、 このような現状に鑑み、 個体間における塩基配列情報の相違 を有効に利用して各個体にとつて有益な意味情報及び/又は当該意味情報に関連する 情報を提供するシステムを構築することを目的とする。
上述した目的を達成した本発明に係る塩基配列に関する情報処理方法は、 所定の 個体に関する塩基配列関連情報を受け取った後、 個体毎に塩基配列関連情報群を有 する記憶装置から前記受け取つた塩基配列関連情報と一致性がある塩基配列関連情 報を含んだ塩基配列関連情報群を特定する方法である。 本方法によれば、 塩基配列 関連情報群を特定することによって、 前記受け取った塩基配列関連情報が帰属する 個体を特定することもまたできる。
また、 本発明に係る塩基配列に関する情報処理方法は、 所定の個体に関する個体 関連情報を受け取り、 特定した塩基配列関連情報群若しくは個体と、 前記受け取つ た個体関連情報とを関連付けて記憶することで、 当該個体関連情報と個体に関する 塩基配列関連情報群とを関連付けることができる。
なお、 本発明に係る塩基配列に関する情報処理方法において、 塩基配列関連情報 群を特定する際には、 例えば、 予め決まった位置情報に対応する塩基配列関連情報 を受け取り、 当該受け取った塩基配列関連情報を用いることができる。 また、 本発 明に係る塩基配列に関する情報処理方法においては、 所定の個体に関する塩基配列 関連情報の受け取りと、 当該受け取った塩基配列関連情報と一致性がある塩基配列 関連情報を含んだ塩基配列関連情報群の特定とを、 唯一の塩基配列関連情報群を特 定すまで繰り返すこともできる。
さらに、 本発明に係る塩基配列に関する情報処理方法は、 所定の個体に関して個 体関連情報を受け取ることによって、 当該所定の個体に関する塩基配列関連情報群 と個体関連情報とを関連付けたデータベースを構築することもできる。
本発明に係る塩基配列に関する情報処理方法は、 前記データベースに含まれる複 数の個体に関する複数の個体関連情報及び複数の個体に関する塩基配列関連情報群 を統計的に処理することで、 塩基配列関連情報を意味づける意味情報及び/又は当該 意味情報に関連する情報を創出することができる。 このとき、 当該複数の個体に関 する塩基配列関連情報群は、 前記データベースに含まれていても、 含まれていなく ても良い。 また、 統計的に処理した結果と複数の個体に関する複数の個体関連情報 とを用いて更に統計的に処理することによって、 意味情報及び/又は当該意味情報に 関連する情報を創出してもよい。
一方、 本発明に係る塩基配列に関する情報処理方法は、 創出された塩基配列関連 情報を意味づける意味情報及び/又は当該意味情報に関連する情報を受け取り、 受け 取った意味情報及び/又は当該意味情報に関連する情報を用いて、 物品及び/又はサ 一ビスの要求情報に応じた意味情報及び/又は当該意味情報に関連する情報を提供す るための記憶装置の記憶内容を構築することもできる。
なお、 本発明に係る塩基配列に関する情報処理方法は、 制御装置、 送受信装置及 ぴ記憶装置等のハードウェアを備えるコンピュータに、 各ステップを実行させるプ ログラムとして実現することができる。 また、 本発明に係る塩基配列に関する情報 処理方法は、 制御装置、 送受信装置及び記憶装置等のハードウェアを備えるコンビ ユータに、 各ステップを実行させるプログラムを記録した記録媒体として実現する こともできる。 さらに、 本発明に係る塩基配列に関する情報処理方法は、 各ステツ プを実行する制御装置、 送受信装置及び記憶装置等のハードウ アを備える情報処 理装置として実現することもできる。
その他、 本発明は、 請求項各項に記載されている通りの構成を有するものである c 本明細書は本願の優先権の基礎である日本国特許出願 2002- 336916号の明細書およ ぴ /または図面に記載される内容を包含する。 図面の簡単な説明
図 1は、 本発明を適用した情報処理システムの構成を概略的に示す概略構成図で める。
図 2は、 共用コンピュータの構成を概略的に示す概略構成図である。
図 3は、 メイン DBに記録されたデータの一例を示す構成図である。
図 4は、 統計解析用コンピュータの構成を概略的に示す概略構成図である。
図 5は、 ゲノム関連情報 D Bに記録されたデータの一例を示す構成図である。
図 6は、 個体関連情報 D Bに記録されたデータの一例を示す構成図である。 図 7は、 個人用コンピュータの構成を概略的に示す概略構成図である。 図 8は、 ゲノム関連情報記録媒体に記録されたデータの一例を示す構成図である。 図 9は、 個体関連情報とゲノム関連情報とを関連連付ける情報処理システムにお いて、 統計解析用コンピュータ及ぴ個人用コンピュータでの処理を示すフローチヤ ートである。
図 1 0は、 個体関連情報収集画面の一例として示す面面ィメージである。
図 1 1は、 ゲノム関連情報 D Bの全データから、 多型番地における各多型パター ンの出現頻度を算出したデータの一例を示す構成図である。
図 1 2は、 ゲノム関連情報 D Bと個体関連情報 D Bとを用いて、 個体関連情報に ついて多型番地毎の各多型パターンの出現頻度を算出したデータの一例を示す構成 図である。
図 1 3は、 図 1 1及ぴ図 1 2に示したデータから、 個体関連情報について多型番 地毎の各多型パターンの割合値を算出したデータの一例を示す構成図である。
図 1 4は、 図 1 3に示したデータから、 個体関連情報について多型番地毎の各多 型パタ一ンの相対値を算出したデータの一例を示す構成図である。
図 1 5は、 所定の疾病に対する罹患可能性を提供するシステムにおいて、 共用コ ンピュータ及び個人用コンピュータでの処理を示すフローチャートである。
図 1 6は、 図 1 5の続きであり、 所定の疾病に対する罹患可能性を提供するシス テムにおいて、 共用コンピュータ及ぴ個人用コンピュータでの処理を示すフローチ ヤートである。
図 1 7は、 所定の疾病に対する罹患可能性を提供するシステムにおいて、 共用コ ンピュータ及び個人用コンピュータでの他の処理を示すフローチャートである。
図 1 8は、 所定の疾病に対する罹患可能性を提供するシステムにおいて、 共用コ ンピュータ及ぴ個人用コンピュータでの更に他の処理を示すフローチヤ一トである。 符号の説明
1…通信回線網、 2…共用コンピュータ、 3…個人用コンピュータ、 S T…統計解 析用コンピュータ 発明を実施するための最良の形態
以下、 図面を参照して本発明を詳細に説明する。
本発明を適用した実施の形態として、 利用者に対して所定の疾病の罹患可能性等 の意味情報を提供する情報処理システムにおいて、 当該意味情報を創出するシステ ムについて説明する。 すなわち、 情報処理システムは、 利用者に対して提供する罹 患可能性等の意味情報を、 個体に関する情報 (以下、 個体関連情報) から創出する システムである。
以下の説明においては、 個体関連情報から意味情報を創出する情報処理システム について説明するが、 説明の都合上、 簡略化したモデルとして説明する。 情報処理 システムは、 図 1に示すように、 インターネット等の通信回線網 1と、 通信回線網 1に接続された共用コンピュータ 2と、 通信回線網 1に接続された少なくとも 1以 上の個人用コンピュータ 3と、 通信回線網 1に接続された統計解析用コンピュータ S Tとを備え、 通信回線網 1を介して共用コンピュータ 2と個人用コンピュータ 3 と統計解析用コンピュータ S Tとの間のデータ通信を可能としている。
共用コンピュータ 2は、 図 2に示すように、 当該共用コンピュータ 2の動作を全 て制御する CPU 4と、 情報及ぴプログラムの実行指示等を入力できるキーボード及び マウス等の入力装置 5と、 ディスプレイ装置等の表示装置 6と、 一時的な情報及び 書き換え不可能な情報等が記録されるメモリー 7と、 各種データを格納しているデ ータベース 8と、 これらメモリー 7及びデータベース 8に対して所定の情報を書き 込む記録装置 9と、 通信回線網 1を介して個人用コンピュータ 3との間で情報の送 受信を行う送受信装置 1 7とから構成されている。
共用コンピュータ 2におけるメモリー 7は、 それぞれ異なる種類の情報を記録す るメモリー部 A 1 0及びメモリー部 B 1 1と、 例えば個人用コンピュータ 3や表示 装置 6に表示させる画像データを記録した画面メモリー 1 2と、 本システムを動作 させるための処理プログラム 1 3とから構成されている。 なお、 共用コンピュータ
2においては、 画面メモリー 1 2及ぴ処理プログラム 1 3等を内部のメモリー 7に 有さず、 通信回線網 1を介して共用コンピュータ 2と接続された外部記憶装置 (図 示せず) に有するものであってもよい。
共用コンピュータ 2におけるデータベース 8 (記憶装置) は、 多型番地、 多型パ ターン及び意味情報が記録されたメイン DB 1 4と、 メモリー部 A 1 0に記録された 情報を保存する保管用 DB - A 1 5と、 メモリー部 B 1 1に記録された情報を保存する 保管用 DB-B 1 6とから構成されている。 メイン DB 1 4は、 図 3に示すように、 多型 番地と、 当該多型番地で取りうる複数の多型パターンと、 当該複数の多型パターン それぞれを意味づける意味情報とが関連付けられて記録されている。 また、 メイン DB 1 4には、 複数の多型番地における多型パターンの組合せ (例えば、 ハプロタイ プ) を意味づける意味情報が記録されていても良い。
ここで、 「多型番地 (位置情報) 」 とは、 少なくとも、 塩基配列における多型が 存在する位置を意味する。 なお、 一般的に多型とは、 例えば、 いわゆる SNP (single nucleotide polymorphism; RFLP (restriction fragment length or polymorphism) VNTR (variable number of tandem repeat)、 マイクロサテライト等を含んでいる。 しかし、 本明細書において使用する 「多型」 は、 これらに限定されず、 個体種中 1 %未満の頻度でしか存在しない塩基及ぴ塩基配列の変化 (バリエーション) も含 む意味とする。 したがって、 「多型番地」 は、 個体種中 1 %未満の頻度でしか存在 しない塩基及び塩基配列の変化を示す、 塩基配列における位置も含む意味である。 すなわち、 「多型番地」 とは、 数値、 文字及び記号等を組み合わせて、 多型等を示 す位置を表すものである。 多型番地は、 特に限定されないが、 例えば、 染色体番号 と多型が存在する遺伝子を表す記号と当該遺伝子における多型の存在位置を示す数 値との組み合わせにより表記することもできるし、 多型が存在する遺伝子を示す記 号と当該遺伝子における多型の存在位置を示す数値との組み合わせであってもよい c また、 多型番地は、 多型毎に付与される多型固有の表記であっても良い。 多型番 地として多型固有の表記を使用する場合、 多型番地は塩基配列中の位置を直接的に は示さないが、 多型固有の表記に基づいて間接的に位置を知ることができる。 した がって、 「多型番地」 は、 多型固有の表記も含む意味である。
「多型パターン (塩基配列関連情報) 」 とは、 個体間において相違する塩基配列 の情報であり、 少なくとも、 多型における塩基又は塩基配列のパターンを含む意味 である。 さらに 「多型パターン」 は、 多型に限らず、 個体種中 1 %未満の頻度でし か存在しなレ、塩基及び塩基配列のパターンも含む意味である。
例えば、 A又は Gを取ることが知られている多型番地において、 「多型パター ン」 は、 「A」 及び 「G」 のいずれかで表される。 また、 「多型パターン」 は、 相 同染色体におけるヘテロ接合体又はホモ接合体を示すものであってもよい。 この場 合、 例えば、 A又は Gを取ることが知られている多型番地において、 「多型パター ン」 は、 「AA」 、 「G G」 及ぴ 「A G」 のいずれかで表現できる。 さらに、 「多 型パターン」 は、 所定の多型番地で取りうるパターンを直接的に表記するものでは なく、 間接的に表記するものであっても良い。 すなわち、 「多型パターン」 は、 例 えば、 A又は Gを取ることが知られている多型番地において 「A」 を取る場合に 「アレル 1」 とし、 「G」 を取る場合に 「アレル 2」 と表記してもよレ、。 また、 「多型パターン」 が上述したように 「AA」 、 「G G」 及ぴ 「A G」 のいずれかで 表現できる場合、 例えば、 「AA」 で表現できるときに 「ひ」 、 「G G」 で表現で きるときに 「i3」 、 「A G」 で表現できるときに 「τ/」 と表記してもよい。 その他 「多型パターン」 の表記例としては、 多型がマイクロサテライトの場合には 「繰り 返し数」 を表す数値で、 多型が揷入、 欠失型の場合には 「有/無」 を表す記号で表記 してもよい。
また更に、 各多型番地における 「多型パターン」 は、 所定の規則や取り決めに従 つて、 例えば、 「多型 1」 、 「多型 2」 、 「多型 3」 等と表記されても良い。 例え ば、 各多型番地において、 「多型パターン」 がとり得る頻度の高い順に、 「多型 1」 、 「多型 2」 、 「多型 3」 と表記できる。 この場合、 例えば、 各多型番地にお けるそれぞれの 「多型 1」 は必ずしも同じ内容を表すものではない。 すなわち、 例 えば、 ある多型番地の 「多型 1」 は最もとり得る頻度が高い 「Α Α」 を表し、 別の 多型番地 「多型 1」 は最もとり得る頻度が高い 「G G」 を表すことになる。 なお、 本実施の形態においては、 「多型パターン」 を 「多型 1」 、 「多型 2」 及び 「多型 3 j 等のいずれかで表記する方法を使用している。 ところで、 本システムにおいて は、 多型パターンは、 暗号化されていても暗号化されていなくても差し支えない。 ここで、 「意味情報」 とは、 「多型パターン」 に関連づけられた情報であり、 例 えば、 薬剤に対する応答性、 薬剤に対する副作用、 疾患及び障害に対するリスク、 体質 ·性質、 体質 ·性質等に基づく生活習慣ァドバイス、 タンパク質相互作用など、 「多型パターン」 の相違に起因する様々な情報を意味する。
なお、 「意味情報」 としては、 「多型パターン」 の相違に起因する様々な情報を 直接表しても良く、 また、 当該情報を意味する記号などを用いて間接的に表しても 良い。 「意味情報」 は、 ゲノム ·遺伝子に関する研究が進むことにより種類が増加 するとともに訂正が行われる種類の情報であり、 常にパージヨンアップすることが 好ましい。 すなわち、 「意味情報」 は、 ゲノム ·遺伝子の研究成果を用いてデータ ベースを更新することによって、 蓄積量が増加 '減少してより精度の高いものとな る。
なお、 直接 「多型パターン」 には関連づけられていないが 「意味情報」 から更に 導き出される情報は、 「意味情報に関連する情報」 である。 「意味情報」 が 「疾患 に対するリスク」 である場合、 当該リスクがある一定の水準を超えたときに、 例え ば特定の 「健康診断検査項目」 が導き出される。 この特定の 「健康診断検査項目」 が 「意味情報に関連する情報」 である。
本実施の形態において意味情報は、 図 3に示すように、 少なくとも、 所定の 「多 型番地」 及び 「多型パターン」 に関連づけられた 「多型パターンに対する注釈情 報」 としてメイン DB 1 4に記録されている。 また、 意味情報には、 所定の 「多型番 地」 に対応する 「多型分類」 及び 「分類 (疾患名) 」 等が関連づけられている。 す なわち、 所定の 「多型番地」 が所定の 「多型パターン」 である場合、 疾患名の種類 と当該疾患に対する罹患可能性を示す注釈情報 (意味情報) を得ることができる。 したがって、 例えば、 意味情報は、 複数の多型番地に対応するそれぞれの多型パタ ーンの組み合わせ (例えば、 ハプロタイプ) に対して関連付けることもできる。 す なわち、 複数の多型番地における多型パターンの組み合わせ毎に、 所定の疾患に対 する異なる罹患可能性を示す注釈情報 (意味情報) を関連付けることができる。 こ の場合、 複数の多型番地が所定の多型パターンの組み合わせである場合、 所定の疾 患に対する罹患可能性を示す注釈情報 (意味情報) を得ることができる。
また、 意味情報には、 所定の基準で決定した 「公開レベル」 を関連づけることも できる。 例えば、 「公開レベル」 を決定する際の基準としては、 意味情報、 すなわ ちここでは 「分類 (疾患名) 」 の罹患可能性を公開することによる個人に対する不 測の不利益等を考慮して定めることができる。 詳細には、 共用コンピュータ 2にお いて、 法律、 規則又は自らの行動基準若しくは利用者との契約等に鑑みて、 公開す ることが相応しくない意味情報については、 公開しないような 「公開レベル」 を決 定することができる。 この場合、 本システムでは、 公開不可を意味する 「公開レべ ル」 に関連付けられた罹患可能性を示す注釈情報については、 利用者に対して開示 することはない。 これにより、 利用者に対して不測の不利益となりうる意味情報を 与えることや、 契約者以外に意味情報が開示されることを防止できる。
なお、 利用者がインフォームドコンセント等により、 所定の 「公開レベル」 を関 連づけた意味情報の開示を容認することにより、 利用者に対して、 所定の 「公開レ ベル」 が関連づけられた意味情報を公開するようなシステムであってもよい。
また、 「公開レベル」 は、 例えば 「1 , 2 , 3、 ···」 又は 「a , b, c , ···] とい つた 3以上の複数の段階として設定することができる。 この場合、 共用コンビユー タ 2側では、 利用者の年齢、 資格及び利用者との契約の有無等、 利用者の種類に応 じてレベルを設定することができる。 なお、 インフォームドコンセント等によって、 所定の公開レベル以上 (又は未満) の公開レベルに関連付けられた罹患可能性を示 す注釈情報のみが利用者側に対して提供されるように、 当該利用者側が公開レベル を選択することもできる。
なお、 データベース 8において、 保管用 DB- B 1 6には、 例えば、 本システムを利 用する要求者個人の遺伝情報である塩基配列関連情報といったデータを記録するこ とができる。 また、 保管用 DB-A 1 5には、 例えば、 本システムを利用する要求者を 特定する情報といったデータを記録することができる。 このように、 保管用 DB-A 1 5及ぴ保管用 DB-B 1 6に、 個人の遺伝情報と個人を特定する情報とを分けて記録す ることによって、 要求者の遺伝情報と、 要求者を特定するデータとを関連付け難く なる。
なお、 共用コンピュータ 2は、 データベース 8を内部に有するものに限定されず、 通信回線網 1を介して共用コンピュータ 2に接続された外部データベース (図示せ ず) を有するものであってもよい。 また、 共用コンピュータ 2は、 内部に複数のデ ータベース 8を有するものであってもよいし、 内部のデータベース 8と通信回線網 1を介して共用コンピュータ 2に接続された外部データベースとを有するものであ つても良い。
統計 祈用コンピュータ S Tは、 図 4に示すように、当該統計解析用コンピュータ
S Tの動作を全て制御する CPU 3 0と、情報及ぴプログラムの実行指示等を入力でき るキーボード、マウス等の入力装置 3 1と、ディスプレイ装置等の表示装置 3 2と、一 時的な情報及び書換え可能な情報や書換え不可能な情報等が記録されるメモリー 3 3と、各種データを格納しているデータベース 3 4と、これらメモリー 3 3及びデー タベース 3 4に対して所定の情報を書き込む記録装置 3 5と、通信回線網 1を介して 共用コンピュータ 2及び個人用コンピュータ 3との間で情報の送受信を行う送受信装 置 3 6とから構成されている。
統計解析用コンピュータ S Tにおけるメモリー 3 3は、 個人用コンピュータ 3か ら送られた多型パターン等を一時的に記録したり、 統計解析結果等を記録するメモ リー部 3 7と、 例えば個人用コンピュータ 3や共用コンピュータ 2や表示装置 3 2 に表示させる画像データを記録した画面メモリー 3 8と、 本システムを動作させ、 複数の個人 (個体) に関する「個体関連情報」と複数の個人 (個体) に関する「ゲノム 関連情報」とを用いて、 例えば、 所定の疾患に対する罹患可能性を示す注釈情報とい つた意味情報を創出する処理プログラム 3 9とが記録されている。 なお、 当該処理 プログラム 3 9によれば、 先ず、 複数の個人 (個体) に関する「ゲノム関連情報」と 複数の個人 (個体) に関する「個体関連情報」とを集積した後、 当該「ゲノム関連情 報」と当該「個体関連情報」とを用いて統計的に処理することで、 所定の疾患に対する 罹患可能性を示す注釈情報 (意味情報) 等を得ることができる。 なお、 統計解析用 コンピュータ S Tにおいては、 処理プログラム 3 9やメモリー部 3 7を内部のメモ リー 3 3に有さず、 通信回線網 1を介して統計解析用コンピュータ S Tに接続され た外部記憶装置 (図示せず) に有するものであっても良い。
ここで、 「個体関連情報」とは、 個体の性質、 心理的状態、 体質、 体調、 健康状態、 病歴、 生活習慣、 行動 ·思考パターン、 癖及び嗜好等、 所定の個体に関するあらゆ る情報が含まれる。 例えば、 個体関連情報としては、 予め準備された質問等に対し て利用者等の個人 (個体) が回答することから得られる情報、 或いは、 例えば、 利 用者等が医療機関や検査機関等で検査を受けることによって得られる情報を挙げる ことができる。
また、 「ゲノム関連情報」とは、 所定の個体に関する複数の「多型パターン」をそれ ぞれ所定の「多型番地」に関連付けたデータの群 (塩基配列関連情報群) である。
統計解析用コンピュータ S Tにおけるデータベース 3 4 (記憶装置) は、 複数の 個人 (個体)に関する「ゲノム関連情報」を各個人 (個体) 毎に記録した「ゲノム関連情 報 D B 4 0」 (図 5に示す) を有している。 なお、 「ゲノム関連情報 D B 4 0」 に記 録された「ゲノム関連情報」は、 直接個人 (個体) を特定する情報と結びつかないよ うに匿名化されていることが望ましい。
また、 データベース 3 4は、 個人用コンピュータ 3より受信した「個体関連情報」 を各個人 (個体) 毎に記録した 「個体関連情報 D B 4 1」 (図 6に示す) を有して いる。 なお、 「個体関連情報 D B 4 1」に記録された「個体関連情報」は、 直接個人 (個体) を特定する情報と結びつかない、ように匿名化されていることが望ましい。 なお、 統計解析用コンピュータ S Tは、 前記データベース 3 4を内部に有するも のに限定されず、 通信回線網 1を介して統計解析用コンピュータ S Tに接続された 外部データベース (図示せず) に対してアクセスするものであっても良い。
個人用コンピュータ 3は、 図 7に示すように、 当該個人用コンピュータ 3の動作 を全て制御する CPU 2 0と、 情報及ぴプログラムの実行指示等を入力できるキ 一ボード及ぴマウス等の入力装置 2 1と、 ディスプレイ装置等の表示装置 2 2と、 一時的な情報及び書き換え可能な情報等が記録されるメモリー 2 3と、 ゲノム関連 情報記録媒体 2 4からデータを読み取る読取り装置 2 5と、 通信回線網 1を介して 共用コンピュータ 2との間で情報の送受信を行う送受信装置 2 9とから構成されて いる。 なお、 個人用コンピュータ 3は、 通常のコンピュータに限定されず、 例えば、 携帯電話、 個人携帯端末及びその他の移動体通信機器等、 いかなる形態であっても よい。
個人用コンピュータ 3におけるメモリー 2 3は、 ゲノム関連情報記録媒体 2 4か らの情報等を記録するメモリー部 2 6を有し、 本情報処理システムを動作させる処 理プログラム 2 7が記録されている。
ゲノム関連情報記録媒体 2 4には、 個人のゲノム関連情報 2 8が記録されている。 ゲノム関連情報記録媒体 2 4としては、 例えば、 磁気ディスクや磁気カード等の磁 気記録媒体、 光磁気記録方式や相変化記録方式等を適用した光学式記録媒体、 半導 体メモリー等を挙げることができる。 また、 このゲノム関連情報記録媒体 2 4は、 カード状、 ディスク状、 スティック状、 テープ状又はドラム状等いかなる形態であ つてもよい。 さらに、 このゲノム関連情報記録媒体 2 4は、 単一の個人 (個体) の ゲノム関連情報 2 8を記録したものであってもよいが、 複数の個人 (個体) に関す る複数のゲノム関連情報 2 8を記録したものであってもよい。
ゲノム関連情報記録媒体 2 4に含まれるゲノム関連情報 2 8とは、 少なくとも、 「多型番地」 及び個人 (個体) の塩基配列を解析した結果として得られる所定の多 型番地における 「多型パターン」 を意味する。 また、 ゲノム関連情報 2 8には、 既 往症、 特徴、 カルテ情報、 健康診断結果といった各種情報を含んでいてもよい。 ゲノム関連情報記録媒体 2 4には、 ゲノム関連情報 2 8として、 例えば、 図 8に 示すように、 データ Iとしてゲノム関連情報 2 8に固有の個別番号 「Gno.」 (ジーナ ンパー) 及ぴ生年月日等の個人情報を記録し、 データ IIとして多型番地及び多型パ ターンを記録し、 データ IIIとして既往症を記録し、 データ IVとして特徴を記録し、 データ Vとしてカルテ情報等を記録する。 すなわち、 ゲノム関連情報 2 8は、 データ I、 データ II、 データ III、 データ IV及びデータ Vから構成されている。 データ I及び データ IIには必須の情報が含まれており、 データ III、 データ IV及びデータ Vには付 加的な情報から構成されている。
ゲノム関違情報 2 8においては、 塩基配列上の位置に対応する 「多型番地」 と、 当該多型番地における 「多型パターン」 とをリンクさせて記録している。 また、 デ ータ IIには、 所定の多型番地における付加的な情報を 「コメント」 として、 「多型 番地」 にリンクさせて記録していてもよい。 なお、 データ IIには、 所定の個体に関 する全塩基配列を記録しても良い。 データ IIに全塩基配列を記録した場合であって も、 データ II内に 「多型番地」 及び 「多型パターン」 が含まれることとなる。
なお、 本発明において、 個人用コンピュータ 3及びゲノム関連情報記録媒体 2 4 は、 それぞれ図 7及び図 8に示したような構成に限定されず、 例えば、 ゲノム関連 情報記録媒体が処理プログラムを有するメモリー部を備え、 個人用コンピュータが 当該ゲノム関連情報記録媒体を装着して処理プログラムを動作させるような構成で あってもよい。 この場合、 個人用コンピュータは、 ゲノム関連情報記録媒体のメモ リ一部に記録された処理プログラムに従つて動作できる。
以上のように構成された情報処理システムにおいては、 統計解析用コンピュータ
S Tのメモリー 3 3が有する処理プログラム 3 9及び個人用コンピュータ 3のメモ リー 2 3に記録された処理プログラム 2 7が例えば、 図 9に示すようなフローチヤ ートに従って情報処理動作する。 なお、 図 9に示すフローチャートにおいて、 「 (統) 」 と記載したステップは統計解析用コンピュータ S Tにおける処理を意味 し、 「 (個) 」 と記載したステップは個人用コンピュータ 3における処理を意味し ている。
本情報処理システムは、 ゲノム関連情報記録媒体 2 4を所持する各個人が個人用 コンピュータ 3を用いて通信回線網 1を介して統計解析用コンピュータ S Tにァク セスし、 各個人 (個体) に関する 「個体関連情報」 を統計解析用コンピュータ S T の 「個体関連情報 D B 4 1」 に、 「ゲノム関連情報 D B 4 0」 の中のゲノム関連情 報と関連付けて登録するシステムである。 なお、 本情報処理システムは、 複数人の ゲノム関連情報 2 8がそれぞれ記録されたゲノム関連情報記録媒体 2 4を用い、 各 個人がゲノム関連情報記録媒体 2 4にアクセスするようなシステムであってもよい。 このとき、 先ず要求者は、 ステップ 1 ( S 1 ) で、 通信回線網 1を介して統計解 析用コンピュータ S Tにアクセスし、 統計解析用コンピュータ S Tに対して個体関 連情報の登録を行う旨の意思表示を行う。 ステップ 1では、 統計解析用コンビユー タ S Tが提供するゥヱプページにアクセスして前記意思表示を行っても良いし、 統 計解析用コンピュータ S Tに対して電子メール等を用いてアクセスして前記意思表 示を行っても良い。 なお、 本例においては、 要求者が自らの個体関連情報を登録す る場合について述べるが、 これに限定されず、 要求者が自分以外の個人 (個体) に 関する個体関連情報を登録することもできる。
次に、 統計解析用コンピュータ S Tは、 前記意思表示を個人用コンピュータ 3か ら受信した後、 ステップ 2 ( S 2 ) で、 画面メモリー 3 8から、 図 1 0に示すよう な 「個体関連情報収集画面」 を読み出し、 個人用コンピュータ 3の表示装置 2 2に 表示する。 ステップ 2では、 統計解析用コンピュータ S Tが提供するウェブページ に個人用コンピュータ 3がアクセスした状態で個体関連情報収集画面を表示しても 良いし、 個人用コンピュータ 3に対して送信した個体関連情報収集画面データに基 づいて個人用コンピュータ 3の表示装置 2 2に表示しても良い。
次に、 個人用コンピュータ 3は、 ステップ 3 ( S 3 ) で、 個体関連情報収集画面 に従って、 要求者自身の個体関連情報を入力する。 すなわち、 要求者は、 個体関連 情報収集画面に表示されている設問に対して回答し、 当該個体関連情報収集画面に 回答内容を入力する。 或いは、 要求者は、 個体関連情報収集画面に表示されている 設問に対する回答を、 当該個体関連情報収集画面とは異なる回答用画面に入力して も良い。 また、 ステップ 3では、 個体関連情報として利用者 (要求者) 等が医療機 関や検査機関等で検査を受けることによって得た情報を入力しても良い。
次に、 個人用コンピュータ 3は、 ステップ 4 ( S 4 ) で、 個体関連情報収集画面 に表示されている設問に対する回答 (個体関連情報) を統計解析用コンピュータ S Tに対して送信する。 ステップ 4では、 回答を入力した個体関連情報収集画面デー タ又は回答を入力した回答用画面データを、 通信回線網 1を介して送信することで 前記設問に対する回答を統計解析用コンピュータ S Tに対して送信することができ る。 また、 ステップ 4では、 個体関連情報として利用者 (要求者) 等が医療機関や 検查機関等で検査を受けることによつて得た情報を統計解析用コンピュータ S Tに 対して送信することもできる。
次に、 統計解析用コンピュータ S Tは、 個人用コンピュータ 3から個体関連情報 を受信した後、 ステップ 5 ( S 5 ) で、 個人用コンピュータ 3に対して、 複数の多 型番地を送信する。 ステップ 5で送信する複数の多型番地は、 既定の多型番地であ つても良いし、 ランダムに選択した多型番地であっても良!/、。
次に、 個人用コンピュータ 3は、 統計解析用コンピュータ S Tから複数の多型番 地を受信した後、 ステップ 6 ( S 6 ) で、 読取り装置 2 5を駆動してゲノム関連情 報記録媒体 2 4にアクセスする。 次に、 個人用コンピュータ 3は、 ステップ 7 ( S 7 ) で、 統計解析用コンピュータ S Tより受信した複数の多型番地について、 それ ぞれ対応する多型パターンを読み出す。 そして、 個人用コンピュータ 3は、 ステツ プ 8 ( S 8 ) で、 ステップ 7で読み出した多型パターンを対応する多型番地と関連 付けて統計解析用コンピュータ S Tに対して送信する。 すなわち、 ステップ 8では、 統計解析用コンピュータ S Tより受信した複数の多型番地それぞれについて、 対応 する多型パターンを関連付けて送信する。 なお、 ステップ 8で個人用コンピュータ
3から統計解析用コンピュータ S Tに送信する際には、 「Gno.」 のような個人 (個 体) を特定しうる情報を送信しないことが望ましい。
ところで、 本実施の形態では、 ステップ 5で統計解析用コンピュータ S Tが送信 した多型番地を個人用コンピュータ 3で受信し、 受信した多型番地に対応する多型 パターンをステップ 8で個人用コンピュータ 3が統計解析用コンピュータ S Tに対 して送信している。 しかしながら、 これに限定されず、 例えばステップ 4において、 個人用コンピュータ 3が統計解析用コンピュータ STに対して 「個体関連情報」 を 送信するとともに、 既定の多型番地と当該多型番地に対応する多型パターンとを自 発的に統計解析用コンピュータ S Tに対して送信してもよい。 この場合は、 上述し たステップ 5〜 8までは行われず、 ステップ 4の後に以下のステップ 9以降のステ ップを同様に行うことになる。
次に、 統計解析用コンピュータ STは、 個人用コンピュータ 3から多型番地及び 多型パターンを受信した後、 ステップ 9 (S 9) で、 ゲノム関連情報 DB40にァ クセスする。 なお、 ステップ 9では、 統計解析用コンピュータ STがゲノム関連情 報 DB 40を有さず、 外部の機関がゲノム関連情報 DB 40を有する場合には、 通 信回線網 1を介して当該外部の機関が有するゲノム関連情報 DB 40にアクセスす る。
次に、 統計解析用コンピュータ S Tは、 ステップ 10 (S 10) で、 個人用コン ピュータ 3より受信した複数の多型番地及ぴ多型パターンの組合せに基づいてゲノ ム関連情報 D B 40を検索し、 ゲノム関連情報 D B 40に格納されたゲノム関連情 報の中から、 受信した複数の多型番地及ぴ多型パターンの組合せを有する個人 (個 体) に関するゲノム関連情報を特定する。 言い換えると、 ステップ 10では、 ゲノ ム関連情報 DB 40に登録された複数の個人 (個体) に関する複数のゲノム関連情 報の中から要求者 (要求者が送信した 「個体関連情報」 に関連する個人 (個体) ) に関するゲノム関連情報を特定する。 ステップ 10では、 例えば、 特定した要求者、 すなわち個人 (個体) に関するゲノム関連情報に対して 「整理 No.」 を付与してもよ レ、。 或いは、 ステップ 10では、 ゲノム関連情報 DB4
0に登録している個人 (個体) に関するゲノム関連情報に対して予め付与された 「整理 No.」 を抽出しても良い。
次に、 統計解析用コンピュータ S Tでは、 ステップ 1 1 (S 1 1) で、 ステップ
1 0で特定した要求者 (要求者が送信した 「個体関連情報」 に関連する個人 (個 体) ) に関するゲノム関連情報と、 個人用コンピュータ 3より受信した個体関連情 報とを関連付ける。 具体的には、 ステップ 1 0で特定した要求者 (要求者が送信し た 「個体関連情報」 に関連する個人 (個体) ) に関するゲノム関連情報に付与した
「整理 No.」 、 又はステップ 1 0で特定した要求者 (要求者が送信した 「個体関連情 報」 に関連する個人 (個体) ) に関するゲノム関連情報について抽出した 「整理 No. J を、 個体関連情報に関連付けて格納した、 図 6に示すような 「個体関連情報 D B 4 1」 を作成する。
或いは、 ステップ 1 0では、 統計解析用コンピュータ S Tがゲノム関連情報 D B 4 0を有する場合には、 ゲノム関連情報 D B 4 0に格納されている要求者 (要求者 が送信した 「個体関連情報」 に関連する個人 (個体) ) に関するゲノム関連情報に 対して、 個人用コンピュータ 3より受信した個体関連情報を直接関連付けて格納し ても良い。
以上、 図 9に示すフローチャートに従えば、 例えば所定の要求者について、 当該 要求者に関する個体関連情報を、 当該要求者に関するゲノム関連情報に関連付けて 統計解析用コンピュータ S Tに登録することができる。 また、 複数の要求者が図 9 に示すフローチャートに従ってそれぞれ個体関連情報を登録することによって、 統 計解析用コンピュータ S Tは、 複数の個人 (個体) に関する個体関連情報を有する こととなる。 言い換えると、 統計解析用コンピュータ S Tは、 複数の個体に関する ゲノム関連情報についてそれぞれ個体関連情報を関連付けて格納したデータベース を作成することができる。
以上のように、 本システムによれば、 統計解析用コンピュータ S丁の 「ゲノム関 連情報 D B 4 0」 に、 予め匿名化して記録しておいたゲノム関連情報に対して、 後 から匿名化した個体関連情報を統計解析用コンピュータ S Tに送信した場合であつ ても、 当該ゲノム関連情報と当該個体関連情報とをリンクさせることができる。
なお、 図 9に示したフローチヤ一トにおいては、 統計解析用コンピュータ S Tは- ステップ 5で送信した複数の多型番地について、 個人用コンピュータ 3より多型パ ターンを受信し、 ステップ 1 0でゲノム関連情報 D B 4 0を検索することによって 要求者 (要求者が送信した 「個体関連情報」 に関連する個人 (個体) ) に関するゲ ノム関連情報を特定している。 しかしながら、 本情報処理システムにおいては、 要 求者 (要求者が送信した 「個体関連情報」 に関連する個人 (個体) ) に関するゲノ ム関連情報の特定に際してこの方法に限定されず、 例えば、 所定の 「多型番地」 及 び 「多型パターン」 の組合せを、 順次個人用コンピュータ 3から統計解析用コンビ ユータ S Tに対して送信し、 統計解析用コンピュータ S Tが要求者の特定を行って も良い。 この場合、 個人用コンピュータ 3から所定の 「多型番地」 及ぴ 「多型パタ 一ン」 の組合せを統計解析用コンピュータ S Tに対して順次自発的に送信しても良 いし、 統計解析用コンピュータ S Tから所定の 「多型番地」 に対応する 「多型パタ ーン」 の提出を個人用コンピュータ 3に対して順次要求し、 個人用コンピュータ 3 が当該要求に対応した 「多型パターン」 を 「多型番地」 に関連付けて順次送信して も良い。
詳細には、 統計解析用コンピュータ S Tは、 要求者に関する 1又は複数の 「多型 番地」 及ぴ 「多型パターン」 の組合せを受け取るステップと、 受け取った 「多型番 地」 及ぴ 「多型パターン」 の組合せと一致する 「多型番地」 及び 「多型パターン」 の組合せを有する個体に関するゲノム関連情報をゲノム関連情報 D B 4 0から検索 するステップとを、 検索の結果として 1の個人 (個体) に関するゲノム関連情報を 要求者 (要求者が送信した 「個体関連情報」 に関連する個人 (個体) ) に関するゲ ノム関連情報として特定するまで繰り返すことで、 ゲノム関連情報 D B 4 0に含ま れる所定の個人 (個体) に関するゲノム関連情報を要求者 (要求者が送信した 「個 体関連情報」 に関連する個人 (個体) ) に関するゲノム関連情報として特定するこ とができる。
一方、 統計解析用コンピュータ S Tは、 複数の個体に関する複数の個体関連情報 を、 それぞれゲノム関連情報 D B 4 0に含まれるゲノム関連情報と関連付けて格納 した個体関連情報 D B 4 1を用いて、 当該複数の個体関連情報と当該複数のゲノム 関連情報とを統計的に処理して、 塩基配列関連情報を意味づける意味情報及び/又は 当該意味情報に関連する情報を創出することができる。
ここで統計的処理としては、 遺伝統計学的手法として知られている手法を適用し た処理を意味し、 従来知られている各種プログラム及ぴアルゴリズムを適用して行 うことができる。
以下に一例を示す。 まず、 ゲノム関連情報 D B 4 0のその時点における全データ (全「整理 No. Jに関連付けられた全データ) 力、ら、 多型番地毎に当該多型番地におい てとりうる多型パターンのそれぞれの出現頻度を算出する。 算出結果は、 例えば、 図 1 1に示すように、 行方向に多型番地を並べ、 列方向に多型パターン毎の出現頻 度を並べて示されるマ トリ ックスとして表される。 なお、 図 1 1では、多型番地 「000001」 における多型パターン「多型 1」の出現頻度は 100人中 50人であることを表 している。
次に、 ゲノム関連情報 D B 4 0と個体関連情報 D B 4 1とを用いて、 所定の個体 関連情報に関して、 多型番地毎に当該多型番地においてとりうる多型パターンのそ れぞれの出現頻度を算出する。
具体的には、 個体関連情報 D B 4 1から、 例えば、 「嗜好 a (例:赤色よりも青色の 方が好きだ) 」について該当する (結果欄に「〇」が付いている) 「整理 No.」だけを抽 出した上で、 ゲノム関連情報 4 0から前記抽出した「整理 No.」を検索し、 検索したデ ータのなかから、 多型番地毎に当該多型番地においてとりうる多型パターンのそれ ぞれの出現頻度を算出する。 算出結果は、 例えば、 図 1 2に示すように、 個体関連 情報毎 ( 「嗜好」 毎) に行方向に多型番地を並べ、 列方向に多型パターン毎の出現 頻度を並べて示されるマトリ ックスとして表される。 なお、 図 1 2では、 「嗜好 a」に ついて該当する場合に、 多型番地 「000001」 における多型パターン「多型 1」の出現 頻度は 50人中 45人であることを表している。
次に、図 1 1に示した出現頻度及ぴ図 1 2に示した出現頻度の結果を用いて、 所定 の個体関連情報に該当するか否かに関わらず算出した、 多型番地毎の当該多型番地 においてとりうる多型パターンのそれぞれの出現頻度 (図 1 1 ) と、 所定の個体関 連情報に該当する場合に限って算出した、 多型番地毎の当該多型番地においてとり うる多型パターンのそれぞれの出現頻度 (図 1 2 ) とを、 互いに比較し相対的な値 を求める。
具体的には、 例えば、 図 1 2に示した出現頻度の結果として、 「嗜好 a」について該 当する場合における、 多型番地 「000001」 における多型パターン「多型 1」の出現頻 度は 50人中 45人と表される当該 45人という値を、 図 1 1に示した出現頻度の結果を 表す、 ゲノム関連情報 D B 4 0のその時点における全データ (全「整理 No.」に関連付 けられた全データ) における多型番地 「000001」 における多型パターン「多型 1」の 出現頻度 100人中 50人の当該 50人で除した割合値 (90%) を、 前記相対的な値として 求める。 同様に、 多型番地 「000001」 における多型パターン「多型 2」の場合の割合 値 (12%) 、 多型番地 「000001」 における多型パターン「多型 3」の場合の割合値 (8%) を求める。その結果は、 例えば、 図 1 3に示すように、 個体関連情報毎に行方 向に多型番地を並べ、 列方向に多型パターン毎の割合値を並べて示されるマトリツ タスとして表される。
このときに、 もし「嗜好 a」が多型番地 「000001」 における多型パターンの相違によ る影響を全く受けないのであれば、 上記算出した割合値 (相対的な値) は、 「多型 1 J、 「多型 2」、 「多型 3」のいずれにおいても同程度の値を示すはずである。この傾向 は、 図 1 1及ぴ図 1 2に示した出現頻度を算出する際の母数が大きいほど顕著に表 れることが統計学的に知られている。
なお、 図 1 3に示した結果を求める際には、 図 1 1に示した出現頻度を用いる代 わりに、 例えば、 統計解析用コンピュータ S T以外の外部機関が算出 (統計的に処 理) した、 多型番地毎の当該多型番地においてとりうる多型パターンのそれぞれの 出現頻度を示すデータ又は当該出現頻度を算出するための元データを用いても良い。 この場合は、 前記外部機関が当該出現頻度を求める際に基にしたゲノム関連情報に 関連する個体の中に、個体関連情報 D B 4 1に含まれる個体関連情報に関連する個体 が含まれていても含まれていなくても良い。
次に、 図 1 3に示した割合値を用いて、 各多型番地毎に、 当該多型番地において 取りうる各多型パターンの相対値を算出する。 具体的には、 図 1 3に示した結果で は、 例えば、 「嗜好 a」 において、 多型番地 「000001」 の多型パターン「多型 1」に おける割合値は 90%、 多型パターン「多型 2」における割合値は 12°ん 多型パターン「多 型 3」における割合値は 8%と表されるが、 そのうち最小の割合値を示す多型パターン
(「多型 3」) の割合値 (8%) を基準にして、 各多型パターンにおける割合値を「多型
3」の割合値 (8%) で除す。 すなわち多型パターン「多型 1」の相対値は 11. 25
(=90/8) 、 「多型 2」の相対値は 1. 5 (=12/8) 、 「多型 3」の相対値は 1. 0 (=8/8) と なり、 最小の割合値を示す「多型 3」の割合値を基準にした倍率として、 各多型パタ ーンの相対値を求める。 その結果として、 例えば図 1 4に示すように、 個体関連情 報毎に行方向に多型番地を並べ、 列方向に多型パターン毎の相対値を並べて示され るマトリッタスとして表される。
このとき、 もし「嗜好 a」が多型番地 「000001」 における多型パターンの相違による 影響を全く受けないのであれば、 上記算出した倍率 (相対値) は、 「多型 1」、 「多型 2」、 「多型 3」のいずれにおいても 1. 0に近い値を示すはずである。この傾向は、 図 1 1及ぴ図 1 2に示した出現頻度を算出する際の母数が大きいほど顕著に表れること が統計学的に知られている。
次に、 図 1 4に示した結果に基づいて、 相対値が所定の値を超えた場合に、 当該 相対値を示す多型番地における多型パターンの相違力 所定の個体関連情報に (該当 するか否かに) 関係していると判断する。 具体的には、 例えば、 図 1 4に示した結 果において、 倍率 (相対値) が閾値を超えた場合に、 当該倍率を示す多型番地とそ の倍率とを抽出し、 出力する。 なお、 当該閾値は、 例えば、 図 1 4に示した、 所定 の個体関連情報に該当する場合の全ての相対値を概観したうえで、 統計的に算出す ることができる。
なお、 図 1 4に示した相対値の算出方法によっては、 相対値が所定の値を下回つ た場合に当該相対値の多型番地における多型パターンの相違力 S、所定の個体関連情報 に (該当するか否かに) 関係していると判断してもよい。
また、 抽出した倍率 (相対値) が相対的に大きいほど、 当該抽出した倍率を示す 多型番地における多型パターンの相違が、 所定の個体関連情報に(該当するか否かに おいて)より強く関係していると推定できる。 すなわち、 所定の個体関連情報に(該 当するか否かにおいて)先天的 (遺伝的) 要素が強いと推定される。
さらにまた、 図 1 1及び図 1 2に示した出現頻度から図 1 4に示した結果を得る までの処理を、 複数の個体関連情報について同時に並行して行った場合には、 それ ぞれの個体関連情報について抽出された、 それぞれの多型番地とその倍率 (相対 値) との傾向から、 どの個体関連情報とどの個体関連情報とが互いに関連性がある のかが推定できる。
以上のように、図 1 1及び図 1 2に示した出現頻度から図 1 4に示した結果を得て、 当該結果から判断を導くまでの処理を行うことにより、 今まで先天的 (遺伝的) 影 響との関連性が希薄と思われていた個体関連情報についても遺伝的影響を受けてい るか否かを調べることができる。 すなわち、 各人 (個体) より入手する様々な種類 の個体関連情報を用いることにより、 従来、 先天的 (遺伝的) 影響との関連性が希 薄と思われた個体の性質等と遺伝との関連性を推定することができる。 また、 図 1 1及び図 1 2に示した出現頻度から図 1 4に示した結果を得て、 当該 結果から判断を導くまでの処理は、 所定の個体関連情報 (属性) に該当するか否か に拘わらず算出した多型パタ一ン毎の出現頻度を母数 (図 1 1 ) にしているので、 個体関連情報 (属性) がどれだけ遺伝の影響を受けているかを定量的に表すことに 向いている。 これに対して、 通常行われる相関解析の方法では、 個体関連情報 (属 性) に該当する集団と該当しない集団とを比較しているので、 個体関連情報 (属 性) が人の性格のように遺伝による影響が比較的少ないと思われるものの場合に遺 伝的影響の度合いを表すのが困難となる。 すなわち、 人の性格のような個体関連情 報 (属性) の場合、 個々人の "かくありたい" という願望などが起因して当該個体 関連情報 (属性) に該当しているか否かを判断すること自体が難しいため、 母数に 誤りが含まれることがあり正確に比較することが難しくなるからである。
なお、 図 1 4に示した結果において、 倍率 (相対値) が閾値を超えた場合に当該 倍率を示す多型番地とその倍率とを抽出する際に、 図 1 1、 図 1 2及び図 1 3に示 した出現頻度や割合値及びそれらの算出根拠となった元の数値も抽出して併せて出 力することが望ましい。 この場合、 図 1 1、 図 1 2及び図 1 3に示した出現頻度や 割合値及びそれらの算出根拠となった元の数値を、 図 1 4に示した結果を使用する 側で、 データの信憑性を判断する材料として使用することができる。
その後、 統計解析用コンピュータ S Tは、 図 1 4に示した結果から抽出した多型 番地とその倍率及び/又は併せて抽出した算出根拠となる元の数値を用いることによ り、 所定の個体関連情報と所定の多型番地との相関関係及ぴ多型パターンの種類に よる所定の個体関連情報への影響の差異という知見を得ることができる。そして統計 解析用コンピュータ S Tは、 得た知見を基に意味情報及び/又は当
該意味情報に関連する情報を創出することができる。 例えば、 図 1 4に示した結果 から抽出した 「倍率」 は、 そのまま意味情報として使用することが可能である。 なお、 統計解析用コンピュータ S Tは、 図 1 4に示した倍率 (相対値) の算出結 果及び/又は図 1 4に示した算出結果から導かれた知見に基づいて創出した意味情報 及ぴ Z又は当該意味情報に関連する情報を、 逐次記録したデータベース(以下、 参照 用 D Bと称す)を構築することができる。
また、 所定の個体関連情報 (性質) に関して所定の多型番地との相関関係が見い だせない場合であっても、 以下のようにして、 1又は複数の他の個体関連情報 (性 質) との組合せと所定の多型番地との相関関係を見いだすことができる。
例えば、 「多汗症である」 という個体関連情報 (性質) と相関関係がある多型番 地が見いだせなかったとする。 また、 「多汗症である」 性質に関連性がある性質、 例えば 「よく水分を摂取する」 性質及ぴ 「塩辛いものを好む」 性質については、 そ れぞれ 「多型番地 000001」 及ぴ 「多型番地 000101」 に相関関係が見いだされたとす る。 ここで、 所定の性質と他の性質との関連性とは、 所定の性質を示す個体が他の 性質を示す確率が所定の値、 例えば 80%以上であることを意味する。 前記関連性は. 例えば、 所定の性質と他の性質を含むアンケートを実施した集計結果から導き出す ことができる。 例えば、 所定の性質を有すると答えた回答者の中で、 他の性質を有 すると答えた回答者が 80%以上の場合は、 所定の性質と他の性質との間に関連性が あるとみなすことができる。
さらに、 「よく水分を摂取する」 性質を示す個体のうち 80%の個体は、 「多型番 地 000001」 において 「多型 1」 を有しており、 「塩辛いものを好む」 性質を示す個 体のうち 70%の個体は、 「多型番地 000101」 において 「多型 2」 を有していたとす る。
以上の前提条件の基では、 「多汗症である」 という性質について、 「多型番地 000001」 及ぴ 「多型番地 000101」 との間に間接的な相関関係を見いだすことができ る。 すなわち、 「多型番地 000001」 において 「多型 1」 を有し、 「多型番地 000101」 において 「多型 2」 を有する個体のうち、 56% (0. 8 X 0. 7 = 0. 56) は 「多 汗症である」 性質を示すことが間接的に見いだせる。
以上によって、 「多型番地 000001」 において 「多型 1」 を有し、 「多型番地 000101」 において 「多型 2」 を有する場合に、 「多汗症である場合が多い (例えば 「指数 5 6」 ) 」 という意味情報を創出することができる。 さらに、 創出した意味 情報から、 例えば、 「生活留意情報」 等の当該意味情報に関連する情報を導き出す こともできる。
統計解析用コンピュータ S Tは、 以上のようにして、 創出した意味情報及び/又は 当該意味情報に関連する情報を共用コンピュータ 2に提供することができる。 共用 コンピュータ 2は、 統計解析用コンピュータ S Tから提供された意味情報に基づい てメイン DB 1 4を構築したり、 統計解析用コンピュータ S Tから提供された当該意 味情報に関連する情報に基づいて情報提供用データベースを構築することができる。 また、 統計解析用コンピュータ S Tは、 上述したように創出した意味情報及び/又 は当該意味情報に関連する情報等を逐次記録して 「参照用 D B」 を構築し、 当該 「参照用 D B」 をメイン DB 1 4として使用することによって、 自らが共用コンビュ ータ 2として動作することもできる。
共用コンピュータ 2は、 構築したメイン DB 1 4を用いて、 以下のようにして利用 者に対して所定の疾病の罹患可能性等の意味情報を提供することができる。 すなわ ち、 共用コンピュータ 2は、 利用者が 「物品及び/又はサービスの要求」 として、 例 えば、 所定の疾病に関する自分の罹患可能性を教えて欲しいと要求する場合に、 当 該罹患可能性等の意味情報を提供できる。
なお、 本情報処理システムにおいて、 「物品及び/又はサービス」 としては、 所 定の疾病の罹患可能性に限定されず、 例えば、 個人 (個体) の体質に適合した医薬 品、 食品及び嗜好品等の物品や、 個人 (個体) の体質,性質に適合した情報等のサ 一ビスを含む意味である。
共用コンピュータ 2が利用者に対して所定の疾病の罹患可能性を提供する情報処 理システムにおいては、 共用コンピュータ 2のメモリー 7に記録された処理プログ ラム 1 3及ぴ個人用コンピュータ 3のメモリー 2 3に記録された処理プログラム 2 7が例えば、 図 1 5及び図 1 6に示すようなフローチャートに従って情報処理動作 する。 なお、 図 1 5及ぴ図 1 6に示すフローチャートにおいて、 「 (共) 」 と記載 したステップは共用コンピュータ 2における処理を意味し、 「 (個) 」 と記載した ステップは個人用コンピュータ 3における処理を意味している。
本情報処理システムは、 ゲノム関連情報記録媒体 2 4を所持する各個人が個人用 コンピュータ 3を用いて通信回線網 1を介して共用コンピュータ 2にアクセスし、 共用コンピュータ 2のメイン DB 1 4に記録されている意味情報を利用するシステム である。 なお、 本情報処理システムは、 複数人のゲノム関連情報 2 8がそれぞれ記 録されたゲノム関連情報記録媒体 2 4を用い、 各個人がゲノム関連情報記録媒体 2
4にアクセスするようなシステムであってもよい。
この場合、 先ず、 ステップ A l (SA1) で、 要求者が本システムを利用するにあた り、 メモリー 2 3に記録されている処理プログラム 2 7を起動する。 処理プロダラ ム 2 7によって、 個人用コンピュータ 3の読取り装置 2 5を駆動してゲノム関連情 報記録媒体 2 4にアクセスし、 ゲノム関連情報記録媒体 2 4においてデータ Iとして 記録されている 「Gno.」 を読み出す。 読み出した 「Gno. J は、 メモリー部 2 6に格 糸内する。
次に、 ステップ A 2 (SA2) では、 処理プログラム 2 7によって表示装置 2 2に表 示された画面イメージに基づいて、 要求者が提供を受けたい情報、 例えば、 「大腸 がんの罹患可能性」 (要求情報) を個人用コンピュータ 3に入力するとともに、 個 人用コンピュータ 3から通信回線網 1を経由して共用コンピュータ 2に 「大腸がん の罹患可能性」 及び 「Gno.」 を送信する。 或いは、 個人用コンピュータ 3から通信 回線網 1を経由して共用コンピュータ 2に対して、 「大腸がんの罹患可能性」 及び 「Gno.」 を書き込む。
次に、 ステップ A 3 (SA3) では、 共用コンピュータ 2が 「大腸がんの罹患可能 性」 及ぴ 「Gno.」 を受信する。 受信した 「大腸がんの罹患可能性」 及び 「Gno.」 は、 メモリ一部 A 1 0に要求情報として格納する。
次に、 ステップ A 4 (SA4) では、 要求情報を受信すると、 メモリー 7に記録され ている処理プログラム 1 3を起動してメイン DB14にアクセスする。 なお、 この処理 プログラム 1 3は、 共用コンピュータ 2における処理を行うものである。
次に、 ステップ A 5 (SA5) では、 処理プログラム 1 3に従って、 メイン DB14に記 録されている 「分類 (疾患名) 」 を検索し、 要求された 「大腸がんの罹患可能性」 (大腸がん) と一致するものを抽出する。
ステップ A 6 (SA6) では、 メイン DB14に記録されているデータのなかから 「大腸 がんの罹患可能性」 と一致した 「分類 (疾患名) 」 (大腸がん) に関連づけられた 「多型番地」 を読み出す。 読み出した 「多型番地」 は、 メモリー部 A 1 0に要求情 報に関連づけた位置情報として格納する。 すなわち、 メモリー部 A 1 0には、 所定 の 「Gno.」 に対して 「大腸がんの罹患可能性」 及び 「多型番地」 が記録されること となる。
次に、 ステップ A 7 (SA7) では、 メモリー部 A 1 0に記録されている 「Gno.」 及 ぴ 「多型番地」 を個人用コンピュータ 3に送信するとともに、 送信する 「多型番 地」 に対応する 「多型パターン」 を提出する命令情報を個人用コンピュータ 3に送 信する。 また、 このとき、 要求情報の種類によっては、 必要に応じて既往症や特徴 等の付加的な情報の提出を命令してもよい。
次に、 ステップ A 8 (SA8) では、 共用コンピュータ 2から送信された 「Gno.」 、 「多型番地」 及び命令情報を受信する。 受信した 「Gno.」 及び 「多型番地」 は、 メ モリー部 2 6に記録される。
次に、 ステップ A 9 (SA9) では、 受信した命令情報に従って、 ゲノム関連情報記 録媒体 2 4に記録されているデータ IIにアクセスする。 ステップ A 1 0 (SA10) では、 処理プログラム 2 7に従ってゲノム関連情報記録媒体 2 4に記録されているデータ IIを検索し、 命令された多型番地の多型パターンを読み出し、 多型番地と多型パタ 一ンとを関連づけてメモリー部 2 6に記録する。 このとき、 データ Iに対してァクセ スし、 ステップ A 8で受信した 「Gno.」 が正しいか否かを確認することが好ましい。 また、 ステップ A 1 0では、 多型パターンのほかにデータ III、 データ IV及びデータ V に記録されている付加的な情報も同時に読み出し、 必要に応じてメモリー部 2 6に 記録してもよい。
次に、 ステップ A l 1 (SA11) では、 メモリー部 2 6に一時的に記録した多型番地 に関連付けられた多型パターン及び必要に応じて記録された付加的な情報を、
「Gno.」 とともに通信回線網 1を介して共用コンピュータ 2に対して出力する。 ス テツプ A 1 2 (SA12) では、 多型番地に関連付けられた多型パターン及び必要に応じ て記録された付加的な情報を共用コンピュータ 2で受信し、 受信した多型パターン を多型番地と関連付けてメモリ一部 A 1 0に記録する。
また、 本例では、 ステップ A 7において、 共用コンピュータ 2が 「多型パターン」 の提出を命令する命令情報を送出し、 ステップ A 1 0において、 個人用コンピュータ
3は命令情報に従って多型パターンをゲノム関連情報記録媒体 2 4から読み出して いる。 しかしながら、 本システムは、 ステップ A 7において当該命令情報を送出しな いシステムであってもよい。 この場合、 ステップ A 1 0において、 個人用コンピュー タ 3は、 処理プログラム 2 7に従って、 ステップ A 8で受信した多型番地に基づいて データ IIを検索し、 受信した多型番地の多型パターンを読み出す。 そして、 個人用 コンピュータ 3は、 ステップ A 1 1で多型パターン等を共用コンピュータ 2に対して 出力する。 この場合でも、 共用コンピュータ 2は、 ステップ A 1 2において、 「大腸 がんの罹患可能性」 と一致した 「分類 (疾患名) 」 に関連づけられた 「多型番地」 の多型パターンを得ることができる。
次に、 ステップ A 1 3 (SA13) では、 メイン DB 1 4にアクセスし、 受信した多型番 地及び多型パターンと一致するものを検索する。 具体的には、 メイン DB 1 4におい て、 一つの多型番地に対して複数の多型パターンが記録されており、 受信した多型 番地及ぴその多型パターンがメイン DB 1 4においてどの多型パターンに一致してい るのかを検索する。
次に、 ステップ A 1 4 (SA14) では、 処理プログラム 1 3に従って、 受信した多型 パターンと—致した多型パターンに関連づけられている大腸がんに対する罹患可能 性を読み出す。 すなわち、 ステップ A 1 4では、 要求者が提出した多型番地及び多型 パターンに従って、 要求者の大腸がんに対する罹患可能性を読み出すことができる。 読み出した罹患可能性は、 要求者の 「Gno.」 と関連づけてメモリー部 A 1 0に格納 する。 このとき、 大腸がんに対する罹患可能性を、 付加的な情報により補正したか たちで格納してもよいし、 付加的な情報から得られるその他の情報を要求者の 「Gno.」 に関連づけて格納しても良い。
次に、 ステップ A 1 5 (SA15 ) では、 メモリー部 A 1 0に格納した要求者の
「Gno.」 及ぴ罹患可能性を意味情報として、 通信回線網 1を介して個人用コンビュ ータ 3に対して送信する。 ステップ A 1 6 (SA16) では、 個人用コンピュータ 3が要 求者の 「Gno.」 及び罹患可能性 (意味情報) を受信する。 受信した意味情報は、 メ モリー部 2 6に記録される。
次に、 ステップ A 1 7 (SA17) では、 処理プログラム 2 7に従って、 メモリー部 2
6に記録された意味情報から大腸がんに対する罹患可能性を表示装置 2 2に表示す る。 なお、 ステップ A 1 5からステップ A 1 7の代わりに共用コンピュータ 2が処理 プログラム 1 3に従って意味情報を表示する画面を読み出し (作成し) 、 通信回線 網 1を経由して個人用コンピュータ 3の表示装置 2 2に表示させることもできる。 こ の場合においても、 共用コンピュータ 2から個人用コンピュータ 3に対して意味情 報が送信されたものとする。 これにより、 要求者は、 ゲノム関連情報記録媒体 2 4 に記録したゲノム関連情報 2 8を用いて大腸がんに対する罹患可能性を得ることが できる。
以上のように、 本システムにおいては、 個人の多型パターンを多型番地と関連づ けて記録したゲノム関連情報記録媒体 2 4を用いることによって、 メイン DB14に記 録された意味情報を多型番地を介在させて個人が利用することができる。 言い換え れば、 本システムを利用する個人は、 意味情報をゲノム関連情報記録媒体に記録し ておく必要はなく、 多型番地と多型パターンとを関連づけたゲノム関連情報 2 8を 所有するだけで、 様々な意味情報を得ることができる。
特に、 意味情報は、 上述したように、 その種類が増加するとともに訂正が行われ るため、 メイン DB14を更新することによってより精度が高く、 且つ、 幅広い情報を 含むものとなる。 本システムによれば、 このような意味情報の増加及ぴ訂正等に追 従してメイン DB14を更新することによって、 個人が最新の意味情報を利用すること ができる。
さらに、 ゲノム関連情報 2 8を記録したゲノム関連情報記録媒体 2 4を用いるこ とによって、 利用者は本システムを利用するたび毎にゲノム関連情報を得るための 検査をする必要がない。 すなわち、 利用者は、 ー且、 ゲノム関連情報記録媒体 2 4 を作製すれば、 以降は本システムを利用して最新の意味情報を得ることができる。 ゲノム関連情報 2 8を記録したゲノム関連情報記録媒体 2 4を利用者自身が保有 する場合、 本人のゲノム関連情報 2 8を外部の機関に委託して保管させる際の不安 や当該機関に対する不正アクセスによりゲノム関連情報 2 8が流出するといつた危 険性を回避することができる。 一方、 ゲノム関連情報記録媒体 2 4に複数の個人に 関する複数のゲノム関連情報 2 8を記録して外部の機関に委託して保管させる場合、 個々人がゲノム関連情報記録媒体 2 4を保有する場合と比較して、 ゲノム関連情報 記録媒体 2 4の取り扱いの不手際ゃゲノム関連情報記録媒体 2 4の損失といった事 態を防止することができる。
特に、 この図 1 5及ぴ図 1 6に示したフローチャートに従えば、 ゲノム関連情報 記録媒体 2 4に記録したゲノム関連情報 2 8の全てを通信回線網 1を介して出力す る必要がなく、 提出命令を受けた一部のゲノム関連情報 2 8のみを出力すればよレ、。 したがって、 本システムによれば、 機密性の高い個人特有の多型番地及ぴ多型パタ ーンの漏洩を防止することができる。 また、 この図 1 5及ぴ図 1 6に示したフローチャートに従えば、 共用コンビユー タ 2において要求者に提供する意味情報を得ているため、 個人用コンピュータ 3に おいてメイン DB 1 4に記録されている情報を取り扱う必要がない。 したがって、 こ の図 1 5及び図 1 6に示したフローチャートに従えば、 個人用コンピュータ 3の情 報処理能力が比較的低くても、 十分に所望の意味情報を得ることができる。 さらに、 個人用コンピュータ 3においてメイン DB 1 4に記録されている情報を取り扱う必要 がないため、 個人用コンピュータ 3の処理プログラム 2 7を、 ゲノム関連情報記録 媒体 2 4を装着するカードドライブ等に併せて規格化しやすくなる。
ところで、 本情報処理システムにおいては、 共用コンピュータ 2のメモリー 7に 記録された処理プログラム 1 3及び個人用コンピュータ 3のメモリー 2 3に記録さ れた処理プログラム 2 7が例えば、 図 1 7に示すようなフローチャートに従って情 報処理動作するものであってもよい。 なお、 図 1 7に示すフローチャートにおいて も、 「 (共) 」 と記載したステップは共用コンピュータ 2における処理を意味し、 「 (個) 」 と記載したステップは個人用コンピュータ 3における処理を意味してい る。
ここでは、 先ず、 ステップ B l (SB1) では、 要求者が本システムを利用するにあ たり、 メモリー 2 3に記録されている処理プログラム 2 7を起動する。 処理プログ ラム 2 7によって、 個人用コンピュータ 3の読取り装置 2 5を駆動してゲノム関連 情報記録媒体 2 4にアクセスし、 ゲノム関連情報記録媒体 2 4においてデータ Iとし て記録されている 「Gno.」 を読み出す。 読み出した 「Gno.」 は、 メモリー部 2 6に 格納する。
次に、 ステップ B 2 (SB2) では、 処理プログラム 2 7によって表示装置 2 2に表 示された画面イメージに基づいて、 要求者が提供を受けたい情報、 例えば、 「大腸 がんの罹患可能性」 (要求情報) を個人用コンピュータ 3に入力するとともに、 個 人用コンピュータ 3から通信回線網 1を経由して共用コンピュータ 2に 「大腸がん の罹患可能性」 及ぴ 「Gno.」 を送信するとともに、 メイン DB14の 「分類 (疾患 名) 」 が大腸がんである 「多型番地」 と当該 「多型番地」 に関連付けられた全ての
「多型パターン」 と当該全ての 「多型パターン」 それぞれを意味づける 「罹患可能 性」 との提出を要求する。 すなわち、 要求者は、 ステップ B2において、 メイン DB14 の 「分類 (疾患名) 」 が大腸がんである 「多型番地」 と当該 「多型番地」 に関連付 けられた全ての 「多型パターン」 と当該全ての 「多型パターン」 それぞれを意味づ ける 「罹患可能性」 とからなる情報を要求する。
次に、 ステップ B3 (SB3) では、 共用コンピュータ 2が上記要求情報を受信する。 共用コンピュータ 2は、 要求情報を受信すると処理プログラム 1 3を起動する。 そ して、 ステップ B4 (SB4) で、 処理プログラム 1 3に従ってメイン DB14にアクセスす る。
次に、 ステップ B5 (SB5) では、 処理プログラム 1 3に従って、 メイン DB14に記録 されている 「分類 (疾患名) 」 を検索し、 要求された 「大腸がんの罹患可能性」 (大腸がん) と一致するものを抽出する。 ステップ B6 (SB6) では、 処理プログラム 1 3に従って、 メイン DB14にアクセスし、 「大腸がんの罹患可能性」 と一致する 「分類 (疾患名) 」 (大腸がん) に関連づけられた 「多型番地」 、 当該多型番地に 関連づけられた全ての 「多型パターン」 及び全ての多型パターンにおける 「罹患可 能性」 を読み出す。 読み出した 「多型番地」 、 「多型パターン」 及び 「罹患可能 性」 は、 メモリー部 A 1 0に要求情報に関連づけて格納する。 すなわち、 メモリー 部 A 1 0には、 所定の 「Gno.」 に対して 「多型番地」 、 「多型パターン」 及び 「罹 患可能性」 が記録されることとなる。
次に、 ステップ B 7 (SB7) では、 メモリー部 A 1 0に記録されている 「Gno.」 、 「多型番地」 、 「多型パターン」 及び 「罹患可能性」 を、 通信回線網 1を介して個 人用コンピュータ 3に対して送信する。 ステップ B8 (SB8) では、 共用コン ピュータ 2から送信された 「Gno.」 、 「多型番地」 、 「多型パターン」 及び 「罹患 可能性」 を受信する。 受信した 「Gno.」 、 「多型番地」 、 「多型パターン」 及び 「罹患可能性」 は、 メモリー部 2 6に記録される。
次にステツプ B9 (SB9) では、 処理プログラム 2 7に従い、 ゲノム関連情報記録媒 体 2 4に記録されているデータ IIにアクセスする。 このとき、 ゲノム関連情報記録 媒体 2 4に記録されているデータ Iにもアクセスし、 受信した 「Gno.」 が正しいか否 かを確認することが好ましい。
次に、 ステップ BIO (SB10) では、 処理プログラム 2 7に従って、 ゲノム関連情報
2 8から、 受信した 「多型番地」 と一致する多型番地における多型パターンを抽出 する。 そして、 ステップ BIO (SB10) では、 受信した多型番地に関連づけられた全て の 「多型パターン」 のうちで、 抽出した多型パターンと一致するものを検索する。 ステップ Bll (SB11) では、 受信した多型番地に関連づけられた全ての 「多型パタ ーン」 のうちで一致した多型パターンに関連づけられた 「罹患可能性」 を抽出する とともに、 抽出した 「罹患可能性」 を出力する。 これにより、 要求者は、 大腸がん に対する罹患可能性 (意味情報) を得ることができる。 このとき、 ステップ B11では、 データ III、 データ IV及びデータ Vに記録されている付加的な情報も同時に読み出し、 大腸がんに対する罹患可能性を、 付加的な情報により補正したかたちで出力しても よい。
特に、 図 1 7に示したフローチャートに従えば、 ゲノム関連情報記録媒体 2 4に 記録したゲノム関連情報 2 8を個人用コンピュータ 3以外の外部に対して全く出力 することがない。 すなわち、 ゲノム関連情報 2 8は、 ゲノム関連情報記録媒体 2 4 と個人用コンピュータ 3との間でのみ、 やり取りされる。 したがって、 本システム によれば、 機密性の高い個人特有のゲノム関連情報 2 8の漏洩をより確実に防止す ることができる。
ところで、 本情報処理システムにおいては、 共用コンピュータ 2のメモリー 7に 記録された処理プログラム 1 3及び個人用コンピュータ 3のメモリー 2 3に記録さ れた処理プログラム 2 7が例えば、 図 1 8に示すようなフローチャートに従って情 報処理動作するものであってもよい。 なお、 図 1 8に示すフローチャートにおいて も、 「 (共) 」 と記載したステップは共用コンピュータ 2における処理を意味し、 「 (個) 」 と記載したステップは個人用コンピュータ 3における処理を意味してい る。
ここでは、 先ず、 ステップ C I (SC1) で、 要求者が本システムを利用するにあた り、 メモリー 2 3に記録されている処理プログラム 2 7を起動する。 処理プログラ ム 2 7によって、 個人用コンピュータ 3の読取り装置 2 5を駆動してゲノム関連情 報記録媒体 2 4にアクセスし、 ゲノム関連情報記録媒体 2 4においてデータ Iとして 記録されている 「Gno.」 、 データ IIとして記録されている全ての 「多型番地」 及び 「多型パターン」 を読み出す。 読み出した 「Gno.」 、 「多型番地」 及び 「多型パタ ーン」 は、 メモリー部 2 6に格納する。 次に、 ステップ C 2 (SC2) では、 処理プログラム 2 7によって表示装置 2 2に表 示された画面イメージに基づいて、 要求者が提供を受けたい情報、 例えば、 「大腸 がんの罹患可能性」 (要求情報) を個人用コンピュータ 3に入力するとともに、 個 人用コンピュータ 3から通信回線網 1を経由して共用コンピュータ 2に 「大腸がん の罹患可能性」 と、 メモリー部 2 6に記録されている 「Gno.」 、 「多型番地」 及び 「多型パターン」 とを送信する。
次に、 ステップ C 3 (SC3) では、 共用コンピュータ 2が 「大腸がんの罹患可能 性」 、 「Gno.」 、 「多型番地」 及び 「多型パターン」 を受信する。 受信した 「大腸 がんの罹患可能性」 は要求情報としてメモリ一部 A 1 0に記録され、 「Gno.」 、 「多型番地」 及ぴ 「多型パターン」 も、 メモリー部 A 1 0に格納される。 共用コン ピュータ 2は、 要求情報を受信すると処理プログラム 1 3を起動する。 そして、 ス テツプ C4 (SC4) では、 処理プログラム 1 3に従って、 メイン DB14にァク
セスする。
次に、 ステップ C5 (SC5) では、 処理プログラム 1 3に従って、 メイン DB14に記録 されている 「分類 (疾患名) 」 を検索し、 要求された 「大腸がんの罹患可能性」 (大腸がん) と一致するものを抽出する。
ステップ C6 (SC6) では、 処理プログラム 1 3に従って、 メイン DB 1 4にアクセス し、 メイン DB 1 4から 「大腸がん」 に分類された 「多型番地」 、 当該多型番地に対 する全ての 「多型パターン」 、 及び当該多型パターンに対する 「罹患可能性」 を読 み出す。 読み出した 「多型番地」 、 「多型パターン」 及び 「罹患可能性」 は、 メモ リー部 A 1 0に格納される。
次に、 ステップ C 7 (SC7) では、 ステップ C3で受信した 「多型番地」 及び 「多型 パターン」 に基づいて、 ステップ C 6でメモリー部 A 1 0に格納したデータを検索し. 受信した 「多型パターン」 と一致した多型パターンに関連付けられた罹患可能性を メモリー部 A 1 0から抽出する。
ステップ C 8 (SC8) では、 ステップ C7の結果、 すなわち、 ステップ C3で受信した 情報に含まれる多型パターンがメイン DB 1 4のレ、ずれの多型パターンと一致するか に基づいて抽出した罹患可能性を、 通信回線網 1を介して個人用コンピュータ 3に 対して送信する。 このとき、 共用コンピュータ 2は、 抽出した罹患可能性を要求者 の 「Gno.」 とともに送信する。
次に、 ステップ C9 (SC9) では、 共用コンピュータ 2から送信された 「Gno.」 及ぴ 「罹患可能性」 (意味情報) を受信する。 受信した 「Gno.」 及び 「罹患可能性」 は、 メモリー部 2 6に記録される。 このとき、 ゲノム関連情報記録媒体 2 4に記録され ているデータ Iにアクセスし、 受信した 「Gno.」 が正しいか否かを確認することがで さる。
次に、 ステップ CIO (SC10) では、 処理プログラム 2 7に従って、 メモリー部 2 6 に記録された意味情報から大腸がんに対する罹患可能性を表示装置 2 2に表示する。 なお、 ステップ C 8からステップ C 1 0の代わりに、 共用コンピュータ 2が処理プロ グラム 1 3に従って意味情報を表示する画面を読み出し (作成し) 、 通信回線網 1を 経由して個人用コンピュータ 3の表示装置 2 2に表示させることもできる。 この場 合においても、 共用コンピュータ 2から個人用コンピュータ 3に対して意味情報が 送信されたものとする。 これにより、 要求者は、 ゲノム関連情報記録媒体 2 4に記 録したゲノム関連情報 2 8を用いて大腸がんに対する罹患可能性を得ることができ る。
特に、 図 1 8に示したフローチャートに従えば、 ゲノム関連情報記録媒体 2 4に 記録したゲノム関連情報 2 8を全て共用コンピュータ 2に対して出力し、 共用コン ピュータ 2において要求者に提供する意味情報を得ている。 このため、 図 1 8に示 したフローチャートに従えば、 個人用コンピュータ 3と共用コンピュータ 2との間 での情報の授受が比較的少ない回数で、 要求者が意味情報を得ることができる。 し たがって、 この図 1 8に示したフローチャートに従えば、 個人用コンピュータ 3の 情報処理能力が比較的低くても、 十分に所望の意味情報を得ることができるととも に、 要求者にとっては非常に簡便に意味情報を得ることができる。
以上、 説明したように本システムによれば、 ゲノム関連情報記録媒体 2 4及ぴメ イン DB 1 4において、 「多型番地」 及びその 「多型パターン」 のみを規格化してお けば、 それ以外の特別なデータの規格化を必要としないので、 広範囲な産業に利用 することができる。 すなわち、 物品或いはサービスを提供する側は、 ゲノム関連情 報記録媒体 2 4を用いた情報提供に際して、 多型パターンに対応する意味情報の規 格化や、 データ授受処理方法等の統一した規格を必要とせず、 様々な方式で情報提 供することができる。
さらにまた、 本システムによれば、 メイン DB 1 4をチェックすることで、 第三者 或レ、は第三者機関は共用コンピュータ 2に対する監視及ぴ管理を容易に行うことが できる。 したがって、 本システムは、 意味情報を提供する側に対する例えば行政的 な管理を行うことができるため、 意味情報を提供する側の健全性及び倫理管理を行 うことができる。
一方、 本情報処理システムにおいては、 ゲノム関連情報記録媒体からデータ IIに 含まれる情報を除いたもの、 すなわちデータ I及び付加的にデータ III〜Vのみを有す る記憶媒体を用いても良い。 この場合、 データ IIに含まれる情報は、 通信回線網 1 を介して個人用コンピュータ 3と接続された外部のデータベース (ゲノム関連情報 記録媒体) に記録しておく。 このようなシステムの場合、 例えば、 上述したステツ プ A 1 0において、 通信回線網 1を介して外部のデータベースにアクセスし、 命令さ れた多型番地の多型パターンを読み出し、 多型番地と多型パターンとを関連づけて メモリー部 2 6に記録することができる。 したがって、 このようなシステムであつ ても、 図 1 5及ぴ図 1 6に示したフローチャート、 図 1 7に示したフローチャート 及ぴ図 1 8に示したフローチャートと同様に、 要求者は意味情報を得ることができ る。
さらに、 本情報処理システムにおいては、 要求者がゲノム関連情報記録媒体 2 4 及び前記ゲノム関連情報記録媒体からデータ IIに含まれる情報を除いた記録媒体の いずれも有さず、 通信回線網 1を介して個人用コンピュータ 3と接続したゲノム関 連情報記録媒体 2 4を備えるものであっても良い。 このようなシステムの場合、 要 求者は、 通信回線網 1を介してゲノム関連情報記録媒体 2 4にアクセスし、 ゲノム 関連情報記録媒体 2 4に記録された 「多型番地」 及び 「多型パターン」 等の情報を 個人用コンピュータ 3にダウンロードできる。 なお、 この場合、 ゲノム関連情報記 録媒体 2 4は、 複数の個人に関するゲノム関連情報を個人毎 ( 「Gno.」 毎) に記録 したものであっても良い。
さらにまた、 本発明は、 上述したような共用コンピュータ 2がメイン DB 1 4を有 するような構成に限定されず、 例えば、 共用コンピュータ 2と通信回線網 1を介し て接続されたメイン DB 1 4を備える情報処理システムにも適用される。 この場合、 共用コンピュータ 2は、 図 1 5及び図 1 6に示したフローチャート、 図 1 7に示し たフローチヤ一ト或いは図 1 8に示したフローチヤ一トにおいて、 メイン DB 1 4に 対して通信回線網 1を介してアクセスする。 この場合でも、 本情報処理システムに よれば、 図 1 5及び図 1 6に示したフローチャート、 図 1 7に示したフローチヤ一 ト或いは図 1 8に示したフローチャートに従って要求者が所望の意味情報を得るこ とができる。
特に、 この場合、 共用コンピュータ 2は、 異なる機関又は団体が有する複数のメ イン DB 1 4に対して通信回線網 1を介してアクセスし、 これら複数のメイン DB 1 4 に含まれる意味情報を使用して、 要求者に対する情報提供を行うことが可能となる。 すなわち、 本情報処理システムにおいては、 図 1 5及び図 1 6に示したフローチヤ ートにおけるステップ A 5で、 図 1 7に示したフローチャートにおけるステップ B 5 で、 或いは図 1 8に示したフローチャートにおけるステップ C 5で、 共用コンビユー タ 2が大腸がんの罹患可能性に関する情報を意味情報として有する様々なメィン DB 1 4にアクセスする。 これにより、 本情報処理システムによれば、 要求者は、 様々 なメイン DB 1 4に含まれる情報に基づいて、 大腸がんの罹患可能性に関する情報を 得ることができる。
また、 本システムは、 図 1 5及び図 1 6に示したフローチヤ一ト、 図 1 7に示し たフローチャート、 或いは図 1 8に示したフローチャートにおいて、 共用コンビュ ータ 2が、 いわゆるエージェントに対して、 少なくとも個人用コンピュータ 3から 受け取った要求情報を送信し、 意味情報 (本例においては、 「大腸がんに関する罹 患可能性」 ) を、 当該エージェントを介して得るものであってもよい。
本明細書で引用した全ての刊行物、 特許および特許出願をそのまま参考として本 明細書にとり入れるものとする。 産業上の利用の可能性
以上、 詳細に説明したように、 本発明によれば、 個体間における塩基配列情報の相 違を有効に利用して各個体にとって有益な意味情報及び/又は当該意味情報に関連す る情報を提供できる情報処理システムを構築することができ、 特に、 当該意味情報 を創出することができる情報処理システムを構築することができる。

Claims

請求の範囲
1 . 所定の個体に関する塩基配列関連情報を受け取るステップ aと、
塩基配列における位置を意味する位置情報及び当該位置情報に対応する塩基配列 関連情報が互いに関連付けられたセットが複数含まれた塩基配列関連情報群が個体 毎に格納された記憶装置から、 前記受け取つた塩基配列関連情報と一致性がある塩 基配列関連情報を含んだ塩基配列関連情報群を特定するステツプ bと、
を有する塩基配列に関する情報処理方法。
2 . 前記ステツプ aでは、 予め決まつた位置情報に対応する塩基配列関連情報を 受け取ることを特徴とする請求項 1記載の情報処理方法。
3 . 前記ステップ bで特定した塩基配列関連情報群が複数ある場合には、 所定の個体に関する塩基配列関連情報の受け取りと、 複数の塩基配列関連情報群 の中で、 当該受け取つた塩基配列関連情報と一致性がある塩基配列関連情報を含ん だ塩基配列関連情報群の特定とを、 唯一の塩基配列関連情報群を特定するまで繰り 返すステップ cを更に有することを特徴とする請求項 1記載の情報処理方法。
4 . 前記所定の個体に関する個体関連情報を受け取るステップ dを更に有し、 前記ステップ a、 ステップ b及びステップ dを複数の個体に関して行い、 当該複 数の個体に関する複数の塩基配列関連情報群と当該複数の個体に関する複数の個体 関連情報とをそれぞれ関連付けたデータベースを構築することを特徴とする請求項 1記載の情報処理方法。
5 . 前記データベースに含まれる複数の個体に関する複数の個体関連情報と、 前記データベースに含まれる若しくは含まれなレ、複数の個体に関する複数の塩基配 列関連情報群又は当該複数の塩基配列関連情報群を統計的に処理した結果とを統計 的に処理して、 塩基配列関連情報を意味づける意味情報及び/又は当該意味情報に関 連する情報を創出することを特徴とする請求項 4記載の情報処理方法。
6 . 複数の個体に関する複数の塩基配列関連情報群と当該複数の個体に関する 複数の個体関連情報とをそれぞれ関連付けて構築されたデータベースに含まれる複 数の個体に関する複数の個体関連情報と、 前記データベースに含まれる若しくは含 まれない複数の個体に関する複数の塩基配列関連情報群又は当該複数の塩基配列関 連情報群を統言+的に処理した結果とを統計的に処理して創出された塩基配列関連情 報を意味づける意味情報及び/又は当該意味情報に関連する情報を取得し、
取得した意味情報及び/又は当該意味情報に関連する情報を用いて、 物品及び/又 はサービスの要求情報に応じた意味情報及び/又は当該意味情報に関連する情報を提 供するための記憶装置の記憶内容を構築することを特徴とする塩基配列に関する情 報処理方法。
PCT/JP2003/014733 2002-11-20 2003-11-19 塩基配列関連情報を用いた情報処理システム WO2004046997A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US10/535,407 US20060041389A1 (en) 2002-11-20 2003-11-19 Data processing system using base sequence-relating data
EP03774053A EP1569154A4 (en) 2002-11-20 2003-11-19 DATA PROCESSING SYSTEM USING DATA RELATING TO BASIC SEQUENCES
JP2004553203A JP4266008B2 (ja) 2002-11-20 2003-11-19 塩基配列関連情報を用いた情報処理システム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002336916 2002-11-20
JP2002-336916 2002-11-20

Publications (1)

Publication Number Publication Date
WO2004046997A1 true WO2004046997A1 (ja) 2004-06-03

Family

ID=32321822

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/014733 WO2004046997A1 (ja) 2002-11-20 2003-11-19 塩基配列関連情報を用いた情報処理システム

Country Status (4)

Country Link
US (1) US20060041389A1 (ja)
EP (1) EP1569154A4 (ja)
JP (1) JP4266008B2 (ja)
WO (1) WO2004046997A1 (ja)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11353404A (ja) * 1998-06-11 1999-12-24 Hitachi Ltd 電子カルテシステム
JP2000067139A (ja) * 1998-08-25 2000-03-03 Hitachi Ltd 電子カルテシステム
CA2369485A1 (en) * 1999-06-25 2001-01-04 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data
WO2001026029A2 (en) * 1999-10-01 2001-04-12 Orchid Biosciences, Inc. Method and system for providing genotype clinical information over a computer network
US6640211B1 (en) * 1999-10-22 2003-10-28 First Genetic Trust Inc. Genetic profiling and banking system and method
US20020019746A1 (en) * 2000-03-16 2002-02-14 Rienhoff Hugh Y. Aggregating persons with a select profile for further medical characterization
US20020010552A1 (en) * 2000-05-26 2002-01-24 Hugh Rienhoff System for genetically characterizing an individual for evaluation using genetic and phenotypic variation over a wide area network
WO2002025519A1 (fr) * 2000-09-20 2002-03-28 Kabushiki Kaisha Toshiba Procede visant a fournir une information de diagnostic a base de genes, terminal fournissant l'information, et terminal de reception de l'information
JPWO2002044967A1 (ja) * 2000-11-30 2004-04-02 株式会社日立製作所 遺伝子解析情報の提供方法およびシステム並びに認証識別方法
CA2872499C (en) * 2001-05-25 2016-07-05 Hitachi, Ltd. Information processing system using nucleotide sequence related information

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FURUYA TOSHIO, MURAKAMI YASUFUMI: "1. SNPs to genome no tayosei kaiseki", GENOME KINO KENKYU PROTOCOL, KABUSHIKI KAISHA YODOSHA, 10 April 2000 (2000-04-10), pages 130 - 137, XP002979121 *
NAKAMURA YUSUKE: "Lecture SNP (single nucleotide polymorphism) no iryo genba ni okeru juyosei", GENDAI IRYO, vol. 32, no. 1, 10 January 2000 (2000-01-10), pages 204 - 210, XP002979120 *
See also references of EP1569154A4 *

Also Published As

Publication number Publication date
US20060041389A1 (en) 2006-02-23
EP1569154A1 (en) 2005-08-31
JP4266008B2 (ja) 2009-05-20
JPWO2004046997A1 (ja) 2006-03-16
EP1569154A4 (en) 2006-09-06

Similar Documents

Publication Publication Date Title
US8571810B2 (en) Information processing system using nucleotide sequence-related information
Chin et al. Multiscale analysis of pangenomes enables improved representation of genomic diversity for repetitive and clinically relevant genes
Johnson et al. The UCLA ATLAS Community Health Initiative: promoting precision health research in a diverse biobank
US20090240441A1 (en) System and method for analysis and presentation of genomic data
Gutmann Koch et al. Research Revolution Or Status Quo: The New Common Rule and Research Arising from Direct-to-Consumer Genetric Testing
Singh et al. From the reference human genome to human pangenome: Premise, promise and challenge
Seol et al. NABIC: a new access portal to search, visualize, and share agricultural genomics data
Oliveira et al. DiseaseCard: a web-based tool for the collaborative integration of genetic and medical information
JP3888999B2 (ja) 塩基配列関連情報を用いた情報処理システム
JP4365822B2 (ja) 塩基配列関連情報を用いた情報処理システム
JP4266008B2 (ja) 塩基配列関連情報を用いた情報処理システム
Gambin et al. TIRfinder: a web tool for mining class II transposons carrying terminal inverted repeats
US7337071B2 (en) Information processing system using base sequence-related information
JP3677275B2 (ja) 塩基配列関連情報を用いた情報処理システム
Alzu'bi A personal genomic information analysis and management system for healthcare purposes
JP3677258B2 (ja) 塩基配列関連情報を用いた情報処理システム
Kim et al. On whole-genome demography of world’s ethnic groups and individual genomic identity
Muhammad et al. An Integrated Framework for Analysis and Prediction of Impact of Single Nucleotide Polymorphism Associated with Human Diseases
Ferrada Gene Families, Epistasis and the Amino Acid Preferences of Protein Homologs

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN JP KR US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2004553203

Country of ref document: JP

ENP Entry into the national phase

Ref document number: 2006041389

Country of ref document: US

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 10535407

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2003774053

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2003774053

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 10535407

Country of ref document: US