WO2022244058A1 - 塩基配列の解析方法及び遺伝子解析装置 - Google Patents

塩基配列の解析方法及び遺伝子解析装置 Download PDF

Info

Publication number
WO2022244058A1
WO2022244058A1 PCT/JP2021/018618 JP2021018618W WO2022244058A1 WO 2022244058 A1 WO2022244058 A1 WO 2022244058A1 JP 2021018618 W JP2021018618 W JP 2021018618W WO 2022244058 A1 WO2022244058 A1 WO 2022244058A1
Authority
WO
WIPO (PCT)
Prior art keywords
correction amount
mobility correction
data
amount data
base sequence
Prior art date
Application number
PCT/JP2021/018618
Other languages
English (en)
French (fr)
Inventor
徹 横山
Original Assignee
株式会社日立ハイテク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立ハイテク filed Critical 株式会社日立ハイテク
Priority to DE112021007137.8T priority Critical patent/DE112021007137T5/de
Priority to PCT/JP2021/018618 priority patent/WO2022244058A1/ja
Priority to CN202180095722.8A priority patent/CN117043356A/zh
Priority to JP2023522007A priority patent/JPWO2022244058A1/ja
Priority to GB2316050.0A priority patent/GB2620335A/en
Priority to US18/555,972 priority patent/US20240132951A1/en
Publication of WO2022244058A1 publication Critical patent/WO2022244058A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Definitions

  • the present invention relates to a gene analysis device and method for analyzing the base sequence of a sample using electrophoresis.
  • the detection data of the reference base is used as the reference detection data
  • the target peak that precedes and follows the reference peak of the reference detection data is selected from the other detection data (S7), and the target peak and the target peak (S8), and the shift amount of the target peak is calculated so that both peak intervals are equal (S9). correct the information (S10).”
  • the base sequence of a nucleic acid is determined by including the following steps (A) to (C) in that order.
  • a base peak extraction step of extracting base peaks from electrophoresis data containing peaks (B) setting search start base peaks and peak interval reference values for starting searches in time-series data composed of the extracted base peaks condition setting step (C) in the time-series data, starting from the search starting base peak, sequentially scanning between adjacent base peaks in the forward and backward directions of the time series, and determining the interval between the base peaks as the peak interval basis;
  • the base sequence is determined by comparing the values and adding interpolated peaks to peak-missing sections.”
  • the conventional mobility correction method functions correctly. For example, in the case of a sample containing a long mixed base sequence, or in the case of a signal containing a large amount of noise, the waveform of the signal is corrected to reduce waveform overlap, and there are cases where the correct base sequence cannot be identified.
  • An object of the present invention is to provide a mobility correction method that solves the above problems.
  • a representative example of the invention disclosed in the present application is as follows. That is, a method for analyzing a base sequence executed by a gene analyzer for analyzing the base sequence of a sample using time-series data of signal intensities of a plurality of bases obtained by electrophoresis of the sample, wherein the gene
  • the analysis device manages an observation environment in association with mobility correction amount data for correcting the position in the time direction of the time-series data of the signal intensities of the plurality of bases
  • the base sequence analysis method comprises: When the genetic analysis device receives time-series data of signal intensities of a plurality of bases obtained by electrophoresis of the sample under the first observation environment, it corresponds to the observation environment different from the first observation environment.
  • FIG. 1 is a diagram showing a configuration example of a gene analysis apparatus of Example 1.
  • FIG. 1 is a diagram showing a configuration example of an electrophoresis apparatus of Example 1.
  • FIG. 4 is a diagram showing an example of migration characteristic information stored in the storage device of Example 1.
  • FIG. 5 is a diagram showing an example of mobility correction amount information stored in a storage device according to the first embodiment;
  • FIG. 5 is a diagram showing an example of mobility correction amount information stored in a storage device according to the first embodiment;
  • FIG. 5 is a diagram showing an example of mobility correction amount information stored in a storage device according to the first embodiment;
  • FIG. 4 is a flow chart for explaining an outline of processing executed by the gene analysis device of Example 1.
  • FIG. 4 is a flow chart for explaining an outline of processing executed by the gene analysis device of Example 1.
  • FIG. 4 is a flowchart for explaining electrophoresis processing executed by the electrophoresis apparatus of Example 1.
  • FIG. 5 is a flowchart for explaining mobility correction processing executed by the data analysis device of the first embodiment;
  • 4 is a diagram showing an image of a scale calculation method in Example 1.
  • FIG. 4 is a diagram showing an image of scaling of mobility correction amount data in Example 1.
  • FIG. 10 is a diagram showing an example of a method for correcting automatic mobility correction amount data according to the first embodiment;
  • FIG. 10 is a diagram showing an example of a method for correcting automatic mobility correction amount data according to the first embodiment;
  • FIG. 10 is a diagram showing a configuration example of a gene analysis apparatus of Example 2;
  • 10 is a flowchart for explaining data generation processing executed by the gene analysis apparatus of Example 2.
  • FIG. 10 is a flowchart for explaining mobility correction amount data generation processing executed by the gene analysis apparatus of Example 2.
  • FIG. 10 is a diagram showing an image of migration characteristic data and mobility correction amount data stored
  • FIG. 1 is a diagram showing a configuration example of the genetic analysis device 100 of Example 1.
  • FIG. 1 is a diagram showing a configuration example of the genetic analysis device 100 of Example 1.
  • the gene analysis device 100 includes an electrophoresis device 110 and a data analysis device 111.
  • the electrophoresis device 110 and the data analysis device 111 are communicably connected using a communication cable.
  • the data analysis device 111 has a control device 120 , a storage device 121 and a connection interface 122 .
  • the control device 120 controls the electrophoresis apparatus 110 and performs data processing.
  • the control device 120 is, for example, a CPU (Central Processing Unit) and a GPU (Graphics Processing Unit).
  • the storage device 121 stores programs executed by the control device 120, setting information of the electrophoresis apparatus 110, information used for various processes, and the like.
  • the storage device 121 is, for example, memory.
  • connection interface 122 is an interface that connects with an input device and an output device, or an interface that connects with an external device via a network.
  • the data analysis device 111 presents information to the user via the connection interface 122 and accepts information input by the user.
  • the control device 120 operates as a sample information setting unit 131, an electrophoresis apparatus control unit 132, a fluorescence intensity calculation unit 133, a mobility correction unit 134, and a base call unit 135 by executing programs stored in the storage device 121. Operate. In the following description, when the processing is described with the functional unit as the subject, it means that the control device 120 is executing the program.
  • the electrophoresis device 110 electrophoreses a sample (DNA fragment) and acquires migration data.
  • the migration data is time-series data of luminance values of DNA fragments labeled with a fluorescent dye.
  • FIG. 2 is a diagram showing a configuration example of the electrophoresis device 110 of the first embodiment.
  • the electrophoresis apparatus 110 has a detection unit 216 , a constant temperature bath 218 , a carrier 225 , a high voltage power supply 204 , a first ammeter 205 , an anode-side electrode 211 , a second ammeter 212 , a capillary array 217 and a pump mechanism 203 .
  • the capillary array 217 is a replacement member that includes a plurality of (e.g., eight) capillaries 202, and includes a load header 229, a detector 216, and a capillary head 233. Also, when the capillary 202 is damaged or degraded in quality, it can be replaced with a new capillary array 217 .
  • the capillary 202 is composed of a glass tube with an inner diameter of several tens to several hundred microns and an outer diameter of several hundred microns, and its surface is coated with polyimide to improve its strength.
  • the light irradiation portion irradiated with the laser light has a structure in which the polyimide film is removed so that the light emitted from the inside is easily leaked to the outside.
  • the inside of the capillary 202 is filled with a separation medium for giving a migration velocity difference during electrophoresis. There are both fluid and non-fluid separation media, but in Example 1, a fluid polymer is used.
  • a high voltage power supply 204 applies a high voltage to the capillary 202 .
  • a first ammeter 205 detects the current emitted from the high-voltage power supply 204 .
  • a second ammeter 212 detects the current flowing through the anode-side electrode 211 .
  • the optical detection section for detecting the information light obtained from the sample is composed of a light source 214 for irradiating the detection section 216 with excitation light, an optical detector 215 for detecting light emission in the detection section 216, and a diffraction grating 232. there is
  • the detector 216 is a member that acquires sample-dependent information.
  • the detection unit 216 When detecting a sample in the capillary 202 separated by electrophoresis, the detection unit 216 is irradiated with excitation light from the light source 214 to generate fluorescence having a wavelength dependent on the sample as information light. Furthermore, the diffraction grating 232 disperses the information light in the wavelength direction, the optical detector 215 detects the disperse information light, and analyzes the sample.
  • the capillary cathode ends 227 are fixed through metal hollow electrodes 226, and the tip of the capillary 202 protrudes from the hollow electrodes 226 by about 0.5 mm. Further, the hollow electrodes 226 provided in each capillary 202 are all integrated and attached to the load header 229 . Furthermore, all the hollow electrodes 226 are electrically connected to the high-voltage power supply 204 mounted on the main body of the apparatus, and function as cathode electrodes when it is necessary to apply voltage such as electrophoresis and sample introduction.
  • the capillary end (other end) opposite to the capillary cathode end 227 is bundled together by a capillary head 233 .
  • a capillary head 233 can be connected to block 207 in a pressure tight manner.
  • a high voltage from the high voltage power supply 204 is applied between the load header 229 and the capillary head 233 .
  • the new polymer is filled into the capillary 202 from the other end by the syringe 206 . Polymer refilling in capillary 202 is performed for each measurement to improve the performance of the measurement.
  • the pump mechanism 203 is composed of a syringe 206 and a mechanical system for pressurizing the syringe 206, and injects the polymer into the capillary 202.
  • a block 207 is a connecting portion for connecting the syringe 206, the capillary array 217, the anode buffer container 210, and the polymer container 209, respectively.
  • the constant temperature bath 218 is covered with a heat insulating material and the temperature is controlled by a heating and cooling mechanism 220 in order to keep the capillary 202 in the constant temperature bath 218 at a constant temperature.
  • a fan 219 circulates and agitates the air in the constant temperature bath 218 to keep the temperature of the capillary array 217 positionally uniform and constant.
  • a transporter 225 transports various containers to the capillary cathode end 227 .
  • the conveying machine 225 has three electric motors and linear actuators, and can move in three axial directions of up/down, left/right, and depth. At least one or more containers can be placed on the moving stage 230 of the carrier 225 .
  • the motion stage 230 is equipped with motorized grips 231 for grasping and releasing each container. Therefore, the buffer container 221, washing container 222, waste container 223, and sample plate 224 can be transported to the capillary cathode end 227 as required. Unnecessary containers are stored in a predetermined accommodation within the electrophoresis apparatus 110 .
  • a user can use the data analysis device 111 to control various functions of the electrophoresis device 110 and obtain migration data detected by the optical detection unit.
  • the electrophoresis apparatus 110 may have a sensor for acquiring information (observation environment information) on the observation environment that affects electrophoresis.
  • the electrophoresis apparatus 110 of FIG. 2 has an in-apparatus sensor 240 , a polymer sensor 241 and a buffer solution sensor 242 .
  • the in-apparatus sensor 240 is a sensor for acquiring information about the internal environment of the electrophoresis apparatus 110, and measures, for example, a temperature sensor, a humidity sensor, and an air pressure sensor inside the electrophoresis apparatus 110.
  • the polymer sensor 241 is a sensor for acquiring information about the quality of polymers, such as a PH sensor and an electrical conductivity sensor. Although the polymer sensor 241 is installed inside the polymer container 209 in FIG. 2, the installation location is not limited to this.
  • the buffer solution sensor 242 is a sensor for acquiring information about the quality of the buffer solution, for example, a temperature sensor.
  • the buffer solution sensor 242 is installed inside the anode buffer container 210 in FIG. 2, the installation location is not limited to this. For example, it may be set within the buffer container 221 .
  • FIG. 3 is a diagram showing an example of migration characteristic information stored in the storage device 121 of the first embodiment.
  • the storage device 121 stores migration characteristic information for managing migration characteristic data representing the relationship between migration time (t) and base position (p) for each type of base. Permanent characteristic data for each observation environment in the electrophoresis apparatus 110 is stored in the migration characteristic information.
  • the migration characteristic data are managed as a function Y(p). In this embodiment, it is assumed that the parameters representing the functions are managed instead of the functions themselves.
  • FIG. 3 shows migration characteristic data with different voltages applied by the high-voltage power supply 204 .
  • Y 5 (p) is electrophoretic characteristic data at a voltage of 5.0 kV
  • Y 8 (p) is electrophoretic characteristic data at a voltage of 8.0 kV
  • Y 11 (p) is a voltage of 11.0 kV. It is migration characteristic data in the case of 0 kV.
  • the migration characteristic information may be stored in the storage device 121 in advance, or may be obtained by electrophoresis of a sample having a known length such as a size standard in the electrophoresis device 110 by the electrophoresis device 110 . It may be generated using data.
  • 4A, 4B, and 4C are diagrams showing examples of mobility correction amount information stored in the storage device 121 of the first embodiment.
  • the storage device 121 stores mobility correction amount information for managing mobility correction amount data representing the relationship between migration time and mobility correction amount for each base species.
  • the mobility correction amount information stores default mobility correction amount data for each observation environment in the electrophoresis apparatus 110 .
  • the mobilities of base C (cytosine), base A (adenine), and base T (thymine) are corrected based on base G (guanine). Therefore, the storage device 121 stores the mobility correction amount information of each of base C, base A, and base T.
  • FIG. 4A represents the mobility correction amount information of the base C
  • FIG. 4B represents the mobility correction amount information of the base A
  • FIG. 4C represents the mobility correction amount information of the base T.
  • Curves represent default mobility correction amount data.
  • the mobility correction amount information may be stored in the storage device 121 in advance, or may be obtained by actually performing electrophoresis of a sample having a known length such as a size standard in the electrophoresis apparatus 110 using the electrophoresis apparatus 110. may be generated using the migration data obtained from
  • FIG. 5 is a flow chart explaining the outline of the processing executed by the gene analysis device 100 of the first embodiment.
  • the electrophoresis device 110 of the gene analysis device 100 executes electrophoresis processing on the sample to be analyzed (step S101). Details of the electrophoresis process will be described with reference to FIG.
  • the data analysis device 111 of the gene analysis device 100 executes fluorescence intensity calculation processing using migration data (step S102). Specifically, the fluorescence intensity calculator 133 calculates time-series data of the fluorescence intensity of the fluorescent dye from the migration data, and detects the center position, height, width, etc. of the peak from the time-series data of the fluorescence intensity.
  • the data analysis device 111 of the gene analysis device 100 executes mobility correction processing on the fluorescence intensity time-series data (step S103). Details of the mobility correction process will be described with reference to FIGS. 7 to 10.
  • FIG. The gene analysis apparatus 100 of Example 1 is characterized by mobility correction processing, as will be described later.
  • the data analysis device 111 of the gene analysis device 100 performs a base call using the fluorescence intensity time-series data corrected based on the result of the mobility correction processing (step S104). Specifically, the base calling unit 135 identifies the base sequence of the sample using the time-series data of the corrected fluorescence intensity.
  • FIG. 6 is a flowchart for explaining electrophoresis processing executed by the electrophoresis apparatus 110 of the first embodiment.
  • the user sets the sample to be analyzed, reagents, etc. in the electrophoresis apparatus 110 and instructs the start of electrophoresis processing via the connection interface 122 .
  • Samples are set according to the following procedure.
  • the user fills the buffer container 221 and the anode buffer container 210 with a buffer solution that forms part of the current-carrying path.
  • the buffer solution is, for example, an electrolytic solution commercially available for electrophoresis from each company.
  • the user dispenses samples to be analyzed into the wells of the sample plate 224 .
  • the sample is, for example, a PCR product of DNA.
  • a user dispenses a cleaning solution into cleaning container 222 for cleaning capillary cathode end 227 .
  • the cleaning solution is pure water, for example.
  • a user injects an electrophoresis medium for electrophoresis of a sample into the syringe 206 .
  • the electrophoresis medium is, for example, a polyacrylamide-based separation gel or polymer commercially available for electrophoresis from various companies.
  • the user replaces the capillary array 217 when deterioration of the capillaries 202 is expected or when the length of the capillaries 202 is changed.
  • the samples set on the sample plate 224 include, in addition to the actual sample of DNA to be analyzed, positive controls, negative controls, allelic ladders, and the like, which are electrophoresed in different capillaries 202 .
  • a positive control is, for example, a PCR product containing known DNA, and is a sample for control experiments to confirm that the DNA is correctly amplified by PCR.
  • a negative control is a PCR product that does not contain DNA, and is a control experiment sample for confirming that the amplified product of PCR is free from contamination such as user's DNA and dust.
  • An allelic ladder is an artificial sample containing many bases that may generally be contained in a DNA marker, and is usually provided by a reagent manufacturer as a reagent kit for DNA identification. The allelic ladder is used for the purpose of fine-tuning the corresponding relationship between the DNA fragment lengths of individual DNA markers and alleles.
  • a known DNA fragment labeled with a specific fluorescent dye is mixed with all of the real sample, positive control, negative control, and allelic ladder.
  • the type of fluorescent dye assigned to the size standard differs depending on the reagent kit used.
  • the user specifies the type of allelic ladder, the type of size standard, the type of fluorescent reagent, the type of sample set in the wells on the sample plate 224 corresponding to each capillary 202, and the like. In Example 1, any one type of real sample, positive control, negative control, and allelic ladder is specified. These information settings are input to the sample information setting unit 131 via the connection interface 122 of the data analysis device 111 .
  • the electrophoresis apparatus control unit 132 transmits a signal instructing the start of analysis to the electrophoresis apparatus 110 . Upon receiving the signal, the electrophoresis apparatus 110 starts electrophoresis processing described below.
  • the electrophoresis apparatus 110 first fills the capillary 202 with a new migration medium to form a migration path (step S201).
  • the filling of the electrophoresis medium may be performed automatically after the analysis is started, or may be sequentially performed based on control signals transmitted from the electrophoresis apparatus control section 132 .
  • the electrophoresis apparatus 110 carries the waste liquid container 223 directly under the load header 229 by the carrier 225, closes the solenoid valve 213, and receives the used electrophoresis medium discharged from the cathode end 227 of the capillary. to Then, the electrophoresis apparatus 110 drives the syringe 206 to fill the capillary 202 with a new electrophoresis medium and discard the used electrophoresis medium. Finally, the electrophoresis apparatus 110 immerses the capillary cathode end 227 in the washing solution in the washing container 222 to wash the capillary cathode end 227 dirty with the electrophoresis medium.
  • the electrophoresis apparatus 110 applies a predetermined voltage to the migration medium to perform preliminary migration for making the migration medium suitable for electrophoresis (step S202).
  • Preliminary electrophoresis may be performed automatically, or may be performed sequentially based on control signals transmitted from the electrophoresis apparatus controller 132 .
  • the electrophoresis apparatus 110 immerses the cathode ends 227 of the capillaries in the buffer solution in the buffer container 221 by the transfer machine 225 to form an electric path. Then, the electrophoresis apparatus 110 applies a voltage of several to several tens of kilovolts to the migration medium for several to several tens of minutes using the high-voltage power supply 204 to make the migration medium suitable for electrophoresis. Finally, the electrophoresis apparatus 110 soaks the capillary cathode end 227 in the washing solution in the washing container 222 to wash the dirty capillary cathode end 227 with the buffer solution.
  • the electrophoresis apparatus 110 introduces a sample (step S203).
  • the introduction of the sample may be performed automatically, or sequentially based on control signals transmitted from the electrophoresis apparatus controller 132 .
  • the electrophoresis apparatus 110 immerses the capillary cathode end 227 in the sample held in the well of the sample plate 224 by the carrier 225 and then opens the electromagnetic valve 213 . As a result, an energizing path is formed, and the sample component can be introduced into the electrophoresis path.
  • the electrophoresis apparatus 110 applies a pulse voltage to the current path from the high-voltage power supply 204 to introduce sample components into the electrophoresis path.
  • the electrophoresis apparatus 110 soaks the capillary cathode end 227 in the washing solution in the washing container 222 to wash the capillary cathode end 227 soiled by the sample.
  • the electrophoresis apparatus 110 separates and analyzes each sample component contained in the sample to perform electrophoresis analysis (step S204).
  • the electrophoresis analysis may be performed automatically, or sequentially based on control signals transmitted from the electrophoresis apparatus control section 132 .
  • the electrophoresis apparatus 110 immerses the cathode ends 227 of the capillaries in the buffer solution in the buffer container 221 by the transfer machine 225 to form an electric path.
  • the electrophoresis apparatus 110 applies a high voltage of about 15 kV to the current path by the high-voltage power supply 204 to generate an electric field in the electrophoresis path. Due to the generated electric field, each sample component in the migration path moves to the detection section 216 at a speed depending on the properties of each sample component. That is, sample components are separated by differences in their migration speeds. Then, the sample components that have reached the detection unit 216 are detected in order.
  • the migration speed will differ depending on the base lengths, and DNAs with shorter base lengths will reach the detector 216 in order.
  • Each DNA is attached with a fluorescent dye depending on its terminal base sequence.
  • Electrophoresis device 110 detects fluorescence with optical detector 215 .
  • the optical detector 215 detects this fluorescence at regular time intervals and transmits image data to the data analysis device 111 .
  • each capillary 202 may transmit luminance values sampled only at wavelength positions at regular intervals.
  • the data transmitted from the electrophoresis apparatus 110 is time-series data of luminance values of the capillaries 202 and stored in the storage device 121 .
  • the electrophoresis apparatus 110 stops applying the voltage and ends the electrophoresis analysis.
  • the above is the description of the electrophoresis treatment.
  • FIG. 7 is a flowchart for explaining mobility correction processing executed by the data analysis device 111 of the first embodiment.
  • FIG. 8 is a diagram showing an image of a scale calculation method according to the first embodiment.
  • FIG. 9 is a diagram showing an image of scaling of mobility correction amount data according to the first embodiment.
  • 10A and 10B are diagrams illustrating an example of a method for correcting automatic mobility correction amount data according to the first embodiment.
  • the mobility correction unit 134 calculates the scale based on the observation environment information of the electrophoresis device 110 (step S301).
  • a method of calculating the scale will be described by focusing on the voltage in the observation environment.
  • the mobility correction unit 134 refers to the migration characteristic information and searches for migration characteristic data corresponding to the voltage (target voltage) included in the observation environment information. If migration characteristic data corresponding to the target voltage exists, default mobility correction amount data corresponding to the target voltage exists, so the mobility correction unit 134 terminates the processing of step S301. In this case, no scale calculation is performed.
  • the mobility correction unit 134 uses the migration characteristic data of a voltage with a small difference from the target voltage to obtain the migration characteristic data of the target voltage (target migration characteristics data).
  • the migration characteristic data of the actual observation environment is estimated using the migration characteristic data of the observation environment similar to the actual observation environment.
  • the similarity of the viewing environment means that the combination of physical quantities representing the viewing environment is similar.
  • the target voltage is 9.0 kV , as shown in FIG. Migration property data is generated.
  • the electrophoresis characteristic data of the target voltage can be generated by Equation (1).
  • the mobility correction unit 134 calculates the scale between the migration characteristic data used to generate the target migration characteristic data and the target migration characteristic data at time t.
  • the scale S 8 (t) for the migration characteristic data Y 8 (p) of 8.0 kV at time t is given by equation (2)
  • the scale S 8 (t) of 11.0 kV at time t is given by Equation (3).
  • the mobility correction unit 134 generates default mobility correction amount data (step S302).
  • a method of calculating the default mobility correction amount data will be described by focusing on the voltage in the observation environment.
  • the mobility correction unit 134 refers to the mobility correction amount information of each base and searches for default mobility correction amount data corresponding to the voltage (target voltage) included in the observation environment information. If there is default mobility correction amount data corresponding to the target voltage, the mobility correction unit 134 ends the processing of step S302. In this case, the searched default mobility correction amount data is used as it is.
  • the mobility correction unit 134 specifies the voltage of the migration characteristic data used to generate the target migration characteristic data in step S301. do.
  • the mobility correction unit 134 refers to the mobility correction amount information of each base and acquires default mobility correction amount data corresponding to the specified voltage.
  • the mobility correction unit 134 multiplies each point of the default mobility correction amount data by a scale corresponding to the specified voltage, thereby obtaining the default mobility of the target voltage. Calculate correction amount data.
  • the mobility correction unit 134 multiplies the default mobility correction amount data of 8.0 kV by the scale S 8 (t) to obtain the first default mobility correction amount data. Then, the default mobility correction amount data of 11.0 kV is multiplied by the scale S 11 (t) to calculate the second default mobility correction amount data. Further, the mobility correction unit 134 calculates the average of the first default mobility correction amount data and the second default mobility correction amount data as default mobility correction amount data of 9.0 kV.
  • the default mobility correction amount data for each observation environment in Example 1 has a scale relationship.
  • the mobility correction unit 134 optimizes the amount of mobility correction for the fluorescence intensity time-series data (step S303).
  • a known algorithm for optimizing the amount of mobility correction can be used for optimizing the amount of mobility correction, so a detailed description will be omitted.
  • the following optimization algorithm is conceivable.
  • the mobility correction unit 134 sets a block of a predetermined time size and moves the block in the time direction with respect to the fluorescence intensity time-series data so that the waveform overlap of each base in the block is minimized. Search for the mobility correction amount for each base.
  • Mobility correction amount data (automatic mobility correction amount data) is obtained by plotting the results of the search processing and smoothly interpolating between the plotted points.
  • the default mobility correction amount data may be used as an initial value for optimization.
  • the mobility correction unit 134 determines mobility correction amount data based on the automatic mobility correction amount data and the default mobility correction amount data (step S304). For example, the following processing can be considered.
  • the mobility correction unit 134 adopts the default mobility correction amount data.
  • a unit 134 employs the automatic mobility correction amount data. The aforementioned difference is based on the maximum value of the difference between the automatic mobility correction amount data and the default mobility correction amount data, the total value of the differences at each point of the automatic mobility correction amount data and the default mobility correction amount data, etc. can be evaluated. For portions where the difference between the automatic mobility correction amount data and the default mobility correction amount data is small, the automatic mobility correction amount data is adopted, and the difference between the automatic mobility correction amount data and the default mobility correction amount data is The default mobility correction amount data may be employed for the portion where is large.
  • the mobility correction unit 134 has a large difference between the automatic mobility correction amount data (solid line graph) and the default mobility correction amount data (dotted line graph), and A place (dotted-line rectangular area) with a large rate of change is identified. As shown in FIG. 10B , the mobility correction unit 134 corrects the specified location so that the difference from the default mobility correction amount data is small and the variation rate is small.
  • the amount of mobility correction is calculated so that the overlap is reduced. Therefore, when the mixed base sequence is long, an appropriate mobility correction may not be calculated. In such a case, the difference from the default mobility correction amount data tends to increase.
  • the mobility correction unit 134 of the first embodiment performs automatic correction using the default mobility correction amount data as correction constraints. This makes it possible to accurately correct the mobility even for a sample containing a long mixed base sequence or electrophoresis data containing a large amount of noise.
  • the mobility correction amount data that is actually used is adjusted based on the default mobility correction amount data, part or all of it has characteristics similar to the default mobility correction amount data.
  • Example 1 default mobility correction amount data for an arbitrary observation environment is generated by scaling default mobility correction amount data for different observation environments. This makes it possible to adapt to various observation environments.
  • Example 2 the data analysis device 111 generates migration characteristic data and default mobility correction amount data for each observation environment.
  • the second embodiment will be described below, focusing on the differences from the first embodiment.
  • FIG. 11 is a diagram showing a configuration example of the gene analysis device 100 of Example 2.
  • FIG. 11 is a diagram showing a configuration example of the gene analysis device 100 of Example 2.
  • the configuration of the electrophoresis apparatus 110 of Example 2 is the same as that of Example 1.
  • the hardware configuration of the data analysis device 111 of the second embodiment is the same as that of the first embodiment.
  • the software configuration of the data analysis device 111 of Example 2 is partially different. Specifically, the data analysis apparatus 111 of the second embodiment differs from that of the first embodiment in that it has a migration characteristic data generator 136 .
  • the migration characteristic data generator 136 generates migration characteristic data and default mobility correction amount data.
  • the processing executed by the gene analysis apparatus 100 of the second embodiment is the same as that of the first embodiment.
  • the electrophoresis process executed by the electrophoresis apparatus 110 of the second embodiment is the same as that of the first embodiment.
  • the mobility correction processing executed by the data of the second embodiment is the same as that of the first embodiment.
  • the storage device 121 stores reference migration characteristic data, mobility correction amount data, and base sequences of any sample in any observation environment.
  • the sample is desirably a sample with a single nucleotide sequence that facilitates base calling.
  • FIG. 12 is a flowchart for explaining data generation processing executed by the gene analysis device 100 of the second embodiment.
  • the gene analysis apparatus 100 Upon receiving an instruction from the user, the gene analysis apparatus 100 executes data generation processing.
  • the gene analysis apparatus 100 executes mobility correction amount data generation processing (step S401).
  • mobility correction amount data generation process mobility correction amount data is generated for a plurality of observation environments, and a base call is performed for base sequences. Details of the processing will be described with reference to FIG.
  • the gene analysis device 100 performs mapping between the reference base sequence and base sequences in any observation environment (step S402).
  • the migration characteristic data generation unit 136 of the data analysis device 111 calculates the base position of base G in the base sequence of each observation environment by the above mapping.
  • step S403 the gene analysis apparatus 100 executes migration characteristic data generation processing. Specifically, the following processing is executed.
  • the migration characteristic data generation unit 136 of the data analysis device 111 plots points in a space with base positions and migration times as axes, based on the base sequence in a certain observation environment.
  • the migration characteristic data generation unit 136 may interpolate between the points plotted in S403-1 as necessary.
  • the migration characteristic data generator 136 obtains an approximate expression from the plotted points.
  • the migration characteristic data generator 136 stores the parameters of the approximation formula as migration characteristic data in the storage device 121 in association with the observation environment.
  • FIG. 13 is a flowchart for explaining mobility correction amount data generation processing executed by the gene analysis apparatus 100 of the second embodiment.
  • the electrophoresis device 110 of the gene analysis device 100 executes sample electrophoresis processing for a plurality of observation environments (step S501).
  • the electrophoresis treatment in Example 2 is the same as in Example 1.
  • observation environment is assumed to be specified by the user. It is assumed that a plurality of pieces of electrophoresis data are obtained by executing the electrophoresis process a plurality of times for one observation environment.
  • the data analysis device 111 of the gene analysis device 100 starts loop processing of the observation environment (step S502). Specifically, the data analysis device 111 selects one observation environment.
  • the data analysis device 111 of the gene analysis device 100 executes fluorescence intensity calculation processing for a plurality of migration data (step S503).
  • the fluorescence intensity calculation process of the second embodiment is the same as that of the first embodiment.
  • the data analysis device 111 of the gene analysis device 100 optimizes the mobility correction amount for the time-series data of each fluorescence intensity (step S504).
  • a well-known technique is used for optimizing the mobility correction amount in the second embodiment.
  • the data analysis device 111 of the gene analysis device 100 performs a base call using the corrected time-series data of fluorescence intensity (step S505).
  • the data analysis device 111 of the gene analysis device 100 generates mobility correction amount data of the observation environment (step S506).
  • the migration characteristic data generator 136 calculates the average of the plurality of mobility correction amount data calculated in step S504.
  • the migration characteristic data generator 136 stores the calculated mobility correction amount data in the storage device 121 in association with the observation environment. Note that the mobility correction amount data for which the base call of the base sequence is determined to be erroneous is excluded.
  • the data analysis device 11 of the gene analysis device 100 determines whether or not processing has been completed for all observation environments (step S507).
  • the data analysis device 111 of the genetic analysis device 100 returns to step S502 and performs similar processing.
  • the gene analysis apparatus 100 terminates the mobility correction amount data generation processing.
  • the second embodiment by preparing migration characteristic data for a plurality of observation environments, it is possible to reduce the cost of calculating the scale and calculating the mobility correction amount data.
  • Example 3 the data analysis device 111 adds the migration characteristic data and the mobility correction amount calculated in the actual analysis.
  • the third embodiment will be described below, focusing on the differences from the first embodiment.
  • the configuration of the genetic analysis device 100 of Example 3 is the same as that of Example 1.
  • the configurations of the electrophoresis device 110 and the data analysis device 111 of the third embodiment are the same as those of the first embodiment.
  • Example 3 the processing executed by the gene analysis device 100 is partially different. Specifically, after the data analysis device 111 makes a base call (step S104), based on the user's instruction, the migration characteristic data and the mobility correction amount data calculated in a series of processes are transferred to the observation environment. They are stored in the storage device 121 in association with each other.
  • FIG. 14 is a diagram showing an image of migration characteristic data and mobility correction amount data stored in the storage device 121 of the third embodiment.
  • FIG. 14 shows the distribution of spatial data representing the observation environment composed of temperature and voltage.
  • the initial storage device 121 stores permanent characteristic data and mobility correction amount data of the observation environment corresponding to the black dot. It can be seen that the permanent characteristic data and the mobility correction amount data of the observation environment indicated by hatched circles have been added by the user's instruction.
  • Example 3 The electrophoresis process and mobility correction process of Example 3 are the same as those of Example 1. Also, the gene analysis apparatus 100 of Example 3 may execute data generation processing.
  • Example 3 by adding the migration characteristic data and the mobility correction amount data according to the secular change of the gene analysis device 100 and the environment in which it is actually used, the accuracy and cost of base calling can be reduced. can.
  • the present invention is not limited to the above-described embodiments, and includes various modifications. Further, for example, the above-described embodiments are detailed descriptions of the configurations for easy understanding of the present invention, and are not necessarily limited to those having all the described configurations. Moreover, it is possible to add, delete, or replace a part of the configuration of each embodiment with another configuration.
  • each of the above configurations, functions, processing units, processing means, etc. may be realized in hardware, for example, by designing a part or all of them with an integrated circuit.
  • the present invention can also be implemented by software program code that implements the functions of the embodiments.
  • a computer is provided with a storage medium recording the program code, and a processor included in the computer reads the program code stored in the storage medium.
  • the program code itself read from the storage medium implements the functions of the above-described embodiments, and the program code itself and the storage medium storing it constitute the present invention.
  • Examples of storage media for supplying such program code include flexible disks, CD-ROMs, DVD-ROMs, hard disks, SSDs (Solid State Drives), optical disks, magneto-optical disks, CD-Rs, magnetic tapes, A nonvolatile memory card, ROM, or the like is used.
  • program code that implements the functions described in this embodiment can be implemented in a wide range of programs or script languages, such as assembler, C/C++, perl, Shell, PHP, Python, and Java.
  • the program code of the software that implements the functions of the embodiment can be stored in storage means such as a hard disk or memory of a computer, or in a storage medium such as a CD-RW or CD-R.
  • a processor provided in the computer may read and execute the program code stored in the storage means or the storage medium.
  • control lines and information lines indicate those that are considered necessary for explanation, and not all the control lines and information lines are necessarily indicated on the product. All configurations may be interconnected.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Signal Processing (AREA)
  • Sustainable Development (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

サンプルの塩基配列を解析する遺伝子解析装置は、観測環境と、サンプルを電気泳動することによって取得される複数の塩基の信号強度の時系列データの時間方向の位置を補正するための移動度補正量データとを対応づけて管理し、第1観測環境下においてサンプルを電気泳動することによって取得された複数の塩基の信号強度の時系列データを受け付けた場合、第1観測環境と異なる観測環境に対応する移動度補正量データをスケーリングすることによって、デフォルト移動度補正量データを生成し、移動度補正量の最適化アルゴリズムと、デフォルト移動度補正量データとを用いて、複数の塩基の信号強度の時系列データの時間方向の位置を補正し、補正された複数の塩基の信号強度の時系列データを用いてサンプルの塩基配列を特定する。

Description

塩基配列の解析方法及び遺伝子解析装置
 本発明は、電気泳動を用いてサンプルの塩基配列を解析する遺伝子解析装置及びその方法に関する。
 キャピラリ電気泳動装置を用いたDNAの塩基配列の解析では、塩基の泳動速度の違いを補正する移動度補正処理が実行される(例えば、非特許文献1を参照)。移動度補正処理に関しては、例えば、特許文献1、2に記載の技術が知られている。
 特許文献1には、「4種類の塩基の検出データを得(S1)、基準塩基の検出データを基準検出データとして他の検出データを移動させ(S2)、頂点波形の総面積の計算を行ない(S3)、移動度補正用の関数を直線的シフトとして頂点波形の総面積が最大になる他の検出データのシフト量を求め(S4)、検出データの位置情報を補正する(S5)。仮の塩基配列を決定し(S6)、基準塩基の検出データを基準検出データとし、基準検出データの基準ピークが前後に存在する対象ピークを他の検出データから選出し(S7)、対象ピークと前後の基準ピークとのピーク間隔をそれぞれ求め(S8)、両ピーク間隔が等しくなるように対象ピークのシフト量を算出し(S9)、それを対象ピークの属する検出データのシフト量として検出データの位置情報を補正する(S10)。」ことが記載されている。
 特許文献2には、「以下の工程(A)から(C)をその順に含んで核酸の塩基配列を決定する。(A)試料核酸を電気泳動分離して得られた4種類の塩基種別のピークを含む電気泳動データから基盤ピークを抽出する基盤ピーク抽出工程、(B)抽出された基盤ピークにより構成される時系列データにおいて、探索を開始する探索始点基盤ピーク及びピーク間隔基準値を設定する条件設定工程、(C)前記時系列データにおいて、探索始点基盤ピークを始点として、隣接する基盤ピーク間を時系列の前方向及び後方向に順次走査し、基盤ピーク間の間隔を前記ピーク間隔基準値とを比較してピーク欠落区間に補間ピークを追加することにより塩基配列を決定する。」ことが記載されている。
特開2002-228633号公報 国際公開第2008/050426号
Michael C. Giddings, Jessica Severin, Michael Westphall, Jiazhen Wu, and Lloyd M. Smith、"A Software System for Data Analysis in Automated DNA?Sequencing"、Genome Res. 1998 Jun;8(6):644-665.
 近年、電気泳動装置の小型化のニーズが高まっている。電気泳動装置を小型化した場合、信号の分解能の精度が低下し、信号の波形を用いて補正することが困難となるという課題がある。
 また、信号の分解能の精度が低下した場合、従来の移動度補正の手法が正しく機能しケースがある。例えば、長い混合塩基配列が含まれるサンプルの場合、又は、大きなノイズを含む信号の場合、波形の重なりが小さくなるように信号の波形が補正され、正しい塩基配列を特定できないケースがある。
 本発明は、上記の課題を解決する移動度補正の手法を提供することを目的とする。
 本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、サンプルを電気泳動することによって取得される複数の塩基の信号強度の時系列データを用いて前記サンプルの塩基配列を解析する遺伝子解析装置が実行する塩基配列の解析方法であって、前記遺伝子解析装置は、観測環境と、前記複数の塩基の信号強度の時系列データの時間方向の位置を補正するための移動度補正量データとを対応づけて管理し、前記塩基配列の解析方法は、前記遺伝子解析装置が、第1観測環境下において前記サンプルを電気泳動することによって取得された複数の塩基の信号強度の時系列データを受け付けた場合、前記第1観測環境と異なる前記観測環境に対応する前記移動度補正量データをスケーリングすることによって、デフォルト移動度補正量データを生成する第1のステップと、前記遺伝子解析装置が、移動度補正量の最適化アルゴリズムと、前記デフォルト移動度補正量データとを用いて、前記複数の塩基の信号強度の時系列データの時間方向の位置を補正する第2のステップと、補正された前記複数の塩基の信号強度の時系列データを用いて前記サンプルの塩基配列を特定する第3のステップと、を含む。
 本発明によれば、サンプルの塩基配列の解析精度の高い移動度補正を実現できる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。
実施例1の遺伝子解析装置の構成例を示す図である。 実施例1の電気泳動装置の構成例を示す図である。 実施例1の記憶デバイスに格納される泳動特性情報の一例を示す図である。 実施例1の記憶デバイスに格納される移動度補正量情報の一例を示す図である。 実施例1の記憶デバイスに格納される移動度補正量情報の一例を示す図である。 実施例1の記憶デバイスに格納される移動度補正量情報の一例を示す図である。 実施例1の遺伝子解析装置が実行する処理の概要を説明するフローチャートである。 実施例1の電気泳動装置が実行する電気泳動処理を説明するフローチャートである。 実施例1のデータ解析装置が実行する移動度補正処理を説明するフローチャートである。 実施例1のスケールの算出方法のイメージを示す図である。 実施例1の移動度補正量データのスケーリングのイメージを示す図である。 実施例1の自動移動度補正量データの修正方法の一例を示す図である。 実施例1の自動移動度補正量データの修正方法の一例を示す図である。 実施例2の遺伝子解析装置の構成例を示す図である。 実施例2の遺伝子解析装置が実行するデータ生成処理を説明するフローチャートである。 実施例2の遺伝子解析装置が実行する移動度補正量データ生成処理を説明するフローチャートである。 実施例3の記憶デバイスに格納される泳動特性データ及び移動度補正量データのイメージを示す図である
 以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。
 以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。
 本明細書等における「第1」、「第2」、「第3」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。
 図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。
 図1は、実施例1の遺伝子解析装置100の構成例を示す図である。
 遺伝子解析装置100は、電気泳動装置110及びデータ解析装置111を備える。電気泳動装置110及びデータ解析装置111は通信ケーブルを用いて通信可能に接続される。
 データ解析装置111は、制御デバイス120、記憶デバイス121、及び接続インタフェース122を有する。
 制御デバイス120は、電気泳動装置110の制御及びデータ処理を実行する。制御デバイス120は、例えば、CPU(Central Processing Unit)及びGPU(Graphics Processing Unit)である。
 記憶デバイス121は、制御デバイス120が実行するプログラム、電気泳動装置110の設定情報、各種処理に使用する情報等を格納する。記憶デバイス121は、例えば、メモリである。
 接続インタフェース122は、入力装置及び出力装置と接続するインタフェース、又は、ネットワークを介して外部装置と接続するインタフェースである。データ解析装置111は、接続インタフェース122を介して、ユーザに情報を提示し、また、ユーザによって入力された情報を受け付ける。
 制御デバイス120は、記憶デバイス121に格納されるプログラムを実行することによって、サンプル情報設定部131、電気泳動装置制御部132、蛍光強度算出部133、移動度補正部134、及びベースコール部135として動作する。以下の説明では、機能部を主語に処理を説明する場合、制御デバイス120がプログラムを実行していることを表す。
 電気泳動装置110は、サンプル(DNA断片)を電気泳動し、泳動データを取得する。泳動データは、蛍光色素で標識されたDNA断片の輝度値の時系列データである。
 ここで、電気泳動装置110の構成を説明する。図2は、実施例1の電気泳動装置110の構成例を示す図である。
 電気泳動装置110は、検出部216、恒温槽218、搬送機225、高圧電源204、第1電流計205、陽極側電極211、第2電流計212、キャピラリアレイ217、ポンプ機構203を有する。
 キャピラリアレイ217は、複数本(例えば、8本)のキャピラリ202を含む交換部材であり、ロードヘッダ229、検出部216、及びキャピラリヘッド233を含む。また、キャピラリ202の破損又は品質の劣化に伴って、新品のキャピラリアレイ217に交換できる。
 キャピラリ202は、内径数十から数百ミクロン、外形数百ミクロンのガラス管で構成され、強度を向上させるために表面をポリイミドでコーティングしている。ただし、レーザ光が照射される光照射部は、内部の発光が外部に漏れやすいように、ポリイミド被膜が除去された構造になっている。キャピラリ202の内部には、電気泳動時に泳動速度差を与えるための分離媒体が充填される。分離媒体は、流動性及び非流動性の双方が存在するが、実施例1では流動性のポリマを用いる。
 高圧電源204は、キャピラリ202に高い電圧を印加する。第1電流計205は、高圧電源204から発せられる電流を検出する。第2電流計212は、陽極側電極211に流れる電流を検出する。
 サンプルより得られる情報光を検出する光学検出部は、検出部216に励起光を照射する光源214と、検出部216内の発光を検出するための光学検出器215、回折格子232で構成されている。検出部216は、サンプルに依存した情報を取得する部材である。
 電気泳動により分離されたキャピラリ202中のサンプルを検出する場合、検出部216に光源214から励起光が照射することによって、サンプルに依存した波長を有する蛍光を情報光として生じさせる。さらに、回折格子232が波長方向に情報光を分光し、光学検出器215が分光された情報光を検出し、サンプルを解析する。
 キャピラリ陰極端227は、それぞれ金属製の中空電極226を通して固定されており、キャピラリ202の先端が中空電極226から0.5mm程度突き出た状態になっている。また、各キャピラリ202に装備された中空電極226は、すべてが一体となってロードヘッダ229に装着される。さらに、すべての中空電極226は、装置本体に搭載されている高圧電源204と導通しており、電気泳動及びサンプル導入等、電圧を印加する必要がある場合、陰極電極として機能する。
 キャピラリ陰極端227と反対側のキャピラリ端部(他端部)は、キャピラリヘッド233により一つに束ねられている。キャピラリヘッド233は、ブロック207に耐圧機密で接続できる。高圧電源204による高電圧はロードヘッダ229及びキャピラリヘッド233の間にかけられる。そして、シリンジ206によって、他端部からキャピラリ202内に新規ポリマが充填される。キャピラリ202中のポリマ詰め替えは、測定の性能を向上するために測定ごとに実施される。
 ポンプ機構203は、シリンジ206と当該シリンジ206を加圧するための機構系とで構成され、キャピラリ202にポリマを注入する。
 ブロック207は、シリンジ206、キャピラリアレイ217、陽極バッファ容器210、及びポリマ容器209をそれぞれ連通させるための接続部である。
 恒温槽218は、恒温槽218内のキャピラリ202を一定の温度に保つために、断熱材で覆われ、加熱冷却機構220によって温度が制御される。また、ファン219が恒温槽218内の空気を循環及び攪拌し、キャピラリアレイ217の温度を位置的に均一かつ一定に保つ。
 搬送機225は、キャピラリ陰極端227に様々な容器を搬送する。搬送機225は、三つの電動モータ及びリニアアクチュエータを備え、上下、左右、及び奥行きの3軸方向に移動可能である。また、搬送機225の移動ステージ230には少なくとも一つ以上の容器を載せることができる。さらに、移動ステージ230には電動のグリップ231が備えられており、各容器を掴むこと及び放すことができる。このため、バッファ容器221、洗浄容器222、廃液容器223、及びサンプルプレート224を必要に応じて、キャピラリ陰極端227まで搬送できる。なお、不必要な容器は、電気泳動装置110内の所定収容所に保管される。
 ユーザは、データ解析装置111を用いて、電気泳動装置110の各種機能を制御し、光学検出部によって検出された泳動データを取得することができる。
 電気泳動装置110には、電気泳動に影響を与える観測環境に関する情報(観測環境情報)を取得するためのセンサが存在してもよい。図2の電気泳動装置110は、装置内センサ240、ポリマセンサ241、緩衝液センサ242を有する。
 装置内センサ240は、電気泳動装置110の内部環境に関する情報を取得するためのセンサであり、例えば、電気泳動装置110内の温度センサ、湿度センサ、及び気圧センサ等を計測する。
 ポリマセンサ241は、ポリマの品質に関する情報を取得するためのセンサであり、例えば、PHセンサ及び電気伝導率センサ等である。ポリマセンサ241は、図2ではポリマ容器209内に設置されているが、設置場所はこれに限定されない。
 緩衝液センサ242は、緩衝液の品質に関する情報を取得するためのセンサであり、例えば、温度センサがある。緩衝液センサ242は、図2では陽極バッファ容器210内に設置されているが、設置場所はこれに限定されない。例えば、バッファ容器221内に設定されていてもよい。
 図3は、実施例1の記憶デバイス121に格納される泳動特性情報の一例を示す図である。
 記憶デバイス121には、塩基種ごとに、泳動時間(t)と塩基の位置(p)との関係を表す泳動特性データを管理する泳動特性情報が格納される。泳動特性情報には、電気泳動装置110における観測環境ごとの永続特性データが格納される。
 泳動特性データは関数Y(p)として管理される。なお、本実施例では、関数そのものではなく関数を表すパラメータが管理されるものとする。図3では、高圧電源204が印加する電圧が異なる泳動特性データを示す。Y(p)は、電圧が5.0kVの場合の泳動特性データであり、Y(p)は電圧が8.0kVの場合の泳動特性データであり、Y11(p)は電圧11.0kVの場合の泳動特性データである。
 なお、泳動特性情報は、記憶デバイス121にあらかじめ記憶されてもよいし、実際に電気泳動装置110にサイズスタンダード等の長さが既知のサンプルを電気泳動装置110により電気泳動して得られた泳動データを用いて生成してもよい。
 図4A、図4B、及び図4Cは、実施例1の記憶デバイス121に格納される移動度補正量情報の一例を示す図である。
 記憶デバイス121には、塩基種ごとに、泳動時間と移動度の補正量との関係を表す移動度補正量データを管理する移動度補正量情報が格納される。移動度補正量情報には、電気泳動装置110における観測環境ごとのデフォルト移動度補正量データが格納される。実施例1では、塩基G(グアニン)を基準にして、塩基C(シトシン)、塩基A(アデニン)、塩基T(チミン)の移動度の補正が行われる。したがって、記憶デバイス121には、塩基C、塩基A、及び塩基Tの各々の移動度補正量情報が格納される。
 図4Aは塩基Cの移動度補正量情報を表し、図4Bは塩基Aの移動度補正量情報を表し、図4Cは塩基Tの移動度補正量情報を表す。曲線がデフォルト移動度補正量データを表す。
 なお、移動度補正量情報は、記憶デバイス121にあらかじめ記憶されてもよいし、実際に電気泳動装置110にサイズスタンダード等の長さが既知のサンプルを電気泳動装置110により電気泳動して得られた泳動データを用いて生成してもよい。
 図5は、実施例1の遺伝子解析装置100が実行する処理の概要を説明するフローチャートである。
 遺伝子解析装置100の電気泳動装置110は、解析対象のサンプルに対して電気泳動処理を実行する(ステップS101)。電気泳動処理の詳細は図6を用いて説明する。
 次に、遺伝子解析装置100のデータ解析装置111は、泳動データを用いた蛍光強度算出処理を実行する(ステップS102)。具体的には、蛍光強度算出部133が、泳動データから蛍光色素の蛍光強度の時系列データを算出し、蛍光強度の時系列データからピークの中心位置、高さ、及び幅等を検出する。
 次に、遺伝子解析装置100のデータ解析装置111は、蛍光強度の時系列データに対して移動度補正処理を実行する(ステップS103)。移動度補正処理の詳細は図7から図10を用いて説明する。実施例1の遺伝子解析装置100は、後述するように、移動度補正処理に特徴がある。
 次に、遺伝子解析装置100のデータ解析装置111は、移動度補正処理の結果に基づいて補正された蛍光強度の時系列データを用いてベースコールを実行する(ステップS104)。具体的には、ベースコール部135が、補正された蛍光強度の時系列データを用いてサンプルの塩基配列を特定する。
 図6は、実施例1の電気泳動装置110が実行する電気泳動処理を説明するフローチャートである。
 ユーザは、電気泳動装置110に解析対象のサンプル及び試薬等をセットし、接続インタフェース122を介して電気泳動処理の開始を指示する。サンプルのセットは以下のような手順で行われる。
 ユーザは、バッファ容器221及び陽極バッファ容器210に、通電路の一部を形成する緩衝液を満たす。緩衝液は、例えば、各社から電気泳動用として市販されている電解質液である。ユーザは、サンプルプレート224のウェル内に、解析対象のサンプルを分注する。サンプルは、例えば、DNAのPCR産物である。ユーザは、洗浄容器222に、キャピラリ陰極端227を洗浄するための洗浄溶液を分注する。洗浄溶液は、例えば、純水である。ユーザは、シリンジ206内に、サンプルを電気泳動するための泳動媒体を注入する。泳動媒体は、例えば各社から電気泳動用として市販されているポリアクリルアミド系分離ゲルやポリマ等である。ユーザは、キャピラリ202の劣化が予想される場合又はキャピラリ202の長さを変更する場合、キャピラリアレイ217を交換する。
 このときに、サンプルプレート224にセットされるサンプルとしては、解析対象のDNAの実サンプルのほかに、ポジティブコントロール、ネガティブコントロール、アレリックラダー等があり、それぞれ異なるキャピラリ202において電気泳動される。
 ポジティブコントロールは、例えば、既知のDNAを含むPCR産物であり、PCRによってDNAが正しく増幅されていることを確認するための対照実験用のサンプルである。ネガティブコントロールとは、DNAを含まないPCR産物であり、PCRの増幅物にユーザのDNA及び塵等のコンタミネーションが生じていないことを確認するための対照実験用のサンプルである。アレリックラダーとは、DNAマーカに一般的に含まれる可能性のある塩基を多く含む人工的なサンプルであり、通常、DNA鑑定用の試薬キットとして試薬メーカから提供される。アレリックラダーは、個々のDNAマーカのDNA断片長とアレルとの対応関係を微調整する目的で使用される。
 また、実サンプル、ポジティブコントロール、ネガティブコントロール、及びアレリックラダーの全てに対して、サイズスタンダードと呼ばれる、特定の蛍光色素で標識された既知のDNA断片が混ぜられる。使用する試薬キットによってサイズスタンダードに割り当てられる蛍光色素の種類は異なる。
 ユーザは、アレリックラダーの種類及びサイズスタンダードの種類、蛍光試薬の種類、それぞれのキャピラリ202に対応するサンプルプレート224上のウェルにセットされたサンプルの種類等を指定する。実施例1では、実サンプル、ポジティブコントロール、ネガティブコントロール、及びアレリックラダーのいずれかの種類が指定される。これらの情報の設定は、データ解析装置111の接続インタフェース122を介し、サンプル情報設定部131に入力される。
 以上が、サンプルのセットの説明である。
 電気泳動装置制御部132は、解析の開始を指示する信号を電気泳動装置110に送信する。電気泳動装置110は、当該信号を受信すると、以下で説明する電気泳動処理を開始する。
 電気泳動装置110は、まず、キャピラリ202内に新しい泳動媒体を充填し、泳動路を形成する(ステップS201)。泳動媒体の充填は、解析開始後に自動的に実行されてもよいし、逐次、電気泳動装置制御部132から送信される制御信号に基づいて実行されてもよい。
 具体的には、電気泳動装置110は、搬送機225により廃液容器223をロードヘッダ229の直下に運び、電磁弁213を閉じ、キャピラリ陰極端227から排出される使用済の泳動媒体を受け止められるようにする。そして、電気泳動装置110は、シリンジ206を駆動して、キャピラリ202に新しい泳動媒体を充填し、使用済の泳動媒体を廃棄する。最後に、電気泳動装置110は、洗浄容器222内の洗浄溶液にキャピラリ陰極端227を浸し、泳動媒体により汚れたキャピラリ陰極端227を洗浄する。
 次に、電気泳動装置110は、泳動媒体に所定の電圧を印加し、泳動媒体を電気泳動に適した状態にするための予備泳動を実行する(ステップS202)。予備泳動は、自動的に行われてもよいし、逐次、電気泳動装置制御部132から送信される制御信号に基づいて行われてもよい。
 具体的には、電気泳動装置110は、搬送機225により、バッファ容器221内の緩衝液にキャピラリ陰極端227を浸し、通電路を形成する。そして、電気泳動装置110は、高圧電源204により、泳動媒体に数から数十キロボルト程度の電圧を数から数十分間印加し、泳動媒体を電気泳動に適した状態とする。最後に、電気泳動装置110は、洗浄容器222内の洗浄溶液にキャピラリ陰極端227を浸し、緩衝液により汚れたキャピラリ陰極端227を洗浄する。
 次に、電気泳動装置110は、サンプルを導入する(ステップS203)。サンプルの導入は、自動的に行われてもよいし、逐次、電気泳動装置制御部132から送信される制御信号に基づいて行われてもよい。
 具体的には、電気泳動装置110は、搬送機225により、サンプルプレート224のウェル内に保持されたサンプルにキャピラリ陰極端227を浸し、その後、電磁弁213を開く。これにより、通電路が形成され、泳動路にサンプル成分を導入するできる状態となる。電気泳動装置110は、高圧電源204によりパルス電圧を通電路に印加し、泳動路にサンプル成分を導入する。最後に、電気泳動装置110は、洗浄容器222内の洗浄溶液にキャピラリ陰極端227を浸し、サンプルにより汚れたキャピラリ陰極端227を洗浄する。
 次に、電気泳動装置110は、サンプル中に含まれる各サンプル成分が分離し、解析する泳動解析を実行する(ステップS204)。泳動解析は、自動的に行われてもよいし、逐次、電気泳動装置制御部132から送信される制御信号に基づいて行われてもよい。
 具体的には、電気泳動装置110は、搬送機225により、バッファ容器221内の緩衝液にキャピラリ陰極端227を浸し、通電路を形成する。電気泳動装置110は、高圧電源204により、通電路に15kV前後の高電圧を印加し、泳動路に電界を発生させる。発生した電界によって、泳動路内の各サンプル成分は、各サンプル成分の性質に依存した速度で検出部216に移動する。つまり、サンプル成分は、その移動速度の差により分離される。そして、検出部216に到達したサンプル成分から順番に検出される。例えば、サンプルが、塩基長の異なるDNAを多数含む場合は、その塩基長により移動速度に差が生じ、塩基長の短いDNAから順に検出部216に到達する。各DNAには、その末端塩基配列に依存した蛍光色素が取り付けられている。検出部216に光源214から励起光が照射されることによって、サンプルに依存した波長を有する蛍光が生じ、外部に放出される。電気泳動装置110は、蛍光を光学検出器215により検出する。泳動解析中は、光学検出器215では、一定の時間間隔でこの蛍光を検出し、画像データをデータ解析装置111へ送信する。なお、送信する情報量を減らすため、画像データではなく、画像データ中の一部の領域のみの輝度を送信してもよい。例えば、キャピラリ202毎に、一定間隔の波長位置のみサンプリングされた輝度値を送信してもよい。この、電気泳動装置110より送信されるデータは、各キャピラリ202の輝度値の時系列データであり、記憶デバイス121に格納される。
 電気泳動装置110は、予定していた画像データを取得した場合、電圧の印加を停止し、泳動分析を終了する。以上が、電気泳動処理の説明である。
 図7は、実施例1のデータ解析装置111が実行する移動度補正処理を説明するフローチャートである。図8は、実施例1のスケールの算出方法のイメージを示す図である。図9は、実施例1の移動度補正量データのスケーリングのイメージを示す図である。図10A及び図10Bは、実施例1の自動移動度補正量データの修正方法の一例を示す図である。
 移動度補正部134は、電気泳動装置110の観測環境情報に基づいて、スケールを算出する(ステップS301)。ここで、観測環境における電圧に着目してスケールの算出方法を説明する。
 (S301-1)移動度補正部134は、泳動特性情報を参照し、観測環境情報に含まれる電圧(ターゲット電圧)に対応する泳動特性データを検索する。ターゲット電圧に対応する泳動特性データが存在する場合、ターゲット電圧に対応するデフォルト移動度補正量データが存在するため、移動度補正部134は、ステップS301の処理を終了する。この場合、スケールの算出は行われない。
 (S301-2)ターゲット電圧に対応する泳動特性データが存在しない場合、移動度補正部134は、ターゲット電圧との差異が小さい電圧の泳動特性データを用いて、ターゲット電圧の泳動特性データ(ターゲット泳動特性データ)を生成する。このように、実際の観測環境に類似する観測環境の泳動特性データを用いて、実際の観測環境の泳動特性データが推定される。ここで、観察環境の類似とは、観察環境を表す物理量の組み合わせが類似することを表す。
 例えば、ターゲット電圧が9.0kVである場合、図8に示すように、8.0kVの泳動特性データY(p)と11.0kVの泳動特性データY11(p)とを用いて、ターゲット泳動特性データが生成される。線形補間を用いた場合、例えば、式(1)によりターゲット電圧の泳動特性データを生成できる。
Figure JPOXMLDOC01-appb-M000001
 (S301-3)移動度補正部134は、時間tにおける、ターゲット泳動特性データを生成するために使用した泳動特性データと、ターゲット泳動特性データとの間のスケールを算出する。
 例えば、ターゲット電圧が9.0kVである場合、時間tにおける8.0kVの泳動特性データY(p)に対するスケールS(t)は式(2)で与えられ、時間tにおける11.0kVの泳動特性データY11(p)に対するスケールS11(t)は式(3)で与えられる。
Figure JPOXMLDOC01-appb-M000002
Figure JPOXMLDOC01-appb-M000003
 以上がスケールの算出方法の説明である。
 次に、移動度補正部134は、デフォルト移動度補正量データを生成する(ステップS302)。ここで、観測環境における電圧に着目してデフォルト移動度補正量データの算出方法を説明する。
 (S302-1)移動度補正部134は、各塩基の移動度補正量情報を参照し、観測環境情報に含まれる電圧(ターゲット電圧)に対応するデフォルト移動度補正量データを検索する。ターゲット電圧に対応するデフォルト移動度補正量データが存在する場合、移動度補正部134は、ステップS302の処理を終了する。この場合、検索されたデフォルト移動度補正量データがそのまま使用される。
 (S302-2)ターゲット電圧に対応するデフォルト移動度補正量データが存在しない場合、移動度補正部134は、ステップS301において、ターゲット泳動特性データを生成するために使用した泳動特性データの電圧を特定する。移動度補正部134は、各塩基の移動度補正量情報を参照し、特定された電圧に対応するデフォルト移動度補正量データを取得する。
 (S302-3)移動度補正部134は、図9に示すように、デフォルト移動度補正量データの各点に、特定された電圧に対応するスケールを乗算することによって、ターゲット電圧のデフォルト移動度補正量データを算出する。
 例えば、ターゲット電圧が9.0kVである場合、移動度補正部134は、8.0kVのデフォルト移動度補正量データにスケールS(t)を乗算して、第1デフォルト移動度補正量データを算出し、11.0kVのデフォルト移動度補正量データにスケールS11(t)を乗算して、第2デフォルト移動度補正量データを算出する。さらに、移動度補正部134は、第1デフォルト移動度補正量データ及び第2デフォルト移動度補正量データの平均を、9.0kVのデフォルト移動度補正量データとして算出する。
 このように、実施例1の各観測環境のデフォルト移動度補正量データは、スケール関係が存在する。
 以上がデフォルト移動度補正量データの算出方法の説明である。
 次に、移動度補正部134は、蛍光強度の時系列データについて移動度補正量の最適化を実行する(ステップS303)。
 移動度補正量の最適化は、公知の移動度補正量の最適化アルゴリズムを用いればよいため、詳細な説明は省略するが、例えば、以下のような最適化アルゴリズムが考えられる。
 移動度補正部134は、所定の時間サイズのブロックを設定し、蛍光強度の時系列データに対してブロックを時間方向に移動させながら、ブロック内の各塩基の波形の重なりが最小となるように各塩基の移動度補正量を探索する。探索処理の結果をプロットし、さらに、プロットした点の間のなめらかに補間することによって移動度補正量データ(自動移動度補正量データ)が得られる。
 なお、デフォルト移動度補正量データを最適化の初期値として用いてもよい。
 次に、移動度補正部134は、自動移動度補正量データと、デフォルト移動度補正量データとに基づいて、移動度補正量データを決定する(ステップS304)。例えば、以下のような処理が考えられる。
 (処理1)自動移動度補正量データがデフォルト移動度補正量データとの差異が大きい場合、移動度補正部134は、デフォルト移動度補正量データを採用し、当該差異が小さい場合、移動度補正部134は、自動移動度補正量データを採用する。前述の差異は、自動移動度補正量データ及びデフォルト移動度補正量データの差分の最大値、自動移動度補正量データ及びデフォルト移動度補正量データの各点の差分の合計値等に基づいて、評価できる。なお、自動移動度補正量データがデフォルト移動度補正量データとの差異が小さい部分については、自動移動度補正量データを採用し、自動移動度補正量データがデフォルト移動度補正量データとの差異が大きい部分については、デフォルト移動度補正量データを採用してもよい。
 (処理2)移動度補正部134は、図10Aに示すように、自動移動度補正量データ(実線のグラフ)について、デフォルト移動度補正量データ(点線のグラフ)との差異が大きく、かつ、変動率が大きい箇所(点線の矩形領域)を特定する。移動度補正部134は、図10Bに示すように、特定された箇所を、デフォルト移動度補正量データとの差異が小さく、かつ、変動率が小さくなるように補正する。
 自動移動度補正処理では重なりが小さくなるように移動度補正量が算出されるため、混合塩基配列が長い場合に適切な移動度補正が算出されない場合がある。このような場合、デフォルト移動度補正量データとの差が大きくなりやすい。
 実施例1の移動度補正部134は、デフォルト移動度補正量データを補正の制約として用いて自動補正を行う。これによって、長い混合塩基配列を含むサンプル、又は、大きいノイズが含まれる泳動データであっても精度よく移動度を補正することができる。
 実際に使用する移動度補正量データは、デフォルト移動度補正量データに基づいて調整されるため、一部又は全部がデフォルト移動度補正量データと類似した特性を有する。
 実施例1では、任意の観測環境のデフォルト移動度補正量データは、異なる観測環境のデフォルト移動度補正量データをスケーリングすることによって生成される。これによって、様々な観測環境に対応できる。
 実施例2では、データ解析装置111が観測環境ごとの泳動特性データ及びデフォルト移動度補正量データを生成する。以下、実施例1との差異を中心に実施例2について説明する。
 図11は、実施例2の遺伝子解析装置100の構成例を示す図である。
 実施例2の電気泳動装置110の構成は実施例1と同一である。実施例2のデータ解析装置111のハードウェア構成は実施例1と同一である。
 実施例2のデータ解析装置111はソフトウェア構成が一部異なる。具体的には、実施例2のデータ解析装置111は、泳動特性データ生成部136を有する点が実施例1と異なる。泳動特性データ生成部136は泳動特性データ及びデフォルト移動度補正量データを生成する。
 実施例2の遺伝子解析装置100が実行する処理は実施例1と同一である。実施例2の電気泳動装置110が実行する電気泳動処理は実施例1と同一である。実施例2のデータが実行する移動度補正処理は実施例1と同一である。
 なお、記憶デバイス121には、任意の観測環境における任意のサンプルの参照用の泳動特性データ、移動度補正量データ、及び塩基配列が格納されるものとする。サンプルは、ベースコールが容易な単一塩基配列のサンプルが望ましい。
 図12は、実施例2の遺伝子解析装置100が実行するデータ生成処理を説明するフローチャートである。
 遺伝子解析装置100は、ユーザからの指示を受け付けた場合、データ生成処理を実行する。
 遺伝子解析装置100は、移動度補正量データ生成処理を実行する(ステップS401)。移動度補正量データ生成処理では、複数の観測環境について、移動度補正量データが生成され、また、塩基配列のベースコールが行われる。処理の詳細は図12を用いて説明する。
 次に、遺伝子解析装置100は、参照塩基配列と、任意の観測環境の塩基配列との間のマッピングを行う(ステップS402)。
 具体的には、データ解析装置111の泳動特性データ生成部136が、上記マッピングにより、各観測環境の塩基配列の塩基Gの塩基位置を算出する。
 次に、遺伝子解析装置100は、泳動特性データ生成処理を実行する(ステップS403)。具体的には、以下のような処理が実行される。
 (S403-1)データ解析装置111の泳動特性データ生成部136が、ある観測環境の塩基配列に基づいて、塩基位置及び泳動時間を軸とする空間に点をプロットする。
 (S403-2)泳動特性データ生成部136は、必要に応じて、S403-1においてプロットされた点の間を補間してもよい。
 (S403-3)泳動特性データ生成部136は、プロットされた点から近似式を求める。泳動特性データ生成部136は、観測環境と対応づけて、近似式のパラメータ等を泳動特性データとして記憶デバイス121に格納する。
 以上がステップS403の処理の説明である。
 図13は、実施例2の遺伝子解析装置100が実行する移動度補正量データ生成処理を説明するフローチャートである。
 遺伝子解析装置100の電気泳動装置110は、複数の観測環境について、サンプルの電気泳動処理を実行する(ステップS501)。実施例2の電気泳動処理は実施例1と同一である。
 なお、観測環境は、ユーザによって指定されているものとする。なお、一つの観測環境について、電気泳動処理を複数回実行することによって、複数の泳動データが取得されるものとする。
 次に、遺伝子解析装置100のデータ解析装置111は、観測環境のループ処理を開始する(ステップS502)。具体的には、データ解析装置111は、一つの観測環境を選択する。
 次に、遺伝子解析装置100のデータ解析装置111は、複数の泳動データについて蛍光強度算出処理を実行する(ステップS503)。実施例2の蛍光強度算出処理は実施例1と同一である。
 次に、遺伝子解析装置100のデータ解析装置111は、各蛍光強度の時系列データについて、移動度補正量の最適化を実行する(ステップS504)。実施例2の移動度補正量の最適化は公知の技術を用いる。
 次に、遺伝子解析装置100のデータ解析装置111は、補正された蛍光強度の時系列データを用いてベースコールを実行する(ステップS505)。
 次に、遺伝子解析装置100のデータ解析装置111は、観測環境の移動度補正量データを生成する(ステップS506)。
 具体的には、泳動特性データ生成部136が、ステップS504において算出された複数の移動度補正量データの平均を算出する。泳動特性データ生成部136は、観測環境と対応づけて、算出された移動度補正量データを記憶デバイス121に保存する。なお、塩基配列のベースコールが誤りと判定された移動度補正量データは除外される。
 次に、遺伝子解析装置100のデータ解析装置11は、すべての観測環境について処理が完了したか否かを判定する(ステップS507)。
 すべての観測環境について処理が完了していない場合、遺伝子解析装置100のデータ解析装置111は、ステップS502に戻り、同様の処理を実行する。すべての観測環境について処理が完了した場合、遺伝子解析装置100は、移動度補正量データ生成処理を終了する。
 実施例2によれば、複数の観測環境の泳動特性データを用意することによって、スケールの算出及び移動度補正量データの算出のコストを削減できる。
 実施例3では、データ解析装置111が、実際の解析において算出された泳動特性データ及び移動度補正量を追加する。以下、実施例1との差異を中心に実施例3について説明する。
 実施例3の遺伝子解析装置100の構成は実施例1と同一である。実施例3の電気泳動装置110及びデータ解析装置111の構成は実施例1と同一である。
 実施例3では、遺伝子解析装置100が実行する処理が一部異なる。具体的には、データ解析装置111が、ベースコール(ステップS104)を行った後、ユーザの指示に基づいて、一連の処理で算出された泳動特性データ及び移動度補正量データを、観測環境に対応づけて記憶デバイス121に保存する。
 図14は、実施例3の記憶デバイス121に格納される泳動特性データ及び移動度補正量データのイメージを示す図である。
 図14は、温度及び電圧から構成される観測環境を表す空間上のデータの分布を示す。初期の記憶デバイス121には、黒マルに対応する観測環境の永続特性データ及び移動度補正量データが格納される。ユーザの指示によって、斜線のマルの観測環境の永続特性データ及び移動度補正量データが追加されたことが分かる。
 実施例3の電気泳動処理及び移動度補正処理は実施例1と同様である。また、実施例3の遺伝子解析装置100はデータ生成処理を実行してもよい。
 実施例3によれば、遺伝子解析装置100の経年変化及び実際に使用する環境に合わせて、泳動特性データ及び移動度補正量データを追加することによって、ベースコールの精度及びコストを削減することができる。
 なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。
 また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD-ROM、DVD-ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD-R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
 また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Python、Java等の広範囲のプログラム又はスクリプト言語で実装できる。
 さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD-RW、CD-R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
 上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。

Claims (15)

  1.  サンプルを電気泳動することによって取得される複数の塩基の信号強度の時系列データを用いて前記サンプルの塩基配列を解析する遺伝子解析装置が実行する塩基配列の解析方法であって、
     前記遺伝子解析装置は、観測環境と、前記複数の塩基の信号強度の時系列データの時間方向の位置を補正するための移動度補正量データとを対応づけて管理し、
     前記塩基配列の解析方法は、
     前記遺伝子解析装置が、第1観測環境下において前記サンプルを電気泳動することによって取得された複数の塩基の信号強度の時系列データを受け付けた場合、前記第1観測環境と異なる前記観測環境に対応する前記移動度補正量データをスケーリングすることによって、デフォルト移動度補正量データを生成する第1のステップと、
     前記遺伝子解析装置が、移動度補正量の最適化アルゴリズムと、前記デフォルト移動度補正量データとを用いて、前記複数の塩基の信号強度の時系列データの時間方向の位置を補正する第2のステップと、
     補正された前記複数の塩基の信号強度の時系列データを用いて前記サンプルの塩基配列を特定する第3のステップと、を含むことを特徴とする塩基配列の解析方法。
  2.  請求項1に記載の塩基配列の解析方法であって、
     前記遺伝子解析装置は、観測環境と、電気泳動による前記塩基の位置と泳動時間との関係を表す泳動特性データとを対応づけて管理し、
     前記第1のステップは、
     前記遺伝子解析装置が、前記第1観測環境に対応する前記泳動特性データと、前記第1観測環境とは異なる前記観測環境に対応する前記泳動特性データとを用いて、スケールを算出するステップと、
     前記遺伝子解析装置が、前記スケールに基づいて、前記第1観測環境とは異なる前記観測環境に対応する前記移動度補正量データをスケーリングするステップと、を含むことを特徴とする塩基配列の解析方法。
  3.  請求項1に記載の塩基配列の解析方法であって、
     前記第2のステップは、
     前記遺伝子解析装置が、前記移動度補正量の最適化アルゴリズムに基づいて、自動移動度補正量データを生成する第4のステップと、
     前記遺伝子解析装置が、前記自動移動度補正量データと前記デフォルト移動度補正量データとの差異に基づいて、前記自動移動度補正量データを補正する第5のステップと、を含むことを特徴とする塩基配列の解析方法。
  4.  請求項3に記載の塩基配列の解析方法であって、
     前記第5のステップは、前記自動移動度補正量データと前記デフォルト移動度補正量データとの全体の差異が大きい場合、前記遺伝子解析装置が、前記自動移動度補正量データを前記デフォルト移動度補正量データに置き換えるステップを含むことを特徴とする塩基配列の解析方法。
  5.  請求項3に記載の塩基配列の解析方法であって、
     前記第5のステップは、
     前記遺伝子解析装置が、前記自動移動度補正量データと前記デフォルト移動度補正量データとの差異が大きい部分を特定するステップと、
     前記遺伝子解析装置が、前記特定された部分を前記デフォルト移動度補正量データに置き換えるステップを含むことを特徴とする塩基配列の解析方法。
  6.  請求項3に記載の塩基配列の解析方法であって、
     前記第5のステップは、
     前記遺伝子解析装置が、前記自動移動度補正量データと前記デフォルト移動度補正量データとの差異が大きく、かつ、変動率が大きい部分を特定するステップと、
     前記遺伝子解析装置が、前記特定された部分を、前記デフォルト移動度補正量データとの差異が小さくなるように補正するステップと、を含むことを特徴とする塩基配列の解析方法。
  7.  請求項1に記載の塩基配列の解析方法であって、
     前記第3のステップは、前記遺伝子解析装置が、前記第1観測環境と、使用した前記移動度補正量データとを対応づけて保存するステップを含むことを特徴とする塩基配列の解析方法。
  8.  請求項2に記載の塩基配列の解析方法であって、
     前記遺伝子解析装置が、第2観測環境下において前記サンプルを電気泳動することによって取得された複数の塩基の信号強度の時系列データの移動度補正量データと、補正された前記複数の塩基の信号強度の時系列データを用いて特定された前記サンプルの前記塩基配列と、を用いて、前記第2観測環境における前記複数の塩基の前記泳動特性データを生成するステップと、
     前記第2観測環境と、前記生成された泳動特性データとを対応づけて保存するステップと、を含むことを特徴とする塩基配列の解析方法。
  9.  サンプルを電気泳動することによって取得される複数の塩基の信号強度の時系列データを用いて前記サンプルの塩基配列を解析する遺伝子解析装置であって、
     観測環境と、前記複数の塩基の信号強度の時系列データの時間方向の位置を補正するための移動度補正量データとを対応づけて管理し、
     第1観測環境下において前記サンプルを電気泳動することによって取得された複数の塩基の信号強度の時系列データを受け付けた場合、前記第1観測環境と異なる前記観測環境に対応する前記移動度補正量データをスケーリングすることによって、デフォルト移動度補正量データを生成する第1の処理と、
     移動度補正量の最適化アルゴリズムと、前記デフォルト移動度補正量データとを用いて、前記複数の塩基の信号強度の時系列データの時間方向の位置を補正する第2の処理と、
     補正された前記複数の塩基の信号強度の時系列データを用いて前記サンプルの塩基配列を特定する第3の処理と、を実行することを特徴とする遺伝子解析装置。
  10.  請求項9に記載の遺伝子解析装置であって、
     観測環境と、電気泳動による前記塩基の位置と泳動時間との関係を表す泳動特性データとを対応づけて管理し、
     前記第1の処理では、
     前記第1観測環境に対応する前記泳動特性データと、前記第1観測環境とは異なる前記観測環境に対応する前記泳動特性データとを用いて、スケールを算出し、
     前記スケールに基づいて、前記第1観測環境とは異なる前記観測環境に対応する前記移動度補正量データをスケーリングすることを特徴とする遺伝子解析装置。
  11.  請求項9に記載の遺伝子解析装置であって、
     前記第2の処理では、
     前記移動度補正量の最適化アルゴリズムに基づいて、自動移動度補正量データを生成する第4の処理と、
     前記自動移動度補正量データと前記デフォルト移動度補正量データとの差異に基づいて、前記自動移動度補正量データを補正する第5の処理と、を実行することを特徴とする遺伝子解析装置。
  12.  請求項11に記載の遺伝子解析装置であって、
     前記第5の処理では、前記自動移動度補正量データと前記デフォルト移動度補正量データとの全体の差異が大きい場合、前記自動移動度補正量データを前記デフォルト移動度補正量データに置き換えることを特徴とする遺伝子解析装置。
  13.  請求項11に記載の遺伝子解析装置であって、
     前記第5の処理では、
     前記自動移動度補正量データと前記デフォルト移動度補正量データとの差異が大きい部分を特定し、
     前記特定された部分を前記デフォルト移動度補正量データに置き換えることを特徴とする遺伝子解析装置。
  14.  請求項11に記載の遺伝子解析装置であって、
     前記第5の処理では、
     前記自動移動度補正量データと前記デフォルト移動度補正量データとの差異が大きく、かつ、変動率が大きい部分を特定し、
     前記特定された部分を、前記デフォルト移動度補正量データとの差異が小さくなるように補正することを特徴とする遺伝子解析装置。
  15.  サンプルの塩基配列を解析する遺伝子解析装置が実行する塩基配列の解析方法であって、
     前記遺伝子解析装置が、第1観測環境下において前記サンプルを電気泳動することによって取得された複数の塩基の信号強度の時系列データを受け付けた場合、前記第1観測環境のデフォルト移動度補正量データを算出するステップと、
     前記遺伝子解析装置が、前記デフォルト移動度補正量データを用いて、前記複数の塩基の信号強度の時系列データの時間方向の位置を補正するステップと、
     前記遺伝子解析装置が、補正された前記複数の塩基の信号強度の時系列データを用いて前記サンプルの塩基配列を特定するステップと、を含み、
     異なる観測環境の前記デフォルト移動度補正量データは、任意のスケールによって対応付けが可能なデータであり、
     前記補正に用いた移動度補正量データは、少なくとも一部が、前記デフォルト移動度補正量データと類似する補正量の変化特性を有することを特徴とする塩基配列の解析方法。
PCT/JP2021/018618 2021-05-17 2021-05-17 塩基配列の解析方法及び遺伝子解析装置 WO2022244058A1 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
DE112021007137.8T DE112021007137T5 (de) 2021-05-17 2021-05-17 Verfahren zum analysieren einer basensequenz und genanalysator
PCT/JP2021/018618 WO2022244058A1 (ja) 2021-05-17 2021-05-17 塩基配列の解析方法及び遺伝子解析装置
CN202180095722.8A CN117043356A (zh) 2021-05-17 2021-05-17 碱基序列的解析方法以及基因解析装置
JP2023522007A JPWO2022244058A1 (ja) 2021-05-17 2021-05-17
GB2316050.0A GB2620335A (en) 2021-05-17 2021-05-17 Method for analyzing base sequences and gene analyzer
US18/555,972 US20240132951A1 (en) 2021-05-17 2021-05-17 Analysis method of base sequence and gene analyzer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/018618 WO2022244058A1 (ja) 2021-05-17 2021-05-17 塩基配列の解析方法及び遺伝子解析装置

Publications (1)

Publication Number Publication Date
WO2022244058A1 true WO2022244058A1 (ja) 2022-11-24

Family

ID=84141375

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/018618 WO2022244058A1 (ja) 2021-05-17 2021-05-17 塩基配列の解析方法及び遺伝子解析装置

Country Status (6)

Country Link
US (1) US20240132951A1 (ja)
JP (1) JPWO2022244058A1 (ja)
CN (1) CN117043356A (ja)
DE (1) DE112021007137T5 (ja)
GB (1) GB2620335A (ja)
WO (1) WO2022244058A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017130349A1 (ja) * 2016-01-28 2017-08-03 株式会社日立ハイテクノロジーズ 塩基配列決定装置、キャピラリアレイ電気泳動装置及び方法
US20170235874A1 (en) * 2014-08-15 2017-08-17 Life Technologies Corporation Methods and systems for detecting minor variants in a sample of genetic material
WO2020179405A1 (ja) * 2019-03-05 2020-09-10 株式会社日立ハイテク 遺伝子型解析装置及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170235874A1 (en) * 2014-08-15 2017-08-17 Life Technologies Corporation Methods and systems for detecting minor variants in a sample of genetic material
WO2017130349A1 (ja) * 2016-01-28 2017-08-03 株式会社日立ハイテクノロジーズ 塩基配列決定装置、キャピラリアレイ電気泳動装置及び方法
WO2020179405A1 (ja) * 2019-03-05 2020-09-10 株式会社日立ハイテク 遺伝子型解析装置及び方法

Also Published As

Publication number Publication date
CN117043356A (zh) 2023-11-10
GB202316050D0 (en) 2023-12-06
JPWO2022244058A1 (ja) 2022-11-24
DE112021007137T5 (de) 2023-12-21
US20240132951A1 (en) 2024-04-25
GB2620335A (en) 2024-01-03

Similar Documents

Publication Publication Date Title
EP2937685B1 (en) Method for genotypic analysis
JP4991252B2 (ja) 電気泳動装置、及び電気泳動分析方法
US20200003728A1 (en) Automated quality control and spectral error correction for sample analysis instruments
EP2669669B1 (en) Capillary unit for electrophoresis apparatus
CN105143469B (zh) 核酸分析装置及使用其的核酸分析方法
US20240085329A1 (en) Analysis system and analysis method
CA2469197A1 (en) Multi-capillary electrophoresis apparatus
WO2022244058A1 (ja) 塩基配列の解析方法及び遺伝子解析装置
JP7340095B2 (ja) 電気泳動システム
WO2023195077A1 (ja) 塩基配列の解析方法及び遺伝子解析装置
CN112513618B (zh) 生物聚合物分析方法及生物聚合物分析装置
CN113439117B (zh) 基因型解析装置及方法
CN114391098B (zh) 生物体试料分析装置、生物体试料分析方法
WO2024214217A1 (ja) 遺伝子解析装置及び遺伝子解析方法
JP6514369B2 (ja) 塩基配列決定装置、キャピラリアレイ電気泳動装置及び方法
JP2000258392A (ja) 電気泳動装置
CN115380208A (zh) 电泳装置以及分析方法
WO2023139711A1 (ja) 電気泳動システム
WO2023223547A1 (ja) 電気泳動データ処理装置及び電気泳動データ処理方法
WO2024111038A1 (ja) 変異遺伝子検出方法
JP7261877B2 (ja) マルチキャピラリ電気泳動装置、及びサンプル分析方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21940678

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 202180095722.8

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2023522007

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 18555972

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 112021007137

Country of ref document: DE

ENP Entry into the national phase

Ref document number: 202316050

Country of ref document: GB

Kind code of ref document: A

Free format text: PCT FILING DATE = 20210517

122 Ep: pct application non-entry in european phase

Ref document number: 21940678

Country of ref document: EP

Kind code of ref document: A1