WO2019208225A1 - 配列決定方法および配列決定装置 - Google Patents

配列決定方法および配列決定装置 Download PDF

Info

Publication number
WO2019208225A1
WO2019208225A1 PCT/JP2019/015664 JP2019015664W WO2019208225A1 WO 2019208225 A1 WO2019208225 A1 WO 2019208225A1 JP 2019015664 W JP2019015664 W JP 2019015664W WO 2019208225 A1 WO2019208225 A1 WO 2019208225A1
Authority
WO
WIPO (PCT)
Prior art keywords
current value
value
signal
region
maximum
Prior art date
Application number
PCT/JP2019/015664
Other languages
English (en)
French (fr)
Inventor
正輝 谷口
敬人 大城
真田 雅和
聡 宮城
Original Assignee
株式会社Screenホールディングス
国立大学法人大阪大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Screenホールディングス, 国立大学法人大阪大学 filed Critical 株式会社Screenホールディングス
Publication of WO2019208225A1 publication Critical patent/WO2019208225A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M1/00Apparatus for enzymology or microbiology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Definitions

  • the present invention relates to a sequencing method and a sequencing apparatus for measuring a tunnel current flowing between a pair of electrodes and determining an arrangement of monomers constituting a biopolymer from current value data including a signal current of the biopolymer. About.
  • Patent Document 1 discloses a method for identifying a specific molecule using a fine electrode.
  • the measured tunnel current includes a pseudo signal due to noise or the like. For this reason, the pseudo signal may be mistaken as a part of the biopolymer signal.
  • the base current value which is the current value at the time when the biopolymer does not pass through, fluctuates, the current value corresponding to each monomer also fluctuates, which may hinder accurate analysis.
  • the present invention has been made in view of such circumstances, and a technique capable of more accurately identifying a monomer from current value data obtained by measuring a tunnel current flowing between a pair of electrodes.
  • the purpose is to provide.
  • a first invention of the present application is a sequencing method for determining the sequence of a plurality of monomers constituting a biopolymer by measuring a tunnel current flowing between a pair of electrodes.
  • the second invention of the present application is the sequencing method according to the first invention, wherein the step b) includes the step of b1) identifying a current value exceeding a predetermined signal reference value as the signal in the current value data; b2) detecting a region where the signal certified in the step b1) satisfies a dense region qualification condition and certifying the region as a dense region.
  • the third invention of the present application is the sequencing method according to the second invention, and in the step b2), the dense region recognition condition includes that an interval between the signals is less than a predetermined value.
  • 4th invention of this application is the sequencing method of 2nd invention or 3rd invention, Comprising: In the said process b2), the said congestion area
  • the fifth invention of the present application is the sequencing method according to any one of the second to fourth inventions, wherein the signal reference value is calculated based on a standard deviation for each section of the current value data.
  • the sixth invention of the present application is the sequencing method according to the first to fifth inventions, wherein the biopolymer is a polynucleotide, and the monomer corresponding to the maximum representative value is GMP or dGMP.
  • a sequence determination apparatus determines the arrangement
  • a sequence determination apparatus wherein p) a step of selecting an analysis region including a signal dense region from the current value data, and q) a minimum representative value having a smallest current value among a plurality of representative values in the analysis region. Determining the largest maximum representative value among a plurality of representative values; and r) determining the type of monomer corresponding to the signal based on the minimum representative value and the maximum representative value And execute.
  • the minimum representative value corresponding to the base current value and the maximum representative value corresponding to the monomer signal having the largest tunnel current value Based on the above, the signal of each monomer is discriminated. As a result, even when the base current value fluctuates, a reference for determining each monomer can be provided in a short time interval that is not easily affected by fluctuations in the base current value. Can be identified more accurately. That is, the monomer can be more accurately identified from the obtained current value data.
  • the second invention of the present application it is possible to more accurately recognize the period during which the biopolymer passed between the nanoelectrodes from the current value data. Therefore, the monomer can be more accurately identified from the obtained current value data.
  • noise can be eliminated more accurately. Therefore, the period during which the biopolymer passes between the nanoelectrodes 34 can be recognized more accurately. As a result, the monomer can be more accurately identified from the obtained current value data.
  • the thickness direction of the electrode substrate is defined as the vertical direction
  • the metal layer side is the upper side with respect to the substrate layer
  • the substrate layer side is the lower side with respect to the metal layer.
  • the direction of use of the electrode substrate does not necessarily have to be vertically upward on the metal layer side.
  • FIG. 1 is a top view of the electrode substrate 1.
  • 2 to 4 are partial top views of the electrode substrate 1.
  • FIG. 5 and FIG. 6 are schematic views showing the state of the electrode substrate 1 being bent using the current measuring device 9.
  • 7 and 8 are partial cross-sectional views of the electrode substrate 1.
  • the electrode substrate 1 and the current measuring device 9 are used for analyzing the arrangement of the monomers constituting the biopolymer and each monomer.
  • the monomer constituting the biopolymer to be analyzed include amino acids constituting proteins, nucleotides constituting nucleic acids (DNA, RNA), and monosaccharides constituting sugar chains.
  • the biopolymer is passed between the nanoelectrodes 34 with a voltage applied between the nanoelectrodes 34 described later.
  • the monomer which comprises biopolymer is analyzed by detecting and analyzing the tunnel current which flows between the nanoelectrode 34 and biopolymer.
  • the electrode substrate 1 is a substantially rectangular plate-shaped substrate. As shown in FIGS. 1 to 4, 7, and 8, the electrode substrate 1 includes a substrate layer 20 and a metal layer 30.
  • the longitudinal direction of the electrode substrate 1 is referred to as a first direction
  • the short direction of the electrode substrate 1 is referred to as a second direction.
  • the second direction is orthogonal to the first direction. Note that “perpendicular” includes “substantially orthogonal”.
  • the substrate layer 20 of this embodiment is formed of an insulating material.
  • the substrate layer 20 of the present embodiment has a two-layer structure in which a substrate layer formed of polyimide overlaps a substrate layer formed of silicon (Si).
  • substrate layer 20 of this embodiment is a 2 layer structure, this invention is not limited to this.
  • the substrate layer 20 may be composed of only one layer formed of one kind of material, or may be composed of three or more layers.
  • the substrate layer 20 may be formed of a material other than silicon and polyimide as long as it is formed of an insulating material.
  • the substrate layer 20 may be formed of, for example, polyethylene terephthalate resin, ceramic, silicone rubber, or alumina.
  • the metal layer 30 includes two connection electrode portions 31, a wiring portion 32 extending in the first direction between the two connection electrode portions 31, and a central portion of the wiring portion 32.
  • the measurement electrode unit 33 is disposed.
  • the metal layer 30 is formed of a metal such as gold (Au), platinum (Pt), silver (Ag), copper (Cu), tungsten (W) which is a conductor, for example.
  • the metal layer 30 may be configured by stacking a plurality of metal layers. For example, a structure in which a metal layer made of a metal such as gold, platinum, silver, or copper is overlapped on a metal layer formed of chromium (Cr) may be used. Even in this case, it is preferable that the measurement electrode unit 33 is composed of only one metal layer.
  • the thickness of the metal layer 30 is, for example, 50 to 300 nm.
  • the uppermost surfaces of the substrate layer 20 and the metal layer 30 are covered with an insulating film (not shown).
  • an insulating film By covering the surface of the metal layer 30 with an insulating film, when the measurement electrode unit 33 is used in a liquid, the metal constituting the metal layer 30 and the liquid are formed at a location other than the measurement electrode unit 33 in the metal layer 30. It is possible to suppress the exchange of electrons between them.
  • the insulating film is a TEOS oxide film, but may be formed of other materials as long as it is an insulating material. Note that an insulating film is not formed on at least a part of the upper surface of the connection electrode portion 31. For this reason, at least a part of the upper surface of the connection electrode portion 31 is exposed.
  • the two connection electrode portions 31 are arranged apart from each other in the first direction.
  • the width of each of the two wiring portions 32 gradually decreases from the connection electrode portion 31 toward the measurement electrode portion 33.
  • the measurement electrode part 33 having a smaller width in the second direction than the wiring part 32 is disposed.
  • the measurement electrode unit 33 is composed of a pair of nanoelectrodes 34. In a state where no load (external force) is applied to the electrode substrate 1, as shown in FIG. 4, the tip portions of the pair of nanoelectrodes 34 are in contact with each other.
  • the substrate layer 20 has a channel 50 that is recessed downward from the upper surface.
  • the flow channel 50 includes a first flow channel 51, a second flow channel 52, and a measurement flow channel 53.
  • the first flow channel 51 and the second flow channel 52 are arranged to face each other in the second direction with the measurement electrode portion 33 interposed therebetween.
  • the measurement channel 53 connects the first channel 51 and the second channel 52 in the second direction.
  • 1st flow path 51 and 2nd flow path 52 are comprised by the some groove
  • each biopolymer is easily arranged along the direction in which the groove extends. Therefore, it is possible to prevent the biopolymer from being clogged at the boundary portion between the first flow path 51 and the second flow path 52 and the measurement flow path 53 and to reduce the fluidity of the liquid.
  • the biopolymer is arranged in a state of extending along the direction in which the measurement channel 53 extends.
  • Each groove of the first channel 51 and the second channel 52 has a width of about 1 ⁇ m and a depth of about 2 ⁇ m.
  • the measurement channel 53 is a groove extending in the second direction.
  • the measurement channel 53 is arranged at a position overlapping the tip of the nanoelectrode 34 in the vertical direction.
  • the depth of the measurement channel 53 is about 2 ⁇ m, like the first channel 51 and the second channel 52.
  • the measurement channel 53 is narrow in the vicinity of the nanoelectrode 34.
  • each depth of the 1st flow path 51, the 2nd flow path 52, and the measurement flow path 53 may be less than 2 micrometers, and may be larger than 2 micrometers.
  • FIGS. FIG. 5 and FIG. 6 are diagrams showing a state when current measurement is performed in the current measurement device 9.
  • FIG. 5 is a side view showing a state in the initial state of the current measuring device 9 on which the electrode substrate 1 is set.
  • FIG. 6 is a side view showing a state of the current measuring device 9 when the electrode substrate 1 is pushed and bent. In FIG. 6, the deformation of the electrode substrate 1 is exaggerated.
  • the current measuring device 9 includes a mounting table 91, a fixture 92, a push-up tool 93, a lifting mechanism 94, a power source 95, an ammeter 96, and a control unit 90.
  • a mounting table 91 the mounting table 9
  • a fixture 92 the fixture 92
  • a push-up tool 93 the push-up tool 93
  • a lifting mechanism 94 the lifting mechanism 94
  • a power source 95 As conceptually shown in FIG. 6, the current measuring device 9 includes a mounting table 91, a fixture 92, a push-up tool 93, a lifting mechanism 94, a power source 95, an ammeter 96, and a control unit 90.
  • the mounting table 91 has a flat upper surface on which the electrode substrate 1 is mounted.
  • the fixture 92 of the present embodiment is four plate-like members that are disposed substantially perpendicular to the first direction. The fixture 92 fixes the electrode substrate 1 by pressing it from above and below at two locations in the first direction across the measurement electrode portion 33.
  • the pusher 93 for example, a cylindrical member having a hemispherical upper surface is used.
  • the pusher 93 is connected to the lifting mechanism 94.
  • the elevating mechanism 94 includes a motor 941 and a piezo actuator 942.
  • the motor 941 moves the push-up tool 93 largely up and down in millimeters.
  • the piezo actuator 942 moves the pusher 93 up and down small in nanometer units.
  • the elevating mechanism 94 realizes both a large movement and a fine movement by combining the motor 941 and the piezo actuator 942.
  • the lifting mechanism 94 may be a mechanism using other power as long as the lifting height can be controlled.
  • the power source 95 applies a voltage between the pair of connection electrode portions 31.
  • the ammeter 96 measures the current value of the current flowing between the nanoelectrodes 34 of the measurement electrode unit 33.
  • the control unit 90 is electrically connected to the lifting mechanism 94, the power source 95, and the ammeter 96, respectively, and controls each unit.
  • the control unit 90 of the present embodiment is configured by a computer including an arithmetic processing unit such as a CPU, a memory such as a RAM, and a storage unit such as a hard disk drive.
  • the function of the control unit 90 is realized by operating the arithmetic processing unit based on a computer program stored in the storage unit. Thereby, current value data acquisition processing and biopolymer sequence determination processing in the current measuring device 9 described later proceed.
  • the electrode substrate 1 When setting the electrode substrate 1 to the current measuring device 9, first, the electrode substrate 1 is mounted on the mounting table 91. Thereafter, the electrode substrate 1 is fixed by the four fixtures 92 from above and below in a state where no load is applied near the measurement electrode portion 33 of the electrode substrate 1. At this time, the electrode substrate 1 is disposed so that the push-up tool 93 is positioned directly below the measurement electrode unit 33.
  • a predetermined voltage is applied between the connection electrode portions 31 by the power source 95, and measurement of the current value by the ammeter 96 is started. Then, the elevating mechanism 94 is driven to push up the pusher 93 to adjust the distance between the tips of the nanoelectrodes 34 (interelectrode distance).
  • FIG. 7 is a partial cross-sectional view of the electrode substrate 1 at the initial position.
  • FIG. 8 is a partial cross-sectional view of the electrode substrate 1 when pushed up.
  • the tip portions of the nanoelectrodes 34 are in contact with each other when the electrode substrate 1 is not pushed and bent.
  • the push-up tool 93 when the push-up tool 93 is pushed up, the vicinity of the measurement electrode portion 33 of the electrode substrate 1 is pushed up from the lower surface side. Then, the side walls of the substrate layer 20 constituting the measurement flow path 53 move away from each other as indicated by solid arrows in FIG. As a result, the nanoelectrodes 34 move in directions away from each other, as indicated by broken line arrows in FIG. As a result, the distance between the electrodes increases. In this way, the distance between the electrodes is adjusted by pushing up the electrode substrate 1 by the push-up tool 93.
  • FIG. 9 is a flowchart showing the flow of the array determination process based on the current value data.
  • FIG. 10 is a diagram showing an example of the current value I. Note that FIG. 10 exaggerates the characteristics of the time series data of the current value I and is not experimental data.
  • step S101 When determining the sequence of nucleotides constituting a polynucleotide that is a biopolymer, first, current value data is obtained for a liquid sample containing the polynucleotide to be measured (step S101).
  • current value data is acquired using the electrode substrate 1 and the current measuring device 9 of the present embodiment, first, the flow path 50 of the electrode substrate 1 and at least the periphery of the nanoelectrode 34 are filled with the sample. Then, current value data is obtained by measuring the current value I between the nanoelectrodes 34.
  • the current value data of the present embodiment is data obtained by acquiring the current value I every 0.1 msec.
  • control unit 90 that controls each unit of the current measuring device 9 constitutes a sequence determination device that performs the analysis process.
  • the present invention is not limited to this. These analysis steps in the sequencing process may be performed by a sequencing apparatus different from the control unit 90.
  • FIG. 11 is a flowchart showing a specific flow of the analysis region selection step in step S102.
  • step S102 first, a first signal exceeding the first signal reference value K1 is recognized (step S201).
  • the first signal reference value K1 a sufficiently large current value is used so as not to be affected by baseline noise.
  • the current value I when only the sample solvent exists between the nanoelectrodes 34 is referred to as a baseline.
  • the average value Iv is larger than the base current value Ib that is the average current value of the baseline.
  • a portion where the interval between the first signals recognized in step S201 is smaller than a predetermined first threshold value T1 is selected. Specifically, first, a first interval Ta that is an interval between the first signals is calculated.
  • the first threshold T1 is, for example, 0.2 msec.
  • the continuous first signal is treated as one first signal.
  • interval Ta used as less than 1st threshold value T1 is selected (step S202).
  • the first signal group constituted by the plurality of first signals selected in step S202 is surrounded by a broken line.
  • a portion where the interval between the maximum values of the first signals included in the first signal group selected in step S202 is smaller than a predetermined second threshold T2 is selected (step S203).
  • the second threshold T2 is, for example, 0.2 msec.
  • a second interval Tb that is an interval between the maximum values of the first signals included in the first signal group is calculated.
  • the largest value of the continuous first signals having the largest current value is set.
  • the value of the single first signal is the maximum value.
  • interval Tb used as less than 2nd threshold value T2 is selected, and the signal group after selection is recognized.
  • the first signal group selected after the end of step S203 includes All the first signals selected after the end of step S202 are included.
  • a second signal that is current value data continuous with the first signal group after selection and exceeds the second signal reference value K2 is recognized, and a signal crowded region is recognized (step S204).
  • a region obtained by adding a region for a predetermined period before and after the signal dense region to the signal dense region is recognized as an analysis region used for subsequent data analysis (step S205).
  • a region including 5 msec before and after the signal dense region is set as the analysis region.
  • step S102 After selecting the analysis region in step S102, the minimum representative value is determined as shown in FIG. 9 (step S103). Thereafter, the maximum representative value is determined (step S104). Note that the order of step S103 and step S104 may be reversed.
  • FIG. 12 is a diagram showing an example of current value data in the analysis region.
  • FIG. 12 exaggeratedly displays the characteristics of the current value data of a nucleobase sample composed of three types of nucleotides, GMP, AMP, and UMP, such as RNA Let7a, and is not experimental data.
  • the current value I included in the current value data analysis region of FIG. 12 includes a base current value Ib component that is a baseline current value, a current value component corresponding to GMP, and a current value component corresponding to AMP. , Current value components corresponding to UMP. Therefore, four representative values corresponding to these four components are obtained from the current value I. Thus, a plurality of representative values respectively corresponding to the baseline component and the plurality of monomer types are obtained from the current value I. Among these four components, the base current value Ib exists in the minimum current value region, and the current value component corresponding to GMP exists in the maximum current value region. For this reason, first, in step S103, the minimum representative value corresponding to the base current value Ib is determined. The minimum representative value has the smallest current value among the four representative values obtained from the current value I.
  • the minimum representative value In the determination process of the minimum representative value of the present embodiment, a plurality of methods for calculating the minimum representative value are performed, and the one having the smallest current value among the plurality of calculated minimum representative values is set as the final minimum representative value. decide.
  • the minimum representative value may be determined by one type of calculation method, or an average value or median value of a plurality of minimum representative values obtained by a plurality of types of calculation methods may be used as the final minimum representative value. .
  • a histogram for each current value region is created for the current value I in the analysis region, and a plurality of mode values near each peak (see FIG. 12). 4) Select. Among the plurality of mode values, the smallest current value is set as the minimum representative value.
  • a histogram for each current value region is created for the current value I in the analysis region, and the histogram is smoothed. And the thing with the smallest electric current value is made into the minimum representative value among the peak values of a smoothing histogram.
  • a histogram for each current value region is created for the current value I in the analysis region, and the histogram is superimposed on a plurality of normal distributions. Approximate. Then, among the peak values of each normal distribution, the one with the smallest current value is set as the minimum representative value.
  • the minimum representative value for example, among the analysis regions certified in step S205, the region that is not certified as the signal crowded region in step S204 is estimated as the baseline, and the average of the corresponding points is calculated. The value, the mode, etc. are set as the minimum representative value.
  • the maximum representative value corresponding to GMP is determined (step S104).
  • the maximum representative value has the largest current value among the four representative values obtained from the current value I.
  • a plurality of methods for calculating the maximum representative value are performed, and the average value or median value of the calculated maximum representative values is determined as the final maximum representative value.
  • the maximum representative value may be calculated by one type of calculation method.
  • the monomer corresponding to the maximum representative value is GMP.
  • the monomer corresponding to the maximum representative value is dGMP.
  • the type of monomer corresponding to the maximum representative value is determined by the biopolymer to be analyzed.
  • a histogram for each current value region is created for the current value I in the analysis region, and a plurality of mode values near each peak are selected. Of the plurality of mode values, the largest current value is set as the maximum representative value.
  • a histogram for each current value region is created for the current value I in the analysis region, and the histogram is smoothed. Of the peak values of the smoothed histogram, the largest current value is set as the maximum representative value.
  • a histogram for each current value region is created for the current value I in the analysis region, and the histogram is used to superimpose a plurality of normal distributions as in the case of the minimum representative value. Approximate. Of the peak values of each normal distribution, the largest current value is set as the maximum representative value.
  • the maximum representative value is obtained by multiplying the maximum value of the current value I in the signal dense region by a predetermined coefficient smaller than 1.
  • the maximum representative value is obtained by multiplying the maximum value of the current value I in the signal dense region by 0.9.
  • the current region for each monomer is estimated (step S105).
  • the minimum representative value is the base current value Ib and the maximum representative value is the GMP current value Ig
  • the current region for each monomer is the base current value Ib, the GMP current value Ig, and the base current value Ib.
  • GMP current value Ig difference ⁇ Ig Ig ⁇ Ib.
  • the center value of the current region of the baseline is the base current value Ib
  • the center value of the current region of GMP is Ig
  • the width of each current region is set.
  • the current region for each monomer and its center value may be calculated from, for example, the histogram, the smoothed histogram, and the normal distribution approximation shown in FIG.
  • a signal corresponding to a nucleotide is determined based on each set current region (step S106).
  • each signal that becomes the current value I included in each current region is selected.
  • the selected signals only the portions where the signals are continuous for a predetermined period (for example, 1 msec) are selected. Thereby, the signal corresponding to the nucleotide can be discriminated.
  • a predetermined period for example, 1 msec
  • this sequencing method includes a step of acquiring current value data by measuring the current value I between the nanoelectrodes 34 at a predetermined time interval (step S101), and a signal dense region from the current value data.
  • a process of selecting an analysis region step S102
  • a step of determining a minimum representative value and a maximum representative value in the analysis region steps S103 to S104
  • steps S105 to S106 step of determining the type of monomer.
  • the minimum representative value corresponding to the base current value and the maximum representative value corresponding to the monomer signal having the largest tunnel current value are used as a reference. Determine the signal.
  • a reference for determining each monomer can be provided in a short time interval that is not easily affected by fluctuations in the base current value. Can be identified more accurately. That is, the monomer can be more accurately identified from the obtained current value data.
  • the step of selecting an analysis region including a signal crowded region from the current value data is a step of recognizing a current value exceeding a predetermined signal reference value in the current value data as a signal ( Step S201) and a step (Steps S202 to S204) of detecting a region that satisfies the dense region qualification condition around the certified signal and certifying it as a dense region.
  • step S202 it is determined in step S202 whether or not the interval between signals is less than a predetermined value as the dense region recognition condition. Further, as a dense region recognition condition, in step S203, a maximum signal that takes a maximum current value among consecutive signals is detected, and it is determined whether or not the interval between the maximum signals is less than a predetermined value.
  • the metal layer of the electrode substrate has only one pair of connection electrode portions to which power is input from the outside, but the present invention is not limited to this.
  • One electrode substrate may have a plurality of pairs of connection electrode portions to which electric power is input from the outside.
  • the electrode substrate has a connection electrode part for applying a voltage for electrophoresis between the first flow path and the second flow path in addition to the connection electrode part of the above embodiment. May be.
  • the sequence of nucleotides as monomers is determined from the current value data acquired by the current value data acquisition process, but the present invention is not limited to this.
  • the current value data obtained by other methods may be analyzed using the sequencing method described above to determine the monomer sequence.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

この配列決定方法は、電極間の電流値を所定の時間間隔で計測して電流値データを取得する工程(S102)と、電流値データからシグナルの密集領域を含む解析領域を選択する工程(S102)と、解析領域において最小代表値と最大代表値とを決定する工程(S103,S104)と、最小代表値および最大代表値を基準としてシグナルに対応する単量体の種類を判別する工程(S106)とを含む。これにより、ベース電流値が変動する場合であっても、ベース電流値の変動の影響を受けにくい短時間の区間において、各単量体を判別するための基準を設けられるため、各単量体のシグナルをより正確に識別できる。このように、一対の電極間を流れるトンネル電流を測定して得られた電流値データから、より正確に単量体の識別を行うことができる。

Description

配列決定方法および配列決定装置
 本発明は、一対の電極間を流れるトンネル電流を測定して、生体高分子のシグナル電流を含む電流値データから生体高分子を構成する単量体の配列を決定する配列決定方法および配列決定装置に関する。
 従来、微細な先端部を有する電極を用いて、特定の分子や原子を測定または識別する方法が知られている。微細な電極を用いて特定の分子を識別する方法については、例えば、特許文献1に記載されている。
 特許文献1に記載の単分子識別方法では、電極間距離の短い電極対を用いて、電極間を通過する生体高分子を構成する単分子(単量体)を、トンネル電流を測定することにより識別する。
特開2015-64248号公報
 特許文献1に記載のように、生体高分子のトンネル電流を測定して生体高分子を構成する単量体を識別するためには、得られた測定データを適切に解析する必要がある。しかしながら、測定データの解析において、正確な解析を妨げる種々の問題がある。例えば、測定されたトンネル電流には、ノイズ等による擬似シグナルが含まれている。このために、擬似シグナルを生体高分子のシグナルの一部と誤認してしまう場合がある。また、生体高分子が通過していない時刻における電流値であるベース電流値が変動することにより、それぞれの単量体に対応する電流値も変動し、正確な解析の妨げとなる場合がある。
 本発明は、このような事情に鑑みなされたものであり、一対の電極間を流れるトンネル電流を測定して得られた電流値データから、より正確に単量体の識別を行うことができる技術を提供することを目的とする。
 上記課題を解決するため、本願の第1発明は、一対の電極間を流れるトンネル電流を測定することにより、生体高分子を構成する複数の単量体の配列を決定する配列決定方法であって、a)前記電極間の電流値を所定の時間間隔で計測し、電流値データを取得する工程と、b)前記電流値データからシグナルの密集領域を含む解析領域を選択する工程と、c)前記解析領域において、複数の代表値のうちで最も電流値が小さい最小代表値と、複数の代表値のうちで最も大きい最大代表値とを決定する工程と、d)前記最小代表値および前記最大代表値を基準として、前記シグナルに対応する単量体の種類を判別する工程と、を含む。
 本願の第2発明は、第1発明の配列決定方法であって、前記工程b)は、b1)前記電流値データにおいて、所定のシグナル基準値を超える電流値を前記シグナルと認定する工程と、b2)前記工程b1)において認定した前記シグナルが密集領域認定条件を満たす領域を検出し、前記密集領域として認定する工程と、を含む。
 本願の第3発明は、第2発明の配列決定方法であって、前記工程b2)において、前記密集領域認定条件は、前記シグナル同士の間隔が所定値未満であることを含む。
 本願の第4発明は、第2発明または第3発明の配列決定方法であって、前記工程b2)において、前記密集領域認定条件は、連続した前記シグナルのうち最大電流値をとる最大シグナルを検出し、前記最大シグナル同士の間隔が所定値未満であることを含む。
 本願の第5発明は、第2発明ないし第4発明のいずれかの配列決定方法であって、前記シグナル基準値は、前記電流値データの区間毎の標準偏差に基づいて算出される。
 本願の第6発明は、第1発明ないし第5発明の配列決定方法であって、前記生体高分子はポリヌクレオチドであり、前記最大代表値に対応する単量体はGMPまたはdGMPである。
 本願の第7発明は、一対の電極間を流れるトンネル電流を所定の時間間隔で計測して得られた電流値データに基づいて、生体高分子を構成する複数の単量体の配列を決定する配列決定装置であって、p)前記電流値データからシグナルの密集領域を含む解析領域を選択する工程と、q)前記解析領域において、複数の代表値のうちで最も電流値が小さい最小代表値と、複数の代表値のうちで最も大きい最大代表値とを決定する工程と、r)前記最小代表値および前記最大代表値を基準として、前記シグナルに対応する単量体の種類を判別する工程と、を実行する。
 本願の第1発明から第7発明によれば、シグナル密集領域を含む解析領域において、ベース電流値に対応する最小代表値と、最もトンネル電流値の大きな単量体のシグナルに対応する最大代表値とを基準として各単量体のシグナルを判別する。これにより、ベース電流値が変動する場合であっても、ベース電流値の変動の影響を受けにくい短時間の区間において、各単量体を判別するための基準を設けられるため、各単量体のシグナルをより正確に識別できる。すなわち、得られた電流値データから、より正確に単量体の識別を行うことができる。
 特に、本願の第2発明によれば、電流値データから、ナノ電極間を生体高分子が通過した期間をより正確に認識できる。したがって、得られた電流値データから、さらに正確に単量体の識別を行うことができる。
 特に、本願の第3発明によれば、ノイズをより精度良く排除できる。したがって、ナノ電極34間を生体高分子が通過した期間をさらに正確に認識できる。その結果、得られた電流値データから、さらに正確に単量体の識別を行うことができる。
一実施形態に係る電極基板の上面図である。 一実施形態に係る電極基板の部分上面図である。 一実施形態に係る電極基板の部分上面図である。 一実施形態に係る電極基板の部分上面図である。 一実施形態に係る電極基板の電流計測を行う際の様子を示した図である。 一実施形態に係る電極基板の電流計測を行う際の様子を示した図である。 一実施形態に係る電極基板の初期位置における部分断面図である。 一実施形態に係る電極基板の押し上げ時における部分断面図である。 配列決定処理の流れを示したフローチャートである。 電流値データの一例を示した図である。 解析領域選択工程の具体的な流れを示すフローチャートである。 解析領域における電流値データの一例を示した図である。
 以下、本発明の実施形態について、図面を参照しつつ説明する。なお、本願では、電極基板の厚み方向を上下方向とし、基板層に対して金属層側を上側、金属層に対して基板層側を下側として説明を行っている。しかしながら、電極基板の使用時の向きは必ずしも金属層側を鉛直上向きとしなくてもよい。
 <1.電極基板および電流計測装置の構成>
 本発明の一実施形態に係る電極基板1と、電流計測装置9とについて、図1~図8を参照しつつ説明する。図1は、電極基板1の上面図である。図2~図4は、電極基板1の部分上面図である。図5および図6は、電流計測装置9を用いた電極基板1の押し曲げの様子を示した概略図である。図7および図8は、電極基板1の部分断面図である。
 この電極基板1および電流計測装置9は、生体高分子を構成する単量体の配列や、各単量体を解析するために用いられる。解析対象となる生体高分子を構成する単量体としては、例えば、タンパク質を構成するアミノ酸、核酸(DNA,RNA)を構成するヌクレオチド、糖鎖を構成する単糖が挙げられる。この電極基板1を用いた生体高分子の解析において、具体的には、後述するナノ電極34間に電圧を印加した状態でナノ電極34間に生体高分子を通過させる。そして、ナノ電極34と生体高分子との間に流れるトンネル電流を検知し、解析することにより、生体高分子を構成する単量体の解析を行う。
 図1に示すように、電極基板1は、略長方形の板状の基板である。図1~図4、図7および図8に示すように、電極基板1は、基板層20と、金属層30とを有する。以下では、電極基板1の長手方向を第1方向と称し、電極基板1の短手方向を第2方向と称する。第2方向は、第1方向と直交する。なお、「直交する」とは、「略直交する」を含むものとする。
 本実施形態の基板層20は、絶縁材料により形成される。本実施形態の基板層20は、シリコン(Si)により形成された基板層の上にポリイミドにより形成された基板層が重なった2層構造である。なお、本実施形態の基板層20は2層構造であるが、本発明はこれに限られない。基板層20は1種類の材料により形成される1層のみから構成されてもよいし、3つ以上の層から構成されてもよい。また、基板層20は、絶縁性の材料により形成されていれば、シリコンおよびポリイミド以外の材料により形成されてもよい。基板層20は、例えば、ポリエチレンテレフタラート樹脂、セラミック、シリコーンゴムまたはアルミナにより形成されてもよい。
 金属層30は、図1~図4に示すように、2つの接続用電極部31と、2つの接続用電極部31の間において第1方向に延びる配線部32と、配線部32の中央に配置された計測電極部33とを有する。
 金属層30は、例えば、導体である金(Au)、白金(Pt)、銀(Ag)、銅(Cu)、タングステン(W)等の金属により形成される。なお、金属層30は、複数の金属層を重ねて構成されてもよい。例えば、クロム(Cr)により形成された金属層の上に、上記の金、白金、銀、銅等の金属からなる金属層が重なる構造であってもよい。なお、その場合であっても、計測電極部33は、1層の金属層のみから構成されることが好ましい。金属層30の厚みは、例えば、50~300nmである。
 基板層20および金属層30の最上面は、絶縁膜(図示せず)により覆われている。金属層30の表面を絶縁膜で覆うことにより、計測電極部33を液中で用いる場合に、金属層30のうち計測電極部33以外の箇所において、金属層30を構成する金属と液体との間における電子のやりとりが生じるのを抑制できる。なお、本実施形態では、絶縁膜はTEOS酸化膜であるが、絶縁性の材料であれば、他の材料により形成されてもよい。なお、接続用電極部31の上面の少なくとも一部には、絶縁膜が形成されない。このため、接続用電極部31の上面の少なくとも一部は露出している。
 2つの接続用電極部31は、第1方向に離れて配置されている。2つの配線部32はそれぞれ、各接続用電極部31から計測電極部33へ向かうにつれて次第にその幅が小さくなる。両側の配線部32の間には、配線部32よりもさらに第2方向の幅が小さい計測電極部33が配置される。図4に示すように、計測電極部33は、一対のナノ電極34により構成される。電極基板1に負荷(外力)がかかっていない状態では、図4に示すように、一対のナノ電極34の先端部同士は、互いに接触した状態となっている。
 基板層20は、上面から下方へ凹む流路50を有する。流路50は、第1流路51、第2流路52および計測流路53を有する。第1流路51および第2流路52は、計測電極部33を挟んで第2方向に対向して配置される。計測流路53は、第1流路51と第2流路52を第2方向に繋ぐ。
 第1流路51および第2流路52は、格子状に繋がる複数の溝により構成される。このような形状により、第1流路51および第2流路52に生体高分子を含む液体が充填されると、各生体高分子が溝の延びる方向に沿って配置されやすくなる。したがって、第1流路51および第2流路52と計測流路53との境界部で生体高分子が詰まって液体の流動性が低下するのが抑制されるとともに、計測流路53内において各生体高分子が計測流路53の延びる方向に沿って延びた状態で配置される。第1流路51および第2流路52の各溝は、幅が約1μmであり、深さが約2μmである。
 計測流路53は、第2方向に延びる溝である。計測流路53は、ナノ電極34の先端部と上下に重なる位置に配置される。これにより、計測流路53内を第2方向に移動する生体高分子が、ナノ電極34の間を通過しやすい。計測流路53の深さは、第1流路51および第2流路52と同様、約2μmである。計測流路53はナノ電極34付近においてその幅が狭くなっている。これにより、電流値計測時に、生体高分子が、計測流路53の延びる第2方向に沿う向きで、ナノ電極34間を1つずつ通過しやすい。なお、第1流路51、第2流路52および計測流路53のそれぞれの深さは、2μm未満であってもよいし、2μmより大きくてもよい。
 次に、電流計測装置9について、図5および図6を参照しつつ説明する。図5および図6は、電流計測装置9において電流計測を行う際の様子を示した図である。図5は、電極基板1がセットされた電流計測装置9の初期状態における様子を示した側面図である。図6は、電極基板1の押し曲げ時における電流計測装置9の様子を示した側面図である。なお、図6では、電極基板1の変形を誇張して示している。
 図6に概念的に示すように、電流計測装置9は、載置台91と、固定具92と、押し上げ具93と、昇降機構94と、電源95と、電流計96と、制御部90とを有する。
 載置台91は、電極基板1を載置する平らな上面を有する。本実施形態の固定具92は、第1方向に対して略垂直に配置される4つの板状部材である。固定具92は、計測電極部33を挟んだ第1方向の2箇所において、電極基板1を上下から押えて固定する。
 押し上げ具93には、例えば、半球状の上面を有する円柱状の部材が用いられる。押し上げ具93は、昇降機構94に接続されている。昇降機構94は、モータ941とピエゾアクチュエータ942とを有する。モータ941は、押し上げ具93をミリメートル単位で大きく上下に移動させる。ピエゾアクチュエータ942は、押し上げ具93をナノメートル単位で小さく上下に移動させる。昇降機構94は、モータ941とピエゾアクチュエータ942とを組み合わせることにより、大きな動きと細かな動きとの双方を実現している。なお、昇降機構94は、押し上げ高さを制御できる機構であれば、その他の動力を用いた機構であってもよい。
 電源95は、一対の接続用電極部31間に電圧を印加する。電流計96は、計測電極部33のナノ電極34間に流れる電流の電流値を測定する。
 制御部90は、昇降機構94、電源95および電流計96とそれぞれ電気的に接続し、各部を制御する。本実施形態の制御部90は、CPU等の演算処理部、RAM等のメモリ、およびハードディスクドライブ等の記憶部を備えたコンピュータにより構成されている。制御部90の機能は、記憶部に記憶されたコンピュータプログラムに基づいて、演算処理部が動作することにより実現される。これにより、後述する電流計測装置9における電流値データ取得処理や、生体高分子の配列決定処理が進行する。
 電極基板1を電流計測装置9にセットする際には、まず、載置台91上に電極基板1を載置する。その後、電極基板1の計測電極部33付近に負荷のかからない状態で電極基板1を上下から4つの固定具92で固定する。このとき、計測電極部33の真下に押し上げ具93が位置するように、電極基板1を配置する。
 そして、電流計測時には、まず、電源95により、接続用電極部31間に所定の電圧を印加するとともに、電流計96による電流値の計測を開始する。そして、昇降機構94を駆動させて押し上げ具93を押し上げて、ナノ電極34の先端部同士の距離(電極間距離)を調整する。
 図7は、初期位置における電極基板1の部分断面図である。図8は、押し上げ時における電極基板1の部分断面図である。図4および図7に示すように、電極基板1が押し曲げられていない状態では、ナノ電極34の先端部同士は接触している。図8に示すように、押し上げ具93を押し上げると、電極基板1の計測電極部33付近が下面側から押し上げられる。すると、計測流路53を構成する基板層20の側壁が、図8中に実線矢印で示すように、互いに離れる方向へと移動する。これにより、ナノ電極34同士が、図8中に破線矢印で示すように、互いに離れる方向へと移動する。その結果、電極間距離が拡がる。このように、押し上げ具93によって電極基板1を押し上げることにより、電極間距離の調整を行う。
 <2.配列決定処理>
 続いて、電流計測装置9において、生体高分子を構成する複数の単量体の配列を決定する配列決定処理について、図9および図10を参照しつつ説明する。電流計測装置9では、1対のナノ電極34間を流れるトンネル電流を測定することにより、生体高分子を構成する単量体を識別する。図9は、電流値データに基づいた配列決定処理の流れを示したフローチャートである。図10は、電流値Iの一例を示した図である。なお、図10は、電流値Iの時系列データの特徴を誇張して表示したものであり、実験データではない。
 生体高分子であるポリヌクレオチドを構成するヌクレオチドの配列を決定する場合、まず、測定対象のポリヌクレオチドを含む液体試料についての電流値データを取得する(ステップS101)。本実施形態の電極基板1および電流計測装置9を用いて電流値データを取得する場合、まず、電極基板1の流路50および少なくともナノ電極34の周辺を試料で満たす。そして、ナノ電極34間の電流値Iを計測することにより、電流値データを取得する。本実施形態の電流値データは、0.1msec毎に電流値Iを取得したデータである。
 次に、ステップS102~ステップS107における解析工程を、制御部90において行う。なお、本実施形態では、電流計測装置9の各部を制御する制御部90が、当該解析工程を行う配列決定装置を構成する。しかしながら、本発明はこれに限られない。配列決定処理におけるこれらの解析工程は、制御部90とは異なる配列決定装置によって行われてもよい。
 解析工程では、初めに、取得した電流値データから、解析領域を選択する(ステップS102)。図11は、ステップS102における解析領域選択工程の具体的な流れを示すフローチャートである。
 ステップS102では、まず、第1シグナル基準値K1を超える第1シグナルを認定する(ステップS201)。第1シグナル基準値K1には、ベースラインのノイズの影響を受けない程度に十分大きな電流値が用いられる。ここで、ナノ電極34間に試料の溶媒のみが存在する場合の電流値Iをベースラインと称する。
 本実施形態の第1シグナル基準値K1は、所定の期間ごとに区切られた区間内の電流値Iの平均値Ivと、当該区間内の電流値Iの標準偏差σとに基づいて、K1=Iv+6*σとして算出される。なお、平均値Ivは、ベースラインの平均電流値であるベース電流値Ibよりも大きな値となる。
 なお、第1シグナル基準値K1は、例えば、K1=Iv+4*σや、K1=Iv+5*σのように、上記の第1シグナル基準値K1と同様に、ベース電流値Ibと標準偏差σとに基づいて算出されてもよいし、その他の算定式に基づいて算出されてもよい。また、第1シグナル基準値K1は、予め決められた固定値であってもよい。
 続いて、ステップS201で認定した第1シグナル同士の間隔が所定の第1閾値T1よりも小さい箇所を選択する。具体的には、まず、第1シグナル同士の間隔である第1間隔Taを算出する。第1閾値T1は、例えば、0.2msecである。第1シグナルが連続して現れる部分については、連続する第1シグナルを1つの第1シグナルとして取り扱う。そして、第1閾値T1未満となる第1間隔Taの前後の第1シグナルを選択する(ステップS202)。図10中には、ステップS202で選択された複数の第1シグナルにより構成される第1シグナル群が、破線により囲まれて示されている。
 その後、ステップS202において選択された第1シグナル群に含まれる各第1シグナルの最大値同士の間隔が所定の第2閾値T2よりも小さい箇所を選択する(ステップS203)。第2閾値T2は、例えば、0.2msecである。具体的には、まず、第1シグナル群に含まれる各第1シグナルの最大値同士の間隔である第2間隔Tbを算出する。ここで、連続して現れる第1シグナルについては、連続した第1シグナルの中で最も電流値の大きいものを最大値とする。また、ごく短時間に生じる単発の第1シグナルについては、当該単発の第1シグナルの値を最大値とする。そして、各第2間隔Tbが第2閾値T2未満となるか否かをそれぞれ判定する。そして、第2閾値T2未満となる第2間隔Tbの前後の最大値を有する第1シグナルを選択して、選択後シグナル群を認定する。
 なお、図10の例では、2つの第1シグナル群において、全ての第2間隔Tbが第2閾値T2未満となっているため、ステップS203の終了後に選択されている第1シグナル群には、ステップS202の終了後に選択されている第1シグナルが全て含まれている。
 続いて、選択後第1シグナル群と連続する電流値データであって、第2シグナル基準値K2を超える第2シグナルを認定し、シグナル密集領域を認定する(ステップS204)。
 本実施形態の第2シグナル基準値K2は、区間内の電流値Iの平均値Ivと、当該区間内の電流値Iの標準偏差σとに基づいて、K2=Iv+σとして算出される。なお、第2シグナル基準値K2は、例えば、K1=Iv+2*σや、K2=Iv+3*σのように、上記の第2シグナル基準値K2と同様に、ベース電流値Ibと標準偏差σとに基づいて算出されてもよいし、その他の算定式に基づいて算出されてもよい。また、第2シグナル基準値K2は、予め決められた固定値であってもよい。
 その後、シグナル密集領域に、シグナル密集領域の前後の所定期間の領域を加えた領域を、その後のデータ解析に用いる解析領域として認定する(ステップS205)。本実施形態では、例えば、シグナル密集領域の前後5msecを含む領域を解析領域とする。
 このようにしてステップS102において解析領域を選択した後、図9に示すように、最小代表値を決定する(ステップS103)。その後、最大代表値を決定する(ステップS104)。なお、ステップS103とステップS104とは、その順序が逆であってもよい。
 図12は、解析領域における電流値データの一例を示した図である。なお、図12は、RNA Let7aのように、GMP,AMP,UMPの3種のヌクレオチドから構成される核酸塩基試料の電流値データの特徴を誇張して表示したものであり、実験データではない。
 図12の電流値データの解析領域に含まれる電流値Iには、ベースラインの電流値であるベース電流値Ibの成分と、GMPに対応する電流値成分と、AMPに対応する電流値成分と、UMPに対応するする電流値成分とが含まれる。したがって、この4つの成分に対応する4つの代表値が電流値Iから得られる。このように、ベースラインの成分と、複数の単量体の種類とにそれぞれ対応する複数の代表値が電流値Iから得られる。この4つの成分のうち、ベース電流値Ibが最小の電流値領域に存在し、GMPに対応する電流値成分が最大の電流値領域に存在する。このため、まず、ステップS103においてベース電流値Ibに対応する最小代表値を決定する。最小代表値は、電流値Iから得られる4つの代表値のうちで最も電流値が小さいものである。
 本実施形態の最小代表値の決定工程では、最小代表値の算出方法を複数種類行い、算出された複数の最小代表値のうちで最も小さな電流値を有するものを、最終的な最小代表値として決定する。なお、1種類の算出方法によって最小代表値を決定してもよいし、複数種類の算出方法によって得られた複数の最小代表値の平均値や中央値等を最終的な最小代表値としてもよい。
 最小代表値の算出方法としては、例えば、図12に示すように、解析領域の電流値Iについて電流値領域毎のヒストグラムを作成し、それぞれのピーク付近の最頻値を複数個(図12の場合4つ)選出する。その複数の最頻値のうち、電流値が最も小さいものを最小代表値とする。
 他の最小代表値の算出方法としては、例えば、図12に示すように、解析領域の電流値Iについて電流値領域毎のヒストグラムを作成し、そのヒストグラムを平滑化する。そして、平滑化ヒストグラムのピーク値のうち、電流値が最も小さいものを最小代表値とする。
 また、他の最小代表値の算出方法としては、例えば、図12に示すように、解析領域の電流値Iについて電流値領域毎のヒストグラムを作成し、そのヒストグラムを複数の正規分布の重ね合わせに近似する。そして、各正規分布のピーク値のうち、電流値が最も小さいものを最小代表値とする。
 また、他の最小代表値の算出方法としては、例えば、ステップS205で認定した解析領域のうち、ステップS204でシグナル密集領域と認定されていない領域がベースラインであると推定し、当該箇所の平均値や最頻値等を最小代表値とする。
 最小代表値の決定(ステップS103)に続いて、GMPに対応する最大代表値の決定を行う(ステップS104)。最大代表値は、電流値Iから得られる4つの代表値のうちで最も電流値が大きいものである。本実施形態の最大代表値の決定工程では、最大代表値の算出方法を複数種類行い、算出された複数の最大代表値の平均値または中央値を、最終的な最大代表値として決定する。なお、1種類の算出方法によって最大代表値を算出してもよい。
 なお、本実施形態のように、解析対象の生体高分子がRNAである場合には、最大代表値に対応する単量体はGMPである。しかしながら、解析対象の生体高分子がDNAである場合には、最大代表値に対応する単量体はdGMPとなる。このように、解析対象の生体高分子によって、最大代表値に対応する単量体の種類が決まっている。
 最大代表値の算出方法としては、例えば、最小代表値と同様に、解析領域の電流値Iについて電流値領域毎のヒストグラムを作成し、それぞれのピーク付近の最頻値を複数個選出する。その複数の最頻値のうち、電流値が最も大きいものを最大代表値とする。
 また、他の最大代表値の算出方法としては、例えば、最小代表値と同様に、解析領域の電流値Iについて電流値領域毎のヒストグラムを作成し、そのヒストグラムを平滑化する。そして、平滑化ヒストグラムのピーク値のうち、電流値が最も大きいものを最大代表値とする。
 また、他の最大代表値の算出方法としては、例えば、最小代表値と同様に、解析領域の電流値Iについて電流値領域毎のヒストグラムを作成し、そのヒストグラムを複数の正規分布の重ね合わせに近似する。そして、各正規分布のピーク値のうち、電流値が最も大きいものを最大代表値とする。
 また、他の最大代表値の算出方法としては、例えば、シグナル密集領域における電流値Iの最大値に、1よりも小さい所定の係数を乗じたものを、最大代表値とする。本実施形態においては、シグナル密集領域における電流値Iの最大値に0.9を乗じたものを、最大代表値とする。
 続いて、単量体毎の電流領域を推定する(ステップS105)。単量体毎の電流領域は、例えば、最小代表値をベース電流値Ibとし、最大代表値をGMP電流値Igとした場合に、ベース電流値Ibと、GMP電流値Igと、ベース電流値IbおよびGMP電流値Igの差分ΔIg=Ig-Ibとに基づいて算出される。本実施形態では、ベースラインの電流領域の中心値をベース電流値Ibとし、GMPの電流領域の中心値をIgとし、AMPの電流領域の中心値をIa=Ib+0.7*ΔIgとし、UMPの電流領域の中心値をIu=Ib+0.5*ΔIgとする。そして、各電流領域の幅をそれぞれ設定する。なお、単量体毎の電流領域や、その中心値は、例えば、図12に示すヒストグラム、平滑化ヒストグラムおよび正規分布近似から算出されてもよい。
 続いて、設定された各電流領域に基づいて、ヌクレオチドに相当するシグナルを判別する(ステップS106)。本実施形態では、図12中の電流値Iのグラフの下方に示すように、各電流領域に含まれる電流値Iとなる各シグナルを選択する。そして、選択したシグナルのうち、所定の期間(例えば1msec)以上シグナルが連続している箇所のみを選択する。これにより、ヌクレオチドに相当するシグナルを判別できる。図12中には、選択されなかった(シグナル連続時間が短い)シグナルの上方に「×」印が付されている。
 このようにして選択されたシグナルを、それぞれ対応する領域のシグナルとして認識する。これにより、ベースライン、GMP、AMP、UMPの4種類のシグナルの出現時刻が決定される。そして、これにより、ヌクレオチドの配列が決定できる(ステップS107)。
 上記のように、この配列決定方法では、ナノ電極34間の電流値Iを所定の時間間隔で計測して電流値データを取得する工程(ステップS101)と、電流値データからシグナル密集領域を含む解析領域を選択する工程(ステップS102)と、解析領域において最小代表値と最大代表値とを決定する工程(ステップS103~S104)と、最小代表値および最大代表値を基準として、シグナルに対応する単量体の種類を判別する工程(ステップS105~S106)とを含む。
 このように、シグナル密集領域を含む解析領域において、ベース電流値に対応する最小代表値と、最もトンネル電流値の大きな単量体のシグナルに対応する最大代表値とを基準として各単量体のシグナルを判別する。これにより、ベース電流値が変動する場合であっても、ベース電流値の変動の影響を受けにくい短時間の区間において、各単量体を判別するための基準を設けられるため、各単量体のシグナルをより正確に識別できる。すなわち、得られた電流値データから、より正確に単量体の識別を行うことができる。
 また、上記の配列決定方法では、電流値データからシグナル密集領域を含む解析領域を選択する工程(ステップS102)は、電流値データにおいて所定のシグナル基準値を超える電流値をシグナルと認定する工程(ステップS201)と、認定したシグナルの周辺において密集領域認定条件を満たす領域を検出し、密集領域として認定する工程(ステップS202~S204)を含む。
 これにより、電流値データから、ナノ電極34間を生体高分子が通過した期間をより正確に認識できる。したがって、得られた電流値データから、さらに正確に単量体の識別を行うことができる。
 より具体的には、上記の実施形態において、密集領域認定条件として、ステップS202において、シグナル同士の間隔が所定値未満であるか否かを判断する。また、密集領域認定条件として、ステップS203において、連続したシグナルのうち最大電流値をとる最大シグナルを検出し、最大シグナル同士の間隔が所定値未満であるか否かを判断する。
 これにより、ノイズをより精度良く排除できる。したがって、ナノ電極34間を生体高分子が通過した期間をさらに正確に認識できる。その結果、得られた電流値データから、さらに正確に単量体の識別を行うことができる。
 <3.変形例>
 以上、本発明の一実施形態について説明したが、本発明は、上記の実施形態に限定されるものではない。
 上記の実施形態では、電極基板の有する金属層が外部から電力が入力される接続用電極部を一対のみ有したが、本発明はこれに限られない。1つの電極基板が、外部から電力が入力される接続用電極部を複数対有していてもよい。例えば、電極基板は、上記の実施形態の接続用電極部に加えて、第1流路と第2流路との間に電気泳動用の電圧を印加するための接続用電極部を有していてもよい。
 また、上記の実施形態では、上記の電流値データ取得処理によって取得された電流値データから単量体であるヌクレオチドの配列を決定したが、本発明はこれに限られない。他の方法によって得られた電流値データを、上記の配列決定方法を用いて解析し、単量体の配列を決定してもよい。
 また、上記の実施形態や変形例に登場した各要素を、矛盾が生じない範囲で、適宜に組み合わせてもよい。
 1 電極基板
 9 電流計測装置
 34 ナノ電極
 Ib ベース電流
 Ig GMP電流値
 K1 第1シグナル基準値
 K2 第2シグナル基準値

Claims (7)

  1.  一対の電極間を流れるトンネル電流を測定することにより、生体高分子を構成する複数の単量体の配列を決定する配列決定方法であって、
     a)前記電極間の電流値を所定の時間間隔で計測し、電流値データを取得する工程と、
     b)前記電流値データからシグナルの密集領域を含む解析領域を選択する工程と、
     c)前記解析領域において、複数の代表値のうちで最も電流値が小さい最小代表値と、複数の代表値のうちで最も大きい最大代表値とを決定する工程と、
     d)前記最小代表値および前記最大代表値を基準として、前記シグナルに対応する単量体の種類を判別する工程と、
    を含む、配列決定方法。
  2.  請求項1に記載の配列決定方法であって、
     前記工程b)は、
      b1)前記電流値データにおいて、所定のシグナル基準値を超える電流値を前記シグナルと認定する工程と、
      b2)前記工程b1)において認定した前記シグナルが密集領域認定条件を満たす領域を検出し、前記密集領域として認定する工程と、
    を含む、配列決定方法。
  3.  請求項2に記載の配列決定方法であって、
     前記工程b2)において、前記密集領域認定条件は、
      前記シグナル同士の間隔が所定値未満であること
    を含む、配列決定方法。
  4.  請求項2または請求項3に記載の配列決定方法であって、
     前記工程b2)において、前記密集領域認定条件は、
      連続した前記シグナルのうち最大電流値をとる最大シグナルを検出し、前記最大シグナル同士の間隔が所定値未満であること
    を含む、配列決定方法。
  5.  請求項2ないし請求項4のいずれかに記載の配列決定方法であって、
     前記シグナル基準値は、前記電流値データの区間毎の標準偏差に基づいて算出される、配列決定方法。
  6.  請求項1ないし請求項5に記載の配列決定方法であって、
     前記生体高分子はポリヌクレオチドであり、
     前記最大代表値に対応する単量体はGMPまたはdGMPである、配列決定方法。
  7.  一対の電極間を流れるトンネル電流を所定の時間間隔で計測して得られた電流値データに基づいて、生体高分子を構成する複数の単量体の配列を決定する配列決定装置であって、
     p)前記電流値データからシグナルの密集領域を含む解析領域を選択する工程と、
     q)前記解析領域において、複数の代表値のうちで最も電流値が小さい最小代表値と、複数の代表値のうちで最も大きい最大代表値とを決定する工程と、
     r)前記最小代表値および前記最大代表値を基準として、前記シグナルに対応する単量体の種類を判別する工程と、
    を実行する、配列決定装置。
PCT/JP2019/015664 2018-04-27 2019-04-10 配列決定方法および配列決定装置 WO2019208225A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-086934 2018-04-27
JP2018086934A JP2021165635A (ja) 2018-04-27 2018-04-27 配列決定方法および配列決定装置

Publications (1)

Publication Number Publication Date
WO2019208225A1 true WO2019208225A1 (ja) 2019-10-31

Family

ID=68295377

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/015664 WO2019208225A1 (ja) 2018-04-27 2019-04-10 配列決定方法および配列決定装置

Country Status (2)

Country Link
JP (1) JP2021165635A (ja)
WO (1) WO2019208225A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024018725A1 (ja) * 2022-07-21 2024-01-25 国立研究開発法人物質・材料研究機構 配列解析方法、配列解析装置、重合条件提案装置、及び、自動合成装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011108540A1 (ja) * 2010-03-03 2011-09-09 国立大学法人大阪大学 ヌクレオチドを識別する方法および装置、ならびにポリヌクレオチドのヌクレオチド配列を決定する方法および装置
US20120276530A1 (en) * 2009-08-24 2012-11-01 Trustees Of Boston University Label-free sensing of pna-dna complexes using nanopores
WO2012164679A1 (ja) * 2011-05-31 2012-12-06 株式会社日立製作所 生体分子情報解析装置
JP2015059824A (ja) * 2013-09-18 2015-03-30 国立大学法人大阪大学 生体分子シーケンシング装置、方法、及びプログラム
JP2015064248A (ja) * 2013-09-24 2015-04-09 国立大学法人大阪大学 単分子識別方法、装置、及びプログラム
JP2015145885A (ja) * 2010-02-02 2015-08-13 アリゾナ ボード オブ リージェンツ フォー アンド オン ビハーフ オブ アリゾナ ステート ユニバーシティ ポリマーの配列を決定するための制御されたトンネルギャップデバイス

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120276530A1 (en) * 2009-08-24 2012-11-01 Trustees Of Boston University Label-free sensing of pna-dna complexes using nanopores
JP2015145885A (ja) * 2010-02-02 2015-08-13 アリゾナ ボード オブ リージェンツ フォー アンド オン ビハーフ オブ アリゾナ ステート ユニバーシティ ポリマーの配列を決定するための制御されたトンネルギャップデバイス
WO2011108540A1 (ja) * 2010-03-03 2011-09-09 国立大学法人大阪大学 ヌクレオチドを識別する方法および装置、ならびにポリヌクレオチドのヌクレオチド配列を決定する方法および装置
WO2012164679A1 (ja) * 2011-05-31 2012-12-06 株式会社日立製作所 生体分子情報解析装置
JP2015059824A (ja) * 2013-09-18 2015-03-30 国立大学法人大阪大学 生体分子シーケンシング装置、方法、及びプログラム
JP2015064248A (ja) * 2013-09-24 2015-04-09 国立大学法人大阪大学 単分子識別方法、装置、及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHANG ET AL.: "Chemical Recognition and Binding Kinetics in a Functionalized Tunnel Junction", NANOTECHNOLOGY: AUTHOR MANUSCRIPT, vol. 23, no. 23, 15 June 2013 (2013-06-15), XP020224117, Retrieved from the Internet <URL:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3392519> [retrieved on 20190606], DOI: 10.1088/0957-4484/23/23/235101 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024018725A1 (ja) * 2022-07-21 2024-01-25 国立研究開発法人物質・材料研究機構 配列解析方法、配列解析装置、重合条件提案装置、及び、自動合成装置

Also Published As

Publication number Publication date
JP2021165635A (ja) 2021-10-14

Similar Documents

Publication Publication Date Title
JP2018510329A5 (ja)
US10190161B2 (en) Apparatus and method for nucleic acid sequencing based on nanowire detectors
CN109791137A (zh) 用于分子识别的微流控阵列中的隧道结
JP6826047B2 (ja) 生体分子測定装置
JP2020519254A5 (ja)
WO2019208225A1 (ja) 配列決定方法および配列決定装置
US10690618B2 (en) Electrode arrangements for electrochemical test elements and methods for use thereof
US20140295573A1 (en) Biosensor with dual gate structure and method for detecting concentration of target protein in a protein solution
US7564252B2 (en) Semiconductor inspection apparatus
US10101253B2 (en) Method of and apparatus for detecting a crack in a pair of piezoelectric elements based on transfer function
WO2019203094A1 (ja) 電流値データ取得方法および電流計測装置
WO2019176412A1 (ja) 電流測定方法
JP7398129B2 (ja) 電流測定方法
US9274081B2 (en) Sample dependent selection of parameters for use in electrokinetic treatment of the sample
WO2019176411A1 (ja) 電極対の校正方法
JP7372683B2 (ja) 電極基板および電極基板の製造方法
JP4797498B2 (ja) ハイブリダイゼーションの検出方法
JP2020076605A (ja) 電極調整方法および電極調整装置
WO2019087436A1 (ja) 基板
JP2021047018A (ja) 電極基板
CN114058686A (zh) 一种基于阻抗检测的数字pcr芯片及其检测方法
JP2021038924A (ja) 電極作成方法
Ghanim et al. Design of a Low-Cost DNA Biochip Using Copper Electrode.
KR20120110746A (ko) 바이오 센서 및 이의 제조 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19793958

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19793958

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP