JP4171919B2 - Structure estimation system, structure estimation method and program - Google Patents
Structure estimation system, structure estimation method and program Download PDFInfo
- Publication number
- JP4171919B2 JP4171919B2 JP2005223566A JP2005223566A JP4171919B2 JP 4171919 B2 JP4171919 B2 JP 4171919B2 JP 2005223566 A JP2005223566 A JP 2005223566A JP 2005223566 A JP2005223566 A JP 2005223566A JP 4171919 B2 JP4171919 B2 JP 4171919B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- image
- data processing
- images
- measurement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Description
本発明は、分子の立体構造を推定するシステム、方法およびプログラムに関する。 The present invention relates to a system, method, and program for estimating a three-dimensional structure of a molecule.
分子の立体構造を解析する技術として、従来、解析対象となるタンパク質等の生体高分子を結晶化させた試料を作成し、この試料をX線結晶構造解析法とNMR法とにより解析および評価する方法がある。ところが、この方法では、試料の結晶化が必要となるため、膜タンパク質等の結晶化が困難な試料の解析に適用することができなかった。 As a technique for analyzing the three-dimensional structure of a molecule, a sample obtained by crystallizing a biopolymer such as a protein to be analyzed has been prepared, and this sample is analyzed and evaluated by an X-ray crystal structure analysis method and an NMR method. There is a way. However, since this method requires crystallization of the sample, it could not be applied to analysis of a sample that is difficult to crystallize membrane protein or the like.
そこで、試料の結晶化を必要としない方法として、極低温透過型電子顕微鏡(Cryo−TEM)を用いてタンパク質の構造解析を行う単粒子構造解析法が提案されている(非特許文献1)。単粒子構造解析法は、透過型電子顕微鏡(TEM)中で極低温に冷却した粒子状のタンパク質試料から得られたTEM画像から、個々の球状タンパク質試料の画像を切り出し、これらの試料画像から粒子状タンパク質試料の3次元構造を推定する方法である。この方法によれば、試料の画像を加算平均することにより、試料画像のノイズを低減させることができるとされている。
ところが、単粒子構造解析法のように試料の画像データを用いて分子の構造解析を行う場合、構造解析に必要なデータの量およびデータ処理の量が膨大であった。このため、解析を要求するユーザの端末や、データ処理を行う端末への負荷が大きく、解析に長時間を要していた。 However, when the molecular structure analysis is performed using the sample image data as in the single particle structure analysis method, the amount of data necessary for the structure analysis and the amount of data processing are enormous. For this reason, the load on the user's terminal requesting the analysis and the terminal performing the data processing is large, and the analysis takes a long time.
本発明は上記事情に鑑みてなされたものであり、画像データを用いた分子の構造解析において、データ処理を効率よく行う技術を提供する。 The present invention has been made in view of the above circumstances, and provides a technique for efficiently performing data processing in molecular structure analysis using image data.
本発明者は、画像データを用いた分子の構造解析における画像処理の効率化、迅速化を図るべく鋭意検討を行った。その結果、複数の測定画像および複数のリファレンス画像を用いたデータ処理に所定の分散処理を適用することにより、データ処理の際に発生する負荷が軽減され、迅速な解析処理が可能となることを見出し、本発明に至った。 The present inventor has intensively studied to improve the efficiency and speed of image processing in molecular structure analysis using image data. As a result, by applying predetermined distributed processing to data processing using a plurality of measurement images and a plurality of reference images, the load generated during data processing can be reduced and rapid analysis processing can be performed. The headline, the present invention has been reached.
本発明によれば、
複数の画像のデータから分子の立体構造を推定するシステムであって、
ユーザのリクエストを受け付けて、前記分子の複数の測定画像に基づく構造解析を要求するユーザ端末と、
複数のデータ処理端末から構成されるデータ処理システムと、
前記ユーザ端末からの要求を受け付けて、前記データ処理システムにデータ処理を要求するスケジューラと、
がネットワークを介して接続されており、
前記データ処理システムが、
複数のリファレンス画像のデータが分配される複数のリファレンスデータ記憶部と、複数のデータ処理部と、を含み、
前記データ処理部の各々が、前記スケジューラからの前記データ処理の要求に応じて、複数の前記測定画像のそれぞれについて、前記測定画像のデータまたは前記測定画像を平行移動させてなる平行移動画像のデータと、自己に割り当てられた前記リファレンス画像のデータと当該リファレンス画像を回転移動させてなる回転移動画像の群のデータとから構成されるリファレンスデータセットと、を比較して、前記測定画像と割り当てられた前記リファレンス画像との類似度を評価する処理を行い、
前記スケジューラが、
類似度を評価する前記処理の結果に基づいて、複数の前記リファレンス画像のいずれかに複数の前記測定画像を対応づける測定データ分類部と、
前記測定データ分類部にて同じ前記リファレンス画像に対応づけられた複数の前記測定画像を平均化して得られる平均化画像のデータを複数の前記リファレンス画像について取得し、取得した複数の前記平均化画像に基づき前記分子の前記立体構造を推定する構造推定部と、
を含む構造推定システムが提供される。
According to the present invention,
A system for estimating the three-dimensional structure of a molecule from data of a plurality of images,
A user terminal that accepts a user request and requests a structural analysis based on a plurality of measurement images of the molecule;
A data processing system comprising a plurality of data processing terminals;
A scheduler that accepts a request from the user terminal and requests data processing from the data processing system;
Are connected via a network,
The data processing system is
A plurality of reference data storage units to which data of a plurality of reference images are distributed, and a plurality of data processing units,
Each of the data processing units translates the measurement image data or the translation image data obtained by translating the measurement image for each of the plurality of measurement images in response to the data processing request from the scheduler. And a reference data set composed of data of the reference image assigned to itself and data of a group of rotationally moving images obtained by rotating and moving the reference image, and assigned to the measurement image. There line processing for evaluating the similarity between the reference image,
The scheduler
A measurement data classifying unit that associates a plurality of the measurement images with any one of the plurality of reference images based on the result of the processing for evaluating the similarity;
The averaged image data obtained by averaging the plurality of measurement images associated with the same reference image in the measurement data classifying unit is acquired for the plurality of reference images, and the plurality of averaged images acquired A structure estimation unit for estimating the three-dimensional structure of the molecule based on
A structure estimation system is provided.
また、本発明によれば、
複数の画像のデータから分子の立体構造を推定する方法であって、
ユーザ端末が、ユーザのリクエストを受け付けて、複数の測定画像に基づく前記分子の構造解析を要求するステップと、
スケジューラが前記ユーザ端末からの要求を受け付けて、複数のデータ処理端末から構成されるデータ処理システムにデータ処理を要求するステップと、
前記スケジューラが、前記データ処理システムに含まれる複数のリファレンスデータ記憶部に、複数のリファレンス画像のデータを分配させるステップと、
前記スケジューラが、前記データ処理システムに含まれる複数のデータ処理部に、複数の測定画像と複数のリファレンス画像との類似度を評価する処理を割り当てるステップと、
複数の前記データ処理部の各々が、前記スケジューラからの前記データ処理の要求に応じて、前記測定画像のデータまたは前記測定画像を平行移動させてなる平行移動画像のデータと、自己に割り当てられた前記リファレンス画像のデータと前記リファレンス画像を回転移動させてなる回転移動画像の群のデータとから構成されるリファレンスデータセットと、を比較して、前記測定画像と割り当てられた前記リファレンス画像との類似度を評価する前記処理を行うステップと、
前記スケジューラが、類似度を評価する前記処理の結果に基づいて、複数の前記測定画像を、それぞれ、複数の前記リファレンス画像のいずれかに対応づけるステップと、
前記スケジューラが、複数の前記リファレンス画像のいずれかに対応づけられた複数の前記測定画像を平均化して得られる複数の平均化画像のデータを取得して、前記平均化画像のデータに基づいて、前記分子の前記立体構造を推定するステップと、
を含む構造推定方法が提供される。
Moreover, according to the present invention,
A method for estimating the three-dimensional structure of a molecule from data of a plurality of images,
A user terminal accepting a user request and requesting a structural analysis of the molecule based on a plurality of measurement images;
A scheduler accepting a request from the user terminal and requesting data processing from a data processing system including a plurality of data processing terminals;
A step wherein the scheduler, the multiple's Reference data storage unit included in the data processing system, for distributing the data of a plurality of reference images,
A step wherein the scheduler is to allocate the data processing plurality of data processing units included in the system, the process of evaluating the similarity between a plurality of measurement images and the plurality of reference images,
Each of the plurality of data processing units is assigned to the data of the measurement image or the data of the translation image obtained by translating the measurement image in response to the data processing request from the scheduler . by comparing the reference data set composed of a data group of rotational movement image composed by rotating moving data and the reference image of the reference image, similar to the reference image allocated to the measurement image Performing the process of evaluating the degree;
The scheduler associates each of the plurality of measurement images with one of the plurality of reference images based on the result of the process of evaluating the similarity,
The scheduler acquires a plurality of averaged image data obtained by averaging the plurality of measurement images associated with any of the plurality of reference images, and based on the averaged image data, Estimating the conformation of the molecule;
A structure estimation method is provided.
本発明においては、複数のリファレンス画像のデータが複数のリファレンスデータ記憶部に分配される。また、複数のデータ処理部が、測定画像と複数のリファレンス画像との類似度の評価に関するデータ処理を分担して行う。複数の測定画像と複数のリファレンス画像とを用いる際に必要な膨大なデータ処理を複数のデータ処理部に分散させるため、データ処理システムにおける局所的な負荷の増加を低減することができる。このため、データ処理を効率よく行い、処理速度を増加させることができる。また、ユーザ端末においてデータ処理を行う必要がないため、ユーザ端末への負荷を低減させることができる。 In the present invention, data of a plurality of reference images is distributed to a plurality of reference data storage units. A plurality of data processing units share and perform data processing related to the evaluation of the similarity between the measurement image and the plurality of reference images. Since enormous data processing required when using a plurality of measurement images and a plurality of reference images is distributed to a plurality of data processing units, an increase in local load in the data processing system can be reduced. For this reason, data processing can be performed efficiently and the processing speed can be increased. Moreover, since it is not necessary to perform data processing in the user terminal, the load on the user terminal can be reduced.
本発明の構造推定システムにおいて、複数の前記リファレンスデータ記憶部に、複数の前記平均化画像のデータが更新リファレンス画像として再分配されるとともに、複数の前記データ処理部に前記更新リファレンス画像が割り当てられ、前記データ処理部が、前記測定画像と割り当てられた前記更新リファレンス画像との類似度を評価する処理を行い、前記測定データ分類部が、類似度を評価する前記処理の結果に基づいて、複数の前記更新リファレンス画像のいずれかに複数の前記測定画像を対応づけし、前記構造推定部が、前記測定データ分類部にて同じ前記更新リファレンス画像に対応づけられた複数の前記測定画像を平均化して得られる平均化画像のデータを複数の前記更新リファレンス画像について取得し、取得した複数の前記平均化画像に基づき前記分子の前記立体構造を推定する構成とすることができる。この構成においては、分子の立体構造を推定する際に、リファレンス画像として複数の更新リファレンス画像が用いられる。このため、構造推定に用いるリファレンス画像の精度をさらに向上させることができる。 In the structure estimation system of the present invention, a plurality of the averaged image data are redistributed as updated reference images to the plurality of reference data storage units, and the updated reference images are allocated to the plurality of data processing units. The data processing unit performs a process of evaluating the similarity between the measurement image and the assigned update reference image, and the measurement data classifying unit performs a plurality of processes based on the result of the process of evaluating the similarity. A plurality of the measurement images are associated with any of the updated reference images, and the structure estimation unit averages the plurality of measurement images associated with the same updated reference image in the measurement data classification unit. The averaged image data obtained by acquiring the plurality of the updated reference images, the plurality of acquired It can be configured to estimate the three-dimensional structure of the molecule based upon the disproportionation image. In this configuration, a plurality of updated reference images are used as reference images when estimating the three-dimensional structure of molecules. For this reason, the precision of the reference image used for structure estimation can be further improved.
本発明の構造推定システムにおいて、前記スケジューラが、複数の前記データ処理部の稼働状態に基づいて、類似度を評価する前記処理について複数の前記リファレンス画像が割り当てられる複数のデータ処理部を選択するデータ処理部選択部と、複数の前記リファレンスデータセットの分配状況に関する情報を記憶するリファレンス分配情報記憶部と、を含んでもよい。また、本発明の構造推定システムにおいて、前記データ処理部選択部が、前記リファレンスデータセットを取得する複数の前記データ処理部をさらに選択してもよい。こうすることによって、データ処理をさらに効率よく進行させることができる。 In the structure estimation system of the present invention, the scheduler selects, based on operating states of the plurality of data processing units, data for selecting a plurality of data processing units to which the plurality of reference images are assigned for the processing for evaluating the degree of similarity. You may include a process part selection part and the reference distribution information storage part which memorize | stores the information regarding the distribution condition of the said some reference data set. In the structure estimation system of the present invention, the data processing unit selection unit may further select a plurality of the data processing units that acquire the reference data set. By doing so, the data processing can proceed more efficiently.
本発明の構造推定システムにおいて、複数の前記データ処理部が、前記リファレンスデータセットを取得するリファレンスデータセット取得部と、前記リファレンスデータセット取得部における前記リファレンスデータセットの取得方法を選択するリファレンスデータセット取得方法選択部と、を含んでもよい。また、本発明の構造推定システムにおいて、複数の前記データ処理部が、前記リファレンスデータセットを取得するリファレンスデータセット取得部を含み、前記スケジューラが、前記リファレンスデータセット取得部における前記リファレンスデータセットの取得方法を選択するリファレンスデータセット取得方法選択部を含んでもよい。この構成においては、リファレンスデータセットの取得が複数のデータ処理部に分散されるため、リファレンスデータの取得をさらに効率よく行うことができる。 In the structure estimation system of the present invention, a plurality of the data processing units select a reference data set acquisition unit for acquiring the reference data set, and a reference data set for selecting the reference data set acquisition method in the reference data set acquisition unit And an acquisition method selection unit. In the structure estimation system of the present invention, the plurality of data processing units include a reference data set acquisition unit that acquires the reference data set, and the scheduler acquires the reference data set in the reference data set acquisition unit. A reference data set acquisition method selection unit that selects a method may be included. In this configuration, since the acquisition of the reference data set is distributed to a plurality of data processing units, the reference data can be acquired more efficiently.
本発明において、前記リファレンスデータセットが、前記リファレンス画像のデータと、前記リファレンス画像を0度から360度まで回転させた回転移動画像群のデータとを含んでもよい。これにより、リファレンス画像と測定画像との類似度の評価をさらに確実に行うことができる。さらに、本発明において、前記リファレンスデータセットが、前記リファレンス画像のデータと、前記リファレンス画像を0度から90度まで回転させた回転移動画像群のデータとを含んでもよい。こうすれば、回転移動画像群のうち、4回対称の画像群のみを作成しておけばよく、予め作成する回転移動画像の数を減らしつつ、類似度を評価する際に必要に応じて符号反転により360度までの回転画像のデータを容易に取得することができる。このため、システムへの負荷をさらに軽減するとともに、さらに処理を高速に行うことができる。 In the present invention, the reference data set may include data of the reference image and data of a rotationally moving image group obtained by rotating the reference image from 0 degrees to 360 degrees. Thereby, it is possible to more reliably evaluate the similarity between the reference image and the measurement image. In the present invention, the reference data set may include data of the reference image and data of a rotationally moving image group obtained by rotating the reference image from 0 degrees to 90 degrees. In this way, it is only necessary to create a four-fold symmetric image group from among the rotationally moving image group, and the number of rotationally moving images to be created in advance is reduced as necessary when evaluating the degree of similarity. Rotation image data up to 360 degrees can be easily acquired by inversion. For this reason, the load on the system can be further reduced and the processing can be performed at higher speed.
本発明において、前記分子が生体高分子であってもよい。さらに、この構成において、前記生体高分子が膜タンパク質であってもよい。こうすれば、膜タンパク質を結晶化せずに立体構造を推定できるため、一般に結晶化が困難な膜タンパク質の立体構造推定を確実に行うことができる。 In the present invention, the molecule may be a biopolymer. Furthermore, in this configuration, the biopolymer may be a membrane protein. In this way, since the three-dimensional structure can be estimated without crystallizing the membrane protein, the three-dimensional structure of a membrane protein that is generally difficult to crystallize can be reliably estimated.
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。 It should be noted that any combination of the above-described constituent elements and a conversion of the expression of the present invention between a method, an apparatus, a system, a recording medium, a computer program, etc. are also effective as an aspect of the present invention.
たとえば、本発明によれば、
コンピュータを、複数の画像のデータから分子の立体構造を推定するシステムであって、
ユーザのリクエストを受け付けて、前記分子の複数の測定画像に基づく構造解析を要求するユーザ端末と、
複数のデータ処理端末から構成されるデータ処理システムと、
前記ユーザ端末からの要求を受け付けて、前記データ処理システムにデータ処理を要求するスケジューラと、
がネットワークを介して接続されており、
前記データ処理システムが、
複数のリファレンス画像のデータが分配される複数のリファレンスデータ記憶部と、複数のデータ処理部と、を含み、
前記データ処理部の各々が、前記スケジューラからの前記データ処理の要求に応じて、複数の前記測定画像のそれぞれについて、前記測定画像のデータまたは前記測定画像を平行移動させてなる平行移動画像のデータと、自己に割り当てられた前記リファレンス画像のデータと当該リファレンス画像を回転移動させてなる回転移動画像の群のデータとから構成されるリファレンスデータセットと、を比較して、前記測定画像と割り当てられた前記リファレンス画像との類似度を評価する処理を行い、
前記スケジューラが、
類似度を評価する前記処理の結果に基づいて、複数の前記リファレンス画像のいずれかに複数の前記測定画像を対応づける測定データ分類部と、
前記測定データ分類部にて同じ前記リファレンス画像に対応づけられた複数の前記測定画像を平均化して得られる前記平均化画像のデータを複数の前記リファレンス画像について取得し、取得した複数の前記平均化画像に基づき前記分子の前記立体構造を推定する構造推定部と、
を含む構造推定システムとして機能させるプログラムが提供される。
For example, according to the present invention,
A system for estimating a three-dimensional structure of a molecule from data of a plurality of images,
A user terminal that accepts a user request and requests a structural analysis based on a plurality of measurement images of the molecule;
A data processing system comprising a plurality of data processing terminals;
A scheduler that accepts a request from the user terminal and requests data processing from the data processing system;
Are connected via a network,
The data processing system is
A plurality of reference data storage units to which data of a plurality of reference images are distributed, and a plurality of data processing units,
Each of the data processing units translates the measurement image data or the translation image data obtained by translating the measurement image for each of the plurality of measurement images in response to the data processing request from the scheduler. And a reference data set composed of data of the reference image assigned to itself and data of a group of rotationally moving images obtained by rotating and moving the reference image, and assigned to the measurement image. There line processing for evaluating the similarity between the reference image,
The scheduler
A measurement data classifying unit that associates a plurality of the measurement images with any one of the plurality of reference images based on the result of the processing for evaluating the similarity;
The averaged image data obtained by averaging the plurality of measurement images associated with the same reference image in the measurement data classification unit is acquired for the plurality of reference images, and the plurality of the averaged acquired A structure estimation unit that estimates the three-dimensional structure of the molecule based on an image;
There is provided a program that functions as a structure estimation system including.
本発明によれば、画像データを用いた分子の構造解析において、データ処理を効率よく行う技術が実現される。 ADVANTAGE OF THE INVENTION According to this invention, the technique which performs a data processing efficiently in the structure analysis of the molecule | numerator using image data is implement | achieved.
以下、本発明の実施形態について、図面を用いて説明する。なお、すべての図面において、共通する構成要素には同じ符号を付し、適宜説明を省略する。なお、以下の実施形態においては、単粒子解析法の手法を用いて生体高分子の立体構造を解析する場合を例に説明するが、本発明の解析対象は生体高分子には限られず、合成高分子や各種低分子化合物等を解析対象とすることもできる。また、本発明は、画像処理による分子の立体構造解析であれば、単粒子解析法以外の手法にも適用できる。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In all the drawings, common constituent elements are denoted by the same reference numerals, and description thereof is omitted as appropriate. In the following embodiments, a case where a three-dimensional structure of a biopolymer is analyzed using a single particle analysis method will be described as an example. However, the analysis target of the present invention is not limited to a biopolymer, and synthesis is performed. Polymers and various low-molecular compounds can also be analyzed. In addition, the present invention can be applied to techniques other than the single particle analysis method as long as the three-dimensional structure analysis of molecules is performed by image processing.
はじめに、本発明の理解を深めるために、分子の立体構造の解析方法の一例として、従来の単粒子解析法について図7を参照して概要を説明する。図7は、背景技術の項で前述した非特許文献1に示された単粒子解析法の概要を説明する図である。同文献に記載のように、単粒子解析法は、結晶を用いないタンパク質の構造解析法である。単粒子解析法では、タンパク質の電子顕微鏡写真を用いて構造解析が行われる。 First, in order to deepen the understanding of the present invention, an outline of a conventional single particle analysis method will be described with reference to FIG. 7 as an example of a method for analyzing a three-dimensional structure of a molecule. FIG. 7 is a diagram for explaining the outline of the single particle analysis method disclosed in Non-Patent Document 1 described above in the background art section. As described in this document, the single particle analysis method is a protein structure analysis method that does not use crystals. In the single particle analysis method, structural analysis is performed using an electron micrograph of a protein.
タンパク質の電子顕微鏡写真は、電子線照射による試料の損傷のために分解能が制限され、ノイズが多い画像となる。タンパク質のように電子線損傷を受けやすい場合には、シグナルとノイズの比(S/N比)が悪いことによって、画像の分解能が制限されるために、電子顕微鏡の持つ本来の分解能が発揮できない。このために、1枚の画像から高分解能の情報が得られないのみならず、立体構造の再構成も容易ではない。 An electron micrograph of a protein is a noisy image with limited resolution due to sample damage due to electron beam irradiation. When proteins are susceptible to electron beam damage, the resolution of the image is limited due to the poor signal-to-noise ratio (S / N ratio), so the original resolution of the electron microscope cannot be achieved. . For this reason, not only high-resolution information cannot be obtained from one image, but also the reconstruction of the three-dimensional structure is not easy.
この問題を克服するため、単粒子解析では、同じ向きの粒子画像を選び出し、それらを平均化することでS/N比を向上させて分解能を上げるというコンピュータを用いた結晶化ともいうべき方法を用いる(図7中)。凍結法による無染色電子顕微鏡画像は分子内密度を反映した投影画像を与えると考えられるため、そのS/N比が向上した平均画像から、様々な角度で1次元に投影したシノグラムを作成し、相互に比較することで3次元上のお互いの角度を推定する(図7左下)。 In order to overcome this problem, in single particle analysis, a method that should be referred to as crystallization using a computer, which selects particle images in the same direction and averages them to improve the S / N ratio and increase the resolution. Used (in FIG. 7). Since the unstained electron microscope image by the freezing method is thought to give a projected image reflecting the intramolecular density, create a sinogram projected in one dimension at various angles from the average image with improved S / N ratio, By comparing with each other, each other's three-dimensional angle is estimated (lower left of FIG. 7).
すなわち、ここでは全周360度に関して角度を変え1次元に投影したシノグラムを用いて、相互に一致度の高い成分を検索する。粒子の投影方向の似た画像同士を重ね合わせて平均化する。その相互の値を3枚以上の平均化画像について求め、それぞれの平均化画像における粒子の相対方位角を推定する。それに基づいて、平均投影画像を3次元的に組み合わせることでノイズの少ない立体構造を再構成する(図7右下)。ノイズはランダムであり、同じ位置にはこないことから、多くの画像を重ね合わせる平均化によってS/N比はさらに向上される。 In other words, here, components having a high degree of coincidence are searched for using a sinogram projected in a one-dimensional manner by changing the angle with respect to the entire circumference of 360 degrees. The images with similar particle projection directions are overlapped and averaged. The mutual values are obtained for three or more averaged images, and the relative azimuth angle of the particles in each averaged image is estimated. Based on this, a three-dimensional structure with less noise is reconstructed by combining the average projected images three-dimensionally (lower right of FIG. 7). Since the noise is random and does not come to the same position, the S / N ratio can be further improved by averaging many images.
また、得られた複数の平均化画像は、再び参照画像として元画像の位置あわせに用いられ、さらに新たに改善された平均化画像を生み出す。このようなサイクルを所定の回数繰り返すことにより、S/N比がさらに高まる。 Further, the obtained plurality of averaged images are used again as a reference image for alignment of the original image, and a newly improved averaged image is generated. By repeating such a cycle a predetermined number of times, the S / N ratio is further increased.
単粒子解析法は、以上の手順で行われるものである。ところが、この方法においては、解析時に、対象粒子の平行移動画像および回転移動画像の作成が必要となる。また、これらの画像と参照画像との位置合わせとが必要である。これらのすべての処理を1台の端末で行おうとした場合、データ処理量が膨大すぎて、端末への負荷が大きく、解析に長時間を要する。また、この問題は、平均化画像の作成サイクルを複数回繰り返す場合には、さらに顕著となる。 The single particle analysis method is performed by the above procedure. However, in this method, it is necessary to create a parallel movement image and a rotation movement image of the target particle at the time of analysis. In addition, alignment between these images and the reference image is necessary. If all these processes are performed by a single terminal, the amount of data processing is too large, the load on the terminal is large, and analysis takes a long time. In addition, this problem becomes more prominent when the averaged image creation cycle is repeated a plurality of times.
そこで、本発明では、測定画像の回転移動画像を作成するのではなく、参照画像(リファレンス画像)の回転移動画像を複数のリファレンス画像について予め作成することにより、類似度の高い成分を検索する際に、対象粒子の回転移動画像を作成することを不要とした。また、複数のデータ処理部を有するデータ処理システムを用いる。そして、リファレンス画像の回転移動画像の取得と、類似度の評価の各処理について、複数の所定のデータ処理部にて分散処理を行う。これにより、局所的な負荷を軽減し、膨大なデータ処理を効率よく迅速に行うことが可能となった。以下、具体的な構成を説明する。 Therefore, in the present invention, instead of creating a rotationally moving image of a measurement image, a rotationally moving image of a reference image (reference image) is created in advance for a plurality of reference images, thereby searching for a component having high similarity. In addition, it is unnecessary to create a rotational movement image of the target particles. A data processing system having a plurality of data processing units is used. Then, distributed processing is performed by a plurality of predetermined data processing units for each process of obtaining a rotationally moving image of the reference image and evaluating the similarity. As a result, the local load is reduced, and a huge amount of data processing can be performed quickly and efficiently. A specific configuration will be described below.
図1は、本発明の実施形態に係る構造推定システムの基本構成を説明する図である。図1に示した構造推定システム100は、生体高分子等の立体構造を推定するシステムであって、ユーザ端末101と、スケジューラ103と、データ処理システム110とを含む。以下、生体高分子の立体構造を推定する場合を例に説明する。
FIG. 1 is a diagram illustrating a basic configuration of a structure estimation system according to an embodiment of the present invention. A
ユーザ端末101はユーザのサービス利用のリクエストを受け付けて、生体高分子の構造解析を要求する。スケジューラ103は、ユーザ端末101からの要求を受け付けて、データ処理端末群105にデータ処理を要求する。また、スケジューラ103は、データ処理に得られた情報に基づき生体高分子の構造を推定して、ユーザ端末に提示する。
The
データ処理システム110は、生体高分子の測定画像のデータを用いたデータ処理を行う。データ処理システム110は、複数のデータ処理端末から構成され、複数のリファレンスデータ記憶部113と複数のデータ処理部111とを含む。複数のリファレンスデータ記憶部111および複数のデータ処理部113は、それぞれ、所定の複数のデータ処理端末105に設けられている。
The
図1は、データ処理システム110が、データ処理端末105a〜データ処理端末105bの5台の端末から構成された例を示している。データ処理端末105a、データ処理端末105bおよびデータ処理端末105dは、データ処理部113およびリファレンスデータ記憶部111を備える。また、データ処理端末105cおよびデータ処理端末105eは、データ処理部113のみを備える。なお、図1には示していないが、構造推定システム100は、第二記憶部109を含まずリファレンスデータ記憶部111を含む端末を含んでいてもよい。
FIG. 1 shows an example in which the
構造推定システム100は、複数の画像から分子の立体構造を推定するシステムである。構造推定システム100では、観察方向の異なる複数の測定画像を用いて、試料の立体構造の再構築がなされる。立体構造の再構築の際に、測定画像より少ない数の複数のリファレンス画像が用いられる。複数の測定画像は、リファレンス画像とのマッチングにより、測定画像とリファレンス画像との類似度が評価される。測定画像は、最も類似度の高いリファレンス画像ごとに分類される。そして、同じリファレンス画像に分類された複数の測定画像が平均化されて、平均化画像が得られる。得られた平均化画像は新たなリファレンス画像として更新される。更新処理が繰り返されることにより、リファレンス画像の精度が向上する。所定の回数更新された複数のリファレンス画像を用いて、試料の立体構造が精度よく再構築される。
The
構造推定システム100では、上述した処理のうち、
(i)リファレンスデータセットの作成、および
(ii)測定画像とリファレンスデータセットとの類似度の評価
に関する処理が、複数のデータ処理部113に分配される。
In the
The processing related to (i) creation of a reference data set and (ii) evaluation of the degree of similarity between the measurement image and the reference data set is distributed to a plurality of
上記(i)において、リファレンスデータセットは、一つのリファレンスセットのデータである。一つのリファレンスセットは、一つのリファレンス画像と、当該リファレンス画像を所定のピッチで回転移動させた画像の群(回転移動画像群)とから構成される。一つのリファレンスデータセットは、一つのリファレンス画像のデータと、当該リファレンス画像の回転移動画像群のデータとから構成される。また、複数のリファレンスデータセットは、複数のリファレンスデータ記憶部111に分配される。
In (i) above, the reference data set is data of one reference set. One reference set is composed of one reference image and a group of images obtained by rotating the reference image at a predetermined pitch (rotation-moving image group). One reference data set includes data of one reference image and data of a rotationally moving image group of the reference image. The plurality of reference data sets are distributed to the plurality of reference
たとえば、図1では、リファレンス画像のデータref.a〜ref.iのそれぞれに対応するリファレンスデータセットref.seta〜ref.setiが作成される。たとえば、回転移動画像の回転角のピッチを1度とし、90度までの回転移動画像を作成する場合、
ref.seta:ref.a0(=ref.a)、ref.a1、ref.a2、・・・、ref.a90、
ref.setb:ref.b0(=ref.b)、ref.b1、ref.b2、・・・、ref.b90、
・・・
ref.seti:ref.i0(=ref.i)、ref.i1、ref.i2、・・・、ref.i90、
となり、各リファレンスセットは、91枚の画像のデータから構成される。データ処理端末105a、データ処理端末105b、およびデータ処理端末105dには、それぞれ、ref.seta〜c、ref.setd〜f、およびref.setg〜iが分配される。また、リファレンスデータセットの作成が、複数のデータ処理部113における分散処理により行われる。これにより、データ処理システム110の局所的な負荷を軽減し、複数のリファレンス画像のそれぞれに対応するリファレンスデータセットを効率よく作成することができる。
For example, in FIG. 1, reference image data ref. a to ref. i reference data sets ref. seta-ref. seti is created. For example, when the rotational angle pitch of a rotationally moving image is 1 degree and a rotationally moving image up to 90 degrees is created,
ref. seta: ref. a0 (= ref.a), ref. a1, ref. a2,... ref. a90,
ref. setb: ref. b0 (= ref.b), ref. b1, ref. b2, ..., ref. b90,
...
ref. seti: ref. i0 (= ref.i), ref. i1, ref. i2, ..., ref. i90,
Thus, each reference set is composed of data of 91 images. The
また、上記(ii)において、複数の測定画像は、一つの試料を複数の方向から見た画像の群である。複数の測定画像のデータのそれぞれについて、各リファレンス画像との類似度が評価される。類似度の評価は、測定画像のデータとリファレンスデータセットとの比較により行われる。このとき、複数のデータ処理部113に複数のリファレンス画像の担当を分散させることにより、類似度の評価を効率よく進めることができる。図1においては、データ処理端末105a、データ処理端末105b、データ処理端末105c、データ処理端末105dおよびデータ処理端末105eのそれぞれに、ref.a〜b、ref.c〜d、ref.e〜f、ref.g〜h、およびref.iが担当として割り当てられている。各データ処理端末は、複数の測定画像のそれぞれについて、割り当てられたリファレンスセットとのマッチングを行う。
In the above (ii), the plurality of measurement images are a group of images obtained by viewing one sample from a plurality of directions. The degree of similarity with each reference image is evaluated for each of the data of the plurality of measurement images. The evaluation of the similarity is performed by comparing the measurement image data with the reference data set. At this time, by assigning a plurality of reference images to a plurality of
図2は、図1に示した構造推定システム100の構成を示す機能ブロック図である。また、図3は、構造推定システム100のスケジューラ103およびデータ処理端末105の詳細構造を示す機能ブロック図である。以下、図2および図3を参照して、構造推定システム100の構成をさらに詳細に説明する。
FIG. 2 is a functional block diagram showing the configuration of the
構造推定システム100は、ユーザ端末101と、スケジューラ103と、データ処理システム110とがネットワーク115により接続されたシステムである。
The
ユーザ端末101は、第一記憶部107および第一送受信部117を有する。第一記憶部107には、試料のcryo−TEM画像の測定データが格納されている。
The
データ処理端末105は、データ処理端末群を構成する端末である。図2では、データ処理システム110がリファレンスデータ記憶部111とデータ処理部113とを両方備えるデータ処理端末105を3つ含む場合が例示されているが、複数のリファレンスデータ記憶部111と複数のデータ処理部113とを含むデータ処理システム110であれば、データ処理端末105の数は特に限定されない。データ処理端末105は、第二送受信部119、データ処理部113およびリファレンスデータ記憶部111を備える。リファレンスデータ記憶部111は、第二記憶部109(図3)中に設けられている。
The
第二送受信部119は、ネットワーク115を介して測定画像データ、リファレンスデータ、データ処理結果等の送受信を行う。
The second transmission /
データ処理部113は、複数の測定画像のそれぞれについて、測定画像のデータまたは測定画像を平行移動させてなる平行移動画像のデータと、割り当てられた前記リファレンス画像のデータと当該リファレンス画像を回転移動させてなる回転移動画像の群のデータとから構成されるリファレンスデータセットと、を比較して、測定画像と割り当てられたリファレンス画像との類似度を評価する処理を行う。また、リファレンス画像が更新された際には、データ処理部113に更新リファレンス画像が割り当てられる。そして、データ処理部113は、測定画像と割り当てられた更新リファレンス画像との類似度を評価する処理を行う。
The
データ処理部113は、平行移動画像取得部141、リファレンスデータセット取得方法選択部143、リファレンスデータセット取得部145、類似度パラメータ付与部147、および平均化処理部149を備える。
The
平行移動画像取得部141は、測定画像のデータを面内の所定の方向に平行移動させた画像のデータを取得する。平行移動画像取得部141は、平行移動画像情報記憶部135に格納された算出式を参照して、たとえば、X軸方向およびY軸方向のそれぞれについて測定画像を所定のピッチで平行移動させた平行移動画像の群のデータを作成し、測定画像の識別子と関連づけて平行移動画像情報記憶部135に保存する。
The translation image acquisition unit 141 acquires image data obtained by translating the measurement image data in a predetermined direction in the plane. The translation image acquisition unit 141 refers to the calculation formula stored in the translation image
リファレンスデータセット取得方法選択部143は、リファレンスデータセット取得部145におけるリファレンスデータセットの取得方法を選択する。たとえば、ネットワーク115を介して他のデータ処理端末105と通信し、通信時間に応じて第二記憶部109に格納されたリファレンスデータセットを取得するか、自身のリファレンスデータセット取得部145において回転移動画像のデータおよびリファレンスデータセットを作成するかのいずれかを選択する。
The reference data set acquisition
リファレンスデータセット取得部145は、リファレンスデータセットを取得する。たとえば、データ処理端末群を構成するデータ処理端末105中のリファレンスデータセット記憶部139に保存されたデータを取得する。または、スケジューラ103から分配されたリファレンス画像のデータに基づき、リファレンスデータセット取得部145にて回転移動画像群のデータを作成し、作成した回転移動画像群のデータと回転前のリファレンス画像のデータとをリファレンス画像の識別子に関連づけてリファレンスデータセットとし、リファレンスデータセット記憶部139に格納する。
The reference data
類似度パラメータ付与部147は、測定画像のデータおよびその平行移動画像のデータとリファレンスデータセットとの位置合わせを行う。また、これらを比較して、リファレンス画像のデータと測定画像のデータとの類似度を示す類似度パラメータを算出する。類似度パラメータを算出する際に、既知の方法を用いてリファレンス画像のデータおよび測定画像のデータのベクトル化処理を行ってもよい。このとき、類似度パラメータは、ベクトル化されたリファレンス画像のデータと測定画像のデータとの内積を計算することにより取得される。また、内積を反映するパラメータを算出して類似度パラメータとしてもよい。内積を算出する際に、各画像を構成するn×nのデータマトリックスを対角化処理してもよい。また、測定画像のデータのS/N比が低い場合、類似度パラメータの算出に先立ち、既知の方法によるフィルタリングを行ってもよい。得られた類似度パラメータを測定画像の識別子に関連づけて類似度情報記憶部151に格納する。
The similarity
平均化処理部149は、リファレンス画像ごとに、当該リファレンス画像に対して高い類似度(最適類似度)を有すると分類された複数の測定画像のデータを平均化処理する。平均化により得られたデータは、平均化情報記憶部153に格納されるとともに、第二送受信部119を介してスケジューラ103に送出される。
For each reference image, the averaging
なお、平均化処理部149における平均化処理の方法として、たとえば、n×nのマトリックスの各ドットごとに、複数の測定画像のデータの算術平均を求める方法が挙げられる。また、平均化処理が、ノイズ除去の処理を含んでいてもよい。ノイズ除去の処理として、たとえば、ノイズを近似的に白色ノイズ化して除去するノイズアベレージングが挙げられる。
An example of the averaging processing method in the averaging
第二記憶部109は、測定データ記憶部131、リファレンスデータ記憶部111、類似度情報記憶部151および平均化情報記憶部153を含む。
The
測定データ記憶部131は、測定画像データ記憶部133と平行移動画像情報記憶部135とから構成される。
The measurement data storage unit 131 includes a measurement image data storage unit 133 and a parallel movement image
測定画像データ記憶部133には、測定画像のデータが格納される。測定画像のデータは、スケジューラ103から提示される測定画像データの分配情報に基づき取得される。平行移動画像情報記憶部135には、測定画像のデータを平行移動画像のデータに変換する変換式が記憶されている。通常、一つの測定データから複数の平行移動画像の群のデータが作成される。また、平行移動画像情報記憶部135に、作成された平行移動画像のデータが記憶されてもよい。
The measurement image data storage unit 133 stores measurement image data. The measurement image data is acquired based on the distribution information of the measurement image data presented from the
リファレンスデータ記憶部111は、リファレンス画像データ記憶部137およびリファレンスデータセット記憶部139を含む。
The reference
データ処理システム110の複数のリファレンス画像データ記憶部137には、複数のリファレンス画像のデータが分散される。また、リファレンス画像が更新された際には、複数の平均化画像のデータが更新リファレンス画像として再分配される。なお、リファレンスデータの更新処理の詳細については後述する。
In the plurality of reference image data storage units 137 of the
リファレンスデータセット記憶部139には、分配されたリファレンス画像より取得されるリファレンスセットのデータすなわちリファレンスデータセットがリファレンス画像データの識別子に関連づけられて記憶される。リファレンスセットは、リファレンス画像をたとえば1度のピッチで0度〜360度回転移動させた画像の群である。なお、0度回転移動させた画像は、もとのリファレンス画像に対応する。リファレンス画像の回転角度は、少なくとも0度〜90度の範囲とすることが好ましい。このとき、リファレンスデータセットが、リファレンス画像のデータと、リファレンス画像を0度から90度まで回転させた回転移動画像群のデータとを含む。0度〜90度の回転データを予め作成しておけば、360度までの回転画像をすべて記憶する場合に比べてデータ量を顕著に減少させることができる。また、4回対称に対応する0度〜90度の回転データを予め作成しておけば、X軸方向またはY軸方向についての符号反転により、測定画像とリファレンス画像との類似度を評価する際に必要となる0度〜360度回転画像のデータを後処理で容易に取得することができる。また、回転画像のピッチ角は、たとえば5度以下とし、さらに具体的には1度とする。こうすれば、測定データとリファレンスデータセットとの類似度の評価精度を向上させることができる。 In the reference data set storage unit 139, reference set data acquired from the distributed reference image, that is, a reference data set is stored in association with the identifier of the reference image data. The reference set is a group of images obtained by rotating the reference image by 0 ° to 360 °, for example, at a pitch of 1 °. Note that the image rotated by 0 degrees corresponds to the original reference image. The rotation angle of the reference image is preferably in the range of at least 0 degrees to 90 degrees. At this time, the reference data set includes reference image data and data of a rotationally moving image group obtained by rotating the reference image from 0 degrees to 90 degrees. If rotation data of 0 to 90 degrees is created in advance, the amount of data can be significantly reduced as compared with the case where all rotated images up to 360 degrees are stored. In addition, if rotation data of 0 to 90 degrees corresponding to four-fold symmetry is created in advance, the similarity between the measurement image and the reference image is evaluated by sign inversion in the X-axis direction or the Y-axis direction. Therefore, it is possible to easily acquire the data of the 0 degree to 360 degree rotated image necessary for the post-processing. The pitch angle of the rotated image is, for example, 5 degrees or less, and more specifically, 1 degree. In this way, it is possible to improve the evaluation accuracy of the similarity between the measurement data and the reference data set.
類似度情報記憶部151は、リファレンス画像のデータと測定度のデータとの類似度を示すパラメータを算出する算出式を記憶する。
The similarity
平均化情報記憶部153は、リファレンス画像ごとに、当該リファレンス画像に対して最も高い類似度を有すると分類された測定画像のデータを平均化する際の計算式を記憶する。
The averaged
スケジューラ103は、第三送受信部121、演算部123および第三記憶部129を有する。
The
演算部123は、データ処理部選択部155、測定データ分類部157、および構造推定部125を有する。
The
データ処理部選択部155は、複数のデータ処理部113の稼働状態に基づいて、類似度を評価する処理について複数のリファレンス画像が割り当てられる複数のデータ処理部113を選択する。また、データ処理部選択部155は、リファレンスデータセットを取得する複数のデータ処理部113をさらに選択する。
The data processing
つまり、データ処理部選択部155は、前述した
(i)リファレンスデータセットの作成、および
(ii)測定画像とリファレンスデータセットとの類似度の評価
に関するデータ処理を担当するデータ処理部113を選択する。このとき、データ処理部選択部155は、たとえば、各データ処理部113の負荷を検知し、負荷の軽い前記データ処理部113を選択する。また、データ処理端末105のCPU占有率のデータを取得したり、稼働状態の情報を取得してもよい。また、データ処理部選択部155が、データ処理部113との通信に要する時間のデータを取得して、短時間でデータの送信が可能なデータ処理端末105のデータ処理部113を選択することもできる。
That is, the data processing
測定データ分類部157は、類似度を評価する処理の結果に基づいて、複数のリファレンス画像のいずれかに複数の測定画像を対応づける。具体的には、測定データ分類部157は、類似度パラメータを付与された測定画像のデータを取得し、複数の測定画像のそれぞれについて、最も一致度の高いリファレンス画像を選択し、このリファレンス画像の識別子と測定画像の識別子とを対応づけた分類データを作成し、演算情報記憶部163に格納する。また、リファレンスの更新の際には、類似度を評価する処理の結果に基づいて、複数の更新リファレンス画像のいずれかに複数の前記測定画像を対応づける。
The measurement
構造推定部125は、平均化処理部149にて作成された更新後の複数のリファレンス画像に基づき、解析対象の膜タンパク質の立体構造を再構成する。このとき、構造推定部125は、測定データ分類部157にて同じ前記リファレンス画像に対応づけられた複数の測定画像を平均化して得られる平均化画像のデータを複数のリファレンス画像について取得し、取得した複数の平均化画像に基づき分子の立体構造を推定する。また、構造推定部125は、演算情報記憶部163に格納された演算式を参照して複数の平面画像のデータに基づき立体画像のデータを作成してもよい。さらに、リファレンスの更新の際には、構造推定部125は、測定データ分類部157にて同じ更新リファレンス画像に対応づけられた複数の測定画像を平均化して得られる平均化画像のデータを複数の更新リファレンス画像について取得し、取得した複数の平均化画像に基づき分子の立体構造を推定する。
The
第三記憶部129は、リファレンス情報記憶部159、測定データ配置情報記憶部161および演算情報記憶部163を有する。
The
リファレンス情報記憶部159は、リファレンスデータに関する情報を記憶する。リファレンス情報記憶部159は、イニシャルリファレンスデータ記憶部(不図示)と、リファレンス分配情報記憶部(不図示)を備える。イニシャルリファレンスデータ記憶部は、構造推定の際に最初のリファレンスとして用いる複数のイニシャルリファレンス画像のデータが格納されている。また、リファレンス分配情報記憶部は、複数のリファレンスデータセットの分配状況に関する情報を記憶する。リファレンス分配情報記憶部には、どのデータ処理端末105のデータ処理部113にどのリファレンスセットが記憶されているかの対応付け情報が格納されている。具体的には、データ処理端末105の識別子とリファレンスセットの識別子とが関連づけて記憶されている。
The reference
測定データ配置情報記憶部161は、測定データの配置場所に関する情報を記憶する。測定データは、たとえばユーザ端末101に記憶されている。
The measurement data arrangement
演算情報記憶部163は、測定データ分類部157にて作成された分類データを記憶する。また、構造推定部125における演算に用いる演算式が格納されていてもよい。また、演算情報記憶部163には、更新回数に関する情報が記憶されていてもよい。更新回数に関する情報は、たとえば、リファレンスデータの必要な更新回数を試料の種類を示す識別子に対応づけたものである。
The calculation
次に、構造推定システム100を用いた構造推定手順を説明する。構造推定は、図7を参照して前述した単粒子解析法に基づき行われる。前述した(i)(ii)のデータ処理が、それぞれ、複数のデータ処理部113による分散処理により行われる。
Next, a structure estimation procedure using the
構造推定システム100を用いた構造推定の手順は、以下の4つの段階に大きく分けられる。
(1)構造解析要求〜リファレンスデータセット作成
(2)測定データとリファレンスデータセットとの比較〜リファレンスの更新
(3)繰り返し
(4)構造推定
以下、それぞれの段階について、適宜図1〜図3、図5および図6を参照しながら説明する。図5は、スケジューラ103およびデータ処理端末105における解析手順を示す図である。図6は、図5の手順のうち、リファレンスデータセットの取得の手順を詳細に示す図である。
The structure estimation procedure using the
(1) Structural analysis request-creation of reference data set (2) Comparison between measurement data and reference data set-update of reference (3) repetition (4) structure estimation Hereinafter, for each stage, FIGS. This will be described with reference to FIGS. FIG. 5 is a diagram showing an analysis procedure in the
(1)構造解析要求〜リファレンスデータセット作成
まず、ユーザ端末101は、ユーザのリクエストを受け付けて、複数の測定画像に基づく前記分子の構造解析を要求する。すると、図5に示したように、スケジューラ103は、ユーザ端末101の構造解析のリクエストを受け付けて(S101)、複数のデータ処理端末105から構成されるデータ処理システム110にデータ処理を要求する。このとき、スケジューラ103は、各データ処理端末105に稼働状況を問い合わせる(S103)。各データ処理端末からの報告(S201)を踏まえ、スケジューラ103は、リファレンスデータセットの取得を行う端末を決定し(S105)、該当端末に、イニシャルリファレンスデータを配布する。また、スケジューラ103は、測定画像のデータ処理を行う端末を決定し(S105)、該当端末に、測定画像のデータの分配状況に関する情報を送出して、データ処理システム110に含まれる複数のリファレンスデータ記憶部111に、複数のリファレンス画像のデータを分配させる。リファレンス画像のデータが分配された複数のリファレンスデータ記憶部111においては、自身に分配されたリファレンス画像について、リファレンスデータセットを取得する。
(1) Structural Analysis Request to Reference Data Set Creation First, the
以下においては、まず、図6および図1を参照して、リファレンスデータセットの取得手順について説明する。その後、図5にもどり、測定画像のデータ処理の手順について説明する。 In the following, first, a reference data set acquisition procedure will be described with reference to FIGS. 6 and 1. Thereafter, returning to FIG. 5, the procedure of the data processing of the measurement image will be described.
図6に示したように、スケジューラ103は、データ処理端末105の稼働状況を確認し(S151)、データ処理端末105から報告される稼働状況(S251)に応じて、リファレンスデータの配布端末およびリファレンスデータの作成端末を決定する(S153、S157)。リファレンスデータが配布されるデータ処理端末105はリファレンスデータ記憶部111を有し、リファレンスデータの作成を担当する端末は、データ処理部113を有する。
As shown in FIG. 6, the
次に、スケジューラ103は、リファレンスデータの配布端末に複数の初期のリファレンスデータ(イニシャルリファレンスデータ)を分配する(S155)。このとき、スケジューラ103は、データ処理端末105と通信して、データ処理端末105から報告される稼働状況を確認しながら、イニシャルリファレンスデータの受信速度に応じてデータ処理端末105にイニシャルリファレンスデータを配布する(S155)。たとえば、スケジューラ103は一つのデータ処理端末105に対し複数回に分けてイニシャルリファレンスデータを送信する。なお、スケジューラ103は、リファレンスデータ記憶部111を有する複数のデータ処理端末105のうちの一部にリファレンスデータを配布してもよい。また、スケジューラ103は、一つのリファレンスデータを複数のデータ処理端末105のリファレンスデータ記憶部111に配布してもよい。
Next, the
たとえば図1では、リファレンスデータを配布する端末として、リファレンスデータ記憶部111を有するデータ処理端末105a、データ処理端末105bおよびデータ処理端末105dが選出されている。スケジューラ103は、データ処理端末105aにref.a〜cを配布し、データ処理端末105bにref.d〜fを配布し、データ処理端末105dにref.g〜iのデータを配布する。
For example, in FIG. 1, a
また、ステップ155において、データ処理部113を有するデータ処理端末105に、リファレンスデータセットの作成を要求する(S159)。たとえば図1では、データ処理端末105aにref.a〜ref.cのそれぞれのリファレンスデータセットの作成を要求し、データ処理端末105bにref.d〜ref.fのリファレンスデータセットの作成を要求し、データ処理端末105dにref.g〜ref.iのリファレンスデータセットの作成を要求する。
In
リファレンスデータセットの作成のリクエストを受け付けたデータ処理端末105は、リファレンスデータセット取得方法選択部143にてリファレンスデータセットの取得方法を選択する(S255)。リファレンスデータセット取得部145は、選択された方法で回転移動画像のデータおよびリファレンスデータセットを作成し(S261)、リファレンスデータセット記憶部139に格納する。たとえば、リファレンスデータセット取得部145は、リファレンス画像データ記憶部137に格納されたリファレンス画像のデータを取得して(S257)、それぞれについてたとえば1度ピッチで1度から360度まで回転させた回転移動画像群のデータを作成し(S259)。そして、回転移動画像群のデータとゼロ度回転させた像つまりリファレンス像のデータとを含むリファレンスデータセットを作成する(S261)。
The
なお、ステップ259において、360度までの回転移動像群のデータを作成せずに、たとえば90度までの回転移動像群のデータを作成することもできる。このとき、後述する類似度パラメータの算出の手順において、90度までの回転移動像群のデータの符号反転により、360度までの回転移動像群のデータを作製することができる。よって、ステップ159におけるリファレンスデータセットの作成量およびリファレンスデータセット記憶部139に保存されるデータ量を減少させて、リファレンスデータセットの作成処理を迅速化するとともに、類似度パラメータにおける算出処理についても効率よく行うことができる。
Note that in
図1および図3に示した例では、たとえばデータ処理端末105aのデータ処理部113が、自身のリファレンス像データ記憶部137に記憶されたref.a〜ref.cを参照し、それぞれのリファレンス像について、回転移動画像群を作成する。リファレンスデータセットとしてref.setaおよびref.setbを得る。得られたリファレンスデータセットは、自身のリファレンスデータセット記憶部139に保存される。データ処理端末105bおよびデータ処理端末105dについても、データ処理端末105aと同様の方法を用いてリファレンスデータセットが作成される。
In the example shown in FIG. 1 and FIG. 3, for example, the
なお、データ処理端末105は必ずしも自身のリファレンスデータ記憶部111に記憶されたリファレンスのリファレンスデータセットを作成しなくてもよく、スケジューラ103は、リファレンスデータセットの作成対象となるリファレンス画像および当該リファレンス画像のデータの配置状況を、リファレンスデータセットの作成端末に送出してもよい。こうすれば、データ処理端末105の稼働状況に応じてリファレンスデータセットの作成をさらに迅速に行うことができる。
Note that the
(2)測定データとリファレンスデータセットとの比較〜リファレンスの更新
図5に戻り、スケジューラ103は、データ処理システム110に含まれる複数のデータ処理部113に、複数の測定画像と複数のリファレンス画像との類似度を評価する処理を割り当てる。そして、スケジューラ103は、測定画像のデータ処理を行うデータ処理端末105に、測定データ配置情報記憶部161に記憶された測定データの配置情報と、データ処理対象となるリファレンス画像の識別子とを提示して、データ処理を要求する(S107)。たとえば、図1の例では、データ処理端末105a〜データ処理端末105eに、それぞれ、ref.a〜b、ref.c〜d、ref.e〜f、ref.g〜hおよびref.iに関するデータ処理を要求する。リクエストを受け付けたデータ処理端末105は、提示された測定データ配置情報を取得する(S203)。
(2) Comparison of Measurement Data and Reference Data Set to Reference Update Returning to FIG. 5, the
各データ処理端末は、担当のリファレンス画像のリファレンスデータセットをイニシャルリファレンスとして取得する(S205)。取得方法は、図6を参照して前述した通りであり、データ処理端末105は、自身でリファレンスデータセットを作成してもよいし、担当のリファレンス画像のリファレンスデータセットのデータが記憶された他の端末のリファレンスデータ記憶部111からデータを取得してもよい。また、他のデータ処理端末105と通信してみて、応答時間から、リファレンスデータセットの受信に要する時間と自身で作成した場合に要する時間とを比較して、自身で作成するかどうかを判断してもよい。他のデータ処理端末105からリファレンスデータセット取得する場合であって、複数のデータ処理端末105に対象のリファレンスセットのデータが保存されている場合には、どのデータ処理端末105からデータを取得するのが最も速いかについてもあわせて判断する。また、図1のデータ処理端末105aのように、自身のリファレンスデータ記憶部111に、対象のリファレンスのリファレンスデータセットが保存されている場合には、これを取得して用いることができる。
Each data processing terminal acquires a reference data set of a reference image in charge as an initial reference (S205). The acquisition method is as described above with reference to FIG. 6, and the
また、データ処理端末105は、類似度パラメータ付与部147にて、測定データ配置情報に基づき測定データを取得する(S207)。たとえば測定データがユーザ端末101の第一記憶部107に格納されている場合、格納された測定データを取得する。また、データ処理端末105は、測定データの平行移動画像を取得する(S209)。このとき、データ処理端末105は、測定画像データ記憶部133に格納された測定データおよび平行移動画像情報記憶部135に格納された演算式を参照して自身で平行移動画像のデータを作成してもよい。また、自身の測定画像データ記憶部133または他の端末に格納された平行移動画像のデータを取得してもよい。
In addition, the
そして、データ処理端末105は、測定画像のデータまたは測定画像を平行移動させてなる平行移動画像のデータと、割り当てられたリファレンス画像のデータとリファレンス画像を回転移動させてなる回転移動画像の群のデータとから構成されるリファレンスデータセットと、を比較して、測定画像と割り当てられたリファレンス画像との類似度を評価する処理を行う。データ処理端末105は、担当のリファレンスのリファレンスデータセットと、測定データおよびその平行移動画像とを比較して、測定データとリファレンスとの類似度を示すパラメータを算出し、測定データの識別子、リファレンスの識別子および類似度パラメータとを互いに関連づけて類似度情報記憶部151に格納するとともに、スケジューラ103に送信する(S211)。
Then, the
スケジューラ103は、類似度を評価する処理の結果に基づいて、複数の測定画像を、それぞれ、複数のリファレンス画像のいずれかに対応づける。このとき、スケジューラ103は、各データ処理端末105から送出された類似度パラメータの付与された測定データを取得し(S109)、各測定データについて、類似度の最も高いリファレンスを抽出し、測定データの識別子に分類パラメータを付与して演算情報記憶部163に格納するとともに、データ処理端末105に送出する(S111)。分類パラメータは、たとえば、類似度の最も高いリファレンス画像の識別子とする。
The
データ処理端末105は、分類パラメータが付与されたリファレンス画像のデータを取得する(S213)。そして、平均化処理部149において、類似度の最も高いリファレンス画像の識別子が付与された複数の測定画像のデータを参照し、同じリファレンスに対応づけられている測定画像を平均化する(S215)。そして、平均化により得られた平均化画像のデータを、新たなリファレンス画像のデータとしてリファレンス画像データ記憶部137を更新する(S217)。
The
(3)繰り返し
以上の手順のうち、ステップ205のリファレンスデータセットの取得から、ステップ217のリファレンス更新までのステップを、所定の回数繰り返して行う(S219のYES)。
(3) Repeat In the above procedure, the steps from the acquisition of the reference data set in
(4)構造推定
リファレンスの更新を所定の回数繰り返して行った後(S219のNO)、データ処理端末105は、更新後のリファレンス画像のデータをスケジューラ103に提示する(S221)。そして、スケジューラ103は、複数のリファレンス画像のいずれかに対応づけられた複数の測定画像を平均化して得られる複数の平均化画像のデータを取得して、平均化画像のデータに基づいて、分子の立体構造を推定する。このとき、構造推定部125は、演算情報記憶部163に格納された演算式および取得したリファレンス画像のデータに基づき、解析対象の膜タンパク質の立体構造の推定データを作成し(S113)、ユーザ端末101に提示する(S115)。
(4) Structure estimation After updating the reference repeatedly a predetermined number of times (NO in S219), the
本実施形態によれば、単粒子解析法により生体高分子の立体構造を推定する際に、複数のリファレンス画像とその回転移動画像群とからなるリファレンスセットのデータ(リファレンスデータセット)を予め複数のリファレンスデータ記憶部111に保存しておく。従来は、このようなリファレンスデータセットを予め作成しておかずに、測定画像の平行移動画像とそれぞれに対応する回転移動画像を作成し、リファレンス画像との位置合わせを行うとともに、これらの類似度を評価していた。このため、データ処理の負荷が高く、データ処理を行う端末に負荷が集中し、解析に長時間を要していた。これに対し、本実施形態では、予めデータ処理システム110がリファレンスセットのデータを保有しているため、類似度パラメータの算出が容易であり、測定画像を回転移動させながら類似度の評価を行う必要がない。このため、データ処理を効率よく迅速に行うことができる。また、ユーザ端末101がデータ処理部を有しない場合にも、ネットワーク115を介して構造推定を要求し、解析結果を迅速に取得することができる。
According to this embodiment, when estimating the three-dimensional structure of a biopolymer by a single particle analysis method, reference set data (reference data set) composed of a plurality of reference images and a rotationally moving image group is preliminarily stored. It is stored in the reference
さらに、本実施形態では、リファレンスデータセットの作成を、複数のデータ処理部113による分散処理により行うとともに、リファレンスデータセットと測定画像のデータとを比較する際にも、複数のデータ処理部113による分散処理がなされる。このため、データ処理システム110内の所定のデータ処理部113の負荷が集中するのを抑制し、リファレンスセットの作成処理を効率よく迅速に行うことができる。
Furthermore, in the present embodiment, the reference data set is created by distributed processing by the plurality of
また、スケジューラ103は、データ処理部選択部155を有する。このため、データ処理部選択部155において、ネットワーク上の距離の近いデータ処理端末105、負荷の軽いデータ処理部113を有するデータ処理端末105、通信のバンド幅の広いデータ処理端末105等を選択して、分散処理を要求したり、データ配布を行ったりすることができる。また、同じデータ処理端末105のリファレンスデータ記憶部111に記憶されたリファレンスデータセットとの比較を当該データ処理端末105のデータ処理部113に要求することもできる。このため、処理速度をさらに向上させることができる。
In addition, the
このように、構造推定システム100では、データ処理において負荷の大きい前述の
(i)リファレンスデータセットの作成、および
(ii)測定画像とリファレンスデータセットとの類似度の評価
のそれぞれの処理について、複数のデータ処理部113による分散処理を適用する。複数のデータ処理端末105にリファレンス画像のデータを分配する。また、複数のデータ処理端末105にて分担してリファレンス画像のリファレンスデータセットを作成する。このため、ユーザ端末101や特定のデータ処理端末105に負荷がかからないようにして、大量の測定データおよび大量のリファレンスデータセットを用いたデータ処理を効率よく迅速に行うことができる。
As described above, in the
また、本実施形態では、リファレンスデータセットと測定画像とのデータの類似度を評価して、類似度パラメータを測定画像の識別子に付与することにより、複数の測定データを、最も類似度の高いリファレンス画像の識別子に効率よく関連づけて分類することができる。このため、測定方向の異なる複数の測定画像を用いた解析を効率よく行うことができる。 Further, in the present embodiment, the similarity between the reference data set and the measurement image is evaluated, and a similarity parameter is assigned to the identifier of the measurement image, so that a plurality of measurement data is referred to as the reference having the highest similarity. It is possible to classify in association with an image identifier efficiently. For this reason, analysis using a plurality of measurement images having different measurement directions can be efficiently performed.
また、本実施形態では、リファレンスごとに分類された測定データを平均化して得られた平均化画像を新たなリファレンス画像として更新し、更新処理を繰り返し行う。このため、膜タンパク質のように、従来の方法では結晶化が困難であるために、立体構造の解析データの蓄積が進んでいない試料に対しても、所定の画像をイニシャルリファレンスとして用いて更新作業を繰り返し行うことにより、リファレンス画像を実画像に近づけることが可能である。また、構造推定システム100は、たとえば、膜タンパク質以外の生体高分子の解析にも効果的に用いることができる。たとえば、構造推定システム100を多糖類や糖タンパク質の立体構造の解析に用いてもよい。
In this embodiment, the averaged image obtained by averaging the measurement data classified for each reference is updated as a new reference image, and the update process is repeated. For this reason, it is difficult to crystallize using conventional methods, such as membrane proteins, so even for samples for which three-dimensional structure analysis data has not accumulated, update work using a predetermined image as an initial reference. By repeating the above, it is possible to bring the reference image closer to the actual image. In addition, the
(第二の実施形態)
第一の実施形態においては、リファレンスデータセット取得方法選択部143がデータ処理端末105に設けられた構成を例示したが、図2に示した構造推定システム100において、リファレンスデータセット取得方法選択部143がスケジューラ103に設けられた構成としてもよい。本実施形態では、かかる構成について説明する。
(Second embodiment)
In the first embodiment, the configuration in which the reference data set acquisition
図4は、本実施形態の構造推定システムのスケジューラ103およびデータ処理端末105の詳細を示す機能ブロック図である。図4においては、スケジューラ103がリファレンスデータセット取得方法選択部143を含み、複数のデータ処理部113が、リファレンスデータセット取得部145におけるリファレンスデータセットの取得方法を選択するリファレンスデータセット取得方法選択受付部165を含む。
FIG. 4 is a functional block diagram showing details of the
本実施形態では、スケジューラ103のリファレンスデータセット取得方法選択部143がデータ処理端末105の稼働状況を把握して、リファレンスデータセットの取得方法を選択する。そして、データ処理を行うデータ処理端末105に、取得方法の情報が提示される。データ処理端末105は、リファレンスデータセット取得方法選択受付部165にて取得方法の情報を受け付ける。リファレンスデータセット取得部145は、リファレンスデータセット取得方法選択受付部165にて受け付けた取得方法に基づきリファレンスデータセットを取得または作成する。
In this embodiment, the reference data set acquisition
本実施形態では、スケジューラ103がデータ処理端末群全体の稼働状況を把握して、データ処理を行うデータ処理端末105にリファレンスデータセットの取得方法を指示するため、システム全体におけるリファレンスデータセットの取得動作をさらに効率よく行うことができる。
In this embodiment, the
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。 As mentioned above, although embodiment of this invention was described with reference to drawings, these are the illustrations of this invention, Various structures other than the above are also employable.
たとえば、以上の実施形態では、平均化処理部149がデータ処理端末105に設けられた場合を例に説明したが、スケジューラ103が平均化処理部149を有していてもよい。また、スケジューラ103とデータ処理端末105の両方に平均化処理部149が設けられていてもよい。このとき、スケジューラ103が、データ処理端末105の稼働状況を確認し、データ処理端末105に平均化処理を行わせるか自身の平均化処理部149にて平均化処理を行うかどうかを判断する平均化処理方法判断部を有していてもよい。
For example, in the above embodiment, the case where the averaging
また、以上の実施形態において、スケジューラ103が複数の端末装置から構成されており、各機能ブロックが複数の端末装置に分散して配置されていてもよい。また、ユーザ端末101が複数の端末から構成されている態様とすることもできる。
Further, in the above embodiment, the
また、以上の実施形態において、解析対象物質は一分子から構成されていてもよいし、複数の分子が超分子構造を形成してなるものであってもよい。 In the above embodiment, the substance to be analyzed may be composed of a single molecule, or a plurality of molecules may form a supramolecular structure.
100 構造推定システム
101 ユーザ端末
103 スケジューラ
105 データ処理端末群
105a データ処理端末
105b データ処理端末
105c データ処理端末
105d データ処理端末
105e データ処理端末
107 第一記憶部
109 第二記憶部
111 リファレンスデータ記憶部
113 データ処理部
115 ネットワーク
117 第一送受信部
119 第二送受信部
121 第三送受信部
123 演算部
125 構造推定部
127 測定データ分類部
129 第三記憶部
131 測定データ記憶部
133 測定画像データ記憶部
135 平行移動画像情報記憶部
137 リファレンス画像データ記憶部
139 リファレンスデータセット記憶部
141 平行移動画像取得部
143 リファレンスデータセット取得方法選択部
145 リファレンスデータセット取得部
147 類似度パラメータ付与部
149 平均化処理部
151 類似度情報記憶部
153 平均化情報記憶部
155 リファレンスデータ更新部
157 測定データ分類部
159 リファレンス情報記憶部
161 測定データ配置情報記憶部
163 演算情報記憶部
165 リファレンスデータセット取得方法選択受付部
DESCRIPTION OF
Claims (11)
ユーザのリクエストを受け付けて、前記分子の複数の測定画像に基づく構造解析を要求するユーザ端末と、
複数のデータ処理端末から構成されるデータ処理システムと、
前記ユーザ端末からの要求を受け付けて、前記データ処理システムにデータ処理を要求するスケジューラと、
がネットワークを介して接続されており、
前記データ処理システムが、
複数のリファレンス画像のデータが分配される複数のリファレンスデータ記憶部と、
複数のデータ処理部と、
を含み、
前記データ処理部の各々が、前記スケジューラからの前記データ処理の要求に応じて、複数の前記測定画像のそれぞれについて、前記測定画像のデータまたは前記測定画像を平行移動させてなる平行移動画像のデータと、自己に割り当てられた前記リファレンス画像のデータと当該リファレンス画像を回転移動させてなる回転移動画像の群のデータとから構成されるリファレンスデータセットと、を比較して、前記測定画像と割り当てられた前記リファレンス画像との類似度を評価する処理を行い、
前記スケジューラが、
類似度を評価する前記処理の結果に基づいて、複数の前記リファレンス画像のいずれかに複数の前記測定画像を対応づける測定データ分類部と、
前記測定データ分類部にて同じ前記リファレンス画像に対応づけられた複数の前記測定画像を平均化して得られる平均化画像のデータを複数の前記リファレンス画像について取得し、取得した複数の前記平均化画像に基づき前記分子の前記立体構造を推定する構造推定部と、
を含む構造推定システム。 A system for estimating the three-dimensional structure of a molecule from data of a plurality of images,
A user terminal that accepts a user request and requests a structural analysis based on a plurality of measurement images of the molecule;
A data processing system comprising a plurality of data processing terminals;
A scheduler that accepts a request from the user terminal and requests data processing from the data processing system;
Are connected via a network,
The data processing system is
A plurality of reference data storage units to which data of a plurality of reference images are distributed;
A plurality of data processing units;
Including
Each of the data processing units translates the measurement image data or the translation image data obtained by translating the measurement image for each of the plurality of measurement images in response to the data processing request from the scheduler. And a reference data set composed of data of the reference image assigned to itself and data of a group of rotationally moving images obtained by rotating and moving the reference image, and assigned to the measurement image. There line processing for evaluating the similarity between the reference image,
The scheduler
A measurement data classifying unit that associates a plurality of the measurement images with any one of the plurality of reference images based on the result of the processing for evaluating the similarity;
The averaged image data obtained by averaging the plurality of measurement images associated with the same reference image in the measurement data classifying unit is acquired for the plurality of reference images, and the plurality of averaged images acquired A structure estimation unit for estimating the three-dimensional structure of the molecule based on
Structure estimation system including
複数の前記リファレンスデータ記憶部に、複数の前記平均化画像のデータが更新リファレンス画像として再分配されるとともに、複数の前記データ処理部に前記更新リファレンス画像が割り当てられ、
前記データ処理部が、前記測定画像と割り当てられた前記更新リファレンス画像との類似度を評価する処理を行い、
前記測定データ分類部が、類似度を評価する前記処理の結果に基づいて、複数の前記更新リファレンス画像のいずれかに複数の前記測定画像を対応づけし、
前記構造推定部が、前記測定データ分類部にて同じ前記更新リファレンス画像に対応づけられた複数の前記測定画像を平均化して得られる平均化画像のデータを複数の前記更新リファレンス画像について取得し、取得した複数の前記平均化画像に基づき前記分子の前記立体構造を推定する構造推定システム。 The structure estimation system according to claim 1,
A plurality of the averaged image data is redistributed as updated reference images to the plurality of reference data storage units, and the updated reference images are allocated to the plurality of data processing units,
The data processing unit performs a process of evaluating the similarity between the measurement image and the assigned update reference image,
The measurement data classifying unit associates the plurality of measurement images with any of the plurality of updated reference images based on the result of the process of evaluating the similarity,
The structure estimation unit acquires data of an averaged image obtained by averaging the plurality of measurement images associated with the same updated reference image in the measurement data classification unit for the plurality of updated reference images, A structure estimation system that estimates the three-dimensional structure of the molecule based on the plurality of acquired averaged images.
前記スケジューラが、
複数の前記データ処理部の稼働状態に基づいて、類似度を評価する前記処理について複数の前記リファレンス画像が割り当てられる複数のデータ処理部を選択するデータ処理部選択部と、
複数の前記リファレンスデータセットの分配状況に関する情報を記憶するリファレンス分配情報記憶部と、
を含む構造推定システム。 The structure estimation system according to claim 1 or 2,
The scheduler
A data processing unit selection unit that selects a plurality of data processing units to which a plurality of reference images are assigned for the processing for evaluating similarity based on operating states of the plurality of data processing units;
A reference distribution information storage unit for storing information on a distribution status of the plurality of reference data sets;
Structure estimation system including
複数の前記データ処理部が、
前記リファレンスデータセットを取得するリファレンスデータセット取得部と、
前記リファレンスデータセット取得部における前記リファレンスデータセットの取得方法を選択するリファレンスデータセット取得方法選択部と、
を含む構造推定システム。 The structure estimation system according to any one of claims 1 to 4,
A plurality of the data processing units,
A reference data set acquisition unit for acquiring the reference data set;
A reference data set acquisition method selection unit that selects an acquisition method of the reference data set in the reference data set acquisition unit;
Structure estimation system including
複数の前記データ処理部が、前記リファレンスデータセットを取得するリファレンスデータセット取得部を含み、
前記スケジューラが、前記リファレンスデータセット取得部における前記リファレンスデータセットの取得方法を選択するリファレンスデータセット取得方法選択部を含む構造推定システム。 The structure estimation system according to any one of claims 1 to 4,
A plurality of the data processing units include a reference data set acquisition unit that acquires the reference data set,
The structure estimation system in which the scheduler includes a reference data set acquisition method selection unit that selects an acquisition method of the reference data set in the reference data set acquisition unit.
ユーザ端末が、ユーザのリクエストを受け付けて、複数の測定画像に基づく前記分子の構造解析を要求するステップと、
スケジューラが前記ユーザ端末からの要求を受け付けて、複数のデータ処理端末から構成されるデータ処理システムにデータ処理を要求するステップと、
前記スケジューラが、前記データ処理システムに含まれる複数のリファレンスデータ記憶部に、複数のリファレンス画像のデータを分配させるステップと、
前記スケジューラが、前記データ処理システムに含まれる複数のデータ処理部に、複数の測定画像と複数のリファレンス画像との類似度を評価する処理を割り当てるステップと、
複数の前記データ処理部の各々が、前記スケジューラからの前記データ処理の要求に応じて、前記測定画像のデータまたは前記測定画像を平行移動させてなる平行移動画像のデータと、自己に割り当てられた前記リファレンス画像のデータと前記リファレンス画像を回転移動させてなる回転移動画像の群のデータとから構成されるリファレンスデータセットと、を比較して、前記測定画像と割り当てられた前記リファレンス画像との類似度を評価する前記処理を行うステップと、
前記スケジューラが、類似度を評価する前記処理の結果に基づいて、複数の前記測定画像を、それぞれ、複数の前記リファレンス画像のいずれかに対応づけるステップと、
前記スケジューラが、複数の前記リファレンス画像のいずれかに対応づけられた複数の前記測定画像を平均化して得られる複数の平均化画像のデータを取得して、前記平均化画像のデータに基づいて、前記分子の前記立体構造を推定するステップと、
を含む構造推定方法。 A method for estimating the three-dimensional structure of a molecule from data of a plurality of images,
A user terminal accepting a user request and requesting a structural analysis of the molecule based on a plurality of measurement images;
A scheduler accepting a request from the user terminal and requesting data processing from a data processing system including a plurality of data processing terminals;
A step wherein the scheduler, the multiple's Reference data storage unit included in the data processing system, for distributing the data of a plurality of reference images,
A step wherein the scheduler is to allocate the data processing plurality of data processing units included in the system, the process of evaluating the similarity between a plurality of measurement images and the plurality of reference images,
Each of the plurality of data processing units is assigned to the data of the measurement image or the data of the translation image obtained by translating the measurement image in response to the data processing request from the scheduler . by comparing the reference data set composed of a data group of rotational movement image composed by rotating moving data and the reference image of the reference image, similar to the reference image allocated to the measurement image Performing the process of evaluating the degree;
The scheduler associates each of the plurality of measurement images with one of the plurality of reference images based on the result of the process of evaluating the similarity,
The scheduler acquires a plurality of averaged image data obtained by averaging the plurality of measurement images associated with any of the plurality of reference images, and based on the averaged image data, Estimating the conformation of the molecule;
A structure estimation method including:
複数の画像のデータから分子の立体構造を推定するシステムであって、
ユーザのリクエストを受け付けて、前記分子の複数の測定画像に基づく構造解析を要求するユーザ端末と、
複数のデータ処理端末から構成されるデータ処理システムと、
前記ユーザ端末からの要求を受け付けて、前記データ処理システムにデータ処理を要求するスケジューラと、
がネットワークを介して接続されており、
前記データ処理システムが、
複数のリファレンス画像のデータが分配される複数のリファレンスデータ記憶部と、
複数のデータ処理部と、
を含み、
前記データ処理部の各々が、前記スケジューラからの前記データ処理の要求に応じて、複数の前記測定画像のそれぞれについて、前記測定画像のデータまたは前記測定画像を平行移動させてなる平行移動画像のデータと、自己に割り当てられた前記リファレンス画像のデータと当該リファレンス画像を回転移動させてなる回転移動画像の群のデータとから構成されるリファレンスデータセットと、を比較して、前記測定画像と割り当てられた前記リファレンス画像との類似度を評価する処理を行い、
前記スケジューラが、
類似度を評価する前記処理の結果に基づいて、複数の前記リファレンス画像のいずれかに複数の前記測定画像を対応づける測定データ分類部と、
前記測定データ分類部にて同じ前記リファレンス画像に対応づけられた複数の前記測定画像を平均化して得られる平均化画像のデータを複数の前記リファレンス画像について取得し、取得した複数の前記平均化画像に基づき前記分子の前記立体構造を推定する構造推定部と、
を含む構造推定システムとして機能させるプログラム。 The computer,
A system for estimating the three-dimensional structure of a molecule from data of a plurality of images,
A user terminal that accepts a user request and requests a structural analysis based on a plurality of measurement images of the molecule;
A data processing system comprising a plurality of data processing terminals;
A scheduler that accepts a request from the user terminal and requests data processing from the data processing system;
Are connected via a network,
The data processing system is
A plurality of reference data storage units to which data of a plurality of reference images are distributed;
A plurality of data processing units;
Including
Each of the data processing units translates the measurement image data or the translation image data obtained by translating the measurement image for each of the plurality of measurement images in response to the data processing request from the scheduler. And a reference data set composed of data of the reference image assigned to itself and data of a group of rotationally moving images obtained by rotating and moving the reference image, and assigned to the measurement image. There line processing for evaluating the similarity between the reference image,
The scheduler
A measurement data classifying unit that associates a plurality of the measurement images with any one of the plurality of reference images based on the result of the processing for evaluating the similarity;
The averaged image data obtained by averaging the plurality of measurement images associated with the same reference image in the measurement data classifying unit is acquired for the plurality of reference images, and the plurality of averaged images acquired A structure estimation unit for estimating the three-dimensional structure of the molecule based on
A program that functions as a structure estimation system.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005223566A JP4171919B2 (en) | 2005-08-02 | 2005-08-02 | Structure estimation system, structure estimation method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005223566A JP4171919B2 (en) | 2005-08-02 | 2005-08-02 | Structure estimation system, structure estimation method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007041738A JP2007041738A (en) | 2007-02-15 |
JP4171919B2 true JP4171919B2 (en) | 2008-10-29 |
Family
ID=37799673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005223566A Expired - Fee Related JP4171919B2 (en) | 2005-08-02 | 2005-08-02 | Structure estimation system, structure estimation method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4171919B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4893943B2 (en) | 2006-10-31 | 2012-03-07 | 独立行政法人産業技術総合研究所 | Structure estimation system, structure estimation method and program |
JP4899170B2 (en) * | 2008-11-11 | 2012-03-21 | 独立行政法人産業技術総合研究所 | Image processing system, image processing method, program, and recording medium |
EP3185000B1 (en) * | 2014-08-22 | 2021-12-01 | National University Corporation Nagoya University | Three-dimensional image construction method, image processing device, and electron microscope |
-
2005
- 2005-08-02 JP JP2005223566A patent/JP4171919B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007041738A (en) | 2007-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4893943B2 (en) | Structure estimation system, structure estimation method and program | |
Gürsoy et al. | Rapid alignment of nanotomography data using joint iterative reconstruction and reprojection | |
JP4392344B2 (en) | Tomographic reconstruction of small objects using a priori knowledge | |
Lei et al. | Automated acquisition of cryo-electron micrographs for single particle reconstruction on an FEI Tecnai electron microscope | |
JP5725891B2 (en) | Method and apparatus for noise reduction processing of mass signal | |
EP2648206B1 (en) | Transmission electron microscope for reconstructing a three-dimensional structure and transmission electron microscope image reconstruction method | |
JP4171919B2 (en) | Structure estimation system, structure estimation method and program | |
JP7398432B2 (en) | Multimode defect classification in semiconductor inspection | |
Sander et al. | Corrim-based alignment for improved speed in single-particle image processing | |
US8649598B2 (en) | Method for determining a three-dimensional representation of an object using a sequence of cross-section images, computer program product, and corresponding method for analyzing an object and imaging system | |
JP2020166848A (en) | Artificial intelligence enabled volume reconstruction | |
JP2017509945A5 (en) | ||
FI3092589T3 (en) | Method for processing molecular imaging data and corresponding data server | |
CN108510436B (en) | Method and system for searching reconstruction parameters in three-dimensional reconstruction of cryoelectron microscope | |
Sorzano et al. | A multiresolution approach to orientation assignment in 3D electron microscopy of single particles | |
JP4899170B2 (en) | Image processing system, image processing method, program, and recording medium | |
Oveisi et al. | Stereo-vision three-dimensional reconstruction of curvilinear structures imaged with a TEM | |
JP2005019218A (en) | Electron microscope device | |
CN111274455A (en) | Graph data processing method and device, electronic equipment and computer readable medium | |
Seifer et al. | ClusterAlign: A fiducial tracking and tilt series alignment tool for thick sample tomography | |
JP2005525863A5 (en) | ||
Norlén et al. | Structural analysis of vimentin and keratin intermediate filaments by cryo-electron tomography | |
KR20210067257A (en) | Device for determining complexity of system and method for determining complexity of system | |
Helminiak et al. | Multimodal Deep Learning Approach for Dynamic Sampling with Automatic Feature Selection in Matrix-Assisted Laser Desorption/Ionization Mass Spectrometry Imaging | |
US20230038727A1 (en) | Three-dimensional tracking and mapping of atomic planes in atom probe tomography imaging |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080507 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080703 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080729 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080729 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110822 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120822 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130822 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |