JP2022542751A - 生物学関連のデータを処理するためのシステムおよび方法、顕微鏡を制御するためのシステムおよび方法ならびに顕微鏡 - Google Patents
生物学関連のデータを処理するためのシステムおよび方法、顕微鏡を制御するためのシステムおよび方法ならびに顕微鏡 Download PDFInfo
- Publication number
- JP2022542751A JP2022542751A JP2021572430A JP2021572430A JP2022542751A JP 2022542751 A JP2022542751 A JP 2022542751A JP 2021572430 A JP2021572430 A JP 2021572430A JP 2021572430 A JP2021572430 A JP 2021572430A JP 2022542751 A JP2022542751 A JP 2022542751A
- Authority
- JP
- Japan
- Prior art keywords
- dimensional representation
- language
- dimensional
- machine learning
- representations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012545 processing Methods 0.000 title claims description 27
- 238000010801 machine learning Methods 0.000 claims abstract description 135
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 124
- 238000003860 storage Methods 0.000 claims abstract description 20
- 230000000007 visual effect Effects 0.000 claims description 56
- 108090000623 proteins and genes Proteins 0.000 claims description 39
- 102000004169 proteins and genes Human genes 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 30
- 238000013528 artificial neural network Methods 0.000 claims description 29
- 230000008827 biological function Effects 0.000 claims description 21
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 18
- 230000004071 biological effect Effects 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 12
- 230000006399 behavior Effects 0.000 claims description 10
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 7
- 239000002775 capsule Substances 0.000 claims description 4
- 230000014509 gene expression Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 230000006403 short-term memory Effects 0.000 claims description 3
- 230000026676 system process Effects 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 9
- 238000012549 training Methods 0.000 description 94
- 238000002474 experimental method Methods 0.000 description 28
- 239000002773 nucleotide Substances 0.000 description 14
- 125000003729 nucleotide group Chemical group 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 238000003066 decision tree Methods 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 7
- 210000004940 nucleus Anatomy 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000003197 catalytic effect Effects 0.000 description 5
- 150000002632 lipids Chemical class 0.000 description 5
- 230000037361 pathway Effects 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 150000004676 glycans Chemical class 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 229920001282 polysaccharide Polymers 0.000 description 4
- 239000005017 polysaccharide Substances 0.000 description 4
- 230000002787 reinforcement Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 102000005853 Clathrin Human genes 0.000 description 3
- 108010019874 Clathrin Proteins 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 230000004791 biological behavior Effects 0.000 description 3
- 210000003855 cell nucleus Anatomy 0.000 description 3
- 238000007635 classification algorithm Methods 0.000 description 3
- 229930193282 clathrin Natural products 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 210000004292 cytoskeleton Anatomy 0.000 description 3
- 210000000172 cytosol Anatomy 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012432 intermediate storage Methods 0.000 description 3
- 238000000386 microscopy Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 2
- BAWFJGJZGIEFAR-NNYOXOHSSA-N NAD zwitterion Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013501 data transformation Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 229950006238 nadide Drugs 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 241000995051 Brenda Species 0.000 description 1
- 102000000634 Cytochrome c oxidase subunit IV Human genes 0.000 description 1
- 108090000365 Cytochrome-c oxidases Proteins 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 102000029749 Microtubule Human genes 0.000 description 1
- 108091022875 Microtubule Proteins 0.000 description 1
- 101100521334 Mus musculus Prom1 gene Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000726445 Viroids Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000004110 gluconeogenesis Effects 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000004688 microtubule Anatomy 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000006705 mitochondrial oxidative phosphorylation Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004879 molecular function Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 238000012576 optical tweezer Methods 0.000 description 1
- 210000002220 organoid Anatomy 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 230000010627 oxidative phosphorylation Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000003863 physical function Effects 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 210000004895 subcellular structure Anatomy 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000002110 toxicologic effect Effects 0.000 description 1
- 231100000027 toxicology Toxicity 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Library & Information Science (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Bioethics (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
Description
101 生物学的関連の言語ベースの検索データ
105 第2の高次元表現
110 1つまたは複数のプロセッサ
120 1つまたは複数のストレージデバイス
200 生物学関連のデータを処理するためのシステム
201 クエリ、検索クエリ、生物学的関連の言語ベースの検索データ
210 テキストモデル、分類器
220 トレーニングされた視覚認識機械学習アルゴリズム、視覚モデル
230 トレーニングされた言語認識機械学習アルゴリズム、テキストモデル、言語モデル
240 データベース
250 埋め込み、複数の第2の高次元表現
255 データベース、中間ストレージ
257 バイパス
260 埋め込み、第1の高次元表現
270 埋め込み空間における比較
280 最も近い埋め込み
290 それぞれの画像
300 生物学関連のデータを処理するためのシステム
315 スキップされた事前分類
381 最も近い埋め込みに対応する画像を返送する
383 画像ソースにデータを供給する
385 ユーザ
387 データベース
389 パブリックのデータベース
390 科学出版物、ソーシャルメディアのエントリ、またはブログ投稿
393 生物学的分子の画像
395 生物学的配列
400 顕微鏡を制御するためのシステム
401 言語ベースの検索データ
405 第2の高次元表現
411 制御信号
500 データを処理するためのシステム
510 顕微鏡
520 コンピュータデバイス
600 生物学関連の言語ベースの検索データを処理するための方法
610 生物学関連の言語ベースの検索データを受信すること
620 第1の高次元表現を生成すること
630 複数の第2の高次元表現を取得すること
640 第1の高次元表現をそれぞれの第2の高次元表現と比較すること
700 顕微鏡を制御するための方法
710 言語ベースの検索データを受信すること
720 第1の高次元表現を生成すること
730 複数の第2の高次元表現を取得すること
740 第2の高次元表現を選択すること
750 顕微鏡の動作を制御すること
Claims (37)
- 1つまたは複数のプロセッサ(110)と、1つまたは複数のストレージデバイス(120)と、を含むシステム(100,200,300)であって、前記システム(100,200,300)は、
生物学関連の言語ベースの検索データ(101)を受信し、
前記1つまたは複数のプロセッサ(110)によって実行されるトレーニングされた言語認識機械学習アルゴリズム(230)によって、前記生物学関連の言語ベースの検索データ(101)の第1の高次元表現(260)を生成し、なお、前記第1の高次元表現(260)は、それぞれ異なる値を有する少なくとも3つのエントリを含み、
複数の生物学関連の画像ベースの入力データセットまたは複数の生物学関連の言語ベースの入力データセットの複数の第2の高次元表現(105,250)を取得し、
前記第1の高次元表現(260)を、前記複数の第2の高次元表現(105,250)のうちのそれぞれの第2の高次元表現と比較する、
ように構成されているシステム(100,200,300)。 - 前記生物学関連の言語ベースの検索データ(101)は、ヌクレオチド配列、タンパク質配列、生物学的分子もしくは生物学的構造の記述、生物学的分子もしくは生物学的構造の挙動の記述、または、生物学的機能もしくは生物学的活動の記述のうちの少なくとも1つである、
請求項1記載のシステム。 - 前記第1の高次元表現(260)の1つまたは複数のエントリの値は、特定の生物学的機能または特定の生物学的活動が存在する尤度に比例する、
請求項1または2記載のシステム。 - 前記第2の高次元表現(105,250)の1つまたは複数のエントリの値は、特定の生物学的機能または特定の生物学的活動が存在する尤度に比例する、
請求項1から3までのいずれか1項記載のシステム。 - 前記システムは、生物学的標本の画像を撮影することによって前記複数の生物学関連の画像ベースの入力データセットを取得するように構成された顕微鏡(510)をさらに含む、
請求項1から4までのいずれか1項記載のシステム。 - 前記システムは、前記比較に基づいて、前記複数の第2の高次元表現(105,250)のうち、前記第1の高次元表現(260)に最も近い第2の高次元表現を選択するように構成されている、
請求項1から5までのいずれか1項記載のシステム。 - 前記システムは、
前記最も近い第2の高次元表現、
前記複数の生物学関連の画像ベースの入力データセットのうちの、前記最も近い第2の高次元表現に対応する生物学関連の画像ベースの入力データセット、または、
前記複数の生物学関連の言語ベースの入力データセットのうちの、前記最も近い第2の高次元表現に対応する生物学関連の言語ベースの入力データセット、
のうちの少なくとも1つを出力するように構成されている、
請求項6記載のシステム。 - 前記第1の高次元表現(260)と、前記複数の第2の高次元表現(105,250)のうちのそれぞれの第2の高次元表現と、の比較は、ユークリッド距離関数またはアースムーバー距離関数に基づく、
請求項1から7までのいずれか1項記載のシステム。 - 前記第1の高次元表現(260)および前記第2の高次元表現(105,250)は、数値表現である、
請求項1から8までのいずれか1項記載のシステム。 - 前記第1の高次元表現(260)および前記第2の高次元表現(105,250)は、それぞれ100を超える次元を含む、
請求項1から9までのいずれか1項記載のシステム。 - 前記第1の高次元表現(260)は、第1のベクトルであり、
前記第2の高次元表現(105,250)は、第2のベクトルである、
請求項1から10までのいずれか1項記載のシステム。 - 前記第1の高次元表現(260)のエントリの値の50%超および前記第2の高次元表現(105,250)のエントリの値の50%超は、0に等しくない、
請求項1から11までのいずれか1項記載のシステム。 - 前記第1の高次元表現(260)の5つを超えるエントリの値は、前記第1の高次元表現(260)のエントリの最大絶対値の10%よりも大きく、
前記複数の第2の高次元表現(105,250)のうちのそれぞれの第2の高次元表現の5つを超えるエントリの値は、前記第2の高次元表現(105,250)のエントリのそれぞれの最大絶対値の10%よりも大きい、
請求項1から12までのいずれか1項記載のシステム。 - 前記生物学関連の言語ベースの検索データ(101)は、20文字を超える長さを含む、
請求項1から13までのいずれか1項記載のシステム。 - 前記トレーニングされた言語認識機械学習アルゴリズム(230)は、トレーニングされた言語認識ニューラルネットワークを含む、
請求項1から14までのいずれか1項記載のシステム。 - 前記トレーニングされた言語認識ニューラルネットワークは、30を超える層を含む、
請求項15記載のシステム。 - 前記トレーニングされた言語認識ニューラルネットワークは、リカレントニューラルネットワークである、
請求項15または16記載のシステム。 - 前記トレーニングされた言語認識ニューラルネットワークは、長短期記憶ネットワークである、
請求項15、16、または17記載のシステム。 - 前記システム(100)は、
トレーニングされた視覚認識機械学習アルゴリズム(220)により、前記複数の生物学関連の画像ベースの入力データセットの前記複数の第2の高次元表現(105,250)の前記第2の高次元表現(105,250)を生成することによって、
または、
実行されるトレーニングされた言語認識機械学習アルゴリズム(230)により、前記複数の生物学関連の言語ベースの入力データセットの前記複数の第2の高次元表現(105,250)の前記第2の高次元表現(105,250)を生成することによって、
前記第2の高次元表現(105,250)を取得するように構成されており、
前記複数の第2の高次元表現(105,250)のうちのそれぞれの第2の高次元表現は、それぞれ異なる値を有する少なくとも3つのエントリを含む、
請求項1から18までのいずれか1項記載のシステム。 - 前記トレーニングされた視覚認識機械学習アルゴリズム(220)は、トレーニングされた視覚認識ニューラルネットワークを含む、
請求項19記載のシステム。 - 前記トレーニングされた視覚認識ニューラルネットワークは、30を超える層を含む、
請求項20記載のシステム。 - 前記トレーニングされた視覚認識ニューラルネットワークは、畳み込みニューラルネットワークまたはカプセルネットワークである、
請求項20または21記載のシステム。 - 前記トレーニングされた視覚認識ニューラルネットワークは、複数の畳み込み層および複数のプーリング層を含む、
請求項20、21、または22記載のシステム。 - 前記トレーニングされた視覚認識ニューラルネットワークは、正規化線形ユニット活性化関数を使用する、
請求項20から23までのいずれか1項記載のシステム。 - 前記システムは、
第2の生物学関連の言語ベースの検索データと、論理演算子に関する情報とを受信し、
前記1つまたは複数のプロセッサ(110)によって実行される前記トレーニングされた言語認識機械学習アルゴリズム(230)によって、前記第2の生物学関連の言語ベースの検索データ(102)の第1の高次元表現を生成し、
前記論理演算子に従って、第1の生物学関連の言語ベースの検索データの前記第1の高次元表現(260)と、第2の生物学関連の言語ベースの検索データの前記第1の高次元表現と、を組み合わせることに基づいて、1つの結合された高次元表現を決定し、
前記結合された高次元表現を、前記複数の第2の高次元表現(105,250)のうちのそれぞれの第2の高次元表現と比較する、
ように構成されている、
請求項1から24までのいずれか1項記載のシステム。 - 前記論理演算子は、AND演算子であり、
前記結合された高次元表現は、前記第1の生物学関連の言語ベースの検索データ(101)の前記第1の高次元表現(260)と、前記第2の生物学関連の言語ベースの検索データの前記第1の高次元表現と、を加算することによって決定される、
請求項25記載のシステム。 - 前記システムは、前記生物学関連の言語ベースの検索データ(101)に基づいて、複数のトレーニングされた言語認識機械学習アルゴリズムから、前記トレーニングされた言語認識機械学習アルゴリズム(230)を選択するように構成されている、
請求項1から26までのいずれか1項記載のシステム。 - 前記システムは、顕微鏡(510)の動作を制御するように構成されている、
請求項1から27までのいずれか1項記載のシステム。 - 1つまたは複数のプロセッサ(110)と、1つまたは複数のストレージデバイス(120)と、を含むシステム(400)であって、前記システム(400)は、
言語ベースの検索データ(401)を受信し、
前記1つまたは複数のプロセッサ(110)によって実行されるトレーニングされた言語認識機械学習アルゴリズムによって、前記言語ベースの検索データ(401)の第1の高次元表現を生成し、なお、前記第1の高次元表現は、それぞれ異なる値を有する少なくとも3つのエントリを含み、
複数の画像ベースの入力データセットの複数の第2の高次元表現(405)を取得し、
前記第1の高次元表現と、前記複数の第2の高次元表現のうちのそれぞれの第2の高次元表現(405)と、の比較に基づいて、前記複数の第2の高次元表現から1つの第2の高次元表現(405)を選択し、
選択された前記第2の高次元表現(405)に基づいて、顕微鏡の動作を制御するための制御信号(411)を供給する、
ように構成されているシステム(400)。 - 前記システムは、選択された前記第2の高次元表現(405)に基づいて、顕微鏡目標位置を決定するように構成されており、
前記顕微鏡目標位置は、選択された前記第2の高次元表現(405)に対応する、前記画像ベースの入力データによって表現されている画像が撮像された位置であり、
前記制御信号(411)は、前記顕微鏡目標位置へと駆動するように前記顕微鏡(510)をトリガするように構成されている、
請求項29記載のシステム。 - 前記システムは、前記1つまたは複数のプロセッサ(110)によって実行される視覚認識機械学習アルゴリズム(230)によって、前記複数の画像ベースの入力データセットの前記複数の第2の高次元表現(405)を生成するように構成されている、
請求項29または30記載のシステム。 - 前記システムは、前記比較に基づいて、前記複数の第2の高次元表現のうち、前記第1の高次元表現に最も近い第2の高次元表現(405)を選択するように構成されている、
請求項29から31までのいずれか1項記載のシステム。 - 前記システムは、標本の複数の画像を撮影するように構成された顕微鏡(510)をさらに含み、
前記複数の画像ベースの入力データセットは、前記標本の複数の画像を表す、
請求項29から32までのいずれか1項記載のシステム。 - 請求項1から33までのいずれか1項記載のシステムを含む、顕微鏡(510)。
- 生物学関連の言語ベースの検索データを処理するための方法(600)であって、前記方法は、
生物学関連の言語ベースの検索データを受信するステップ(610)と、
トレーニングされた言語認識機械学習アルゴリズムによって、前記生物学関連の言語ベースの検索データの第1の高次元表現を生成するステップであって、前記第1の高次元表現は、それぞれ異なる値を有する少なくとも3つのエントリを含むステップ(620)と、
複数の生物学関連の画像ベースの入力データセットまたは複数の生物学関連の言語ベースの入力データセットの複数の第2の高次元表現を取得するステップ(630)と、
前記第1の高次元表現を、前記複数の第2の高次元表現のうちのそれぞれの第2の高次元表現と比較するステップ(640)と、
を含む方法(600)。 - 顕微鏡を制御するための方法(700)であって、前記方法は、
言語ベースの検索データを受信するステップ(710)と、
トレーニングされた言語認識機械学習アルゴリズムによって、前記言語ベースの検索データの第1の高次元表現を生成するステップであって、前記第1の高次元表現は、それぞれ異なる値を有する少なくとも3つのエントリを含むステップ(720)と、
複数の画像ベースの入力データセットの複数の第2の高次元表現を取得するステップ(730)と、
前記第1の高次元表現と、前記複数の第2の高次元表現のうちのそれぞれの第2の高次元表現と、の比較に基づいて、前記複数の第2の高次元表現から1つの第2の高次元表現を選択するステップ(740)と、
選択された前記第2の高次元表現に基づいて、顕微鏡の動作を制御するステップ(750)と、
を含む方法(700)。 - プロセッサによって実行されるときに請求項35または36記載の方法を実施するためのプログラムコードを有する、コンピュータプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2019/064967 WO2020244775A1 (en) | 2019-06-07 | 2019-06-07 | A system and method for processing biology-related data, a system and method for controlling a microscope and a microscope |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022542751A true JP2022542751A (ja) | 2022-10-07 |
Family
ID=66951900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021572430A Pending JP2022542751A (ja) | 2019-06-07 | 2019-06-07 | 生物学関連のデータを処理するためのシステムおよび方法、顕微鏡を制御するためのシステムおよび方法ならびに顕微鏡 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11960518B2 (ja) |
EP (1) | EP3980901A1 (ja) |
JP (1) | JP2022542751A (ja) |
CN (1) | CN114375448A (ja) |
WO (1) | WO2020244775A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230085786A1 (en) * | 2021-09-23 | 2023-03-23 | The Joan and Irwin Jacobs Technion-Cornell Institute | Multi-stage machine learning techniques for profiling hair and uses thereof |
CN116705189B (zh) * | 2023-08-09 | 2023-10-10 | 北京慧采通科技有限公司 | 检索化学物的方法、装置以及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030123737A1 (en) * | 2001-12-27 | 2003-07-03 | Aleksandra Mojsilovic | Perceptual method for browsing, searching, querying and visualizing collections of digital images |
WO2005036451A1 (en) * | 2003-10-08 | 2005-04-21 | Lifespan Biosciences, Inc. | Automated microspcope slide tissue sample mapping and image acquisition |
AU2008233083A1 (en) | 2007-03-30 | 2008-10-09 | Knewco, Inc. | Data structure, system and method for knowledge navigation and discovery |
EP2272014A2 (en) | 2008-04-29 | 2011-01-12 | LTU Technologies S.A.S. | Method for generating a representation of image content using image search and retrieval criteria |
KR102490720B1 (ko) * | 2013-01-31 | 2023-01-27 | 코덱시스, 인코포레이티드 | 상호작용 성분을 이용하여 생체분자를 확인하기 위한 방법, 시스템, 및 소프트웨어 |
JP6146265B2 (ja) * | 2013-11-07 | 2017-06-14 | ソニー株式会社 | 顕微鏡システムおよびオートフォーカス方法 |
JP6746472B2 (ja) | 2016-11-11 | 2020-08-26 | ヤフー株式会社 | 生成装置、生成方法および生成プログラム |
US10459995B2 (en) * | 2016-12-22 | 2019-10-29 | Shutterstock, Inc. | Search engine for processing image search queries in multiple languages |
US20210089571A1 (en) * | 2017-04-10 | 2021-03-25 | Hewlett-Packard Development Company, L.P. | Machine learning image search |
CN108733780B (zh) * | 2018-05-07 | 2020-06-23 | 浙江大华技术股份有限公司 | 一种图片搜索方法及装置 |
-
2019
- 2019-06-07 EP EP19731632.6A patent/EP3980901A1/en active Pending
- 2019-06-07 WO PCT/EP2019/064967 patent/WO2020244775A1/en active Application Filing
- 2019-06-07 CN CN201980099046.4A patent/CN114375448A/zh active Pending
- 2019-06-07 US US17/596,289 patent/US11960518B2/en active Active
- 2019-06-07 JP JP2021572430A patent/JP2022542751A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN114375448A (zh) | 2022-04-19 |
WO2020244775A1 (en) | 2020-12-10 |
US11960518B2 (en) | 2024-04-16 |
US20220229862A1 (en) | 2022-07-21 |
EP3980901A1 (en) | 2022-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7443401B2 (ja) | 生物学関連のデータを処理するための機械学習アルゴリズムをトレーニングするためのシステムおよび方法、顕微鏡ならびにトレーニングされた機械学習アルゴリズム | |
Zhu et al. | Converting tabular data into images for deep learning with convolutional neural networks | |
Yan et al. | Protein fold recognition based on multi-view modeling | |
Sekhon et al. | DeepDiff: DEEP-learning for predicting DIFFerential gene expression from histone modifications | |
Islamaj Doğan et al. | Overview of the BioCreative VI Precision Medicine Track: mining protein interactions and mutations for precision medicine | |
Arowolo et al. | A survey of dimension reduction and classification methods for RNA-Seq data on malaria vector | |
US20220245188A1 (en) | A system and method for processing biology-related data, a system and method for controlling a microscope and a microscope | |
Zhang et al. | Application of the AlphaFold2 Protein Prediction Algorithm Based on Artificial Intelligence | |
US11960518B2 (en) | System and method for processing biology-related data, a system and method for controlling a microscope and a microscope | |
Sanchez-Fernandez et al. | CLOOME: contrastive learning unlocks bioimaging databases for queries with chemical structures | |
JP7346603B2 (ja) | 生物学関連のデータを処理するためのシステムおよび方法ならびに顕微鏡 | |
Tripathy et al. | AEGA: enhanced feature selection based on ANOVA and extended genetic algorithm for online customer review analysis | |
Do et al. | Evaluating named-entity recognition approaches in plant molecular biology | |
Yang et al. | AnnoFly: annotating Drosophila embryonic images based on an attention-enhanced RNN model | |
Qattous et al. | PaCMAP-embedded convolutional neural network for multi-omics data integration | |
Hsu et al. | Using deep learning to identify translational research in genomic medicine beyond bench to bedside | |
Gancheva et al. | SOA based system for big genomic data analytics and knowledge discovery | |
Pan et al. | Predicting protein subcellular location using learned distributed representations from a protein-protein network | |
Afonso et al. | Cancer Prediction using machine learning | |
Cellamare et al. | Exploring transductive and inductive methods for vertex embedding in biological networks | |
EP4116869A1 (en) | A method and an apparatus for predicting a future state of a biological system, a system and a computer program | |
EP3980938A1 (en) | A system and method for generating a biology-related image-based output data set of a typical image of a biological structure and a system and method for training a generative adversarial network | |
Yazdani-Jahromi et al. | AttentionSiteDTI: Attention Based Model for Predicting Drug-Target Interaction Using 3D Structure of Protein Binding Sites | |
Kumar et al. | Variational Inference Driven Drug Protein Binding Prediction | |
Silvestre | Identifying negative results using biomedical relation extraction systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220607 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220607 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240402 |