JP2023509976A - リアルタイム放射線医学を行うための方法およびシステム - Google Patents
リアルタイム放射線医学を行うための方法およびシステム Download PDFInfo
- Publication number
- JP2023509976A JP2023509976A JP2022542426A JP2022542426A JP2023509976A JP 2023509976 A JP2023509976 A JP 2023509976A JP 2022542426 A JP2022542426 A JP 2022542426A JP 2022542426 A JP2022542426 A JP 2022542426A JP 2023509976 A JP2023509976 A JP 2023509976A
- Authority
- JP
- Japan
- Prior art keywords
- image
- derivative
- radiologist
- subject
- computer system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 179
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 162
- 238000011156 evaluation Methods 0.000 claims abstract description 134
- 238000012545 processing Methods 0.000 claims abstract description 38
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 206010028980 Neoplasm Diseases 0.000 claims description 217
- 201000011510 cancer Diseases 0.000 claims description 202
- 238000012216 screening Methods 0.000 claims description 145
- 210000000481 breast Anatomy 0.000 claims description 111
- 238000012549 training Methods 0.000 claims description 96
- 238000013135 deep learning Methods 0.000 claims description 50
- 238000011282 treatment Methods 0.000 claims description 48
- 206010006187 Breast cancer Diseases 0.000 claims description 41
- 208000026310 Breast neoplasm Diseases 0.000 claims description 41
- 238000003745 diagnosis Methods 0.000 claims description 36
- 238000010801 machine learning Methods 0.000 claims description 36
- 230000008569 process Effects 0.000 claims description 30
- 230000036541 health Effects 0.000 claims description 27
- 230000035945 sensitivity Effects 0.000 claims description 20
- 230000006872 improvement Effects 0.000 claims description 18
- 230000002123 temporal effect Effects 0.000 claims description 16
- 230000002159 abnormal effect Effects 0.000 claims description 15
- 238000004393 prognosis Methods 0.000 claims description 15
- 238000012544 monitoring process Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 238000002405 diagnostic procedure Methods 0.000 claims description 10
- 238000012706 support-vector machine Methods 0.000 claims description 10
- 210000003484 anatomy Anatomy 0.000 claims description 7
- 230000001747 exhibiting effect Effects 0.000 claims description 5
- 238000007637 random forest analysis Methods 0.000 claims description 5
- 238000009795 derivation Methods 0.000 claims description 4
- 230000002730 additional effect Effects 0.000 claims 1
- 238000002372 labelling Methods 0.000 claims 1
- 238000009607 mammography Methods 0.000 description 93
- 238000013473 artificial intelligence Methods 0.000 description 90
- 238000012360 testing method Methods 0.000 description 77
- 238000003384 imaging method Methods 0.000 description 51
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 37
- 201000010099 disease Diseases 0.000 description 36
- 239000011159 matrix material Substances 0.000 description 33
- 238000012552 review Methods 0.000 description 30
- 230000006978 adaptation Effects 0.000 description 28
- 238000002591 computed tomography Methods 0.000 description 24
- 230000001225 therapeutic effect Effects 0.000 description 20
- 230000015654 memory Effects 0.000 description 19
- 238000003860 storage Methods 0.000 description 19
- 230000009471 action Effects 0.000 description 16
- 238000013136 deep learning model Methods 0.000 description 15
- 230000003044 adaptive effect Effects 0.000 description 14
- 238000009826 distribution Methods 0.000 description 14
- 230000002829 reductive effect Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 238000001514 detection method Methods 0.000 description 12
- 210000001519 tissue Anatomy 0.000 description 12
- 208000019901 Anxiety disease Diseases 0.000 description 11
- 230000036506 anxiety Effects 0.000 description 11
- 238000009533 lab test Methods 0.000 description 11
- 238000002604 ultrasonography Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 230000008901 benefit Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 9
- 238000001574 biopsy Methods 0.000 description 9
- 239000002131 composite material Substances 0.000 description 9
- 238000009534 blood test Methods 0.000 description 8
- 238000002595 magnetic resonance imaging Methods 0.000 description 8
- 238000002600 positron emission tomography Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000003211 malignant effect Effects 0.000 description 7
- 230000004083 survival effect Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 210000000038 chest Anatomy 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 229940079593 drug Drugs 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000010200 validation analysis Methods 0.000 description 6
- 230000001934 delay Effects 0.000 description 5
- 210000005075 mammary gland Anatomy 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000002059 diagnostic imaging Methods 0.000 description 4
- 239000007943 implant Substances 0.000 description 4
- 230000000704 physical effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 206010055113 Breast cancer metastatic Diseases 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000007435 diagnostic evaluation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003902 lesion Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000000391 smoking effect Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000209094 Oryza Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 208000002193 Pain Diseases 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 206010016256 fatigue Diseases 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000002599 functional magnetic resonance imaging Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 201000010759 hypertrophy of breast Diseases 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 230000035790 physiological processes and functions Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 239000003826 tablet Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000010626 work up procedure Methods 0.000 description 2
- BSYNRYMUTXBXSQ-UHFFFAOYSA-N Aspirin Chemical compound CC(=O)OC1=CC=CC=C1C(O)=O BSYNRYMUTXBXSQ-UHFFFAOYSA-N 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 206010072082 Environmental exposure Diseases 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 206010018429 Glucose tolerance impaired Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 206010033307 Overweight Diseases 0.000 description 1
- 208000001280 Prediabetic State Diseases 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 244000107946 Spondias cytherea Species 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 229960001138 acetylsalicylic acid Drugs 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 210000000746 body region Anatomy 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000004195 computer-aided diagnosis Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000009206 nuclear medicine Methods 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 238000012014 optical coherence tomography Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036407 pain Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 201000009104 prediabetes syndrome Diseases 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012285 ultrasound imaging Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 208000016261 weight loss Diseases 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
- G06T7/0014—Biomedical image inspection using an image reference approach
- G06T7/0016—Biomedical image inspection using an image reference approach involving temporal comparison
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B6/00—Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
- A61B6/50—Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment specially adapted for specific body parts; specially adapted for specific clinical applications
- A61B6/502—Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment specially adapted for specific body parts; specially adapted for specific clinical applications for diagnosis of breast, i.e. mammography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/04—Indexing scheme for image data processing or generation, in general involving 3D image data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10012—Stereo images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10116—X-ray image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30068—Mammography; Breast
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Public Health (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Pathology (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本開示は、リアルタイムおよび/またはAI支援の放射線医学を実施することを対象とする方法およびシステムを提供する。被検者の身体の部位の画像を処理するための方法は、(a)被検者の身体の部位の画像を取得するステップと、(b)訓練済アルゴリズムを使用して、画像またはその導出物を、複数のカテゴリのうちの1つのカテゴリに分類するステップであって、分類するステップが、画像処理アルゴリズムを適用するステップを含む、分類するステップと、(c)画像が複数のカテゴリのうちの第1のカテゴリに分類されると、画像を、放射線医学的評価のために第1の放射線科医に送るステップ、または(ii)画像が複数のカテゴリのうちの第2のカテゴリに分類されると、画像を、放射線医学的評価のために第2の放射線科医に送るステップ、および(d)放射線医学的分析に少なくとも部分的に基づいて被検者を診察するために、第1の放射線科医または第2の放射線科医から推奨を受け取るステップとを含んでもよい。
Description
相互参照
[001]本出願は、2020年1月9日に提出された米国仮特許出願第62/958,859号の利益を主張するものであり、その全体が参照により本明細書に組み込まれる。
[001]本出願は、2020年1月9日に提出された米国仮特許出願第62/958,859号の利益を主張するものであり、その全体が参照により本明細書に組み込まれる。
[002]乳癌は、米国の女性に最も広くみられるがんであり、2017年だけで25万を超える新規の診断があった。約8人に1人の女性が、その生涯の何らかの時点で乳癌であると診断される。処置の改善に関わらず、米国では4万人を超える女性が毎年乳癌により死亡する。スクリーニングマンモグラフィの広い受診によりある程度、乳癌死亡率の低下に大きな進歩があった。乳癌のスクリーニングは、後期がんと比較して予後がずっと良好であり、処置コストが低い早期がんを識別するのを助けることが可能である。この差は非常に重要な可能性がある:限局的な乳癌のある女性は99%近い5年生存率を有するが、転移性の乳癌のある女性の5年生存率は27%である。
[003]このように立証されたベネフィットに関わらず、スクリーニングマンモグラフィの受診率は、予約取得の長い遅れ、不明確な価格設定、診察結果を受け取る長い待ち時間、紛らわしいレポートなど、一部患者経験の貧しさにより妨げられる。さらには、価格設定の透明性の欠如から生じる問題は、医療機関同士のコストの大きなバラつきによってひどくなる。同様に、診察結果を受け取るための伝達時間は、医療機関同士で一貫性がない。加えて、放射線科医のパフォーマンスの著しいバラつきにより、患者は場所と収入に応じて非常に様々なケアの基準を経験することになる。
[004]本開示は、人工知能を使用して、医学的画像データをさらなるスクリーニングおよび/または診断評価のために個別の放射線医学的ワークフローに階層化することによって、被検者の放射線医学的評価を行うための方法およびシステムを提供する。そのような被検者は、疾患(例えば、がん)を有する被検者および疾患(例えば、がん)のない被検者を含み得る。スクリーニングは、例えば乳癌などのがんに向けたものであってもよい。階層化は、疾患関連の評価または他の評価(例えば、事例の推定される難しさ)に基づいて行われてもよい。
[005]一態様では、本開示は、(a)被検者の身体の部位の少なくとも1つの画像を取得するステップと、(b)訓練済アルゴリズムを使用して、少なくとも1つの画像またはその導出物を、複数のカテゴリのうちの1つのカテゴリに分類するステップであって、分類するステップが、画像処理アルゴリズムを少なくとも1つの画像またはその導出物に適用するステップを含む、分類するステップと、(c)(b)において少なくとも1つの画像またはその導出物を分類すると、(i)少なくとも1つの画像が複数のカテゴリのうちの第1のカテゴリに分類されると、少なくとも1つの画像またはその導出物を、放射線医学的評価のために第1の放射線科医に送るステップ、または(ii)少なくとも1つの画像が複数のカテゴリのうちの第2のカテゴリに分類されると、少なくとも1つの画像またはその導出物を、放射線医学的評価のために第2の放射線科医に送るステップ、および(d)少なくとも1つの画像またはその導出物の放射線医学的分析に少なくとも部分的に基づいて、第1の放射線科医または第2の放射線科医から被検者の放射線医学的評価を受け取るステップを含む、被検者の身体の部位の少なくとも1つの画像を処理するための方法を提供する。
[006]いくつかの実施形態では、(b)は、少なくとも1つの画像またはその導出物を、正常、曖昧、または疑わしいとして分類するステップを含む。いくつかの実施形態では、方法は、少なくとも1つの画像またはその導出物を、少なくとも1つの画像またはその導出物の(b)における分類に基づいて分類器に送るステップをさらに含む。いくつかの実施形態では、(c)は、少なくとも1つの画像またはその導出物を、放射線医学的評価のために、第1の複数の放射線科医のうちの第1の放射線科医、または第2の複数の放射線科医のうちの第2の放射線科医に送るステップを含む。いくつかの実施形態では、少なくとも1つの画像またはその導出物は、医学的画像である。
[007]いくつかの実施形態では、訓練済アルゴリズムは、少なくとも1つの画像またはその導出物を、少なくとも約80%の感度で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも1つの画像またはその導出物を、少なくとも約80%の特異性で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも1つの画像またはその導出物を、少なくとも約80%の陽性予測値で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも1つの画像またはその導出物を、少なくとも約80%の陰性予測値で、正常、曖昧、または疑わしいとして分類するように構成される。
[008]いくつかの実施形態では、訓練済機械学習アルゴリズムは、異常な組織を含むか、異常な組織を含むと疑われる、少なくとも1つの画像またはその導出物の少なくとも1つの領域を識別するように構成される。
[009]いくつかの実施形態では、訓練済アルゴリズムは、少なくとも1つの画像またはその導出物を、がんを示すために、正常、曖昧、または疑わしいとして分類する。いくつかの実施形態では、がんは乳癌である。いくつかの実施形態では、少なくとも1つの画像またはその導出物は、被検者の乳房の三次元画像である。いくつかの実施形態では、訓練済機械学習アルゴリズムは、がんを示すか、がんを示すと疑われる画像を含む少なくとも約100の独立的な訓練サンプルを使用して訓練される。
[010]いくつかの実施形態では、訓練済アルゴリズムは、がんを示すか、がんを示すと疑われる陽性画像を含む第1の複数の独立的な訓練サンプル、およびがんを示さないか、がんを示すと疑われない陰性画像を含む第2の複数の独立的な訓練サンプルを使用して訓練される。いくつかの実施形態では、訓練済アルゴリズムは教師あり機械学習アルゴリズムを含む。いくつかの実施形態では、教師あり機械学習アルゴリズムは、深層学習アルゴリズム、サポートベクタマシン(SVM)、ニューラルネットワーク、またはランダムフォレストを含む。
[011]いくつかの実施形態では、方法は、被検者をモニタリングするステップをさらに含み、モニタリングするステップは、被検者の身体の部位の画像を複数の時間的ポイントにおいて評価するステップを含み、評価するステップが、複数の時間的ポイントのそれぞれにおける、少なくとも1つの画像またはその導出物の、正常、曖昧、または疑わしいとしての分類に少なくとも部分的に基づいている。いくつかの実施形態では、複数の時間的ポイントにおける、被検者の身体の画像の評価における差は、(i)被検者の診断、(ii)被検者の予後、および(iii)被検者の一連の処置の有効性または非有効性から成る群から選択される、1つまたは複数の臨床的指標を示す。
[012]いくつかの実施形態では、(c)は、(i)少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第1のセットのうちの第1の放射線科医に送って、少なくとも1つの画像が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、(ii)少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第2のセットのうちの第2の放射線科医に送って、少なくとも1つの画像が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、または(iii)少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第3のセットのうちの第3の放射線科医に送って、少なくとも1つの画像が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップとをさらに含む。いくつかの実施形態では、(c)は、少なくとも1つの画像が疑わしいと分類された場合、少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第1のセットのうちの第1の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、(c)は、少なくとも1つの画像が曖昧であると分類された場合、少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第2のセットのうちの第2の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、(c)は、少なくとも1つの画像が正常であると分類された場合、少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第3のセットのうちの第3の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、被検者のスクリーニング結果は、少なくとも1つの画像またはその導出物を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、放射線科医の第1のセットは、オンサイトクリニックに配置され、少なくとも1つの画像またはその導出物はオンサイトクリニックにおいて取得される。
[013]いくつかの実施形態では、放射線科医の第2のセットは放射線専門医を含み、放射線専門医は、少なくとも1つの画像またはその導出物を、訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練される。いくつかの実施形態では、放射線科医の第3のセットは、オンサイトクリニックからリモートに配置され、少なくとも1つの画像はオンサイトクリニックにおいて取得される。いくつかの実施形態では、放射線科医の第3のセットのうちの第3の放射線科医は、複数の画像を含むバッチのうち少なくとも1つの画像またはその導出物の放射線科医評価を実施し、バッチは放射線医学的評価の効率の向上のために選択される。
[014]いくつかの実施形態では、方法は、被検者の診断手順を、スクリーニング結果に少なくとも部分的に基づいて実施して、被検者の診断結果を作り出すステップをさらに含む。いくつかの実施形態では、被検者の診断結果は、少なくとも1つの画像を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、被検者の診断結果は、少なくとも1つの画像を取得するステップから約1時間以内に作り出される。
[015]いくつかの実施形態では、少なくとも1つの画像またはその導出物は、被検者の身体の部位の追加的な特性に少なくとも部分的に基づいて、第1の放射線科医、第2の放射線科医、または第3の放射線科医に送られる。いくつかの実施形態では、追加的な特性は、解剖学的構造、組織特性(例えば、組織密度または物理的性質)、異物の存在(例えば、インプラント)、所見のタイプ、病状(例えば、機械学習アルゴリズムなどのアルゴリズムによって予測される)、またはそれらの組合せを含む。
[016]いくつかの実施形態では、少なくとも1つの画像またはその導出物は、第1の放射線科医、第2の放射線科医、または第3の放射線科医の追加的な特性(例えば、第1の放射線科医、第2の放射線科医、または第3の放射線科医の、少なくとも1つの画像またはその導出物の放射線医学的評価を行う個人的な能力)に少なくとも部分的に基づいて、第1の放射線科医、第2の放射線科医、または第3の放射線科医に送られる。
[017]いくつかの実施形態では、(c)は、少なくとも1つの画像またはその導出物を第1の放射線科医に送るステップ、または少なくとも1つの画像またはその導出物を第2の放射線科医に送るステップに少なくとも部分的に基づいて、アラートを生成するステップをさらに含む。いくつかの実施形態では、方法は、アラートを、被検者または被検者の臨床医療従事者に送信するステップをさらに含む。いくつかの実施形態では、方法は、アラートを、患者のモバイルアプリケーションを通じて被検者に送信するステップをさらに含む。いくつかの実施形態では、アラートは、(b)とリアルタイムか、(b)とほぼリアルタイムで生成される。
[018]いくつかの実施形態では、画像処理アルゴリズムを適用するステップは、少なくとも1つの画像またはその導出物内で関心領域を識別するステップと、関心領域をラベル付けして少なくとも1つのラベル付けされた画像を作り出すステップとを含む。いくつかの実施形態では、方法は、少なくとも1つのラベル付けされた画像をデータベースに記憶するステップをさらに含む。いくつかの実施形態では、方法は、少なくとも1つの画像またはその導出物のうちの1つまたは複数、および分類を、データベースに記憶するステップをさらに含む。いくつかの実施形態では、方法は、少なくとも1つの画像またはその導出物のうちの1つまたは複数および分類に少なくとも部分的に基づいて、少なくとも1つの画像のプレゼンテーションを生成するステップをさらに含む。いくつかの実施形態では、方法は、プレゼンテーションをデータベースに記憶するステップをさらに含む。
[019]いくつかの実施形態では、(c)は、(b)とリアルタイムか、(b)とほぼリアルタイムで実施される。いくつかの実施形態では、少なくとも1つの画像は、被検者から取得された複数の画像を含み、複数の画像は、異なるモダリティを使用して、または異なる時間的ポイントにおいて取得される。いくつかの実施形態では、分類するステップは、被検者の臨床健康データを処理するステップを含む。
[020]別の態様では、本開示は、被検者の身体の部位の少なくとも1つの画像を処理するためのコンピュータシステムを提供する:被検者の身体の部位の少なくとも1つの画像を記憶するように構成されたデータベースと、データベースに動作可能に結合された1つまたは複数のコンピュータプロセッサであって、1つまたは複数のコンピュータプロセッサが、(a)訓練済アルゴリズムを使用して、少なくとも1つの画像またはその導出物を、複数のカテゴリのうちの1つのカテゴリに分類するステップであって、分類するステップが、画像処理アルゴリズムを少なくとも1つの画像またはその導出物に適用するステップを含む、分類するステップと、(b)(a)において少なくとも1つの画像またはその導出物を分類すると、(i)少なくとも1つの画像が複数のカテゴリのうちの第1のカテゴリに分類されると、少なくとも画像またはその導出物を、放射線医学的評価のために第1の放射線科医に送るステップと、または(ii)少なくとも1つの画像が複数のカテゴリのうちの第2のカテゴリに分類されると、少なくとも1つの画像またはその導出物を、放射線医学的評価のために第2の放射線科医に送るステップと、(c)少なくとも1つの画像またはその導出物の放射線医学的分析に少なくとも部分的に基づいて、第1の放射線科医または第2の放射線科医から被検者の放射線医学的評価を受け取るステップとを行うように個々に、または集合的にプログラムされる、1つまたは複数のコンピュータプロセッサと。
[021]いくつかの実施形態では、(a)は、少なくとも1つの画像またはその導出物を、正常、曖昧、または疑わしいとして分類するステップを含む。いくつかの実施形態では、1つまたは複数のコンピュータプロセッサは、少なくとも1つの画像またはその導出物を、少なくとも1つの画像または導出物の(a)における分類に基づいて分類器に送るステップをさらに行うように、個々に、または集合的にプログラムされる。いくつかの実施形態では、(b)は、少なくとも1つの画像またはその導出物を、放射線医学的評価のために、第1の複数の放射線科医のうちの第1の放射線科医、または第2の複数の放射線科医のうちの第2の放射線科医に送るステップを含む。いくつかの実施形態では、少なくとも1つの画像またはその導出物は、医学的画像である。
[022]いくつかの実施形態では、訓練済アルゴリズムは、少なくとも1つの画像またはその導出物を、少なくとも約80%の感度で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも1つの画像またはその導出物を、少なくとも約80%の特異性で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも1つの画像またはその導出物を、少なくとも約80%の陽性予測値で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済アルゴリズムは、少なくとも1つの画像またはその導出物を、少なくとも約80%の陰性予測値で、正常、曖昧、または疑わしいとして分類するように構成される。いくつかの実施形態では、訓練済機械学習アルゴリズムが、異常な組織を含むか、異常な組織を含むと疑われる、少なくとも1つの画像またはその導出物の少なくとも1つの領域を識別するように構成される。
[023]いくつかの実施形態では、訓練済アルゴリズムは、少なくとも1つの画像またはその導出物を、がんを示すために、正常、曖昧、または疑わしいとして分類する。いくつかの実施形態では、がんは乳癌である。いくつかの実施形態では、少なくとも1つの画像またはその導出物が、被検者の乳房の三次元画像である。いくつかの実施形態では、訓練済機械学習アルゴリズムは、がんを示すか、がんを示すと疑われる画像を含む少なくとも約100の独立的な訓練サンプルを使用して訓練される。
[024]いくつかの実施形態では、訓練済アルゴリズムは、がんを示すか、がんを示すと疑われる陽性画像を含む第1の複数の独立的な訓練サンプル、およびがんを示さないか、がんを示すと疑われない陰性画像を含む第2の複数の独立的な訓練サンプルを使用して訓練される。いくつかの実施形態では、訓練済アルゴリズムは教師あり機械学習アルゴリズムを含む。いくつかの実施形態では、教師あり機械学習アルゴリズムは、深層学習アルゴリズム、サポートベクタマシン(SVM)、ニューラルネットワーク、またはランダムフォレストを含む。
[025]いくつかの実施形態では、1つまたは複数のコンピュータプロセッサは、被検者をモニタリングするステップをさらに行うように、個々に、または集合的にプログラムされ、モニタリングするステップは、被検者の身体の部位の画像を複数の時間的ポイントにおいて評価するステップを含み、評価するステップは、複数の時間的ポイントのそれぞれにおける、少なくとも1つの画像またはその導出物の、正常、曖昧、または疑わしいとしての分類に少なくとも部分的に基づいている。いくつかの実施形態では、複数の時間的ポイントにおける、被検者の身体の画像の評価における差は、(i)被検者の診断、(ii)被検者の予後、および(iii)被検者の一連の処置の有効性または非有効性から成る群から選択される、1つまたは複数の臨床的指標を示す。
[026]いくつかの実施形態では、(b)は、(i)少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第1のセットのうちの第1の放射線科医に送って、少なくとも1つの画像またはその導出物が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、(ii)少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第2のセットのうちの第2の放射線科医に送って、少なくとも1つの画像またはその導出物が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、または(iii)少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第3のセットのうちの第3の放射線科医に送って、少なくとも1つの画像またはその導出物が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップとをさらに含む。いくつかの実施形態では、(b)は、少なくとも1つの画像が疑わしいと分類された場合、少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第1のセットのうちの第1の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、(b)は、少なくとも1つの画像が曖昧であると分類された場合、少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第2のセットのうちの第2の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、(b)は、少なくとも1つの画像が正常であると分類された場合、少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第3のセットのうちの第3の放射線科医に送って、スクリーニング結果を作り出すステップをさらに含む。いくつかの実施形態では、被検者のスクリーニング結果は、少なくとも1つの画像を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、放射線科医の第1のセットは、オンサイトクリニックに配置され、少なくとも1つの画像はオンサイトクリニックにおいて取得される。
[027]いくつかの実施形態では、放射線科医の第2のセットは放射線専門医を含み、放射線専門医は、少なくとも1つの画像またはその導出物を、訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練される。いくつかの実施形態では、放射線科医の第3のセットは、オンサイトクリニックからリモートに配置され、少なくとも1つの画像はオンサイトクリニックにおいて取得される。いくつかの実施形態では、放射線科医の第3のセットのうちの第3の放射線科医は、複数の画像を含むバッチのうち少なくとも1つの画像またはその導出物の放射線科医評価を実施し、バッチは放射線医学的評価の効率の向上のために選択される。
[028]いくつかの実施形態では、1つまたは複数のコンピュータプロセッサは、スクリーニング結果に少なくとも部分的に基づいて、被検者に対して行われる診断手順から被検者の診断結果をさらに取得するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、被検者の診断結果は、少なくとも1つの画像を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、被検者の診断結果は、少なくとも1つの画像を取得するステップから約1時間以内に作り出される。
[029]いくつかの実施形態では、少なくとも1つの画像またはその導出物は、被検者の身体の部位の追加的な特性に少なくとも部分的に基づいて、第1の放射線科医、第2の放射線科医、または第3の放射線科医に送られる。いくつかの実施形態では、追加的な特性は、解剖学的構造、組織特性(例えば、組織密度または物理的性質)、異物の存在(例えば、インプラント)、所見のタイプ、病状(例えば、機械学習アルゴリズムなどのアルゴリズムによって予測される)、またはそれらの組合せを含む。
[030]いくつかの実施形態では、少なくとも1つの画像またはその導出物は、第1の放射線科医、第2の放射線科医、または第3の放射線科医の追加的な特性(例えば、第1の放射線科医、第2の放射線科医、または第3の放射線科医の、少なくとも1つの画像またはその導出物の放射線医学的評価を行う個人的な能力)に少なくとも部分的に基づいて、第1の放射線科医、第2の放射線科医、または第3の放射線科医に送られる。
[031]いくつかの実施形態では、(b)は、少なくとも1つの画像またはその導出物を第1の放射線科医に送るステップ、または少なくとも1つの画像またはその導出物を第2の放射線科医に送るステップに少なくとも部分的に基づいて、アラートを生成するステップをさらに含む。いくつかの実施形態では、1つまたは複数のコンピュータプロセッサは、アラートを、被検者または被検者の臨床医療従事者にさらに送信するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、1つまたは複数のコンピュータプロセッサは、アラートを、患者のモバイルアプリケーションを通じて被検者にさらに送信するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、アラートは、(a)とリアルタイムか、(a)とほぼリアルタイムで生成される。
[032]いくつかの実施形態では、画像処理アルゴリズムを適用するステップは、少なくとも1つの画像またはその導出物内で関心領域を識別するステップと、関心領域をラベル付けして少なくとも1つのラベル付けされた画像を作り出すステップとを含む。いくつかの実施形態では、1つまたは複数のコンピュータプロセッサは、少なくとも1つのラベル付けされた画像をデータベースにさらに記憶するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、1つまたは複数のコンピュータプロセッサは、少なくとも1つの画像またはその導出物のうちの1つまたは複数、および分類を、データベースにさらに記憶するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、1つまたは複数のコンピュータプロセッサは、少なくとも1つの画像のうちの1つまたは複数および分類に少なくとも部分的に基づいて、少なくとも1つの画像またはその導出物のプレゼンテーションをさらに生成するように、個々に、または集合的にプログラムされる。いくつかの実施形態では、1つまたは複数のコンピュータプロセッサは、プレゼンテーションをデータベースにさらに記憶するように、個々に、または集合的にプログラムされる。
[033]いくつかの実施形態では、(b)は、(a)とリアルタイムか、(a)とほぼリアルタイムで実施される。いくつかの実施形態では、少なくとも1つの画像は、被検者から取得された複数の画像を含み、複数の画像は、異なるモダリティを使用して、または異なる時間的ポイントにおいて取得される。いくつかの実施形態では、分類するステップは、被検者の臨床健康データを処理するステップを含む。
[034]本開示の別の態様は、1つまたは複数のコンピュータプロセッサによって実行されると、上述の方法または本明細書における他での方法のいずれかを実装する機械実行可能コードを含む、非一時的なコンピュータ可読媒体を提供する。
[035]本開示の別の態様は、1つまたは複数のコンピュータプロセッサおよびそれに結合されたコンピュータメモリを備えるシステムを提供する。コンピュータメモリは、1つまたは複数のコンピュータプロセッサによって実行されると、上述の方法または本明細書における他での方法のいずれかを実装する機械実行可能コードを含む。
[036]本開示の追加的な態様および利点は、以下の詳細な説明から当業者には容易に明らかとなろう。以下の詳細な説明では、本開示の単なる例示的な実施形態が示され、説明される。理解されるように、本開示は、他の実施形態および異なる実施形態に対応しており、そのいくつかの詳細は、すべて本開示から逸脱することなく様々な明確な点から修正形態が可能なものである。したがって、図面および説明は、性質として制限的なものではなく、例示的なものと考えられるべきである。
参照による組み込み
[037]本明細書において言及されるすべての出版物、特許、および特許出願は、それぞれ個々の出版物、特許、または特許出願が参照により組み込まれるように具体的かつ個々に示されている場合と同じ程度に、参照により本明細書に組み込まれる。参照により組み込まれる出版物および特許または特許出願が本明細書に含まれる開示と矛盾する範囲で、本明細書は、そのような矛盾する資料に取って代わるおよび/または優先することが意図される。
[037]本明細書において言及されるすべての出版物、特許、および特許出願は、それぞれ個々の出版物、特許、または特許出願が参照により組み込まれるように具体的かつ個々に示されている場合と同じ程度に、参照により本明細書に組み込まれる。参照により組み込まれる出版物および特許または特許出願が本明細書に含まれる開示と矛盾する範囲で、本明細書は、そのような矛盾する資料に取って代わるおよび/または優先することが意図される。
[038]本発明の新規な特徴を、特に添付の特許請求の範囲を用いて説明する。本発明の特徴および利点は、本発明の原理が利用されている例示的な実施形態を説明する以下の詳細な説明、および添付の図面(本明細書では「図面」および「図」とも称される)を参照することによって、より良く理解されるであろう。
[059]本発明の様々な実施形態が、本明細書で示され説明されているが、当業者には、そのような実施形態は単なる例として提供されることが明らかであろう。当業者にとっては多数の変形例、変更、および置き換えが、本発明から逸脱することなく、想到する場合がある。本明細書で説明される本発明の実施形態に対して様々な代替が採用され得ることを理解されたい。
[060]本明細書および特許請求の範囲で使用される場合、そうではないと明確に述べられない限り、単数形「a」、「an」、「the」は複数形を含む。例えば、用語「核酸(a nucleic acid)」は、その混合物を含め、「複数の核酸(nucleic acids)」を含む。
[061]本明細書で使用される場合、用語「被検者」は一般に、検査可能または検出可能な遺伝情報を有するエンティティまたは媒体を称する。被検者は、人、個体、または患者であり得る。被検者は、例えば哺乳類などの脊椎動物であり得る。哺乳類の非限定的な例としては、人間、サル、家畜、狩猟用動物、げっ歯類、およびペットが挙げられる。被検者は、がんを有する人、またはがんを有する疑いのある人であり得る。被検者は、被検者のがん(例えば、乳癌)など、被検者の健康上のまたは生理学的な状態またはコンディションを示す症状を呈している場合がある。代替として、被検者は、そのような健康上のまたは生理学的な状態またはコンディションに関して無症状である可能性がある。
[062]乳癌は、米国の女性に最も広くみられるがんであり、2017年だけで25万を超える新規の診断があった。約8人に1人の女性が、その生涯の何らかの時点で乳癌であると診断される。処置の改善に関わらず、米国では4万人を超える女性が毎年乳癌により死亡する。スクリーニングマンモグラフィの広い受診によりある程度、乳癌死亡率の低下に大きな進歩があった。乳癌のスクリーニングは、後期がんと比較して予後がずっと良好であり、処置コストが低い早期がんを識別するのを助けることが可能である。この差は非常に重要な可能性がある:限局的な乳癌のある女性は99%近い5年生存率を有するが、転移性の乳癌のある女性の5年生存率は27%である。
[063]このように立証されたベネフィットに関わらず、スクリーニングマンモグラフィの受診率は、予約取得の長い遅れ、不明確な価格設定、診察結果を受け取る長い待ち時間、紛らわしいレポートなど、一部患者経験の貧しさにより妨げられる。さらには、価格設定の透明性の欠如から生じる問題は、医療機関同士のコストの大きなバラつきによってひどくなる。同様に、診察結果を受け取るための伝達時間は、医療機関同士で一貫性がない。加えて、放射線科医のパフォーマンスの著しいバラつきにより、患者は場所と収入に応じて非常に様々なケアの基準を経験することになる。
[064]本開示は、人工知能を使用して、医学的画像データをさらなるスクリーニングおよび/または診断評価のために個別の放射線医学的ワークフローに階層化することによって、被検者のリアルタイム放射線医学を行うための方法およびシステムを提供する。そのような被検者は、がんのある被検者およびがんのない被検者を含み得る。スクリーニングは、例えば乳癌などのがんに向けたものであってもよい。
[065]図1は、開示される実施形態による、(例えば、放射線科医、放射線専門家、または放射線技師による)放射線医学的レビュー用に事例を送るための方法の例示的なワークフローを図示する。一態様では、本開示は、被検者の身体の部位の少なくとも1つの画像を処理するための方法100を提供する。方法100は、被検者の身体の部位の画像を取得することを含んでもよい(動作102の通り)。次に、方法100は、訓練済アルゴリズムを使用して、画像またはその導出物を、複数のカテゴリのうちの1つのカテゴリに分類することを含んでもよい(動作104の通り)。例えば、分類することは、画像処理アルゴリズムを画像またはその導出物に適用することを含んでもよい。次に、方法100は、画像が複数のカテゴリのうち第1のカテゴリに分類されたか、それとも第2のカテゴリに分類されたかを判定することを含んでもよい(動作106の通り)。画像が第1のカテゴリに分類された場合、方法100は、画像を、放射線医学的評価のために第1の放射線科医に送ることを含んでもよい(動作108の通り)。画像が第2のカテゴリに分類された場合、方法100は、画像を、放射線医学的評価のために第2の放射線科医に送ることを含んでもよい(動作110の通り)。次に、方法100は、画像の放射線医学的評価に基づいて、(例えば、第1の放射線科医もしくは第2の放射線科医から、または別の放射線科医もしくは医師から)被検者を診察するよう提案を受け取ることを含んでもよい(動作112の通り)。
[066]図2は、開示される実施形態による、被検者のマンモグラフィデータを、正常、不確実、および疑わしい、の3つの異なるワークフローのうちの1つに分類することによって、マンモグラフィスクリーニングを受けている被検者を階層化するように構成されたトリアージエンジンを使用する方法の例を図示する。まず、患者の電子カルテ(EHR)と医学的画像を含むデータセットが用意される。次に、AIベースのトリアージエンジンは、EHRと医学的画像を処理してデータセットを分析し、正常と思われる、疑わしい可能性がある、または疑わしいと思われる、として分類する。次に、患者のデータセットは、正常、不確実、または疑わしいとのデータセットの分類に基づいて、それぞれ、正常な場合のワークフロー、不確実な場合のワークフロー、および疑わしい場合のワークフロー、の3つのワークフローのうちの1つによって処理される。3つのワークフローのそれぞれは、放射線科医レビューまたはさらなるAIベースの分析(例えば、訓練済アルゴリズムによって)を含んでもよい。正常な場合のワークフローは、患者のデータセットが正常であるという、AIベースの(任意選択で、クラウドベースの)確認を含んでもよく、確認されると慣例的なスクリーニングが完了する。例えば、放射線科医のグループは、正常な場合のワークフロー事例を、大量かつ効率的にレビューする場合がある。代替的に、正常な場合のワークフローは、患者のデータセットが疑わしいという、AIベースの(任意選択で、クラウドベースの)判定を含んでもよく、判定されると患者のデータセットの迅速な放射線科医レビューが発注される。例えば、放射線科医の第2のグループは、少数かつ効率的ではなく疑わしい場合のワークフロー事例をレビューしてもよい(例えば、放射線専門医がより詳細な放射線医学的評価を行う)。同様に、不確実な場合と疑わしい場合のワークフローもまた、患者のデータセットの迅速な放射線科医レビューを含んでもよい。いくつかの実施形態では、本明細書の他で説明されるように、放射線科医の異なるセットを使用して、異なるワークフローをレビューする。いくつかの実施形態では、放射線科医の同一のセットを使用して、異なるワークフローを(例えば、放射線医学的評価向けの事例の優先度に応じて異なる時間的ポイントにおいて)レビューする。
[067]図3A~図3Dは、開示される実施形態による、マンモグラフィ技師または技師アシスタント(図3A)、放射線科医(図3B)、請求担当者(図3C)、および超音波技師または技師アシスタント(図3D)の視点からのビューを含む、リアルタイム放射線医学システム用のユーザインターフェースの例の図を示す。ビューは、どの領域がAIアルゴリズムによって疑わしいと識別されたかを示すヒートマップを含んでもよい。マンモグラフィの技師または技師アシスタントは、患者がリアルタイム放射線医学的評価に適しているかどうかを調べるために、患者にいくつかの質問をして、その質問に対する応答を評価する場合がある。放射線科医は、患者の医学的画像(例えば、マンモグラフィ画像)を本開示のリアルタイム放射線医学方法およびシステムにしたがって、読影または解釈してもよい。請求担当者は、患者がリアルタイム放射線医学的評価に適しているかに基づいて診断コストを推定してもよい。マンモグラフィ/超音波の技師または技師アシスタントは、患者にリアルタイム放射線医学的評価の結果を待機するよう知らせてもよい。ユーザインターフェースは、技師または技師アシスタントが取得画像に補正を行うことができるように、または画像取得を繰り返すことができるように、取得画像が低品質であるという(例えば、AIベースのアルゴリズムによって生成された)通知を技師または技師アシスタントに与えてもよい。
医学的画像の取得
[068]医学的画像は、人間被検者(例えば、患者)から取得または導出することができる。医学的画像は、コンピュータサーバ(例えば、クラウドベースのサーバ)、ローカルサーバ、ローカルコンピュータ、またはモバイルデバイス(スマートフォンまたはタブレットなど))などのデータベースに記憶してもよい。医学的画像は、がんのある被検者から、がんがあると疑われる被検者から、またはがんのない被検者もしくはがんがあると疑われない被検者から取得されてもよい。
[068]医学的画像は、人間被検者(例えば、患者)から取得または導出することができる。医学的画像は、コンピュータサーバ(例えば、クラウドベースのサーバ)、ローカルサーバ、ローカルコンピュータ、またはモバイルデバイス(スマートフォンまたはタブレットなど))などのデータベースに記憶してもよい。医学的画像は、がんのある被検者から、がんがあると疑われる被検者から、またはがんのない被検者もしくはがんがあると疑われない被検者から取得されてもよい。
[069]医学的画像は、がんのある被検者の処置の前および/または後に得られてもよい。医学的画像は、処置または処置レジームの間に被検者から取得されてもよい。処置の効果を経時的にモニタリングするために、医学的画像の複数のセットが被検者から取得されてもよい。医学的画像は、臨床検査を通じて最終的な陽性または陰性の診断が利用可能ではない、がん(例えば、乳癌)があると分かっているか、それが疑われる被検者から得られてもよい。医学的画像は、がんがあると疑われる被検者から得られてもよい。医学的画像は、疲労、悪心、体重減少、痛みや疼痛、衰弱または出血などの説明されない症状を感じている被検者から得られてもよい。医学的画像は、説明される症状を有する被検者から得られてもよい。医学的画像は、家族歴、年齢、高血圧もしくは高血圧前段階、糖尿病もしくは糖尿病前症、体重過多もしくは肥満、環境露出、ライフスタイルのリスクファクタ(例えば、喫煙、アルコール消費、または薬物使用)、または他のリスクファクタの存在などのファクタによって、がんが発生するリスクにある被検者から得られてもよい。
[070]医学的画像は、マンモグラフィスキャン、コンピュータ断層撮影法(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、デジタルX線スキャン、陽電子放出断層撮影法(PET)スキャン、PET-CTスキャン、核医学スキャン、サーモグラフィスキャン、眼科スキャン、光干渉断層撮影スキャン、心電図スキャン、内視鏡スキャン、光透視スキャン、骨密度測定スキャン、光学スキャン、またはそれらのあらゆる組合せなどの、1つまたは複数のイメージングモダリティを使用して得られてもよい。医学的画像は、画像特性(例えば、コントラスト、明るさ、シャープネス)を向上するため、ノイズもしくはアーチファクトを除去するため、周波数範囲をフィルタリングするため、画像を小さなファイルサイズに圧縮するため、または画像をサンプリングもしくはクロップするために、画像処理技法または深層学習を使用して、事前処理されてもよい。医学的画像は、生であってもよく、(例えば、複数の2D画像から3D容積を作り出すために)再構築されてもよい。画像は、組織特性または機能的MRI(fMRI)もしくは安静時fMRIにおけるような機能的挙動に相関付けられたマップを計算するために処理されてもよい。画像は、ヒートマップまたは流体などの情報を示す追加的な情報と重ね合わせてもよい。画像は、同一被検者のいくつかのスキャンからの、または数名の被検者からの、画像の合成から作成されてもよい。
[071]訓練済アルゴリズム
[072]1つまたは複数の被検者の身体の部位の複数の医学的画像を含むデータセットを取得した後、訓練済アルゴリズムを使用してデータセットを処理し、画像を、正常、曖昧、または疑わしいとして分類することができる。例えば、訓練済アルゴリズムを使用して、被検者の複数の医学的画像における関心領域(ROI)を判定すること、およびROIを処理して画像を、正常、曖昧、または疑わしいとして分類することができる。訓練済アルゴリズムは、画像を、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または99%より高い精度で、少なくとも約25、少なくとも約50、少なくとも約100、少なくとも約150、少なくとも約200、少なくとも約250、少なくとも約300、少なくとも約350、少なくとも約400、少なくとも約450、少なくとも約500、または約500よりも多い独立したサンプルについて、正常、曖昧、または疑わしいとして分類するように構成されてもよい。
[072]1つまたは複数の被検者の身体の部位の複数の医学的画像を含むデータセットを取得した後、訓練済アルゴリズムを使用してデータセットを処理し、画像を、正常、曖昧、または疑わしいとして分類することができる。例えば、訓練済アルゴリズムを使用して、被検者の複数の医学的画像における関心領域(ROI)を判定すること、およびROIを処理して画像を、正常、曖昧、または疑わしいとして分類することができる。訓練済アルゴリズムは、画像を、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、または99%より高い精度で、少なくとも約25、少なくとも約50、少なくとも約100、少なくとも約150、少なくとも約200、少なくとも約250、少なくとも約300、少なくとも約350、少なくとも約400、少なくとも約450、少なくとも約500、または約500よりも多い独立したサンプルについて、正常、曖昧、または疑わしいとして分類するように構成されてもよい。
[073]訓練済アルゴリズムは、教師あり機械学習アルゴリズムを含んでもよい。訓練済アルゴリズムは、分類回帰木(CART:classification and regression tree)アルゴリズムを含んでもよい。教師あり機械学習アルゴリズムとしては、例えば、ランダムフォレスト、サポートベクタマシン(SVM)、ニューラルネットワーク(例えば、深層ニューラルネットワーク(DNN))、または深層学習アルゴリズムを挙げることができる。訓練済アルゴリズムは、教師なし機械学習アルゴリズムを含んでもよい。
[074]訓練済アルゴリズムは、複数の入力変数を受け入れて、複数の入力変数に基づいて1つまたは複数の出力値を作り出すように構成されてもよい。複数の入力変数は、被検者の身体の部位の医学的画像を含む1つまたは複数のデータセットから抽出した特徴を含んでもよい。例えば、入力変数は、医学的画像のデータセット中の、潜在的にがん的または疑わしい関心領域(ROI)の数を含んでもよい。潜在的にがん的または疑わしい関心領域(ROI)は、画像セグメント化などの多様な画像処理手法を使用して医学的画像のデータセットから識別または抽出されてもよい。入力変数はまた、3D容積またはある時間に渡る複数の診察におけるスライスからのいくつかの画像を含んでもよい。複数の入力変数はまた、被検者の臨床健康データを含んでもよい。
[075]いくつかの実施形態では、臨床健康データは、年齢、体重、身長、肥満指数(BMI)、血圧、心拍、グルコースレベルなど、被検者の1つまたは複数の定量的な測定値を含む。別の例として、臨床健康データは、人種、民族、投薬歴または他の臨床処置歴、喫煙歴、アルコール消費履歴、日常活動または運動レベル、遺伝的検査結果、血液検査結果、イメージング結果、およびスクリーニング結果など、1つまたは複数のカテゴリ的な測定値を含むことが可能である。
[076]訓練済アルゴリズムは、1つまたは複数の画像(例えば、放射線医学的画像)に対して画像処理を行うように構成された1つまたは複数のモジュールを含んでもよく、それにより1つまたは複数の画像の検出またはセグメント化を作り出す。訓練済アルゴリズムは、1つまたは複数の出力値のそれぞれが固定数の可能な値のうちの1つを含むように、分類器(例えば、線形分類器、ロジスティック回帰分類器など)を含んで、分類器による医学的画像を含むデータセットの分類を示してもよい。訓練済アルゴリズムは、1つまたは複数の出力値のそれぞれが2つの値(例えば、{0,1}、{陽性,陰性}、{高リスク,低リスク}、または{疑わしい,正常})のうちの1つを含むように、二値分類器を含んで、分類器による医学的画像を含むデータセットの分類を示してもよい。訓練済アルゴリズムは、1つまたは複数の出力値のそれぞれが3つ以上の値(例えば、{0,1,2}、{陽性,陰性,もしくは中間}、{高リスク,中リスク、または低リスク}、または{疑わしい、正常、または分類不能})のうちの1つを含むように、別のタイプの分類器であって、分類器による医学的画像を含むデータセットの分類を示してもよい。出力値は、説明ラベル、数値、またはそれらの組合せを含んでもよい。出力値の一部は、説明ラベルを含んでもよい。そのような説明ラベルは、識別情報、指標、見込み、または被検者の疾患もしくは障害状態のリスクを提供することができ、例えば、陽性、陰性、高リスク、中リスク、低リスク、疑わしい、正常、または分類不能を含んでもよい。そのような説明ラベルは、被検者のフォローアップの診断手順または処置の識別情報を提供する場合があり、例えば、がんまたは他の状態を処置するために適した治療的介入、治療的介入の持続時間、および/または治療的介入の投与法を含んでもよい。そのような説明ラベルは、被検者に対して行うことが適当であり得る二次的な臨床検査の識別情報を提供する場合があり、例えば、画像検査、血液検査、コンピュータ断層撮影法(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、デジタルX線、陽電子放出断層撮影法(PET)スキャン、PET-CTスキャン、またはそれらのあらゆる組合せを含んでもよい。別の例として、そのような説明ラベルは、被検者のがんの予後を提供する場合がある。別の例として、そのような説明ラベルは、被検者のがんの相対的な評価(例えば、推定ステージまたは腫瘍負荷)を提供する場合がある。一部の説明ラベルは、例えば「陽性」を1に、「陰性」を0にマッピングすることによって、数値にマッピングされる場合がある。
[077]出力値の一部は、バイナリ値、整数、または連続値などの数値を含んでもよい。そのようなバイナリ出力値は、例えば、{0,1}、{陽性,陰性}、または{高リスク,低リスク}を含んでもよい。そのような整数出力値は、例えば{0,1,2}を含んでもよい。そのような連続出力値は、例えば少なくとも0かつ1以下の確率値を含んでもよい。そのような連続出力値は、例えばROIの中心座標を含んでもよい。そのような連続出力値は、被検者のがんの予後を示す場合がある。一部の数値は、例えば1を「陽性」に、0を「陰性」にマッピングすることによって、説明ラベルにマッピングされる場合がある。がんの確率マップなどの、数値のアレイまたはマップが作り出されてもよい。
[078]出力値の一部は、1つまたは複数の切り捨て値に基づいて割り当てられてもよい。例えば、医学的画像を含むデータセットが、被検者が少なくとも50%の確率でがん(例えば、乳癌)を有することを示す場合、医学的画像を含むデータセットの二値分類は「陽性」または1の出力値を割り当ててもよい。例えば、医学的画像を含むデータセットが、被検者が50%未満の確率でがんを有することを示す場合、医学的画像を含むデータセットの二値分類は「陰性」または0の出力値を割り当ててもよい。この場合、単一の切り捨て値50%を使用して、医学的画像を含むデータセットを、2つの可能な二値出力値のうちの1つに分類する。単一の切り捨て値の例としては、約1%、約2%、約5%、約10%、約15%、約20%、約25%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、および約99%を挙げることができる。
[079]別の例として、被検者が少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の確率でがんを有することを、医学的画像を含むデータセットが示す場合、医学的画像を含むデータセットの分類は「陽性」または1の出力値を割り当ててもよい。被検者が約50%超、約55%超、約60%超、約65%超、約70%超、約75%超、約80%超、約85%超、約90%超、約91%超、約92%超、約93%超、約94%超、約95%超、約96%超、約97%超、約98%超、または約99%超の確率でがんを有することを、医学的画像を含むデータセットが示す場合、サンプルの分類は「陽性」または1の出力値を割り当ててもよい。
[080]被検者が約50%未満、約45%未満、約40%未満、約35%未満、約30%未満、約25%未満、約20%未満、約15%未満、約10%未満、約9%未満、約8%未満、約7%未満、約6%未満、約5%未満、約4%未満、約3%未満、約2%未満、または約1%未満の確率でがんを有することを、医学的画像を含むデータセットが示す場合、医学的画像を含むデータセットの分類は「陰性」または0の出力値を割り当ててもよい。被検者が約50%以下、約45%以下、約40%以下、約35%以下、約30%以下、約25%以下、約20%以下、約15%以下、約10%以下、約9%以下、約8%以下、約7%以下、約6%以下、約5%以下、約4%以下、約3%以下、約2%以下、または約1%以下の確率でがんを有することを、医学的画像を含むデータセットが示す場合、医学的画像を含むデータセットの分類は「陰性」または0の出力値を割り当ててもよい。
[081]医学的画像を含むデータセットが「陽性」、「陰性」、1、または0として分類されない場合、医学的画像を含むデータセットの分類は「中間」または2の出力値を割り当ててもよい。この場合、2つの切り捨て値のセットを使用して、医学的画像を含むデータセットを、3つの可能な出力値のうちの1つに分類する。切り捨て値のセットの例としては、{1%,99%}、{2%,98%}、{5%,95%}、{10%,90%}、{15%,85%}、{20%,80%},{25%,75%}、{30%,70%}、{35%,65%}、{40%,60%}、および{45%,55%}を挙げることができる。同様に、n個の切り捨て値のセットを使用して、医学的画像を含むデータセットを、n+1個の可能な出力値のうちの1つに分類してもよく、この場合nはあらゆる正の整数である。
[082]訓練済アルゴリズムは、複数の独立的な訓練サンプルを用いて訓練されてもよい。独立的な訓練サンプルのそれぞれは、被検者からの医学的画像を含むデータセット、医学的画像を分析することによって取得される関連するデータセット(例えば、ラベルまたはアノテーション)、および医学的画像を含むデータセットに対応する1つまたは複数の既知の出力値(例えば、画像の読影の難しさ、画像を読影するのにかかった時間、臨床的診断、予後、欠落、被検者のがんの処置有効性)を含んでもよい。独立的な訓練サンプルは、医学的画像を含むデータセット、ならびに関連するデータセットおよび複数の異なる被検者から取得または導出された出力を含んでもよい。独立的な訓練サンプルは、医学的画像を含むデータセット、ならびに関連するデータセットおよび同一被検者から複数の異なる時間的ポイントで(例えば、毎週、毎月、または毎年など定期的に)取得された出力を含んでもよい。独立的な訓練サンプルは、がんまたは疾患の存在に関連付けられてもよい(例えば、医学的画像を含むデータセットを含む訓練サンプル、ならびにがんまたは疾患があると分かっている複数の被検者から取得または導出された関連するデータセットおよび出力)。独立的な訓練サンプルは、がんまたは疾患がないことに関連付けられてもよい(例えば、医学的画像を含むデータセットを含む訓練サンプル、ならびに以前にがんと診断されたことがないと分かっている、またはがんもしくは疾患について陰性の検査結果を受け取っている複数の被検者から、取得または導出された関連するデータセットおよび出力)。
[083]訓練済アルゴリズムは、少なくとも約50、少なくとも約100、少なくとも約250、少なくとも約500、少なくとも約1000、少なくとも約5000、少なくとも約1万、少なくとも約15000、少なくとも約2万、少なくとも約25000、少なくとも約3万、少なくとも約35000、少なくとも約4万、少なくとも約45000、少なくとも約5万、少なくとも約10万、少なくとも約15万、少なくとも約20万、少なくとも約25万、少なくとも約30万、少なくとも約35万、少なくとも約40万、少なくとも約45万、または少なくとも約50万の独立的な訓練サンプルを用いて訓練されてもよい。独立的な訓練サンプルは、疾患(例えば、がん)の存在に関連付けられる医学的画像を含むデータセットおよび/または疾患(例えば、がん)がないことに関連付けられる医学的画像を含むデータセットを含んでもよい。訓練済アルゴリズムは、約50万以下、約45万以下、約40万以下、約35万以下、約30万以下、約25万以下、約20万以下、約15万以下、約10万以下、約5万以下、約25000以下、約1万以下、約5000以下、約1000以下、約500以下、約250以下、約100以下、または約50以下の疾患(例えば、がん)の存在に関連付けられる独立的な訓練サンプルを用いて訓練されてもよい。いくつかの実施形態では、医学的画像を含むデータセットは、訓練済アルゴリズムを訓練するために使用されるサンプルとは無関係である。
[084]訓練済アルゴリズムは、疾患(例えば、がん)の存在に関連付けられる独立的な訓練サンプルの第1の数、および疾患(例えば、がん)が存在しないことに関連付けられる独立的な訓練サンプルの第2の数を用いて訓練されてもよい。疾患(例えば、がん)の存在に関連付けられる独立的な訓練サンプルの第1の数は、疾患(例えば、がん)が存在しないことに関連付けられる独立的な訓練サンプルの第2の数以下であってもよい。疾患(例えば、がん)の存在に関連付けられる独立的な訓練サンプルの第1の数は、疾患(例えば、がん)が存在しないことに関連付けられる独立的な訓練サンプルの第2の数に等しくてもよい。疾患(例えば、がん)の存在に関連付けられる独立的な訓練サンプルの第1の数は、疾患(例えば、がん)が存在しないことに関連付けられる独立的な訓練サンプルの第2の数より大きくてもよい。
[085]訓練済アルゴリズムは、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の精度で、少なくとも約50,少なくとも約100、少なくとも約250、少なくとも約500、少なくとも約1000、少なくとも約5000、少なくとも約1万、少なくとも約15000、少なくとも約2万、少なくとも約25000、少なくとも約3万、少なくとも約35000、少なくとも約4万、少なくとも約45000、少なくとも約5万、少なくとも約10万、少なくとも約15万、少なくとも約20万、少なくとも約25万、少なくとも約30万、少なくとも約35万、少なくとも約40万、少なくとも約45万、または少なくとも約50万の独立的な検査サンプルについて、医学的画像を分類するように構成されてもよい。訓練済アルゴリズムによって医学的画像を分類する精度は、正常または疑わしいとして正しく識別または分類される独立的な検査サンプルのパーセンテージとして計算されてもよい(例えば、がんがあると分かっている被検者、またはがんについての臨床検査結果が陰性である被検者からの画像)。
[086]訓練済アルゴリズムは、医学的画像を、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の陽性予測値(PPV)で分類するように構成されてもよい。訓練済アルゴリズムを使用して医学的画像を分類するPPVは、本当に異常な状態(例えば、がん)を有する被検者に相当する、疑わしいとして識別または分類される医学的画像のパーセンテージとして計算されてもよい。
[087]訓練済アルゴリズムは、医学的画像を、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の陰性予測値(NPV)で分類するように構成されてもよい。訓練済アルゴリズムを使用して医学的画像を分類するNPVは、本当に異常な状態(例えば、がん)を有さない被検者に相当する、正常として識別または分類される医学的画像のパーセンテージとして計算されてもよい。
[088]訓練済アルゴリズムは、医学的画像を、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれ以上の臨床的感度で分類するように構成されてもよい。訓練済アルゴリズムを使用して医学的画像を分類する臨床的感度は、ある状態(例えば、がん)を有すると分かっている被検者から取得された、その状態について疑わしいとして正しく識別または分類される医学的画像のパーセンテージとして計算されてもよい。
[089]訓練済アルゴリズムは、医学的画像を、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれ以上の臨床的特異性で分類するように構成されてもよい。訓練済アルゴリズムを使用して医学的画像を分類する臨床的特異性は、ある状態にない被検者(例えば、がんについて臨床検査結果が陰性の被検者)から取得された、その状態について正常として正しく識別または分類される医学的画像のパーセンテージとして計算されてもよい。
[090]訓練済アルゴリズムは、医学的画像を、少なくとも約0.50、少なくとも約0.55、少なくとも約0.60、少なくとも約0.65、少なくとも約0.70、少なくとも約0.75、少なくとも約0.80、少なくとも約0.81、少なくとも約0.82、少なくとも約0.83、少なくとも約0.84、少なくとも約0.85、少なくとも約0.86、少なくとも約0.87、少なくとも約0.88、少なくとも約0.89、少なくとも約0.90、少なくとも約0.91、少なくとも約0.92、少なくとも約0.93、少なくとも約0.94、少なくとも約0.95、少なくとも約0.96、少なくとも約0.97、少なくとも約0.98、少なくとも約0.99、またはそれ以上の曲線下面積(AUC:Area-Under-Curve)で分類するように構成されてもよい。AUCは、医学的画像を含むデータセットを正常または疑わしいとして分類する際に訓練済アルゴリズムに関連付けられる受信者操作特性(ROC)曲線の積分(例えば、ROC曲線下の面積)として計算されてもよい。
[091]訓練済アルゴリズムは、がんを識別するパフォーマンス、精度、PPV、NPV、臨床的感度、臨床的特異性、またはAUCのうちの1つまたは複数を改善するために、調節または微調整されてもよい。訓練済アルゴリズムは、訓練済アルゴリズムのパラメータ(例えば、本明細書の他で説明されるような医学的画像を含むデータセットを分類するために使用される切り捨て値のセット、またはニューラルネットワークのパラメータもしくは重み)を調節することによって調節または微調整されてもよい。訓練済アルゴリズムは、訓練プロセスの間、または訓練プロセスが完了した後、絶え間なく調節または微調整されてもよい。
[092]最初に訓練済アルゴリズムが訓練された後、入力のサブセットは、高品質な分類を行うために含まれる、最も影響するものまたは最も重要なものとして識別されてもよい。例えば、医学的画像を含むデータセットの複数の特徴のサブセットは、高品質な分類またはがんの識別を行うために含まれる、最も影響するものまたは最も重要なものとして識別されてもよい。医学的画像を含むデータセットの複数の特徴またはそのサブセットは、高品質な分類またはがんの識別に向けて、それぞれ個々の特徴の影響度または重要性を示す分類メトリクスに基づいてランク付けされてもよい。そのようなメトリクスを使用して、場合によっては著しく、訓練済アルゴリズムを所望のパフォーマンスレベルまで訓練するために使用され得る入力変数(例えば、予測変数)の数を減らすことができる(例えば、所望の最小精度、PPV、NPV、臨床的感度、臨床的特異性、AUC、またはそれらの組合せに基づいて)。例えば、訓練済アルゴリズムに数十から数百の入力変数を含む複数の変数を用いて訓練済アルゴリズムを訓練することが、99%より高い分類の精度となる場合、代わりに複数の変数のうち、そのような最も影響があるか最も重要な入力変数の約5以下、約10以下、約15以下、約20以下、約25以下、約30以下、約35以下、約40以下、約45以下、約50以下、または約100以下の選択されたサブセットだけを用いて訓練済アルゴリズムを訓練することは、低下はするが、なお許容可能な分類の精度(例えば、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%)を与えることが可能である。サブセットは、複数の入力変数全体をランク付け順にすること、および予め定められた数(例えば、約5以下、約10以下、約15以下、約20以下、約25以下、約30以下、約35以下、約40以下、約45以下、約50以下、または約100以下)の最良の分類メトリクスを有する入力変数を選択することによって選択されてもよい。
がんを識別すること、またはモニタリングすること
[093]訓練済アルゴリズムを使用して被検者の身体の部位の複数の医学的画像を含むデータセットを処理して、画像を正常、曖昧、または疑わしいとして分類した後、がんは被検者内で識別またはモニタリングされてもよい。識別は、少なくとも部分的に、正常、曖昧、もしくは疑わしいという画像の分類、医学的画像を含むデータセットから抽出した複数の特徴、および/または被検者の臨床健康データに基づいて行われてもよい。識別は、放射線科医、複数の放射線科医、または訓練済アルゴリズムによって行われてもよい。
[093]訓練済アルゴリズムを使用して被検者の身体の部位の複数の医学的画像を含むデータセットを処理して、画像を正常、曖昧、または疑わしいとして分類した後、がんは被検者内で識別またはモニタリングされてもよい。識別は、少なくとも部分的に、正常、曖昧、もしくは疑わしいという画像の分類、医学的画像を含むデータセットから抽出した複数の特徴、および/または被検者の臨床健康データに基づいて行われてもよい。識別は、放射線科医、複数の放射線科医、または訓練済アルゴリズムによって行われてもよい。
[094]がんは、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の精度で、被検者内で識別されてもよい。がんを識別する精度は、がんを有するまたは有さないとして正しく識別または分類される、独立的な検査の被検者(例えば、がんがあると分かっている被検者、またはがんについての臨床検査結果が陰性である被検者)のパーセンテージとして計算されてもよい。
[095]がんは、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の陽性予測値(PPV)で、被検者内で識別されてもよい。がんを識別するPPVは、本当にがんを有する被検者に相当する、がんを有するとして識別または分類される独立的な検査の被検者のパーセンテージとして計算されてもよい。
[096]がんは、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上の陰性予測値(NPV)で、被検者内で識別されてもよい。訓練済アルゴリズムを使用してがんを識別するNPVは、本当にがんを有さない被検者に相当する、がんを有さないとして識別または分類される独立的な検査の被検者のパーセンテージとして計算されてもよい。
[097]がんは、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれ以上の臨床的感度で、被検者内で識別されてもよい。がんを識別する臨床的感度は、がんを有するとして正しく識別または分類される、がんの存在に関連付けられる独立的な検査の被検者(例えば、がんがあると分かっている被検者)のパーセンテージとして計算されてもよい。
[098]がんは、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれ以上の臨床的特異性で、被検者内で識別されてもよい。がんを識別する臨床的特異性は、がんを有さないとして正しく識別または分類される、がんがないことに関連付けられる独立的な検査の被検者(例えば、がんについての臨床検査結果が陰性である被検者)のパーセンテージとして計算されてもよい。
[099]いくつかの実施形態では、被検者は、がんのリスクがあるとして識別されてもよい。被検者をがんのリスクがあるとして識別した後、リスクがあるとして被験者が識別されたがんに少なくとも部分的に基づいて、被検者には臨床的介入が選択されてもよい。いくつかの実施形態では、臨床的介入は、複数の臨床的介入から選択される(例えば、様々なタイプのがんに対し臨床的に示される)。
[100]いくつかの実施形態では、訓練済アルゴリズムは、被検者が、少なくとも約5%、少なくとも約10%、少なくとも約15%、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、またはそれ以上で、がんのリスクがあると判定してもよい。
[101]訓練済アルゴリズムは、被検者が、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約81%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%、少なくとも約99.1%、少なくとも約99.2%、少なくとも約99.3%、少なくとも約99.4%、少なくとも約99.5%、少なくとも約99.6%、少なくとも約99.7%、少なくとも約99.8%、少なくとも約99.9%、少なくとも約99.99%、少なくとも約99.999%、またはそれ以上の精度で、がんのリスクがあると判定してもよい。
[102]被検者が、がんを有していると識別すると、被検者には、任意選択で、治療的介入がなされてもよい(例えば、被検者のがんを処置するための適当な一連の処置を処方する)。治療的介入は、有効量の薬物の処方、がんのさらなる検査もしくは評価、がんのさらなるモニタリング、またはそれらの組合せを含んでもよい。被検者が現在一連の処置によりがんの処置中である場合、治療的介入は、その後の異なる一連の処置(例えば、現在の一連の処置が有効性でないため、処置の有効性を大きくすること)を含んでもよい。
[103]治療的介入は、がんの診断を確かめるために被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影法(PET)スキャン、PET-CTスキャン、またはそれらのあらゆる組合せを含んでもよい。
[104]画像の正常、曖昧、または疑わしいという分類、医学的画像を含むデータセットから抽出した複数の特徴、および/または被検者の臨床健康データは、患者(例えば、がんのある被検者またはがんを処置中の被検者)をモニタリングするために一定期間に渡って評価されてもよい。場合によっては、患者の医学的画像の分類は、一連の処置の間に変わってもよい。例えば、有効な処置によってがんのリスクが低下している患者のデータセットの特徴は、健康な被検者(例えば、がんのない被検者)のプロファイルまたは分布に近づくようにシフトする場合がある。逆に、例えば、有効ではない処置によってがんのリスクが上昇している患者のデータセットの特徴は、がんのリスクがより高い被検者またはさらに進行したがんを有する被検者のプロファイルまたは分布に近づくようにシフトする場合がある。
[105]被検者のがんは、被検者のがんを処置するための一連の処置をモニタリングすることによってモニタリングされてもよい。モニタリングすることは、2つ以上の時間的ポイントで被検者のがんを評価することを含んでもよい。評価することは、少なくとも、正常、曖昧、もしくは疑わしいという画像の分類、医学的画像を含むデータセットから抽出した複数の特徴、および/または2つ以上の時間的ポイントのそれぞれで判定された被検者の臨床健康データに基づいていてもよい。
[106]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および/または2つ以上の時間的ポイント間で判定された被検者の臨床健康データは、(i)被検者のがんの診断、(ii)被検者のがんの予後、(iii)被検者のがんのリスクの上昇、(iv)被検者のがんのリスクの低下、(v)被検者のがんを処置するための一連の処置の有効性および、(vi)被検者のがんを処置するための一連の処置の非有効性などの、1つまたは複数の臨床的指標を示す場合がある。
[107]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および/または2つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんの診断を示す場合がある。例えば、早い時間的ポイントにおいて被検者にがんが検出されていなかったが、後の時間的ポイントでは被検者にがんが検出された場合、その差は、被検者にがんがあるという診断を示す。臨床的行為または決定は、例えば被検者に新しい治療的介入を処方することなど、被検者にがんがあるという診断のこの指標に基づいて行われてもよい。臨床的行為または決定は、がんの診断を確かめるよう被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影法(PET)スキャン、PET-CTスキャン、またはそれらのあらゆる組合せを含んでもよい。
[108]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および/または2つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんの予後を示す場合がある。
[109]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および/または2つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんのリスクが上昇していることを示す場合がある。例えば、早い時間的ポイントと後の時間的ポイントの両方において、被検者にがんが検出され、かつその差が正の差(例えば、早い時間的ポイントから後の時間的ポイントに向けて大きくなる)である場合、その差は、被検者のがんのリスクが上昇していることを示す場合がある。臨床的行為または決定は、例えば被検者に新しい治療的介入を処方すること、または治療的介入を切り替えること(例えば、現在の処置を終了して新しい処置を処方すること)など、がんのリスクが上昇しているというこの指標に基づいて行われてもよい。臨床的行為または決定は、がんのリスクの上昇を確かめるよう被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影法(PET)スキャン、PET-CTスキャン、またはそれらのあらゆる組合せを含んでもよい。
[110]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および/または2つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんのリスクが低下していることを示す場合がある。例えば、早い時間的ポイントと後の時間的ポイントの両方において、被検者にがんが検出され、かつその差が負の差(例えば、早い時間的ポイントから後の時間的ポイントに向けて小さくなる)である場合、その差は、被検者のがんのリスクが低下していることを示す場合がある。臨床的行為または決定は、被検者について、がんのリスクが低下しているというこの指標に基づいて行われてもよい(例えば、現在の治療的介入を継続するか終了すること)。臨床的行為または決定は、がんのリスクの低下を確かめるよう被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影法(PET)スキャン、PET-CTスキャン、またはそれらのあらゆる組合せを含んでもよい。
[111]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および/または2つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんを処置するための一連の処置の有効性を示す場合がある。例えば、早い時間的ポイントにおいて被検者にがんが検出されたが、後の時間的ポイントでは被検者にがんが検出されなかった場合、その差は、被検者のがんを処置するための一連の処置の有効性を示す。臨床的行為または決定は、被検者のがんを処置するための一連の処置の有効性のこの指標に基づいて行われてもよく、例えば、被検者に対して現在の治療的介入を継続するか終了する。臨床的行為または決定は、がんを処置するための一連の処置の有効性を確かめるよう被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影法(PET)スキャン、PET-CTスキャン、またはそれらのあらゆる組合せを含んでもよい。
[112]いくつかの実施形態では、画像の正常、曖昧、または疑わしいという分類における違い、医学的画像を含むデータセットから抽出した複数の特徴、および/または2つ以上の時間的ポイント間で判定された被検者の臨床健康データは、被検者のがんを処置するための一連の処置の非有効性を示す場合がある。例えば、早い時間的ポイントと後の時間的ポイントの両方において、被検者にがんが検出され、かつその差が正またはゼロの差(例えば、早い時間的ポイントから後の時間的ポイントに向けて大きくなるか、一定レベルのまま)であり、また有効な処置が早い時間的ポイントで示された場合、その差は、被検者のがんを処置するための一連の処置の非有効性を示す場合がある。臨床的行為または決定は、被検者のがんを処置するための一連の処置の非有効性のこの指標に基づいて行われてもよく、例えば、被検者に対して、現在の治療的介入を終了する、および/または異なる新しい治療的介入に切り替える(例えば、処方する)。臨床的行為または決定は、がんを処置するための一連の処置の非有効性を確かめるよう被検者に二次的な臨床検査を推奨することを含んでもよい。この二次的な臨床検査は、画像検査、血液検査、コンピュータ断層撮影法(CT)スキャン、磁気共鳴画像法(MRI)スキャン、超音波スキャン、胸部X線、陽電子放出断層撮影法(PET)スキャン、PET-CTスキャン、またはそれらのあらゆる組合せを含んでもよい。
[113]疾患のレポートを出力すること
[114]被検者において、がんが識別された後、または疾患もしくはがんのリスクの上昇がモニタリングされた後、被検者の疾患またはがんを示す(例えば、疾患またはがんを識別するかその指標を提供する)レポートが電子的に出力されてもよい。被検者は、疾患またはがんを表していなくてもよい(例えば、合併症など疾患またはがんが無症候性のものである)。レポートは、ユーザの電子デバイスのグラフィカルユーザインターフェース(GUI)に提示されてもよい。ユーザは、被検者、介護者、医師、看護師、または別の医療ワーカーであってもよい。
[114]被検者において、がんが識別された後、または疾患もしくはがんのリスクの上昇がモニタリングされた後、被検者の疾患またはがんを示す(例えば、疾患またはがんを識別するかその指標を提供する)レポートが電子的に出力されてもよい。被検者は、疾患またはがんを表していなくてもよい(例えば、合併症など疾患またはがんが無症候性のものである)。レポートは、ユーザの電子デバイスのグラフィカルユーザインターフェース(GUI)に提示されてもよい。ユーザは、被検者、介護者、医師、看護師、または別の医療ワーカーであってもよい。
[115]レポートは、(i)被検者のがんの診断、(ii)被検者の疾患またはがんの予後、(iii)被検者の疾患またはがんのリスクの上昇、(iv)被検者の疾患またはがんのリスクの低下、(v)被検者の疾患またはがんを処置するための一連の処置の有効性、(vi)被検者の疾患またはがんを処置するための一連の処置の非有効性、(vii)疾患またはがんの部位および/または疑わしさのレベル、および(viii)疾患またはがんの提案される一連の診断の有効性尺度などの、1つまたは複数の臨床的指標を含んでもよい。レポートは、このような1つまたは複数の臨床的指標に基づいて行われた、1つまたは複数の臨床的行為または決定を含んでもよい。そのような臨床的行為または決定は、治療的介入、または被検者の疾患またはがんのさらなる臨床的な評価もしくは検査を対象としたものであってもよい。
[116]例えば、被検者の疾患またはがんの診断の臨床的指標は、被検者に対する新しい治療的介入を処方する臨床的行為を伴ってもよい。別の例として、被検者の疾患またはがんのリスクの上昇の臨床的指標は、被検者に対する新しい治療的介入を処方すること、または治療的介入を切り替えること(例えば、現在の処置を終了して新しい処置を処方すること)の臨床的行為を伴ってもよい。別の例として、被検者の疾患またはがんのリスクの低下の臨床的指標は、被検者に対して現在の治療的介入を継続するか終了する臨床的行為を伴ってもよい。別の例として、被検者の疾患またはがんを処置するための一連の処置の有効性の臨床的指標は、被検者に対して現在の治療的介入を継続するか終了する臨床的行為を伴ってもよい。別の例として、被検者の疾患またはがんを処置するための一連の処置の非有効性の臨床的指標は、被検者について現在の治療的介入を終了する、および/または異なる新しい治療的介入に切り替える(例えば、処方する)臨床的行為を伴ってもよい。別の例として、疾患またはがんの部位の臨床的指標は、新しい診断的検査を処方する臨床的行為、特に指標のターゲットとなり得るその検査のあらゆる特定のパラメータを伴ってもよい。
コンピュータシステム
[117]本開示は、本開示の方法を実装するようプログラムされたコンピュータシステムを提供する。図4は、例えば訓練済アルゴリズムを訓練してテストすること、訓練済アルゴリズムを使用して医学的画像を処理し、画像を正常、曖昧、または疑わしいとして分類すること、被検者のがんを識別またはモニタリングすること、および被検者のがんを示すレポートを電子的に出力することを行うようにプログラムされた、または構成されたコンピュータシステム401を示す。
[117]本開示は、本開示の方法を実装するようプログラムされたコンピュータシステムを提供する。図4は、例えば訓練済アルゴリズムを訓練してテストすること、訓練済アルゴリズムを使用して医学的画像を処理し、画像を正常、曖昧、または疑わしいとして分類すること、被検者のがんを識別またはモニタリングすること、および被検者のがんを示すレポートを電子的に出力することを行うようにプログラムされた、または構成されたコンピュータシステム401を示す。
[118]コンピュータシステム401は、例えば訓練済アルゴリズムを訓練してテストすること、訓練済アルゴリズムを使用して医学的画像を処理し、画像を正常、曖昧、または疑わしいとして分類すること、被検者のがんを識別またはモニタリングすること、および被検者のがんを示すレポートを電子的に出力することなど、本開示の分析、計算、および生成の様々な態様を調節することが可能である。コンピュータシステム401は、ユーザの電子デバイスまたは電子デバイスに対してリモートに配置されるコンピュータシステムであり得る。電子デバイスは、モバイル型の電子デバイスであることが可能である。
[119]コンピュータシステム401は、中央処理装置(CPU、本明細書では「プロセッサ」および「コンピュータプロセッサ」とも称される)405を含み、CPU405はシングルコアまたはマルチコアのプロセッサであってもよく、または並列処理向けの複数のプロセッサであることができる。コンピュータシステム401はまた、メモリもしくはメモリロケーション410(例えば、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ)、電子記憶装置415(例えば、ハードディスク)、1つもしくは複数の他のシステムとの通信するための通信インターフェース420(例えば、ネットワークアダプタ)、ならびにキャッシュ、他のメモリ、データ記憶装置、および/または電子ディスプレイアダプタなどの周辺デバイス425を含む。メモリ410、記憶装置415、インターフェース420および周辺デバイス425は、マザーボードなどの通信バス(実線)を通じてCPU405と通信している。記憶装置415は、データを記憶するためのデータ記憶装置(またはデータリポジトリ)であってもよい。コンピュータシステム401は、通信インターフェース420に助けられてコンピュータネットワーク(「ネットワーク」)430に動作可能に結合することが可能である。ネットワーク430は、Internet、インターネットおよび/もしくはエクストラネット、またはInternetと通信するイントラネットおよび/もしくはエクストラネットであり得る。
[120]一部の事例では、ネットワーク430は、電気通信および/またはデータネットワークである。ネットワーク430は、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる1つまたは複数のコンピュータサーバを含むことが可能である。例えば、1つまたは複数のコンピュータサーバは、ネットワーク430(「クラウド」)上でクラウドコンピューティングに、例えば訓練済アルゴリズムを訓練してテストすること、訓練済アルゴリズムを使用して医学的画像を処理し、画像を正常、曖昧、または疑わしいとして分類すること、被検者のがんを識別またはモニタリングすること、および被検者のがんを示すレポートを電子的に出力することなど、本開示の分析、計算、および生成の様々な態様を実行させることが可能である。そのようなクラウドコンピューティングは、例えば、Amazon Web Services(AWS)、Microsoft Azure、Google Cloud Platform、およびIBM cloudなどの、クラウドコンピューティングプラットフォームによって実現することができる。ネットワーク430は、一部の事例ではコンピュータシステム401に助けられて、ピアツーピアネットワークを実装することが可能であり、ピアツーピアネットワークは、コンピュータシステム401に結合されたデバイスが、クライアントまたはサーバとして振る舞えるようにすることが可能である。
[121]CPU405は、1つもしくは複数のコンピュータプロセッサおよび/または1つもしくは複数のグラフィック処理ユニット(GPU)を含んでもよい。CPU405は、プログラムまたはソフトウェアとして具体化可能な機械可読命令のシーケンスを実行することが可能である。命令は、メモリ410などのメモリロケーションに記憶することができる。命令は、CPU405に送ることが可能であり、続いてCPU405が本開示の方法を実装するようプログラムまたは構成することが可能である。CPU405によって実行される動作の例としては、フェッチ、デコーダ、実行、およびライトバックを挙げることが可能である。
[122]CPU405は、集積回路などの回路の一部であることが可能である。システム401の1つまたは複数の他のコンポーネントは、回路に含まれることが可能である。場合によっては、回路は特定用途向け集積回路(ASIC)である。
[123]記憶装置415は、ドライバ、ライブラリ、および保存されたプログラムなどのファイルを記憶することが可能である。記憶装置415は、例えば、ユーザ設定およびユーザプログラムなどのユーザデータを記憶することができる。コンピュータシステム401は、一部の事例では、イントラネットまたはInternetを通じてコンピュータシステム401と通信するリモートサーバ上に配置されるなど、コンピュータシステム401の外部にある1つまたは複数の追加的なデータ記憶装置を含むことが可能である。
[124]コンピュータシステム401は、ネットワーク430を通じて1つまたは複数のリモートのコンピュータシステムと通信することが可能である。例えば、コンピュータシステム401は、ユーザのリモートのコンピュータシステムと通信することが可能である。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、ポータブルのPC)、スレートまたはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android対応デバイス、Blackberry(登録商標))、または携帯情報端末が挙げられる。ユーザは、ネットワーク430を介してコンピュータシステム401にアクセスすることが可能である。
[125]本明細書で説明される方法は、コンピュータシステム401の電子記憶ロケーション上、例えばメモリ410または電子記憶装置415上に記憶された機械(例えば、コンピュータプロセッサ)実行可能コードによって実装することが可能である。機械実行可能または機械可読コードは、ソフトウェアの形態で提供される場合がある。使用中、コードはプロセッサ405によって実行可能である。場合によっては、コードは、記憶装置415から取り出すことが可能であり、プロセッサ405による容易なアクセスのために、メモリ410に記憶され得る。一部の状況では、電子記憶装置415は除外される可能性があり、機械実行可能命令はメモリ410に記憶される。
[126]コードは、コードを実行するように構成されたプロセッサを有する機械での使用のためにプリコンパイルされて設定することが可能であるか、ランタイム中にコンパイルすることが可能である。コードは、プリコンパイルまたはアズコンパイルされた様式でコードが実行され得るように選択され得る、プログラミング言語として供給することが可能である。
[127]コンピュータシステム401などの本明細書で提供されるシステムおよび方法の態様は、プログラミングとして具体化することが可能である。技術の様々な態様は、通常は機械(またはプロセッサ)実行可能コード、および/またはあるタイプの機械可読媒体で実行されるか具体化される関連データの形態の「製品」または「製造物品」として考えてもよい。機械実行可能コードは、メモリ(例えば、読み取り専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に記憶することが可能である。「記憶」タイプの媒体としては、コンピュータ、プロセッサなど、または様々な半導体メモリ、テープドライブ、ディスクドライブなどの、その関連モジュールの有形なメモリのいずれか、またはすべてを挙げることが可能であり、これらはいつでもソフトウェアプログラミング用に非一時的な記憶を実現することができる。ソフトウェアのすべてまたは一部は、Internetまたは様々な他の電気通信ネットワークを通じて、時々通信される場合がある。そのような通信は、例えば、ソフトウェアを1つのコンピュータまたはプロセッサから別のものにロードすること、例えば、管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームにロードすることを可能にすることができる。故に、ソフトウェア要素を運び得る別のタイプの媒体としては、有線および光学固定電話(landline)ネットワークを通じる、ならびに様々な無線(air-link)上での、ローカルデバイス間の物理的インターフェース間で使用されるような、光学的、電気的、および電磁的な波が挙げられる。そのような波を搬送する、有線または無線リンク、光学リンクなどの物理的な要素はまた、ソフトウェアを運ぶ媒体と考えることができる。本明細書で使用される場合、非一時的な、有形の「記憶」媒体として限定されない限り、コンピュータまたは機械「可読媒体」という用語は、命令を実行用にプロセッサに提供することに関与するあらゆる媒体を指す。
[128]したがって、コンピュータ実行可能コードなどの機械可読媒体は、有形な記憶媒体、搬送波媒体、または物理的な送信媒体を含む形態を取ることができるが、それに限定されなくてもよい。非揮発性の記憶媒体としては、例えば図面に示される、光学または磁気ディスク、あらゆるコンピュータなどの記憶デバイスにおけるいずれか、データベースを実装するために使用され得るものなど、が挙げられる。揮発性の記憶媒体としては、そのようなコンピュータプラットフォームの主メモリなどの動的メモリが挙げられる。有形の送信媒体としては、同軸ケーブル、銅線、および光ファイバが挙げられ、コンピュータシステム内のバスを含む配線が含まれる。搬送波送信媒体は、高周波(RF)および赤外(IR)データ通信中に生成されるような、電気的もしくは電磁気的な信号、または音響波もしくは光波の形態を取る場合がある。したがって、コンピュータ可読媒体の一般的な形態としては、例えば以下が挙げられる:フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、あらゆる他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、あらゆる他の光学媒体、パンチカード紙テープ、孔のパターンを有するあらゆる他の物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、あらゆる他のメモリチップもしくはカートリッジ、データもしくは命令を移送する搬送波、そのような搬送波を移送するケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび/もしくはデータを読み出すことができるあらゆる他の媒体。コンピュータ可読媒体のこのような形態の多くは、1つまたは複数の命令の1つまたは複数のシーケンスを実行用にプロセッサに搬送するのに関与する可能性がある。
[129]コンピュータシステム401は、電子ディスプレイ435を含むか、電子ディスプレイ435と通信することが可能であり、電子ディスプレイ435は、例えば訓練済アルゴリズムの訓練およびテストを示す視覚的表示、正常、曖昧、または疑わしいとしての分類を示す画像データの視覚的表示、がんを有するという被検者の識別情報、または被検者のがんを示す電子的レポート(例えば、診断または放射線医学的レポート)を提供するためのユーザインターフェース(UI)440を含む。UIの例としては、限定しないが、グラフィカルユーザインターフェース(GUI)およびウェブベースのユーザインターフェースが挙げられる。
[130]本開示の方法およびシステムは、1つまたは複数のアルゴリズムによって実装することが可能である。アルゴリズムは、中央処理装置405によって実行されると、ソフトウェアにより実装される。アルゴリズムは、例えば訓練済アルゴリズムを訓練してテストすること、訓練済アルゴリズムを使用して医学的画像を処理し、画像を正常、曖昧、または疑わしいとして分類すること、被検者のがんを識別またはモニタリングすること、および被検者のがんを示すレポートを電子的に出力することが可能である。
実施例
[131]
[131]
リアルタイム放射線医学を用いた患者ケアの改善
[132]本開示のシステムおよび方法を使用して、リアルタイム放射線医学スクリーニングおよび診断ワークフローを、複数の患者に対して行った。例として、リアルタイム放射線医学のクリニックの第1日目に、患者は正常な事例についての即時結果を受け取り、患者の感情は安心して落ち着いたものとなった。
[132]本開示のシステムおよび方法を使用して、リアルタイム放射線医学スクリーニングおよび診断ワークフローを、複数の患者に対して行った。例として、リアルタイム放射線医学のクリニックの第1日目に、患者は正常な事例についての即時結果を受け取り、患者の感情は安心して落ち着いたものとなった。
[133]別の例として、リアルタイム放射線医学のクリニックの翌日に、別の患者はスクリーニング中に疑わしいという所見を受け取り、疑わしい所見について3時間以内に診断的なフォローアップが行われた。患者は放射線科医に、その所見は良性であり、がんがあると疑われないと伝えられた。患者は非常に安心し、最終診断結果を待つ心配が避けられて喜んだ。米国では、どこでも平均して、そのようなプロセスは2週間から8週間かかることがある。迅速なワークフローを持つ特定のクリニックでも、リアルタイム放射線医学の支援がない場合は、プロセスには1~2週間かかる場合がある。
[134]別の例として、リアルタイム放射線医学のクリニックでの別の日に、AIベースのリアルタイム放射線医学システムは、3mmの乳癌腫瘍を検出し、これは5日後に生検によってがんであると確かめられた。図5は、開示される実施形態による、放射線科医によって検出される様々なサイズ(2mmから29mmの範囲)の乳癌腫瘍の検出頻度の例示的なプロットを示す。リアルタイム放射線医学システムは、処置する時間を低減することによって、救命上の臨床的影響力を提供することができる。がんは、この患者が自身の次のスクリーニングまたは診断手順を受けるまで成長し続ける可能性があり、その時には、除去や処置がより生命を脅かすもの、痛みがあり、高額となり、成功率が低くなっている場合がある。
[135]リアルタイム放射線医学のクリニックの別の例として、患者は1時間以内に疑わしい所見についての診断的なフォローアップ手順を受け取った。生検が必要とされたが、患者がアスピリンを服用していたので生検は翌診療日に完了した。生検は、リアルタイム放射線医学によって検出されたがんを確かめた。放射線医学的なワークアップ期間は、8診療日から1日に低減し、診断にかかる時間は1カ月から1週間に低減した。
[136]リアルタイム放射線医学システムの臨床的影響力は、PPV1およびコールバック率などのスクリーニングマンモグラフィメトリクスによって測定されてもよい。PPV1は一般に、1年以内にがんと組織診断される、放射線科医による異常初期解釈の診察のパーセンテージを称する。コールバック率は一般に、異常初期解釈の診察のパーセンテージを称する(例えば、「リコール率」)。6週間のスパンの間、リアルタイム放射線医学のクリニックは796患者の事例を、AIベースの分析を用いて処理し、そのうち94事例はリアルタイムに放射線科医によって読影されるべきであるとフラグが立てられた。全部で4事例ががんと診断され、そのうち3事例が(例えば、生検によって)がんであると確かめられた。
[137]図6は、開示される実施形態による、スクリーニングマンモグラフィからの陽性予測値(PPV1)対コールバック率の例示的なプロットを示す。前向きな調査では、コールバック率11.8%でPPV1が3.2%となった。対照的に、中間的な放射線科医は、コールバック率11.6%でPPV1が4.4%を有する。
[138]図7は、開示される実施形態による、放射線科医の第1のセット、放射線科医の第2のセット、および放射線科医の合計セット全体についての、AIソートされたバッチにおける画像を読影するための解釈時間(Bi-RADS Assessment、および密度を含む)(左)と、ランダムにシャッフルされたバッチを読影したコントロールに対する解釈時間のパーセンテージ改善(右)とを比較する例示的なプロットを示す。この図面は、AI駆動のワークフローが、放射線科医の生産性を統計的にかなりの程度まで(約13%から21%の範囲で)改善できることを示している。
[139]
深層ニューラルネットワークを用いるスクリーニングマンモグラフィにおける疑わしい所見の分類
[140]深層学習は、多様なコンピュータビジョンおよび画像処理の用途に適用され得る。例えば、深層学習は、所与のタスクに関連する画像特徴を自動的に学習するために使用されてもよく、分類、検出から、セグメント化に渡る様々なタスクに使用される場合がある。深層ニューラルネットワーク(DNN)に基づく計算科学的モデルは、スクリーニングマンモグラフィなどの放射線医学的用途で開発され、疑わしさを識別するために、可能性としては異常または高リスク病変を識別するために使用され、放射線科医の生産性を向上することができる。場合によっては、深層学習モデルは、人間レベルのパフォーマンスに匹敵するか、それを上回ることさえできる。加えて、深層学習を使用して、一般的な放射線科医のパフォーマンスが乳房イメージング専門家のパフォーマンスに近づくよう高めることを支援することができる。例えば、一般的な放射線科医は通常、フェローシップに訓練された乳房放射線科医と比べて、がんの検出率が低く、リコール率がずっと高い。
[140]深層学習は、多様なコンピュータビジョンおよび画像処理の用途に適用され得る。例えば、深層学習は、所与のタスクに関連する画像特徴を自動的に学習するために使用されてもよく、分類、検出から、セグメント化に渡る様々なタスクに使用される場合がある。深層ニューラルネットワーク(DNN)に基づく計算科学的モデルは、スクリーニングマンモグラフィなどの放射線医学的用途で開発され、疑わしさを識別するために、可能性としては異常または高リスク病変を識別するために使用され、放射線科医の生産性を向上することができる。場合によっては、深層学習モデルは、人間レベルのパフォーマンスに匹敵するか、それを上回ることさえできる。加えて、深層学習を使用して、一般的な放射線科医のパフォーマンスが乳房イメージング専門家のパフォーマンスに近づくよう高めることを支援することができる。例えば、一般的な放射線科医は通常、フェローシップに訓練された乳房放射線科医と比べて、がんの検出率が低く、リコール率がずっと高い。
[141]深層学習は、悪性と良性の所見の区別を含め、スクリーニングマンモグラフィの解釈を行うために使用することが可能である。DNNモデルは、このタスク向けに訓練され、特に専門家ではない読影者のために、見逃されたがんを識別する、または偽陽性のコールバックを減少させる。
[142]DNNモデルは、一般向けにアクセス可能なDigital Database for Screening Mammography(DDSM)データセット(eng.usf.edu/cvprg/Mammography/Database.html)を使用して訓練された。DDSMは、10,000を超えるデジタル化されたスキャンフィルムのマンモグラフィ画像を伴う2,620の症例を含む。画像は、正常なマンモグラムと、疑わしい所見があるマンモグラムとに、均等に分割された。正常なマンモグラムは、患者の4年間フォローアップを経て確かめられた。疑わしい所見は、生検証明の良性の所見(51%)と生検証明の悪性の所見(49%)とに、さらに分割された。慣例的な臨床ケアの一部として、生検によってフォローアップされない明らかに良性の所見を持つすべての事例は、データセットから除外された。結果として、このデータセットで良性と悪性の所見を見分けることは、典型的な臨床的マンモグラフィスクリーニングのシナリオよりも困難な場合がある。
[143]DDSMデータセットは、訓練データセットを含むサブセット、検証データセット、およびテスト用データセットに分割された。訓練データセットを使用して、DNNは、乳房の良性の所見または正常領域と悪性の所見とを見分けるように訓練された。データセットは、深層学習プロセスを導くにあたり極めて重要な場合がある、画像内で腫瘍の場所を指摘するアノテーションを含んでいた。
[144]この二値分類タスクに対するDNNのパフォーマンスは、受信者操作特性(ROC)曲線の使用を通じてテスト用データセットに対して評価された(図8に示される通り)。DNNモデルは、悪性と良性の所見とを、ROC曲線(AUC)の0.89より下の面積によって示されるような高い精度で見分けるために使用された。対照的に、放射線専門医は通常、スクリーニングマンモグラフィでのがん検出のタスクについては、84.4%の感度と90.8%の特異性を達成することができる。DNNモデルは、DDSMデータセットに見られるより難しい事例で、悪性と良性の所見とを、79.2%の感度と80.0%の特異性で見分けるために使用された。放射線専門医に対するパフォーマンスのギャップは、一部、データセットのサイズが比較的小さいことに起因しており、より大きな訓練データセットを組み込むことにより軽減することができる。さらには、DNNモデルは、精度、感度、特異性、AUC、陽性予測値、陰性予測値、またはそれらの組合せに関して、一般的な放射線科医を上回るようにさらに構成することができる。
[145]高精度のDNNモデルが、限定的な一般向けのベンチマークデータセットを訓練することによって開発された。データセットは恐らく臨床的なセッティングにおけるものより困難であるが、DNNモデルは、ほぼ人間レベルのパフォーマンスで悪性と良性の所見とを見分けることができた。
[146]同様のDNNモデルが、セントルイス・ワシントン大学とパートナーシップ関係にあるセントルイスのJoanne Knight Breast Health Centerの臨床的なマンモグラフィデータセットを使用して訓練されてもよい。このデータセットは大規模な医療記録データベースを含んでおり、10万人を上回る患者を含み、4000例の生検確認のがん患者、150万画像から成る40万を超える画像セッションが含まれる。データセットは、深層学習プロセスを最適化するために、手動または自動でラベル付けされてもよい(例えば、アノテーションをビルドすることによって)。DNNのパフォーマンスは訓練データセットのサイズとともに著しく改善するため、この一意で膨大かつ豊富なデータセットにより、DDSMデータに対して訓練されたDNNモデルと比較してDNNモデルの感度および特異性が劇的に向上する場合がある。このような高精度DNNモデルは、乳癌スクリーニングに変革的な改善の機会を与え、すべての女性が専門家レベルのケアを受けられるようにする。
[147]
早期がん検出のための人工知能(AI)駆動の放射線医学クリニック
[148]はじめに
[149]乳癌は、米国の女性に最も広くみられ、2017年だけで25万を超える新規の診断があった。約8人に1人の女性が、その生涯の何らかの時点で乳癌であると診断される。処置の改善に関わらず、米国では4万人を超える女性が毎年乳癌により死亡する。スクリーニングマンモグラフィの広い受診により、一部の乳癌死亡率の低下に大きな進歩があった(1989年から39%低下)。乳癌のスクリーニングは、後期がんと比較して予後がずっと良好であり、処置コストが低い早期がんを識別することを助けることが可能である。この差は非常に重要な可能性がある:限局的な乳癌のある女性は99%近い5年生存率を有するが、転移性の乳癌のある女性の5年生存率は27%である。
[148]はじめに
[149]乳癌は、米国の女性に最も広くみられ、2017年だけで25万を超える新規の診断があった。約8人に1人の女性が、その生涯の何らかの時点で乳癌であると診断される。処置の改善に関わらず、米国では4万人を超える女性が毎年乳癌により死亡する。スクリーニングマンモグラフィの広い受診により、一部の乳癌死亡率の低下に大きな進歩があった(1989年から39%低下)。乳癌のスクリーニングは、後期がんと比較して予後がずっと良好であり、処置コストが低い早期がんを識別することを助けることが可能である。この差は非常に重要な可能性がある:限局的な乳癌のある女性は99%近い5年生存率を有するが、転移性の乳癌のある女性の5年生存率は27%である。
[150]このような実証されたベネフィットにも関わらず、現在女性の約半分しかAmerican College of Radiologyによって推奨されるレートでマンモグラムを受けていない。このマンモグラフィ利用の低さは、患者にとって、またヘルスケアシステムにとって、出費がかさみコストが高くなるという形で著しい負担となる場合がある。スクリーニングマンモグラフィの受診率は、予約取得の長い遅れ、不明確な価格設定、診察結果を受け取る長い待ち時間、紛らわしいレポートなど、一部患者経験の貧しさにより妨げられる。さらには、価格設定の透明性の欠如から生じる問題は、医療機関同士のコストの大きなバラつきによってひどくなる。同様に、診察結果を受け取るための伝達時間は、医療機関同士で一貫性がない。
[151]加えて、放射線科医のパフォーマンスの著しいバラつきにより、患者は場所と収入に応じて非常に様々なケアの基準を経験することになる。例えば、がん検出率は、10パーセンタイルの放射線科医と比較して90パーセンタイルの放射線科医について2倍以上高くなっている。偽陽性率(例えば、健康な患者が誤ってフォローアップ診察にリコールされる割合)には、これらの2つのグループでさらに大きな差がある。米国で行われるすべてのスクリーニング検査を集約すると、コールバックされる約96%の患者は偽陽性である。がんの大きな社会的そして個人的な負担を、しばしば患者の貧しい経験、一貫性のないスクリーニングパフォーマンス、および大きなコスト変動と併せて考えると、AIベースまたはAI支援のスクリーニング手法が、マンモグラフィスクリーニングのこの臨床的な精度を著しく改善するために開発されることが可能である。
[152]人工知能およびソフトウェアにおけるイノベーションは、がんの早期における正確な検出を含む健康上の結果に著しい改善を達成することに向けて活用することが可能である。このような改善は、コスト透明性、予約のスケジューリング、患者ケア、放射線医学的ワークフロー、診断精度、結果伝達からフォローアップに至る患者の行動において、1つまたは複数のステップに影響を及ぼす可能性がある。イメージングセンターのAI駆動のネットワークは、高品質サービス、適時性、精度、および費用対効果を実現するように開発され得る。そのようなクリニックでは、女性は直ちにマンモグラムをスケジューリングすること、および単一回の訪問で女性が帰る前にがんの診断を受け取ることができる。AI駆動のクリニックは、本開示の「リアルタイム放射線医学」方法およびシステムを使用することによって、従来的な2回訪問のスクリーニング-診断パラダイムを単一回の訪問に変形することが可能である。人工知能は、トリアージエンジンを使用して臨床的なワークフローを患者ごとにカスタマイズするために、またスクリーニング検査をどのように読み取るかを調整して放射線科医の精度を著しく向上させる(例えば、放射線科医の疲労を低減することにより)ために使用されてもよく、それによってがん検出の精度を改善する。スクリーニング/診断プロセスに対しては、AIベースまたはAI支援の手法を使用して、患者スケジューリング、顧客アウトリーチを通じたスクリーニングガイドライン遵守の改善、および患者が対面するアプリケーションを用いたレポート伝達の適時性など、追加的な改善を実現することが可能である。自己改善システムは、データを生成してAIベースのシステムを改善するより良好なクリニックを作り上げるために、AIを使用してもよい。
[153]AI駆動の放射線科ネットワークを作る重要な構成要素は、患者獲得を通じて成長を進めることである。システムの他の構成要素は放射線医学的ワークフローのプロセスを合理化し、患者に改善および合理化された体験を提供することができる一方で、患者の募集と登録は、高パフォーマンスのために十分なデータを収集してAI駆動システムを訓練するために重要である。
[154]さらには、AI駆動クリニックは、患者がクリニックに到着する前の患者体験を改善することによって、スクリーニングマンモグラフィに対する支障を低減する場合がある。このことは、受診を制限する2つの主な障壁に対処することを含み得る:(1)診察のコストについての懸念、および(2)便利な場所にあるクリニックに気付かないこと。従来的なクリニックにあるように、価格と利用可能性がまったく不透明な場合、価格とサービスには著しい変動が存在する場合があり、それによって患者の予約のスケジューリングに対する支障となっている。
[155]スケジューリングプロセスを合理化して患者への透明性を与えるためにAIベースのユーザアプリケーションが開発されてもよい。アプリケーションは、ユーザの保険がきくクリニックの地図、ならびに予約に利用可能な時間をユーザに提供するように構成されてもよい。健康保険に入っている人には、スクリーニングマンモグラムは2Dおよび3Dの両方とも自己負担なしである。これは、負担が生じ得るあらゆる潜在的なコストとともに、スケジューリングの時点で患者に明確に示され得る。診察結果の適時性についての保証も患者に提示される場合があり、このことは、患者に予約をスケジューリングすることを億劫にさせ得る、患者の潜在的な不安の原因に対処するものである。
[156]アプリケーションは、患者の保険を確かめて、必要であればスケジューリングプロセスの間に、かかりつけ医(PCP)からの作業命令を要求するように構成されてもよい。アプリケーションは、患者のクリニック訪問の間、より効率的に患者を処理するために、予診フォームのユーザ入力を受信するように構成されてもよい。患者に診察の前に完了すべき残りのフォームに残りがあれば、残りのフォームを完了するために患者にはクリニックにチェックインする際にデバイスが与えられる場合がある。アプリケーションは、このようなフォームの電子的な入力を容易にして、現在の標準的なケアで行われるような、手書きの紙のフォームでの時間がかかり、誤りが生じやすいタスクを、低減または除去するように構成されてもよい。診察日に先立って書類のユーザ入力を容易にすることによって、アプリケーションは、患者がより合理化された体験を得られるようにして、オンサイトでの運用上のタスクに割かれる時間とリソースが少なくなる。
[157]患者の以前得られたマンモグラムも、診察に先立って取得される場合がある。提携クリニックで得られた画像では、このプロセスは患者に分かりやすく生じ得る。訪問前に以前の画像を取得することによって、新しく得られる画像を迅速にレビューするための潜在的なボトルネックが除去され得る。
[158]予約をスケジューリングした後、アプリケーションは、出席率を向上させるべく患者に近づく診察についてのリマインダを提供するように構成されてもよい。アプリケーションはまた、不安を最小限にすべく、また診察室で手順の説明に費やす時間を減らすべく、患者に診察手順についての情報を事前に提供するように構成されてもよい。さらには、かかりつけ医(PCP)との関係性を築くために、紹介医は自身の患者がマンモグラフィ予約をスケジューリングしているかどうかを確認してもよい。これは、医師がコンプライアンスを評価して、医師の推奨にしたがって適時的に予約を登録していない患者を奨励することができる。
[159]リアルタイム放射線医学システム
[160]従来型の乳癌スクリーニングパラダイムは、患者に不安をもたらす著しい遅れを含む場合がある。これは、この予防的ケアを受けることを選ぶ女性の数を減らし、彼女らのがんの発見が後になるリスクにさらす可能性があり、その時には処置がより困難でより命に関わることになる。通常の患者は、スクリーニングマンモグラムのためにクリニックを訪問し、クリニックで約30分過ごした後に帰る。女性は、その後30日間、電話または書面を待機して、スクリーニングマンモグラムに疑わしい異常性があること、そして女性がフォローアップ診断予約をスケジューリングすべきであるという知らせを受け取る。次に、患者はその予約にもう1週間待ち、その間、女性は追加的なイメージングを受け、生検が必要かどうかを判定してもよい。
[160]従来型の乳癌スクリーニングパラダイムは、患者に不安をもたらす著しい遅れを含む場合がある。これは、この予防的ケアを受けることを選ぶ女性の数を減らし、彼女らのがんの発見が後になるリスクにさらす可能性があり、その時には処置がより困難でより命に関わることになる。通常の患者は、スクリーニングマンモグラムのためにクリニックを訪問し、クリニックで約30分過ごした後に帰る。女性は、その後30日間、電話または書面を待機して、スクリーニングマンモグラムに疑わしい異常性があること、そして女性がフォローアップ診断予約をスケジューリングすべきであるという知らせを受け取る。次に、患者はその予約にもう1週間待ち、その間、女性は追加的なイメージングを受け、生検が必要かどうかを判定してもよい。
[161]現在のパラダイムは、大規模実施(例えば、1日あたり100を上回る患者)でスクリーニングされる患者のボリュームによって動機付けされる。このようなイメージングセンターは、放射線科医が所与の日に行われたスクリーニングマンモグラムをプロセスすることができるより前に、通常少なくとも1~2日分の読影する必要があるスクリーニング診察のバックログを有する。このような事例のいずれかが診断的なワークアップを必要とする場合、その診察は、診断的な診察の長さの大きな変動(例えば、20分から120分に渡る)のために、すぐに行うことができない場合が多い。スケジューリングは、これを考慮せず、結果として患者の待ち時間を長引かせ、技師向けのワークフローが不十分なものとなる。
[162]自身のスクリーニングマンモグラムの即時的なリアルタイムの読影を受け取った患者は、3週間後までそれがない患者に比べてあまり大きな不安を体験しなくてもよい。対照的に、スクリーニングで偽陽性(疑わしいとフラグが立てられた正常な事例)を受け取ったが、即時的な読影を受け取った女性は、正常なマンモグラムを受け取った女性の不安とほぼ同じレベルを体験した。このような女性のほとんどは、自分自身が異常なスクリーンを有すると意識しなかった。しかしながら、異常なスクリーンを有すると意識する女性は、乳房関連の懸念および他の医学的問題について、さらに医学的な注意を探す傾向がある。さらには、女性は、自分自身のマンモグラムの結果とともに自分がマンモグラフィクリニックから帰ると分かっている場合、スクリーニングプロセスにより満足している場合があり、将来的なスクリーニング推奨にずっとしたがいやすい場合がある。そのような患者の満足度の向上は、健康計画におけるメンバー保持を改善し得る。追加的に、疑わしい事例の即時的な読影は、乳癌診断までの時間を減少させる場合があり、それによって患者ケアおよび結果を改善する。
[163]場合によっては、クリニックは、ボリュームを制限することによってリアルタイムのサービスを提供することができる。そのようなクリニックは、必要が生じた場合に患者が診断的な診察を伴うスクリーニング手順を即時的にフォローアップすることができるように、所与の時間に数人の患者だけのスケジューリングをしてもよい。この手順は、高額で、時間がかかり、大規模に行うには受け入れられない場合があり、これはやはりほとんどの女性が、潜在的に生活を変えるような結果を数週間待つ必要があることを意味している。おおまかに400万人の女性が毎年、そのような不愉快なスクリーニングプロセスに遭遇する可能性がある。
[164]本開示の方法およびシステムを使用して、AIベースのトリアージシステムが、スクリーニングマンモグラフィ向けに開発されてもよい。
[165]スクリーニング診察画像は、臨床的なイメージングシステムから受信されるため、これらの画像は、AI駆動Triage Engineによって処理されてもよく、次いで、このエンジンは患者の事例を複数のワークフローのうちの1つに階層化する。例えば、複数のワークフローは、2つのカテゴリを含んでもよい(例えば、正常および疑わしい)。別の例として、複数のワークフローは、3つのカテゴリを含んでもよい(例えば、正常、不確実、および疑わしい)。次いで、このようなカテゴリのそれぞれは、担当のワークフローの特定のセットを実施することを専門とする専任の放射線科医の異なるセットによって扱われ得る。
[165]スクリーニング診察画像は、臨床的なイメージングシステムから受信されるため、これらの画像は、AI駆動Triage Engineによって処理されてもよく、次いで、このエンジンは患者の事例を複数のワークフローのうちの1つに階層化する。例えば、複数のワークフローは、2つのカテゴリを含んでもよい(例えば、正常および疑わしい)。別の例として、複数のワークフローは、3つのカテゴリを含んでもよい(例えば、正常、不確実、および疑わしい)。次いで、このようなカテゴリのそれぞれは、担当のワークフローの特定のセットを実施することを専門とする専任の放射線科医の異なるセットによって扱われ得る。
[166]図9は、開示される実施形態による、AI対応リアルタイム放射線医学システムおよび患者のモバイルアプリケーション(アプリ)を使用する、クリニックを通じた患者フローの概略の例を示す。患者は、ウェブサイトまたは患者用アプリに登録することによって開始する。次に、患者は患者用アプリを使用して放射線医学スクリーニングの予約をスケジューリングする。次に、患者は患者用アプリを使用して予診フォームを完了させる。次に、患者はクリニックに到着してスクリーニング診察を受ける。次に、患者のスクリーニング診察から取得された医学的画像に対してAIベースの放射線医学的評価が実施される。次に、患者の画像および診察結果が患者用アプリを通じて患者に提供される。次に、必要があれば、または推奨されれば、患者は患者用アプリを使用して予約を再スケジューリングする。スクリーニング診察プロセスは、以前と同様に進められてもよい。
[167]図10は、開示される実施形態による、AI支援放射線医学的評価ワークフローの概略の例を示す。まず、患者の電子カルテ(EHR)と医学的画像を含むデータセットが用意される。次に、AIベースのトリアージエンジンは、EHRと医学的画像を処理してデータセットを分析して、データセットを正常と思われる、疑わしい可能性がある、または疑わしいと思われる、として分類する。次に、ワークフロー分配モジュールは、患者のデータセットを、正常と思われる、疑わしい可能性がある、または疑わしいと思われるとのデータセットの分類に基づいて、それぞれ、正常な場合のワークフロー、不確実な場合のワークフロー、および疑わしい場合のワークフロー、の3つのワークフローのうちの1つに分配する。3つのワークフローのそれぞれは、放射線科医レビューまたはさらなるAIベースの分析(例えば、訓練済アルゴリズムによって)を含んでもよい。
[168]マンモグラフィスクリーニング診察の大多数は、正常カテゴリに分類され得る。放射線科医の第1のセットをこのワークフローだけに集中させることによって、「バッチ読影」の概念と価値、およびそれに関連する生産性ゲインが適用され拡張され得る。この放射線科医の第1のセットによって扱われる事例はほとんどすべて正常な事例であり得るため、大幅に変わった事例を扱うことによって生じるコンテキストスイッチおよびペナルティは少ない可能性がある。AIベースのシステムでは、レポートは自動的に事前埋め込みされてもよく、放射線科医がレポートを書くよりも、画像の解釈にかなり多くの時間を費やすことができるようにしている。放射線科医がAI評価の正常事例に同意せず、その事例は疑わしいと考える稀な事例では、そのような事例は普段通りに扱ってもよく、患者は診断的な診察をスケジューリングしてもよい。このような正常事例は、AIベースのシステムが類似していると判定してある事例をグループ化することによって生産性の改善を実現するために、さらにずっと同質なバッチへと、さらにサブ分割されてもよい。例えば、すべてのAI判定の高密度乳房を一緒にバッチ化すること、またはAI導出の特徴に基づいて視覚的に類似している事例をバッチ化すること。
[169]マンモグラフィスクリーニング診察のごく一部は、不確実な場合のワークフローに分類される場合がある。そのようなセッションは、AIシステムは正常であるとして分類しないが、完全に疑わしいというしきい値もまた満足しない所見を伴う場合がある。これらは通常、正常な場合または疑わしい場合のワークフローの事例に比べて、放射線科医評価の1セッション当たりに著しく時間を必要とする非常に複雑な事例であり得る。このような理由で、別個の放射線科医の第2のセットに、この少数の作業を行うよう集中させることが有益な場合があり、この作業はあまり同質性がなく、潜在的に著しく解釈およびレポーティング要求事項が多い。これらの放射線科医は、数年の経験または訓練を通じ、この困難な事例の読影において、より専門性が高い。この専門化は、AIが判定するカテゴリまたは特徴に基づいて、さらにより具体的になる場合がある。例えば、ある放射線科医のグループは、AI判定の腫瘍塊を正しく評価することについて、他のグループよりも良好なパフォーマンスを見せる場合がある。したがって、アルゴリズムによってそのように識別される診察は、このより好適な専門家のグループにルーティングされてもよい。場合によっては、放射線科医の第2のセットは、放射線科医の第1のセットと同じであるが、異なる事例のセットの放射線医学的評価は、事例の優先順位に基づいて、異なる時間に行われる。場合によっては、放射線科医の第2のセットは、放射線科医の第1のセットのサブセットである。
[170]マンモグラフィスクリーニング診察の最も少数であるが最も重要な部分は、疑わしい場合のワークフローに分類され得る。放射線科医の第3のセットは、この役割に割り当てられてもよく、これらの事例を自身の「オンコール」義務として効果的に読影する。放射線科医の時間のほとんどは、スケジューリングされた診断的な診察を行うのに費やされる場合がある。しかしながら、診察間のダウンタイムでは、放射線科医は、可能な限り早く診断を検証できるように、あらゆる疑わしい事例に対するアラートを受ける場合がある。このような事例は、患者がフォローアップの診断的な診察を可能な限り早く始めることができるように、効率的に扱うために極めて重要な場合がある。場合によっては、放射線科医の第3のセットは、放射線科医の第1のまたは第2のセットと同じであるが、異なる事例のセットの放射線医学的評価は、事例の優先順位に基づいて、異なる時間に行われる。場合によっては、放射線科医の第3のセットは、放射線科医の第1または第2のセットのサブセットである。
[171]場合によっては、ワークフローは、医学的画像を分析して医学的画像の放射線医学的評価を実施する難しさを判定するために、AIベースのアルゴリズムを適用すること、次いで判定された難しさの程度に基づいて、放射線医学的評価のために医学的画像を優先順位付けすること、または医学的画像を(例えば、複数の異なる放射線科医のセットのうちの)放射線科医のセットに割り当てることを含んでもよい。例えば、難しさの低い事例(例えば、より「慣例的な」事例)は、技能または経験の程度が比較的低い放射線科医のセットに割り当てられてもよく、一方で難しさの高い事例(例えば、より疑わしいか、慣例的ではない事例)は、技能または経験の程度が比較的高い放射線科医(専門化された放射線科医)の異なるセットに割り当てられてもよい。例えば、難しさの低い事例(例えば、より「慣例的な」事例)はスケジュールの空きレベルが比較的低い放射線科医の第1のセットに割り当られてもよく、一方で難しさの高い事例(例えば、より疑わしいか、慣例的ではない事例)は、スケジュールの空きレベルが比較的高い放射線科医の異なるセットに割り当てられてもよい。
[172]場合によっては、難しさの程度は、画像を完全に評価するために必要な推定時間長さによって測ってもよい(例えば、約1分、約2分、約3分、約4分、約5分、約6分、約7分、約8分、約9分、約10分、約15分、約20分、約25分、約30分、約40分、約50分、約60分、または約60分より長い)。場合によっては、難しさの程度は、複数の無関係の放射線医学的評価に渡る医学的画像の放射線医学的評価の一致または合意の推定程度によって測ってもよい(例えば、異なる放射線科医によって、または同一の放射線科医によって異なる日に行う)。例えば、放射線医学的評価の一致または合意の推定程度は、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、約96%、約97%、約98%、約99%、または約99%より高くてもよい。場合によっては、難しさの程度は、放射線科医の教育、経験、または専門知識の所望のレベルによって測ってもよい(例えば、約1年未満、約1年、1~2年の間、約2年、2~3年の間、約3年、3~4年の間、約4年、4~5年の間、約5年、5~6年の間、約6年、6~7年の間、約7年、7~8年の間、約8年、8~9年の間、約9年、9~10年の間、約10年、または約10年より長い)。場合によっては、難しさの程度は、推定される感度、特異性、陽性予測値(PPV)、陰性予測値(NPV)、または放射線医学的評価の精度(例えば、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、約96%、約97%、約98%、約99%、または約99%より高い)によって測ってもよい。
[173]場合によっては、ワークフローは、医学的画像を分析して医学的画像のカテゴリ化を判定するために、AIベースのアルゴリズムを適用すること、次いで判定された医学的画像のカテゴリ化に基づいて、放射線医学的評価のために医学的画像を優先順位付けすること、または医学的画像を(例えば、複数の異なる放射線科医のセットのうちの)放射線科医のセットに割り当てることを含んでもよい。例えば、類似の特性を有する事例のセットは、ともにカテゴライズされて同一の放射線科医または放射線科医のセットに割り当てられてもよく、それによってコンテキストスイッチの低減および効率性と精度における向上を達成する。類似の特性は、例えば、ROIがある身体の部位、組織の密度、BIRADSスコアなどに基づいていてもよい。場合によっては、ワークフローは、医学的画像を分析して医学的画像の病変タイプを判定するために、AIベースのアルゴリズムを適用すること、次いで判定された医学的画像の病変タイプに基づいて、放射線医学的評価のために医学的画像を優先順位付けすること、または医学的画像を(例えば、複数の異なる放射線科医のセットのうちの)放射線科医のセットに割り当てることを含んでもよい。
[174]場合によっては、ワークフローは、市場ベースのシステムを介して放射線科医に事例を自身に割り当てさせることを含んでもよく、それによってそれぞれの事例がAIベースのアルゴリズムによって評価され、放射線医学的評価の適当な価格またはコストを判定する。そのような価格またはコストは、放射線医学的評価が完了すると、各放射線科医へ補填される定められた相対的な価値単位であり得る。例えば、ある事例の各放射線医学的評価は、定められた特性(例えば、難しさ、診察時間の長さ)に基づいて価格決定されてもよい。そのようなワークフローでは、事例は放射線科医に割り当てられなくてもよく、それによって比較的慣例的な、または容易なものを選んで事例当たり高い払い戻し率を得る放射線科医の問題が回避される。
[175]場合によっては、ワークフローは、事例を、放射線科医の評価されたパフォーマンス(例えば、放射線医学的評価を行う際の、放射線科医の以前の感度、特異性、陽性予測値(PPV)、陰性予測値(NPV)、精度、または効率)に基づいて、放射線科医に割り当てることを含んでもよい。そのようなパフォーマンスは、品質制御を確かにするために、コントロール事例(例えば、陽性または陰性のコントロール事例)を目隠し的なやり方で放射線科医に割り当てることに基づいて判定または改良されてもよい。例えば、より良好なパフォーマンスを持つ放射線科医は、ボリュームの多い事例または高い価値もしくは補填のある事例を割り当てられてもよい。所与の放射線科医(例えば、任意の所与の日)に対して、このような明確な役割を定義することによって、各ワークフローは、タスク固有のニーズに対して個々に最適化することができる。AI駆動のトリアージエンジンは、リアルタイム放射線医学を大規模に患者へ伝達できるようにすることが可能である。システムはまた、専門知識に基づいて事例の動的な割り振りを可能にする場合がある。例えば、フェローシップに訓練された乳房イメージング者は、彼らの卓越した経験が活用され得る不確実な場合のワークフローでは最も価値のあるイメージング者であり得る。その上、我々は、クリニックのネットワーク越しに、クリニックをまたいだスクリーンの解釈を行うことが可能であり、あらゆる個々のクリニックのスタッフ配置や患者ベースに関わらず放射線科医の時間の有効利用を確かにするよう行うことが可能である。
[176]レポート伝達は次のように行われてもよい。Mammography Quality Standards Act(MQSA)は、すべての患者は自身のマンモグラフィレポートの書面のレイサマリーを直接的に受け取ることを義務付けている。このレポートは、マンモグラムから30日以内に送られなければならない。ケアを進めて不安を和らげるために口頭での結果が使用されることが多いが、これは書面のレポートによってサポートされなければならない。レポートは、郵送、電子的に送信、または患者に手渡しすることが可能である。通常、クリニックは、紙の郵便を使用してレポートを患者に配達することができる。AIベースのクリニックは、マンモグラフィレポートを、電子的に患者用アプリケーションを介して配達してもよい。ソース画像はまた、患者が情報を容易に取得して他のクリニックに転送することができるように、電子的に利用可能にされてもよい。リアルタイム放射線医学ワークフローにおける患者は、スクリーニングと診断的なレポートを、クリニックから帰る前に即時的に受け取ることができる。
[177]スクリーニング結果の適時的なレポーティングは、患者満足度に極めて重要な場合がある。結果を2週間より長く待つこと、および疑問に答えてもらうために誰かに連絡することができないでいることは、患者の不満に寄与する主な理由として考えられてきた(これはまた将来的なスクリーニング率の低下となり得る。)このシステムは、患者が不意に誤ったレポートを受け取らないこと、および患者が自身の結果をいつ受け取ることができるかについて、不確実さを持たないことを確実にすることができる。
[178]AIベースのシステムは、以下のように絶えず訓練されてもよい。臨床的な実務が運用されるに伴い、新しいデータが絶えず収集され、AIシステムをさらに訓練して改良するために使用され、それによりケアの品質をさらに改善し、患者体験への新しい改善を可能にする。各患者診察は、システムにアノテーション付けされた、恐らくは生検証明の例を与え、データセットに追加する。特に、リアルタイム放射線医学システムのワークフローは、価値の高い事例を捉えることを優先付けすることを容易にする。偽陽性および偽陰性(フラグは立てられていないが本当は疑わしい事例)の識別は、教育的な価値の高い難しい例を提供することによってシステムのパフォーマンスを向上させるために重要な場合がある。正しく(例えば、放射線科医のレビューに関してグラウンドトゥルースとして)分類される事例でさえ、有用なフィードバックを与えることができる。このような事例を訓練データセットに組み込むことは、システムに不確実なキャリブレーションについての情報の価値あるソースを提供することができ、これはAIベースのシステムによって作り出される信頼値が正確であることを確かにする。これは、全体的なロバスト性、ひいてはシステムの信用を劇的に向上させる場合がある。エンドツーエンドの患者ワークフローを改善すること、および放射線科医をそのループに維持することによって、AIベースの臨床システムは上で概説した重要な情報を自動的に発見することができる。得られるシステムは常に改善され、常に高品質の患者ケアおよび放射線科医支援を提供することができる。
[179]AI駆動のマンモグラフィスクリーニングクリニックは、スクリーニングプロセスを通じて患者に高品質なサービスと精度を提供することができる。患者は、クリニックを訪ね、がんについてのスクリーニングを受け、あらゆる必要なフォローアップ作業を受け、そしてその診断を手に帰ることができ、それによって迅速な結果を伴う一連の単一の訪問の間に、スクリーニングと診断全体のプロセスを完了することができる。患者用アプリケーションは、価格の透明性、手間のかからないスケジューリング、誤りのないフォーム記入、およびレポートと画像の瞬時伝達を実現するように構成され、それによって患者スクリーニングプロセスの容易さ、ストレス、および効率を改善することができる。
[180]放射線科医は、AIトリアージエンジンによって編成される、正常な場合、不確実な場合、および疑わしい(または画像のAI評価に基づく代替的なカテゴリ化)場合のワークフローという専門化されたセットを採用することによって、より正確でより生産性の高い結果を提供することができる。AIシステムが学習し、臨床医の能力を高めるため、臨床医はさらに有能になるかも知れない。AIベースまたはAI支援のマンモグラフィは、低コストかつ高効率で大規模人数スケールに対して行われてもよく、それによってがんスクリーニングプロセスおよび患者の結果を向上する。
[181]
人工知能技術と組み合わせた場合の乳癌スクリーニングマンモグラフィにおけるリアルタイム放射線医学
[182]放射線科医による即時的なレビューのために疑わしいスクリーニングマンモグラムを優先付けするように構成されたソフトウェアシステムが開発され、それによって診断的なフォローアップまでの時間を低減する。ソフトウェアシステムは、疑わしいマンモグラフィ事例についてのレビュー時間を短縮することによって、患者不安ならびに処置までの全体的な時間を大幅に低減することを目的として開発される。第1の評価と第2の評価の間が最大で約2~4週間になることも多い、待ち時間の低減は、このような実際に乳癌が陽性である患者の平均余命を延ばすよう期待され得る。さらなる潜在的なベネフィットは、ソフトウェアが何らかのがんを見落とす見込みを減らすことができることである。
[182]放射線科医による即時的なレビューのために疑わしいスクリーニングマンモグラムを優先付けするように構成されたソフトウェアシステムが開発され、それによって診断的なフォローアップまでの時間を低減する。ソフトウェアシステムは、疑わしいマンモグラフィ事例についてのレビュー時間を短縮することによって、患者不安ならびに処置までの全体的な時間を大幅に低減することを目的として開発される。第1の評価と第2の評価の間が最大で約2~4週間になることも多い、待ち時間の低減は、このような実際に乳癌が陽性である患者の平均余命を延ばすよう期待され得る。さらなる潜在的なベネフィットは、ソフトウェアが何らかのがんを見落とす見込みを減らすことができることである。
[183]一部の研究では、スクリーニングでは偽陽性(疑わしいとフラグが立てられた正常な事例、BIRADS 0)であるが、即時的なフォローアップを受け取った女性は、正常な場合の診断を受け取った女性の不安とほぼ同じレベルを体験する場合がある。このような女性の多くは、自分自身が異常なスクリーニング結果を持つと意識すらしない場合がある。したがって、即時的なフォローアップのケアは、偽陽性のスクリーニング結果により生じる潜在的な不安を和らげることができる。
[184]その一方で、偽陽性のスクリーニング結果を受け取り、数日から数週間後にフォローアップの診断的な診察にコールバックされる女性は、乳房関連の懸念および他の医学的問題について、さらに医学的な注意を探す傾向がある。したがって、マンモグラフィスキャンと同一クリニック訪問の間に最終的なマンモグラフィ結果を受け取ることができる女性は、スクリーニング体験により満足し、将来的なスクリーニング推奨に高い遵守率を有する可能性が高い場合がある。
[185]しかしながら、多くの乳房イメージングセンターは、即時的なフォローアップ診察を伝達することができないことがある。これは、スケジューリング制約、他の機関からの以前の評価を受け取る適時性、および取得直後の各診察の読影による生産性の損失を含む、いくつかの困難に起因する可能性がある。恐らく最も重要なことであるが、いくつかの乳房スクリーニング事例をまとめて読影することは、読影者の評価精度を大幅に向上させる。これにより、診察の読影前に十分に大きな事例のバッチが収集されるまで待機する必要が生じ、指示された場合に患者へ即時的な結果とフォローアップ診察を提供することを不可能にする。
[186]機械学習ベースの方法は、マンモグラフィおよびトモシンセシス画像において疑わしい所見を評価するために採用される。トリアージソフトウェアシステムが、より適時的なレポート配信および疑わしい事例のための(例えば、バッチ読影セッティングにおいて行われるような)フォローアップを可能にするために、スクリーニングマンモグラフィ用に機械学習を使用して開発される(図11に示される通り)。医学的画像は、処理のためにリアルタイム放射線医学システムに与えられる。リアルタイム放射線医学システムのAIベースのトリアージエンジンは、医学的画像を処理して、画像を疑わしいか、それとも疑わしくない(例えば、正常または慣例的)か、を分類する。画像がAIベースのトリアージエンジンによって疑わしいと分類された場合、画像は即時的な放射線科医レビューに送られる(例えば、最初のスクリーニング予約と同一の訪問の間に、または同じ日のうちに)。即時的な放射線科医レビューは、疑わしい事例を確かめることにつながる(それにより即時的な診断的な診察が発注されることになる)、または疑わしい事例であることを覆す場合がある(それにより次回のスケジューリングされた慣例的な年に一度のスクリーニングが実施されることになる)。画像がAIベースのトリアージエンジンによって疑わしくない(例えば、正常または慣例的)と分類された場合、画像は慣例的な放射線科医レビューに送られる。慣例的な放射線科医レビューは、事例が疑わしいと評価する場合があり(それにより慣例的な診断的な診察が発注されることになる)、または事例が疑わしくないとの確認となる場合がある(それにより次回のスケジューリングされた慣例的な年に一度のスクリーニングが実施されることになる)。
[187]このソフトウェアは、大規模乳房スクリーニングクリニックが、異常が見られるマンモグラフィ結果を有する患者に、同一日または同一訪問での診断的なフォローアップイメージングを渡すことを可能にする。そのような素早い診断的なフォローアップイメージングを活用することは、乳房イメージングクリニックが最高レベルのサービスとともに最高精度を伝達すること、および患者不安を大幅に低減することへの道を切り開くことができる。
[188]このような機械学習ベースの手法を使用して、AIによって評価されない患者およびフォローアップの診断的な評価を同一日に受け取らない患者と比べて、患者が高い確率でより長い寿命を有するよう、真の腫瘍の治療までの時間が低減される。
[189]マンモグラフィおよびトモシンセシス画像における疑わしい所見を評価するための機械学習ベースの手法は、次のようにいくつかの利点および目的を検討する。第1に、最初のスクリーニング診察から診断的イメージング結果の伝達までの時間が、乳癌スクリーニングについて、(恐らくは大幅に)低減され、正確な診断の見込みが改善される。例えば、そのような診断は、さらなる感度、特異性、陽性予測値、陰性予測値、受信者操作特性より下の面積(AUROC)、またはそれらの組合せを伴って作り出されてもよい。第2に、放射線科医と人工知能とを組み合わせる手法は、最初の評価のスピードおよび/または品質を効率的に改善する場合がある。第3に、より高度な診断的な診察(例えば、追加的なX線ベースのイメージング、超音波イメージング、別のタイプの医学的イメージング、またはそれらの組合せ)が、患者が自身のスクリーニング結果を受け取ってから短期間(例えば、60分以内)のうちに完了されてもよい。第4に、そのような方法は、結果およびフォローアップイメージングのより適時的な伝達による、患者満足度を改善することにつながり得ることが有利である。
[190]方法
[191]臨床的なワークフローは、患者へより高いレベルのサービスを提供するよう最適化される。より多くの患者およびデータが訓練データセットに収集されるにつれ、機械学習アルゴリズムは、絶えずそのコンピュータ支援の診断の精度(または感度、特異性、陽性予測値、陰性予測値、AUROC、もしくはその組合せ)が改善する。
[191]臨床的なワークフローは、患者へより高いレベルのサービスを提供するよう最適化される。より多くの患者およびデータが訓練データセットに収集されるにつれ、機械学習アルゴリズムは、絶えずそのコンピュータ支援の診断の精度(または感度、特異性、陽性予測値、陰性予測値、AUROC、もしくはその組合せ)が改善する。
[192]コンピュータアルゴリズムおよびソフトウェアは、乳房スクリーニング画像を恐らくは異常および正常カテゴリに、高い精度で自動的に分類するように開発される。そのようなソフトウェアは、大規模乳房スクリーニングクリニックが、異常が見られる初期スクリーニング結果を有する患者に、同一日または同一訪問での診断的なフォローアップイメージングを渡すことを可能にし得る。このことはまた、臨床的な運用に対する変化、特に最初の検査の60分間の間にスクリーニング事例をどのように読み取り、第2の診断的な評価をどのように行うことができるか、に対する変化を評価することを必要とする。
[193]素早いスクリーニング手法は、乳房スクリーニングクリニックにおいてすべての患者に対して行われる。スクリーニングを受ける患者の約10%は、疑わしいという結果を有し、続いて同日のうちまたは同一訪問の間に診断的な診察が行われるよう推奨される。スクリーニング結果およびフォローアップの診断的な診察の素早いターンアラウンドタイムは、臨床環境における放射線科医と、臨床スタッフと、患者との間での注意深いコーディネートにより可能となる。さらに情報が収集されるにつれ、ますます大規模な訓練データセットで訓練される機械学習は、疑わしいマンモグラフィスキャンを検出する際にさらに高いレベルの精度を与える。
[194]スクリーニング診察の取得が完了すると、画像はルータに送られ、ソフトウェアにより受信され、素早く分類される(例えば、約1分以内に)。スクリーニングが機械学習アルゴリズムによって恐らく正常であるとしてマークされる場合、患者は自身の訪問を終え、普段通りにクリニックから退出する。しかしながら、スクリーニングが機械学習アルゴリズムによって恐らく異常であるとしてフラグが立てられる場合、患者は事例が放射線科医によって迅速にレビューされる間、最大約10分待つように言われる(図11に示される通り)。
[195]所与のクリニックが1日当たり約30患者をスクリーニングすること、および陽性の可能性が10%の率であると仮定すると、通常は機械学習アルゴリズムによって1日当たり約3患者が陽性であると分かり、放射線科医によるレビューの後、リアルタイムの診断的なフォローアップに適していると指定されることになる(例えば、普通、追加的なトモシンセシスイメージングと、恐らく超音波による診察)。
[196]リアルタイム放射線医学方法およびシステムの有効性を実証するために、いくつかのメトリクスが使用される。第1に、慣例的なワークフローおよび提案されるリアルタイムのワークフロー下での患者の最初のスクリーニング診察と診断的イメージング結果の伝達との間の時間の変化が、事例のスクリーニングがレビューされる時期の遅れの変化、ならびに文書の郵送と予約のスケジューリングなどのロジスティックスにおける変化の両方を捉えるために、測定され得る。
[197]第2に、リアルタイム放射線医学モデルが、収集された最新のデータに基づいて絶えず(例えば、毎月ベースで)評価される。例えば、コンピュータビジョンのアルゴリズムのパラメータは、すぐ後続のスクリーニング期間に向けて(例えば、一カ月)その精度を改善するために微調整および変更される。コンピュータプログラムへの変更の有効性は、数百の代表的な診察のブラインドテストデータセットに対して、および後続のスクリーニング期間からの暫定結果から評価される。
[198]第3に、患者満足度調査が定期的にレビューされ、短時間(例えば、約60分)内のフォローアップの診断的な診察をより良好に可能にするために、運用上のプロセスがどのように改善され得るかを判定するのを助ける。
[199]以下のデータは、リアルタイム放射線医学ワークフローを介してマンモグラフィスクリーニング/診断的評価を受ける患者ごとに収集されてもよい:患者人口統計学(例えば、年齢、人種、身長、体重、社会経済的背景、喫煙状態など)、患者イメージングデータ(例えば、マンモグラフィにより取得)、患者の結果(例えば、スクリーニングおよび診断的な診察についてのBIRADS、ならびに適用可能であれば生検病理結果)、患者の訪問イベントのタイムスタンプ、バッチ読影およびリアルタイム事例についての患者のコールバック率、ならびにスクリーニングおよび診断的な事例についての放射線科医解釈時間。
[200]本開示の方法およびシステムを使用して、以下を含む潜在的なベネフィットを有するリアルタイム放射線医学が行うことができる:他のやり方では認識されない可能性があった(または腫瘍が進行してしまわないと認識することができない)腫瘍を検出すること、処置までの時間の低減、従来の評価プロセスと比較した場合の、認識および処置に起因する患者の寿命の改善、検査の間の待ち時間がなくなったことによる患者不安の低減。
[201]
フルフィールド・デジタルマンモグラフィおよびデジタル乳腺トモシンセシス診察についての、乳腺密度深層学習モデルのマルチサイト調査
[202]概要
[203]深層学習(DL)モデルは、マンモグラフィ乳腺密度推定に有望であるが、訓練データが限られていること、またはクリニックをまたいで生じ得る画像の違いにより、パフォーマンスが妨げられる可能性がある。デジタル乳腺トモシンセシス(DBT)診察は、乳癌スクリーニングおよび乳腺密度評価にますます標準になっているが、フルフィールド・デジタルマンモグラフィ(FFDM)診察にはずっと多くのデータが利用可能である。3DのDBT診察から導出された合成2Dマンモグラフィ(SM)画像のために、FFDM画像および限られたSMデータを使用して、マルチサイトのセッティングにおいて、乳腺密度DLモデルが開発された。Breast Imaging Reporting and Data System(BI-RADS)乳腺密度を予測するように、遡及的な調査のために2008年から2017年(Site1:57492患者、750752画像)に得られたFFDM画像を使用して、DLモデルが訓練された。2つの機関(Site1:3842患者、14472画像;Site2:7557患者、63973画像)からのSMデータセットに対して、FFDMモデルが評価された。SMデータセットに対するパフォーマンスを改善するために適応方法が検討され、それぞれの適法方法に対するデータセットサイズの影響が考慮された。統計的有意性は信頼区間の使用を通じて評価され、ブートストラップ法によって推定された。適応がない場合でも、モデルは3つのデータセットすべてについて最初のレポートを行った放射線科医と近い一致を見せた(Site1 FFDM:線形重みづけされたκw=0.75,95%信頼区間(CI):[0.74,0.76];Site1 SM:κw=0.71,CI:[0.64,0.78];Site2 SM:κw=0.72,CI:[0.70,0.75])。適応がある場合では、500SM画像だけの使用によって、Site2(Site1:κw=0.72,CI:[0.66,0.79],Site2:κw=0.79,CI:[0.76,0.81])についてパフォーマンスが改善された。このような結果は、BI-RADS乳腺密度DLモデルは、SM画像を必要としないか、ほとんど必要としない方法の使用によって、2つの機関からのFFDMおよびSM画像に対して高レベルのパフォーマンスを実証したことを確立する。
[202]概要
[203]深層学習(DL)モデルは、マンモグラフィ乳腺密度推定に有望であるが、訓練データが限られていること、またはクリニックをまたいで生じ得る画像の違いにより、パフォーマンスが妨げられる可能性がある。デジタル乳腺トモシンセシス(DBT)診察は、乳癌スクリーニングおよび乳腺密度評価にますます標準になっているが、フルフィールド・デジタルマンモグラフィ(FFDM)診察にはずっと多くのデータが利用可能である。3DのDBT診察から導出された合成2Dマンモグラフィ(SM)画像のために、FFDM画像および限られたSMデータを使用して、マルチサイトのセッティングにおいて、乳腺密度DLモデルが開発された。Breast Imaging Reporting and Data System(BI-RADS)乳腺密度を予測するように、遡及的な調査のために2008年から2017年(Site1:57492患者、750752画像)に得られたFFDM画像を使用して、DLモデルが訓練された。2つの機関(Site1:3842患者、14472画像;Site2:7557患者、63973画像)からのSMデータセットに対して、FFDMモデルが評価された。SMデータセットに対するパフォーマンスを改善するために適応方法が検討され、それぞれの適法方法に対するデータセットサイズの影響が考慮された。統計的有意性は信頼区間の使用を通じて評価され、ブートストラップ法によって推定された。適応がない場合でも、モデルは3つのデータセットすべてについて最初のレポートを行った放射線科医と近い一致を見せた(Site1 FFDM:線形重みづけされたκw=0.75,95%信頼区間(CI):[0.74,0.76];Site1 SM:κw=0.71,CI:[0.64,0.78];Site2 SM:κw=0.72,CI:[0.70,0.75])。適応がある場合では、500SM画像だけの使用によって、Site2(Site1:κw=0.72,CI:[0.66,0.79],Site2:κw=0.79,CI:[0.76,0.81])についてパフォーマンスが改善された。このような結果は、BI-RADS乳腺密度DLモデルは、SM画像を必要としないか、ほとんど必要としない方法の使用によって、2つの機関からのFFDMおよびSM画像に対して高レベルのパフォーマンスを実証したことを確立する。
[204]マルチサイト調査は、例えば、Matthewsらの「A Multisite Study of a Breast Density Deep Learning Model for Full-Field Digital Mammography and Synthetic Mammography」、Radiology:Artificial Intelligence、doi.org/10.1148/ryai.2020200015に記載されるようなフルフィールド・デジタルマンモグラフィおよび合成マンモグラフィ向けの乳腺密度深層学習モデルを開発するために行
われた。この文献はその全体が参照により本明細書に組み込まれる。
われた。この文献はその全体が参照により本明細書に組み込まれる。
[205]はじめに
[206]乳腺密度は乳癌にとって重要なリスクファクタであり、エリアの密度が高いほどマンモグラム内の所見にマスクをし、感度をさらに低下させる可能性がある。一部の状態では、クリニックは女性に対しその密度を知らせる必要がある。放射線科医は通常、乳腺密度を次の4カテゴリに分割する、Breast Imaging Reporting and Data System(BI-RADS)レキシコンを使用して乳腺密度を評価する:almost entirely fatty(ほぼ全体的に脂肪)、scattered areas of fibroglandular density(線維腺密度が散乱するエリア)、heterogeneously dense(不均一に高密度)およびextremely dense(極めて高密度)(図12A~図12Dに示される通り)。残念ながら、BI-RADS乳腺密度の評価において、放射線科医は読影者内および読影者間でのバラつきを見せ、これは臨床的なケアおよび推定されるリスクにおける差となり得る。
[206]乳腺密度は乳癌にとって重要なリスクファクタであり、エリアの密度が高いほどマンモグラム内の所見にマスクをし、感度をさらに低下させる可能性がある。一部の状態では、クリニックは女性に対しその密度を知らせる必要がある。放射線科医は通常、乳腺密度を次の4カテゴリに分割する、Breast Imaging Reporting and Data System(BI-RADS)レキシコンを使用して乳腺密度を評価する:almost entirely fatty(ほぼ全体的に脂肪)、scattered areas of fibroglandular density(線維腺密度が散乱するエリア)、heterogeneously dense(不均一に高密度)およびextremely dense(極めて高密度)(図12A~図12Dに示される通り)。残念ながら、BI-RADS乳腺密度の評価において、放射線科医は読影者内および読影者間でのバラつきを見せ、これは臨床的なケアおよび推定されるリスクにおける差となり得る。
[207]図12A~図12Dは、4つのBreast Imaging Reporting and Data System(BI-RADS)乳腺密度カテゴリ(A)almost entirely fatty(ほぼ全体的に脂肪)(図12A)、(B)scattered areas of fibroglandular density(線維腺密度が散乱するエリア)(図12B)、(C)heterogeneously dense(不均一に高密度)(図12C)、(D)extremely dense(極めて高密度)(図12D)のそれぞれについて、デジタル乳腺トモシンセシス(DBT)診察から導出した合成2Dマンモグラフィ(SM)画像の例を示す。画像は、Digital Imaging and Communications in Medicine(DICOM)ヘッダで見られるグレースケールの強度ウィンドウが0.0~1.0の範囲となるよう正規化される。
[208]深層学習(DL)は、フィルム画像およびフルフィールド・デジタルマンモグラフィ(FFDM)画像の両方について、BI-RADS乳腺密度を評価するために採用されてもよく、一部のモデルは、個々の放射線科医よりもコンセンサス予想と近い一致を見せる。このようなDLモデルを臨床的な実践で使用する期待を実現するためには、2つの主要な課題が満足される必要がある。1つ目は、読影者パフォーマンスの改善に起因して、乳癌スクリーニングがますますデジタル乳腺トモシンセシス(DBT)に移るにしたがい、DLモデルはDBT診察に対応する必要があり得る。図13A~図13Dは、FFDMおよびDBT診察用の2D画像同士の画像特性の違いを示す。しかしながら、多くの機関における比較的最近のDBTの採用は、DLモデルを訓練するために利用可能なデータセットが、FFDM診察と比べてDBT診察には極めて限られていることが多いことを意味する。2つ目に、DLモデルは、サイトをまたいで一貫したパフォーマンスを与える必要があり得るが、サイトをまたぐ場合はイメージング技術、患者人口統計学、または評価実務における違いがモデルパフォーマンスに影響を及ぼし得る。実用上、これは、各サイトからの追加的なデータをほとんど必要とせずに達成される必要があり得る。
[209]図13A~図13Dは、ある被検者の同一圧力下での同一乳房のフルフィールド・デジタルマンモグラフィ(FFDM)画像(図13A)と合成2Dマンモグラフィ(SM)画像(図13B)との比較、ならびにFFDM画像(図13C)とSM画像(図13D)の両方について元の部位が白色四角により示される、2つの画像タイプ間に生じ得るテクスチャおよびコントラストの差異を強調するための、ズームインされた領域を示す。画像は、Digital Imaging and Communications in Medicine(DICOM)ヘッダで見られるグレースケールの強度ウィンドウが0.0~1.0の範囲となるよう正規化される。
[210]2つの機関におけるFFDMおよびDBT診察両方について、最初のレポートを行った放射線科医に近い一致を与えるBI-RADS乳腺密度DLモデルが開発された。まず、DLモデルは、1機関からの大規模なFFDMデータセットを使用して、BI-RADS乳腺密度を予測するように訓練された。次いで、モデルは、同一機関および別個の機関から得られたFFDM診察の検査セットならびにDBT診察の一部として生成された合成2Dマンモグラフィ(SM)画像(C-View,Hologic,Inc.,Marlborough,MA)に対して評価された。2つのSMデータセットに対するパフォーマンスを改善するために、SM画像をほとんど必要としない適応技法が探られた。
[211]資料および方法
[212]治験審査委員会によって、データが収集された2サイトのそれぞれに遡及的な調査が承認された(Site1:内部的な治験審査委員会、Site2:Western Institutional Review Board)。インフォームドコンセントは破棄され、すべてのデータはHealth Insurance Portability and Accountability Act(健康保険のポータビリティと説明責任に関する法律)にしたがって取り扱った。
[212]治験審査委員会によって、データが収集された2サイトのそれぞれに遡及的な調査が承認された(Site1:内部的な治験審査委員会、Site2:Western Institutional Review Board)。インフォームドコンセントは破棄され、すべてのデータはHealth Insurance Portability and Accountability Act(健康保険のポータビリティと説明責任に関する法律)にしたがって取り扱った。
[213]データセットは2つのサイトから収集された:Site1は米国中西部域にある学術医療センター、Site2は北カリフォルニアにある外来放射線医学クリニックである。Site1では、191,493マンモグラフィ診察が選ばれた(FFDM:n=187,627;SM:n=3,866)。診察は乳房イメージング経験のある11名の放射線科医のうちの1名によって読影された。Site2では、16283診察が選ばれた。診察は9年から41年に渡る乳房イメージング経験のある12名の放射線科医のうちの1名によって読影された。放射線科医のBI-RADS乳腺密度の評価は、各サイトのマンモグラフィレポーティングソフトウェアから取得された(Site1:Magviewバージョン7.1、Magview、Burtonsville、メリーランド州;Site2:MRSバージョン7.2.0;MRS Systems Inc.シアトル、ワシントン州)。本発明のDLモデルの開発を容易にするために、患者は訓練目的(FFDM:50700,88%;Site1 SM:3169,82%;Site2 SM:6056,80%)、検証目的(FFDM:1832,3%;Site1 SM:403,10%;Site2 SM:757,10%)、またはテスト目的(FFDM:4960,9%;Site1 SM:270,7%;Site2 SM:744,10%)にランダムに選ばれた。BI-RADS乳腺密度評価を有するすべての診察が含まれた。検査セットには、診察は4つすべての標準的なスクリーニングマンモグラフィ画像(左右乳房の内外斜位ビューと頭尾方向ビュー)を有することが必要とされた。セットごとのBI-RADS乳腺密度評価の配分は、表1(Site1)および表2(Site2)に示される。
[214]表1:Site1のフルフィールド・デジタルマンモグラフィ(FFDM)および合成2Dマンモグラフィ(SM)の、訓練(Train)、検証(Val)、およびテスト(Test)データセットの説明。患者、診察、および画像の総数がデータセットごとに与えられる。4つのBreast Imaging Reporting and Data System(BI-RADS)乳腺密度カテゴリの画像の数もまた、与えられる。
[215]表2:Site2の合成2Dマンモグラフィ(SM)の、訓練(Train)、検証(Val)、およびテスト(Test)データセットの説明。患者、診察、および画像の総数がデータセットごとに与えられる。4つのBreast Imaging Reporting and Data System(BI-RADS)乳腺密度カテゴリの画像の数もまた、与えられる。
[216]2サイトは、異なる患者人口を提供する。Site1からの患者コホートは、コーカサス系59%(34192/58397)、アフリカ系アメリカ人23%(13201/58397)、アジア系3%(1630/58397)、およびヒスパニック系1%(757/58397)であり、一方でSite2はコーカサス系58%(4350/7557)、アフリカ系アメリカ人1%(110/7557)、アジア系21%(1594/7557)、およびヒスパニック系7%(522/7557)である。
[217]深層学習モデル
[218]DLモデルおよび訓練手順は、深層ニューラルネットワークモデルを含むpytorch DLフレームワーク(pytorch.org、バージョン1.0)を使用して実装された。ベースモデルアーキテクチャは、バッチ正規化レイヤがグループ正規化レイヤで置換されたpre-activation Resnet-34を含んだ。モデルは、入力としてマンモグラフィ診察からのビューのうちの1つに対応する単一画像を処理し、画像がBI-RADS乳腺密度カテゴリのそれぞれに属する乳房の画像である推定確率を作り出すように構成された。
[218]DLモデルおよび訓練手順は、深層ニューラルネットワークモデルを含むpytorch DLフレームワーク(pytorch.org、バージョン1.0)を使用して実装された。ベースモデルアーキテクチャは、バッチ正規化レイヤがグループ正規化レイヤで置換されたpre-activation Resnet-34を含んだ。モデルは、入力としてマンモグラフィ診察からのビューのうちの1つに対応する単一画像を処理し、画像がBI-RADS乳腺密度カテゴリのそれぞれに属する乳房の画像である推定確率を作り出すように構成された。
[219]深層学習(DL)モデルは、学習速度が10-4および重み減衰が10-3のAdamオプティマイザの使用によって、フルフィールド・デジタルマンモグラフィ(FFDM)データセット(表1に示される通り)を使用して訓練された。重み減衰は、正規化レイヤに属するパラメータには適用されなかった。入力は416×320ピクセルにリサイズされ、ピクセル強度値は、Digital Imaging and Communications in Medicine(DICOM)ヘッダで見られるグレースケールの強度ウィンドウが0.0~1.0の範囲となるよう正規化された。訓練は、NVIDIA(カリフォルニア州サンタクララ)製GTX 1080 Tiグラフィック処理ユニット2つに分散されたバッチサイズ256を用いて混合精度および勾配チェックポイントを使用して行われた。各バッチは、BI-RADS BまたはBI-RADS Cのサンプルを選択する確率が、BI-RADS AまたはBI-RADS Dサンプルを選択する確率の4倍になるようにサンプリングされ、これは概ね米国で見られる密度の分布に相当する。データ強化のために、水平および垂直フリッピングが採用された。訓練の進行度についてより頻繁な情報を得るために、67万2000を超えるサンプルの合計訓練セットサイズに対して、エポックは10万サンプルでキャップされた。モデルはそのような100エポックについて訓練された。結果は、検証セットに対する交差エントロピー損失が最小となったエポックについてレポートされ、これは93エポック後に生じた。
[220]ベクトルおよび行列キャリブレーション方法のためのパラメータは、BFGS最適化方法(scipy.org、バージョン1.1.0)の使用によって交差エントロピー損失関数を最小にすることによって選ばれた。パラメータは、線形レイヤが恒等変換に相当するように初期化された。訓練は、勾配のL2ノルムが10-6未満になったときか、反復数が500を越えたときに停止された。最後の完全結合層をファインチューニング法向けに再訓練することが、学習速度が10-4および重み減衰が10-5のAdamオプティマイザの使用によって、実施された。バッチサイズは64にセットされた。完全結合層は、ランダム初期化から100エポック訓練され、結果は検証交差エントロピー損失が最小となるエポックについてレポートされる。ベースモデルに対するものと同じ手順にしたがって、合成2Dマンモグラフィ(SM)データセットに対するスクラッチからの訓練が行われた。ファインチューニングおよびスクラッチからの訓練では、エポックのサイズは訓練サンプルの数にセットされた。
[221]ドメイン適応
[222]1つのドメイン(ソースドメイン)からのデータセットに対して訓練されたモデルを用いて、そのナレッジを、通常はずっと小さなサイズである別のドメイン(ターゲットドメイン)のデータセットに移すために、ドメイン適応が実行された。前段のレイヤでDLモデルによって学習された特徴は一般的であり得、例えばドメインとタスクに依らない(domain and task agnostic)。ドメインおよびタスクの類似度に応じて、1つのドメインから学習されたより深い特徴を、別のドメインまたはタスクに再利用することが可能である。新しいドメインに修正することなく直接適用可能なモデルは、一般化するためのものである。
[222]1つのドメイン(ソースドメイン)からのデータセットに対して訓練されたモデルを用いて、そのナレッジを、通常はずっと小さなサイズである別のドメイン(ターゲットドメイン)のデータセットに移すために、ドメイン適応が実行された。前段のレイヤでDLモデルによって学習された特徴は一般的であり得、例えばドメインとタスクに依らない(domain and task agnostic)。ドメインおよびタスクの類似度に応じて、1つのドメインから学習されたより深い特徴を、別のドメインまたはタスクに再利用することが可能である。新しいドメインに修正することなく直接適用可能なモデルは、一般化するためのものである。
[223]FFDM画像(ソースドメイン)に対して訓練されたDLモデルを、SM画像(ターゲットドメイン)に適応するための、FFDMドメインから学習したすべての特徴を再利用する手法が開発された。第1に、ニューラルネットワークのキャリブレーションを行うために、小さな線形レイヤが最後の完全結合層に続いて追加された。線形レイヤには2つの形態が考えられた:(1)ベクトルキャリブレーションと称される、行列が対角であるもの、および(2)行列キャリブレーションと称される、行列が自由に変形するよう許可されたもの。第2に、Resnet-34モデルの最後の完全結合層は、ターゲットドメインからのサンプルに対して再訓練され、これはファインチューニングと称される。
[224]ターゲットドメインのデータセットサイズの影響を調査するために、適応技法が、ある範囲のサイズに対して様々なSM訓練セットについて反復された。適応プロセスは、訓練データの異なるランダムなサンプルを用いてデータセットサイズごとに10回反復された。サンプルごとに、訓練画像は、全訓練セットから置き換えることなくランダムに選択された。基準として、Resnet-34モデルが、例えばランダムな初期化から、SMデータセットごとに最大数の訓練サンプルについて、スクラッチから訓練された。
[225]統計的な分析
[226]診察レベルの評価を得るために、診察における各画像が、DLモデルを用いて処理され、得られた確率は平均された。いくつかのパフォーマンスメトリクスが、4クラスのBI-RADS乳腺密度タスク、および二値の高密度(BI-RADS C+D)対非高密度(BI-RADS A+B)タスクについて、このような平均確率から計算された:(1)最初のレポートを行った放射線科医との一致に基づいて推定された精度、(2)受信者操作特性曲線より下の面積(AUC)、および(3)コーエンのカッパ係数(scikit-learn.org、バージョン0.20.0)。8000のランダムなサンプルについて、検査セットの非スチューデント化されたピボットのブートストラップ法の使用によって、信頼区間が計算された。4クラスの問題では、macroAUC(あるタスク対他のタスクからの4つのAUC値の平均)および線形重みづけされたコーエンのカッパ係数がレポートされた。二値密度タスクでは、予測された高密度および非高密度の確率が、対応するBI-RADS密度カテゴリについて予測された確率を加算することによって計算された。
[226]診察レベルの評価を得るために、診察における各画像が、DLモデルを用いて処理され、得られた確率は平均された。いくつかのパフォーマンスメトリクスが、4クラスのBI-RADS乳腺密度タスク、および二値の高密度(BI-RADS C+D)対非高密度(BI-RADS A+B)タスクについて、このような平均確率から計算された:(1)最初のレポートを行った放射線科医との一致に基づいて推定された精度、(2)受信者操作特性曲線より下の面積(AUC)、および(3)コーエンのカッパ係数(scikit-learn.org、バージョン0.20.0)。8000のランダムなサンプルについて、検査セットの非スチューデント化されたピボットのブートストラップ法の使用によって、信頼区間が計算された。4クラスの問題では、macroAUC(あるタスク対他のタスクからの4つのAUC値の平均)および線形重みづけされたコーエンのカッパ係数がレポートされた。二値密度タスクでは、予測された高密度および非高密度の確率が、対応するBI-RADS密度カテゴリについて予測された確率を加算することによって計算された。
[227]結果
[228]FFDM診察に対する深層学習モデルのパフォーマンスは、次のように評価された。最初に訓練済モデルは、Site1からのFFDM診察の大きなホールドアウトされた検査セット(4960患者、53048画像、平均年齢:56.9、年齢範囲:23~97)に対して評価された。この場合、画像は同一の機関からの、モデルを訓練するために採用された画像タイプと同一のタイプのものである。DLモデルによって予測されるBI-RADS乳腺密度分布(A:8.5%、B:52.2%、C:36.1%、D:3.2%)は、最初のレポートを行った放射線科医の分布(A:9.3%、B:52.0%、C:34.6%、D:4.0%)と類似した。DLモデルは、多様なパフォーマンス尺度(表3に示される通り)に対して4クラスBI-RADS乳腺密度タスクについて、精度(82.2%、95%信頼区間(CI):[81.6%,82.9%])および線形重みづけされたコーエンのカッパ係数(κw=0.75、CI:[0.74,0.76])を含め、放射線科医に近い一致を見せた。二値の乳腺密度タスクに対しても、高レベルの一致が観察された(精度=91.1%、CI:[90.6%,91.6%]、AUC=0.971、CI:[0.968,0.973]、κ=0.81、CI:[0.80,0.82])。図14A~図14Dに示される混同行列によって実証されるように、DLモデルは複数の乳腺密度カテゴリから外れることは滅多になかった(例えば、extremely dense breastをscattered結果として呼ぶことによる;0.03%、4/13262)。これは、このようなタイプの大きな誤差に対して、いかなる明示的なペナルティを伴わずに、DLモデルによって暗黙的に学習される。
[228]FFDM診察に対する深層学習モデルのパフォーマンスは、次のように評価された。最初に訓練済モデルは、Site1からのFFDM診察の大きなホールドアウトされた検査セット(4960患者、53048画像、平均年齢:56.9、年齢範囲:23~97)に対して評価された。この場合、画像は同一の機関からの、モデルを訓練するために採用された画像タイプと同一のタイプのものである。DLモデルによって予測されるBI-RADS乳腺密度分布(A:8.5%、B:52.2%、C:36.1%、D:3.2%)は、最初のレポートを行った放射線科医の分布(A:9.3%、B:52.0%、C:34.6%、D:4.0%)と類似した。DLモデルは、多様なパフォーマンス尺度(表3に示される通り)に対して4クラスBI-RADS乳腺密度タスクについて、精度(82.2%、95%信頼区間(CI):[81.6%,82.9%])および線形重みづけされたコーエンのカッパ係数(κw=0.75、CI:[0.74,0.76])を含め、放射線科医に近い一致を見せた。二値の乳腺密度タスクに対しても、高レベルの一致が観察された(精度=91.1%、CI:[90.6%,91.6%]、AUC=0.971、CI:[0.968,0.973]、κ=0.81、CI:[0.80,0.82])。図14A~図14Dに示される混同行列によって実証されるように、DLモデルは複数の乳腺密度カテゴリから外れることは滅多になかった(例えば、extremely dense breastをscattered結果として呼ぶことによる;0.03%、4/13262)。これは、このようなタイプの大きな誤差に対して、いかなる明示的なペナルティを伴わずに、DLモデルによって暗黙的に学習される。
[229]図14A~図14Bは、フルフィールド・デジタルマンモグラフィ(FFDM)検査セットに対して評価した、Breast Imaging Reporting and Data System(BI-RADS)乳腺密度タスクについての混同行列(図14A)、および二値密度タスク(高密度であるBI-RADS C+D対非高密度であるBI-RADS A+B)についての混同行列(図14B)を示す。各ビンにおける検査サンプル(診察)の数をカッコ内に示す。
[230]表3:4クラスBreast Imaging Reporting and Data System(BI-RADS)乳腺密度タスクと二値密度タスク(高密度であるBI-RADS C+D対非高密度であるBI-RADS A+B)との両方についての、フルフィールド・デジタルマンモグラフィ(FFDM)診察用の検査セットに対する本開示の深層学習モデルのパフォーマンス。95%信頼区間がブラケット内に与えられる。他の調査からの結果が、それら各々の検査セットに対して評価されて比較ポイントとして示される。
[231]結果を他の調査のコンテキストに配置するために、FFDM検査セットに対する深層学習モデルのパフォーマンスが、学術センターから得られた他の大規模なFFDMデータセットに対して評価された結果および市販の乳腺密度ソフトウェアと比較された(表3に示される通り)。FFDM DLモデルは、匹敵するパフォーマンスを与えるように見える。
[232]DBT診察に対する深層学習モデルのパフォーマンスは、次のように評価された。結果は、まずSite1 SM検査セット(270患者、1080画像、平均年齢:54.6、年齢範囲:28~72)についてレポートされたが、これは2サイト間で生じ得るあらゆる差を回避するためである。表4に示すように、適応なしで実施されるときでも、モデルはBI-RADS乳腺密度タスクについて最初のレポートを行った放射線科医に近い一致を見せた(精度=79%、CI:[74%,84%];κw=0.71、CI:[0.64,0.78])。DLモデルは、SM画像についての乳腺密度をわずかに過小評価し(図15A~図15Dに示される通り)、放射線科医(A:8.9%、B:49.6%、C:35.9%、D:5.6%)に対して非高密度事例が多く、高密度事例が少ないBI-RADS乳腺密度分布を作り出している(A:10.4%、B:57.8%、C:28.9%、D:3.0%)。この偏りは、図13に示される差、すなわち乳房の特定の領域がSM画像ではより暗く見えることに起因するものであり得る。同じような偏りが、他の自動化された乳腺密度推定ソフトウェアで示されている[33]。二値密度タスクについての一致はまた、適応なしで極めて高い(精度=88%、CI:[84%,92%];κ=0.75、CI:[0.67,0.83];AUC=0.97、CI:[0.96,0.99]。
[233]表4:1つのデータセットに対して訓練された深層学習(DL)モデルを、500の合成2Dマンモグラフィ(SM)画像のセットを持つ別のモデルに適応するための本開示の方法およびシステムのパフォーマンス。データセットは、フルフィールド・デジタルマンモグラフィ(FFDM)データセットには「MM」、Site1のSMデータセットには「C1」、およびSite2のSMデータセットには「C2」として示す。参照として、FFDMデータセット(67万2000訓練サンプル)に対してスクラッチから訓練され、その検査セットに対して評価されたモデルのパフォーマンスも示される。検査セットに対してブートストラップ法によって計算された95%信頼区間がブラケット内に与えられる。
[234]500SM画像を用いた行列キャリブレーションによる適応の後、密度分布は、放射線科医による分布(A:5.9%、B:53.7%、C:35.9%、D:4.4%)により類似したものとなったが、全体的な一致は類似した(精度=80%、CI:[76%,85%];κw=0.72、CI:[0.66,0.79])。2つの高密度なクラスの精度は、2つの非高密度なクラスを犠牲にして改善された(図15A~図15Dに示される通り)。二値密度タスクではかなりの改善が見られ、コーエンのカッパ係数が0.75[0.67,0.83]から0.82[0.76,0.90](精度=91%,CI:[88%,95%];AUC=0.97、CI:[0.96,0.99])に増大した。
[235]図15A~図15Dは、Site1のSM検査セットに対して評価した、適応なしのBreast Imaging Reporting and Data System(BI-RADS)乳腺密度タスクについての混同行列(図15A)、適応なしの二値密度タスク(高密度であるBI-RADS C+D対非高密度であるBI-RADS A+B)についての混同行列(図15B)、500訓練サンプルの行列キャリブレーションによる適応ありのBI-RADS乳腺密度タスクについての混同行列(図15C)、500訓練サンプルの行列キャリブレーションによる適応ありの二値密度タスク(高密度対非高密度)についての混同行列(図15B)を示す。各ビンにおける検査サンプル(診察)の数をカッコ内に示す。
[236]適応なしのSite2のSM検査セット(744患者、6192画像、平均年齢:55.2、年齢範囲:30~92)について、DLモデルと最初のレポートを行った放射線科医との間には、やはり程度の高い一致が観察された(表4に示される通り、精度=76%、CI:[74%,78%];κw=0.72CI:[0.70,0.75])。DLモデルによって予測されるBI-RADS乳腺密度分布(A:5.7%、B:48.8%、C:36.4%、D:9.1%)は、Site1のデータセットに見られる分布にさらに類似した。モデルは、患者人口統計学が異なるSite2には最適でない場合がある、Site1のFFDMデータセットから以前のものを学習してしまっている可能性がある。予測される密度分布は、Site1で見られたような低い密度推定に偏っているようには見えない(図16A~図16Dに示される通り)。これは、2つのサイト間でのSM画像またはその解釈における何らかの違いを示唆する場合がある。二値密度タスクについての一致は殊に強かった(精度=92%、CI:[91%,93%];κ=0.84、CI:[0.81,0.87];AUC=0.980、CI:[0.976,0.986])。適応なしのSite2データセットに対する非常に良好なパフォーマンスは、DLモデルがサイトをまたいで、うまく一般化され得ることを実証する。
[237]500訓練サンプルについての行列キャリブレーションによる適応によって、Site2のSMデータセットに対するBI-RADS乳腺密度タスクについてのパフォーマンスは大幅に改善した(精度=80、CI:[78,82];κw=0.79、CI:[0.76,0.81])。適応の後、予測されるBI-RADS乳腺密度分布(A:16.9%、B:43.3%、C:29.4%、D:10.4%)は、放射線科医の分布(A:15.3%、B:42.2%、C:30.2%、D:12.3%)とさらに類似した。適応は、このサイトでは乳腺密度の人口統計学的な分布についての調節を助けている可能性がある。二値の乳腺密度タスクにはあまり改善が見られなかった(精度=92、CI:[91,94]、κ=0.84、CI:[0.82,0.87];AUC=0.983、CI:[0.978,0.988])。
[238]図16A~図16Dは、Site2のSM検査セットに対して評価した、適応なしのBreast Imaging Reporting and Data System(BI-RADS)乳腺密度タスクについての混同行列(図16A)、適応なしの二値密度タスク(高密度であるBI-RADS C+D対非高密度であるBI-RADS A+B)についての混同行列(図16B)、500訓練サンプルの行列キャリブレーションによる適応ありのBI-RADS乳腺密度タスクについて(図16C)、500訓練サンプルの行列キャリブレーションによる適応ありの二値密度タスク(高密度対非高密度)についての混同行列(図16B)を示す。各ビンにおける検査サンプル(診察)の数をカッコ内に示す。
[239]異なる適応方法の相対的なパフォーマンスは、適応に利用可能な訓練サンプルの数に依存する可能性があり、訓練サンプルが多いほど、パラメータが多い方法に有益となる。図17A~図17Dは、開示される実施形態による、Site1データセットについて、macroAUCによって測定された、適応方法のパフォーマンスに対する訓練データ量の影響(図17A)、Site1データセットについて、線形重みづけされたコーエンのカッパ係数によって測定された、適応方法のパフォーマンスに対する訓練データ量の影響(図17B)、Site2のSMデータセットについて、macroAUCによって測定された、適応方法のパフォーマンスに対する訓練データ量の影響(図17C)、Site2のSMデータセットについて、線形重みづけされたコーエンのカッパ係数によって測定された、適応方法のパフォーマンスに対する訓練データ量の影響(図17D)を示す。95%信頼区間を計算する際に行ったように、検査セットの限られたサイズから生じる不確定性ではなく、訓練データの選択から生じる不確定性を調査するために、結果は、データセットサイズ(本明細書の他で説明されるような)ごとに訓練データの10個のランダムなリアル化に対してレポートされる。各適応方法は、最良のパフォーマンスを提供するサンプル数の範囲を有し、領域は適応方法のパラメータ数に対応している(ベクトルキャリブレーション:4+4=8パラメータ;行列キャリブレーション:4×4+4=20パラメータ;ファインチューニング:512×4+4=2052パラメータ)。訓練サンプルの数が非常に少ない場合(例えば、100画像未満)、何らかの適応方法がパフォーマンスにマイナスに影響した。最大規模のデータセットサイズでも、SM画像に対してスクラッチから訓練されたResnet-34モデルがFFDMから適応されたモデルのパフォーマンスを超えるには、訓練データの量があまりにも限定され過ぎた。
[240]図17A~図17Dは、適応されたモデルのパフォーマンスに対するターゲットドメイン中の訓練サンプルの数の影響を、Site1の合成2Dマンモグラフィ(SM)検査セットについてmacroAUC(図17A)、および線形に重みづけしたコーエンのカッパ係数(図17B)によって測定したもの、ならびにSite2のSM検査セットについてmacroAUC(図17C)、および線形に重みづけしたコーエンのカッパ係数(図17D)によって測定したものを示す。結果は、ベクトルキャリブレーションと行列キャリブレーション、および最後の完全結合層(ファインチューニング)を再訓練することについて示される。エラーバーは、訓練データの10個のランダムなサンプリングに対して計算された平均の標準誤差を示す。適応する前のパフォーマンス(なし)およびスクラッチからの訓練は、参照として示される。Site1のSM調査では、フルフィールド・デジタルマンモグラフィ(FFDM)パフォーマンスは、追加的な参照として機能した。それぞれのグラフは、所与のメトリクスとデータセットについての異なる適応方法の比較を容易にするべく、それ自身の全ダイナミックレンジを用いて示されていることに留意されたい。
[241]議論
[242]Breast Imaging Reporting and Data System(BI-RADS)乳腺密度は、乳癌リスクと放射線科医感度の重要なインジケータであり得るが、読影者内および読影者間でのバラつきが、この尺度の有効性を限られたものにしている場合がある。乳腺密度を推定するための深層学習(DL)モデルは、このバラつきを低減しつつ、なお正確な評価を実現するように構成されてもよい。しかしながら、このようなDLモデルは、デジタル乳腺トモシンセシス(DBT)診察に適用可能であると実証され、機関をまたいで一般化することができ、それによって有用な臨床的なツールとしての適性を示している。DBT診察用の訓練データが限られていることを克服するために、DLモデルは最初、フルフィールド・デジタルマンモグラフィ(FFDM)画像の大きなセットに対して訓練される。FFDM画像のホールドアウトされた検査セットに対して評価される場合、モデルは放射線科医レポートのBI-RADS乳腺密度に近い一致を示した(κw=0.75、95%信頼区間(CI):[0.74,0.76])。次いで、モデルは、DBT診察の一部として生成される合成2Dマンモグラフィ(SM)画像の2つのデータセットに対して評価された。FFDMデータと同一機関からのSMデータセット(Site1:κw=0.71、CI:[0.64,0.78])、および別の機関からのSMデータセット(Site2:κw=0.72、CI:[0.70,0.75])についても、高いレベルの一致が見られた。DLモデルの強いパフォーマンスは、これがDBT診察および異なる機関からのデータに一般化される得ることを実証している。SMデータセットについてのモデルのさらなる適応は、Site1では何らかの改善に(κw=0.72、CI:[0.66,0.79])、またSite2ではずっと大幅な改善に(κw=0.79、CI:[0.76,0.81])つながった。
[242]Breast Imaging Reporting and Data System(BI-RADS)乳腺密度は、乳癌リスクと放射線科医感度の重要なインジケータであり得るが、読影者内および読影者間でのバラつきが、この尺度の有効性を限られたものにしている場合がある。乳腺密度を推定するための深層学習(DL)モデルは、このバラつきを低減しつつ、なお正確な評価を実現するように構成されてもよい。しかしながら、このようなDLモデルは、デジタル乳腺トモシンセシス(DBT)診察に適用可能であると実証され、機関をまたいで一般化することができ、それによって有用な臨床的なツールとしての適性を示している。DBT診察用の訓練データが限られていることを克服するために、DLモデルは最初、フルフィールド・デジタルマンモグラフィ(FFDM)画像の大きなセットに対して訓練される。FFDM画像のホールドアウトされた検査セットに対して評価される場合、モデルは放射線科医レポートのBI-RADS乳腺密度に近い一致を示した(κw=0.75、95%信頼区間(CI):[0.74,0.76])。次いで、モデルは、DBT診察の一部として生成される合成2Dマンモグラフィ(SM)画像の2つのデータセットに対して評価された。FFDMデータと同一機関からのSMデータセット(Site1:κw=0.71、CI:[0.64,0.78])、および別の機関からのSMデータセット(Site2:κw=0.72、CI:[0.70,0.75])についても、高いレベルの一致が見られた。DLモデルの強いパフォーマンスは、これがDBT診察および異なる機関からのデータに一般化される得ることを実証している。SMデータセットについてのモデルのさらなる適応は、Site1では何らかの改善に(κw=0.72、CI:[0.66,0.79])、またSite2ではずっと大幅な改善に(κw=0.79、CI:[0.76,0.81])つながった。
[243]最初のレポートを行った放射線科医の評価がグラウンドトゥルースとして受け入れられると、このような放射線科医同士の読影者間でのバラつきのレベルが、所与のデータセットに対して達成され得るパフォーマンスに対して大きな影響力を有する。例えば、適応の後、Site2のSMデータセットに対して得られるパフォーマンスは、モデルを訓練するために使用されるFFDMデータセットに対して得られるパフォーマンスより高かった。これは、読影者2名だけで診察の80%以上が読み取られたことにより、Site2のSMデータセットについての読影者間のバラつきが限られたものとなった結果の可能性が高い。
[244]他の手法とは対照的に、BI-RADS乳腺密度DLモデルは、DBT診察からのSM画像に対して、および複数機関からのデータに対して、評価された。さらには、上で議論したように、DLモデルは、FFDM画像に対して評価した場合、他のDLモデルおよび市販の乳腺密度ソフトウェアと比較して匹敵するパフォーマンスを実証した(κw=0.75、CI:[0.74,0.76]対Lehmanら 0.67、CI:[0.66,0.68];Volpara 0.57、CI:[0.55,0.59]、Quantra 0.46、CI:[0.44,0.47])[19,3]。手法ごとに、本発明者ら自身の結果がレポートされるやり方と同じように、結果がその個々の検査セットに対してレポートされる。
[245]体積乳腺密度などの乳腺密度の他の尺度は、3Dトモシンセシス容積用の自動化されたソフトウェアまたはDBT診察からの推測によって推定されてもよい。閾値は、このような尺度をBI-RADS乳腺密度に変換するように選ぶことが可能であるが、これは、BI-RADS乳腺密度の直接的な推定よりも一致のレベルが低下することになり得る(例えば、放射線科医評価のBI-RADS乳腺密度と体積乳腺密度から導出した評価との一致はκw=0.47)。ここではBI-RADS乳腺密度を3Dトモシンセシス容積の代わりに2DのSM画像から推定するが、このことがFFDM画像からの転移学習を簡略化し、乳房放射線科医が密度を評価するやり方をミラーリングするからである。
[246]場合によっては、深層学習(DL)モデルが新しい機関に適合される際、画像内容、患者人口統計学、または解釈放射線科医における機関をまたいだ差異に対して調節が行われる場合がある。この最後の調節により、最初のDLモデルと適合済DLモデルとの間に、ある程度の読影者間のバラつきが生じ得るが、モデルが各グループの放射線科医のコンセンサスを学習すれば、個々の読影者間のバラつきよりも低くなる可能性がある。結果として、Site2のSMデータセットについての適合の後に観察される改善されたDLモデルのパフォーマンスは、FFDMデータセットと比較した患者人口統計学または放射線科医評価実務における差異に起因するものであり得る。Site1のSMデータセットについての改善が弱かったことは、このような同一ファクタにおける類似性に起因するものであり得る。訓練サンプルの数の関数としてのドメイン適応技法の比較については、訓練サンプルの数に基づいてモデル内のパラメータの数を調整することによって、スクラッチから訓練されたDLモデルを訓練するための良好なパフォーマンスが得られる場合がある。
[247]このような結果は、Breast Imaging Reporting and Data System(BI-RADS)乳腺密度の深層学習(DL)モデルの広範な使用が、臨床的なケアを改善する大きな可能性を秘めていることを確かにしている。適応なしのDLモデルの成功は、モデルによって学習される特徴が、デジタル乳腺トモシンセシス(DBT)診察からの、フルフィールド・デジタルマンモグラフィ(FFDM)画像と合成2Dマンモグラフィ(SM)画像との両方に、ならびに異なる読影者および機関に、広く適用可能であることを示す。したがって、BI-RADS乳腺密度DLモデルは、新しいサイトおよび機関に、大規模なデータセットおよびスクラッチからの訓練モデルを編集する追加的な努力なしに展開することができる。サイトおよび画像タイプをまたいで一般化することが可能なBI-RADS乳腺密度DLモデルは、女性の乳腺密度について、高速で低コスト、かつより一貫性のある推定を行うために使用され得る。
[248]
最適化された放射線医学ワークフローのためのリアルタイム放射線医学
[249]機械学習ベースの分類システムが開発され、被検者の医学的画像を含むデータセットの分析に基づいて放射線医学的な解釈作業(例えば、複数の異なるワークフロー同士で)を、ソート、優先付け、強化、または編集する。放射線医学的評価のために事例をソート、優先付け、強化、または編集することは、医学的画像データに基づいて実施されてもよい(ラベルまたはアノテーション情報などのメタデータだけに依拠する代わりに、画像データのヘッダまたはデータベース要素など)。例えば、医学的画像は、1つまたは複数の画像処理アルゴリズムによって処理されてもよい。機械学習ベースの放射線医学システムは、医学的画像のデータセットを、様々な放射線医学的評価に、それらのそのような様々な評価に対する適性に基づいて階層化できるようにすることによって、高速かつより正確な診断を伝達する高度な放射線医学ワークフローを可能にする。例えば、複数の異なるワークフローは、放射線科医の複数の異なるセットによる放射線医学的評価を含んでもよい。放射線科医は、患者の医学的画像が取得されるクリニックに対して、オンサイトにいてもよいし、リモートにいてもよい。
[249]機械学習ベースの分類システムが開発され、被検者の医学的画像を含むデータセットの分析に基づいて放射線医学的な解釈作業(例えば、複数の異なるワークフロー同士で)を、ソート、優先付け、強化、または編集する。放射線医学的評価のために事例をソート、優先付け、強化、または編集することは、医学的画像データに基づいて実施されてもよい(ラベルまたはアノテーション情報などのメタデータだけに依拠する代わりに、画像データのヘッダまたはデータベース要素など)。例えば、医学的画像は、1つまたは複数の画像処理アルゴリズムによって処理されてもよい。機械学習ベースの放射線医学システムは、医学的画像のデータセットを、様々な放射線医学的評価に、それらのそのような様々な評価に対する適性に基づいて階層化できるようにすることによって、高速かつより正確な診断を伝達する高度な放射線医学ワークフローを可能にする。例えば、複数の異なるワークフローは、放射線科医の複数の異なるセットによる放射線医学的評価を含んでもよい。放射線科医は、患者の医学的画像が取得されるクリニックに対して、オンサイトにいてもよいし、リモートにいてもよい。
[250]いくつかの実施形態では、機械学習ベースの分類システムは、被検者の医学的画像を含むデータセットの分析に基づいて、複数の異なるワークフロー同士で放射線医学的な解釈作業を、ソート、または優先付けするように構成される。例えば、医学的画像を含むデータセットのうちの1つのセットは、データセットの第1のセットがデータセットの第2のセットよりも高い優先度または緊急度を有するというAIトリアージエンジンの判定に基づいて、医学的画像を含むデータセットの別のセットよりも放射線医学的評価について優先されてもよい。
[251]いくつかの実施形態では、リアルタイム放射線医学システムは、AI対応トリアージワークフローを使用して、スクリーニング診察を通じて被検者の医学的画像を得て、次いでAIを使用して放射線医学的な結果(例えば、スクリーニング結果および/または診断結果)を、医学的画像を取得した後、数分のうち(例えば、約5分、約10分、約15分、約30分、約45分、約60分、約90分、約2時間、約3時間、約4時間、約5時間、約6時間、約7時間、または約8時間以内に)に患者へ伝達する。
[252]いくつかの実施形態では、リアルタイム放射線医学システムは、AI判定のアラート事例のクリニックスタッフと対話するためのリアルタイム通知システムを含む。通知システムは、スクリーニングクリニック内の様々な場所に(例えば、クリニックスタッフのワークステーションに)設置される。ユーザ(例えば、医師およびクリニックスタッフ)は役割を割り当てられ、役割ごとに異なる通知を受け取る。通知は、患者の事例について訓練済アルゴリズムによって緊急事態が判定されると、トリガされる。例えば、通知は、アドバイザリ情報ならびに訪問中リアルタイムに患者の臨床的なワークフローに影響を及ぼし得る、情報を入力する許可ユーザの両方を含んでもよい。医師(例えば、処置を行う医師または放射線科医)は、緊急事態事例が生じるとリアルタイムのアラートを介してこのような事例を通知され、通知からの情報を使用してより良好な診断を提供する。
[253]いくつかの実施形態では、リアルタイム放射線医学システムは、患者に通知を送るための患者のモバイルアプリケーション(アプリ)を含む。通知は、患者のスクリーニング/診断的な訪問のステータス、患者の医学的画像に対して実施された放射線医学的評価、放射線医学的評価から構築されたプレゼンテーションなどを含んでもよい。
[254]いくつかの実施形態では、リアルタイム放射線医学システムは、将来的な取り出しのために、医学的画像を含むデータセット(例えば、放射線医学的画像)、データセットのAIエンリッチメント(例えば、画像処理アルゴリズムなどを介して、AIによってラベル付け、アノテーション付け、または処理された医学的画像)、スクリーニング結果、診断結果、ならびに医学的画像および結果のプレゼンテーションを、獲得、取得、および記憶するように構成されたデータベースを含む。リアルタイム放射線医学システムは、サービスを患者および患者の臨床医療従事者(例えば、放射線科医およびクリニックスタッフ)に提供して、データベースの内容を取り出し、アクセスおよび閲覧するように構成される。リアルタイム放射線医学システムのサービスは、いくつかのAIモデルをチェーン化することを含め、記憶されたデータセットから、複雑な計算科学的なグラフを構築するサポートをしてもよい。
[255]図18は、リアルタイム放射線医学評価ワークフローの概略の例を示す。リアルタイム放射線医学評価ワークフローは、被検者から画像を獲得することを含んでもよい(例えば、マンモグラフィを介して)。画像は、画像が疑わしい事例に対応すること検出するために、本開示のシステムおよび方法(例えば、AIアルゴリズムを含む)を使用して処理されてもよい。臨床医は、被検者がリアルタイム放射線医学評価に適しているとアラートされてもよい。被検者がクリニックで待っている間、画像は放射線医学的評価のために放射線科医に送られ、放射線医学的評価の結果は、さらなるレビューのために臨床医に提供される。
[256]図19は、リアルタイム放射線医学評価ワークフローの概略の別の例を示す。本開示のシステムおよび方法(例えば、AIアルゴリズムを含む)を使用して、被検者の画像がPACSデータベースから検索され、分析される。AI分析が、所与の被検者(例えば、患者)が疑わしい画像を有していないことを示す場合、患者コーディネータに通知され、次いで患者コーディネータは、結果は放射線医学的評価が実施された後に、自宅で受け取ることになると、患者に知らせる。AI分析が、患者が疑わしい画像を有すると示す場合、技師に通知され、次いで技師は(1)病歴を更新し、放射線科医に放射線医学的評価を実施するように通知して、患者コーディネータに結果を提供するか、(2)請求担当に患者のフォローアップ診察についての自己負担額を処理するように通知し、患者コーディネータに通知する。患者コーディネータは、結果を患者と共有して、必要であればフォローアップ予約をスケジューリングしてもよい。
[257]いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、(i)画像またはその導出物を、放射線医学的評価のために放射線科医の第1のセットのうちの第1の放射線科医に送って、画像が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、(ii)画像またはその導出物を、放射線医学的評価のために放射線科医の第2のセットのうちの第2の放射線科医に送って、画像が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、または(iii)画像またはその導出物を、放射線医学的評価のために放射線科医の第3のセットのうちの第3の放射線科医に送って、画像が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップとを含む。
[258]いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、少なくとも1つの画像が疑わしいと分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第1のセットのうちの第1の放射線科医に送って、スクリーニング結果を作り出すステップを含む。いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、画像が曖昧であると分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第2のセットのうちの第2の放射線科医に送って、スクリーニング結果を作り出すステップを含む。いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、画像が正常であると分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第3のセットのうちの第3の放射線科医に送って、スクリーニング結果を作り出すステップを含む。
[259]いくつかの実施形態では、被検者のスクリーニング結果は、画像またはその導出物を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、放射線科医の第1のセットは、オンサイトクリニック(例えば、画像またはその導出物が取得されたクリニック)に配置される。
[260]いくつかの実施形態では、放射線科医の第2のセットは放射線専門医(例えば、画像またはその導出物を、訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練された放射線科医)を含む。いくつかの実施形態では、放射線科医の第3のセットは、オンサイトクリニック(例えば、画像が取得されたクリニック)からリモートに配置される。いくつかの実施形態では、放射線科医の第3のセットのうちの第3の放射線科医は、複数の画像を含むバッチの画像またはその導出物の放射線科医評価を実施する(例えば、この場合、バッチは放射線医学的評価の効率の向上のために選択される)。
[261]いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、被検者の診断手順を、スクリーニング結果に少なくとも部分的に基づいて実施して、被検者の診断結果を作り出すステップを含む。いくつかの実施形態では、被検者の診断結果は、画像を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、被検者の診断結果は、画像を取得するステップから約1時間以内に作り出される。
[262]いくつかの実施形態では、画像またはその導出物は、被検者の身体の部位の追加的な特性に少なくとも部分的に基づいて、第1の放射線科医、第2の放射線科医、または第3の放射線科医に送られる。いくつかの実施形態では、追加的な特性は、解剖学的構造、組織特性(例えば、組織密度または物理的性質)、異物の存在(例えば、インプラント)、所見のタイプ、病状(例えば、機械学習アルゴリズムなどのアルゴリズムによって予測される)、またはそれらの組合せを含む。
[263]いくつかの実施形態では、画像またはその導出物は、第1の放射線科医、第2の放射線科医、または第3の放射線科医の追加的な特性(例えば、第1の放射線科医、第2の放射線科医、または第3の放射線科医の、少なくとも1つの画像またはその導出物の放射線医学的評価を行う個人的な能力)に少なくとも部分的に基づいて、第1の放射線科医、第2の放射線科医、または第3の放射線科医に送られる。
[264]いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、画像またはその導出物を第1の放射線科医に送るステップ、または画像またはその導出物を第2の放射線科医に送るステップに少なくとも部分的に基づいて、アラートを生成するステップを含む。いくつかの実施形態では、リアルタイム放射線医学評価ワークフローは、アラートを、被検者または被検者の臨床医療従事者に送信するステップを含む。いくつかの実施形態ではリアルタイム放射線医学評価ワークフローは、アラートを、患者のモバイルアプリケーションを通じて被検者に送信するステップを含む。いくつかの実施形態では、アラートは、(b)とリアルタイムか、(b)とほぼリアルタイムで生成される。
[265]いくつかの実施形態では、リアルタイム放射線医学システムはAI駆動の遠隔画像診断プラットフォームを含む。遠隔画像診断プラットフォームは、事例を医師によるレビュー用に、医学的画像の取得とリアルタイムに、または実質的にリアルタイムにルーティングする、AIベースの放射線医学作業分配器を備える。遠隔画像診断プラットフォームは、画像タイプおよび医師のAIベースのプロファイリングを実施して、個々の医師の所与の事例のデータセットの取り扱い、評価、または解釈における適性に基づいて、各事例を複数の医師の中から1名の医師に割り当てるように構成されてもよい。放射線科医は、それぞれが放射線医学的技能、専門知識、および経験の別個のセットを有する、放射線科医のネットワークに所属してもよい。遠隔画像診断プラットフォームは、技能、専門知識、経験、およびコストの所望の組合せを有する医師をネットワークで検索することに基づいて事例を医師に割当てもよい。放射線科医は、患者の医学的画像が取得されるクリニックに対して、オンサイトにいてもよいし、リモートにいてもよい。いくつかの実施形態では、放射線科医の専門知識は、データの評価的セットに対する様々な放射線科医タスクについて、放射線科医のパフォーマンスをAIモデルのパフォーマンスと比較することによって判定されてもよい。放射線科医は、自身が引き受けて実施する個々の事例ごとに、放射線医学的評価を実施することに対して支払いを受けてもよい。いくつかの実施形態では、リアルタイム放射線医学システムは、AI判定の難しさ、緊急度、および放射線医学的作業の価値(例えば、放射線医学的評価、解釈、またはレビュー)に基づいた放射線医学的な作業の動的な価格設定を特徴とする。
[266]いくつかの実施形態では、リアルタイム放射線医学システムは、放射線医学的評価、解釈、またはレビューのために、複数の医学的画像事例を、医学的画像事例のサブグループに編成、優先順位付け、または階層化するように構成される。医学的画像事例の階層化は、個々の事例を評価する際の人間の効率を改善するために、個々の医学的画像事例の画像特性に基づいて、AIアルゴリズムによって実施されてもよい。例えば、アルゴリズムは、例えば解剖学的構造の類似の領域に位置する類似の病変タイプを有する識別事例を入れるなど、視覚的に類似しているか、診断的に類似している事例を人間によるレビューのために一緒にグループ化してもよい。
[267]図20は、遠隔画像診断セッティングにおけるAI支援放射線医学評価ワークフローの概略の例を示す。本開示のシステムおよび方法(例えば、AIアルゴリズムを含む)を使用して、被検者の画像がAIアルゴリズムを使用してPACSデータベースから検索されて分析され、放射線医学的評価のために事例を(例えば、被検者の乳腺密度および/または乳癌リスクに基づいて)優先順位付けおよび除外する。AI支援放射線医学評価ワークフローは、放射線科医の技能レベルに基づいて、放射線医学的評価の事例のルーティングを最適化することができる。例えば、第1の放射線科医は、平均読影時間45秒、専門家レベルの専門知識、および極めて高密度な乳房を評価するための技能を有する場合がある。別の例として、第2の放射線科医は、平均読影時間401秒、および初心者レベルの専門知識を有する場合がある。別の例として、第3の放射線科医は、平均読影時間323秒、および初心者レベルの専門知識を有する場合がある。別の例として、第4の放射線科医は、平均読影時間145秒、および初心者レベルの専門知識を有する場合がある。例えば、第5の放射線科医は、平均読影時間60秒、専門家レベルの専門知識、および良性塊を評価するための技能を有する場合がある。AI支援放射線医学評価ワークフローは所与の被検者の事例を、第1、第2、第3、第4、または第5の放射線科医から選択された放射線科医に向けて、所与の被検者の事例についての放射線科医らの平均読影時間、専門知識レベル、および/または技能レベルに基づいて、送ってもよい。
[268]いくつかの実施形態では、AI支援放射線医学評価ワークフローは、(i)画像またはその導出物を、放射線医学的評価のために放射線科医の第1のセットのうちの第1の放射線科医に送って、画像が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、(ii)画像またはその導出物を、放射線医学的評価のために放射線科医の第2のセットのうちの第2の放射線科医に送って、画像が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、または(iii)画像またはその導出物を、放射線医学的評価のために放射線科医の第3のセットのうちの第3の放射線科医に送って、画像が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップとを含む。
[269]いくつかの実施形態では、AI支援放射線医学評価ワークフローは、少なくとも1つの画像が疑わしいと分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第1のセットのうちの第1の放射線科医に送って、スクリーニング結果を作り出すステップを含む。いくつかの実施形態では、AI支援放射線医学評価ワークフローは、画像が曖昧であると分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第2のセットのうちの第2の放射線科医に送って、スクリーニング結果を作り出すステップを含む。いくつかの実施形態では、AI支援放射線医学評価ワークフローは、画像が正常であると分類された場合、画像またはその導出物を、放射線医学的評価のために放射線科医の第3のセットのうちの第3の放射線科医に送って、スクリーニング結果を作り出すステップを含む。
[270]いくつかの実施形態では、被検者のスクリーニング結果は、画像またはその導出物を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、放射線科医の第1のセットは、オンサイトクリニック(例えば、画像またはその導出物が取得されたクリニック)に配置される。
[271]いくつかの実施形態では、放射線科医の第2のセットは放射線専門医(例えば、画像またはその導出物を、訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練された放射線科医)を含む。いくつかの実施形態では、放射線科医の第3のセットは、オンサイトクリニック(例えば、画像が取得されたクリニック)からリモートに配置される。いくつかの実施形態では、放射線科医の第3のセットのうちの第3の放射線科医は、複数の画像を含むバッチの画像またはその導出物の放射線科医評価を実施する(例えば、この場合、バッチは放射線医学的評価の効率の向上のために選択される)。
[272]いくつかの実施形態では、AI支援放射線医学評価ワークフローは、被検者の診断手順を、スクリーニング結果に少なくとも部分的に基づいて実施して、被検者の診断結果を作り出すステップをさらに含む。いくつかの実施形態では、被検者の診断結果は、画像を取得するステップと同じクリニック訪問において作り出される。いくつかの実施形態では、被検者の診断結果は、画像を取得するステップから約1時間以内に作り出される。
[273]いくつかの実施形態では、画像またはその導出物は、被検者の身体の部位の追加的な特性に少なくとも部分的に基づいて、第1の放射線科医、第2の放射線科医、または第3の放射線科医に送られる。いくつかの実施形態では、追加的な特性は、解剖学的構造、組織特性(例えば、組織密度または物理的性質)、異物の存在(例えば、インプラント)、所見のタイプ、病状(例えば、機械学習アルゴリズムなどのアルゴリズムによって予測される)、またはそれらの組合せを含む。
[274]いくつかの実施形態では、画像またはその導出物は、第1の放射線科医、第2の放射線科医、または第3の放射線科医の追加的な特性(例えば、第1の放射線科医、第2の放射線科医、または第3の放射線科医の、少なくとも1つの画像またはその導出物の放射線医学的評価を行う個人的な能力)に少なくとも部分的に基づいて、第1の放射線科医、第2の放射線科医、または第3の放射線科医に送られる。
[275]いくつかの実施形態では、AI支援放射線医学評価ワークフローは、画像またはその導出物を第1の放射線科医に送るステップ、または画像またはその導出物を第2の放射線科医に送るステップに少なくとも部分的に基づいて、アラートを生成するステップを含む。いくつかの実施形態では、AI支援放射線医学評価ワークフローは、アラートを、被検者または被検者の臨床医療従事者に送信するステップを含む。いくつかの実施形態ではAI支援放射線医学評価ワークフローは、アラートを、患者のモバイルアプリケーションを通じて被検者に送信するステップを含む。いくつかの実施形態では、アラートは、(b)とリアルタイムか、(b)とほぼリアルタイムで生成される。
[276]本発明の好ましい実施形態が、本明細書で示され説明されているが、当業者には、そのような実施形態は単なる例として提供されることが明らかであろう。本発明は、本明細書で与えられる具体的な例によって限定されることは意図されていない。本発明は、上で言及した明細書を参照して説明されたが、本明細書における実施形態の説明および例示は、限定的な意味で解釈されるよう意味されるものではない。当業者にとっては多数の変形、変更、および置き換えが、本発明から逸脱することなく、想到されよう。さらには、本発明のすべての態様は、多様な条件と変数に依存する、本明細書で述べられる具体的な描写、構成または相対的な比率に限定されないことを理解されたい。本発明を実用化する際は、本明細書で説明される本発明の実施形態に対して様々な代替が採用され得ることを理解されたい。したがって、本発明はまた、あらゆるそのような代替、修正、変形、または等価物を包含することを企図される。以下の特許請求の範囲は、本発明の範囲を定めること、ならびにこれらの特許請求の範囲およびその等価物の範囲内の方法および構造が、それらによってカバーされることを意図される。
Claims (88)
- 前記被検者の身体の部位の少なくとも1つの画像を処理するための方法であって、
(a)前記被検者の身体の前記部位の前記少なくとも1つの画像を取得するステップと、
(b)訓練済アルゴリズムを使用して、前記少なくとも1つの画像またはその導出物を、複数のカテゴリのうちの1つのカテゴリに分類するステップであって、分類する前記ステップは、画像処理アルゴリズムを前記少なくとも1つの画像またはその導出物に適用するステップを含む、ステップと、
(c)(b)において前記少なくとも1つの画像またはその導出物を分類すると、(i)前記少なくとも1つの画像が前記複数のカテゴリのうちの第1のカテゴリに分類された場合に、前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために第1の放射線科医に送るステップ、または、(ii)前記少なくとも1つの画像が前記複数のカテゴリのうちの第2のカテゴリに分類された場合に、前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために第2の放射線科医に送るステップと、
(d)前記少なくとも1つの画像またはその導出物の放射線医学的分析に少なくとも部分的に基づいて、前記第1の放射線科医または前記第2の放射線科医から前記被検者の放射線医学的評価を受け取るステップと
を含む方法。 - 請求項1に記載の方法であって、(b)は、前記少なくとも1つの画像またはその導出物を、正常、曖昧、または、疑わしいとして分類するステップを含む、方法。
- 請求項2に記載の方法であって、前記少なくとも1つの画像またはその導出物を、前記少なくとも1つの画像またはその導出物の(b)における前記分類に基づいて分類器に送るステップをさらに含む方法。
- 請求項3に記載の方法であって、(c)は、前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために、第1の複数の放射線科医のうちの第1の放射線科医、または、第2の複数の放射線科医のうちの第2の放射線科医に送るステップを含む、方法。
- 請求項1に記載の方法であって、前記少なくとも1つの画像またはその導出物は医学的画像である、方法。
- 請求項2に記載の方法であって、前記訓練済アルゴリズムは、前記少なくとも1つの画像またはその導出物を、少なくとも約80%の感度で、正常、曖昧、または、疑わしいとして分類するように構成される、方法。
- 請求項2に記載の方法であって、前記訓練済アルゴリズムは、前記少なくとも1つの画像またはその導出物を、少なくとも約80%の特異性で、正常、曖昧、または、疑わしいとして分類するように構成される、方法。
- 請求項2に記載の方法であって、前記訓練済アルゴリズムは、前記少なくとも1つの画像またはその導出物を、少なくとも約80%の陽性予測値で、正常、曖昧、または、疑わしいとして分類するように構成される、方法。
- 請求項2に記載の方法であって、前記訓練済アルゴリズムは、前記少なくとも1つの画像またはその導出物を、少なくとも約80%の陰性予測値で、正常、曖昧、または、疑わしいとして分類するように構成される、方法。
- 請求項2に記載の方法であって、前記訓練済機械学習アルゴリズムは、前記異常な組織を含むかまたは含むと疑われる、前記少なくとも1つの画像またはその導出物の少なくとも1つの領域を識別するように構成される、方法。
- 請求項2に記載の方法であって、訓練済アルゴリズムは、前記少なくとも1つの画像またはその導出物を、がんを示すために、正常、曖昧、または、疑わしいとして分類する、方法。
- 請求項11に記載の方法であって、前記がんは乳癌である、方法。
- 請求項12に記載の方法であって、前記少なくとも1つの画像またはその導出物は、前記被検者の前記乳房の三次元画像である、方法。
- 請求項11に記載の方法であって、前記訓練済機械学習アルゴリズムは、がんを示すかまたは示すと疑われる画像を含む少なくとも約100の独立的な訓練サンプルを使用して訓練される、方法。
- 請求項11に記載の方法であって、前記訓練済アルゴリズムは、がんを示すかまたは示すと疑われる陽性画像を含む第1の複数の独立的な訓練サンプル、および、がんを示さないかまたは示すと疑われない陰性画像を含む第2の複数の独立的な訓練サンプルを使用して訓練される、方法。
- 請求項1に記載の方法であって、前記訓練済アルゴリズムは教師あり機械学習アルゴリズムを含む、方法。
- 請求項16に記載の方法であって、前記教師あり機械学習アルゴリズムは、深層学習アルゴリズム、サポートベクタマシン(SVM)、ニューラルネットワーク、または、ランダムフォレストを含む、方法。
- 請求項2に記載の方法であって、前記被検者をモニタリングするステップをさらに含み、モニタリングする前記ステップは、前記被検者の前記身体の前記部位の画像を複数の時間的ポイントにおいて評価するステップを含み、評価する前記ステップは、前記複数の時間的ポイントのそれぞれにおける、前記少なくとも1つの画像またはその導出物の、正常、曖昧、または、疑わしいとしての前記分類に少なくとも部分的に基づく、方法。
- 請求項18に記載の方法であって、前記複数の時間的ポイントにおける、前記被検者の前記身体の前記画像の前記評価における差は、(i)前記被検者の診断、(ii)前記被検者の予後、および、(iii)前記被検者の一連の処置の有効性または非有効性を含む群から選択される1つまたは複数の臨床的指標を示す、方法。
- 請求項2から19までのいずれか一項に記載の方法であって、(c)は、(i)前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第1のセットのうちの第1の放射線科医に送って、前記少なくとも1つの画像またはその導出物が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップ、(ii)前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第2のセットのうちの第2の放射線科医に送って、前記少なくとも1つの画像またはその導出物が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップ、または、(iii)前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第3のセットのうちの第3の放射線科医に送って、前記少なくとも1つの画像またはその導出物が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップをさらに含む方法。
- 請求項20に記載の方法であって、前記被検者の前記スクリーニング結果は、前記少なくとも1つの画像またはその導出物を取得する前記ステップと同じクリニック訪問において作り出される、方法。
- 請求項20に記載の方法であって、放射線科医の前記第1のセットはオンサイトクリニックに配置され、前記少なくとも1つの画像またはその導出物は前記オンサイトクリニックにおいて取得される、方法。
- 請求項20に記載の方法であって、放射線科医の前記第2のセットは放射線専門医を含み、該放射線専門医は、前記少なくとも1つの画像またはその導出物を、前記訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練される、方法。
- 請求項20に記載の方法であって、放射線科医の前記第3のセットは、オンサイトクリニックからリモートに配置され、前記少なくとも1つの画像は前記オンサイトクリニックにおいて取得される、方法。
- 請求項20に記載の方法であって、放射線科医の前記第3のセットのうちの前記第3の放射線科医は、複数の画像を含むバッチのうち前記少なくとも1つの画像またはその導出物の前記放射線科医評価を実施し、前記バッチは前記放射線医学的評価の効率の向上のために選択される、方法。
- 請求項20から25のいずれか一項に記載の方法であって、前記被検者の診断手順を、前記スクリーニング結果に少なくとも部分的に基づいて実施して、前記被検者の診断結果を作り出すステップをさらに含む方法。
- 請求項26に記載の方法であって、前記被検者の前記診断結果は、前記少なくとも1つの画像を取得する前記ステップと同じクリニック訪問において作り出される、方法。
- 請求項27に記載の方法であって、前記被検者の前記診断結果は、前記少なくとも1つの画像を取得する前記ステップから約1時間以内に作り出される、方法。
- 請求項20から28のいずれか一項に記載の方法であって、前記少なくとも1つの画像またはその導出物は、前記被検者の前記身体の前記部位の追加的な特性に少なくとも部分的に基づいて、前記第1の放射線科医、前記第2の放射線科医、または、前記第3の放射線科医に送られる、方法。
- 請求項29に記載の方法であって、前記追加的な特性は、解剖学的構造、組織特性、異物の存在、所見のタイプ、病状、または、それらの組合せを含む、方法。
- 請求項20から30のいずれか一項に記載の方法であって、前記少なくとも1つの画像またはその導出物は、前記第1の放射線科医、前記第2の放射線科医、または、前記第3の放射線科医の追加的な特性に少なくとも部分的に基づいて、前記第1の放射線科医、前記第2の放射線科医、または、前記第3の放射線科医に送られる、方法。
- 請求項1から31までのいずれか一項に記載の方法であって、(c)は、前記少なくとも1つの画像またはその導出物を前記第1の放射線科医に送る前記ステップ、または、前記少なくとも1つの画像またはその導出物を前記第2の放射線科医に送る前記ステップに少なくとも部分的に基づいて、アラートを生成するステップをさらに含む方法。
- 請求項32に記載の方法であって、前記アラートを、前記被検者または前記被検者の臨床医療従事者に送信するステップをさらに含む方法。
- 請求項33に記載の方法であって、前記アラートを、患者のモバイルアプリケーションを通じて前記被検者に送信するステップをさらに含む方法。
- 請求項32に記載の方法であって、前記アラートは、(b)とリアルタイムかまたはほぼリアルタイムで生成される、方法。
- 請求項1に記載の方法であって、前記画像処理アルゴリズムを適用するステップは、前記少なくとも1つの画像またはその導出物内で関心領域を識別するステップと、前記関心領域をラベル付けして少なくとも1つのラベル付けされた画像を作り出すステップとを含む、方法。
- 請求項36に記載の方法であって、前記少なくとも1つのラベル付けされた画像をデータベースに記憶するステップをさらに含む方法。
- 請求項1から37のいずれか一項に記載の方法であって、前記少なくとも1つの画像またはその導出物のうちの1つまたは複数および前記分類をデータベースに記憶するステップをさらに含む方法。
- 請求項1から38までのいずれか一項に記載の方法であって、前記少なくとも1つの画像またはその導出物のうちの1つまたは複数および前記分類に少なくとも部分的に基づいて、前記少なくとも1つの画像またはその導出物のプレゼンテーションを生成するステップをさらに含む方法。
- 請求項39に記載の方法であって、前記プレゼンテーションを前記データベースに記憶するステップをさらに含む方法。
- 請求項1から40までのいずれか一項に記載の方法であって、(c)は、(b)とリアルタイムかまたはほぼリアルタイムで実行される、方法。
- 請求項1に記載の方法であって、前記少なくとも1つの画像は、前記被検者から取得された複数の画像を含み、前記複数の画像は、異なるモダリティを使用するかまたは異なる時間的ポイントにおいて取得される、方法。
- 請求項1に記載の方法であって、分類する前記ステップは、前記被検者の臨床健康データを処理するステップを含む、方法。
- 前記被検者の身体の部位の少なくとも1つの画像を処理するためのコンピュータシステムであって、
前記被検者の身体の前記部位の前記少なくとも1つの画像を記憶するように構成されたデータベースと、
前記データベースに動作可能に結合された1つまたは複数のコンピュータプロセッサであって、前記1つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、
(a)訓練済アルゴリズムを使用して、前記少なくとも1つの画像またはその導出物を、複数のカテゴリのうちの1つのカテゴリに分類するステップであって、分類する前記ステップは、画像処理アルゴリズムを前記少なくとも1つの画像またはその導出物に適用するステップを含む、ステップと、
(b)(b)において前記少なくとも1つの画像またはその導出物を分類すると、(i)前記少なくとも1つの画像が前記複数のカテゴリのうちの第1のカテゴリに分類される場合に、前記少なくとも画像またはその導出物を、放射線医学的評価のために第1の放射線科医に送るステップ、または、(ii)前記少なくとも1つの画像が前記複数のカテゴリのうちの第2のカテゴリに分類される場合に、前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために第2の放射線科医に送るステップと、
(c)前記少なくとも1つの画像またはその導出物の放射線医学的分析に少なくとも部分的に基づいて、前記第1の放射線科医または前記第2の放射線科医から前記被検者の放射線医学的評価を受け取るステップと
を行うようにプログラムされる、1つまたは複数のコンピュータプロセッサと。 - 請求項44に記載のコンピュータシステムであって、(b)は、前記少なくとも1つの画像またはその導出物を、正常、曖昧、または、疑わしいとして分類するステップを含む、コンピュータシステム。
- 請求項45に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記少なくとも1つの画像またはその導出物を、前記少なくとも1つの画像または導出物の(a)における前記分類に基づいて分類器に送るステップをさらに行うようにプログラムされる、コンピュータシステム。
- 請求項46に記載のコンピュータシステムであって、(c)は、前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために、第1の複数の放射線科医のうちの第1の放射線科医、または、第2の複数の放射線科医のうちの第2の放射線科医に送るステップを含む、コンピュータシステム。
- 請求項44に記載のコンピュータシステムであって、前記少なくとも1つの画像またはその導出物は医学的画像である、コンピュータシステム。
- 請求項45に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、前記少なくとも1つの画像またはその導出物を、少なくとも約80%の感度で、正常、曖昧、または、疑わしいとして分類するように構成される、コンピュータシステム。
- 請求項45に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、前記少なくとも1つの画像またはその導出物を、少なくとも約80%の特異性で、正常、曖昧、または、疑わしいとして分類するように構成される、コンピュータシステム。
- 請求項45に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、前記少なくとも1つの画像またはその導出物を、少なくとも約80%の陽性予測値で、正常、曖昧、または、疑わしいとして分類するように構成される、コンピュータシステム。
- 請求項45に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、前記少なくとも1つの画像またはその導出物を、少なくとも約80%の陰性予測値で、正常、曖昧、または、疑わしいとして分類するように構成される、コンピュータシステム。
- 請求項45に記載のコンピュータシステムであって、前記訓練済機械学習アルゴリズムは、前記異常な組織を含むかまたは含むと疑われる、前記少なくとも1つの画像またはその導出物の前記少なくとも1つの領域を識別するように構成される、コンピュータシステム。
- 請求項44から46に記載のコンピュータシステムであって、訓練済アルゴリズムは、前記少なくとも1つの画像またはその導出物を、がんを示すために、正常、曖昧、または、疑わしいとして分類する、コンピュータシステム。
- 請求項54に記載のコンピュータシステムであって、前記がんは乳癌である、コンピュータシステム。
- 請求項55に記載のコンピュータシステムであって、前記少なくとも1つの画像またはその導出物は、前記被検者の前記乳房の三次元画像である、コンピュータシステム。
- 請求項54に記載のコンピュータシステムであって、前記訓練済機械学習アルゴリズムは、がんを示すかまたは示すと疑われる画像を含む少なくとも約100の独立的な訓練サンプルを使用して訓練される、コンピュータシステム。
- 請求項54に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、がんを示すかまたは示すと疑われる陽性画像を含む第1の複数の独立的な訓練サンプル、および、がんを示さないかまたは示すと疑われない陰性画像を含む第2の複数の独立的な訓練サンプルを使用して訓練される、コンピュータシステム。
- 請求項44に記載のコンピュータシステムであって、前記訓練済アルゴリズムは、教師あり機械学習アルゴリズムを含む、コンピュータシステム。
- 請求項59に記載のコンピュータシステムであって、前記教師あり機械学習アルゴリズムは、深層学習アルゴリズム、サポートベクタマシン(SVM)、ニューラルネットワーク、または、ランダムフォレストを含む、コンピュータシステム。
- 請求項45に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記被検者をモニタリングするステップをさらに行うようにプログラムされ、モニタリングする前記ステップは、前記被検者の前記身体の前記部位の画像を複数の時間的ポイントにおいて評価するステップを含み、評価する前記ステップは、前記複数の時間的ポイントのそれぞれにおける、前記少なくとも1つの画像またはその導出物の、正常、曖昧、または、疑わしいとしての前記分類に少なくとも部分的に基づく、コンピュータシステム。
- 請求項61に記載のコンピュータシステムであって、前記複数の時間的ポイントにおける、前記被検者の前記身体の前記画像の前記評価における差は、(i)前記被検者の診断、(ii)前記被検者の予後、および、(iii)前記被検者の一連の処置の有効性または非有効性を含む群から選択される1つまたは複数の臨床的指標を示す、コンピュータシステム。
- 請求項44から62までのいずれか一項に記載のコンピュータシステムであって、(b)は、(i)前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第1のセットのうちの第1の放射線科医に送って、前記少なくとも1つの画像またはその導出物が疑わしいと分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、(ii)前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第2のセットのうちの第2の放射線科医に送って、前記少なくとも1つの画像またはその導出物が曖昧と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップと、または、(iii)前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために放射線科医の第3のセットのうちの第3の放射線科医に送って、前記少なくとも1つの画像またはその導出物が正常と分類されるかどうかに少なくとも部分的に基づいて、スクリーニング結果を作り出すステップとをさらに含む、コンピュータシステム。
- 請求項63に記載のコンピュータシステムであって、前記被検者の前記スクリーニング結果は、前記少なくとも1つの画像またはその導出物を取得する前記ステップと同じクリニック訪問において作り出される、コンピュータシステム。
- 請求項63に記載のコンピュータシステムであって、放射線科医の前記第1のセットは、オンサイトクリニックに配置され、前記少なくとも1つの画像またはその導出物は前記オンサイトクリニックにおいて取得される、コンピュータシステム。
- 請求項63に記載のコンピュータシステムであって、放射線科医の前記第2のセットは放射線専門医を含み、該放射線専門医は、前記少なくとも1つの画像またはその導出物を、前記訓練済アルゴリズムより高い精度で、正常または疑わしいとして分類するように訓練される、コンピュータシステム。
- 請求項63に記載のコンピュータシステムであって、放射線科医の前記第3のセットは、オンサイトクリニックからリモートに配置され、前記少なくとも1つの画像は前記オンサイトクリニックにおいて取得される、コンピュータシステム。
- 請求項63に記載のコンピュータシステムであって、放射線科医の前記第3のセットのうちの前記第3の放射線科医は、複数の画像を含むバッチのうち前記少なくとも1つの画像またはその導出物の前記放射線科医評価を実施し、前記バッチは前記放射線医学的評価の効率の向上のために選択される、コンピュータシステム。
- 請求項63から68までのいずれか一項に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記スクリーニング結果に少なくとも部分的に基づいて、前記被検者に対して行われる診断手順から前記被検者の診断結果をさらに取得するようにプログラムされる、コンピュータシステム。
- 請求項69に記載のコンピュータシステムであって、前記被検者の前記診断結果は、前記少なくとも1つの画像を取得する前記ステップと同じクリニック訪問において取得される、コンピュータシステム。
- 請求項70に記載のコンピュータシステムであって、前記被検者の前記診断結果は、前記少なくとも1つの画像を取得する前記ステップから約1時間以内に取得される、コンピュータシステム。
- 請求項63から71のいずれか一項に記載のコンピュータシステムであって、前記少なくとも1つの画像またはその導出物は、前記被検者の前記身体の前記部位の追加的な特性に少なくとも部分的に基づいて、前記第1の放射線科医、前記第2の放射線科医、または、前記第3の放射線科医に送られる、コンピュータシステム。
- 請求項72に記載のコンピュータシステムであって、前記追加的な特性は、解剖学的構造、組織特性、異物の存在、所見のタイプ、病状、または、それらの組合せを含む、コンピュータシステム。
- 請求項63から73のいずれか一項に記載のコンピュータシステムであって、前記少なくとも1つの画像またはその導出物は、前記第1の放射線科医、前記第2の放射線科医、または、前記第3の放射線科医の追加的な特性に少なくとも部分的に基づいて、前記第1の放射線科医、前記第2の放射線科医、または、前記第3の放射線科医に送られる、コンピュータシステム。
- 請求項44から74までのいずれか一項に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記少なくとも1つの画像またはその導出物を前記第1の放射線科医に送る前記ステップ、または、前記少なくとも1つの画像またはその導出物を前記第2の放射線科医に送る前記ステップに少なくとも部分的に基づいて、アラートをさらに生成するようにプログラムされる、コンピュータシステム。
- 請求項75に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記アラートを前記被検者または前記被検者の臨床医療従事者にさらに送信するようにプログラムされる、コンピュータシステム。
- 請求項76に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記アラートを患者のモバイルアプリケーションを通じて前記被検者にさらに送信するようにプログラムされる、コンピュータシステム。
- 請求項75に記載のコンピュータシステムであって、前記アラートは、(a)とリアルタイムかまたはほぼリアルタイムで生成される、コンピュータシステム。
- 請求項44に記載のコンピュータシステムであって、前記画像処理アルゴリズムを適用するステップは、前記少なくとも1つの画像またはその導出物内で関心領域を識別するステップと、前記関心領域をラベル付けして少なくとも1つのラベル付けされた画像を作り出すステップとを含む、コンピュータシステム。
- 請求項79に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記少なくとも1つのラベル付けされた画像を前記データベースにさらに記憶するようにプログラムされる、コンピュータシステム。
- 請求項44から80までのいずれか一項に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記少なくとも1つの画像またはその導出物のうちの1つまたは複数および前記分類を前記データベースにさらに記憶するようにプログラムされる、コンピュータシステム。
- 請求項44から81までのいずれか一項に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記少なくとも1つの画像のうちの1つまたは複数および前記分類に少なくとも部分的に基づいて、前記少なくとも1つの画像またはその導出物のプレゼンテーションをさらに生成するようにプログラムされる、コンピュータシステム。
- 請求項82に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、個々にまたは集合的に、前記プレゼンテーションを前記データベースにさらに記憶するようにプログラムされる、コンピュータシステム。
- 請求項44に記載のシステムであって、前記1つまたは複数のコンピュータプロセッサに動作可能に結合された電子ディスプレイをさらに備え、前記電子ディスプレイは前記推奨を表示するように構成されるグラフィカルユーザインターフェースを備える、システム。
- 請求項44から84までのいずれか一項に記載のシステムであって、(b)は、(a)とリアルタイムかまたはほぼリアルタイムで実行される、システム。
- 請求項44に記載の方法であって、前記少なくとも1つの画像は、前記被検者から取得された複数の画像を含み、前記複数の画像は、異なるモダリティを使用するかまたは異なる時間的ポイントにおいて取得される、方法。
- 請求項44に記載の方法であって、分類する前記ステップは、前記被検者の臨床健康データを処理するステップを含む、方法。
- 1つまたは複数のコンピュータプロセッサによって実行されると、前記被検者の身体の部位の少なくとも1つの画像を処理するための方法を実施する機械実行可能コードを含む非一時的なコンピュータ可読媒体であって、前記方法は、
(a)前記被検者の身体の前記部位の前記少なくとも1つの画像を取得するステップと、
(b)訓練済アルゴリズムを使用して、前記少なくとも1つの画像またはその導出物を、複数のカテゴリのうちの1つのカテゴリに分類するステップであって、分類する前記ステップは、画像処理アルゴリズムを前記少なくとも1つの画像またはその導出物に適用するステップを含む、ステップと、
(c)(b)において前記少なくとも1つの画像またはその導出物を分類すると、(i)前記少なくとも1つの画像が前記複数のカテゴリのうちの第1のカテゴリに分類される場合に、前記少なくとも画像またはその導出物を、放射線医学的評価のために第1の放射線科医に送るステップ、または、(ii)前記少なくとも1つの画像が前記複数のカテゴリのうちの第2のカテゴリに分類される場合に、前記少なくとも1つの画像またはその導出物を、放射線医学的評価のために第2の放射線科医に送るステップと、
(d)前記少なくとも1つの画像またはその導出物の放射線医学的分析に少なくとも部分的に基づいて、前記第1の放射線科医または前記第2の放射線科医から前記被検者の放射線医学的評価を受け取るステップと
を含む、非一時的なコンピュータ可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062958859P | 2020-01-09 | 2020-01-09 | |
US62/958,859 | 2020-01-09 | ||
PCT/US2021/012625 WO2021142209A1 (en) | 2020-01-09 | 2021-01-08 | Methods and systems for performing real-time radiology |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023509976A true JP2023509976A (ja) | 2023-03-10 |
Family
ID=76788383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022542426A Pending JP2023509976A (ja) | 2020-01-09 | 2021-01-08 | リアルタイム放射線医学を行うための方法およびシステム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230005151A1 (ja) |
EP (1) | EP4088282A4 (ja) |
JP (1) | JP2023509976A (ja) |
CA (1) | CA3164331A1 (ja) |
WO (1) | WO2021142209A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022011755A (ja) * | 2020-06-30 | 2022-01-17 | シスメックス株式会社 | 専門家会議をコンピュータを用いて支援する方法、支援装置、専門家会議を支援するためのコンピュータプログラム、支援システム。 |
US20230121619A1 (en) * | 2021-10-19 | 2023-04-20 | GE Precision Healthcare LLC | System and methods for exam suggestions using a clustered database |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6301378B1 (en) * | 1997-06-03 | 2001-10-09 | R2 Technology, Inc. | Method and apparatus for automated detection of masses in digital mammograms |
US7664604B1 (en) * | 2001-11-30 | 2010-02-16 | University Of South Florida | Breast cancer risk analysis and computer-aided diagnosis |
CA2500805A1 (en) * | 2002-09-13 | 2004-03-25 | Arcturus Bioscience, Inc. | Interactive and automated tissue image analysis |
US7850613B2 (en) * | 2003-05-30 | 2010-12-14 | Orison Corporation | Apparatus and method for three dimensional ultrasound breast imaging |
US8145503B2 (en) * | 2005-02-25 | 2012-03-27 | Virtual Radiologic Corporation | Medical image metadata processing |
WO2013036842A2 (en) * | 2011-09-08 | 2013-03-14 | Radlogics, Inc. | Methods and systems for analyzing and reporting medical images |
WO2014205254A2 (en) * | 2013-06-21 | 2014-12-24 | Virtual Radiologic Corporation | Radiology data processing and standardization techniques |
AU2016226253A1 (en) * | 2015-03-04 | 2017-09-21 | Veracyte, Inc. | Methods for assessing the risk of disease occurrence or recurrence using expression level and sequence variant information |
US20160364527A1 (en) * | 2015-06-12 | 2016-12-15 | Merge Healthcare Incorporated | Methods and Systems for Automatically Analyzing Clinical Images and Determining when Additional Imaging May Aid a Diagnosis |
US10339650B2 (en) * | 2016-01-07 | 2019-07-02 | Koios Medical, Inc. | Method and means of CAD system personalization to reduce intraoperator and interoperator variation |
WO2018002925A1 (en) * | 2016-06-27 | 2018-01-04 | Ramot At Tel-Aviv University Ltd. | Monitoring tissue treatment using thermography |
US11004559B2 (en) * | 2017-12-15 | 2021-05-11 | International Business Machines Corporation | Differential diagnosis mechanisms based on cognitive evaluation of medical images and patient data |
-
2021
- 2021-01-08 JP JP2022542426A patent/JP2023509976A/ja active Pending
- 2021-01-08 CA CA3164331A patent/CA3164331A1/en active Pending
- 2021-01-08 EP EP21738922.0A patent/EP4088282A4/en active Pending
- 2021-01-08 WO PCT/US2021/012625 patent/WO2021142209A1/en unknown
-
2022
- 2022-07-08 US US17/860,310 patent/US20230005151A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021142209A1 (en) | 2021-07-15 |
US20230005151A1 (en) | 2023-01-05 |
EP4088282A4 (en) | 2024-03-13 |
EP4088282A1 (en) | 2022-11-16 |
CA3164331A1 (en) | 2021-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10937164B2 (en) | Medical evaluation machine learning workflows and processes | |
US10176896B2 (en) | Coronary computed tomography clinical decision support system | |
US10984905B2 (en) | Artificial intelligence for physiological quantification in medical imaging | |
US20170053064A1 (en) | Personalized content-based patient retrieval system | |
US11462318B2 (en) | Method and system for computer-aided triage of stroke | |
US20090083075A1 (en) | System and method for analyzing medical data to determine diagnosis and treatment | |
US20230005151A1 (en) | Methods and systems for performing real-time radiology | |
US20210035680A1 (en) | Systems and methods for automating clinical workflow decisions and generating a priority read indicator | |
US20220351838A1 (en) | Methods and systems for management and visualization of radiological data | |
JP7222882B2 (ja) | 医用画像評価のためのディープラーニングの応用 | |
Borovska et al. | Internet of medical imaging Things and analytics in support of precision medicine for early diagnostics of thyroid cancer | |
WO2017127459A1 (en) | Method and system for identifying diagnostic and therapeutic options for medical conditions using electronic health records | |
CA3225227A1 (en) | Methods and systems for expedited radiological screening | |
US20200075163A1 (en) | Diagnostic decision support for patient management | |
Malarvizhi et al. | A Machine Learning Method for Early Detection of Breast Masses on Screening Mammography | |
Farrag | Towards a trustworthy data-driven clinical decision support system: Breast cancer use-case | |
EP4379672A1 (en) | Methods and systems for classifying a medical image dataset | |
Raj et al. | Machine Learning in Medical Diagnosis of Cancer | |
WO2022221175A1 (en) | Methods and systems for optimized customer relationship management in healthcare | |
WO2023196333A1 (en) | Surfacing insights into left and right ventricular dysfunction through deep learning | |
CN114787938A (zh) | 用于推荐医学检查的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231222 |