JP2024053899A - CANCER DETECTION DEVICE, CANCER INFORMATION ACQUISITION METHOD, AND PROGRAM - Google Patents

CANCER DETECTION DEVICE, CANCER INFORMATION ACQUISITION METHOD, AND PROGRAM Download PDF

Info

Publication number
JP2024053899A
JP2024053899A JP2022160396A JP2022160396A JP2024053899A JP 2024053899 A JP2024053899 A JP 2024053899A JP 2022160396 A JP2022160396 A JP 2022160396A JP 2022160396 A JP2022160396 A JP 2022160396A JP 2024053899 A JP2024053899 A JP 2024053899A
Authority
JP
Japan
Prior art keywords
cancer
subject
bile duct
bile
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022160396A
Other languages
Japanese (ja)
Inventor
勢也 横山
昭英 谷本
美智代 東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kagoshima University NUC
Original Assignee
Kagoshima University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kagoshima University NUC filed Critical Kagoshima University NUC
Priority to JP2022160396A priority Critical patent/JP2024053899A/en
Publication of JP2024053899A publication Critical patent/JP2024053899A/en
Pending legal-status Critical Current

Links

Abstract

【課題】早期の膵臓癌及び胆管癌を判定することができる癌の判定装置、癌の情報取得装置及びプログラムを提供する。【解決手段】癌の判定装置1は、被検対象の胆汁中の細菌叢に関する細菌叢データ2に基づいて被検対象が胆管癌又は膵臓癌を有するか否かを判定する判定部を備える。【選択図】図1[Problem] To provide a cancer diagnosis device, a cancer information acquisition device, and a program that can diagnose early-stage pancreatic cancer and bile duct cancer. [Solution] A cancer diagnosis device (1) includes a determination unit that determines whether or not a subject has bile duct cancer or pancreatic cancer based on bacterial flora data (2) related to bacterial flora in the bile of the subject. [Selected Figure] Figure 1

Description

本発明は、癌の判定装置、癌の情報取得方法及びプログラムに関する。 The present invention relates to a cancer diagnosis device, a cancer information acquisition method, and a program.

膵胆管胆嚢系癌は予後が悪く、患者数の対する死亡者数の割合が高い。これらの癌は、早期に発見して治療を開始することで予後が良いことが知られている。例えば、胆管癌では、発見が早期であればあるほど、5年生存率が高くなっている。このため、膵臓癌の早期診断が達成できれば生存率向上に貢献すると考えられている。しかし、早期膵臓癌は基本的に症状がないため、腹部エコー検査、超音波内視鏡検査又はMR(Magnetic Resonance)胆管膵管撮影で異常を指摘されたり、他の病気でコンピュータ断層撮影検査を受けて発見されたりする場合を除いて、発見時には膵臓癌が進行している症例が多く、膵臓癌の早期診断方法が求められている。 Pancreatic and biliary duct cancers have a poor prognosis, with a high proportion of deaths compared to the number of patients. It is known that these cancers have a good prognosis if they are detected early and treatment is started early. For example, the earlier bile duct cancer is detected, the higher the 5-year survival rate. For this reason, it is believed that early diagnosis of pancreatic cancer can contribute to improving survival rates. However, because early pancreatic cancer basically has no symptoms, there are many cases in which pancreatic cancer is already advanced at the time of discovery, except when abnormalities are detected by abdominal echography, endoscopic ultrasound examination, or MR (Magnetic Resonance) cholangiopancreatography, or when it is discovered by computer tomography examination for other diseases, and a method for early diagnosis of pancreatic cancer is needed.

特許文献1では、発癌モデルマウスの解析において腸内細菌叢の変化と癌の発症とが関連しているとの知見に基づいて、腸内細菌叢を解析することで発癌リスクを検査する方法が開示されている。 Patent Document 1 discloses a method for testing the risk of cancer by analyzing the intestinal flora, based on the finding that changes in the intestinal flora are associated with the onset of cancer in an analysis of a carcinogenesis model mouse.

非特許文献1では、大腸癌と腸内細菌叢との関連が解析されており、腸内細菌叢が大腸癌の予後の判定のためのバイオマーカーとして使用できることが報告されている。 Non-patent literature 1 analyzes the relationship between colorectal cancer and intestinal flora, and reports that intestinal flora can be used as a biomarker for determining the prognosis of colorectal cancer.

国際公開第2014/126044号International Publication No. 2014/126044

Andrew Maltez Thomas,外38名,“Metagenomic analysis of colorectal cancer datasets identifies cross-cohort microbial diagnostic signatures and a link with choline degradation”,Nature Medicine,25,667-678,2019Andrew Maltez Thomas, et al., “Metagenomic analysis of colorectal cancer datasets identifies cross-cohort microbial diagnostic signatures and a link with choline degradation”, Nature Medicine, 25, 667-678, 2019

上記特許文献1では、腸内細菌叢の変化及び二次胆汁酸を産生する菌の増加が肝癌及び肺癌の増加に関連することが示されているが、膵臓癌及び胆管癌との関連は示されていない。また、上記非特許文献1における研究対象は大腸癌であって、膵臓癌及び胆管癌ではない。膵臓癌及び胆管癌の早期判定に有用なバイオマーカーがあれば、難治性癌である膵臓癌及び胆管癌の予後の改善に寄与できる。 The above-mentioned Patent Document 1 shows that changes in the intestinal flora and an increase in bacteria that produce secondary bile acids are associated with an increase in liver cancer and lung cancer, but does not show an association with pancreatic cancer and bile duct cancer. Furthermore, the subject of research in the above-mentioned Non-Patent Document 1 is colorectal cancer, not pancreatic cancer and bile duct cancer. If there were a biomarker useful for early detection of pancreatic cancer and bile duct cancer, it could contribute to improving the prognosis of pancreatic cancer and bile duct cancer, which are intractable cancers.

本発明は、上記実情に鑑みてなされたものであり、早期の膵臓癌及び胆管癌を判定することができる癌の判定装置、癌の情報取得方法及びプログラムを提供することを目的とする。 The present invention has been made in consideration of the above-mentioned circumstances, and aims to provide a cancer diagnosis device, a cancer information acquisition method, and a program that can diagnose early-stage pancreatic cancer and bile duct cancer.

(癌の判定装置)
本明細書に記載された癌の判定装置は、
被検対象の胆汁中の細菌叢に関する情報に基づいて前記被検対象が胆管癌又は膵臓癌を有するか否かを判定する判定部を備える。
(Cancer diagnosis device)
The cancer assessment device described in the present specification comprises:
The apparatus includes a determination unit that determines whether or not a subject has bile duct cancer or pancreatic cancer based on information about the bacterial flora in the bile of the subject.

前記細菌叢に関する情報は、
細菌の属ごとの相対的存在量であることとしてもよい。
The information about the bacterial flora may include
It may also be the relative abundance of each bacterial genus.

前記判定部は、
前記被検対象がステージIA以上の胆管癌又は膵臓癌を有するか否かを判定することとしてもよい。
The determination unit is
It may be possible to determine whether or not the subject has bile duct cancer or pancreatic cancer at stage IA or higher.

前記判定部は、
前記被検対象が胆管癌を有するか否かを判定する場合、胆管癌を有することが判明している胆管癌陽性対象及び胆管癌を有さないことが判明している胆管癌陰性対象の胆汁中の細菌叢に関する情報と、前記胆管癌陽性対象及び胆管癌陰性対象が胆管癌を有するか否かの情報との関係を示すサンプルデータに基づく教師あり学習で生成されたモデルによって、前記被検対象が胆管癌を有するか否かを判定し、
前記被検対象が膵臓癌を有するか否かを判定する場合、膵臓癌を有することが判明している膵臓癌陽性対象及び膵臓癌を有さないことが判明している膵臓癌陰性対象の胆汁中の細菌叢に関する情報と、前記膵臓癌陽性対象及び膵臓癌陰性対象が膵臓癌を有するか否かの情報との関係を示すサンプルデータに基づく教師あり学習で生成されたモデルによって、前記被検対象が膵臓癌を有するか否かを判定することとしてもよい。
The determination unit is
When determining whether or not the subject has bile duct cancer, determining whether or not the subject has bile duct cancer using a model generated by supervised learning based on sample data showing a relationship between information on the bacterial flora in the bile of bile duct cancer positive subjects known to have bile duct cancer and bile duct cancer negative subjects known not to have bile duct cancer, and information on whether or not the bile duct cancer positive subjects and bile duct cancer negative subjects have bile duct cancer;
When determining whether or not the subject has pancreatic cancer, whether or not the subject has pancreatic cancer may be determined using a model generated by supervised learning based on sample data showing a relationship between information regarding the bacterial flora in the bile of pancreatic cancer-positive subjects known to have pancreatic cancer and pancreatic cancer-negative subjects known not to have pancreatic cancer, and information regarding whether or not the pancreatic cancer-positive subjects and pancreatic cancer-negative subjects have pancreatic cancer.

前記判定部は、
前記サンプルデータを用いた教師あり学習を実行することにより、前記モデルを生成することとしてもよい。
The determination unit is
The model may be generated by performing supervised learning using the sample data.

本明細書に記載された上記癌の判定装置は、
PCRを実施するPCR装置、PCR産物の塩基配列を解析する塩基配列解析部、及び前記細菌叢を解析する解析部からなる群から選択される少なくとも1つをさらに備えることとしてもよい。
The cancer assessment device described in the present specification comprises:
The apparatus may further include at least one selected from the group consisting of a PCR device that performs PCR, a base sequence analysis unit that analyzes the base sequence of a PCR product, and an analysis unit that analyzes the bacterial flora.

(癌の情報取得方法)
本明細書に記載された癌の情報取得方法は、
被検対象の胆汁中の細菌叢に関する情報に基づいて前記被検対象が胆管癌又は膵臓癌を有するか否かの判定を補助するための情報を取得する。
(How to obtain cancer information)
The method for obtaining cancer information described in the present specification includes:
Based on information regarding the bacterial flora in the bile of a subject, information is obtained to assist in determining whether or not the subject has bile duct cancer or pancreatic cancer.

(プログラム)
本明細書に記載されたプログラムは、
コンピュータを、
被検対象の胆汁中の細菌叢に関する情報に基づいて前記被検対象が胆管癌又は膵臓癌を有するか否かを判定する判定部として機能させる。
(program)
The program described herein is
Computer,
The device functions as a determination unit that determines whether or not a subject has bile duct cancer or pancreatic cancer based on information about the bacterial flora in the bile of the subject.

本発明によれば、早期の膵臓癌及び胆管癌を判定することができる。 The present invention makes it possible to diagnose early-stage pancreatic cancer and bile duct cancer.

本発明の実施の形態に係る判定装置の構成を示すブロック図である。1 is a block diagram showing a configuration of a determination device according to an embodiment of the present invention; 図1の判定装置のハードウエア構成を示すブロック図である。FIG. 2 is a block diagram showing a hardware configuration of the determination device of FIG. 1 . 図1の判定装置の学習処理のフローチャートである。2 is a flowchart of a learning process of the determination device of FIG. 1 . 図1の判定装置の判定処理のフローチャートである。2 is a flowchart of a determination process of the determination device of FIG. 1 . 実施例における膵臓癌に係るモデルの結果を示す図である。Aはニューラルネットワークによるモデルで得られるリスクスコアの分布を示す図である。BはモデルについてのROC(Receiver Operatorating Characteristic)曲線を示す。1 shows the results of a model for pancreatic cancer in an example, in which A shows the distribution of risk scores obtained by a model using a neural network, and B shows a Receiver Operating Characteristic (ROC) curve for the model. 実施例における胆管癌に係るモデルの結果を示す図である。Aはニューラルネットワークによるモデルで得られるリスクスコアの分布を示す図である。BはモデルについてのROC曲線を示す。1 shows the results of a model for bile duct cancer in an example, in which A shows the distribution of risk scores obtained with a neural network model, and B shows the ROC curve for the model.

以下、本発明に係る実施の形態について図面を参照して詳細に説明する。各図面においては、同一又は同等の部分には同一の符号が付される。 The following describes in detail an embodiment of the present invention with reference to the drawings. In each drawing, the same or equivalent parts are given the same reference numerals.

本実施の形態に係る癌の判定装置は、被検対象が胆管癌及び膵臓癌の少なくとも一方を有するか否かを判定するための装置である。本明細書全体にわたって、被検対象とは、胆管及び膵臓を有する動物であれば特に限定されず、イヌ、ネコ、ブタ、サル及びヒトなどの哺乳動物が挙げられ、好ましくはヒトである。被検対象は、胆管癌若しくは膵臓癌を有することが疑われる対象、又は胆管癌及び膵臓癌を有することが知られていない対象であってもよい。 The cancer assessment device according to this embodiment is a device for assessing whether or not a subject has at least one of bile duct cancer and pancreatic cancer. Throughout this specification, the subject is not particularly limited to an animal having a bile duct and a pancreas, and examples of the subject include mammals such as dogs, cats, pigs, monkeys, and humans, and preferably humans. The subject may be a subject suspected of having bile duct cancer or pancreatic cancer, or a subject not known to have bile duct cancer or pancreatic cancer.

判定装置は、コンピュータ上に構築される。すなわち、判定装置は、ソフトウエアによる情報処理が、ハードウエア資源を用いて具体的に実現される情報処理装置である。 The determination device is constructed on a computer. In other words, the determination device is an information processing device in which information processing by software is specifically realized using hardware resources.

図1に示すように、判定装置1は、胆汁中の細菌叢に関する情報(細菌叢データ)2を入力する。細菌叢データ2は、例えば、対象の胆汁に含まれる各細菌の相対的存在量である。細菌の分類では、16SリボソームRNAをコードする遺伝子(16S rRNA遺伝子)の塩基配列の相同性に基づいた系統分類が利用できる。分類のレベルとしては、門、綱、目、科、属及び種が挙げられる。好ましくは、細菌叢データ2は、胆汁に含まれる細菌の属ごとの相対的存在量である。細菌叢データ2として使用する細菌の種類は、膵臓癌又は胆管癌の有無に統計的に関連がある細菌を選択してもよいし、胆汁に含まれる細菌のすべてであってもよい。 As shown in FIG. 1, the determination device 1 inputs information (bacterial flora data) 2 on the bacterial flora in bile. The bacterial flora data 2 is, for example, the relative abundance of each bacterium contained in the bile of a subject. In classifying bacteria, a phylogenetic classification based on the homology of the base sequence of the gene encoding 16S ribosomal RNA (16S rRNA gene) can be used. Classification levels include phylum, class, order, family, genus, and species. Preferably, the bacterial flora data 2 is the relative abundance of each genus of bacteria contained in bile. The type of bacteria used as the bacterial flora data 2 may be selected from bacteria that are statistically associated with the presence or absence of pancreatic cancer or bile duct cancer, or may be all of the bacteria contained in bile.

細菌叢データ2は、被検対象から取得した検体としての胆汁から公知の方法で取得される。胆汁は、例えば、十二指腸ゾンデを用いて採取してもよいし、摘出した胆嚢サンプルから採取してもよい。まず、胆汁からDNAを抽出し、抽出したDNAに含まれる16S rRNA遺伝子を、ポリメラーゼ連鎖反応(PCR)で増幅する。続いて、得られた増幅産物(PCR産物)の塩基配列を次世代シーケンサーなどにより決定する。PCR産物の塩基配列に基づいてクラスタリングなどにより各細菌の分類のレベルに応じた相対的存在量を算出することができる。例えば、細菌のGenus(属)レベルの分類としては、Veillonella、Rothia、Acidaminococcus、Citrobacter、Prevotella、Pseudomonas、Lactobacillus、Atopobium、Streptococcus、Staphylococcus、Pyramidobacter、Acinetobacter、Pseudoxanthomonas、Corynebacterium、Pleomorphomonas、Saccharopolyspora及びNeisseriaなどがある。 The bacterial flora data 2 is obtained by a known method from bile as a specimen obtained from a test subject. Bile may be collected, for example, using a duodenal tube or from a resected gallbladder sample. First, DNA is extracted from the bile, and the 16S rRNA gene contained in the extracted DNA is amplified by polymerase chain reaction (PCR). Next, the base sequence of the obtained amplified product (PCR product) is determined by a next-generation sequencer or the like. Based on the base sequence of the PCR product, the relative abundance according to the classification level of each bacterium can be calculated by clustering or the like. For example, genus-level classifications of bacteria include Veillonella, Rothia, Acidaminococcus, Citrobacter, Prevotella, Pseudomonas, Lactobacillus, Atobium, Streptococcus, Staphylococcus, Pyramidobacter, Acinetobacter, Pseudoxanthomonas, Corynebacterium, Pleomorphomonas, Saccharopolyspora, and Neisseria.

判定装置1は、細菌叢データ2に対して演算を行って、被検対象が胆管癌及び膵臓癌の少なくとも一方を有するか否かに関する情報(判定情報)3を出力する。判定情報3としては、被検対象が胆管癌又は膵臓癌を有するか否かを示す情報、被検対象が胆管癌又は膵臓癌を有するリスクに相関する数値及び被検対象が所定の病期以上の胆管癌又は膵臓癌を有するか否かを示す情報などである。病期は、臨床において使用される分類であれが特に限定されず、例えばTNM悪性腫瘍の分類(UICC)に基づく分類である。膵臓癌の場合、膵癌取扱い規約(日本膵臓学会編)に基づく分類であってもよい。好ましくは、判定情報3は、被検対象がステージIA以上の胆管癌又は膵臓癌を有するか否かを示す情報である。ステージIAとは、胆管癌の場合は、“単発で最大径が2cm以下、血管侵襲及び主要胆管浸潤が無い”である。膵臓癌の場合は、“腫瘍が膵臓に限局しており、最大径が2cm以下”である。 The determination device 1 performs calculations on the bacterial flora data 2 and outputs information (determination information) 3 on whether or not the subject has at least one of bile duct cancer and pancreatic cancer. The determination information 3 includes information indicating whether or not the subject has bile duct cancer or pancreatic cancer, a numerical value correlating with the risk of the subject having bile duct cancer or pancreatic cancer, and information indicating whether or not the subject has bile duct cancer or pancreatic cancer at a predetermined stage or higher. The stage of the disease is not particularly limited to a classification used in clinical practice, and is, for example, a classification based on the TNM Classification of Malignant Tumors (UICC). In the case of pancreatic cancer, it may be a classification based on the Pancreatic Cancer Treatment Guidelines (edited by the Japan Pancreas Society). Preferably, the determination information 3 is information indicating whether or not the subject has bile duct cancer or pancreatic cancer at stage IA or higher. In the case of bile duct cancer, stage IA means "single tumor with a maximum diameter of 2 cm or less, no vascular invasion or main bile duct invasion." In the case of pancreatic cancer, it means "a tumor limited to the pancreas with a maximum diameter of 2 cm or less."

判定装置1の構成について、判定装置1が、被検対象が胆管癌を有するか否かを判定する場合を例にしてより詳細に説明する。以下では、判定の対象である被検対象に対して、胆管癌を有することが判明している対象を胆管癌陽性対象、胆管癌を有さないことが判明している対象を胆管癌陰性対象とする。判定装置1は、図1に示すように、判定部10を備える。判定部10は、被検対象の細菌叢データ2に基づいて被検対象が胆管癌を有するか否かを判定する。詳細には、判定部10は、胆管癌陽性対象及び胆管癌陰性対象の細菌叢データと、胆管癌陽性対象及び胆管癌陰性対象が胆管癌を有するか否かの情報との関係を示すサンプルデータ30に基づく教師あり学習で生成されたモデルによって、被検対象が胆管癌を有するか否かを判定する。 The configuration of the determination device 1 will be described in more detail using an example in which the determination device 1 determines whether or not a test subject has bile duct cancer. In the following, a test subject that is the subject of the determination is defined as a bile duct cancer positive subject, and a test subject that is determined not to have bile duct cancer is defined as a bile duct cancer negative subject. As shown in FIG. 1, the determination device 1 includes a determination unit 10. The determination unit 10 determines whether or not a test subject has bile duct cancer based on the bacterial flora data 2 of the test subject. In detail, the determination unit 10 determines whether or not a test subject has bile duct cancer using a model generated by supervised learning based on sample data 30 showing a relationship between the bacterial flora data of the bile duct cancer positive subject and the bile duct cancer negative subject and information on whether or not the bile duct cancer positive subject and the bile duct cancer negative subject have bile duct cancer.

教師あり学習とは、説明変数とそれに付随する目的変数との組み合わせの集合を学習用データとして、学習用データに対するフィッティングを行うことにより学習を行う機械学習の一手法である。フィッティングは、学習用データに含まれる説明変数の特徴量を抽出して目的変数ごとの特徴量を選んだり、その目的変数に属するデータの特徴を抽出したり、目的変数を識別する判断基準を生成したりすることで行う。フィッティングによって、入力された説明変数からその説明変数に対応するべき目的変数を出力するモデルが生成される。モデルによって、学習用データに含まれない新たな説明変数に対応する目的変数を出力することができる。 Supervised learning is a machine learning technique that uses a set of combinations of explanatory variables and associated objective variables as training data and performs learning by fitting to the training data. Fitting is performed by extracting the features of the explanatory variables included in the training data, selecting features for each objective variable, extracting features of the data belonging to that objective variable, and generating criteria for identifying the objective variable. Fitting generates a model that outputs an objective variable that should correspond to an input explanatory variable from the explanatory variable. The model can output an objective variable that corresponds to a new explanatory variable not included in the training data.

サンプルデータ30は、学習用データに相当し、説明変数は胆管癌陽性対象及び胆管癌陰性対象の胆汁から取得される細菌叢データであって、目的変数は胆管癌陽性対象及び胆管癌陰性対象が胆管癌を有するか否かの情報、すなわち胆管癌陽性対象の場合、胆管癌を有することを示す情報であって、胆管癌陰性対象の場合、胆管癌を有さないことを示す情報である。判定部10が用いるモデルは、学習用である複数の胆管癌陽性対象及び胆管癌陰性対象の胆汁から取得される細菌叢データと、各胆管癌陽性対象及び各胆管癌陰性対象が胆管癌を有するか否かの情報との組み合わせの集合をサンプルデータ30として生成されたモデルである。 The sample data 30 corresponds to learning data, and the explanatory variables are bacterial flora data obtained from the bile of cholangiocarcinoma-positive subjects and cholangiocarcinoma-negative subjects, and the objective variable is information on whether or not the cholangiocarcinoma-positive subjects and cholangiocarcinoma-negative subjects have cholangiocarcinoma, i.e., in the case of a cholangiocarcinoma-positive subject, information indicating that the subject has cholangiocarcinoma, and in the case of a cholangiocarcinoma-negative subject, information indicating that the subject does not have cholangiocarcinoma. The model used by the determination unit 10 is a model generated as sample data 30, which is a set of combinations of bacterial flora data obtained from the bile of multiple cholangiocarcinoma-positive subjects and cholangiocarcinoma-negative subjects for learning, and information on whether or not each cholangiocarcinoma-positive subject and each cholangiocarcinoma-negative subject has cholangiocarcinoma.

例えば、細菌M1、M2、M3・・・Mnそれぞれの相対的存在量をr1、r2、r3・・・rnとして、r1~rnが説明変数である。目的変数は、胆管癌陽性対象及び胆管癌陰性対象が癌を有するか否かを示す情報である。胆管癌の有無に統計的に関連がある細菌を選択する場合、例えば、説明変数は、胆管癌陽性対象又は胆管癌陰性対象の胆汁中の細菌の属G1、G2及びG3それぞれの相対的存在量で、目的変数は、当該胆管癌陽性対象又は胆管癌陰性対象が癌を有するか否かを示す情報である。 For example, the relative abundances of bacteria M1, M2, M3, ... Mn are r1, r2, r3, ... rn, and r1 to rn are explanatory variables. The objective variable is information indicating whether or not a cholangiocarcinoma-positive subject and a cholangiocarcinoma-negative subject have cancer. When selecting bacteria that are statistically related to the presence or absence of cholangiocarcinoma, for example, the explanatory variables are the relative abundances of bacterial genera G1, G2, and G3 in the bile of a cholangiocarcinoma-positive subject or a cholangiocarcinoma-negative subject, and the objective variable is information indicating whether or not the cholangiocarcinoma-positive subject or the cholangiocarcinoma-negative subject has cancer.

判定部10は、被検対象の胆汁から取得された細菌叢データ2を、あらかじめ生成されたモデルに入力することで、被検対象が胆管癌を有するか否かを示す判定情報3を出力として得る。これにより、判定部10は、被検対象が胆管癌を有するか否かを判定する。 The determination unit 10 inputs the bacterial flora data 2 obtained from the bile of the subject into a model generated in advance, and obtains as output determination information 3 indicating whether or not the subject has bile duct cancer. In this way, the determination unit 10 determines whether or not the subject has bile duct cancer.

教師あり学習で生成するモデルには、公知の任意のモデルを採用すればよい。教師あり学習のモデルとしては、例えば、線形回帰、線形分類、ロジスティック回帰、サポートベクターマシーン、ランダムフォレスト、決定木、ニューラルネットワーク、畳み込みニューラルネットワーク、パーセプトロン、ディープラーニング及びk近傍法などが挙げられる。教師あり学習には、R、Jubatus、Theano及びTensorFlowなど、種々のフレームワークを利用できる。好ましくは、上記モデルは、ニューラルネットワークである。胆管癌を有するか否かを示す情報として2値データを使用する場合、上記モデルは被検対象が胆管癌を有するか否かを出力する分類器となる。 Any known model may be used as the model generated by supervised learning. Examples of models for supervised learning include linear regression, linear classification, logistic regression, support vector machine, random forest, decision tree, neural network, convolutional neural network, perceptron, deep learning, and k-nearest neighbor method. Various frameworks such as R, Jubatus, Theano, and TensorFlow can be used for supervised learning. Preferably, the model is a neural network. When binary data is used as information indicating whether or not a subject has cholangiocarcinoma, the model serves as a classifier that outputs whether or not the subject has cholangiocarcinoma.

判定部10は、サンプルデータ30を用いた教師あり学習を実行することにより、モデルを生成する。実際には、サンプルデータ30は複数の胆管癌陽性対象及び胆管癌陰性対象から取得される。胆管癌を判定する場合には胆管癌陰性対象(例えば、胆石症、硬化性胆管炎及び慢性膵炎などの胆管における炎症を伴う良性疾患の患者)及び各ステージの胆管癌を有する胆管癌陽性対象から取得されたサンプルデータ30を多数使用することで判定の精度を向上させることができる。なお、膵臓癌を判定する場合には肝臓癌陽性対象及び各ステージの膵臓癌を有する膵臓癌陽性対象から取得されたサンプルデータ30を多数使用することで判定の精度を向上させることができる。 The determination unit 10 generates a model by performing supervised learning using sample data 30. In practice, the sample data 30 is obtained from a plurality of bile duct cancer positive subjects and bile duct cancer negative subjects. When determining bile duct cancer, the accuracy of the determination can be improved by using a large number of sample data 30 obtained from bile duct cancer negative subjects (e.g., patients with benign diseases accompanied by inflammation in the bile duct, such as cholelithiasis, sclerosing cholangitis, and chronic pancreatitis) and bile duct cancer positive subjects having bile duct cancer at each stage. Note that, when determining pancreatic cancer, the accuracy of the determination can be improved by using a large number of sample data 30 obtained from liver cancer positive subjects and pancreatic cancer positive subjects having pancreatic cancer at each stage.

図1に示す判定装置1は、例えば、図2に示すハードウエア構成を有するコンピュータがソフトウエアプログラムを実現することにより実現される。具体的には、判定装置1は、装置全体の制御を司るCPU(Central Processing Unit)21と、CPU21の作業領域などとして動作する主記憶部22と、CPU21の動作プログラムなどを記憶する外部記憶部23と、操作部24と、表示部25と、通信インターフェイス26と、これらを接続する内部バス27から構成される。 The determination device 1 shown in Fig. 1 is realized, for example, by a computer having the hardware configuration shown in Fig. 2 implementing a software program. Specifically, the determination device 1 is composed of a CPU (Central Processing Unit) 21 that controls the entire device, a main memory unit 22 that operates as a work area for the CPU 21, an external memory unit 23 that stores the operating program of the CPU 21, an operation unit 24, a display unit 25, a communication interface 26, and an internal bus 27 that connects these.

主記憶部22は、RAM(Random Access Memory)などから構成されている。主記憶部22には、CPU21の判定プログラム28と、機械学習プログラム29と、サンプルデータ30と、細菌叢データ2とが外部記憶部23からロードされる。また、主記憶部22は、CPU21の作業領域(データの一時記憶領域)としても用いられる。 The main memory unit 22 is composed of RAM (Random Access Memory) and the like. The CPU 21's judgment program 28, machine learning program 29, sample data 30, and bacterial flora data 2 are loaded into the main memory unit 22 from the external memory unit 23. The main memory unit 22 is also used as a working area (temporary data storage area) for the CPU 21.

外部記憶部23は、フラッシュメモリ及びハードディスクなどの不揮発性メモリから構成される。外部記憶部23には、CPU21に実行させるための判定プログラム28と、機械学習プログラム29と、があらかじめ記憶されている。また、外部記憶部23には、さらに、サンプルデータ30と、被検対象の胆汁から取得された細菌叢データ2とが記憶される。 The external storage unit 23 is composed of a non-volatile memory such as a flash memory and a hard disk. A judgment program 28 to be executed by the CPU 21 and a machine learning program 29 are stored in advance in the external storage unit 23. The external storage unit 23 also stores sample data 30 and bacterial flora data 2 obtained from the bile of the subject.

操作部24は、キーボード及びマウスなどのデバイスと、これらのデバイスを内部バス27に接続するインターフェイス装置から構成されている。 The operation unit 24 is composed of devices such as a keyboard and a mouse, and an interface device that connects these devices to the internal bus 27.

表示部25は、CRT(Cathode Ray Tube)及び液晶モニタなどの表示用デバイスから構成される。表示部25は、判定情報3などを表示する。 The display unit 25 is composed of display devices such as a CRT (Cathode Ray Tube) and an LCD monitor. The display unit 25 displays the judgment information 3 and the like.

通信インターフェイス26は、外部機器とのデータ送受信を行うインターフェイスである。通信インターフェイス26を介して、サンプルデータ30及び細菌叢データ2が送受信される。 The communication interface 26 is an interface for transmitting and receiving data to and from external devices. Sample data 30 and bacterial flora data 2 are transmitted and received via the communication interface 26.

次に、本実施の形態に係る判定装置1の動作によって実現される癌の情報取得方法、すなわち判定装置1によって実行される処理について説明する。判定装置1によって実行される処理は、図3に示す学習処理と、図4に示す判定処理とに分かれている。 Next, a cancer information acquisition method realized by the operation of the determination device 1 according to this embodiment, i.e., the processing executed by the determination device 1, will be described. The processing executed by the determination device 1 is divided into a learning processing shown in FIG. 3 and a determination processing shown in FIG. 4.

まず、学習処理について説明する。学習段階では、機械学習プログラム29が外部記憶部23から主記憶部22に読み込まれ、CPU21が、機械学習プログラム29を実行することにより、処理が実行される。 First, the learning process will be described. In the learning stage, the machine learning program 29 is loaded from the external storage unit 23 into the main storage unit 22, and the CPU 21 executes the machine learning program 29 to perform the process.

図3に示すように、まず、判定装置1は、サンプルデータ30の読み込みを行う(ステップS1)。ここでは、サンプルデータ30が外部記憶部23から主記憶部22に読み込まれる。 As shown in FIG. 3, first, the determination device 1 reads the sample data 30 (step S1). Here, the sample data 30 is read from the external storage unit 23 into the main storage unit 22.

続いて、判定部10は、サンプルデータ30を用いて教師あり学習を行う(ステップS2)。教師あり学習により、教師あり学習で生成されたモデルは、後述される判定プログラム28で用いられるため、主記憶部22及び外部記憶部23に記憶される。ステップS2が完了すると、判定装置1は、学習処理を終了する。 Then, the judgment unit 10 performs supervised learning using the sample data 30 (step S2). The model generated by the supervised learning is stored in the main memory unit 22 and the external memory unit 23 for use in the judgment program 28 described later. When step S2 is completed, the judgment device 1 ends the learning process.

次に、判定処理について説明する。判定処理では、判定プログラム28が外部記憶部23から主記憶部22に読み込まれ、CPU21が、判定プログラム28を実行することにより、処理が実行される。 Next, the judgment process will be described. In the judgment process, the judgment program 28 is loaded from the external storage unit 23 into the main storage unit 22, and the CPU 21 executes the judgment program 28 to perform the process.

図4に示すように、まず、判定装置1は、細菌叢データ2の読み込みを行う(ステップS11)。ここでは、細菌叢データ2が外部記憶部23から主記憶部22に読み込まれる。続いて、判定部10は、教師あり学習で生成されたモデルに従って細菌叢データ2から被検対象が胆管癌を有するか否かを判定し、判定情報3が出力される(ステップS12)。ステップS12が完了すると、判定装置1は、判定処理を終了する。 As shown in FIG. 4, first, the determination device 1 reads the bacterial flora data 2 (step S11). Here, the bacterial flora data 2 is read from the external memory unit 23 to the main memory unit 22. Next, the determination unit 10 determines whether or not the subject has bile duct cancer from the bacterial flora data 2 according to the model generated by supervised learning, and the determination information 3 is output (step S12). When step S12 is completed, the determination device 1 ends the determination process.

本実施の形態に係る判定装置1は、胆汁から取得される細菌叢データ2に基づいて被検対象が胆管癌を有するか否かを判定する。下記実施例に示すように、胆汁中の細菌叢に関する情報によって、胆管癌を精度良く判定することができる。 The determination device 1 according to this embodiment determines whether or not a subject has bile duct cancer based on bacterial flora data 2 acquired from bile. As shown in the following examples, bile duct cancer can be determined with high accuracy based on information about the bacterial flora in bile.

本実施の形態では、細菌叢データ2が細菌の属ごとの相対的存在量であってもよいこととした。細菌の相対的存在量は、市販のキットなどを使用して比較的容易に決定できるため、簡便に被検対象が胆管癌を有するか否かを判定することができる。また、判定部10は、被検対象がステージIA以上の膵臓癌又は胆管癌を有するか否かを判定してもよいこととした。ステージIAの膵臓癌及び胆管癌は、最大径が2cm以下である。判定装置1は、難治性である膵臓癌及び胆管癌を、このような早期であっても判定することができる。 In this embodiment, the bacterial flora data 2 may be the relative abundance of each bacterial genus. The relative abundance of bacteria can be relatively easily determined using a commercially available kit, etc., so it is possible to easily determine whether or not the subject has bile duct cancer. The determination unit 10 may also determine whether or not the subject has pancreatic cancer or bile duct cancer of stage IA or higher. Stage IA pancreatic cancer and bile duct cancer have a maximum diameter of 2 cm or less. The determination device 1 can determine intractable pancreatic cancer and bile duct cancer even at such an early stage.

なお、本実施の形態に係る判定装置1は、判定部10でモデルを生成するようにしたが、判定部10は、生成したモデルではなく、判定装置1の外部で生成され、外部記憶部23にあらかじめ記憶されたモデルにより被検対象が胆管癌を有するか否かを判定してもよい。 In the present embodiment, the determination device 1 generates a model in the determination unit 10, but the determination unit 10 may determine whether or not the subject has bile duct cancer using a model that is generated outside the determination device 1 and pre-stored in the external storage unit 23, rather than using the generated model.

判定情報3は、被検対象が胆管癌を有するか否かの判定を補助するための情報である。よって、別の実施の形態では、癌の情報取得方法が提供され、当該情報取得方法では、被検対象の細菌叢データ2に基づいて被検対象が胆管癌を有するか否かの判定を補助するための情報を取得する取得ステップを含む。 The determination information 3 is information for assisting in the determination of whether or not the subject has bile duct cancer. Therefore, in another embodiment, a cancer information acquisition method is provided, which includes an acquisition step of acquiring information for assisting in the determination of whether or not the subject has bile duct cancer based on the bacterial flora data 2 of the subject.

なお、上記では判定装置1の構成について、被検対象が胆管癌を有するか否かを判定する場合について説明したが、被検対象が膵臓癌を有するか否かを判定する場合の判定装置1の構成は、上述の被検対象が胆管癌を有するか否かを判定する場合の判定装置1の構成についての説明を、胆管癌を膵臓癌に置き換えて参照すればよい。被検対象が膵臓癌を有するか否かを判定する場合、判定部10は、被検対象の細菌叢データ2に基づいて被検対象が膵臓癌を有するか否かを判定する。詳細には、判定部10は、膵臓癌陽性対象及び膵臓癌陰性対象の細菌叢データと、膵臓癌陽性対象及び膵臓癌陰性対象が膵臓癌を有するか否かの情報との関係を示すサンプルデータ30に基づく教師あり学習で生成されたモデルによって、被検対象が膵臓癌を有するか否かを判定する。 The above describes the configuration of the determination device 1 when determining whether or not a subject has bile duct cancer. However, for the configuration of the determination device 1 when determining whether or not a subject has pancreatic cancer, the above description of the configuration of the determination device 1 when determining whether or not a subject has bile duct cancer can be referred to by replacing bile duct cancer with pancreatic cancer. When determining whether or not a subject has pancreatic cancer, the determination unit 10 determines whether or not the subject has pancreatic cancer based on the bacterial flora data 2 of the subject. In detail, the determination unit 10 determines whether or not the subject has pancreatic cancer based on a model generated by supervised learning based on sample data 30 indicating the relationship between the bacterial flora data of pancreatic cancer positive subjects and pancreatic cancer negative subjects and information on whether or not pancreatic cancer positive subjects and pancreatic cancer negative subjects have pancreatic cancer.

上述の判定装置1のハードウエア構成やソフトウエア構成は一例であり、任意に変更及び修正が可能である。例えば、判定装置1は、PCRを実施するPCR装置、PCR産物の塩基配列を解析する塩基配列解析部、及び細菌叢を解析する解析部からなる群から選択される少なくとも1つをさらに備えてもよい。PCR装置としては、公知のサーマルサイクラーなどを使用すればよい。塩基配列解析部は、例えばサンガー法を応用した公知の方法を採用することができる。PCR産物のように多くのDNA断片の塩基配列の解析には次世代シーケンサーを使用するのが好ましい。解析部は、塩基配列解析部から出力された塩基配列を公知の方法で統計的に解析し、各細菌の分類のレベルに応じた相対的存在量を算出する。PCR装置、塩基配列解析部及び解析部は、CPU21の制御下で動作してもよいし、別のCPUに制御されてもよい。 The hardware and software configurations of the determination device 1 described above are merely examples, and can be changed or modified as desired. For example, the determination device 1 may further include at least one selected from the group consisting of a PCR device that performs PCR, a base sequence analysis unit that analyzes the base sequence of the PCR product, and an analysis unit that analyzes the bacterial flora. A known thermal cycler or the like may be used as the PCR device. The base sequence analysis unit may employ a known method that applies the Sanger method, for example. It is preferable to use a next-generation sequencer for analyzing the base sequences of many DNA fragments such as PCR products. The analysis unit statistically analyzes the base sequences output from the base sequence analysis unit using a known method, and calculates the relative abundance of each bacterium according to the classification level. The PCR device, the base sequence analysis unit, and the analysis unit may operate under the control of the CPU 21, or may be controlled by another CPU.

別の実施の形態では、胆管癌の早期診断方法が提供される。胆管癌の早期診断方法は、被検対象の胆汁中の細菌叢に関する情報に基づいて、胆管癌陽性対象及び胆管癌陰性対象の胆汁中の細菌叢に関する情報と、胆管癌陽性対象及び胆管癌陰性対象が胆管癌を有するか否かの情報との関係を示すサンプルデータに基づく教師あり学習で生成されたモデルによって、被検対象が胆管癌を有するか否かを判定し、胆管癌を有すると判定された被検対象を胆管癌であると診断する。 In another embodiment, a method for early diagnosis of cholangiocarcinoma is provided. The method for early diagnosis of cholangiocarcinoma determines whether or not a subject has cholangiocarcinoma based on information about the bacterial flora in the bile of a subject, using a model generated by supervised learning based on sample data showing a relationship between information about the bacterial flora in the bile of cholangiocarcinoma-positive subjects and cholangiocarcinoma-negative subjects and information about whether or not cholangiocarcinoma-positive subjects and cholangiocarcinoma-negative subjects have cholangiocarcinoma, and diagnoses subjects determined to have cholangiocarcinoma as having cholangiocarcinoma.

上記の胆管癌の早期診断方法は、被検対象の胆汁中の細菌叢に関する情報を取得することを含んでもよい。被検対象の胆汁中の細菌叢に関する情報を取得することは、被検対象の胆汁を取得し、被検対象の胆汁中の細菌の16S rRNA遺伝子をPCRで増幅し、胆汁中の細菌の16S rRNA遺伝子のPCR増幅物の塩基配列をシーケンサーにより決定することを含んでもよい。なお、本明細書において、胆汁中の細菌叢に関する情報とは、被検対象の胆汁中の細菌の16S rRNA遺伝子のPCR増幅物の塩基配列情報であってもよい。 The above-mentioned method for early diagnosis of bile duct cancer may include obtaining information about the bacterial flora in the bile of the subject. Obtaining information about the bacterial flora in the bile of the subject may include obtaining bile from the subject, amplifying the 16S rRNA gene of bacteria in the bile of the subject by PCR, and determining the base sequence of the PCR amplified product of the 16S rRNA gene of the bacteria in the bile by a sequencer. In this specification, the information about the bacterial flora in the bile may be base sequence information of the PCR amplified product of the 16S rRNA gene of bacteria in the bile of the subject.

CPU21、主記憶部22、外部記憶部23、操作部24、表示部25、通信インターフェイス26及び内部バス27などから構成される判定装置1の処理を行う中心となる部分は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。例えば、上記の動作を実行するためのコンピュータプログラムを、コンピュータが読み取り可能な記録媒体(フレキシブルディスク、CD-ROM(compact disc read only memory)及びDVD-ROM(digital versatile disk read only memory)など)に格納して配布し、当該コンピュータプログラムをコンピュータにインストールすることにより、上記の処理を実行する判定装置1を構成してもよい。また、インターネットなどの通信ネットワーク上のサーバ装置が有する記憶装置に当該コンピュータプログラムを格納しておき、通常のコンピュータシステムがダウンロードなどすることで判定装置1を構成してもよい。 The core part of the processing of the determination device 1, which is composed of the CPU 21, main memory 22, external memory 23, operation unit 24, display unit 25, communication interface 26, internal bus 27, etc., can be realized by using a normal computer system, not a dedicated system. For example, the computer program for executing the above operations may be stored and distributed on a computer-readable recording medium (such as a flexible disk, a CD-ROM (compact disc read only memory), or a DVD-ROM (digital versatile disk read only memory)), and the determination device 1 that executes the above processing may be configured by installing the computer program on a computer. Also, the determination device 1 may be configured by storing the computer program in a storage device of a server device on a communication network such as the Internet, and a normal computer system downloading the computer program.

判定装置1の機能を、OS(オペレーティングシステム)とアプリケーションプログラムの分担、またはOSとアプリケーションプログラムとの協働により実現する場合などには、アプリケーションプログラム部分のみを記録媒体や記憶装置に格納してもよい。 When the functions of the determination device 1 are realized by sharing between an OS (operating system) and an application program, or by cooperation between an OS and an application program, only the application program portion may be stored in a recording medium or storage device.

搬送波にコンピュータプログラムを重畳し、通信ネットワークを介して配信することも可能である。たとえば、通信ネットワーク上の掲示板(BBS, Bulletin Board System)にコンピュータプログラムを掲示し、ネットワークを介してコンピュータプログラムを配信してもよい。そして、このコンピュータプログラムを起動し、OSの制御下で、他のアプリケーションプログラムと同様に実行することにより、前記の処理を実行できるように構成してもよい。 It is also possible to superimpose a computer program on a carrier wave and distribute it over a communications network. For example, the computer program may be posted on a bulletin board system (BBS) on the communications network and distributed over the network. The computer program may then be started and executed under the control of the OS in the same way as other application programs, thereby enabling the above-mentioned processing to be performed.

上述の判定装置1及び癌の情報取得方法により判定される胆管癌及び膵臓癌は早期癌であってもよい。胆管癌の場合、早期癌は、例えば、TNM分類におけるT=1(単発で最大径が2cm以下、血管侵襲及び主要胆管浸潤が無い)の癌である。膵臓癌の場合、早期癌は、例えば、TNM分類におけるT=1(腫瘍が膵臓に限局しており、最大径が2cm以下)である。 The bile duct cancer and pancreatic cancer determined by the above-mentioned determination device 1 and cancer information acquisition method may be early-stage cancer. In the case of bile duct cancer, early-stage cancer is, for example, T=1 cancer in the TNM classification (single tumor with a maximum diameter of 2 cm or less, no vascular invasion or main bile duct invasion). In the case of pancreatic cancer, early-stage cancer is, for example, T=1 cancer in the TNM classification (tumor limited to the pancreas with a maximum diameter of 2 cm or less).

以下の実施例により、本発明をさらに具体的に説明するが、本発明は実施例によって限定されるものではない。 The present invention will be explained in more detail with reference to the following examples, but the present invention is not limited to these examples.

[DNAの抽出]
QIAamp PowerFecal DNA Kit(Qiagen社製)を用いて、膵臓癌及び胆管癌に関して確定診断がなされている対象の胆汁検体からDNAを抽出した。Qubit 3 system(Invitrogen社製)を用いて抽出後のDNAの収量を確認した。DNAの濃度が10ng/ml以下の検体については除外した。
[DNA extraction]
Using the QIAamp PowerFecal DNA Kit (Qiagen), DNA was extracted from bile samples from subjects with a definitive diagnosis of pancreatic cancer and bile duct cancer. The yield of DNA after extraction was confirmed using the Qubit 3 system (Invitrogen). Samples with a DNA concentration of 10 ng/ml or less were excluded.

[次世代シークエンサー解析ライブラリの作成]
KAPA HiFi HotStart ReadyMix DNA polymerase(Roche Diagnostics社製)を用いて、Nextera overhang adaptters(Illumina社製)で設計したPro341F/Pro805R(V3-V4)プライマー(配列番号1及び2)で細菌の16S rRNA遺伝子をPCRで増幅した。次に、Nextera XT index primers(Integrated DNA Technologies社製)でデュアルインデックスとIllumina sequencing adapttersとを取り付けるために、KAPA HiFi HotStart ReadyMix DNA polymerase(Roche Diagnostics)を用いて、2回目のPCRを実施した。なお、2回のPCRにおいて得られたPCR産物はAMPure XP beads(Beckman Coulter社製)を用いて精製した。
[Creation of next-generation sequencer analysis library]
The bacterial 16S rRNA gene was amplified by PCR using KAPA HiFi HotStart ReadyMix DNA polymerase (Roche Diagnostics) and Pro341F/Pro805R (V3-V4) primers (SEQ ID NOs: 1 and 2) designed with Nextera overlap adapters (Illumina). Next, a second PCR was performed using KAPA HiFi HotStart ReadyMix DNA polymerase (Roche Diagnostics) to attach dual indexes and Illumina sequencing adapters with Nextera XT index primers (Integrated DNA Technologies). The PCR products obtained in the second PCR were purified using AMPure XP beads (Beckman Coulter).

[シークエンス決定]
PCR産物をQubit 3 systemを用いて定量した後、各サンプルから等モル比をプールし、MiSeq System(Illumina社製)で塩基配列を決定した。
[Sequence decision]
The PCR products were quantified using the Qubit 3 system, and equimolar ratios were pooled from each sample, and the base sequences were determined using the MiSeq System (Illumina).

[データマインニング]
シーケンサーから得られた生リードを、MiSeqシステムを用いてバーコードとプライマー配列にしたがってフィルタリングし、トリミングを行った。続いて、QIIME2[34] v2019.4においてDADA2パイプラインを用いて品質を評価し、フィルタリングし、キメラを検出した。
[Data Mining]
Raw reads from the sequencer were filtered and trimmed according to barcode and primer sequences using the MiSeq system, and then quality assessed, filtered, and chimeras detected using the DADA2 pipeline in QIIME2 [34] v2019.4.

[細菌叢解析]
QIIME2[34] v2019.4においてSILVA 132(https://www.arb-silva.de/download/archive/)の99%クラスタリングを用いて、PCR産物のバリアントに分類を付与した。次に、胆汁中細菌叢情報としての全配列の相対的存在量(パーミリオド)を、Qiime2のqiime feature-table rarefyを用いて算出した。
[Bacterial flora analysis]
The PCR product variants were classified using 99% clustering of SILVA 132 (https://www.arb-silva.de/download/archive/) in QIIME2 [34] v2019.4. The relative abundance (per million) of all sequences as bile bacterial flora information was then calculated using qiime feature-table rarefy in QIIME2.

[早期診断モデルの構築]
胆管癌について、Genusレベルでの胆汁中細菌叢情報と臨床情報(TNM分類:取り扱い規約第6版)とを学習データとして使用し、ニューラルネットワークによって、Tが0か1(単発で最大径が2cm以下、血管侵襲及び主要胆管浸潤が無い(ステージIA))以上かを判別する機械学習を行った。
[Construction of an early diagnosis model]
For bile duct cancer, bile bacterial flora information at the Genus level and clinical information (TNM classification: handling guidelines, 6th edition) were used as learning data, and machine learning was performed using a neural network to determine whether T was 0 or 1 (single lesion, 2 cm or less in maximum diameter, no vascular invasion or main bile duct invasion (Stage IA)).

膵臓癌について、Genusレベルでの胆汁中細菌叢情報と臨床情報(TNM分類:取り扱い規約第6版)とを学習データとして使用し、ニューラルネットワークによって、Tが0か1(腫瘍が膵臓に限局しており、最大径が2cm以下(ステージIA))以上かを判別する機械学習を行った。 For pancreatic cancer, bile bacterial flora information at the Genus level and clinical information (TNM classification: handling guidelines, 6th edition) were used as learning data, and machine learning was performed using a neural network to determine whether T is 0 or 1 (the tumor is confined to the pancreas and the maximum diameter is 2 cm or less (stage IA)).

[結果]
膵臓癌について、T=0及びT≧1それぞれのリスクスコアを図5Aに示す。図5Bは、膵臓癌について、ニューラルネットワークによるモデルの一個抜き交差検証(LOOCV)のROC曲線を示す。膵臓癌の判定における感度、特異度及び的中率は、それぞれ76%、85%及び82%であった。
[result]
The risk scores for pancreatic cancer at T=0 and T≧1 are shown in FIG 5A. FIG 5B shows the ROC curve of leave-one-out cross-validation (LOOCV) of the neural network model for pancreatic cancer. The sensitivity, specificity and predictive value for determining pancreatic cancer were 76%, 85% and 82%, respectively.

胆管癌について、T=0及びT≧1それぞれのリスクスコアを図6Aに示す。図6Bは、胆管癌について、ニューラルネットワークによるモデルのLOOCVのROC曲線を示す。胆管癌の判定における感度、特異度及び的中率は、それぞれ84%、88%及び86%であった。 Figure 6A shows the risk scores for T=0 and T≧1 for bile duct cancer. Figure 6B shows the ROC curve of the LOOCV of the neural network model for bile duct cancer. The sensitivity, specificity, and predictive value for diagnosing bile duct cancer were 84%, 88%, and 86%, respectively.

この発明は、この発明の広義の精神と範囲を逸脱することなく、様々な実施の形態及び変形が可能とされるものである。また、上述した実施の形態は、この発明を説明するためのものであり、この発明の範囲を限定するものではない。すなわち、この発明の範囲は、実施の形態ではなく、特許請求の範囲によって示される。そして、特許請求の範囲内及びそれと同等の発明の意義の範囲内で施される様々な変形が、この発明の範囲内とみなされる。 This invention allows for various embodiments and modifications without departing from the broad spirit and scope of the invention. Furthermore, the above-described embodiment is intended to explain the invention and does not limit the scope of the invention. In other words, the scope of the invention is indicated by the claims, not the embodiments. Furthermore, various modifications made within the scope of the claims and within the scope of the meaning of the invention equivalent thereto are considered to be within the scope of the invention.

1 判定装置、2 細菌叢データ、3 判定情報、10 判定部、21 CPU、22 主記憶部、23 外部記憶部、24 操作部、25 表示部、26 通信インターフェイス、27 内部バス、28 判定プログラム、29 機械学習プログラム、30 サンプルデータ 1 Determination device, 2 Bacterial flora data, 3 Determination information, 10 Determination unit, 21 CPU, 22 Main memory unit, 23 External memory unit, 24 Operation unit, 25 Display unit, 26 Communication interface, 27 Internal bus, 28 Determination program, 29 Machine learning program, 30 Sample data

Claims (8)

被検対象の胆汁中の細菌叢に関する情報に基づいて前記被検対象が胆管癌又は膵臓癌を有するか否かを判定する判定部を備える、
癌の判定装置。
A determination unit that determines whether or not a subject has bile duct cancer or pancreatic cancer based on information about a bacterial flora in the bile of the subject.
Cancer diagnosis device.
前記細菌叢に関する情報は、
細菌の属ごとの相対的存在量である、
請求項1に記載の癌の判定装置。
The information about the bacterial flora may include
The relative abundance of each bacterial genus,
The cancer diagnosis device according to claim 1 .
前記判定部は、
前記被検対象がステージIA以上の胆管癌又は膵臓癌を有するか否かを判定する、
請求項1又は2に記載の癌の判定装置。
The determination unit is
Determine whether the subject has stage IA or higher bile duct cancer or pancreatic cancer;
The cancer diagnosis device according to claim 1 or 2.
前記判定部は、
前記被検対象が胆管癌を有するか否かを判定する場合、胆管癌を有することが判明している胆管癌陽性対象及び胆管癌を有さないことが判明している胆管癌陰性対象の胆汁中の細菌叢に関する情報と、前記胆管癌陽性対象及び胆管癌陰性対象が胆管癌を有するか否かの情報との関係を示すサンプルデータに基づく教師あり学習で生成されたモデルによって、前記被検対象が胆管癌を有するか否かを判定し、
前記被検対象が膵臓癌を有するか否かを判定する場合、膵臓癌を有することが判明している膵臓癌陽性対象及び膵臓癌を有さないことが判明している膵臓癌陰性対象の胆汁中の細菌叢に関する情報と、前記膵臓癌陽性対象及び膵臓癌陰性対象が膵臓癌を有するか否かの情報との関係を示すサンプルデータに基づく教師あり学習で生成されたモデルによって、前記被検対象が膵臓癌を有するか否かを判定する、
請求項1又は2に記載の癌の判定装置。
The determination unit is
When determining whether or not the subject has bile duct cancer, determining whether or not the subject has bile duct cancer using a model generated by supervised learning based on sample data showing a relationship between information on the bacterial flora in the bile of bile duct cancer positive subjects known to have bile duct cancer and bile duct cancer negative subjects known not to have bile duct cancer, and information on whether or not the bile duct cancer positive subjects and bile duct cancer negative subjects have bile duct cancer;
When determining whether or not the subject has pancreatic cancer, the method determines whether or not the subject has pancreatic cancer using a model generated by supervised learning based on sample data showing a relationship between information on bacterial flora in bile of pancreatic cancer-positive subjects known to have pancreatic cancer and pancreatic cancer-negative subjects known not to have pancreatic cancer, and information on whether or not the pancreatic cancer-positive subjects and pancreatic cancer-negative subjects have pancreatic cancer.
The cancer diagnosis device according to claim 1 or 2.
前記判定部は、
前記サンプルデータを用いた教師あり学習を実行することにより、前記モデルを生成する、
請求項4に記載の癌の判定装置。
The determination unit is
generating the model by performing supervised learning using the sample data;
The cancer diagnosis device according to claim 4.
PCRを実施するPCR装置、PCR産物の塩基配列を解析する塩基配列解析部、及び前記細菌叢を解析する解析部からなる群から選択される少なくとも1つをさらに備える、
請求項1又は2に記載の癌の判定装置。
The apparatus further includes at least one selected from the group consisting of a PCR device for performing PCR, a base sequence analysis unit for analyzing the base sequence of a PCR product, and an analysis unit for analyzing the bacterial flora.
The cancer diagnosis device according to claim 1 or 2.
被検対象の胆汁中の細菌叢に関する情報に基づいて前記被検対象が胆管癌又は膵臓癌を有するか否かの判定を補助するための情報を取得する、
癌の情報取得方法。
obtaining information for assisting in determining whether or not the subject has bile duct cancer or pancreatic cancer based on information regarding the bacterial flora in the bile of the subject;
How to get information about cancer.
コンピュータを、
被検対象の胆汁中の細菌叢に関する情報に基づいて前記被検対象が胆管癌又は膵臓癌を有するか否かを判定する判定部として機能させる、
プログラム。
Computer,
and functioning as a determination unit that determines whether or not a subject has bile duct cancer or pancreatic cancer based on information about the bacterial flora in the bile of the subject.
program.
JP2022160396A 2022-10-04 2022-10-04 CANCER DETECTION DEVICE, CANCER INFORMATION ACQUISITION METHOD, AND PROGRAM Pending JP2024053899A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022160396A JP2024053899A (en) 2022-10-04 2022-10-04 CANCER DETECTION DEVICE, CANCER INFORMATION ACQUISITION METHOD, AND PROGRAM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022160396A JP2024053899A (en) 2022-10-04 2022-10-04 CANCER DETECTION DEVICE, CANCER INFORMATION ACQUISITION METHOD, AND PROGRAM

Publications (1)

Publication Number Publication Date
JP2024053899A true JP2024053899A (en) 2024-04-16

Family

ID=90670595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022160396A Pending JP2024053899A (en) 2022-10-04 2022-10-04 CANCER DETECTION DEVICE, CANCER INFORMATION ACQUISITION METHOD, AND PROGRAM

Country Status (1)

Country Link
JP (1) JP2024053899A (en)

Similar Documents

Publication Publication Date Title
US20200342958A1 (en) Methods and systems for assessing inflammatory disease with deep learning
KR102461014B1 (en) Methods for Evaluating Lung Cancer Status
WO2019191649A1 (en) Methods and systems for analyzing microbiota
AU2019269679A1 (en) Cell-free DNA for assessing and/or treating cancer
CN110114477A (en) Method for using total and specificity Cell-free DNA assessment risk
WO2019023517A2 (en) Genomic sequencing classifier
US20230175058A1 (en) Methods and systems for abnormality detection in the patterns of nucleic acids
JP2023524016A (en) RNA markers and methods for identifying colon cell proliferative disorders
US20220372573A1 (en) Methods and systems for detection of kidney disease or disorder by gene expression analysis
Subramanian et al. Obesity-instructed TREM2high macrophages identified by comparative analysis of diabetic mouse and human kidney at single cell resolution
US20220213558A1 (en) Methods and systems for urine-based detection of urologic conditions
US20180371553A1 (en) Methods and compositions for the analysis of cancer biomarkers
EP4070317A1 (en) Machine learning techniques for gene expression analysis
CN116312800A (en) Lung cancer characteristic identification method, device and storage medium based on circulating RNA whole transcriptome sequencing in blood plasma
JP2024053899A (en) CANCER DETECTION DEVICE, CANCER INFORMATION ACQUISITION METHOD, AND PROGRAM
JP2021506308A (en) Compositions and Methods for Diagnosing Lung Cancer Using Gene Expression Profiles
WO2019023917A1 (en) Biomarkers for atherosclerotic cardiovascular diseases
WO2018210338A1 (en) Methods for detecting malignant colon conditions
Graham Identifying individuals at-risk of developing oesophageal adenocarcinoma through symptom, risk factor and salivary biomarker analysis
WO2023183468A2 (en) Tcr/bcr profiling for cell-free nucleic acid detection of cancer
WO2021222618A1 (en) Methods and systems for assessing fibrotic disease with deep learning
JP2023106912A (en) Prognosis estimation device, information acquiring method, program and kit for estimating prognosis of biliary tract cancer
Waechter et al. Christian Waechter1, 2*, Leon Fehse3, Marius Welzel3, Dominik Heider3, Lek Babalija1, Juan Cheko1, Julian Mueller1, Jochen Pöling2, Thomas Braun2, Sabine Pankuweit1, Eberhard Weihe4, Ralf Kinscherf4, Bernhard Schieffer1, Ulrich Luesebrink1, Muhidien Soufi1, 5 and Volker Ruppert1, 5
WO2022245342A1 (en) Methods and systems for detection of kidney disease or disorder by gene expression analysis
JP2024513563A (en) Conditional return of tissue of origin for localization accuracy