JP6792751B2 - 分類システム - Google Patents
分類システム Download PDFInfo
- Publication number
- JP6792751B2 JP6792751B2 JP2019039332A JP2019039332A JP6792751B2 JP 6792751 B2 JP6792751 B2 JP 6792751B2 JP 2019039332 A JP2019039332 A JP 2019039332A JP 2019039332 A JP2019039332 A JP 2019039332A JP 6792751 B2 JP6792751 B2 JP 6792751B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- image
- attribute
- candidate
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000463 material Substances 0.000 claims description 57
- 238000011156 evaluation Methods 0.000 claims description 21
- 238000012795 verification Methods 0.000 claims description 12
- 208000024891 symptom Diseases 0.000 description 32
- 238000013135 deep learning Methods 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 206010003011 Appendicitis Diseases 0.000 description 3
- 241000270722 Crocodylidae Species 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- LNNWVNGFPYWNQE-GMIGKAJZSA-N desomorphine Chemical compound C1C2=CC=C(O)C3=C2[C@]24CCN(C)[C@H]1[C@@H]2CCC[C@@H]4O3 LNNWVNGFPYWNQE-GMIGKAJZSA-N 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 208000010125 myocardial infarction Diseases 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000005309 stochastic process Methods 0.000 description 2
- 208000004998 Abdominal Pain Diseases 0.000 description 1
- 206010000097 Abdominal tenderness Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 206010020718 hyperplasia Diseases 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
この出願に関連する先行技術文献としては次のものがある。
しかし、それぞれの分野で長い時間をかけて形成されてきた思考の枠組みの有用性は強固である。いかに大量とはいえ、事前に内部論理構造を一切仮定せずに、全てのデータをフラットにして解析しても、既に知られているありきたりの知見の再確認や、意味がつけにくい相互関係の指摘に留まることが少なくない。
深層学習等では、多数の層からなるニューラルネットワークが使用される。
認識結果が出ても、なぜその認識となったのかを人間が理解することが困難である。
認識精度が上がったとはいえ、100%ではないので、必ず誤認識が発生するが、その責任は、その認識結果を利用した人間が負うしかない。
その際に、なぜ当該認識に至ったかを第三者に説明できなければ、利用する人間に損害賠償などのリスクが生じてしまい、実用性には限界がある。
分類手段備えたので、取得された分類材料がそれぞれ所定の分類候補リストに分類される。
分類妥当性検証手段を備えたので、分類手段で得られた分類候補リストの個々の分類候補について、前記分類材料と当該分類の属性とを突合し、当該分類の妥当性を検証する。
分類材料取得手段では、分類の対象となる情報である画像や、症状、所見などを取得し、分類手段に提供する。分類材料の取得の仕方は、画像であればカメラ映像の直接入力や画像ファイルの読み込み等、いずれの手段を用いてもよい。症状や所見などは、電子カルテの記載や、任意の観測データ、時系列データのファイル読み込み等、いずれでもよい。
提供された分類材料は、分類手段で分類され、1ないし複数の分類候補リストが得られる。候補となりうる分類については、予め、分類ごとに属性を記録しておく(分類属性記録手段)。前記分類手段で得られた分類候補の各々について、前記分類材料と当該分類の属性とを突合し、当該分類の妥当性を検証する(分類妥当性検証手段)。
分類材料である画像と、その正解の分類の対を多数用意し、正解率が向上するように分類器の学習を行う。ここでは、深層学習をはじめとするニューラルネットワークを用いた分類手段を示している。
各症例の陽性あるいは陰性の症状や所見ごとの診断名出現頻度(事前確率)から、複数の観測された症状、所見の組合せで、ベイズ確率(事後確率)などを援用し、診断名(分類)候補のリストを作成することができる。
すなわち、得られた症状、所見ごとの診断名分布を組み合わせることで、多くの症状、所見から推定される診断名を絞り込むことができる。
なお、症状、所見の間に相関関係がある場合、両者の診断名分布は当然似通ったものとなり、追加情報は少ないものとなるので、その分を減価して評価する必要がある。
この目的のために、症状、所見の組合せペアごとの診断名分布を得ておくことも有用である。
このように、本発明の分類手段の分類器の学習は、深層学習に限定されるものでなく、サポートベクターマシンなどの様々な機械学習、頻度分布を活用したもの等、状況に応じて適切な分類器を用いてよい。
図5に示すように、分類の属性には重複が多い。系統樹のように、共通の分類の項目を、より上位の分類にまとめ、共通の属性を上位の分類の属性にまとまれば、属性の記載量は最小限で済み、検索も容易となる。
子の分類は親の分類の属性を継承するとともに、子の分類独自の属性も保有する。
親の分類から継承した属性を、子の分類レベルで変更し上書きすれば、孫の分類の項目の当該属性は、子の分類の変更された属性を継承する。
与えられた分類材料の画像に対して、「猫」、「ワニ」が分類候補として挙がっているとしよう。
分類属性記録手段に記録されている「猫」及び「ワニ」の参照画像群と、分類材料の画像をそれぞれ比較して、類似度の評価を行い、当該分類候補の妥当性を検証し、最も類似度の高い分類候補を妥当な分類と推定する。
分類材料の画像を分類手段にかけ、数千〜数万の分類の中から少数の分類候補を選び出す。なぜ当該分類候補が選ばれたかは通常不明である。
確率過程であるから、当然誤った分類候補である可能性は常時ある。
誤った分類候補を選択しても、説明は困難である。
その上、分類属性記録手段に記録されている当該分類の属性の合致の有無を自動/手動で検証することで、分類の妥当性を上昇させると同時に、当該分類の判断理由を構成することができる。
さらに追加分類材料要求手段で、例えば「体毛はあるか?」などを分類材料取得手段側に問い合わせすることができれば、分類候補(図7では「猫」、「ワニ」)間の判別をピンポイントで行うことができる。
与えられた分類材料である、「腹痛」、「発熱」、「白血球増多」の症状、所見ベクトルに対して、「虫垂炎」、「心筋梗塞」が分類候補として挙がっているとしよう。
分類属性記録手段では、「虫垂炎」及び「心筋梗塞」のそれぞれの分類で、症状、所見ごとの観測頻度が属性として記録されている(ベイズ確率でいう事前確率)。
分類材料取得手段で得られた症状、所見ベクトルを、前記事前確率に適応すれば、当該分類候補が診断名である事後確率を求めることができる。
最も事後確率の高い分類候補を妥当な分類と推定する。
これに対して、本発明の分類妥当性検証手段では、選ばれてきた幾つかの分類候補ごとに、当該分類の分類属性記録手段で既に記録されている症状、所見の出現頻度(事前確率)と突合を行い、事後確率の評価から分類の妥当性を検証する。
さらに、分類属性記録手段に記録されている当該分類の属性の合致の有無を自動/手動で追加検証することで、分類の妥当性を上昇させると同時に、当該分類の判断理由を構成することができる。
さらに追加分類材料要求手段で、例えば「腹部圧痛はあるか?」、「CRPは上昇しているか?」などを分類材料取得手段側(例えば電子カルテ)に問い合わせすることができれば、分類候補(図8では「虫垂炎」、「心筋梗塞」)間の判別をピンポイントで行うことができる。
また、本発明では、分類器で得られた分類候補リストの個々の分類候補に対して、分類属性記録手段で既に記録されている当該分類の参照画像を含めた属性と突合し、必要に応じて追加分類材料要求手段で分類材料の追加、突合を行うが、これらの手順は、セキュリティにおける多要素認証に当たる。悪意ある分類材料が入り込んで分類器で誤分類が起こったとしても、まったく別の参照画像をはじめとする属性群との突合で、当該悪意ある分類材料の誤分類を排除することができる。
例えば、画像の認識では、例として挙げた動物に限定されるものでなく、人の顔や物体の認識など、任意の画像に適応できる。医療の例を挙げているが、他に、貸し倒れの可能性の有無の判断や、株価の上昇/下落など、分類に帰する問題であれば、いずれにも適応できる。
Claims (7)
- 画像または文書または画像及び文書からなる判断材料を得る分類材料取得手段と、
分類材料取得手段によって得られた画像または文書または画像及び文書からなる判断材料から分類を行い分類候補リストを得る分類手段と、
分類候補リストの各々について、当該分類材料の画像または文書または画像及び文書と、当該分類候補に関する画像または文書または画像及び文書からなる属性を記録した分類属性記録手段の記録内容とを突合し、分類の妥当性を検証する分類妥当性検証手段を備えたことを特徴とする分類システム。
- 前記属性には、当該分類の参照画像を含むことを特徴とする請求項1記載の分類システム。
- 前記分類属性記録手段は、分類間の親子関係をツリー状に表現し、親分類の属性を子分類の属性に継承する分類属性ツリー状記録手段を有することを特徴とする請求項1ないし2いずれか記載の分類システム。
- 前記分類妥当性検証手段は、前記分類属性記録手段による当該分類候補の属性に関して、分類材料取得手段で得られた分類材料と比較検討し、当該分類の妥当性を評価する機能を有することを特徴とする請求項1ないし3いずれか記載の分類システム。
- 画像の分類においては、前記分類属性記録手段に記録されている当該分類候補の少なくとも1つの参照画像と、分類材料取得手段で得られた分類対象の画像とを比較検討し、当該分類の信頼性を評価する分類信頼性評価手段を有することを特徴とする請求項1ないし4いずれか記載の分類システム。
- 前記分類信頼性評価手段は、任意の数値を分類信頼性評価基準として設定可能な分類信頼性評価基準設定手段を有し、得られた当該分類の信頼性が当該分類信頼性評価基準を越えれば当該分類を分類結果とすることを特徴とする請求項4ないし5いずれか記載の分類システム。
- 前記分類妥当性検証手段は、前記分類属性記録手段による当該分類候補の属性に関し、分類材料取得手段に対して追加の分類材料を要求する追加分類材料要求手段を有することを特徴とする請求項1ないし6いずれか記載の分類システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019039332A JP6792751B2 (ja) | 2019-03-05 | 2019-03-05 | 分類システム |
PCT/JP2020/008822 WO2020179764A1 (ja) | 2019-03-05 | 2020-03-03 | 分類システム |
US17/462,703 US20210397905A1 (en) | 2019-03-05 | 2021-08-31 | Classification system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019039332A JP6792751B2 (ja) | 2019-03-05 | 2019-03-05 | 分類システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020144502A JP2020144502A (ja) | 2020-09-10 |
JP6792751B2 true JP6792751B2 (ja) | 2020-12-02 |
Family
ID=72338335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019039332A Active JP6792751B2 (ja) | 2019-03-05 | 2019-03-05 | 分類システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210397905A1 (ja) |
JP (1) | JP6792751B2 (ja) |
WO (1) | WO2020179764A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022249927A1 (ja) | 2021-05-28 | 2022-12-01 | 株式会社医療情報技術研究所 | 分類システム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6872214B1 (ja) * | 2020-08-20 | 2021-05-19 | 株式会社医療情報技術研究所 | 分類システム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3529036B2 (ja) * | 1999-06-11 | 2004-05-24 | 株式会社日立製作所 | 文書付き画像の分類方法 |
US7738950B2 (en) * | 2006-09-13 | 2010-06-15 | Cardiac Pacemakers, Inc. | Method and apparatus for identifying potentially misclassified arrhythmic episodes |
US8111923B2 (en) * | 2008-08-14 | 2012-02-07 | Xerox Corporation | System and method for object class localization and semantic class based image segmentation |
WO2010111392A1 (en) * | 2009-03-24 | 2010-09-30 | Regents Of The University Of Minnesota | Classifying an item to one of a plurality of groups |
JP5718781B2 (ja) * | 2011-09-30 | 2015-05-13 | 株式会社Screenホールディングス | 画像分類装置および画像分類方法 |
JP2014006613A (ja) * | 2012-06-22 | 2014-01-16 | Dainippon Screen Mfg Co Ltd | 近傍探索方法および類似画像探索方法 |
JP6814091B2 (ja) * | 2017-05-12 | 2021-01-13 | 株式会社日立製作所 | 文書分類システムおよび文書分類方法 |
US11017317B2 (en) * | 2017-12-27 | 2021-05-25 | X Development Llc | Evaluating robot learning |
-
2019
- 2019-03-05 JP JP2019039332A patent/JP6792751B2/ja active Active
-
2020
- 2020-03-03 WO PCT/JP2020/008822 patent/WO2020179764A1/ja active Application Filing
-
2021
- 2021-08-31 US US17/462,703 patent/US20210397905A1/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022249927A1 (ja) | 2021-05-28 | 2022-12-01 | 株式会社医療情報技術研究所 | 分類システム |
Also Published As
Publication number | Publication date |
---|---|
WO2020179764A1 (ja) | 2020-09-10 |
JP2020144502A (ja) | 2020-09-10 |
US20210397905A1 (en) | 2021-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheng et al. | Evaluation methods and measures for causal learning algorithms | |
Jain et al. | Bridging the gap: from biometrics to forensics | |
Dror et al. | The use of technology in human expert domains: challenges and risks arising from the use of automated fingerprint identification systems in forensic science | |
Neumann et al. | Quantifying the weight of evidence from a forensic fingerprint comparison: a new paradigm | |
Topaloglu et al. | Gender detection and identifying one's handwriting with handwriting analysis | |
Safer-Lichtenstein et al. | Studying terrorism empirically: What we know about what we don’t know | |
Stern | Statistical issues in forensic science | |
Little et al. | Generative adversarial networks for synthetic data generation: a comparative study | |
WO2020179764A1 (ja) | 分類システム | |
CN110321350A (zh) | 一种基于数据修复和主动学习验证的生存认证方法及系统 | |
Johnson et al. | Handwriting identification using random forests and score‐based likelihood ratios | |
Thompson et al. | finFindR: Computer-assisted recognition and identification of bottlenose dolphin photos in r | |
Diaz et al. | Investigating the common authorship of signatures by off-line automatic signature verification without the use of reference signatures | |
Naz et al. | DeepSignature: fine-tuned transfer learning based signature verification system | |
Zeinstra et al. | Grid-based likelihood ratio classifiers for the comparison of facial marks | |
JP7101349B1 (ja) | 分類システム | |
Tongesai et al. | Insurance Fraud Detection using Machine Learning | |
Leevy et al. | One-Class Classifier Performance: Comparing Majority versus Minority Class Training | |
Shanthi et al. | Non-small-cell lung cancer prediction using radiomic features and machine learning methods | |
JP6872214B1 (ja) | 分類システム | |
Cho | Knowledge discovery from distributed and textual data | |
US10997248B2 (en) | Data association using complete lists | |
Man | Multimodal data fusion to detect preknowledge test-taking behavior using machine learning | |
Zamfirescu-Pereira et al. | Trucks Don’t Mean Trump: Diagnosing Human Error in Image Analysis | |
Bolourchi et al. | A machine learning-based data-driven approach to Alzheimer’s disease diagnosis using statistical and harmony search methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190311 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190401 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191206 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200401 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200811 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200828 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6792751 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |