JP2020534622A - 対象者クラスタリング方法及び装置 - Google Patents
対象者クラスタリング方法及び装置 Download PDFInfo
- Publication number
- JP2020534622A JP2020534622A JP2020516730A JP2020516730A JP2020534622A JP 2020534622 A JP2020534622 A JP 2020534622A JP 2020516730 A JP2020516730 A JP 2020516730A JP 2020516730 A JP2020516730 A JP 2020516730A JP 2020534622 A JP2020534622 A JP 2020534622A
- Authority
- JP
- Japan
- Prior art keywords
- dataset
- weighted
- values
- value
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Pathology (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
Description
Claims (15)
- 複数の対象者のうち類似する対象者をクラスタリングする方法であって、前記方法は、
対象者データのデータセットを取得するステップであって、前記データセットは、各対象者についての定量値のそれぞれのセットを含み、各定量値は、前記対象者の臨床的又は病理学的特徴の測定値であり、前記定量値の各セットは同じ数の定量値を有する、ステップと、
クラスタリングプロセスを行うステップと、を有し、
前記クラスタリングプロセスは、
前記対象者データの前記データセットに主成分分析を行って少なくとも2つの主成分を特定するステップであって、各主成分は、成分スコアと、負荷量のデータセットとに関連付けられ、前記負荷量の各データセット内の負荷量の数は、前記対象者データの前記データセット内の定量値の数と等しい、ステップと、
重み付け値の第1のデータセットを生成するステップであって、各重み付け値は、第1の2つの主成分の一方に関連付けられた前記負荷量のデータセット内のそれぞれの負荷量に基づいており、第1のデータセット内の重み付け値の数は、前記負荷量のデータセット内の負荷量の数と等しい、ステップと、
前記重み付け値の前記第1のデータセットを使用して前記対象者データの前記データセットの定量値を重み付けし、前記対象者データの重み付けされたデータセットを取得するステップと、
類似する対象者を、類似する臨床的特性を有する対象者のグループへとクラスタリングするように、前記対象者データの重み付けされたデータセットにクラスタリングアルゴリズムを行うステップであって、前記対象者の各グループ内の対象者は、類似する診断、予測される対象者アウトカム及び/又は好適な治療選択肢を持つ、ステップと、を有する、
方法。 - 前記重み付け値の第2のデータセットを取得するステップであって、前記第2のデータセット内の重み付け値の数は、前記対象者データの前記データセット内の定量値の数と等しい、ステップをさらに有し、
前記重み付け値の前記第1のデータセットを生成するステップは、前記第1の2つの主成分の一方に関連付けられた前記負荷量のデータセット内のそれぞれの負荷量に基づいて前記重み付け値の第2のデータセット内の各重み付け値を修正し、それにより前記重み付け値の前記第1のデータセットを取得するステップを有する、
請求項1に記載の方法。 - 前記重み付け値の前記第2のデータセット内の各重み付け値を修正するステップは、第1又は第2の主成分の一方に関連付けられた負荷量のデータセットを選択するステップと、
前記重み付け値の前記第2のデータセット内の各重み付け値に、選択された主成分に関連付けられた負荷量のデータセット内のそれぞれの負荷量を乗算することにより、前記重み付け値の修正された第1のデータセットを取得するステップと、を有する、
請求項2に記載の方法。 - 前記重み付け値の前記第2のデータセット内の各重み付け値を修正するステップは、前記重み付け値の前記第2のデータセット内の各重み付け値を、0と1との間でランダム又は疑似ランダムに選択された数によって除算するステップをさらに有する、
請求項3に記載の方法。 - 前記重み付け値の前記第2のデータセット内の各値を修正するステップは、前記第1の2つの主成分のうちランダム又は疑似ランダムに選択される一方に関連付けられた負荷量のデータセット内のそれぞれの負荷量に基づいて、前記重み付け値の前記第2のデータセット内の各値を修正するステップを有する、
請求項2から4の何れか一項に記載の方法。 - 前記クラスタリングプロセスを行うステップは、前記クラスタリングプロセスを反復的に行うステップを有し、
前記クラスタリングプロセスは、
クラスタリングアルゴリズムによって行われたクラスタリングの品質を示す品質値を計算するステップと、
前記品質値が第1の所定の閾値より大きいことに応答して、前記重み付け値の前記第2のデータセット内の重み付け値を、前記重み付け値の前記第1のデータセット内の重み付け値に置き換えるステップと、
前記品質値が前記第1の所定の閾値より低いことに応答して、前記重み付け値の前記第1のデータセットを却下し、前記重み付け値の前記第2のデータセットの重み付け値を維持するステップと、をさらに有する、
請求項2から5の何れか一項に記載の方法。 - 前記品質値が第2の所定の閾値より大きいこと、前記反復回数が所定の反復回数より多いこと、反復的クラスタリングプロセスの間に経過した時間の長さが所定の時間長よりも長いこと、及び、前記重み付け値の第1のデータセットの連続した却下の回数が所定の却下回数より多いこと、のいずれか1つ又は複数に応答して反復的クラスタリングプロセスを行うのを中断するステップをさらに有する、
請求項6に記載の方法。 - 前記第1の所定の値は、前記重み付け値の前記第2のデータセットを使用して重み付けされた前記対象者データの前記データセットに基づいて前記クラスタリングアルゴリズムによって行われたクラスタリングの品質値である、
請求項6又は7に記載の方法。 - 前記反復的クラスタリングプロセス中に、前記品質値が第1の所定の閾値より大きいことに応答して、前記第1の所定の閾値を前記品質値に置き換えるステップを有する、
請求項8に記載の方法。 - 前記重み付け値の前記第2のデータセットを使用して定量値を重み付けして、前記対象者データの初期重み付けデータセットを取得するステップと、
類似する対象者をクラスタリングするように、前記対象者データの前記初期重み付けデータセットにクラスタリングアルゴリズムを行うステップと、
前記クラスタリングアルゴリズムによって行われたクラスタリングの品質を示す品質値を計算することにより前記第1の所定の閾値を取得するステップと、をさらに有する、
請求項8又は9に記載の方法。 - 前記品質値を計算するステップは、Dunn指標、シルエット幅、及びDavies−Bouldin指標、の1つ又は複数を計算するステップを有する、
請求項6から10の何れか一項に記載の方法。 - プロセッサ機器で実行されたときに、前記プロセッサ機器に、請求項1から11の何れか一項に記載の方法を実施させるコンピュータ可読プログラム命令が具現化された、
コンピュータ可読記憶媒体。 - 複数の対象者のうち類似する対象者をクラスタリングするプロセッサ機器であって、前記プロセッサ機器は、
対象者データのデータセットを取得する取得ユニットであって、前記データセットは、各対象者についての定量値のそれぞれのセットを含み、各定量値は、前記対象者の臨床的又は病理学的特徴の測定値であり、前記定量値の各セットは同じ数の定量値を有する、取得ユニットと、
クラスタリングユニットと、を備え、
前記クラスタリングユニットは、
前記対象者データのデータセットに主成分分析を行って少なくとも2つの主成分を特定することであって、各主成分は、成分スコアと、負荷量のデータセットとに関連付けられ、前記負荷量の各データセット内の負荷量の数は、前記定量値のセット内の定量値の数と等しい、特定することと、
前記重み付け値の第1のデータセットを生成することであって、前記第1のデータセット内の重み付け値の数は、前記負荷量の前記データセット内の負荷量の数と等しく、前記重み付け値の前記第1のデータセット内の各重み付け値は、第1の2つの主成分の一方に関連付けられた負荷量のデータセット内のそれぞれの負荷量に基づいている、生成することと、
前記重み付け値の第2のデータセットを使用して前記定量値を重み付けし、前記対象者データの重み付けされたデータセットを取得することと、
類似する対象者を、類似する臨床的特性を有する対象者のグループへとクラスタリングするように、前記対象者データの重み付けされたデータセットにクラスタリングアルゴリズムを行うことであって、前記対象者の各グループの中の対象者は、類似する診断、予測される対象者アウトカム及び/又は好適な治療選択肢を持つ、行うことと、
により、前記クラスタリングプロセスを行う、
プロセッサ機器。 - 前記取得ユニットが、前記重み付け値の第2のデータセットを取得し、前記第2のセット内の重み付け値の数は、前記定量値のセット内の定量値の数と等しく、
前記クラスタリングユニットが、前記第1の2つの主成分の一方に関連付けられた負荷量のデータセット内のそれぞれの負荷量に基づいて前記重み付け値の第2のデータセット内の各重み付け値を修正し、それにより前記重み付け値の前記第1のデータセットを取得することにより、前記重み付け値の前記第1のデータセットを生成する、
請求項13に記載のプロセッサ機器。 - 前記クラスタリングユニットは、反復的にクラスタリングプロセスを行い、
前記クラスタリングプロセスは、
前記クラスタリングアルゴリズムによって行われたクラスタリングの品質を示す品質値を計算することと、
前記品質値が第1の所定の閾値より大きいことに応答して、前記重み付け値の第2のデータセット内の重み付け値を、前記重み付け値の前記第1のデータセット内の重み付け値に置き換えることと、
前記品質値が第1の所定の閾値より低いことに応答して、前記重み付け値の前記第1のデータセットを却下し、前記重み付け値の前記第2のデータセットの重み付け値を維持することと、をさらに有する、
請求項14に記載のプロセッサ機器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17192198.4 | 2017-09-20 | ||
EP17192198.4A EP3460807A1 (en) | 2017-09-20 | 2017-09-20 | Subject clustering method and apparatus |
PCT/EP2018/075238 WO2019057727A1 (en) | 2017-09-20 | 2018-09-18 | APPARATUS AND METHOD FOR GROUPING SUBJECTS |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020534622A true JP2020534622A (ja) | 2020-11-26 |
JP2020534622A5 JP2020534622A5 (ja) | 2021-10-28 |
JP7258862B2 JP7258862B2 (ja) | 2023-04-17 |
Family
ID=59982264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020516730A Active JP7258862B2 (ja) | 2017-09-20 | 2018-09-18 | 対象者クラスタリング方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11636954B2 (ja) |
EP (2) | EP3460807A1 (ja) |
JP (1) | JP7258862B2 (ja) |
CN (1) | CN111247600A (ja) |
WO (1) | WO2019057727A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7235960B2 (ja) * | 2019-02-07 | 2023-03-09 | 富士通株式会社 | ジョブ電力予測プログラム、ジョブ電力予測方法、およびジョブ電力予測装置 |
US20210304056A1 (en) * | 2020-03-25 | 2021-09-30 | International Business Machines Corporation | Learning Parameter Sampling Configuration for Automated Machine Learning |
US11423333B2 (en) * | 2020-03-25 | 2022-08-23 | International Business Machines Corporation | Mechanisms for continuous improvement of automated machine learning |
CN112002419B (zh) * | 2020-09-17 | 2023-09-26 | 吾征智能技术(北京)有限公司 | 一种基于聚类的疾病辅助诊断系统、设备、存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050209785A1 (en) * | 2004-02-27 | 2005-09-22 | Wells Martin D | Systems and methods for disease diagnosis |
JP2012150786A (ja) * | 2010-12-28 | 2012-08-09 | Giken Shoji International Co Ltd | 地域特性を利用したプロファイリングシステム |
JP2012523877A (ja) * | 2009-04-15 | 2012-10-11 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 臨床決定支援システム及び方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6952700B2 (en) | 2001-03-22 | 2005-10-04 | International Business Machines Corporation | Feature weighting in κ-means clustering |
EP2229643A1 (en) * | 2007-12-28 | 2010-09-22 | Koninklijke Philips Electronics N.V. | Retrieval of similar patient cases based on disease probability vectors |
ES2795036T3 (es) * | 2008-07-25 | 2020-11-20 | Fund D Anna Sommer Champalimaud E Dr Carlos Montez Champalimaud | Sistemas y métodos para tratar, diagnosticar y predecir la aparición de una afección médica |
US8504392B2 (en) | 2010-11-11 | 2013-08-06 | The Board Of Trustees Of The Leland Stanford Junior University | Automatic coding of patient outcomes |
JP5643430B2 (ja) | 2011-06-28 | 2014-12-17 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 主観的な階層クラスタリングにおける特徴量ごとの重みを求める情報処理装置、方法、およびプログラム |
-
2017
- 2017-09-20 EP EP17192198.4A patent/EP3460807A1/en not_active Withdrawn
-
2018
- 2018-09-18 JP JP2020516730A patent/JP7258862B2/ja active Active
- 2018-09-18 WO PCT/EP2018/075238 patent/WO2019057727A1/en unknown
- 2018-09-18 EP EP18782892.6A patent/EP3685405A1/en not_active Withdrawn
- 2018-09-18 US US16/648,797 patent/US11636954B2/en active Active
- 2018-09-18 CN CN201880068355.0A patent/CN111247600A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050209785A1 (en) * | 2004-02-27 | 2005-09-22 | Wells Martin D | Systems and methods for disease diagnosis |
JP2012523877A (ja) * | 2009-04-15 | 2012-10-11 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 臨床決定支援システム及び方法 |
JP2012150786A (ja) * | 2010-12-28 | 2012-08-09 | Giken Shoji International Co Ltd | 地域特性を利用したプロファイリングシステム |
Also Published As
Publication number | Publication date |
---|---|
WO2019057727A1 (en) | 2019-03-28 |
EP3460807A1 (en) | 2019-03-27 |
CN111247600A (zh) | 2020-06-05 |
EP3685405A1 (en) | 2020-07-29 |
JP7258862B2 (ja) | 2023-04-17 |
US20200219627A1 (en) | 2020-07-09 |
US11636954B2 (en) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11763933B2 (en) | Medical report labeling system and method for use therewith | |
JP2020534622A (ja) | 対象者クラスタリング方法及び装置 | |
US10039485B2 (en) | Method and system for assessing mental state | |
RU2533500C2 (ru) | Система и способ для объединения клинических признаков и признаков изображений для диагностики с применением компьютера | |
US8423596B2 (en) | Methods of multivariate data cluster separation and visualization | |
JP2020149711A5 (ja) | ||
US9861308B2 (en) | Method and system for monitoring stress conditions | |
US20170053064A1 (en) | Personalized content-based patient retrieval system | |
JP7224757B2 (ja) | 診断支援装置、情報処理方法、診断支援システム及びプログラム | |
CN112189238A (zh) | 执行预后评价 | |
JP2007528763A (ja) | インタラクティブコンピュータ支援診断方法及び装置 | |
Holland et al. | Clustering disease trajectories in contrastive feature space for biomarker discovery in age-related macular degeneration | |
JP2020534614A (ja) | 深層学習アルゴリズムを使用した入力データの評価 | |
US20190088369A1 (en) | Determining patient status based on measurable medical characteristics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210917 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210917 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221021 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230405 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7258862 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |