DE102005012665A1 - Verfahren und Vorrichtung zum Ermitteln von Clustern aus einer Mehrzahl von in Aufträgen geordneten Daten - Google Patents

Verfahren und Vorrichtung zum Ermitteln von Clustern aus einer Mehrzahl von in Aufträgen geordneten Daten Download PDF

Info

Publication number
DE102005012665A1
DE102005012665A1 DE102005012665A DE102005012665A DE102005012665A1 DE 102005012665 A1 DE102005012665 A1 DE 102005012665A1 DE 102005012665 A DE102005012665 A DE 102005012665A DE 102005012665 A DE102005012665 A DE 102005012665A DE 102005012665 A1 DE102005012665 A1 DE 102005012665A1
Authority
DE
Germany
Prior art keywords
cluster
clusters
order
orders
conditional probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102005012665A
Other languages
English (en)
Inventor
Clemens Dr. Otte
Rudolf Dr. Sollacher
Volker Dr. Tresp
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE102005012665A priority Critical patent/DE102005012665A1/de
Priority to US11/378,640 priority patent/US7949620B2/en
Publication of DE102005012665A1 publication Critical patent/DE102005012665A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

Bei einem Verfahren zum Ermitteln von Clustern aus in Aufträgen angeordneten Daten in einem Rechner werden in einem ersten Schritt anfängliche Cluster mit nur einer Komponente gebildet. Es wird eine bedingte Wahrscheinlichkeit DOLLAR I1 dass der Cluster Ci in einem Auftrag enthalten ist, unter der Bedingung, dass der Cluster C'k in dem Auftrag enthalten ist, bestimmt. Überschreitet DOLLAR I2 einen ersten Schwellwert S1, wird ein neuer Cluster Cn mit allen Komponenten der Cluster Ci, C'k gebildet und es werden die bisherigen Schritte wiederholt, bis keine neuen Cluster gebildet werden.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zum Ermitteln von Clustern aus Daten, insbesondere von Daten, die komplexe Produkte oder Dienstleistungen geordnet in Aufträge beschreiben. Solche Daten zeichnen sich dadurch aus, dass sie in Aufträgen geordnet werden können, die teilweise gleiche Daten enthalten. Beispielsweise können gleiche Komponenten oder Teildienstleistungen mehrfach vorkommen, wenn in einem Unternehmen dasselbe Produkt mehrfach verkauft wird, oder gleiche Bauteile bei verschiedenen Produkten vorkommen, oder wenn in komplex zu organisierenden Aufträgen im Medizinbereich einzelne Vorgänge, wie Patientenbezogenen Untersuchungen oder Behandlungen sowie Pflegemaßnahmen in einem Krankenhaus, mehrfach enthalten sind. Für eine effiziente Organisation ist es dann notwendig, korrelierte Daten aus den in Aufträgen geordneten Daten zu ermitteln.
  • Insbesondere tritt dieses Problem bei der rechnergestützten Steuerung eines Krankenhausbetriebs auf, wenn im Bereich des Krankenhaus- und Patientenmanagements solche Leistungen organisiert, geplant und gesteuert werden müssen, wie die genannten Untersuchungen, allgemeinen Pflegemaßnahmen oder auch speziellen Rehabilitationsmaßnahmen
  • Vergleichbare Probleme treten auch allgemein im Bereich der rechnergestützten Produktion und Auftragsabwicklung in Unternehmen auf.
  • Um solche korrelierten Gruppen innerhalb der Daten zu finden, ist die „Independent Component Analysis" [Aapo Hyvärinen, Juha Karhunen, Erkki Oja. Independent Component Analysis, Wiley-Interscience, 2001, S. 1–71] bekannt, bei der unabhängige Komponenten der beobachteten Daten gesucht werden. Dabei kann es sich unter anderem um beobachtete Daten wie ökonomische Indikatoren handeln. Da das Verfahren ursprünglich aus der Signaltheorie stammt kann es auf binäre Datenreihen nicht ohne weiteres angewandt werden. Da im vorliegenden Fall aber gerade korrelierte Daten gesucht werden, bei denen bestimmte Komponenten oder Dienstleistungen vorkommen, oder nicht, und dies gerade binär dargestellt wird, sind die Independent Component Analysis-Verfahren vorliegend nicht besonders günstig.
  • Weiter ist hierarchisches Clustern bekannt, das disjunkte Cluster erzeugt, die keine gemeinsamen Komponenten haben. Dabei muss eine Hierarchieebene gewählt werden, auf der die Cluster definiert werden.
  • Nachteilig daran ist, dass gerade Cluster gesucht werden, die zum Teil gleiche Daten enthalten und dieses Verfahren daher nicht die gewünschten Cluster ermittelt und eine notwendige Hierarchieebene nicht einfach bestimmbar ist.
  • Ebenfalls bekannt ist ein Verfahren bezeichnet als „Frequent Item Sets", das insoweit Probleme bereitet, als es zu viele hoch korrelierte Gruppen liefert, vor allem, wenn auch weniger häufig vorkommende Gruppen berücksichtigt werden.
  • Bei der „Probabilistic Latent Semantic Analysis" wird nach statistisch unabhängigen Quelldaten gesucht, die Verteilungen über einzelne Komponenten erzeugen. Aus diesen Verteilungen kann über eine Schwelle eine Gruppe definiert werden, wobei die Schwelle nicht einfach zu bestimmen ist und die Anzahl der Quelldaten festgelegt werden muss.
  • Es ist daher Aufgabe der vorliegenden Erfindung, ein Verfahren und eine Vorrichtung zur Verfügung zu stellen, die es ermöglichen, Cluster aus Gruppen von Daten zu ermitteln, insbesondere von Daten, die Aufträge, wie Leistungen und Produkte des Krankenhaus- und Patientenmanagements beschreiben und die zumindest zum Teil korreliert sind.
  • Die Lösung dieser Aufgaben ergibt sich erfindungsgemäß durch ein Verfahren gemäß den Merkmalen des Anspruchs 1 sowie durch eine Steuervorrichtung nach Anspruch 8.
  • Vorteilhafte Weiterbildungen der Erfindung sind in den Unteransprüchen angegeben.
  • Durch das erfindungsgemäße Verfahren werden Cluster automatisch aus vorhandenen Daten identifiziert. Vor allem können dadurch bestimmte Cluster aus Aufträgen gefunden werden, die korreliert sind, so dass eine Standardisierung der Vorgänge erreicht werden kann.
  • Vorteilhaft werden nach dem Schritt des Bildens neuer Cluster Cn und vor dem jeweiligen Wiederholen des Bestimmens einer bedingten Wahrscheinlichkeit P(Ci|C'k), alle Cluster entfernt, die in einem anderen Cluster enthalten sind und in einem Auftrag nur gleichzeitig mit diesem Cluster enthalten sind.
  • Dadurch wird die Anzahl der Cluster um diejenigen reduziert, die nicht getrennt beachtet werden müssen, da sie nur als Teil eines anderen, zuvor neu gebildeten Cluster auftreten.
  • In einer günstigen Ausführungsform werden nach dem Schritt des Bildens neuer Cluster Cn und vor dem jeweiligen Wiederholen des Bestimmens einer bedingten Wahrscheinlichkeit P(Ci|C'k), alle Cluster Cl entfernt, die in einem anderen Cluster Cg enthalten sind, wenn die bedingte Wahrscheinlichkeit P(Cl|Cg) größer als ein festgelegter zweiter Schwellwert S2 ist.
  • Es werden Cluster Cl nicht mehr getrennt berücksichtigt, wenn die Wahrscheinlichkeit, dass sie zusammen mit einem anderen Cluster auftreten über einem Schwellwert liegt. Dadurch werden weniger relevante Cluster aussortiert.
  • In einer günstigen Ausführungsform werden nach dem Schritt des Bildens neuer Cluster Cn und vor dem jeweiligen Wiederho len des Bestimmens einer bedingten Wahrscheinlichkeit P(Ci|C'k), alle Cluster Cl entfernt, die weniger häufig als ein dritter Schwellwert S3 in den Aufträgen vorkommen.
  • Dadurch werden Cluster, die insgesamt zahlenmäßig nur sehr wenig auftreten, unabhängig von den bedingten Wahrscheinlichkeiten bzw. den Korrelationen entfernt.
  • Die Cluster können nach der Häufigkeit ihres Auftretens in den Aufträgen sortiert werden.
  • Dies ermöglicht es, besonders relevante Korrelationen zu finden.
  • Die Aufträge können Behandlungen und Untersuchungen sowie Pflegemaßnahmen eines rechnergestützten Krankenhaus- und Patientenmanagements, oder solche über Produkte im Mobilfunkbereich sein.
  • Im Krankenhaus- und Patientenmanagement ist es erforderlich, eine durchgängige, möglichst personenunabhängige Qualität der Behandlungen zu gewährleisten. Dazu wird eine Standardisierung der Behandlungen angestrebt. Das hier beschriebene Verfahren ermöglicht es Experten, Cluster, bestehend aus Behandlungen, automatisch aus vorhandenen Daten zu identifizieren. Das Verfahren kann daher beispielsweise nach Einführung eines neuen Medikaments durchgeführt werden, wobei anhand der gefundenen Cluster Behandlungen und Maßnahmen bei bestimmten Krankheiten optimiert werden können.
  • Nachfolgend wird ein Ausführungsbeispiel des erfindungsgemäßen Verfahrens zum Ermitteln von Clustern aus in Aufträgen geordneten Daten in einem Rechner durch die beigefügten Zeichnungen näher erläutert. Dabei zeigt
  • 1 schematisch den Ablauf eines erfindungsgemäßen Verfahrens und
  • 2 das erfindungsgemäße Verfahren in einem Flussdiagramm,
  • 1 zeigt schematisch den grundsätzlichen Ablauf eines erfindungsgemäßen Verfahrens. Aus einer Datenbank 1 mit in Aufträgen geordneten Daten, hier Leistungen und Produkte des Krankenhaus- und Patientenmanagements beschreibende Daten, werden die Aufträge in einer Umsetzeinheit 2 in ein binäres Format umgesetzt. Sodann werden in einer Clustereinheit 3 das erfindungsgemäße Verfahren durchgeführt und die gefundenen Cluster auf einem Bildschirm 4 dargestellt.
  • 2 zeigt das erfindungsgemäße Verfahren in einem Flussdiagramm. In einer ersten Operation 1 werden erste Cluster gebildet. Wenn für die weitere Beschreibung des Verfahrens die folgenden Bezeichnungen vereinbart werden:
    A1, A2, ...: Auf träge
    K1, K2, ...: Daten, die Leistungen und Produkte des Krankenhausund Patientenmanagements beschreiben (Komponenten)
    Ci, C'k: Cluster i, bzw. k
    können als Beispiel die folgenden 10 Aufträge A1–A10 mit Komponenten K1–K4 in Tabellenform zusammengestellt werden:
    Figure 00050001
  • Dabei stehen die Komponenten K1–K4 beispielsweise für Medikamentierungen, Behandlungen oder Pflegemaßnahmen. Dann werden in der ersten Operation 1 die folgenden vier ersten Cluster gebildet:
    Figure 00060001
  • Von diesen ersten Clustern C1–C4 enthält jeder nur eine Komponente. In einer zweiten Operation 6 wird die bedingte Wahrscheinlichkeit P(Ci|C'k) für alle i, k berechnet. Für die Werte i = 1, k = 2 ergibt sich, dass Cluster C2 in den Aufträgen A2 und A4 vorkommt. Dabei erscheint C1 nur in A2. Damit ist P(C1|C'2) = 0.5, also die Wahrscheinlichkeit, dass C1 unter der Nebenbedingung auftritt, dass auch C2 auftritt. Für alle möglichen Werte von i, k zwischen 1 und 4 ergibt sich:
    Figure 00060002
  • In einer nun folgenden ersten Verzweigung 7 wird abgefragt, ob eine der bedingten Wahrscheinlichkeiten P(Ci|C'k) > S1, wobei S1 eine festgelegte Schwelle, hier beispielsweise 0.8 ist. Dies ist für P(C1|C'4) der Fall und in einer dritten Operation 8 wird aus C4 und C1 ein neuer Cluster C5 gebildet, der die Komponenten von C1 und C4 enthält. Es ergibt sich somit eine neue Clustertabelle:
    Figure 00060003
    Figure 00070001
  • In einer vierten Operation 9 werden alle Cluster beseitigt, die identisch in einem anderen Cluster enthalten sind und immer nur zusammen mit diesem Cluster vorkommen. C1 und C4 sind identisch in C5 enthalten. C1 kommt in den Aufträgen A1, A2, A7, A8 vor. C4 kommt in den Aufträgen A1, A8 vor; C5 kommt in den Aufträgen A1 und A8 vor. C4 kommt also zusammen mit C5 vor und wird gelöscht. Es ergeben sich somit die folgenden aktuellen Cluster C1, C2, C3, C5:
    Figure 00070002
  • In einer fünften Operation 10 werden alle Cluster entfernt, die identisch in einem anderen Cluster enthalten sind und deren bedingte Wahrscheinlichkeit für ein Auftreten zusammen mit diesem Cluster größer als ein zweiter Schwellwert S2 ist. Dies ist beim vorliegenden Beispiel bei keinem Cluster der Fall.
  • In einer sechsten Operation 11 werden alle Cluster entfernt, deren zahlenmäßige Häufigkeit des Auftretens in den Aufträgen unter einem Schwellwert S3 liegt. Davon ist im vorliegenden Beispiel kein Cluster betroffen.
  • In der zweiten Verzweigung 12 wird abgefragt, ob neue Cluster gebildet wurden. Dies ist mit dem Cluster C5 der Fall. Das Verfahren kehrt daher zurück zu der zweiten Operation 6 und berechnet wiederum bedingte Wahrscheinlichkeiten P(Ci|C'k). Beispielsweise ergibt sich für i = 3, k = 5, dass der Cluster C5 in den Aufträgen A1 und A8 vorkommt. Davon kommt C3 nur in A8 vor. Damit ist P(C3|C'5) = 0.5. Für alle Werte von i, k ergibt sich die folgende Tabelle:
    Figure 00080001
  • In der ersten Verzweigung 7 folgt somit, dass P(C1|C'5) > 0.8 und es würde ein neuer Cluster C6 in der dritten Operation 8 gebildet, der aber identisch ist mit C5. Damit werden keine neuen Cluster mehr gebildet und in der zweiten Verzeigung 12 gelangt das Verfahren zum Ende. Die resultierenden Cluster sind:
    Figure 00080002
  • Das hier beschriebene Verfahren kann auch dazu verwendet werden, in anderen Produkten wie z.B. Basisstationen für Mobilfunknetze, die aus vielen tausend Komponenten bestehen, standardisierte Plattformen zu identifizieren. Dabei erfüllen viele verschiedene Komponenten im Wesentlichen die gleiche Funktion. Vertrieb und Entwicklung versuchen daher, möglichst Gleichkomponenten zu verwenden, um die Vielfalt der Komponenten und damit den Vertriebs-, Instandhaltungs- und Entwicklungsaufwand zu reduzieren.

Claims (10)

  1. Verfahren zum Ermitteln von Clustern aus in Aufträgen geordneten Daten in einem Rechner, wobei die Aufträge zumindest zum Teil so korreliert sind, dass sie Komponenten wie Dienstleistungen und Produkte enthalten, die zumindest zum Teil mehrfach vorkommen, mit den Schritten: – Bilden von anfänglichen Clustern, die jeweils nur eine, zu allen anderen Komponenten unterschiedliche, Komponente enthalten, – Bestimmen einer bedingten Wahrscheinlichkeit P(Ci|C'k), dass der Cluster Ci in einem Auftrag enthalten ist unter der Bedingung, dass der Cluster C'k in dem Auftrag enthalten ist, über alle i und für alle k, wobei i, k alle vorhandenen Cluster durchlaufen, – Bilden neuer Cluster Cn, die alle Komponenten der Cluster Ci, C'k enthalten, deren bedingte Wahrscheinlichkeit P(Ci|C'k) einen ersten Schwellwert S1 überschreitet, und – Wiederholen des Bestimmens einer bedingten Wahrscheinlichkeit P(Ci|C'k), dass der Cluster Ci in einem Auftrag enthalten ist unter der Bedingung, dass der Cluster C'k in dem Auftrag enthalten ist, über alle i und für alle k und des Bildens neuer Cluster Cn, bis keine neuen Cluster gebildet werden.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass nach dem Schritt des Bildens neuer Cluster Cn und vor dem jeweiligen Wiederholen des Bestimmens einer bedingten Wahrscheinlichkeit P(Ci|C'k), alle Cluster entfernt werden, die in einem anderen Cluster enthalten sind und in einem Auftrag nur gleichzeitig mit diesem Cluster enthalten sind.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass nach dem Schritt des Bildens neuer Cluster Cn und vor dem jeweiligen Wiederholen des Bestimmens einer bedingten Wahrscheinlichkeit P(Ci|C'k), alle Cluster Cl entfernt werden, die in einem anderen Cluster Cg enthalten sind, wenn die bedingte Wahrscheinlichkeit P(Cl|Cg) größer als ein festgelegter zweiter Schwellwert S2 ist.
  4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass nach dem Schritt des Bildens neuer Cluster Cn und vor dem jeweiligen Wiederholen des Bestimmens einer bedingten Wahrscheinlichkeit P(Ci|C'k), alle Cluster Cl entfernt werden, die weniger häufig als ein dritter Schwellwert S3 in den Aufträgen vorkommen.
  5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Cluster nach der Häufigkeit ihres Auftretens in den Aufträgen sortiert werden.
  6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Aufträge Behandlungen und Untersuchungen sowie Pflegemaßnahmen eines rechnergestützten Krankenhaus- und Patientenmanagements sind.
  7. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass die Aufträge solche über Produkte im Mobilfunkbereich sind.
  8. Steuervorrichtung zur Planung und Steuerung der Behandlungen, Untersuchungen und Pflegemaßnahmen in einem Krankenhaus, bestehend aus einem Rechnernetzwerk mit Benutzerschnittstellen, auf dem ein Verfahren nach einem der Ansprüche 1 bis 6 abläuft.
  9. Computerprogrammprodukt, das in den Speicher eines Computers geladen, wenn es als Programm abläuft, ein Verfahren nach einem der Ansprüche 1 bis 7 durchführt.
  10. Speichermedium auf dem ein Computerprogrammprodukt nach Anspruch 9 gespeichert ist.
DE102005012665A 2005-03-18 2005-03-18 Verfahren und Vorrichtung zum Ermitteln von Clustern aus einer Mehrzahl von in Aufträgen geordneten Daten Ceased DE102005012665A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102005012665A DE102005012665A1 (de) 2005-03-18 2005-03-18 Verfahren und Vorrichtung zum Ermitteln von Clustern aus einer Mehrzahl von in Aufträgen geordneten Daten
US11/378,640 US7949620B2 (en) 2005-03-18 2006-03-20 Method and device for detecting clusters amongst data arranged in orders for cluster creation and removal based on conditional probabilities between clusters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102005012665A DE102005012665A1 (de) 2005-03-18 2005-03-18 Verfahren und Vorrichtung zum Ermitteln von Clustern aus einer Mehrzahl von in Aufträgen geordneten Daten

Publications (1)

Publication Number Publication Date
DE102005012665A1 true DE102005012665A1 (de) 2006-09-21

Family

ID=36933888

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102005012665A Ceased DE102005012665A1 (de) 2005-03-18 2005-03-18 Verfahren und Vorrichtung zum Ermitteln von Clustern aus einer Mehrzahl von in Aufträgen geordneten Daten

Country Status (2)

Country Link
US (1) US7949620B2 (de)
DE (1) DE102005012665A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109597858A (zh) * 2018-12-14 2019-04-09 拉扎斯网络科技(上海)有限公司 一种商户的分类方法及其装置和商户的推荐方法及其装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8311969B2 (en) * 2009-01-09 2012-11-13 International Business Machines Corporation Method and system for reducing false positives in the classification of data
US9002847B2 (en) * 2012-02-29 2015-04-07 Hewlett-Packard Development Company, L.P. Identifying an auto-complete communication pattern
CN105335368B (zh) * 2014-06-06 2018-11-16 阿里巴巴集团控股有限公司 一种产品聚类方法及装置
US11594310B1 (en) 2016-03-31 2023-02-28 OM1, Inc. Health care information system providing additional data fields in patient data
US11257574B1 (en) 2017-03-21 2022-02-22 OM1, lnc. Information system providing explanation of models
US11862346B1 (en) 2018-12-22 2024-01-02 OM1, Inc. Identification of patient sub-cohorts and corresponding quantitative definitions of subtypes as a classification system for medical conditions

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6941303B2 (en) * 2000-09-20 2005-09-06 Ndsu Research Foundation System and method for organizing, compressing and structuring data for data mining readiness

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Andritsos, P. ET AL: LIMBO: A Scalable Algorithm to Cluster Cate- gorical Data. CSRG Technical Report 467 [online]. University of Toronto, Department of Computer Science, 2003 [recherchiert am 24.10.2005]. Im Internet: <URL: http://www.cs.toronto.edu/ APPROX periklis/pubs/csrg467.pdf>. *
Andritsos, P.; Tsaparas, P.; Miller, R.J.; Sevcik, K.: LIMBO: A Scalable Algorithm to Cluster Cate- gorical Data. CSRG Technical Report 467 [online]. University of Toronto, Department of Computer Science, 2003 [recherchiert am 24.10.2005]. Im Internet: <URL: http://www.cs.toronto.edu/~perikli s/pubs/csrg467.pdf>.

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109597858A (zh) * 2018-12-14 2019-04-09 拉扎斯网络科技(上海)有限公司 一种商户的分类方法及其装置和商户的推荐方法及其装置

Also Published As

Publication number Publication date
US20060224549A1 (en) 2006-10-05
US7949620B2 (en) 2011-05-24

Similar Documents

Publication Publication Date Title
DE102005012665A1 (de) Verfahren und Vorrichtung zum Ermitteln von Clustern aus einer Mehrzahl von in Aufträgen geordneten Daten
DE102014204827A1 (de) Auflösen ähnlicher Entitäten aus einer Transaktionsdatenbank
EP1307816A1 (de) System zur ermittlung von fehlerursachen
EP2069920A1 (de) Verfahren zur rechnergestützten bewertung von softwarequellcode
DE112011103428T5 (de) Automatisierte Analyse zusammengesetzter Anwendungen
EP3736817A1 (de) Überprüfung und/oder verbesserung der konsistenz von datenkennzeichnungen bei der medizinischen bildverarbeitung
DE102014116117B4 (de) Verfahren und System zum Mining von Mustern in einem Datensatz
DE102012025349A1 (de) Bestimmung eines Ähnlichkeitsmaßes und Verarbeitung von Dokumenten
WO1997015016A1 (de) Datenbankmanagementsystem sowie datenübertragungsverfahren
WO2012017056A1 (de) Verfahren und vorrichtung zur automatischen verarbeitung von daten in einem zellen-format
WO2023156504A1 (de) Verfahren zur erkennung von anomalien in daten
DE19963123B4 (de) Analytisches Informationssystem
DE102010021382A1 (de) Verfahren und System zur Erzeugung eines Integrationsmodells
EP0770946B1 (de) Verfahren zur automatisierten optimalen Redundanz-Auslegung von Messungen für die Leittechnik in Kraftwerken
EP3779619B1 (de) Verfahren und vorrichtung zur bestimmung emergenter risiken eines technischen systems
DE102007044380A1 (de) Verfahren zum rechnergestützten Lernen eines probabilistischen Netzes
DE10213735A1 (de) Verfahren und Vorrichtung zum Vergleichen von Produkteigenschaften
DE4213533A1 (de) System zur automatisierten Analyse von zusammengesetzten Wörtern
Wunderli Database Technology for the Coordination of CIM Subsystems
EP1336922B1 (de) Verfahren und Vorrichtung zum automatischen Erstellen eines Datawarehouse
EP1376383A2 (de) Verfahren zur Verarbeitung von Ein- und Ausgaben für statistische Analysen und Verfahren zur Bereinigung von Redundanzen
EP2423830A1 (de) Verfahren zum Suchen in einer Vielzahl von Datensätzen und Suchmaschine
DE102023115605A1 (de) Vorhersage der operationsdauer
DE102021130822A1 (de) Automatisches erstellen und ausführen eines testsystems für arbeitsabläufe
DE102014016676A1 (de) Verfahren zur rechnergestützten Auswahl von Bewerbern aus einer Vielzahl von Bewerbern für ein vorgegebenes Anforderungsprofil

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection