WO2003021478A2 - Verfahren und anordnung zur datenauswertung sowie ein entsprechendes computerprogramm-erzeugnis und ein entsprechendes computerlesbares speichermedium - Google Patents

Verfahren und anordnung zur datenauswertung sowie ein entsprechendes computerprogramm-erzeugnis und ein entsprechendes computerlesbares speichermedium Download PDF

Info

Publication number
WO2003021478A2
WO2003021478A2 PCT/EP2002/009735 EP0209735W WO03021478A2 WO 2003021478 A2 WO2003021478 A2 WO 2003021478A2 EP 0209735 W EP0209735 W EP 0209735W WO 03021478 A2 WO03021478 A2 WO 03021478A2
Authority
WO
WIPO (PCT)
Prior art keywords
data
evaluation
request
computer
database
Prior art date
Application number
PCT/EP2002/009735
Other languages
English (en)
French (fr)
Other versions
WO2003021478A3 (de
Inventor
Marc Andre Reymond
Original Assignee
Europroteome Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Europroteome Ag filed Critical Europroteome Ag
Priority to US10/488,165 priority Critical patent/US20040236723A1/en
Priority to EP02797658A priority patent/EP1423806A2/de
Priority to JP2003525500A priority patent/JP2005501625A/ja
Priority to CA002459003A priority patent/CA2459003A1/en
Publication of WO2003021478A2 publication Critical patent/WO2003021478A2/de
Publication of WO2003021478A3 publication Critical patent/WO2003021478A3/de

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Definitions

  • the invention relates to a method and an arrangement for data evaluation as well as a corresponding computer program product and a corresponding computer-readable storage medium, which can be used in particular as an internet-based patient-specific forecasting system.
  • a method and an arrangement for data evaluation as well as a corresponding computer program product and a corresponding computer-readable storage medium, which can be used in particular as an internet-based patient-specific forecasting system.
  • the integration of clinical, pathological and molecular biological data is made possible, as well as the linking of these data with relevant prognostic statements for a specific patient.
  • the system allows an oncologist, for example, to make an individual therapy decision based on specific information patterns.
  • IT Information technology
  • Prediction statements are particularly important for cancer diseases in order to determine the best possible therapy. The importance arises from the fact that cancer, in contrast to a viral disease, which causes the same symptoms in every patient, has a developing and individual clinical picture. The following facts are important for prognostic statements for these diseases:
  • Patient information such as age, co-morbidity, reliability, etc., - environmental information such as surgeon, initial treatment, insurance system, country, etc.,
  • Tumor information such as pathology, tumor staging, mutations, gene expression at the transcriptome and proteome level.
  • the staging systems available today (such as the TumorNodeMetastasis system from the International Union against Cancer - UICC) already allow statements to be made for patient groups, but unfortunately not for a specific patient. In the prognosis, however, information must be related to each individual patient, taking into account their specific situation, whereas in diagnosis the special is generalized and ignored. In future, modern findings from tumor gene expression research will also have to be taken into account in order to enable this step from diagnosis to patient-specific prognosis - and thus individual therapy. A task that has not yet been solved. Another unresolved problem with the conventional systems is dealing with the considerable amounts of data that have to be evaluated for a high-quality forecast. These can no longer be managed by the doctor (oncologist) alone when making therapy decisions. The computer technology currently available and the programs used for data evaluation are also unsuitable for evaluating the amounts of data made available by the molecular biological databases in a reasonable time.
  • the object to be achieved by the invention is to provide an improved method for data evaluation.
  • the aim is to expand the informative value (which was previously only possible for patient groups) to include forecasts for an individual patient (e.g. regarding the risk of metastasis, therapy response to a number of chemotherapeutic agents, and prediction of side effects).
  • the invention is intended to determine the significance of the parameters taken into account in the evaluation, and thereby to achieve a reduction in the amount of data required for the forecast without reducing the quality of the forecast.
  • a particular advantage of the invention lies in the fact that in the method for data evaluation using data processing devices coupled to databases, the amounts of data required for a high-quality evaluation, such as, for. B. a medical prognosis, must be taken into account, can be reduced considerably if request data supplied to the data processing device is evaluated by storing the stored data in the database (s) in accordance with predefinable rules and / or using artificial intelligence methods Data are determined, the quality of this corresponding data is automatically evaluated, on the basis of this evaluation, the associated request and / or corresponding data, the significance of this request and / or corresponding data for the request is automatically determined, the results of the evaluation, the quality evaluation and / or the significance of the data is output and / or made available.
  • An arrangement for data evaluation is advantageously set up in such a way that it comprises at least one processor which is (are) set up in such a way that a method for data evaluation can be carried out, the request data supplied to the data processing device being evaluated in accordance with specifiable rules and / or using methods of artificial intelligence with data corresponding to the request data in which the database (s) stored are determined, the quality of this corresponding data is automatically evaluated, based on this evaluation, the associated According to the request and / or corresponding data, the significance of this request and / or corresponding data for the request is automatically determined, the results of the evaluation, the quality assessment and / or the significance of the data are output and / or made available.
  • a computer program product for data evaluation comprises a computer-readable storage medium on which a program is stored which, after it has been loaded into the memory of the computer, enables a computer to carry out a method for data evaluation, the data evaluation comprising the method steps according to one of the claims 1 to 12 comprises.
  • a computer-readable storage medium is advantageously used, on which a program is stored which enables a computer to carry out a method for data evaluation after it has been loaded into the memory of the computer, the data evaluation carrying out the method steps according to a of claims 1 to 12.
  • One method for using a system for data evaluation is that access to the system is made possible by a fee-based PIN, the PIN being provided with means for recording data to be entered into the system and / or with means for recording material which is used for the determination the data to be entered is connected, and the user acquires the PIN by paying a fee.
  • the data evaluation generates medical forecasts and the request data are supplied as clinical pathological data by a doctor and / or as bio-molecular data by an analysis laboratory to the data processing device. It is advantageous if the request data and / or the data stored in the database (s) take into account disease-related factors and / or patient-specific factors and / or environmental-specific factors. In particular, tumor-specific factors are also taken into account among the disease-related factors.
  • the data stored in the database (s) it has been found to be advantageous for the data stored in the database (s) to be updated by supplying data about the therapy and the course of the disease to cases of the data processing device predicted by the data processing device. It is also provided that the evaluation rules are updated in an iterative learning process in which the request, request data, used in evaluating the request, data stored in the database (s), results of the evaluation and actually occurred events are taken into account.
  • the amount of data stored in the database (s) is reduced and / or, depending on the significance, the number of request data to be supplied and / or the amount of data the database (s) stored data is reduced.
  • the evaluation by cluster analysis, similarity search, tendency analysis, correspondence analysis, ascending hierarchical classification, main analysis and / or wavelet analysis in connection with probabili generated from error models - Actual values and / or means of artificial intelligence such as neural networks and / or rule-based systems.
  • the data evaluation includes the determination of the probability of occurrence of events identified by the request and / or by the corresponding data.
  • a reduction in the data to be processed can be achieved by determining the significance of the data in such a way that a query is evaluated a first time without taking this data into account and a second time taking this data into account, comparing the evaluations of the results of these two evaluations and the measure of the influence of the data is determined relative to an improvement or deterioration of the second evaluation compared to the first evaluation and if the second evaluation improves compared to the first evaluation, the data are regarded as significant and are taken into account in future evaluations if the second evaluation deteriorates Compared to the first evaluation, the data are considered insignificant and are no longer used for future evaluations.
  • the invention considerably improves the availability of clinically relevant knowledge about a specific medical problem at the doctor's workplace (oncologist) by supplying the data, requesting and / or outputting the results via the Internet.
  • the computer system (accessible on the Internet) gives him access to data that come from different databases, but e.g. B. were put on a uniform basis by using the Internet standard XML (eXtensible Markup Language).
  • XML eXtensible Markup Language
  • the different formats and data structures are no longer recognizable to him. This makes it possible to have a lasting impact on the acceptance and the actual influence of gene expression data on patient care.
  • This standardization of the language or formats of the data creates the organizational prerequisites for a successful use of the invention.
  • an arrangement which comprises the following: at least one data processing device coupled to at least one database, means for data input and / or output, according to predefinable rules and / or means for determining artificial intelligence data corresponding to request data stored in a database (s) supplied with a data processing device, means for automatically evaluating the quality of the corresponding data,
  • Means for automatically determining the significance of the request and / or corresponding data for a request will allow the risk of metastasis of an individual patient to be estimated, so that the indication of adjuvant chemotherapy can be made more targeted.
  • an estimation of the probability of the therapy response for a number of Che otherapeutics is made possible, so that tumor resistance patterns can also be identified with an appropriate tumor profiling.
  • a further advantage of the invention is that the risk of unsuccessful expensive therapy attempts is significantly reduced, the development costs of a medicament are reduced, and thus the health costs are reduced, since it is possible to determine patient groups that are suitable for clinical studies with a certain chemotherapy drugs are best suited.
  • the doctor is able to make an individual therapy decision, ie a therapy decision based on a specific clinical picture or stage of the disease.
  • prospective randomized studies could possibly be replaced by evidence-based data with a high value. This would be a further advantage because the implementation of numerous randomized studies with an increasing number of cancer therapies is associated with considerable costs and organizational difficulties, which could thus be saved.
  • An improvement of patient-specific prognoses can be expected by using data, genes, molecular and / or genetic targets, which by a method according to one of claims 1 to 12, by an arrangement according to one of claims 13 or 14, by a computer program product Claim 15, made available by a computer readable storage medium according to claim 16 or a use according to claim 17.
  • Production methods for diagnostic arrangements are therefore preferred, which comprises the steps of a method according to one of Claims 1 to 12 and an additional step in which a diagnostically effective analysis tool, such as, for. B.
  • RNA or protein chip and / or a combination of genes, which by a method according to any one of claims 1 to 12, by an arrangement according to one of claims 13 or 14, by a computer program product according to claim 15, by a computer-readable storage medium according to claim 16 or a use according to claim 17 have been made available.
  • carrier elements on which data, genes, molecular and / or genetic targets are provided, which by a method according to one of claims 1 to 12, by a Arrangement according to one of claims 13 or 14, made available by a computer program product according to claim 15, by a computer-readable storage medium according to claim 16 or a use according to claim 17.
  • the carrier element is designed as a chip and - data on the individual risk, such as. B. metastasis potential, and / or
  • the carrier element is preferably designed as a reproducible chip.
  • Findings from (internet) management and quality assurance for e-health systems show that the objective that is implemented by the invention requires a problem-oriented presentation that is not based solely on a strictly scientific structure, such as gene expression data communication. Rather, it is necessary - and the invention fulfills this requirement - to create a basis with the help of a well-structured structure, the representation of larger relationships and the demonstration of methods and techniques, which enables the doctor (oncologist), in addition to one individual therapy decisions fertilizing in addition to be able to form your own practical solutions based on the knowledge imparted.
  • a further possibility of using the system for data evaluation consists in that a distributor of the system for data evaluation concludes user agreements with at least one customer and the customer (s) makes the system usable for further participants by assigning PINs subject to fees. ,
  • reference laboratories, pharmaceutical companies and / or content providers use the system for data evaluation as a customer.
  • the fees for the use of the system for data evaluation are raised by the customer and - per use case and / or as a percentage of the turnover that the customer makes with the system and / or - per assigned PIN be determined.
  • a means for detecting material includes a carrier chip for the samples required in a - if necessary reproducible - laboratory test, such as, for. B. is a DNA microarray.
  • Another advantage is the use of a system for data evaluation according to one of claims 1 to 32 for carrying out profit or non-profit actions by doctors, patients and / or companies operating the system, one action by participants and / or providers the system is started.
  • Such actions could include, for example, the exchange of information and / or the introduction of customer and / or patient groups.
  • Such a use of the system for data evaluation is particularly useful if the actions include the creation, maintenance and / or marketing of a network of excellence and / or the distribution of therapies and / or the selection of patient groups for clinical studies.
  • this can ensure that visitor loyalty is strengthened for the corresponding web pages and / or a specific customer base is tied to the system.
  • FIG. 1 a shows a schematic illustration of the method steps in conventional data evaluation
  • FIG. 1 b shows a schematic illustration of the method steps in data evaluation according to the invention
  • FIG. 2 a-d shows the modular structure of a medical information system
  • FIG. 3 a-f shows a detailed illustration of the modular structure building a medical information system
  • ROC Receiver Operating Characteristic
  • the exemplary system is an internet-based medical information system, which is composed of databases, a data reduction program and modules of artificial intelligence (neural network or rule-based system). It allows the integration of clinical, pathological and biological data, and their connection with relevant prognostic statements for a specific patient. This information system thus enables the oncologist to make an individual therapy decision based on specific information patterns. Therapy decisions are supported by probability calculations. Colorectal carcinoma was chosen as the prototype.
  • the exemplary medical information system integrates data from transcriptome and proteome research.
  • a patient comes to the doctor and inquires about treatment options for his cancer.
  • the oncologist sends the samples against invoice to a reference laboratory, where one or more laboratory tests can be carried out using any laboratory method, such as a chip, in order to carry out the necessary gene expression analyzes.
  • the oncologist receives a PIN number, thanks to which he receives all relevant patient data (patient-specific, environment-specific, etc.) in anonymous form in the database of the computer system according to the invention.
  • the reference laboratory also enters all tumor data with the PIN in this database.
  • a data set includes all prognostic factors as variables that are accepted by medicine for the prognosis of colorectal cancer. Thanks to the PIN number, the correspondence between the molecular and clinical information can be recognized. This combined information is compared to the database, and the patient with the closest information pattern and their course of the disease is selected. A retrospective error minimization procedure is used. The doctor (surgeon or oncologist) can then use the PIN to request various predictions from the information system. Within minutes, the patient then receives information about the likelihood of metastasis, resistance profiles for various chemotherapeutic agents, possibly for immunotherapeutic agents or the like. The knowledge gained in this way is an important decision-making aid when making therapy decisions.
  • the conventional method is compared with the data evaluation according to the invention in FIGS. While in a conventional method (cf. FIG. 1 a) the input variables 1 immediately in a module 2 for calculating the correlation and then in a module 3 for multivariate statistical analysis (for example, regression analysis), a transformation step 5 is carried out in the method according to the invention (cf. FIG. 1b) after reading in the input variable 1.
  • the transformation step 5 is an important step of the method according to the invention and serves to avoid non-linearity of the method in order to keep the computation effort low.
  • the symbolic variables are converted here in a suitable form.
  • the variables with the highest information content are determined one after the other. This continues until each variable has been assigned the appropriate weighting.
  • the next step is training and the selection of model 7.
  • This procedural step includes training various models with different input variables and a number of hidden neurons, which were calculated according to the Bayesian evidence approach.
  • the best model 8 determined in this way can now calculate the forecasts for new patients, that is to say determine an output value for new input data.
  • the model architecture 8 can always be improved and adapted (the model "learns").
  • the results 4b which are achieved when using the method according to the invention, are distinguished from the results 4a achievable by the conventional method by a higher forecast quality, which is achieved above all by creating patient-specific, individual risk profiles.
  • FIGS. 4a and 4b clearly show, by using a data mining system, the method enables such data or characteristics - so-called classifiers - to be determined, in particular molecular biological characteristics that are not contained in the data sets of the clinical data lead to a differentiation of the risk groups within the UICC groups. Taking into account a feature / classifier determined in this way, ie after appropriate training of the system, forecasts for these two subgroups can be made much more precisely.
  • FIG. 4a and 4b clearly show, by using a data mining system, the method enables such data or characteristics - so-called classifiers - to be determined, in particular molecular biological characteristics that are not contained in the data sets of the clinical data lead to a differentiation of the risk groups within the UICC groups.
  • the deviation for the prediction of a five-year survival time for the patient group without this feature is up 25% compared to the entire group, for the group of patients who have the feature, the prognosis for the five-year survival decreased by 8% compared to the entire group.
  • FIGS. 5 and 6 illustrate in detail by means of various graphical representations how the forecast quality can be significantly improved if the forecast is based on additional data which were determined using the data mining system of the invention.
  • FIGS. 5a-c show the results when applied to patients of UICC stage I (FIG. 5a), to patients of UICC stage II (FIG. 5b) and to patients of UICC stage III (FIG. 5c). In all cases it is clear that the application of the data evaluation according to the invention to special patient groups allows a further significant classification.
  • ROC curves illustrate the quality of a prediction.
  • the 'sensitivity' ie the ratio of the correct predictions about the occurrence of an event to the total number of positive test results
  • the quality of the forecast is given by the area under the curve.
  • Tumor-related factors characterize the disease
  • - patient-specific factors refer to the patient, - environmental factors that do not relate directly to the patient or the tumor.
  • tumor-specific factors relate to histological information (type, characteristics) and the anatomical spread of the disease.
  • the tumor pathology is crucial for the prognosis in cancer.
  • the histological type defines the disease, but other factors such as B. the stage or the involvement of lymph nodes affect the result.
  • the anatomical spread of the tumor is usually based on the criteria of the TNM classification Size, infiltration of the primary tumor, existing lymph node metastases and distant metastases are described.
  • cancer-specific proteins have only been used as tumor markers to reflect the tumor burden, without, however, the tumor behavior j. to be able to characterize exactly.
  • Recent results in tumor biology have brought the prognostic role of tumor-specific proteins to the fore again.
  • gene products they can u. a.
  • New technologies in molecular diagnostics make it possible today to determine genetic information related to minimal tumor burden, aggressive tumor cell growth and tumor cell reaction due to changes in DNA or immunotherapies.
  • Patient-specific factors are factors present in the patient, which are either indirect or not malignant, but which can have a major influence on the result through an interference with the tumor behavior or their reaction to the treatment. A distinction is made between demographic factors, co-morbidity and existing diseases.
  • Demographic factors These factors that affect the oncological outcome are age, gender and ethnicity. None of these factors can be affected by surgery or treatment, but many independently affect the outcome of other factors. For example, elderly patients have a shorter survival time with Hodgkin's disease or with lymphoma. The role of gender is far less well defined, but the results for Hodgkin's diseases or malignant malignomas were worse in men than in women.
  • B. Neurofibromatosis which is a risk factor for neurogenic sarcomas and a prognostic factor for cancer results.
  • Performance Status is a strong prognostic factor for many types of cancer, especially those with advanced status such as B. Lung and bladder cancer that require chemotherapy. As a result of age or comorbidity should this factor can be viewed as a patient-specific factor.
  • RNA and protein level For gene expression profiling at the RNA and protein level, purified samples and clinical data from colorectal patients, of whom the required information is available, are analyzed and the transcriptome and proteome profiles determined. A large number of frozen samples from different colorectal patients from different institutions are available for this purpose.
  • the samples prepared using this method can be compared, even if they come from different institutions. This fulfills a basic condition for later comparing the predictive statements of the system described here in various institutions. In the future, this will enable the large sample throughput numbers required to validate gene expression research to be achieved.
  • several thousand samples from patients e.g. T. with stool, blood and bone marrow puncture.
  • the theoretical input of the clinical network, in which the exemplary information system is integrated amounts to several thousand new colorectal cancers per year.
  • a complete system for Such analyzes include, for example, the following components:
  • DNA chips The DNA chips (DNA microarrays): A basic distinction is made between the cDNA chips and the oligo chips. In the case of cDNA chips, approximately 300-400 bp long PCR products are applied to the chips. One is currently able to spot approximately 14,000 cDNAs on an array.
  • oligo chips In the oligo chips, approx. 60 bp long oligonucleotides are synthesized on the chip surface. Arrays with 8,400 features are produced, on request also as a double array (16,800 spots). Especially in the field of DNA chips, new developments will lead to increasingly denser arrays (higher number of spots) with a very high flexibility in the sequence selection in a very short time.
  • microarray scanner New developments in the field of microarray scanners are able to analyze 2 fluorescence wavelengths at the same time. With a resolution of 5 or 10 ⁇ m (adjustable by the user), the scanner needs about 8 minutes to scan a chip. A 48 chip carousel allows the use of this system in high throughput analysis.
  • the Bioanalyzer is a lab-on-a-chip system that is used for quality control, especially for RNA purification. With the help of the bio-analyzer, the RNA purified by the experimenter is analyzed qualitatively and quantitatively by machine. Proteome analysis
  • Proteome techniques can be used to determine the qualitative and quantitative expression of proteins in various disease stages. Since post-translational protein changes are known to play an important role in the clinical behavior of diseased cells, tissues and / or organs, these differences in protein expression have an important influence in the use of the information system described as an example.
  • proteome techniques in human colorectal cancer e.g. B. one (SDS-PAGE) or two-dimensional gel electrophoresis (2D PAGE), N-terminal sequencing and mass spectrometry (MALDI-TOF and MS-MS) and chips on which antibody, ligand or various surfaces for Binding proteins are used to serve.
  • SDS-PAGE SDS-PAGE
  • 2D PAGE two-dimensional gel electrophoresis
  • MALDI-TOF and MS-MS N-terminal sequencing and mass spectrometry
  • chips on which antibody, ligand or various surfaces for Binding proteins are used to serve.
  • 2-D gel electrophoresis and mass spectrometry lends itself as exemplary technology for work in the field of proteome research.
  • the proteins are separated by means of 2-D gel electrophoresis and then stained.
  • the protein spots are cut out, digested enzymatically and the resulting peptide mixture is examined by mass spectrometry.
  • the protein is identified by means of a database comparison of the resulting peptide mass fingerprints.
  • the mass spectrometry platform consists of an automatic sample preparation station, a high-performance MALDI mass spectrometer (matrix-assisted laser desorption / ionization time of flight) and an automatic data station Carrying out the database search together.
  • the MALDI-MS has a high sensitivity and high mass accuracy; both are basic requirements for successful protein identification.
  • sequence information of the peptides can be determined using the PSD technique (Post Sorce Decay).
  • PSD technique Post Sorce Decay
  • electrospray mass spectrometer is helpful in order to gain easier access to sequence information and to be able to specifically determine post-translational modifications. Further automation can be achieved by using an automatic spot picker and a digester.
  • Another important task that had to be solved in the development of the medical information system according to the invention is the translation of the various information platforms (transcriptome and / or proteome data) into a common language.
  • a bioinformatics concept was developed for the exemplary oncological information system that allows data from the clinic, from pathology, from DNA databases (such as CGAP), from cDNA arrays (such as e.g. Agilent Chips) and to integrate and analyze from 2D PAGE.
  • the various information from the clinic, pathology, transcriptome and proteome research are translated into the web-based (* .xml) bioinformatic language GEML (Gene Expression Markup Language) (see http: // www. geml.org).
  • Data reduction methods are used as a component of the exemplary oncological information system. Available data reduction software had to be adapted to the special requirements of oncological evaluations. The approximately 10 4 information per patient is reduced to 10 2 by using this software.
  • the digitized proteome or transcriptome images generated by the scanner are processed in a compatible analysis program.
  • This program is able to evaluate and save the gene expression data.
  • the program logs each gene expression pattern and allows comparisons of different experiments. This generally requires database queries in external and internal databases.
  • the program generates technology-specific error models. The probability values of each measurement generated from the error models are propagated across the entire analysis environment, which is a higher predictive value
  • Cluster analyzes, similarity searches and tendency analyzes are possible.
  • the program enables analyzes to be carried out on exons, sequences, cluster intensity and ratio calculations.
  • Clustering analyzes include, for example, agglomerative, division, mean and median algorithms.
  • An exemplary information technology method allows research of similar patterns with the pattern of interest within all data sets in the database.
  • Time sequences for example in an iterative follow-up measurement, can also be displayed on a time line, whereby specific behavior can be identified.
  • Special search engines allow a quick database query and can be adapted to an internal database.
  • Hypertext links can also be formulated so that connections can be made to internal or external databases.
  • Bioinformatics is further supported by the fact that clinical outcomes (such as the ability to metastasize or the resistance to therapy of a specific tumor) can be directly linked to data patterns after the clinical-pathological data have been taken into account.
  • This interpretation can e.g. B. by artificial intelligence and / or machine learning be simplified.
  • Conventional computer programs contain a set of explicit instructions that tell the program exactly what and how it has to perform a calculation.
  • Artificial intelligence systems (KL systems) work under completely different conditions: the program is given knowledge rather than being given exact instructions for its execution. This happens during the training phase of the AI system. By repeatedly applying the AI system to historical data and comparing the results of these evaluations ("conclusions”) with the facts actually available, during the course of this training it learns the behavior required by the "fully developed” system ,
  • the correspondence analysis approach and the ascending hierarchical classification that are used in the information system according to the invention differ significantly from the more classic approach of discriminant analysis using main component analysis.
  • the correspondence analysis provides a factorized space of reduced size for the representation of the samples.
  • the increasing hierarchical classification sorts the pictures into meaningful groups.
  • the simultaneous display of both the spots and the chip or gel images takes place in the same factored space.
  • the characteristic gene or protein representatives of a certain class of gels e.g. cancer metastasis samples
  • the software can automatically create protein or gene patterns classify, according to the respective requirements main component analysis, wavelet analysis, artificial neural networks, heuristic clustering analysis and others can be used individually or in combination.
  • This laboratory test enables the outcome-relevant genetic, translational or functional characteristics of a tumor to be summarized. This procedure makes it possible to use so-called integrated health care solutions, where the therapy is coupled with the diagnostics.
  • Such a laboratory test (or also several laboratory tests) can (or can) be carried out, for example, with a chip.
  • the chips have the following properties:
  • the chip provides data on the metastasis potential
  • the chip provides data on the therapy response for at least 10 common chemotherapeutic agents, the chip provides data on the patient's metabolism (e.g. enzymatic equipment),
  • the chip provides information on autoimmunity to the tumor
  • the chip contains no more than 10 2 different pieces of information (+ doubles) and
  • the chip is reproducible. Due to the reproducibility, the chips can be widely used, so that inexpensive production is possible.
  • the information system for the data exchange between the treating doctor, reference laboratory (s) and databases, the information system according to the invention comprises a preferably multilingual, secure web interface which, in the exemplary solution, enables connection to oncologists and reference laboratories. Structuring the information system using the Internet standard XML (eXtensible Markup Language) improves the availability of clinically relevant knowledge about a specific medical problem at the oncologist's workplace.
  • XML eXtensible Markup Language
  • the chosen cryptographic basic technology of the exemplary oncological information system is symmetrical encryption. Highly efficient processes are available here that guarantee long-term security with a key length of 128 bits, for example.
  • Communication partners have a common key, the PIN number. The PIN number is only sent to the doctor being treated on account, so that the patient cannot have direct access to the information provided by the information system.
  • the AES Advanced Encyrption Standard
  • the cryptographic chip card is ideal as a safe place to store the electronic identity of a certain oncologist, i.e. the HPC (Health Professional Card, ID for healthcare professions) in healthcare.
  • HPC Health Professional Card, ID for healthcare professions
  • HON Code of Conduct for medical websites in the health sector is implemented as an example (www.hon.ch/HONcode/German). Active content such as Java scripts are not used, except in mandatory applications such as remote entry of clinical and pathological data anonymized with a PIN and follow-up data.
  • the reference laboratories, large pharmaceutical companies or content providers represent the actual customers of the operator ("customers").
  • the target audience or users of the information system (“participants”) are e.g. B. Doctors who deal with cancer.
  • This business idea would use several advantages. So the operator would only have to concentrate on a few customers and could e.g. B. use the developed sales system of these large customers, which extends from large pharmaceutical companies to the individual doctor. With the right choice of customers, the worldwide availability of the information system can be achieved.
  • the billing of the fees for the use of the information system should advantageously also be done by the customers and not directly by the individual participants from the target audience. Depending on the requirements, one could agree an advance payment, installment payments, fees per use case or fees as a percentage of the turnover that the customer makes with the information system. Fees per “PIN” that were given to the participants of the target audience or customers are also conceivable. This PIN enables the participant from the target audience to access and use the information system; more precisely: to the patient-specific data linked to the PIN. The participant receives the PIN against payment of a fee to the customer ("no money - no PIN"). In connection with the PIN, the participant receives a chip that contains the tests required for the analysis.
  • the requirements for the chip result, among other things, from the statements made by the information system with regard to the significance of the variables
  • the chip is then sent to a reference laboratory and the evaluation is carried out in the manner described above it is conceivable that the patient sample is sent directly from the participant to the reference laboratory and only then applied to the chip, and the PIN would then be sent by the reference laboratory together with the test results to the participant.
  • the price for using the information system would be in the total price for purchase of the chip. If the participant requests the information system from the target audience stem, he is usually asked to provide certain information, especially about the course of therapy, medication or the course of the disease. This data is used, among other things, to optimize the system. Since this increases the value of the system, one can possibly consider reimbursing a certain amount of the fees to the respective participant from this data entry.
  • Input variables module for calculating the correlation module for multivariate statistical analysis a results of the conventional method a results of the method according to the invention transformation step feature selection training and selection of the model best model, model architecture pre-operative data 0 pre-operative and additional, by the inventor - Determined data evaluation according to the data

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Die Erfindung betrifft ein Verfahren und eine Anordnung zur Datenauswertung sowie ein entsprechendes Computerprogramm-Erzeugnis und ein entsprechendes computerlesbares Speichermedium, welche insbesondere einsetzbar sind als internetbasiertes patientenspezifisches Prognosesystem. Es wird in diesem Falle die Integration von klinischen, pathologischen und molekularbiologischen Daten ermöglicht sowie die Verknüpfung dieser Daten mit relevanten Prognoseaussagen bei einem bestimmten Patienten. Dadurch erlaubt das System beispielsweise einem Onkologen, aufgrund spezifischer Informationsmuster eine individuelle Therapieentscheidung zu treffen. Eine Verbesserung der Prognosequalität wird erreicht, indem signifikante und unwesentliche Variablen ermittelt werden, was zu einer deutlichen Reduzierung der auszuwertenden Datenmenge, der Beschleunigung der Datenauswertung und zur Verbesserung der Prognose führt.

Description

Verfahren und Anordnung zur Datenauswertung sowie ein entsprechendes Computerprogramm-Erzeugnis und ein entsprechendes computerlesbares Speichermedium
Beschreibung
Die Erfindung betrifft ein Verfahren und eine Anordnung zur Datenauswertung sowie ein entsprechendes Computerprogramm-Erzeugnis und ein entsprechendes computerlesbares Speichermedium, welche insbesondere einsetzbar sind als internetbasiertes patientenspezifisches Prognosesystem. Es wird in diesem Falle die Integration von klinischen, pathologischen und molekularbiologischen Daten ermöglicht sowie die Verknüpfung dieser Daten mit relevanten Prognoseaussagen bei einem bestimmten Patienten. Dadurch erlaubt das System beispielsweise einem Onkologen, aufgrund spezifischer Informationsmuster eine individuelle TherapieentScheidung zu treffen.
Die Informationstechnologie (IT) gewinnt in der Medizin zunehmend an Bedeutung. Dennoch wird derzeit die Patientenversorgung als Kernprozeß im Gesundheitswesen nur unzureichend unterstützt. Stattdessen stehen administrative Tätigkeiten im Vordergrund. Das Potential dieser Technologie erlaubt aber die Bereitstellung einer qualitativ besseren Patientenversorgung bei gleich- zeitiger ökonomischer Nutzung der vorhandenen Ressourcen.
Einen wichtigen Bestanteil einer verbesserten Patien- tenversorgung bilden verläßliche Prognoseaussagen. Eine Prognose läßt sich jedoch nicht nur anhand allgemeiner Kenntnisse zu Krankheit und Patient erstellen; wichtig sind darüber hinaus auch Informationen zum vorherigen Verlauf der Krankheit bei jedem einzelnen Patienten. Hierbei spielen genaue klinisch-pathologische Daten und Informationen zur Nachsorge eine sehr wichtige Rolle . So muß hier beispielsweise die iterative Natur des Pro- gnosebeStimmung berücksichtigt werden.
Neben der genauen Kenntnis des Patienten und seiner Krankheit ist es ebenso wichtig, den vorliegenden Fall mit ähnlichen Fällen aus der Vergangenheit an eigenen oder externen Institutionen vergleichen und die damaligen Erfahrungen berücksichtigen zu können. Solche Vergleiche sind jedoch nur mit qualitativ hochwertigen Referenz-Datenbanken realisierba .
Prognoseaussagen kommt insbesondere bei Krebskrankheiten eine große Bedeutung zu, um die bestmögliche Therapie zu bestimmen. Die Wichtigkeit ergibt sich aus der Tatsache, daß Krebs im Unterschied zu einer Virus- erkrankung, welche in jedem Patienten die gleichen Symptome hervorruft, ein sich entwickelndes und individuelles Krankheitsbild hat. Bei diesen Krankheiten sind für Prognoseaussagen die folgenden Fakten von Bedeutung:
Patienteninformationen wie Alter, Co-Morbidität , Zuverlässigkeit, usw. , - Umgebungsinformationen wie Chirurg, initiale Behandlung, VersicherungsSystem, Land, usw. ,
TumorInformationen wie Pathologie, Tumorstaging, Mutationen, Genexpression auf Transkriptom- und Proteom-Ebene .
Um diese „Kunst der Vorhersage" zu erlernen, ist es wichtig vom Patienten auszugehen. Welche Fragen beschäftigen den Patienten? was will er vom Arzt wissen? Hierbei werden von Patienten - einer Umfrage zufolge - die folgenden Fragen am häufigsten gestellt:
Inwieweit werde ich mit einer Behandlung geheilt?
- Wie ist die normale Lebensdauer mit einer Behandlung? - Werde ich sterben, wenn ich nicht behandelt werde?
- Wie schnell wird sich die Krankheit ausbreiten, wenn ich nicht behandelt werde?
Die heute zu Verfügung stehende Staging-Systeme (wie z. B. das TumorNodeMetastasis-System der International Union Against Cancer - UICC) erlauben zwar bereits Aussagen für Patientengruppen, leider aber nicht für einen spezifischen Patienten. Bei der Prognose müssen aber Informationen auf jeden einzelnen Patienten bezogen werden unter Berücksichtigung von dessen spezifischer Situation, wohingegen bei der Diagnose das Spezielle verallgemeinert und übergangen wird. Künftig werden moderne Erkenntnisse aus der Tumor-Genexpressions- Forschung zusätzlich berücksichtigt werden müssen, um diesen Schritt von Diagnose zu patientenspezifischer Prognose - und damit eine individuelle Therapie - zu ermöglichen. Eine Aufgabe, die bisher noch nicht gelöst wurde . Ein weiteres ungelöstes Problem bei den herkömmlichen Systemen besteht in der Bewältigung der erheblichen Datenmengen, die für eine qualitativ hochwertige Prognose ausgewertet werden müssen. Diese können vom Arzt (Onkologen) allein bei Therapie-Entscheidungen nicht mehr verwaltet werden. Auch die gegenwärtig verfügbare Rechentechnik und die für die Datenauswertung eingesetzten Programme sind nicht geeignet, um diese insbesondere von den molekularbiologischen Datenbanken bereitgestellten - Datenmengen in vertretbarer Zeit auszuwerten.
Die Nachteile der vorhandenen Lösungen auf diesem Gebiet sind von führenden Krebsverbänden erkannt . Zum Beispiel werden alle Patienten mit kolorektalem Karzinom im UICC-Stadium 3 gemäß Richtlinien der Consen- sus- onferenzen nach kurativer Chirurgie adjuvant behandelt, auch wenn nur 40% metachrone Fernmetastasen entwickeln. Dies führt zu überflüssigen Nebenwirkungen für die Patienten, und zu erheblichen Zusatzkosten für das GesundheitsSystem. Auf der anderen Seite werden 8% der Patienten im Stadium I und 14% der Patienten im Stadium II Fernmetastasen entwickeln, und bekommen laut Richtlinien keine adjuvante Chemotherapie, was zu einer erhöhten Krebslethalität führt (Köckerling, Reymond et al, J Clin Oncol, 1998) .
Die Etablierung eines internet-basierten medizinischen Informationssystems für Ärzte ist als eine notwendige Unterstützung der ärztlichen Tätigkeit betont worden. Die American Cancer Society (http://www3.cancer.org/ cancerinfo/cancerjprofiler.asp) und andere Organisationen wie die European School of Oncology (www.cancerworld.org/progetti/cancerworld/start/pagine /Homeframe. tml) , die University of Pennsylvania (www.oncolink.upenn.edu/resources/physicians) und andere (z. B. http://www.cancerhome.com) bieten schon jetzt Internet-Portale, um z. B. die Onkologen zu unter- stützen.
Alle diese Portale geben jedoch nur die aktuellen Richtlinien und Empfehlungen der Experten-Konferenzen wieder und bringen deswegen keine Lösung zur oben erwähnten Problematik. Außerdem können diese Seiten von Patienten aufgerufen werden, was laut dem HON Code of Conduct (HONcode) für medizinische Webseiten im Gesundheitsbereich nicht geschehen darf: „Die Information auf der Website ist so angelegt, daß sie die existierende Arzt-Patienten-Beziehung unterstützt und keinesfalls ersetzt." (http://www.hon.ch/HONcode/German/) .
Weiterhin gibt es bisher kein e-Health-Produkt auf dem Markt, das molekularbiologische Daten mit konventionel- len klinischen und pathologischen Informationen verbindet, um den Arzt bei TherapieentScheidungen für Krebskrankheiten zu unterstützen. Man braucht nur die Vielfalt der möglichen Therapien zu erwähnen, und erhält die Menge an Informationen, die zu bewältigen sind, um die Notwendigkeit eines solchen Systems zu unterstreichen.
Ein Informations-System in der marktvorbereitenden Erprobungsphase, in dem für die Erzeugung der progno- stischen Aussage neuronale Netze bzw. regelbasierte Systeme eingesetzt werden, ist bekannt. Hierbei werden einige tausend Datensätze (Sets) von prospektiven Patientendaten für die Auswertung berücksichtigt. Mit einem großen Teil dieser Datensets, die jeweils aus weit über einhundert Parametern (Variablen) für tausende von Patienten bestehen, wurde das Informations- System trainiert. Eine zusätzliche Anzahl Datensets von (knapp eintausend) zufällig gewählten Patienten, die nicht zum Trainieren des neuronalen Netzes eingesetzt wurden, wurde zur Prüfung des Systems benützt. Dieses System ermöglicht eine Voraussage der Überle- benschancen eines Patienten nach kurativer kolorektaler Chirurgie mit einem prädiktiven Wert von etwa 90%. Für die Metastasierung kann das System diese gute prognostische Aussage noch nicht reproduzieren. Hier sind of ensichtlich molekularbiologische Zusatzdaten erforderlich, um die Leistung zu verbessern. Am signifikantesten schneiden folgende Variablen ab: Tiefe der Tumorinfiltration, T-Kategorie, tumorfreie Resektionsränder, Grading, venöse und lymphatische Invasion.
Die Aufgabe, die durch die Erfindung gelöst werden soll, besteht darin, ein verbessertes Verfahren zur Datenauswertung bereitzustellen. Ziel ist die Erweiterung der Aussagefähigkeit (die bisher nur für Patientengruppen möglich war) auf Prognosen für einen individuellen Patienten (z. B. hinsichtlich Metasta- sierungsrisiko, Therapieantwort auf eine Reihe von Chemotherapeutika, und Voraussage von Nebeneffekten) . Des weiteren soll durch die Erfindung die Signifikanz der in der Auswertung berücksichtigten Parameter bestimmt und dadurch eine Reduzierung der für die Prognose notwendigen Datenmenge erreicht werden, ohne die Qualität der Prognose zu schmälern.
Diese Aufgabe wird erfindungsgemäß gelöst durch die Merkmale im kennzeichnenden Teil der Ansprüche 1, 13 und 15 bis 25 im Zusammenwirken mit den Merkmalen im Oberbegriff. Zweckmäßige Ausgestaltungen der Erfindung sind in den Unteransprüchen enthalten.
Ein besonderer Vorteil der Erfindung liegt darin, daß bei dem Verfahren zur Datenauswertung unter Verwendung von mit Datenbanken gekoppelten Datenverarbeitungs- einrichtungen die Datenmengen, die für eine hochwertige Auswertung, wie z. B. eine medizinische Prognose, berücksichtigt werden müssen, ganz erheblich reduziert werden, wenn der Datenverarbeitungseinrichtung zugeführte Anfragedaten ausgewertet werden, indem nach vorgebbaren Regeln und/oder mit Verfahren der künstlichen Intelligenz mit den Anfragedaten korrespondierende, in der (den) Datenbank (en) gespeicherte Daten ermittelt werden, die Güte dieser korrespondierenden Daten automatisch bewertet, anhand dieser Bewertung, der zugehörigen Anfrage- und/oder korrespondierenden Daten automatisch die Signifikanz dieser Anfrage- und/oder korrespondierenden Daten für die Anfrage ermittelt wird, die Ergebnisse der Auswertung, die Gütebewertung und/ oder die Signifikanz der Daten ausgegeben und/oder abrufbar bereitgestellt werden.
Eine Anordnung zur Datenauswertung ist vorteilhafter- weise so eingerichtet, daß sie mindestens einen Prozessor umfaßt, der (die) derart eingerichtet ist (sind) , daß ein Verfahren zur Datenauswertung durchführbar ist, wobei der Datenverarbeitungseinrichtung zugeführte Anfragedaten ausgewertet werden, indem nach vorgebbaren Regeln und/oder mit Verfahren der künstlichen Intelligenz mit den Anfragedaten korrespondierende, in der (den) Datenbank (en) gespeicherte Daten ermittelt werden, die Güte dieser korrespondierenden Daten automatisch bewertet, anhand dieser Bewertung, der zugehöri- gen Anfrage- und/oder korrespondierenden Daten automatisch die Signifikanz dieser Anfrage- und/oder korrespondierenden Daten für die Anfrage ermittelt wird, die Ergebnisse der Auswertung, die Gütebewertung und/ oder die Signifikanz der Daten ausgegeben und/oder abrufbar bereitgestellt werden.
Ein Computerprogrammprodukt zur Datenauswertung umfaßt ein computerlesbares Speichermedium, auf dem ein Pro- gramm gespeichert ist, das es einem Computer ermöglicht, nachdem es in den Speicher des Computers geladen worden ist, ein Verfahren zur Datenauswertung durchzuführen, wobei die Datenauswertung die Verfahrensschritte gemäß einem der Ansprüche 1 bis 12 umfaßt.
Um eine automatische Datenauswertung durchzuführen, wird vorteilhafterweise ein computerlesbares Speichermedium eingesetzt, auf dem ein Programm gespeichert ist, das es einem Computer ermöglicht, nachdem es in den Speicher des Computers geladen worden ist, ein Verfahren zur Datenauswertung durchzuführen, wobei die Datenauswertung die Verfahrensschritte gemäß einem der Ansprüche 1 bis 12 umfaßt.
Eine Methode zur Nutzung eines Systems zur Datenauswertung besteht darin, daß der Zugang zu dem System durch eine gebührenpflichtige PIN ermöglicht wird, wobei die PIN mit Mitteln zur Erfassung von in das System einzugebenden Daten und/oder mit Mitteln zur Erfassung von Material, welches zur Ermittlung der einzugebenden Daten dient, verbunden ist, und der Nutzer die PIN durch Zahlung einer Gebühr erwirbt . In einer bevorzugten Ausführungsform der Erfindung ist vorgesehen, daß die Datenauswertung medizinische Prognosen generiert und die Anfragedaten als klinischpathologische Daten durch einen Arzt und/oder als bio- molekulare Daten durch ein Analyselabor der Datenverarbeitungseinrichtung zugeführt werden. Dabei ist es vorteilhaft, wenn die Anfragedaten und/oder die in der (den) Datenbank (en) gespeicherten Daten krankheitsbezo- gene Faktoren und/oder patientenspezifische Faktoren und/oder umweltspezifische Faktoren berücksichtigen. Insbesondere werden unter den krankheitsbezogene Faktoren auch tumorspezifische Faktoren berücksichtigt.
Darüber hinaus hat es sich als vorteilhaft heraus- gestellt, daß eine Aktualisierung der in der (den) Datenbank (en) gespeicherten Daten Erfahrungsdaten erfolgt, indem Daten über die Therapie und den Krankheitsverlauf zu von der Datenverarbeitungseinrichtung prognostizierten Fällen der Datenverarbeitungseinrich- tung zugeführt werden. Ebenso ist vorgesehen, daß eine Aktualisierung der Bewertungsvorschriften in einem iterativen Lernprozeß erfolgt, in welchem Anfrage, Anfragedaten, bei der Auswertung der Anfrage benutzte, in der (den) Datenbank (en) gespeicherten Daten, Ergebnisse der Auswertung und tatsächlich eingetretene Ereignisse berücksichtigt werden.
Von Vorteil ist es insbesondere, wenn in Abhängigkeit von der Bewertung die Menge der in der (den) Daten- bank(en) gespeicherten Daten reduziert wird und/oder in Abhängigkeit von der Signifikanz die Zahl der zuzuführenden Anfragedaten und/oder die Menge der in der (den) Datenbank (en) gespeicherten Daten reduziert wird. In einer bevorzugten Ausführungsform der Erfindung ist außerdem vorgesehen, daß die Auswertung durch Cluster- Analyse, Ähnlichkeiten-Suche, Tendenz-Analyse, Korres- pondenzanalyse, aufsteigend hierarchische Klassifikation, Hauptanalyse und/oder Wavelet-Analyse in Verbindung mit aus Irrtums-Modellen generierten Probabili- tätswerten und/oder Mitteln der künstlichen Intelligenz wie neuronalen Netzen und/oder regelbasierten Systemen erfolgt.
Darüber hinaus hat es sich als vorteilhaft erwiesen, daß die Datenauswertung die Ermittlung der Eintrittswahrscheinlichkeit von durch die Anfrage und/oder durch die korrespondierenden Daten bezeichneten Ereignissen umfaßt .
Eine Reduktion der zu verarbeitenden Daten kann erreicht werden, indem die Signifikanz von Daten derart ermittelt wird, daß eine Anfrage ein erstes Mal ohne Berücksichtigung dieser Daten und ein zweites Mal unter Berücksichtigung dieser Daten ausgewertet wird, die Bewertungen der Ergebnisse dieser beiden Auswertungen miteinander verglichen und das Maß des Einflusses der Daten relativ zu einer Verbesserung bzw. Verschlechterung der zweiten Bewertung gegenüber ersten Bewertung bestimmt wird und bei einer Verbesserung der zweiten Bewertung gegenüber der ersten Bewertung die Daten als signifikant angesehen und bei künftigen Auswertungen berücksichtigt werden, bei einer Verschlechterung der zweiten Bewertung gegenüber der ersten Bewertung die Daten als nicht signifikant angesehen und für künftige Auswertungen nicht mehr genutzt werden. Durch die Erfindung wird beispielsweise die Verfügbarkeit klinisch relevanten Wissens zu einem spezifischen medizinischen Problem am Arbeitsplatz des Arztes (Onkologen) erheblich verbessert, indem die Zuführung der Daten, die Anfrage und/oder die Ausgabe der Ergebnisse über das Internet erfolgt. Über das (im Internet erreichbare) ComputerSystem erhält er Zugriff auf Daten, die aus verschiedenen Datenbanken stammen, aber z. B. durch den Einsatz des InternetStandards XML (eXtensible Markup Language) auf eine einheitliche Basis gestellt wurden. Für ihn sind die unterschiedlichen Formate und Datenstrukturen nicht mehr zu erkennen. Dadurch wird es möglich, die Akzeptanz und den tatsächlichen Einfluß von Genexpressionsdaten auf die Patientenversorgung nachhaltig zu beeinflussen. Durch diese Vereinheitlichung der Sprache bzw. Formate der Daten werden die organisatorischen Voraussetzungen für einen erfolgreichen Einsatz der Erfindung geschaffen.
Für den effizienten Einsatz der Erfindung ist eine Anordnung vorgesehen, welche folgendes umfasst: mindestens eine mit mindestens einer Datenbank gekoppelte Datenverarbeitungseinrichtung, Mittel zur Datenein- und/oder -ausgäbe, nach vorgebbaren Regeln und/oder mit Verfahren der künstlichen Intelligenz arbeitende Mittel zur Ermittlung von in der (den) Datenbank (en) gespeicherten, mit einer Datenverarbeitungseinrichtung zugeführten Anfragedaten korrespondierenden Daten, Mittel zur automatischen Bewertung der Güte der korrespondierenden Daten,
Mittel zur automatischen Ermittlung der Signifikanz der Anfrage- und/oder korrespondierenden Daten für eine Anfrage . Die Erfindung wird die Schätzung des Metastasierungs- risiko eines individuellen Patienten erlauben, so daß die Indikation einer adjuvanten Chemotherapie gezielter gestellt werden kann. Außerdem wird eine Schätzung der Probabilität der Therapieantwort bei einer Reihe von Che otherapeutika ermöglicht, so daß mit einer entsprechenden Tumorprofilierung auch Tumorresistenzmuster erkannt werden können. Durch die Selektion der molekula- ren Targets (auf DNA, RNA und Proteine-Ebenen) , die mit einem bestimmten klinischen Outcome (z. B. Metastasierung) verbunden sind, wird eine ganz erhebliche Reduzierung der Daten erreicht, die für eine hochwertige Prognose ausgewertet werden müssen. Es werden nur die Outcome-relevanten Moleküle berücksichtigt, was einen entscheidenden Schritt in Richtung Validierung von potentiellen Drug-Targets im humanen Patienten darstellt. Als weiterer Vorteil der Erfindung ist anzusehen, daß das Risiko von erfolglosen teuren Therapie- versuche deutlich gesenkt, die Entwicklungskosten eines Medikamenten reduziert, und damit die Gesundheitskosten verringert werden, da man in der Lage ist, Patientenkollektive zu bestimmen, die für klinische Studien mit einem bestimmten Chemotherapeutikum am besten geeignet sind. Mit Hilfe der Erfindung wird es möglich sein, zu beurteilen, ob eine zusätzliche Therapie zu einer deutlichen Verbesserung der Prognose führt, z. B. verglichen mit dem Pool der Patienten, die mit adjuvanten Therapie behandelt worden sind. Aufgrund dieser spezi- fischen Informationsmuster wird der Arzt in die Lage versetzt, eine individuelle - d. h. eine auf ein spezifisches Krankheitsbild bzw. Krankheitsstadium bezogene - Therapieentscheidung zu treffen. So könnten möglicherweise durch den Einsatz der Erfindung prospektiv randomisierte Studien durch evidenz- basierte Daten mit einem hohen Wert ersetzt werden. Dies wäre ein weiterer Vorteil, denn die Durchführung von zahlreichen randomisierten Studien bei einer zunehmender Zahl von Krebstherapien ist mit erheblichen Kosten und organisatorischen Schwierigkeiten verbunden, die somit eingespart werden könnten.
Die Verwendung eines Verfahrens nach einem der Ansprüche 1 bis 12 erweist sich als vorteilhaft zur - Auswertung von klinischen, pathologischen und/oder molekulargenetischer Daten,
Ermittlung der prognostischen Signifikanz von klini- sehen, pathologischen und/oder molekulargenetischer
Daten,
Selektion molekularer Targets,
Schätzung des individuellen Risikos, wie beispielsweise des Metastasierungsrisikos, einzelner Patien- ten,
Schätzung der Probabilität der Therapieantwort z. B. auf Chemotherapeutika und/oder automatischen Generation von Prognose- und/oder
Therapievorschlägen.
Eine Verbesserung von patientenspezifischen Prognosen kann erwartet werden, indem Daten, Gene, molekulare und/oder genetische Targets genutzt werden, welche durch ein Verfahren nach einem der Ansprüche 1 bis 12, durch eine Anordnung nach einem der Ansprüche 13 oder 14, durch ein Computerprogrammprodukt nach Anspruch 15, durch ein computerlesbares Speichermedium nach Anspruch 16 oder eine Verwendung nach Anspruch 17 verfügbar gemacht werden. Bevorzugt werden deshalb Herstellungsverfahren für diagnostische Anordnungen, welches die Schritte eines Verfahrens nach einem der Ansprüche 1 bis 12 und einen zusätzlichen Schritt umfaßt, in welchem ein diagnostisch effektives Analysewerkzeug, wie z. B. ein RNA- oder Protein-Chip, und/oder eine Kombination von Genen, welche durch ein Verfahren nach einem der Ansprüche 1 bis 12, durch eine Anordnung nach einem der Ansprüche 13 oder 14, durch ein Computerprogrammprodukt nach Anspruch 15, durch ein computerlesbares Speichermedium nach Anspruch 16 oder eine Verwendung nach Anspruch 17 verfügbar gemacht wurden, zusammengestellt wird.
Desgleichen stellt es einen Vorteil dar, Gene oder Kombination von Genen zu verwenden, welche durch ein Verfahren nach einem der Ansprüche 1 bis 12, durch eine Anordnung nach einem der Ansprüche 13 oder 14 , durch ein Computerprogrammprodukt nach Anspruch 15, durch ein computerlesbares Speichermedium nach Anspruch 16 oder eine Verwendung nach Anspruch 17 verfügbar gemacht wurden, für die Vorbereitung einer diagnostischen Zusammenstellung zur Klassifizierung genetisch bedingter Erkrankungen, Tumoren u.a. und/oder zur Vorhersage genetisch bedingter Erkrankungen und/oder zur Assoziierung von molekular-genetischen Parametern mit klinischen Parametern und/oder zur Identifizierung von Tumoren durch Genexpressionsprofile.
Für die Durchführung von Labortests beispielsweise erweist es sich als vorteilhaft, Trägerelemente zu verwenden, auf dem Daten, Gene, molekulare und/oder genetische Targets bereitgestellt werden, welche durch ein Verfahren nach einem der Ansprüche 1 bis 12 , durch eine Anordnung nach einem der Ansprüche 13 oder 14, durch ein Computerprogrammprodukt nach Anspruch 15, durch ein computerlesbares Speichermedium nach Anspruch 16 oder eine Verwendung nach Anspruch 17 verfügbar gemacht werden.
In einer bevorzugten Ausführungsform des Trägerelements ist vorgesehen, daß das Trägerelement als Chip ausgebildet ist und - Daten zum individuellen Risiko, wie z. B. Metasta- sierungspotential, und/oder
- Daten zur Therapieant ort z. B. auf Chemotherapeuti- ka und/oder
- Daten zum Patientenmetabolismus und/oder - Information zur Autoimmunität z. B. " gegen einen Tumor bereitstellt .
Vorzugsweise ist das Trägerelement als reproduzierbarer Chip ausgebildet .
Erkenntnisse aus (Internet-) Management und Qualitätssicherung für e-Health-Systeme zeigen, daß die Zielsetzung, die durch die Erfindung umgesetzt wird, eine problemorientierte Darstellung erfordert, die sich nicht allein an einer streng wissenschaftlichen Gliederung orientiert, wie die Genexpressionsdatenvermitt- lung. Vielmehr ist es notwendig - und die Erfindung erfüllt diese Forderung -, mit Hilfe eines gut struktu- rierten Aufbaus, der Darstellung von größeren Zusammenhängen und dem Aufzeigen von Methoden und Techniken eine Grundlage zu schaffen, die es dem Arzt (Onkologen) ermöglicht, neben einer individuellen Therapieentschei- düng außerdem eigene praktische Lösungsansätze auf Basis des vermittelten Wissens bilden zu können.
Für die kommerzielle Nutzung der Erfindung erweist es sich als vorteilhaft, wenn der Nutzer die PIN zusammen mit dem (den) Mittel (n) zur Erfassung der Daten und/ oder des Materials beim Kauf dieses (dieser) Mittel (s) erwirbt .
Eine weitere Möglichkeit der Nutzung des Systems zur Datenauswertung besteht darin, daß ein Vertreiber des Systems zur Datenauswertung mit mindestens einem Kunden Nutzungsvereinbarungen schließt und der (die) Kunde (n) das System für weitere Teilnehmer durch Vergabe gebüh- renbehafteter PINs nutzbar macht (machen) .
Insbesondere ist vorgesehen, daß Referenzlabors, Phar- maunternehmen und/oder Content Provider das System zur Datenauswertung als Kunde nutzen.
In einer bevorzugten Variante der kommerziellen Nutzung ist vorgesehen, daß die Gebühren für die Nutzung des Systems zur Datenauswertung über den Kunden erhoben werden und - pro Nutzungsfall und/oder prozentual zum Umsatz, den der Kunde mit dem System macht und/oder - pro vergebener PIN festgelegt werden.
Eine weitere Form der kommerziellen Nutzung besteht darin, daß ein Nutzer des Systems zur Datenauswertung die PIN vom Vertreiber des Systems oder von einem Kunden des Betreibers erwirbt . Als vorteilhaft erweist es sich, wenn ein Mittel zur Erfassung von Material ein Träger-Chip für die bei einem - erforderlichenfalls reproduzierbaren - Labortest benötigten Proben, wie z. B. ein DNA-Mikroarray, ist.
Hinsichtlich des Datenschutzes erweist es sich als vorteilhaft, wenn eine PIN mit vorgebbaren, in dem System gespeicherten Daten verknüpft ist und die PIN nur Zugang zu diesen mit ihr verknüpften Daten ermöglicht.
Ein weiterer Vorteil besteht in der Verwendung eines Systems zur Datenauswertung nach einem der Ansprüche 1 bis 32 zur Durchführung von Profit- oder Non-Profit- Aktionen durch Ärzte, Patienten und/oder das System betreibende Firmen, wobei eine Aktion durch Teilnehmer und/oder Anbieter des Systems gestartet wird. Solche Aktionen könne etwa den Austausch von Informationen und/oder das Einbringen von Kunden- und/oder Patienten- gruppen beinhalten. Insbesondere ist eine solche Verwendung des Systems zur Datenauswertung sinnvoll, wenn die Aktionen die Schaffung, Unterhaltung und/oder Vermarktung eines Exzellenz-Netzwerkes und/oder die Distribution von Therapien und/oder die Selektion von Patientengruppen für klinische Studien umfassen. Damit kann beispielsweise bei Verwendung des Systems im Internet erreicht werden, daß die Besuchertreue für die entsprechenden Web-Pages gefestigt und/oder ein bestimmter Kundenstamm an das System gebunden wird.
Die Erfindung soll nachstehend anhand von zumindest teilweise in den Figuren dargestellten Ausführungsbei- spielen näher erläutert werden. Es zeigen:
Fig. la Schematische Darstellung der Verfahrensschritte bei herkömmlicher Datenauswertung, Fig. lb Schematische Darstellung der Verfahrens- schritte bei Datenauswertung gemäß der Erfindung, Fig. 2a-d Darstellung des modularen Aufbaus eines medizinischen Informationssystems, Fig. 3a-f detaillierte Darstellung des modularen Auf- baus eines medizinischen Informationssystems,
Fig. 4 Darstellung der beobachteten Überlebenszeiten verschiedener Patientengruppen und Abschätzung nach Kaplan-Meier der Anzahl der Patienten mit fünf Jahren Überlebenszeit, 4a Gruppe aller Patienten im UICC-Stadium-III ,
4b Patienten der Gruppe aus 4a, welche ein zusätzliches Merkmal aufweisen (Gruppe 1) , dargestellt im Vergleich zu den Patienten ohne dieses Merkmal (Gruppe 0) , Fig. 5 Klassifizierung von Patienten innerhalb der drei verschiedenen UICC-Stadien in jeweils zwei Untergruppen von Patienten mit hohem Risiko (high-risk) , bzw. geringem Risiko (low risk) , 5a UICC-Stadium I, 5b UICC-Stadium II, 5c UICC-Stadium III, Fig. 6 ROC-Kurve (ROC = Receiver Operating Charac- teristic) für eine Voraussage unter Berück- siehtigung herkömmlicher Informationen bzw. mit Einbeziehung von zusätzlichen, durch die Datenauswertung nach dem erfindungsgemäßen Verfahren gewonnenen Informationen. Am Beispiel eines medizinischen Informationssystems für Onkologen, in welchem ein internetbasiertes patientenspezifisches Prognosesystem realisiert wurde, soll Einsatz und Wirkungsweise der Erfindung beschrieben werden.
Das beispielhafte System ist ein internet-basiertes medizinisches Informationssystem, das sich aus Datenbanken, einem Datenreduktionsprogramm und Modulen der künstlichen Intelligenz (neuronales Netzwerk oder regelbasiertes System) zusammensetzt. Es erlaubt die Integration von klinischen, pathologischen und biologischen Daten, und deren Verknüpfung mit relevanten Prognoseaussagen für einen bestimmten Patienten. Damit erlaubt dieses Informationssystem dem Onkologen, aufgrund spezifischer Informationsmuster eine individuelle Therapieentscheidung zu treffen. Die Therapieentscheidungen werden mit Probabilitätsrechnungen unterstützt. Als Prototyp wurde das kolorektale Karzinom ge- wählt. Das beispielhafte medizinische Informationssystem integriert Daten aus der Transkriptom- und Proteom-Forschung.
Die Anwendung des beispielhaften Informationssystems wird im folgenden beschrieben. Ein Patient wird beim Arzt vorstellig und erkundigt sich nach Therapiemöglichkeiten für seine Krebserkrankung. Nach der Operation schickt der Onkologe die Proben gegen Rechnung an ein Referenzlabor, wo mit beliebigen Laborverfahren wie beispielsweise einem Chip ein oder mehrere Labortests vorgenommen werden, um die notwendigen Genexpressions- analysen durchzuführen. Mit Einsendung der Proben erhält der Onkologe eine PIN-Nummer, dank der er alle relevanten Daten des Patienten (patientenspezifisch, umweltspezifisch etc.) in anonymisierter Form in die Datenbank des erfindungsgemäßen Computersystems eintragen kann. Unterdessen trägt das Referenzlabor ebenfalls alle mit der PIN versehenen Tumordaten in diese Daten- bank ein. Zu Beginn der Nutzung umfaßt ein Datensatz alle Prognosefaktoren als Variablen, die von der Medizin für die Prognose bei kolorektale Karzinom akzeptiert werden. Dank der PIN-Num er kann die Korrespondenz der molekularen und klinischen Informationen er- kannt werden. Diese kombinierten Informationen werden mit der Datenbank verglichen, und die Patienten mit dem nächstliegenden Informationsmuster und deren Krankheitsverlauf wird herausgesucht. Es wird dabei ein rückwirkendes Fehlerminimierungsverfahren angewendet . Der Arzt (Chirurg oder Onkologe) kann anschließend mit der PIN beim Informationssystem verschiedene Voraussagen anfragen. Innerhalb von Minuten erhält dieser dann Angaben zu Metastasierungswahrscheinlichkeit, Resistenzprofile zu verschiedenen Chemotherapeutika, möglicherweise zu Immuntherapeutika oder ähnlichem. Die so gewonnenen Erkenntnisse bilden damit eine wichtige Entscheidungshilfe bei der Therapieentscheidung. Es ist heute nicht vorgesehen, daß Patienten direkten Zugriff auf die Webseite erhalten, die den Zugang zu dem erfin- dungsgemäßen Computersystem gestattet, jedoch wird diese Möglichkeit für die Zukunft offen gehalten. Später wird der Arzt von der Datenbank regelmäßig über Therapie und Verlauf seines Patienten befragt, diese Daten werden zum iterativen Lernprozeß des Systems gebraucht, so daß sich dieses laufend dem medizinischen Fortschritt anpassen kann. Dadurch werden signifikante und unwesentliche Variablen ermittelt, was zu einer Optimierung der auszuwertenden Datenmenge und zur Verbesserung der Prognose führt. Beispielhaft erfolgt die- se Unterscheidung zwischen signifikanten und unwesentlichen Variablen dadurch, daß das Informations-System die Genauigkeit der Prognose unter Berücksichtigung der neuen Variablen prüft . Wenn sich diese Genauigkeit ver- bessert, wird die neue Variable als signifikant berücksichtigt. In den anderen Fällen wird sie als unwesentlich eingestuft und verworfen.
Zum Verständnis der Herkunft und Verknüpfung von Daten muß verdeutlicht werden, daß die heute verfügbaren sig- nifikantesten Daten aus der Klinik, der Pathologie, und der gegebenenfalls schon erfolgten Behandlung es erlauben, eine prognostische Aussage zu treffen. Diese Prognostik wurde im beispielhaften Informationssystem für das kolorektale Karzinom durch moderne Bio-Informatik optimiert. Dieses System hat eine prognostische Leistung erreicht, die bei Hunderten von Patienten durch Kreuzvalidierung genau bestimmt werden konnte. Die Einbeziehung von neuen (molekularbiologischen) Daten erlaubt es, das System erneut zu „trainieren". Wenn die prognostische Leistung steigt, werden die neuen Daten als prognostisch Signifikant bewertet und für weitere Analysen erfordert. Falls das System mit diesem Set neuer Daten nicht besser wird, werden diese Daten ausgeschieden. So können biologische Daten äußerst effizient ausgewählt werden. Mit Data-Mining-Systemne z. B. stehen Auswahl-Verfahren zur Verfügung, welche dies ermöglichen.
In Figur la bzw. lb wird der erfindungsgemäßen Daten- auswertung das herkömmliche Verfahren gegenübergestellt. Während bei einem herkömmlichen Verfahren (vgl. Fig. la) die Input-Variablen 1 sofort in einem Modul 2 zur Berechnung der Korrelation und anschließend in einem Modul 3 zur multivarianten statistischen Analyse (bspw. Regressions-Analyse) verarbeitet werden, wird bei dem erfindungsgemäßen Verfahren (vgl. Fig. lb) nach dem Einlesen der Input-Variablen 1 ein Transformationsschritt 5 durchgeführt. Der Transformationsschritt 5 ist ein wichtiger Schritt des erfindungsgemäßen Verfahrens und dient dazu Nicht-Linearität des Verfahrens zu vermeiden, um den Rechenaufwand klein zu halten. Hierin werden die symbolischen Variablen in geeigneter Form konvertiert. In der anschließenden Feature-Auswahl (Feature-Selection) 6 werden nacheinander die Variablen mit dem höchsten Informationsgehalt ermittelt. Dies wird solange durchgeführt, bis jeder Variable die entsprechende Gewichtung zugeordnet wurde. Als nächster Schritt folgt das Training und die Auswahl des Modells 7. Dieser Verfahrensschritt beinhaltet das Trainieren diverser Modelle mit verschiedenen Input-Variablen und einer Anzahl verborgener Neuronen, die etwa gemäß dem Bayesschen Evidenz-Ansatz berechnet wurden. Das so ermittelte beste Modell 8 kann nun die Prognosen für neue Patienten berechnen, das heißt für neue Eingabedaten einen Ausgabewert bestimmen. Die Modellarchitektur 8 kann immer weiter verbessert und angepaßt werden (das Modell "lernt") . Die Resultate 4b, die bei Verwendung des erfindungsgemäßen Verfahrens erzielt werden, zeichnen sich gegenüber den durch das herkömmliche Verfahren erreichbaren Resultaten 4a durch eine höhere Prognosequalität aus, was vor allem durch die Erstellung patientenspezifischer, individueller Risiko-Profile erreicht wird.
Es stellt somit einen erheblichen Vorteil des erfindungsgemäßen Verfahrens zur Datenauswertung besteht dar, daß patientenspezifische, individuelle Risiko-Profile erstellt werden können, indem neben den klinisch- pathologischen Daten - wie erwähnt - zusätzlich neue molekularbiologische Daten berücksichtigt werden. Wie die Figuren 4a und 4b deutlich zeigen, ermöglicht das Verfahren durch den Einsatz eines Data-Mining-Systems, solche Daten bzw. Merkmale - sog. Klassifizierer -, insbesondere molekularbiologische, nicht in den Datensätzen der klinischen Daten enthaltene Merkmale, zu ermitteln, die zu einer Differenzierung der Risikogruppen innerhalb der UICC-Gruppen führen. Bei Berücksichtigung eines so ermittelten Merkmals/ Klassifizierers, d.h. nach entsprechendem Training des Systems, können Prognosen für diese beiden Unter- Gruppen sehr viel genauer erfolgen. Hier im Beispiel der Fig. 4b ist die Abweichung für die Vorhersage einer Fünf-Jahre-Überlebenszeit für die Patientengruppe ohne dieses Merkmal um 25% nach oben gegenüber der gesamten Gruppe, für die Gruppe der Patienten, welche das Merkmal aufweisen, weicht die Prognose für die Fünf-Jahre- Überlebenszeit um 8% gegenüber der gesamten Gruppe nach unten ab. Eine Prognose wird also bei Verwendung der erfindungsgemäßen Datenauswertung durch die automatische Ermittlung von signifikanten Merkmalen wesentlich präziser.
Figuren 5 und 6 veranschaulichen detailliert durch verschiedene graphische Darstellungen, wie die Prognosequalität signifikant verbessert werden kann, wenn der Prognose zusätzliche Daten zugrundegelegt werden, die mit Hilfe des Data-Mining Systems der Erfindung ermit- telt wurden.
Eine weitere genauere Klassifizierung kann erforderlichenfalls innerhalb der UICC-Klassen durchgeführt werden, wenn man Feature-Selection 6 und Trainieren 7 des neuronalen Netzes nur auf eine UICC-Klasse allein anwendet. Die Figuren 5a-c zeigen die Ergebnisse bei der Anwendung auf Patienten des UICC-Stadiums I (Fig. 5a) , auf Patienten des UICC-Stadiums II (Fig. 5b) und auf Patienten des UICC-Stadiums III (Fig. 5c) . In allen Fällen wird deutlich, daß die Anwendung der erfindungsgemäßen Datenauswertung auf spezielle Patienten-Gruppen eine weitere signifikante Klassifizierung erlaubt.
ROC-Kurven veranschaulichen die Güte einer Voraussage. Dabei wird auf der Ordinate die ' Sensitivität ' (d.h. das Verhältnis der korrekten Voraussagen über den Eintritt eines Ereignisses zur Gesamtzahl der positiven Testergebnisse) aufgetragen gegen das Komplement der Spezifität (das ist der Anteil von gesunden Personen mit negativem Testergebnis unter allen Personen mit negativem Testergebnis) . Die Güte der Prognose wird durch die Fläche unter der Kurve angegeben. Angewendet auf die Vorhersage einer 5-Jahres-Überlebenszeit unter alleiniger Verwendung von prä-operativen (ausschließlich klinisch-pathologischen) Daten 9 und auf Prognosen unter Verwendung von sowohl prä- als auch zusätzlichen, durch die erfindungsgemäße Datenauswertung ermittelten, Daten 10 (insbesondere stellten sich hier post-operati- ven Daten als wichtig heraus) wird durch Figur 6 deutlich gemacht, daß die Berücksichtigung dieser zusätzlichen Daten die Güte der Prognose ganz erheblich verbessert . Von besonderer Bedeutung ist hierbei, daß durch die Erfindung nur solche Daten in die Auswertung einbezogen werden, welche die Vorhersagequalität tatsächlich verbessern (durch die Feature-Selection ausgewählte Merkmale) . Damit wird die riesige Menge von molekularbio- logischen Daten, die heute bereits zur Verfügung stehen, überhaupt erst behandelbar.
Im Gegensatz zu klinischen Versuchen, gibt es keine Standards für Prognosefaktor-Studien. Fast alle Prognosefaktor-Studien haben leider eher einen erklärenden als einen beweisenden Charakter. Es ist daher wichtig für klinische Forscher, Standards für die Beweise für einen Prognosefaktor zu definieren, bevor er in der Praxis angewendet wird. Folgende Richtlinien sollten gelten und liegen dem erfinderischen System zugrunde: die Reproduzierbarkeit der Untersuchung im eigenen und in anderen Laboren,
Untersuchung ungeachtet des Ergebnisses (assay blinded to outcome) , es sollten von weniger als 15% der Patienten Daten fehlen, einheitliche Behandlung, Hypothese im voraus, - genügend Patienten (> 10 pro Ereignis) , durch neue Faktoren wird das derzeitige Wissen durch Vorhersagen ergänzt, angepaßte Analysen für die verschiedenen Hypothesen, Studienabgrenzungen müssen vorher spezifiziert werden.
Diese Richtlinien sind nicht nur für Studien sondern auch für den Erfolg eines Prognosefaktors von Bedeutung. Sie wurden in dem erfinderischen System berück- sichtigt . Die Anerkennung eines neuen Faktors kann nur erfolgreich sein, wenn mindestens eine belegende Studie vorliegt und wenn die Untersuchungen in mehreren Kliniken reproduzierbar sind. Der Prognosewert sollte über bisherige Standard-Prognosefaktoren hinaus gehen, und er muß Auswirkungen auf die Therapie haben.
Um eine Prognose zu bestimmen, sollte man von drei Prognosefaktoren ausgehen.
Tumorbezogene Faktoren: charakterisieren die Krankheit,
- patientenspezifische Faktoren: beziehen sich auf den Patienten, - umweltspezifische Faktoren, die sich weder direkt auf den Patienten noch auf den Tumor beziehen.
Dabei sollten vorteilhafterweise die folgenden Punkte berücksichtigt werden, wobei diese erforderlichenfalls gemäß neuen Erkenntnissen ergänzt werden können.
Tumorspezifische Faktoren
Diese Faktoren sind eigentlich immer die Determinanten, die bestimmenden Faktoren für das Ergebnis in Krebspatienten. Die wichtigsten tumorspezifischen Faktoren beziehen sich auf histologische Angaben (Typ, Merkmale) und die anatomische Ausbreitung der Krankheit .
- Pathologie des Tumors
Die Tumorpathologie ist entscheidend für die Prognose bei Krebs . Der histologische Typ de iniert zwar die Krankheit, aber andere Faktoren, wie z. B. das Stadium oder der Befall von Lymphknoten beein- flussen das Ergebnis .
- Ausbreitung der Krankheit
Die anatomische Ausbreitung des Tumors wird gewöhnlich nach den Kriterien der TNM-Klassifikation zu Größe, Infiltration des Primärtumors, vorhandenen Lymphknotenmetastasen und Fernmetastasen beschrieben.
- Tumorbiologie
Bisher wurden krebsspezifische Proteine lediglich als Tumormarker verwendet, um die Tumorbelastung wiederzuspiegeln, ohne jedoch das Tumorverhalten j. genau charakterisieren zu können. Jüngere Ergebnisse in der Tumorbiologie haben die prognostische Rolle von tumorspezifischen Proteinen wieder in den Vordergrund rücken lassen. Als Genprodukte können sie u. a. Ursachen und Suppression von Krebs, die normale und anormale Kontrolle des Zellzyklus und Meta- stasierung und Angiogenese des Tumors bestimmen. Neue Technologien in der molekularen Diagnostik machen es heute möglich, genetische Information bezogen auf minimale Tumorbelastung, aggressives Tumorzellwachstum und Tumorzellreaktion infolge von Veränderungen der DNA oder Immuntherapien zu bestimmen.
Tumorspezifische Symptome
Obwohl sie auch als patientenspezifisch angesehen werden können, ist die eigentliche Ursache für
Symptome in der Onkologie der invasive Charakter des
Tumors . In der Tat sind Symptome bei den meisten
Krebspatienten ein sehr wichtiger Prognosefaktor.
Klassische Beispiele für die Wirkung von Symptomen sind die B-Symptome (Nachtschweiß, Fieber und
Gewichtsverlust .
Patientenspezifische Faktoren Dies sind im Patienten vorhandene Faktoren, die entweder indirekt oder gar nicht maligne sind, die jedoch durch eine Interferenz mit dem Tumorverhalten oder ihre Reaktion auf die Behandlung einen großen Einfluß auf das Ergebnis haben können. Hier unterscheidet man zwischen demografischen Faktoren, Ko- morbidität und zugleich existierenden Krankheiten.
Demografische Faktoren Diese Faktoren, die sich auf das onkologische Ergebnis auswirken, sind Alter, Geschlecht und ethnische Zugehörigkeit. Keiner dieser Faktoren kann durch einen Eingriff bzw. eine Behandlung beeinflußt werden, aber viele beeinflussen unabhängig voneinander das Ergebnis anderer Faktoren. Beispielsweise haben ältere Patienten eine niedrigere Überlebenszeit bei der Hodgkin' sehen Krankheit oder bei Lymphomen. Die Rolle des Geschlechts ist weitaus weniger genau definiert, aber bei Hodgkin Erkrankungen oder bösar- tigen Malignomas waren die Ergebnisse bei Männern schlechter als bei Frauen.
Komorbidität
Diese Faktoren können vererbte genetische Krank- heiten, wie z. B. Neurofibromatose sein, die ein Risikofaktor für neurogene Sarkomas und einen prognostischen Faktor für Krebsergebnisse darstellen.
Performance Status Der Performance Status ist eine starker prognostischer Faktor für viele Krebsarten, besonders bei denen im fortgeschrittenen Status wie z. B. Lungen- und Blasenkrebs, die eine Chemotherapie erfordern. Als Folge des Alters oder der Komorbidität sollte dieser Faktor als patientenspezifischer Faktor angesehen werden.
- Übereinstimmung Übereinstimmung mit einer vorgeschlagenen Krebsvorsorgeuntersuchung oder Behandlungsplan kann das Überleben eines Patienten oder einer Gruppe von Patienten beeinflussen. Fehlende Übereinstimmung mit Krebsvorsorgeempfehlungen bei Brustkrebs kann zu einer verspäteten Diagnose, einem weiter fortgeschrittenen Stadium bei der Diagnose und schlechterem Überleben führen.
Umweltspezifische Faktoren Obwohl die umweltspezifischen Faktoren weniger untersucht wurden und oft nicht in die Diskussionen einbezogen werden, haben sie einen Einfluß auf das Ergebnis für einen einzelnen oder eine ganze Gruppe von Patienten.
Mediziner
Der Behandlungsplan hat eine tiefgreifende Wirkung auf das Ergebnis . Unangemessene Eingriffe können in exzessiver Toxizität und eingeschränkter Lebens- qualität enden. Fehlgeschlagene Kontrolle des Krebses kann auch den Tod für den Patienten bedeuten. Die Expertise des behandelnden Arztes ist ein weiterer prognostischer Faktor, da sie ebenfalls das Ergebnis im Krebspatienten beeinflußt . Es gibt zu- nehmende Beweise dafür, daß Kliniken, die keine bestimmte Anzahl („critical mass") an Patienten behandelt, auch keine optimalen Behandlungsergebnisse erreichen. Gesundheitswesen
Hier gibt es große Divergenzen zwischen einzelnen Bevölkerungsgruppen. Mehrere Studien haben belegt, daß z. B. ältere Menschen (75 Jahre und älter) oder Patienten aus anderen ethnischen Gruppen nicht die gleiche Behandlung bekommen wie z. B. jüngere oder einheimische Patienten und somit ihr Behandlungs- ergebnis beeinflußt wird.
- Gesellschaft
Studien des Office of National Statistics (GB) haben gezeigt, daß das Überleben bei einer Krebserkrankung abhängig ist vom sozial-wirtschaftlichen Stand der Patienten. Ein weiterer Faktor für eine schlechtere Prognose ist die Ernährung.
Für die Genexpressionsprofilierung auf RNA- und Protein-Ebene werden purifizierte Proben und klinische Daten von kolorektalen Patienten, von denen die er- forderlichen Angaben zur Verfügung stehen, analysiert und daraus die Transkriptom- und Proteom-Profile bestimmt. Hierzu steht eine Vielzahl von tiefgekühlten Proben von verschiedenen kolorektalen Patienten aus verschiedenen Institutionen zu Verfügung.
Diese Proben wurden speziell für diesen Zweck entnommen, und sind charakterisiert durch eine ausgezeichnete Qualität und Reproduzierbarkeit. Der Anteil an Epithelzellen variiert erheblich zwischen verschie- denen Präparaten (Reymond et al, Electrophoresis 1997a) . Für die Probenvorbereitung wurde eine Methode entwickelt, die es erlaubt, reine Epithelzellen in genügender Menge (über 108 Zellen) aus chirurgischen Präparaten vorzubereiten (diese Methode ist z. B. beschrieben in UK Patent Application GB 9705949.7). Aus diesen Proben konnten sowohl Proteine, als auch RNA vorbereitet werden, die qualitativ mit Produkten aus Zellinien verglichen werden können.
Die nach dieser Methode vorbereiteten Proben können verglichen werden, auch wenn sie aus verschiedenen Institutionen kommen. Damit ist eine Grundbedingung erfüllt, um später die prädiktiven Aussagen des hier beispielhaft beschriebenen Systems in verschiedenen Institutionen zu vergleichen. Damit können in der Zukunft die großen Probendurchsatzzahlen erreicht werden, die zur Validierung der Genexpressionsforschung notwendig sind. Bis heute wurden mehrere Tausend Proben von Patienten, z. T. mit Stuhl, Blut und Knochenmark- punktion, gewonnen. Der theoretische Input des klinischen Netzwerkes, in dem das beispielhafte Informationssystem integriert ist, beträgt mehrere tausend neue kolorektale Karzinome pro Jahr.
Diese Proben sind mit klinisch-pathologischen Daten verbunden, die an die Anforderungen des beispielhaften medizinischen Informationssystems angepaßt sind, d. h. daß alle Parameter (Variablen) in jeder Institution gesammelt worden sind. Das (gemeinsame) Follow-up Schema entspricht den deutschen Richtlinien.
Die persönlichen Patientendaten werden in den teilnehmenden Institutionen behalten, die das Follow-up der Patienten sichern. Nur anonymisierte Daten werden an das Informationssystem weitergegeben.
Zur Durchführung einer qualitativ hochwertigen Genexpressionsanalyse steht inzwischen vielfältige Technik zur Verfügung, mit der man in der Lage ist, das Expressionsniveau jedes bekannten Gens auf Transkriptom- und Proteomebene zu analysieren. Ein KomplettSystem für derartige Analysen umfaßt beispielsweise die folgenden Komponenten:
Transkriptom-Analyse - Die DNA-Chips (DNA-Mikroarrays) : Man unterscheidet grundsätzlich die cDNA-Chips von den Oligo-Chips. Bei cDNA-Chips werden ca. 300 - 400 bp lange PCR Produkte auf die Chips aufgebracht . Man ist derzeit in der Lage ca. 14.000 cDNAs auf ein Array zu spotten.
Bei den Oligo-Chips werden ca. 60 bp lange Oligo- nukleotide auf der Chip-Oberfläche synthetisiert. Man produziert Arrays mit 8.400 Features, auf Wunsch auch als Doppelarray (16.800 Spots). Gerade im Be- reich der DNA-Chips werden Neuentwicklungen in sehr kurzer Zeit zu immer dichteren Arrays (höhere Spot- anzahl) mit einer sehr großen Flexibilität bei der Sequenzauswahl führen.
- Der Mikroarray-Scanner : Neuentwicklungen auf dem Gebiet der Mikroarray-Scanner sind in der Lage gleichzeitig 2 Fluoreszenzwellenlängen zu analysieren. Bei einer Auflösung von 5 oder 10 μm (vom Benutzer einstellbar) benötigt der Scanner ca. 8 min für das scannen eines Chips. Ein 48 Chips fassendes Karussell erlaubt die Benutzung dieses Systems in der Hochdurchsatz-Analyse .
Der Bioanalyzer: Der Bioanalyzer ist ein Lab-on-a- Chip-System, das zur Qualitätskontrolle vor allem bei der RNA-Aufreinigung dient. Mit Hilfe des Bio- analyzers wird die vom Experimentator aufgereinigte RNA maschinell qualitativ und quantitativ analysiert . Proteom-Analyse
Mit Proteom-Techniken kann die qualitative und quantitative Expression von Proteinen in verschiedenen Krankheitsstadien bestimmt werden. Da bekannterweise post-translationelle Proteinänderungen eine wichtige Rolle im klinischen Verhalten kranker Zellen, Gewebe und/oder Organe bedeuten, haben diese Unterschiede in der Proteinexpression einen wichtigen Einfluß in der Anwendung des beispielhaft beschriebenen Informations- Systems.
Als Proteom-Techniken im menschlichen kolorektalen Karzinom können z. B. ein- (SDS-PAGE) oder zweidimen- sionale Gel-Elektrophorese (2D PAGE) , N-terminale Sequenzierung und Massenspektrometrie (MALDI-TOF und MS-MS) sowie Chips, auf denen Antikörper-, Ligand- oder verschiedene Oberflächen zur Bindung von Proteinen angewendet werden, dienen.
Als beispielhafte Technologie für Arbeiten auf dem Gebiet der Proteom-Forschung bietet sich eine Kombination der beiden Schlüsseltechnologien 2-D-Gelelektrophorese und Massenspektrometrie an. Die Proteine werden mittels der 2-D-Gelelektrophorese aufgetrennt und anschließend gefärbt. Die Protein-Spots werden ausgeschnitten, enzymatisch verdaut und das entstehende Peptidgemisch massenspektrometrisch untersucht. Über einen Datenbankabgleich der resultierenden Peptide Mass Fingerprints erfolgt die Proteinidentifizierung. Die Massenspektrometrieplattform setzt sich in diesem Falle aus einer automatischen Probenvorbereitungs- station, einem High-Performance MALDI-Massenspektrome- ter (Matrix-Assisted Laser Desorption/lonization Time of Flight) und einer Datenstation zur automatischen Durchführung der Datenbanksuche zusammen. Das MALDI-MS verfügt über eine hohe Sensitivität und hohe Massengenauigkeit; beides sind Grundvoraussetzungen für eine erfolgreiche Proteinidentifizierung. Zusätzlich können mittels der PSD-Technik (Post Sorce Decay) Sequenzinformationen der Peptide ermittelt werden. Um einen leichteren Zugang zu Sequenzinformationen zu bekommen und gezielt posttranslationale Modifikationen bestimmen zu können, ist der Einsatz eines Elektro- spray-Massenspektrometers hilfreich. Durch den Einsatz eines automatischen Spotpickers und eines Digesters kann eine weitere Automatisierung erreicht werden.
Eine weitere wichtige Aufgabe, die bei der Entwicklung des erfindungsgemäßen medizinischen Informationssystems gelöst werden mußte, ist die Übersetzung der verschiedenen Informations-Plattformen (Transkriptom- und/oder Proteomdaten) in eine gemeinsame Sprache .
Um dieses Konvertierungsproblem zu lösen, wurde für das beispielhafte onkologische Informationssystem ein Bioinformatik-Konzept entwickelt, daß es erlaubt, Daten aus der Klinik, aus der Pathologie, aus DNA-Databasen (wie z. B. CGAP) , aus cDNA-Arrays (wie z. B. Agilent Chips) und aus 2D PAGE zu integrieren und zu analysieren. Die verschiedenen Informationen aus der Klinik, der Pathologie, der Transkriptom- und der Proteom- Forschung werden in die Web-basierte (*.xml) bioinfor- matische Sprache GEML (Gene Expression Markup Language) übersetzt (s. http://www.geml.org).
Damit wurden die Voraussetzungen für ein echtes "Bridging" der verschiedenen Informationsbasen geschaffen. Dieses „Bridging" ist als eine unabdingbare Vor- aussetzung für die Umsetzung der experimentellen Ergebnisse der Gen-Expression in eine klinisch sinnvolle Information zu betrachten.
Nachdem nun die Daten aus Klinik und Labor in das *.xml Format übersetzt wurden, kann man auf eine (vereinheitlichte) Datenbank zugreifen, die etwa 104 Informationen enthält. Diese etwa 104 Informationen, die jetzt für jeden Patienten zur Verfügung stehen, können keinesfalls dem Onkologen direkt vermittelt werden. Aus diesem Grunde muß in das erfindungsgemäße Informationssystem eine Software integriert sein, die eine Auswertung dieser Fülle an Information unterstützt.
Als Komponente des beispielhaften onkologischen Informationssystems findet Verfahren zur Datenreduktion Verwendung. Dabei mußte verfügbare Datenreduktions-Soft- ware an die speziellen Anforderungen der onkologischen Auswertungen angepaßt werden. Die etwa 104 Informatio- nen pro Patient werden durch den Einsatz dieser Software auf 102 reduziert.
Die vom Scanner erzeugten digitalisierten Proteom- oder Transcriptom-Bilder werden in einem kompatiblen Analyseprogramm verarbeitet. Dieses Programm ist in der Lage die Genexpressionsdaten auszuwerten und zu speichern. Das Programm protokolliert jedes Genexpressions- muster und erlaubt Vergleiche verschiedener Experimente. Hierzu sind i. a. Datenbankabfragen in externen sowie internen Datenbanken notwendig. Das Programm generiert technologie-spezifische Irrtum-Modelle. Die aus den Irrtum-Modellen generierten Probabilitätswerte jeder Messung werden über die gesamte Analyse-Umgebung propagiert, was einen höheren prädikativen Wert bei Cluster-Analysen, Ähnlichkeiten-Suchen und Tendenz- Analysen ermöglicht. Durch besondere informationstechnische Werkzeuge ermöglicht das Programm, Analysen über Exons, Sequenzen, Cluster Intensität- und Verhält- nisrechnungen durchzuführen. Clustering-Analysen beinhalten beispielweise agglomerative, Teilungs-, Mittelwerte und Medianwerte-Algorithmen. Ein beispielhaftes informationstechnisches Verfahren erlaubt es, ähnliche Muster mit dem Muster von Interesse innerhalb aller Datensets der Datenbank zu recherchieren. Auch Zeit- Sequenzen, beispielhaft in einer iterativen Nachsorgemessung, können über eine Zeitlinie dargestellt werden, wodurch spezifische Verhalten identifiziert werden können. Besondere Suchmaschinen erlauben eine rasche Datenbankanfrage, und können an eine interne Datenbank angepaßt werden. Auch Hypertext-Links können formuliert werden, so daß Verbindungen mit internen oder externen Datenbanken hergestellt werden können.
Durch dieses Vorgehen wird erreicht, daß nur die biologischen Daten, die für eine bestimmte klinische Beobachtung ein signifikantes Verhalten zeigen, berücksichtigt und für die Auswertung übernommen werden. Dadurch wird gegenüber herkömmlichen medizi- nischen Informationssystemen eine erhebliche Datenreduktion erreicht .
Die Bioinformatik wird weiterhin dadurch unterstützt, daß klinische Outcomes (wie die Metastasierungs- fähigkeit oder die Therapie-Resistenz eines bestimmten Tumors) nach Berücksichtigung der klinisch-pathologischen Daten direkt mit Datenmustern verbunden werden können. Diese Interpretation kann z. B. durch künstliche Intelligenz und/oder maschinelle Lernverfahren vereinfacht werden. Herkömmliche Computerprogramme umfassen eine Menge von expliziten Anweisungen, die dem Programm genau sagen, was und wie es eine Berechnung auszuführen hat. Systeme der künstlichen Intelligenz (Kl-Systeme) arbeiten unter vollkommen anderen Voraussetzungen: dem Programm werden eher Kenntnisse vermittelt, als daß ihm exakte Anweisungen für die Abarbeitung gegeben werden. Dies passiert während der Trainingsphase des KI-Systems. Indem das KI-System wieder- holt auf historische Daten angewandt wird und die Ergebnisse dieser Auswertungen ("Schlußfolgerungen") mit den tatsächlich vorliegenden Fakten verglichen werden, lernt es im Verlaufe dieses Trainings das Verhalten, das von dem "fertig ausgebildeten" System gefordert wird.
Der Korrespondenzanalyseansatz und die aufsteigend hierarchische Klassifikation, die bei dem erfindungsgemäßen Informationssystem angewendet werden, weichen signifikant von dem eher klassischen Ansatz der Diskriminanzanalyse mittels Hauptkomponentenanalyse ab. Beginnend mit einer Reihe von Experimenten, wobei jedes Experiment eine große Anzahl an Datenpunkten aufweist, liefert die Korrespondenzanalyse für die Repräsentation der Proben einen faktorisierten Raum von reduzierter Größe. Die ansteigende hierarchische Klassifikation sortiert die Bilder in aussagefähige Gruppen. Die simultane Darstellung sowohl der Spots als auch der Chip- oder Gel-Bilder findet in dem selben faktori- sierten Raum statt. Die charakteristischen Gen- oder Protein-Vertreter einer bestimmten Klasse von Gelen (z. B. Krebsmetastasen-Proben) werden präzise markiert, was die Analyse erheblich vereinfacht. Dementsprechend kann die Software automatisch Protein- oder Gen-Muster klassifizieren, wobei dafür den jeweiligen Anforderungen entsprechend Hauptkomponentenanalyse, Wavelet- Analyse, künstliche neuronale Netze, heuristischer Clusterbildungsanalyse und andere einzeln oder in Kombination eingesetzt werden können.
Um die mit der Software ausgewählten Parameter flächendeckend und billig analysieren zu können, wird ein reproduzierbarer Labortest durchgeführt.
Dieser Labortest erlaubt es, Outcome-relevante genetische, translationeile oder funktionelle Charakteristiken eines Tumors zusammenzufassen. Dieses Vorgehen ermöglicht es, sogenannte Integrated Health-Care Solutions anzuwenden, wo die Therapie mit der Diagnostik gekoppelt ist .
Ein solcher Labortest (oder auch mehrere Labortests) kann (bzw. können) beispielhaft mit einem Chip durchge- führt werden. Die Chips weisen folgende Eigenschaften auf :
- der Chip liefert Daten zum Metastasierungspotential,
- der Chip liefert Daten zur Therapieantwort bei mindestens 10 verbreiteten Chemotherapeutika, - der Chip liefert Daten zum Patientenmetabolismus (z. B. enzymatische Ausrüstung),
- der Chip liefert Information zur Autoimmunität gegen das Tumor,
- der Chip beinhaltet nicht mehr als 102 verschiedene Informationen (+ doubles) und
- der Chip ist reproduzierbar. Durch die Reproduzierbarkeit wird eine breite Anwendbarkeit der Chips erreicht, so daß eine preiswerte Herstellung möglich wird.
Da die relevanten biologische Daten sich je nach Diagnose unterscheiden, muß für jede Diagnose ein eigener Test entwickelt werden. Die daraus resultierenden Labortests können sich dabei erheblich von denen unterscheiden, die beim kolorektalen Karzinom Outcome- relevant sind. Dadurch ist es schwierig, dieses Labortest genauer zu beschreiben.
Für den Datenaustausch zwischen behandelndem Arzt, Referenzlabor (en) und Datenbanken umfaßt das erfin- dungsgemäße Informationssystem eine vorzugsweise mehrsprachige, sichere Web-Schnittstellen, die bei der beispielhaften Lösung die Verbindung mit Onkologen und Referenzlabors ermöglichen. Mit der Strukturierung des Informationssystems mittels des InternetStandards XML (eXtensible Markup Language) verbessert sich die Verfügbarkeit klinisch relevanten Wissens zu einem spezifischen medizinischen Problem am Arbeitsplatz des Onkologen.
Die gewählte kryptographische Basistechnik des beispielhaften onkologischen Informationssystems ist die symmetrische Verschlüsselung. Hier stehen hocheffiziente Verfahren zur Verfügung, die bei einer Schlüssel- länge von beispielweise 128 bits langfristige Sicher- heit gewähren. Kommunikationspartner verfügen über einen gemeinsamen Schlüssel, die PIN-Nummer. Die PIN- Nummer wird nur dem behandelten Arzt gegen Rechnung zugestellt, so daß der Patient keinen direkten Zugang zu den Aussagen des Informationssystems bekommen kann. Als vorteilhafter Standard kann beispielweise der AES (Advanced Encyrption Standard) gewählt werden.
Als sicherer Aufbewahrungsort für die elektronische Identität eines bestimmten Onkologen ist die kryptographische Chipkarte ideal, also im Gesundheitswesen die HPC (Health Professional Card, Ausweis für Berufe im Gesundheitswesen) .
Zunächst wird eine Plattform definiert. Das heißt Inputs und Outputs werden festgelegt . Hierzu werden Festlegungen zum Informationsfluß und zum Abrechnungs- modell getroffen.
Für diesen Informationsfluß wird beispielhaft der HON Code of Conduct (HONcode) für medizinische Webseiten im Gesundheitsbereich umgesetzt (www.hon.ch/HONcode/German) . Auf aktive Inhalte wie Java-Skripte wird verzichtet, außer in zwingenden Anwendungsfällen wie der Fern-Ein- gäbe von mit PIN anonymisierten klinischen und pathologischen Daten und von Nachsorgedaten.
Konkrete Maßnahmen sind auch für die Sicherheit des Servers des beispielhaften Informationssystem getroffen worden. Nur die nötigsten TCP-Dienste laufen auf dem Server. Der Mail-Server wird mit aktuellen Virusfiltern ausgestattet. Client/ Server-Verbindungen, auch mit anonymisierten Daten, werden über SSL (Secure Socket Layer) abgewickelt. Für die Nutzer-Authentisierung wer- den beispielhaft X.509 Zertifikate eingesetzt. Schlußendlich wird die Datenbank des beispielhaften Informationssystems regelmäßig gesichert, um nach einem Schadenfall wieder einen sauberen Zustand herstellen zu können. Der Betreiber dieses Informationssystems kann zur kommerziellen Nutzung der Erfindung entweder selbst einen Vertrieb aufbauen oder beispielsweise Referenzlabors, große Pharma-Unternehmen oder Internet Content Provider mit dem Vertrieb beauftragen. Diese wiederum könnten das Informationssystem dem Zielpublikum zur Nutzung anbieten. Die Referenzlabors, großen Pharma-Unternehmen oder Content Provider stellen dabei die eigentlichen Kunden des Betreibers („Kunden") dar; das Zielpublikum bzw. Nutzer des Informationssystems („Teilnehmer") sind z. B. Ärzte, die sich mit Krebserkrankungen beschäftigen. Dabei würden durch diese Geschäftsidee mehrere Vorteile genutzt. So müßte sich der Betreiber nur auf wenige Kunden konzentrieren und könnte z. B. das entwickelte Vertriebssystem dieser großen Kunden nutzen, das bei den großen Pharma-Unternehmen bis zu dem einzelnen Arzt reicht . Durch die geeignete Wahl der Kunden kann die weltweite Verfügbarkeit des Informationssystems erreicht werden.
Die Abrechnung der Gebühren für die Nutzung des Informationssystems sollte vorteilhafterweise ebenfalls über die Kunden und nicht direkt über die einzelnen Teil- nehmer aus dem Zielpublikum erfolgen. Dabei könnte man je nach Erfordernis eine Vorauszahlung, Ratenzahlung, Gebühren pro Nutzungsfall oder Gebühren prozentual zum Umsatz, den der Kunde mit dem Informationssystem macht, vereinbaren. Auch Gebühren je „PIN", die an die Teil- nehmer des Zielpublikums oder Kunden vergeben wurden, sind denkbar. Diese PIN ermöglicht dem Teilnehmer aus dem Zielpublikum den Zugang zum Informationssystem und dessen Nutzung; genauer: zu den mit der PIN verknüpften patientenspezifischen Daten. Der Teilnehmer erhält die PIN gegen Bezahlung einer Gebühr an den Kunden („no money - no PIN") . In Verbindung mit der PIN erhält der Teilnehmer einen Chip, auf welchem die für die Analyse erforderlichen Tests enthalten sind. Die Anforderungen an den Chip (Art und Anzahl der enthaltenen Tests) ergeben sich u. a. auch aus den Aussagen, die das Informationssystem hinsichtlich der Signifikanz der Variablen macht. Nach Aufbringung der Patientenprobe wird der Chip dann an ein Referenzlabor geschickt, und die Auswertung erfolgt in der oben beschriebenen Weise. Ebenso ist es denkbar, daß die Patientenprobe vom Teilnehmer direkt an das Referenzlabor geschickt wird und erst dort auf den Chip aufgebracht werden. Die PIN würde dann vom Referenz- labor gemeinsam mit den Testergebnissen dem Teilnehmer übersandt . Der Preis für die Nutzung des Informationssystems wäre im Gesamtpreis für den Kauf des Chips enthalten. Wenn der Teilnehmer aus dem Zielpublikum eine Anfrage an das Informationssystem stellt, wird er in der Regel aufgefordert, gewisse Angaben zu machen, insbesondere über Verlauf der Therapie, Medikamentierung oder Verlauf der Erkrankung. Diese Daten dienen u. a. dazu, das System zu optimieren. Da damit der Wert des Systems ge- steigert wird, kann man von dieser Dateneingabe möglicherweise auch eine Rückerstattung eines gewissen Betrages der Gebühren an den jeweiligen Teilnehmer erwägen.
Die Erfindung ist nicht beschränkt auf die hier dargestellten Ausführungsbeispiele. Vielmehr ist es möglich, durch Kombination und Modifikation der genannten Mittel und Merkmale weitere Ausführungsvarianten zu realisieren, ohne den Rahmen der Erfindung zu verlassen. Bezugszeichenliste
Input-Variablen Modul zur Berechnung der Korrelation Modul zur multivarianten statistischen Analyse a Resultate des herkömmlichen Verfahrens a Resultate des erfindungsgemäßen Verfahrens Transformationsschritt Feature-Selection Training und Auswahl des Modells bestes Modell, Modellarchitektur prä-operative Daten 0 prä-operative und zusätzliche, durch die erfin- dungsgemäße Datenauswertung ermittelten, Daten

Claims

Patentansprüche
1. Verfahren zur Datenauswertung unter Verwendung von mit Datenbanken gekoppelten Datenverarbeitungseinrichtungen, dadurch gekennzeichnet, daß der Datenverarbeitungseinrichtung zugeführte An- fragedaten ausgewertet werden, indem nach vorgebbaren Regeln und/oder mit Verfahren der künstlichen Intelligenz mit den Anfragedaten korrespondierende, in der (den) Datenbank (en) gespeicherte Daten ermittelt werden, die Güte dieser korrespondierenden Daten automatisch bewertet, anhand dieser Bewertung, der zugehörigen Anfrage- und/oder korrespondierenden Daten automatisch die Signifikanz dieser Anfrage- und/oder korrespon- dierenden Daten für die Anfrage ermittelt wird, die Ergebnisse der Auswertung, die Gütebewertung und/oder die Signifikanz der Daten ausgegeben und/oder abrufbar bereitgestellt werden.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, daß die Datenauswertung medizinische Prognosen generiert und die Anfragedaten als klinisch-pathologische Daten durch einen Arzt und/oder als biomo- lekulare Daten durch ein Analyselabor der Datenverarbeitungseinrichtung zugeführt werden.
3. Verfahren nach einem der Ansprüche 1 oder 2 , dadurch gekennzeichnet, daß die Anfragedaten und/oder die in der (den) Datenbank (en) gespeicherten Daten - krankheitsbezogene Faktoren und/oder patientenspezifische Faktoren und/oder umweltspezifische Faktoren berücksichtigen.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß eine Aktualisierung der in der (den) Datenbank (en) gespeicherten Daten Erfahrungsdaten erfolgt, indem Daten über die Therapie und den Krankheitsverlauf zu von der Datenverarbeitungs- einrichtung prognostizierten Fällen der Datenverarbeitungseinrichtung zugeführt werden.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß eine Aktualisierung der Bewertungsvorschriften in einem iterativen Lernprozeß erfolgt, in welchem Anfrage, Anfragedaten, bei der Auswertung der Anfrage benutzte, in der (den) Datenbank (en) ge- speicherten Daten, Ergebnisse der Auswertung und tatsächlich eingetretene Ereignisse berücksichtigt werden.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß in Abhängigkeit von der Bewertung die Menge der in der (den) Datenbank (en) gespeicherten Daten reduziert wird.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß in Abhängigkeit von der Signifikanz die Zahl der zuzuführenden Anfragedaten und/oder die Menge der in der (den) Datenban (en) gespeicherten Daten reduziert wird.
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß die Auswertung durch
Cluster-Analyse und/oder
Ähnlichkeiten-Suche und/oder
Tendenz-Analyse und/oder - Korrespondenzanalyse und/oder aufsteigend hierarchische Klassifikation und/ oder
Hauptanalyse und/oder
Wavelet-Analyse in Verbindung mit aus Irrtums-Modellen generierten Probabilitätswerten und/oder Mitteln der künstlichen Intelligenz wie neuronalen Netzen und/oder regelbasierten Systemen erfolgt.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß die Datenauswertung die Ermittlung der Eintrittswahrscheinlichkeit von durch die Anfrage und/oder durch die korrespondierenden Daten bezeichneten Ereignissen umfaßt.
10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, daß die Signifikanz von Daten derart ermittelt wird, daß eine Anfrage ein erstes Mal ohne Berücksichtigung dieser Daten und ein zweites Mal unter Berücksichtigung dieser Daten ausgewertet wird, die Bewertungen der Ergebnisse dieser beiden Aus- Wertungen miteinander verglichen und das Maß des Einflusses der Daten relativ zu einer Verbesserung bzw. Verschlechterung der zweiten Bewertung gegenüber ersten Bewertung bestimmt wird.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, daß bei einer Verbesserung der zweiten Bewertung gegenüber der ersten Bewertung die Daten als signifikant angesehen und bei künftigen Auswertungen berücksichtigt werden, bei einer Verschlechterung der zweiten Bewertung gegenüber der ersten Bewertung die Daten als nicht signifikant angesehen und für künftige Auswertungen nicht mehr genutzt werden.
12. Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß die Zuführung der Daten, die Anfrage und/oder die Ausgabe der Ergebnisse über das Internet erfolgt.
13. Anordnung mit mindestens einem Prozessor, der
(die) derart eingerichtet ist (sind) , daß ein Verfahren zur Datenauswertung durchführbar ist, wobei der Datenverarbeitungseinrichtung zugeführ- te Anfragedaten ausgewertet werden, indem nach vorgebbaren Regeln und/oder mit Verfahren der künstlichen Intelligenz mit den Anfragedaten korrespondierende, in der (den) Datenbank (en) gespeicherte Daten ermittelt werden, die Güte dieser korrespondierenden Daten automatisch bewertet, anhand dieser Bewertung, der zugehörigen Anfrage- und/oder korrespondierenden Daten automatisch die Signifikanz dieser Anfrage- und/oder korrespon- dierenden Daten für die Anfrage ermittelt wird, die Ergebnisse der Auswertung, die Gütebewertung und/oder die Signifikanz der Daten ausgegeben und/oder abrufbar bereitgestellt werden.
14. Anordnung nach Anspruch 13, gekennzeichnet durch mindestens eine mit mindestens einer Datenbank gekoppelte Datenverarbeitungseinrichtung, Mittel zur Datenein- und/oder -ausgäbe, nach vorgebbaren Regeln und/oder mit Verfahren der künstlichen Intelligenz arbeitende Mittel zur Ermittlung von in der (den) Datenbank (en) gespeicherten, mit einer Datenverarbeitungseinrichtung zugeführten Anfragedaten korrespondierenden Daten,
Mittel zur automatischen Bewertung der Güte der korrespondierenden Daten, Mittel zur automatischen Ermittlung der Signifikanz der Anfrage- und/oder korrespondierenden Daten für eine Anfrage .
15. Computerprogrammprodukt, das ein computerlesbares Speichermedium umfaßt, auf dem ein Programm gespeichert ist, das es einem Computer ermöglicht, nachdem es in den Speicher des Computers geladen worden ist, ein Verfahren zur Datenauswertung durchzuführen, wobei die Datenauswertung die Ver- fahrensschritte gemäß einem der Ansprüche 1 bis 12 umfaßt.
16. Computerlesbares Speichermedium, auf dem ein Programm gespeichert ist, das es einem Computer er- möglicht, nachdem es in den Speicher des Computers geladen worden ist, ein Verfahren zur Datenauswertung durchzuführen, wobei die Datenauswertung die Verfahrensschritte gemäß einem der Ansprüche 1 bis 12 umfaßt.
17. Verwendung eines Verfahrens nach einem der Ansprüche 1 bis 12 zur
Auswertung von klinischen, pathologischen und/ oder molekulargenetischer Daten, - Ermittlung der prognostischen Signifikanz von klinischen, pathologischen und/oder molekulargenetischer Daten, Selektion molekularer Targets, Schätzung des individuellen Risikos, wie beispielsweise des Metastasierungsrisikos, einzelner Patienten,
Schätzung der Probabilität der Therapieantwort z. B. auf Chemotherapeutika und/oder automatischen Generation von Prognose- und/oder Therapievorschlägen.
18. Daten, Gene, molekulare und/oder genetische Targets, welche durch ein Verfahren nach einem der Ansprüche 1 bis 12, durch eine Anordnung nach einem der Ansprüche 13 oder 14 , durch ein Computerprogrammprodukt nach Anspruch 15, durch ein computerlesbares Speichermedium nach Anspruch 16 oder eine Verwendung nach Anspruch 17 verfügbar gemacht werden.
19. Herstellungsverfahren für diagnostische Anordnungen, welches die Schritte eines Verfahrens nach einem der Ansprüche 1 bis 12 und einen zusätzlichen Schritt umfaßt, in welchem ein diagnostisch effektives Analysewerkzeug, wie z. B. ein RNA- oder Protein-Chip, und/oder eine Kombination von Genen, welche durch ein Verfahren nach einem der Ansprüche 1 bis 12, durch eine Anordnung nach einem der Ansprüche 13 oder 14, durch ein Computerprogrammprodukt nach Anspruch 15, durch ein computerlesbares Speichermedium nach Anspruch 16 oder eine Verwendung nach An- spruch 17 verfügbar gemacht wurden, zusammengestellt wird.
20. Verwendung von Genen oder Kombination von Genen, welche durch ein Verfahren nach einem der An- Sprüche 1 bis 12 , durch eine Anordnung nach einem der Ansprüche 13 oder 14, durch ein Computerprogrammprodukt nach Anspruch 15, durch ein computerlesbares Speichermedium nach Anspruch 16 oder eine Verwendung nach Anspruch 17 verfügbar gemacht wurden, für die Vorbereitung einer diagnostischen Zusammenstellung zur Klassifizierung genetisch bedingter Erkrankungen, Tumoren u.a. und/oder zur Vorhersage genetisch bedingter Erkrankungen und/oder zur Assoziierung von molekular-genetischen Parametern mit klinischen Parametern und/oder zur Identifizierung von Tumoren durch Genexpressionsprofile.
21. Trägerelement, auf dem Daten, Gene, molekulare und/oder genetische Targets bereitgestellt werden, welche durch ein Verfahren nach einem der Ansprüche 1 bis 12, durch eine Anordnung nach einem der Ansprüche 13 oder 14, durch ein Com- puterprogrammprodukt nach Anspruch 15, durch ein computerlesbares Speichermedium nach Anspruch 16 oder eine Verwendung nach Anspruch 17 verfügbar gemacht werden.
22. Trägerelement nach Anspruch 21, dadurch gekennzeichnet, daß das Trägerelement als Chip ausgebildet ist und
Daten zum individuellen Risiko, wie z. B. Meta- stasierungspotential, und/oder - Daten zur Therapieantwort z . B . auf Chemothera- peutika und/oder - Daten zum Patientenmetabolismus und/oder
Information zur Autoimmunität z . B . gegen einen
Tumor bereitstellt.
23. Trägerelement nach Anspruch 22, dadurch gekennzeichnet, daß die Anzahl der auf dem Trägerelement bereitgestellten Daten Einhundert nicht übersteigt .
24. Trägerelement nach einem der Ansprüche 22 oder 23, dadurch gekennzeichnet, daß das Trägerelement als reproduzierbarer Chip ausgebildet ist .
25. Methode zur Nutzung eines Systems zur Datenaus- wertung nach einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, daß der Zugang zu dem System durch eine gebührenpflichtige PIN ermöglicht wird, wobei die PIN mit Mitteln zur Erfassung von in das System einzuge- benden Daten und/oder mit Mitteln zur Erfassung von Material, welches zur Ermittlung der einzugebenden Daten dient, verbunden ist, und der Nutzer die PIN durch Zahlung einer Gebühr erwirbt .
26. Methode nach Anspruch 25, dadurch gekennzeichnet, daß der Nutzer die PIN zusammen mit dem (den) Mittel (n) zur Erfassung der Daten und/oder des Materials beim Kauf dieses (dieser) Mittel (s) erwirbt .
27. Methode nach einem der Ansprüche 25 oder 26, dadurch gekennzeichnet, daß eine PIN mit vorgebbaren, in dem System gespeicherten Daten verknüpft ist und die PIN nur Zugang zu diesen mit ihr verknüpften Daten ermöglicht .
28. Methode nach einem der Ansprüche 25 bis 27, dadurch gekennzeichnet, daß ein Vertreiber des Systems zur Datenauswertung mit mindestens einem Kunden Nutzungsvereinbarungen schließt und der (die) Kunde (n) das System für weitere Teilnehmer durch Vergabe gebührenbehafteter PINs nutzbar macht (machen) .
29. Methode nach einem der Ansprüche 25 bis 28, dadurch gekennzeichnet, daß
- Referenzlabors und/oder Pharmaunternehmen und/oder - Content Provider das System zur Datenauswertung als Kunde nutzen.
30. Methode nach einem der Ansprüche 25 bis 29, dadurch gekennzeichnet, daß die Gebühren für die Nutzung des Systems zur Datenauswertung über den Kunden erhoben werden und pro Nutzungsfall und/oder
- prozentual zum Umsatz, den der Kunde mit dem System macht und/oder
- pro vergebener PIN festgelegt werden.
31. Methode nach einem der Ansprüche 25 bis 30, dadurch gekennzeichnet, daß ein Mittel zur Erfassung von Material ein Träger- Chip für die bei einem - erforderlichenfalls reproduzierbaren - Labortest benötigten Proben, wie z. B. ein DNA-Mikroarray, ist.
32. Methode nach einem der Ansprüche 25 bis 31, dadurch gekennzeichnet, daß ein Nutzer des Systems zur Datenauswertung die PIN vom Vertreiber des Systems oder von einem Kunden des Betreibers erwirbt .
33. Verwendung eines Systems zur Datenauswertung nach einem der Ansprüche 1 bis 32 zur Durchführung von
Profit- oder Non-Profit-Aktionen durch Ärzte, Patienten und/oder das System betreibende Firmen.
34. Verwendung eines Systems zur Datenauswertung nach Anspruch 33, dadurch gekennzeichnet, daß eine Aktion durch
- Teilnehmer und/oder
- Anbieter des Systems gestartet wird.
35. Verwendung eines Systems zur Datenauswertung nach einem der Ansprüche 33 oder 34, dadurch gekennzeichnet, daß eine Aktion
- die Schaffung, Unterhaltung und/oder Vermarktung eines Exzellenz-Netzwerkes und/oder - die Distribution von Therapien und/oder
- die Selektion von Patientengruppen für klinische Studien umfaßt .
PCT/EP2002/009735 2001-08-30 2002-08-30 Verfahren und anordnung zur datenauswertung sowie ein entsprechendes computerprogramm-erzeugnis und ein entsprechendes computerlesbares speichermedium WO2003021478A2 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US10/488,165 US20040236723A1 (en) 2001-08-30 2002-08-30 Method and system for data evaluation, corresponding computer program product, and corresponding computer-readable storage medium
EP02797658A EP1423806A2 (de) 2001-08-30 2002-08-30 Verfahren und anordnung zur datenauswertung sowie ein entsprechendes computerprogramm-erzeugnis und ein entsprechendes computerlesbares speichermedium
JP2003525500A JP2005501625A (ja) 2001-08-30 2002-08-30 データ評価のための方法およびシステムならびに対応のコンピュータプログラム製品および対応のコンピュータ読取可能な記録媒体
CA002459003A CA2459003A1 (en) 2001-08-30 2002-08-30 Method and system for data evaluation, corresponding computer program product, and corresponding computer-readable storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10143712.9 2001-08-30
DE10143712A DE10143712A1 (de) 2001-08-30 2001-08-30 Verfahren, Computersystem und Computerprogrammprodukt zur Datenauswertung

Publications (2)

Publication Number Publication Date
WO2003021478A2 true WO2003021478A2 (de) 2003-03-13
WO2003021478A3 WO2003021478A3 (de) 2003-12-04

Family

ID=7697934

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2002/009735 WO2003021478A2 (de) 2001-08-30 2002-08-30 Verfahren und anordnung zur datenauswertung sowie ein entsprechendes computerprogramm-erzeugnis und ein entsprechendes computerlesbares speichermedium

Country Status (6)

Country Link
US (1) US20040236723A1 (de)
EP (1) EP1423806A2 (de)
JP (1) JP2005501625A (de)
CA (1) CA2459003A1 (de)
DE (1) DE10143712A1 (de)
WO (1) WO2003021478A2 (de)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2056220A1 (de) * 2007-10-29 2009-05-06 CompuGroup Holding AG Verfahren zur kontextsensitiven Bereitstellung von patientenbezogenen Informationen
WO2010060461A1 (de) * 2008-11-25 2010-06-03 Compugroup Holding Ag Verfahren zur kontextsensitiven bereitstellung von patientenbezogenen informationen
CN103845038A (zh) * 2012-12-04 2014-06-11 中国移动通信集团公司 一种体征信号采集方法和设备
CN104011718A (zh) * 2011-12-19 2014-08-27 国际商业机器公司 用于检测社交媒体中的趋势的方法、计算机程序和计算机

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10322687A1 (de) * 2003-05-20 2004-12-16 Siemens Ag Verfahren zur Referenzierung von Therapiehinweise umfassenden Datensätzen
US8086484B1 (en) * 2004-03-17 2011-12-27 Helium, Inc. Method for managing collaborative quality review of creative works
US20050210015A1 (en) * 2004-03-19 2005-09-22 Zhou Xiang S System and method for patient identification for clinical trials using content-based retrieval and learning
CA2594181A1 (en) * 2004-12-30 2006-07-06 Proventys, Inc. Methods, systems, and computer program products for developing and using predictive models for predicting a plurality of medical outcomes, for evaluating intervention strategies, and for simultaneously validating biomarker causality
DE102005004294A1 (de) * 2005-01-28 2006-08-03 Bayer Healthcare Ag Auswahl und Bewertung diagnostischer Tests mittels Diskordanzanalysen-Charakteristik (DAC)
DE102005019750A1 (de) * 2005-04-28 2006-11-09 Braun Gmbh Vorrichtung und Verfahren zur Verwaltung, Archivierung und/oder Auswertung von Blutdruckdaten
US7664328B2 (en) * 2005-06-24 2010-02-16 Siemens Corporation Joint classification and subtype discovery in tumor diagnosis by gene expression profiling
EP2069990B1 (de) * 2006-09-20 2019-03-13 Koninklijke Philips N.V. Entscheidungsunterstützungssystem in der molekularen diagnostik
US20090070138A1 (en) * 2007-05-15 2009-03-12 Jason Langheier Integrated clinical risk assessment system
CA2905110A1 (en) 2013-03-15 2014-09-18 Lantheus Medical Imaging, Inc. Control system for radiopharmaceuticals
US9522745B2 (en) * 2014-09-24 2016-12-20 Honeywell International Inc. Method and system for preparing aircraft maintenance application data for portable devices
JPWO2016147289A1 (ja) * 2015-03-16 2017-12-21 富士通株式会社 情報分析プログラム、情報分析方法および情報分析装置
WO2016147290A1 (ja) * 2015-03-16 2016-09-22 富士通株式会社 情報分析プログラム、情報分析方法および情報分析装置
CN105976120A (zh) * 2016-05-17 2016-09-28 全球能源互联网研究院 一种电力运营监控数据质量评估系统及方法
WO2018146250A1 (de) 2017-02-10 2018-08-16 Phacon Gmbh System und verfahren zur validierung und zum training operativer eingriffe in der human- und veterinärmedizin
DE202017006757U1 (de) 2017-02-10 2018-04-23 Phacon Gmbh System zur Validierung und zum Training operativer Eingriffe in der Human- und Veterinärmedizin
DE102017213714B4 (de) * 2017-08-07 2020-01-09 Audi Ag Verfahren zum Ermitteln einer Erkrankungsprognose eines Kraftfahrzeuginsassen sowie Prognoseeinrichtung

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5687716A (en) * 1995-11-15 1997-11-18 Kaufmann; Peter Selective differentiating diagnostic process based on broad data bases
US5860917A (en) * 1997-01-15 1999-01-19 Chiron Corporation Method and apparatus for predicting therapeutic outcomes
WO1999066024A1 (en) * 1998-06-19 1999-12-23 Rosetta Inpharmatics, Inc. Methods of monitoring disease states and therapies using gene expression profiles
WO2001041036A1 (en) * 1999-11-30 2001-06-07 Dacom Cyberpass Inc. Electronic payment system using multifunctional prepaid cards and method of selling prepaid cards
WO2001040517A2 (en) * 1999-11-30 2001-06-07 Oxo Chemie Ag Evaluating and predicting clinical outcomes by gene expression analysis

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US36631A (en) * 1862-10-07 Improvement in self-weighing carts
US5779634A (en) * 1991-05-10 1998-07-14 Kabushiki Kaisha Toshiba Medical information processing system for supporting diagnosis
JP2556205Y2 (ja) * 1992-12-18 1997-12-03 株式会社 神崎高級工機製作所 作業車両のミッション装置
US5517405A (en) * 1993-10-14 1996-05-14 Aetna Life And Casualty Company Expert system for providing interactive assistance in solving problems such as health care management
US5574828A (en) * 1994-04-28 1996-11-12 Tmrc Expert system for generating guideline-based information tools
IL131873A0 (en) * 1997-03-13 2001-03-19 First Opinion Corp Disease management system
US7315784B2 (en) * 2001-02-15 2008-01-01 Siemens Aktiengesellschaft Network for evaluating data obtained in a biochip measurement device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5687716A (en) * 1995-11-15 1997-11-18 Kaufmann; Peter Selective differentiating diagnostic process based on broad data bases
US5860917A (en) * 1997-01-15 1999-01-19 Chiron Corporation Method and apparatus for predicting therapeutic outcomes
WO1999066024A1 (en) * 1998-06-19 1999-12-23 Rosetta Inpharmatics, Inc. Methods of monitoring disease states and therapies using gene expression profiles
WO2001041036A1 (en) * 1999-11-30 2001-06-07 Dacom Cyberpass Inc. Electronic payment system using multifunctional prepaid cards and method of selling prepaid cards
WO2001040517A2 (en) * 1999-11-30 2001-06-07 Oxo Chemie Ag Evaluating and predicting clinical outcomes by gene expression analysis

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2056220A1 (de) * 2007-10-29 2009-05-06 CompuGroup Holding AG Verfahren zur kontextsensitiven Bereitstellung von patientenbezogenen Informationen
WO2010060461A1 (de) * 2008-11-25 2010-06-03 Compugroup Holding Ag Verfahren zur kontextsensitiven bereitstellung von patientenbezogenen informationen
CN104011718A (zh) * 2011-12-19 2014-08-27 国际商业机器公司 用于检测社交媒体中的趋势的方法、计算机程序和计算机
US9705837B2 (en) 2011-12-19 2017-07-11 International Business Machines Corporation Method, computer program and computer for detecting trends in social media
CN104011718B (zh) * 2011-12-19 2018-01-23 国际商业机器公司 用于选择识别的消息组的方法、计算机可读介质和计算机
CN103845038A (zh) * 2012-12-04 2014-06-11 中国移动通信集团公司 一种体征信号采集方法和设备

Also Published As

Publication number Publication date
WO2003021478A3 (de) 2003-12-04
US20040236723A1 (en) 2004-11-25
JP2005501625A (ja) 2005-01-20
DE10143712A1 (de) 2003-04-10
EP1423806A2 (de) 2004-06-02
CA2459003A1 (en) 2003-03-13

Similar Documents

Publication Publication Date Title
WO2003021478A2 (de) Verfahren und anordnung zur datenauswertung sowie ein entsprechendes computerprogramm-erzeugnis und ein entsprechendes computerlesbares speichermedium
CN105096225B (zh) 辅助疾病诊疗的分析系统、装置及方法
EP2648122B1 (de) Verfahren zum Laden von medizinischen Bilddaten sowie Vorrichtung zur Durchführung des Verfahrens
DE102007026799A1 (de) Systeme und Verfahren zur Verfeinerung der Identifikation von Kandidaten für klinische Studien
DE112005002331T5 (de) Verfahren, System und Vorrichtung zur Zusammenstellung und Nutzung von biologischem Wissen
CA2594181A1 (en) Methods, systems, and computer program products for developing and using predictive models for predicting a plurality of medical outcomes, for evaluating intervention strategies, and for simultaneously validating biomarker causality
DE102007026802A1 (de) Systeme und Verfahren zur Identifizierung von Kandidaten für eine klinische Studie
DE112005000317T5 (de) Verfahren zum Rekrutieren von Patienten für eine klinische Studie
US20090187420A1 (en) Methods and Systems for Providing Individualized Wellness Profiles
Danesh et al. Symptom clusters seen in adult COVID-19 recovery clinic care seekers
DE112019005389T5 (de) Techniken zum erkennen von optimalen kombinationen von arzneimitteln
Christensen et al. Predictors of work and education among people with severe mental illness who participated in the Danish individual placement and support study: findings from a randomized clinical trial
EP2394229A1 (de) Automatisiertes system zum vergleich individueller genom-, transkriptom-, proteom-, epigenom und metabolomdaten mit daten aus knochenmarkspender-registern und blut, nabelschnurblut und gewebebanken
EP2238553B1 (de) System für die bereitstellung individueller oder gepoolter auch anonymisierter patientendaten auf grundlage von molekularen genom-, transkriptom-, proteom-, epigenom oder metabolomdaten
Garfinkel et al. Competition and innovation revisited: A product-level view
Cacere et al. Translation, cross-cultural adaptation, and analysis of the measurement properties of the Brazilian Portuguese version of the spinal cord injury pain instrument
Oba et al. How to use marginal structural models in randomized trials to estimate the natural direct and indirect effects of therapies mediated by causal intermediates
Oostdyk et al. PNS200 WHAT DOES EMPOWERMENT MEAN?-PERSPECTIVES FROM ECONOMICALLY DISADVANTAGED PATIENTS
Poulos et al. PNS198 Scope tests in health care discrete choice experiments
Fatoye et al. PNS197 FACTORS ENSURING SUCCESSFUL UPTAKE OF PHARMACEUTICAL PRODUCTS BY PATIENTS: THEMATIC ANALYSES OF QUALITATIVE STUDY
Liu et al. PNS199 A REVIEW OF POLICIES REGARDING PATIENT-REPORTED OUTCOMES (PRO) FROM THE FOOD AND DRUG ADMINISTRATION (FDA) AND EUROPEAN MEDICINES AGENCY (EMA)
Smith et al. Analyzing the predictors of health care utilization in the agricultural worker population using decision tree analysis: Does language matter?
Rodas-Osollo et al. Towards Optimisation of Electroconvulsive Therapy with a Little Help from Knowledge Management
Huang et al. The value of data for prediction policy problems: Evidence from antibiotic prescribing
EP1687756B9 (de) Verfahren zur klassifikation von messwerten in der medizinischen und biochemischen analytik

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BY BZ CA CH CN CO CR CU CZ DE DM DZ EC EE ES FI GB GD GE GH HR HU ID IL IN IS JP KE KG KP KR LC LK LR LS LT LU LV MA MD MG MN MW MX MZ NO NZ OM PH PL PT RU SD SE SG SI SK SL TJ TM TN TR TZ UA UG US UZ VC VN YU ZA ZM

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SD SE SG SI SK SL TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): GH GM KE LS MW MZ SD SL SZ UG ZM ZW AM AZ BY KG KZ RU TJ TM AT BE BG CH CY CZ DK EE ES FI FR GB GR IE IT LU MC PT SE SK TR BF BJ CF CG CI GA GN GQ GW ML MR NE SN TD TG

Kind code of ref document: A2

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR IE IT LU MC NL PT SE SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2003525500

Country of ref document: JP

Ref document number: 2459003

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2002333775

Country of ref document: AU

WWE Wipo information: entry into national phase

Ref document number: 2002797658

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2002797658

Country of ref document: EP

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

WWE Wipo information: entry into national phase

Ref document number: 10488165

Country of ref document: US

WWW Wipo information: withdrawn in national office

Ref document number: 2002797658

Country of ref document: EP