DE102020002607A1 - Pharmazeutischer prozess - Google Patents

Pharmazeutischer prozess Download PDF

Info

Publication number
DE102020002607A1
DE102020002607A1 DE102020002607.9A DE102020002607A DE102020002607A1 DE 102020002607 A1 DE102020002607 A1 DE 102020002607A1 DE 102020002607 A DE102020002607 A DE 102020002607A DE 102020002607 A1 DE102020002607 A1 DE 102020002607A1
Authority
DE
Germany
Prior art keywords
data
regulatory
pharmaceutical
source files
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102020002607.9A
Other languages
English (en)
Inventor
Jörg Werner
Moritz Kloft
Dieter Schlaps
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Merck Patent GmbH
Original Assignee
Merck Patent GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Merck Patent GmbH filed Critical Merck Patent GmbH
Priority to DE102020002607.9A priority Critical patent/DE102020002607A1/de
Priority to JP2022565974A priority patent/JP2023523761A/ja
Priority to EP21722843.6A priority patent/EP4143698A1/de
Priority to AU2021265189A priority patent/AU2021265189A1/en
Priority to CN202180031751.8A priority patent/CN115398420A/zh
Priority to PCT/EP2021/061347 priority patent/WO2021219827A1/en
Priority to CA3181613A priority patent/CA3181613A1/en
Priority to US17/922,085 priority patent/US20230170099A1/en
Publication of DE102020002607A1 publication Critical patent/DE102020002607A1/de
Priority to IL297715A priority patent/IL297715A/en
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Cephalosporin Compounds (AREA)

Abstract

Die vorliegende Offenbarung betrifft ein computerimplementiertes Verfahren zum Beseitigen der Barrieren klassischer Informationssysteme und offenbart ein homogenes Datenverwaltungssystem mit dem Ziel, eine Datenintegration zum Anreichern eines pharmazeutischen regulatorischen semantischen Modells zu straffen und automatisieren, das mit einem regulatorischen Status eines pharmazeutischen Produkts assoziiert ist.

Description

  • Die vorliegende Offenbarung betrifft Systeme, Verfahren und computerlesbare Medien zum Mining regulatorischer Informationen oder Daten in einer pharmazeutischen Umgebung. Insbesondere ermöglicht die vorliegende Offenbarung eine effiziente Datenverarbeitung und einen effizienten Datenabruf einer großen Vielfalt an strukturierten oder nichtstrukturierten Datenressourcen zum Verwalten regulatorischer Daten für die Entwicklung und regulatorische Genehmigung eines Produkts.
  • Eine pharmazeutische Arzneimittelgenehmigung wird in Märkten, die einer Produktregulierung unterliegen, wie etwa dem Gesundheitswesen, immer schwieriger. Pharma-, Biotechnologie- und Medizinvorrichtungsfirmen sind mit hohen Produktentwicklungskosten, einem harten Wettbewerb und extensiven Regulierungen konfrontiert. Die Regeln und Prozeduren zum Erhalten einer regulatorischen Überprüfung und Genehmigung ändern sich oft, genauso wie das Personal innerhalb der Regulierungsbehörden oder Zulassungsbehörden. Gleichzeitig stehen Firmen unter enormem Druck, eine regulatorische Genehmigung schnell zu erhalten und Produkte regelkonform zu halten.
  • Viele der heutigen Produkte erfordern eine regulatorische Genehmigung oder Autorisierung. Beispielsweise müssen Pharma- und Biotechnologiefirmen eine Genehmigung von einer Regulierungsbehörde, wie etwa der U.S. Food and Drug Administration (FDA), erhalten, bevor ein neues Arzneimittel vermarktet werden kann. Solche Firmen können Unternehmensabteilungen für regulatorische Angelegenheiten haben, um sämtliche Kommunikation zwischen der Firma und den verschiedenen Regulierungsbehörden zu verwalten, mit denen sie zu tun haben. Die Abteilung für regulatorische Angelegenheiten muss auch mit zahlreichen anderen Gruppen und Bereichen innerhalb des Unternehmens arbeiten, wie etwa jenen, die für Qualitätskontrolle, Forschung und Entwicklung und Verkauf und Marketing verantwortlich sind, um sicherzustellen, dass regulatorische Anforderungen auf eine koordinierte Weise erfüllt werden.
  • Das Volumen an Daten, die eine Abteilung für regulatorische Angelegenheiten verwalten muss, kann enorm sein. Tatsächlich ist die Abteilung für regulatorische Angelegenheiten oft für zahlreiche Produkte verantwortlich, die einer Regulierung durch eine Menge an Regulierungsbehörden in der ganzen Welt unterliegen. Die Menge an regulatorischen Daten für solche Produkte kann jedes Jahr exponentiell zunehmen, da sich die Kommunikation mit diesen Behörden kontinuierlich weiterentwickelt. Zudem verlangen Firmen und Regulierungsbehörden typischerweise, dass diese regulatorischen Daten leicht zugänglich für Behördeninspektionen und Unternehmensplanung gehalten werden.
  • Oft sind die regulatorischen Daten jedoch über verschiedene Stellen über eine Firma hinweg verteilt. Personen innerhalb einer Abteilung für regulatorische Angelegenheiten müssen oft zahlreiche individuelle manuelle Systeme verwenden, um Daten zu verfolgen, die die Produkte betreffen, für die sie verantwortlich sind. Zudem ist es mit Bezug auf ein bestimmtes Produkt oft schwierig, die regulatorischen Daten zu verfolgen, auf diese zuzugreifen oder diese zu referenzieren. In solchen Umgebungen ist das Lokalisieren gesammelter Informationen, die regulatorische Schlüsselaktivitäten betreffen, kompliziert und enorm zeitaufwendig.
  • Mit zunehmender Größe und Komplexität von Daten und Informationen, muss auch die Verwaltung des Wissens wachsen. Typischerweise befindet sich in Betrieben, kleinen wie großen, ein größerer Abschnitt von Daten und Informationen in einem unstrukturierten Format als in einem strukturierten Format. Um die Anforderungen von Daten- und Informationsintegration über verteilte, disparate und heterogene Daten- und Informationsquellen hinweg zu erfüllen, haben sich einige Techniken entwickelt und wurden studiert. Außerdem beschreiben einige Techniken die Verknüpfung unstrukturierter Daten mit strukturierten Daten. In herkömmlichen Prozessen zum Verknüpfen unstrukturierter Daten mit strukturierten Daten werden verschiedene Teile der Daten in statische und dynamische Teile klassifiziert. Der Aspekt des Identifizierens statischer und dynamischer Teile von Daten ist nützlich, um verschiedene Leistungsfähigkeitsmetriken, wie die Abfragezeit, zu optimieren.
  • Das explosive Wachstum von Wissen und Daten liegt jenseits der Fähigkeit traditioneller Informationsverwaltungsmechanismen zur Verwaltung oder gar Beschreibung. Manche Web-Technologien, wie etwa Ontologien und neue Sprachen, wie etwa OWL (Web Ontology Language) und RDF (Resource Description Framework), ermöglichen die Beschreibung verknüpfter Konzepte, wie etwa Gesundheit, Medizin oder Ingenieurswesen, zur Beschreibung mit zuvor unmöglichem Detail und auf eine Weise, die sowohl für Menschen als auch Maschinen verständlich ist. Diese Ontologien werden typischerweise durch Teams aus Experten auf dem Gebiet (Ontologist) erschaffen und sind häufig öffentlich verfügbar.
  • Der Bedarf an einer Ontologieangleichung entsteht aus dem Erfordernis, heterogene Datenbanken zu integrieren, die sich unabhängig entwickelt haben und die dementsprechend jeweils ihr eigenes Datenvokabular haben. Im Kontext des Semantic Webs, wobei viele Akteure beteiligt sind, die ihre eigenen Ontologien bereitstellen, hat der Abgleich von Ontologien einen entscheidenden Platz eingenommen, um dabei zu helfen, dass heterogene Ressourcen zusammenwirken. Ontologieangleichungswerkzeuge finden Klassen von Daten, die „semantisch äquivalent“ sind, zum Beispiel „Lastkraftwagen“ und „Laster“. Die Klassen sind nicht notwendigerweise logisch identisch.
  • Auch das Fehlen einer Ontologiezuordnung der Daten in Bezug auf die pharmazeutischen regulatorischen Prozesse weist ein Risiko auf, dass eine nahtlose Datenintegration nicht erreicht wird und infolgedessen die Qualität der Daten erheblich reduziert ist.
  • Dementsprechend ist das Abrufen relevanter strukturierter oder unstrukturierter pharmazeutischer Daten aus disparaten Quellenkontexten eine Herausforderung für Datenanalysewerkzeuge. Daher wäre es vorteilhaft, ein System und ein Verfahren zu haben, die einen effizienten Abruf strukturierter oder unstrukturierter Daten zum Bereichern semantischer Modelle ermöglichen.
  • Entsprechend gibt es einen Bedarf an Systemen, Verfahren, die eine Integration regulatorischer Daten in der Pharmaindustrie effizient verwalten können. Zudem gibt es einen Bedarf an Systemen und Verfahren, die regulatorische Daten in der Pharmaindustrie verwalten können, so dass sie auf eine verfolgbare Weise, z. B. mit Bezug auf ein Gebiet, ein spezielles Produkt oder eine spezielle Gruppe von Produkten, eine Fertigungsstätte, eine Regulierung und so weiter, abgerufen werden können.
  • Die vorliegende Offenbarung überwindet die oben identifizierten Beschränkungen, die in dem Stand der Technik zu finden sind.
  • Die Techniken der vorliegenden Offenbarung können zum Mining von Daten basierend auf Ontologieabgleichsalgorithmen verwendet werden. Die angereicherte Annotation und Metadaten, die mit diesen Mining-unterzogenen Daten assoziiert sind, können zum Verbessern von Datenanalysewerkzeugen verwendet werden, die Künstliche-Intelligenz(KI)- und Maschinenlernen(ML)-Algorithmen zum Analysieren der angereicherten semantischen Modelle einbinden.
  • Ausführungsformen der vorliegenden Offenbarung betreffen ein Verfahren, ein System und ein Computerprogramm zur automatisierten Integration strukturierter und unstrukturierter Textdatenquellen.
  • Die vorliegende Offenbarung stellt Verfahren bereit, die strukturierte maschinenlesbare kontextbezogene Daten aus Vorlagen mit verschiedenen Formaten extrahieren. Ferner betrifft die vorliegende Offenbarung Verfahren und Einrichtungen zum Extrahieren domänenspezifischer Daten zum Anreichern eines semantischen Modells, das in Neuronales-Netz- und Maschinenlernen-Ansätzen zur Terminologieverbesserung verwendet wird.
  • Es sind auch Verfahren und Einrichtungen zum Verwenden kontrollierter Vokabulare zum Verbessern des Mining von Textdaten bereitgestellt, die für pharmazeutische regulatorische Prozesse relevant sind. Die Verfahren der vorliegenden Offenbarung könnten mit bestehenden kontrollierten Vokabularen und/oder Ontologien kombiniert werden. Ferner sind computerlesbare Medien einschließlich eines Programms bereitgestellt, das bei Ausführung durch einen Computer die Verfahren der vorliegenden Offenbarung durchführt. Die vorliegende Offenbarung kann die oben angesprochenen technischen Probleme und/oder andere, oben nicht angesprochene technische Probleme angehen.
  • Die Verfahren der vorliegenden Offenbarung könnten beispielsweise zum Aufbauen einer durchsuchbaren Ressource von Titel 21 verwendet werden, was der Teil des Code of Federal Regulations (21 CFR) ist, der andere Regulierungen, Richtlinien und regulatorische Prozesse verknüpft. Die Verfahren der vorliegenden Offenbarung könnten alleine oder in Kombination mit den bekannten Algorithmen zur Verwaltung unstrukturierter Informationen, zum Beispiel unter anderem Unstructured-Information-Management-Architecture(UIMA)-Apache-Solr-NLP-Algorithmus oder dergleichen, verwendet werden. Die Verwendungsfälle der Verfahren der vorliegenden Offenbarung können beispielsweise beim Extrahieren von Informationen bezüglich unerwünschter Arzneimittelwirkungen (UAWs) aus Verschreibungsarzneimitteletiketten in Health-Level-Seven(HL7)-Structured-Product-Labels (SPL) liegen.
  • Zusätzliche Aspekte werden teilweise in der folgenden Beschreibung dargelegt und werden teilweise aus der Beschreibung ersichtlich oder können durch Ausüben der präsentierten Ausführungsbeispiele erlernt werden.
  • Gemäß einem Aspekt eines Ausführungsbeispiels der vorliegenden Offenbarung ist ein Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell zum Anreichern eines pharmazeutischen semantischen Modells, das mit einem regulatorischen Status eines pharmazeutischen Produkts assoziiert ist, bereitgestellt, welches Folgendes umfasst: eine Datenvorbereitungseinheit, die zum Zugreifen auf Quellendateien, über ein Kommunikationsnetz, aus mehreren veröffentlichen heterogenen Datenquellen für pharmazeutische regulatorische Informationen ausgebildet ist; ein Computerverarbeitungsmodul, das zu Folgendem ausgebildet ist: Auswählen der Quellendateien, auf die über die Datenvorbereitungseinheit zugegriffen wird, gemäß einem vorbestimmten Regulierungsstatusdateiformat, Mining wenigstens einer Entität aus den ausgewählten Quellendateien basierend auf einem vorbestimmten F1-Maß-Wert und gemäß einem vorbestimmten Ontologieabgleichsalgorithmus, der mit durch Benutzer eingegebenen Abfragen abgleicht; Extrahieren wenigstens eines Datensatzes einschließlich ontologierelevanter verbundener regulatorischer Metadaten, die mit der Mining-unterzogenen Entität assoziiert sind, Speichern des extrahierten Datensatzes in einer Datenspeicherungseinheit; Verknüpfen des extrahierten Datensatzes mit einem oder mehreren Knoten des pharmazeutischen regulatorischen semantischen Modells.
  • Gemäß einem anderen Ausführungsbeispiel der vorliegenden Offenbarung umfasst das Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell ferner das Computerverarbeitungsmodul, das zum Mining ausgewählter Quellendateien in mehreren Sprachen basierend auf einem vorbestimmten F1-Maß-Wert und gemäß einem vorbestimmten Ontologieabgleichsalgorithmus, der mit durch Benutzer eingegebenen Abfragen abgleicht, ausgebildet ist.
  • Gemäß einem anderen Ausführungsbeispiel der vorliegenden Offenbarung umfasst das Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell ferner eine Neuronales-Netz-Vorrichtung mit wenigstens zwei Schichten zum Mining wenigstens einer Entität aus den ausgewählten Quellendateien basierend auf einem trainierten Ontologieabgleichsalgorithmus, der mit durch Benutzer eingegebenen Abfragen abgleicht.
  • Gemäß einem anderen Ausführungsbeispiel der vorliegenden Offenbarung umfasst das Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell ferner das Computerverarbeitungsmodul, das zum Auswählen von Datenquellendateien basierend auf einem SmPC(Summary of Product Characteristics - Zusammenfassung der Merkmale des Arzneimittels)- oder einem CMC(Chemistry and Manufacturing Control - Chemie- und Herstellungskontrolle)-Dateiformat ausgebildet ist.
  • Gemäß einem anderen Ausführungsbeispiel der vorliegenden Offenbarung kann die Datenvorbereitungseinheit des Anreicherungssystems für ein pharmazeutisches regulatorisches semantisches Modell zum Zugreifen auf Quellendateien bezüglich Organizations Management Services (OMS) oder Referential Management Services (RMS), über ein Kommunikationsnetz, von mehreren veröffentlichen pharmazeutischen regulatorischen heterogenen Datenquellen ausgebildet sein.
  • Gemäß einem anderen Ausführungsbeispiel der vorliegenden Offenbarung ist ein Anreicherungsverfahren für ein pharmazeutisches regulatorisches semantisches Modell zum Anreichern eines pharmazeutischen semantischen Modells, das mit einem regulatorischen Status eines pharmazeutischen Produkts assoziiert ist, bereitgestellt, welches Folgendes umfasst: Zugreifen auf Quellendateien, über ein Kommunikationsnetz, aus mehreren veröffentlichen heterogenen Datenquellen für pharmazeutische regulatorische Informationen; Auswählen von Datenaufzeichnungen aus den Datenquellen, auf die zugegriffen wurde, basierend auf einem vorbestimmten regulatorischen Format; Mining wenigstens einer Entität aus den ausgewählten Quellendateien basierend auf einem vorbestimmten F1-Maß-Wert und gemäß einem vorbestimmten Ontologieabgleichsalgorithmus, der mit durch Benutzer eingegebenen Abfragen abgleicht; Extrahieren wenigstens eines Datensatzes einschließlich ontologierelevanter verbundener regulatorischer Metadaten, die mit der Mining-unterzogenen Entität assoziiert sind, und Speichern des extrahierten Datensatzes in einer Datenspeicherungseinheit; Verknüpfen des extrahierten Datensatzes mit einem oder mehreren Knoten des pharmazeutischen regulatorischen semantischen Modells.
  • Gemäß einem anderen Ausführungsbeispiel der vorliegenden Offenbarung umfasst das Anreicherungsverfahren für ein pharmazeutisches regulatorisches semantisches Modell ferner Mining wenigstens einer Entität aus ausgewählten Quellendateien in mehreren Sprachen basierend auf einem vorbestimmten F1-Maß-Wert und gemäß einem vorbestimmten Ontologieabgleichsalgorithmus, der mit durch Benutzer eingegebenen Abfragen abgleicht.
  • Gemäß einem anderen Ausführungsbeispiel der vorliegenden Offenbarung umfasst das Anreicherungsverfahren für ein pharmazeutisches regulatorisches semantisches Modell ferner Mining wenigstens einer Entität aus den ausgewählten Quellendateien basierend auf einem trainierten Ontologieabgleichsalgorithmus an einem neuronalen Netz mit wenigstens zwei Schichten, der mit durch Benutzer eingegebenen Abfragen abgleicht.
  • Gemäß einem anderen Ausführungsbeispiel der vorliegenden Offenbarung umfasst das Anreicherungsverfahren für ein pharmazeutisches regulatorisches semantisches Modell ferner Auswählen von Datenquellendateien basierend auf einem SmPC(Summary of Product Characteristics)- oder einem CMC(Chemistry and Manufacturing Control)-Dateiformat.
  • Gemäß einem anderen Ausführungsbeispiel der vorliegenden Offenbarung umfasst das Anreicherungsverfahren für ein pharmazeutisches regulatorisches semantisches Modell ferner Zugreifen auf Quellendateien bezüglich Organizations Management Services (OMS) oder Referential Management Services (RMS), über ein Kommunikationsnetz, von mehreren veröffentlichen heterogenen Datenquellen pharmazeutischer regulatorischer Informationen.
  • Obwohl oben spezielle Vorteile aufgezählt wurden, können verschiedene Ausführungsformen, manche, keine oder alle der aufgezählten Vorteile aufweisen.
  • Andere technische Vorteile können einem Durchschnittsfachmann nach Durchsicht der folgenden Figuren und Beschreibung sogleich ersichtlich werden.
  • Es versteht sich zu Beginn, dass, obwohl Ausführungsbeispiele in den Figuren und der Beschreibung unten veranschaulicht sind, die Prinzipien der vorliegenden Offenbarung unter Verwendung einer beliebigen Anzahl an Techniken implementiert werden können, unabhängig davon, ob diese derzeit bekannt sind oder nicht. Die vorliegende Offenbarung sollte in keiner Weise auf die Ausführungsbeispiele und beispielhaften Techniken beschränkt werden, die in den Zeichnungen veranschaulicht und unten beschrieben sind.
  • Modifikationen, Hinzufügungen oder Auslassungen können an den Systemen und Verfahren, die hier beschrieben sind, vorgenommen werden, ohne den Schutzumfang der Offenbarung zu verlassen. Zum Beispiel können die Komponenten der Systeme und Verfahren integriert oder separiert werden. Zudem können die Vorgänge der Systeme und Verfahren, die hier offenbart sind, durch mehr, weniger oder andere Komponenten durchgeführt werden und die beschriebenen Verfahren können mehr, weniger oder andere Schritte beinhalten. Außerdem können Schritte in einer beliebigen geeigneten Reihenfolge durchgeführt werden. Wie in diesem Dokument verwendet, verweist „jedes“ auf jedes Element einer Gruppe oder jedes Element einer Untergruppe einer Gruppe.
  • Figurenliste
  • Diese und/oder andere Aspekte werden ersichtlich und sind sogleich aus der folgenden Beschreibung der Ausführungsbeispiele in Verbindung mit den begleitenden Zeichnungen verständlich, in denen gilt:
    • 1 ist ein konzeptuelles Diagramm, das ein Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell (SMES: Semantic Model Enriching System) gemäß einem Ausführungsbeispiel veranschaulicht;
    • 2 ist ein Diagramm zum Beschreiben von Rechenschritten, die durch das Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell (SMES) gemäß einem Ausführungsbeispiel durchgeführt werden.
  • AUSFÜHRLICHE BESCHREIBUNG
  • Es wird nun ausführlich auf Ausführungsformen Bezug genommen, wobei Beispiele für diese in den begleitenden Zeichnungen veranschaulicht sind, wobei gleiche Bezugsziffern durchgehend auf gleiche Elemente verweisen. In dieser Hinsicht können die vorliegenden Ausführungsbeispiele verschiedene Formen aufweisen und sollten nicht als auf die hier dargestellten Beschreibungen beschränkt ausgelegt werden. Entsprechend sind die Ausführungsbeispiele unten durch Bezugnahme auf die Figuren lediglich zum Erklären von Aspekten beschrieben. Wie hier verwendet, schließt der Ausdruck „und/oder“ beliebige und alle Kombinationen aus einem oder mehreren der assoziierten aufgelisteten Gegenstände ein. Ausdrücke, wie etwa „wenigstens eines von“, modifizieren, wenn sie einer Liste von Elementen voranstehen, die gesamte Liste von Elementen und modifizieren nicht die einzelnen Elemente der Liste.
  • Die Ausdrücke „gemäß manchen Ausführungsbeispielen“ oder „gemäß einem Ausführungsbeispiel“, die durch die Beschreibung hinweg verwendet werden, geben nicht notwendigerweise das gleiche Ausführungsbeispiel an.
  • Manche Ausführungsbeispiele der vorliegenden Offenbarung können durch Funktionalblockkonfigurationen und verschiedene Verarbeitungsvorgänge repräsentiert werden. Manche oder alle dieser funktionalen Blöcke können unter Verwendung verschiedener Anzahlen an Hardware- und/oder Softwarekomponenten implementiert werden, die spezielle Funktionen durchführen. Zum Beispiel können die funktionalen Blöcke der vorliegenden Offenbarung unter Verwendung eines oder mehrerer Mikroprozessoren oder Schaltkreise für eine gegebene Funktion implementiert werden. Außerdem können zum Beispiel die funktionalen Blöcke der vorliegenden Offenbarung in verschiedenen Programmier- oder Skriptsprachen implementiert werden. Die funktionalen Blöcke können mit Algorithmen implementiert werden, die auf einem oder mehreren Prozessoren ausgeführt werden. Die vorliegende Offenbarung kann auch herkömmliche Techniken für eine elektronischen Konfiguration, Signalverarbeitung und/oder Datenverarbeitung einsetzen. Die Ausdrücke „Mechanismus“, „Element“, „Einheit“ und „Konfiguration“ können in einem breiten Sinn verwendet werden und sind nicht auf mechanische und physische Konfigurationen beschränkt und können in Hardware, Firmware, Software und/oder Kombinationen davon implementiert werden.
  • Außerdem sind Verbindungslinien oder Verbindungselemente zwischen den Komponenten, die in den Zeichnungen veranschaulicht sind, lediglich veranschaulichend für funktionale Verbindungen und/oder physische Verbindungen oder Schaltkreisverbindungen. In tatsächlichen Vorrichtungen können Verbindungen zwischen den Komponenten durch verschiedene funktionale Verbindungen, physische Verbindungen oder Schaltkreisverbindungen repräsentiert werden, die ersetzt oder hinzugefügt werden können.
  • Währenddessen kann, mit Bezug auf die hier verwendeten Ausdrücke, Vorlage auf ein beliebiges ausführbares oder nichtausführbares Dateiformat mit verschiedenen Dateierweiterungen verweisen. Vorlage kann auch auf eine beliebige Bildrepräsentation eines physischen oder virtuellen Dokuments wie Webseiten oder gescannte Bilder oder eine beliebige andere virtuelle Entität verweisen, von der es möglich ist, digitalisierte Informationen bezüglich der (den) chemischen Struktur(en) zu erhalten. Die Bildrepräsentation der Vorlage kann (einen) vollständige(n) oder (einen) partielle(n) Abschnitt(e) des physischen oder virtuellen Dokuments umfassen. Die Vorlage kann auch Standardaustauschdateiformate umfassen, die mit den regulatorischen Richtlinien kompatibel sind, wie etwa unter anderem Summary of Product Characteristics (SmPC) oder Chemistry, Manufacturing, and Controls (CMC) Regulatory Affairs (RA) oder dergleichen.
  • Außerdem kann eine Ontologie auf ein Vokabular und eine Spezifikation der Bedeutung von Ausdrücken verweisen, die in dem Vokabular verwendet werden, das pharmazeutische regulatorische Prozesse beschreibt. Zum Beispiel können Ontologien unter anderem die Deskriptoren umfassen, die zum Beschreiben der Informationen in dem SmPC- oder CMC(Chemistry, Manufacturing and Controls)-Modul 3 verwendet werden. Dies kann zum Beispiel Namen des medizinischen Produkts, qualitative und quantitative Zusammensetzung, pharmazeutische Form, klinische Einzelheiten, zum Beispiel Posologie und Verfahren der Verabreichung, Kontraindikationen, Überdosierung, unerwünschte Effekte oder dergleichen, pharmakologische Eigenschaften, zum Beispiel pharmakodynamische oder pharmakokinetische Eigenschaften, oder pharmazeutische Einzelheiten, zum Beispiel Haltbarkeit, Beschaffenheit und Inhalte eines Behälters, oder dergleichen beinhalten.
  • Außerdem können heterogene Datenquellen unter anderem auf Datenquellen verweisen, die sowohl strukturierte, halbstrukturierte und unstrukturierte Datenquellen umfassen. Strukturierte Daten sind Daten, die ein vordefiniertes Datenmodell einhalten und sind daher einfach zu analysieren. Strukturierte Daten entsprechen einem tabellarischen Format mit einer Beziehung zwischen den verschiedenen Zeilen und Spalten. Übliche Beispiele für strukturierte Daten sind Excel-Dateien oder SQL-Datenbanken. Diese weisen jeweils strukturierte Zeilen und Spalten auf, die sortiert werden können. Unstrukturierte Daten sind Informationen, die entweder kein vordefiniertes Datenmodell haben oder nicht auf eine vordefinierte Weise organisiert sind. Unstrukturierte Informationen sind typischerweise textlastig, aber können Daten, wie etwa Datum, Zahlen als auch Fakten, enthalten. Dies führt zu Unregelmäßigkeiten und Mehrdeutigkeiten, die ein Verständnis unter Verwendung traditioneller Programme im Vergleich zu Daten schwierig machen, die in strukturierten Datenbanken gespeichert sind. Übliche Beispiele für unstrukturierte Daten schließen Audio-, Videodateien oder nicht-SQL-basierte Datenbanken ein. Halbstrukturierte Daten sind eine Form strukturierter Daten, die nicht der formalen Struktur von Datenmodellen entsprechen, die mit relationalen Datenbanken oder anderen Formen von Datentabellen assoziiert sind, aber trotzdem Tags oder andere Markierungen enthalten, um semantische Elemente zu separieren und Hierarchien von Aufzeichnungen und Feldern innerhalb der Daten zu separieren. Metadaten sind Daten über Daten. Sie sind keine separate Datenstruktur und stellen zusätzliche Informationen über einen speziellen Satz von Daten einer beliebigen Kategorie, wie oben aufgelistet, bereit.
  • Außerdem kann Mining auf das Analysieren großer Mengen an Daten, um Muster zu entdecken, oder Auswählen von Daten aus großen Mengen an Daten basierend auf Parameterwerten oder Attributen verweisen. Es kann auch der Prozess des Versuchens sein, verfeinerte Datensätze aus einem großen Datensatz zu erhalten.
  • Außerdem soll der Ausdruck „Bedeutung“ auf die semantische Interpretation eines speziellen Ontologieausdrucks, Inhaltsnamenfeldes oder dergleichen verweisen. Der Ausdruck Bedeutung schließt daher die beabsichtigte Bedeutung des Ontologieausdrucks oder Inhaltsfeldes ein, zum Beispiel um Probleme, wie etwa Homonyme, Synonyme, Meronyme oder dergleichen, zu berücksichtigen, wie unten ausführlicher beschrieben wird.
  • Außerdem kann Ausdrucksabgleich auf Ontologieabgleich verweisen. In technischer Hinsicht handelt es sich um eine semantische Zuordnung zwischen zwei Ontologien, zum Beispiel durch Benutzer eingegebene Abfragen und Miningunterzogene Entitäten, unter Verwendung eines Ontologieabgleichsalgorithmus. Der Ausdruck Entität kann auf eine semantisch zugeordnete Ontologie basierend auf der eingegebenen Abfrage des Benutzers verweisen.
  • Außerdem kann der Ausdruck Verknüpfung auf eine Erzeugung von Verknüpfungen zwischen einem semantischen Modell und Metadaten verweisen, die mit Mining-unterzogenen Entitäten assoziiert sind. Es wird ein Verknüpfte-Daten-Paradigma erzeugt, das die Wiederverwendung von bestehendem Wissen ermöglicht. Verknüpfte-Daten-Standards können auf Metadaten, zum Beispiel Resource Description Framework (RDF) für Metadaten, angewandt werden. Dementsprechend können die verknüpften Daten durch Ausnutzung bestehender Vokabulare zum Verbessern des bestehenden semantischen Modells verwendet werden.
  • Zu Veranschaulichungszwecken über die folgende Beschreibung hinweg wird der Ausdruck „Quelle“ verwendet, um auf einen Datenspeicher, wie etwa eine Datenbank oder Datei, zu verweisen, aus dem Daten extrahiert werden, während der Ausdruck „Ziel“ verwendet wird, um auf einen Datenspeicher, wie etwa eine Datenbank oder eine Datei, zu verweisen, in dem Daten gespeichert werden. Diese Ausdrücke dienen lediglich Veranschaulichungszwecken, zum Beispiel, um zwischen möglichen Quellen und Zielen zu unterscheiden, und sollen nicht beschränkend sein.
  • Der Ausdruck „Inhaltsinstanz“ verweist auf ein einzelnes Inhaltselement, das aus einer Quelle extrahiert und/oder zu einem Ziel transferiert wird, und soll ebenfalls nicht beschränkend sein. Zum Beispiel könnte der Ausdruck Inhaltsinstanz auf eine Datenbankaufzeichnung mit Werten, die in einer Anzahl an verschiedenen Datenbankfeldern gespeichert sind, oder einen Satz zusammengehöriger Datenbankaufzeichnungen verweisen oder könnte alternativ dazu auf einen einzigen Wert verweisen, der innerhalb eines einzigen Feldes gespeichert ist.
  • Außerdem kann Domäne auf eine beliebige hierarchische Kategorisierung in den Richtlinien beispielsweise bezüglich der regulatorischen Prozesse verweisen, wie etwa unter anderem Summary of Product Characteristics /(SmPC) oder Chemistry, Manufacturing, and Controls (CMC) Regulatory Affairs (RA) oder dergleichen.
  • Außerdem kann Regelsatz auf das Abgleichen von Ontologien durch das Finden von Entsprechungen zwischen semantisch bezogenen Entitäten von Ontologien verweisen. Dies reduziert die semantische Lücke zwischen verschiedenen sich überschneidenden Repräsentationen derselben Domäne. Diese Entsprechungen können für verschiedene Aufgaben verwendet werden, wie etwa Ontologiezusammenführung, Abfragebeantwortung oder Datenübersetzung. Dementsprechend kann das Abgleichen von Ontologien ermöglichen, dass das Wissen und die Daten, die mit Bezug auf die abgeglichenen Ontologien ausgedrückt sind, zusammenwirken. Die Verfahren der vorliegenden Offenbarung können mit beliebigen bekannten Ontologieabgleichsalgorithmen, zum Beispiel unter anderem formal oder informal ressourcenbasiert, Stringbasiert, sprachbasiert, einschränkungsbasiert, taxonomiebasiret, entwurfsbasiert, instanzbasiert oder modellbasiert oder dergleichen, verwendet werden.
  • Außerdem kann ein künstliches neuronales Netz (KNN) auf eine Sammlung von vollständig oder teilweise verbundenen Einheiten verweisen, die Informationen zum Umwandeln von Eingangsdaten in Ausgangsdaten umfassen.
  • Außerdem kann Maschinenlernen (ML) auf ein ML-basiertes Ontologieangleichungssystem verweisen, das einen Klassifikator unter Verwendung von Techniken, zum Beispiel Support Vector Machine (SVM - Stützvektormaschine), K-Nearest Neigbors (KNN - K nächste Nachbarn), Decision Tree (DT - Entscheidungsbaum), AdaBoost oder dergleichen, verwendet.
  • Außerdem kann ein Metrikmaß zum Beurteilen einer ontologiebasierten Informationsextraktion verweisen. Die vorliegende Offenbarung kann mit verschiedenen Typen von Metriken kombiniert werden, zum Beispiel unter anderem einer kostenbasierten Beurteilungsmetrik, Lerngenauigkeitsmetriken, die messen, wie gut die Ontologie besetzt ist, eine erweiterte Genauigkeit-und-Trefferquote-Metrik oder ein F1-Maß, das Genauigkeits-, Trefferquotenmetriken verwendet. Dabei misst Genauigkeit die Anzahl an korrekt identifizierten Gegenständen als ein Prozentsatz der Anzahl an identifizierten Gegenständen und misst Trefferquote die Anzahl an korrekt identifizierten Gegenständen als ein Prozentsatz der Gesamtanzahl an korrekten Gegenständen.
  • Außerdem verweisen strukturierte Daten auf Daten mit einer beliebigen Art von Informationen, die als Metadaten zu den ursprünglichen Daten hinzugefügt wurden, um Teile der ursprünglichen Daten zu gruppieren, wodurch die automatische Verarbeitung der resultierenden Informationen stromabwärts ermöglicht wird.
  • Nachfolgend werden beispielhafte Ausführungsformen der vorliegenden Offenbarung ausführlich unter Bezugnahme auf die begleitenden Zeichnungen beschrieben.
  • Ein Beispiel für den Prozess zum Anreichern eines pharmazeutischen regulatorischen semantischen Modells von externen Datenbanken, wie etwa veröffentlichten pharmazeutischen regulatorischen Datenbanken oder dergleichen, wird nun unter Bezugnahme auf 1 beschrieben.
  • 1 stellt ein beispielhaftes System dar, das ein Beispiel für ein Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell (SMES) 10 veranschaulicht. Das SMES 10 beinhaltet eine (nicht gezeigte) Netzschnittstelle, eine Datenvorbereitungseinheit (DP) 15, eine Datenspeicherungseinheit (DI) 16, ein Computerverarbeitungsmodul 17, eine (nicht gezeigte) Datenkurator-und-Integrator-Einheit (DC), eine (nicht gezeigte) Benutzerschnittstelle und ein semantisches Modell für einen regulatorischen Prozess 19.
  • Das Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell (SMES) 10 ist über die Netzschnittstelle 14 mit externen Datenquellen, wie externen Datenbanken 12, Cloud-basierten Diensten 13, Web-Ressourcen 11, verbunden.
  • Das SMES 10 wird durch eine (in der 1 nicht gezeigte) intuitive Benutzeroberfläche (UI) gesteuert, durch die der Benutzer: Abfragen erstellt und absendet; die gefundenen Informationen überprüft; Berichtpräferenzen auswählt; und Bereiche ausgibt (z. B. druckt). Benutzer werden identifiziert und ihr Zugang wird durch ein Sicherheitssystem beim Anfordern eines Zugriffs auf das SMES 10 über Benutzern zugewiesene Passwörter und Kennungen authentifiziert. Die Kennungen definieren das Zugriffsniveau der Benutzer und die Arten von Informationen, für die sie eine Zugangsberechtigung haben. Zum Beispiel ist ein Benutzer möglicherweise nur an dem Zugriff auf regulatorische Informationen bezüglich medizinischer Vorrichtungen interessiert. Von daher wären andere Kategorien regulatorischer Informationen (d. h. pharmazeutische Gefahren oder Umweltgefahren) nicht zugänglich.
  • Das SMES 100 kann auf Quellendateien von mehreren heterogenen Informationsquellen zugreifen, die jeweils verschiedene Informationsarten (z. B. verschiedene Dateien, verschiedene Aufzeichnungen mit jeder Datei, verschiedene Felder innerhalb jeder Aufzeichnung usw.) aufweisen können. Manche Informationstypen werden aus öffentlichen Webseiten 11 extrahiert, wobei sich diese Informationen innerhalb des Textes einer Webseite oder in einer downloadbaren Datei befinden können. Zum Beispiel veröffentlicht die europäische Arzneimittelagentur (EMA: European Medicine Agency) Informationen über menschliche oder veterinäre Medikamente (pharmazeutische Produkte) in verschiedenen Stufen ihres Lebenszyklus, von der frühen Entwicklung über eine anfängliche Beurteilung bis zu Änderungen nach der Zulassung, Sicherheitsüberprüfungen und Widerrufen der Zulassung. Außerdem sind beispielsweise Berichte über unerwünschte Ereignisse für medizinische Vorrichtungen typischerweise in einer downloadbaren Datei enthalten, die in eine Datenbank importiert werden kann und von MedDRA - dem Medizinischen Wörterbuch für Aktivitäten im Rahmen der Arzneimittelzulassung (Medical Dictionary for Regulatory Activities) - verfügbar ist.
  • Jede Datenquelle, auf die zugegriffen wird, hat ihre eigenen Charakteristiken und ihren eigenen Stil zum Präsentieren von Daten. Dementsprechend weisen die Daten von jeder Quelle einen definierten Satz an Regeln und ein Regime zur Konversion innerhalb der Datenvorbereitungseinheit DP 15 auf. Jede Art von Informationen in den Datenaufzeichnungen, auf die zugegriffen wird, kann in ein konsistentes digitales Format konvertiert werden, das zum Importieren in eine elektronische Datenbank geeignet ist. Zum Beispiel können abgerufene Daten in einem Portable Data Format (.PDF) oder in einem Format mit Tab-getrenntem Text vorliegen. Eine auf einer Webseite veröffentlichte Tabelle wird extrahiert, in spezifizierte Datenfelder aufgeschlüsselt und in ein Spreadsheet oder in Tab-getrennten Text konvertiert. Eine angemessene Konvertierung der Datenaufzeichnungen, auf die zugegriffen wurde, wird vor dem Datenextraktionsschritt abgeschlossen.
  • Datenkorrekturen werden durch die Vorbereitungseinheit DP 15 für Dateninkonsistenzen vorgenommen, um eine Konsolidierung und Integration von Daten von mehreren Quellen zu erlauben. Fehler können in Datensätzen vorhanden sein, die von einer Informationsquelle erhalten werden. Zum Beispiel kann die Datenauflistung für klinische Prüfer von klinischen Arzneimitteltests mehrere Auflistungen beinhalten, die mit einer Sequenz „YYY“ beginnen. Falls diese Daten nicht korrigiert würden, würden Suchen nach „Manuel Schmidt“ eine Aufzeichnung für „Manuel YYY Schmidt“ nicht erkennen. Ein Mittel zum Identifizieren solcher Fehler und zum Korrigieren von ihnen, wie etwa ein oder mehrere vorbestimmte Filter, können durch Software und/oder Hardware bereitgestellt werden. Wenn neue Diskrepanzen entdeckt werden, können das System und das Verfahren ein oder mehrere vorbestimmte Filter hinzufügen, verändern oder löschen, um Diskrepanzen zu identifizieren und zu korrigieren, wenn sie identifiziert werden.
  • Mit der Zeit können die Informationsquellen die Art ändern, auf die die Informationen gesammelt und/oder gemeldet werden. Zum Beispiel konvertieren Informationsquellen ihre häufig verwendeten Informationen (zum Beispiel Berichte über unerwünschte Ereignisse oder Etablierungsregistrierungen) zunehmend in ein über eine Webschnittstelle durchsuchbares Format. Das SMES 10 beinhaltet interne Prüfungen, die auftretende Änderungen detektieren, um die Datenzugriffshäufigkeit angemessen anzupassen.
  • Eine Inkonsistenz der Terminologie ist über heterogene Informationsquellen (z. B. disparate Datenquellen) hinweg wahrscheinlich, die darin begründet sein kann, dass jede Datenquelle hinsichtlich einer speziellen Verwendung erstellt wurde, die sich von jener anderen Datenquellen unterscheidet. Diese Daten müssen dann vor einer Datenkuration und -integration 18 normalisiert werden. Wenn sich regulatorische Anforderungen ändern, kann sich ein gesamtes Schema von Informationen ändern. Das SMES 10 detektiert und erlaubt eine Kompensation dieser Änderungen.
  • Das Computerverarbeitungsmodul 17 führt ein Mining von Entitäten basierend auf der Eingabe des Benutzers oder einer Liste eigegebener Abfragen, indem es einen Ontologieabgleich an den Datenquellen durchführt, auf die zugegriffen wurde. Dies kann abgeglichene Ontologiedatenaufzeichnungen von den Datenquellen zurückgeben, auf die zugegriffen wurde. Alternativ dazu können auch Datensätze von den abgeglichenen Datenaufzeichnungen der Datenquellen, auf die zugegriffen wurde, durch das Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell (SMES) 10 der vorliegenden Offenbarung extrahiert werden.
  • Das Computerverarbeitungsmodul 17 gemäß dem vorliegenden Beispiel ermöglicht einen semantischen Abgleich, indem Beziehungen zwischen Elementen der Datenaufzeichnungen, auf die zugegriffen wird, und ihren Metadatenelementen berücksichtigt werden, um den Umfang des Ontologieabgleichs zu verbessern.
  • Das Computerverarbeitungsmodul 17 kann versuchen, einen Umfang der Suchergebnisse auf regulatorische Statusdokumente wie etwa Spreadsheet-Dokumente zu erweitern, die Tabellen, Grafiken, Berichte, Diagramme, gefilterte Grafiken/Tabellen und ähnliche Elemente enthalten. Manche dieser Elemente können durch eine Anwendung außer der Spreadsheet-Anwendung, die mit dem Spreadsheet-Dokument assoziiert ist, erzeugt und statisch oder dynamisch in das Spreadsheet-Dokument eingebettet werden (d. h. Elementdaten befinden sich bei einer externen Quelle). Beispielhafte Spreadsheet-Dokumente in den Datenquellen, auf die zugegriffen wird, können einen Textbericht, eine Tabelle, ein Diagramm und Videodaten (Präsentation) beinhalten. Ein Textbericht beinhaltet Verknüpfungen zu einzelnen Nichttextelementen. Des Weiteren können eine Tabelle und ein Diagramm assoziiert sein (z. B. ein Teil der Daten in einer Tabelle kann in einem Diagramm angezeigt sein).
  • Andere Beziehungen sind ebenfalls möglich.
  • Das Computerverarbeitungsmodul 17 kann Metadaten extrahieren, die die Einzelheiten des regulatorischen Status bezüglich verwandter Informationen enthalten. Zum Beispiel kann ein Spreadsheet-Dokument in den Datenaufzeichnungen, auf die zugegriffen wird, mehrere Blattfiltertabellen beinhalten. Jede Filtertabelle kann eine Vielzahl an Filtern beinhalten. Das Spreadsheet-Dokument kann ferner Diagramme und/oder Grafiken basierend auf Daten beinhalten, die in dem Spreadsheet-Dokument gespeichert sind und/oder bei einer externen Ressource (z. B. einem anderen Spreadsheet-Dokument, einem Datenspeicher usw.) gespeichert sind. Die Grafiken und/oder Diagramme können basierend auf dem Filtern der Daten gemäß einem oder mehreren der Filter in der Filtertabelle erzeugt werden. Dementsprechend Spiegeln die Elemente in dem Spreadsheet-Dokument möglicherweise nicht das gesamte Ausmaß der verfügbaren Daten wider. Zudem können Beziehungen zwischen den Elementen (z. B. zwischen den Tabellen und Grafiken, Videodaten und Tabellen usw.) für einen Benutzer hilfreich sein, um die Wichtigkeit oder Relevanz abgerufener Daten zu bestimmen und eine Client-Suchbenutzeroberfläche und eine Ergebnisanzeige dynamisch zu steuern.
  • Weil die Daten in dem Spreadsheet-Dokument beschränkt (z. B. aus den verfügbaren Daten bei der externen Datenquelle gefiltert) sein können, kann das Computerverarbeitungsmodul 17 zusätzliche Informationen aus der Datenquelle abrufen, um die Suchergebnisse anzureichern. Zum Beispiel können zusätzliche Dimensionselemente außer den angewandten Filterelementen aus den Daten bei der Datenquelle abgerufen werden. Dimensionen, Hierarchien und Maßinformationen gespeicherter Daten können auch abgerufen werden. Dementsprechend können ausführliche Metadaten und ein Datensatz auf eine strukturelle und bedeutungsvolle Weise extrahiert und verwendet werden, um die Suchergebnisse bezüglich Dokumenten mit Bezug auf einen regulatorischen Status zu untersuchen und Variationen der Ergebnisinhaltsanzeige einer Rendering-Anwendung dynamisch zu steuern.
  • Während dieses Beispiel spezifisch für ausgewählte Datenaufzeichnungen aus einer relationalen Datenbank ist, versteht es sich, dass ähnliche Konzepte auf eine andere Datenstruktur oder unstrukturierte Datenquellen angewandt werden können und dass dieses Beispiel lediglich der Veranschaulichung dient und nicht beschränkend sein soll.
  • Die extrahierten Datenaufzeichnungen und/oder Datensätze können in der lokalen Datenspeicherungseinheit 16 zur weiteren Verarbeitung und anschließenden Verwendung gespeichert werden.
  • Die Ausgabe des Computerverarbeitungsmoduls 17 wird in die Datenkurator-und-Integrator-Einheit (DC) eingegeben. Die DC führt eine Qualitätsprüfung an den extrahierten Datenaufzeichnungen oder Datensätzen durch, die beide die assoziierten Metadaten beinhalten, und verknüpft die extrahierten Informationen semantisch mit einem oder mehreren Knoten des pharmazeutischen regulatorischen semantischen Modells. Dementsprechend wird das pharmazeutische regulatorische semantische Modell angereichert.
  • Ein Beispiel für eine Extraktion basierend auf einem F-Maß-Wert wird nun beschrieben, das durch das Computerverarbeitungsmodul 17 unter Verwendung eines Ontologieabgleichsalgorithmus durchgeführt wird.
  • Eine F-Bewertung ist ein Maß für eine algorithmische Zuverlässigkeit und kann basierend auf Genauigkeit und Trefferquote des Ontologievergleichsalgorithmus berechnet werden. Die Genauigkeit ist ein Maß der Exaktheit oder Zuverlässigkeit, wohingegen die Trefferquote ein Maß der Vollständigkeit ist. Genauigkeit und Trefferquote können auf richtig positiv (tp), richtig negativ (tn), falsch positiv (fp) und falsch negativ (fn) der Konzept-String-Assoziationen basieren. Die Genauigkeit kann auf der folgenden Gleichung basieren: Genauigkeit = tp / ( tp + fp )
    Figure DE102020002607A1_0001
  • Die Trefferquote kann auf der folgenden Gleichung basieren: Trefferquote = tp / ( tp + fn )
    Figure DE102020002607A1_0002
  • Bei der obigen Ausführungsform ist der Grad sowohl der Genauigkeit als auch der Trefferquote umso höher, je näher der Wert der F1-Berwertung an 1,0 ist. Die folgende Gleichung kann zum Berechnen des Wertes der F1-Bewertung verwendet werden: F 1 Bewertung Wert = 2 * ( Genauigkeit * Trefferquote ) / ( Genauigkeit + Treffer quote ) .
    Figure DE102020002607A1_0003
  • Das Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell (SMES) führt ein Mining unter Verwendung kontrollierter Vokabulare durch und ein Mining von Entitäten in der Quellendatei erfolgt basierend auf einer F1-Bewertung zwischen 0,95 und 1.
  • 2 stellt beispielhafte Verfahrensschritte zum Anreichern eines pharmazeutischen regulatorischen semantischen Modells dar, das mit einem regulatorischen Status eines pharmazeutischen Produkts assoziiert ist.
  • In Schritt S201 greift die Datenvorbereitungseinheit 15 auf Quellendateien, über ein Kommunikationsnetz, aus mehreren veröffentlichen heterogenen Datenquellen für pharmazeutische regulatorische Informationen zu. Auf Daten kann von einer Vielzahl von Quellen, wie externen Datenbanken 12, Cloud-basierten Diensten 13, Webressourcen 11, zugegriffen werden. Auf die Daten kann durch eine Datenbankverbindung zugegriffen werden, die ermöglicht, dass das Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell (SMES) mit einer Datenbankserversoftware spricht. Ein Anwendungstreiber kann mit dem SMES verwendet werden, wobei die Informationen, die zum Verbinden mit einer Datenbank oder Cloud-Diensten oder dergleichen benötigt werden, in dem SMES enthalten sind, das den Benutzer zur Authentifizierung auffordert, bevor die Verbindung hergestellt wird. Alternativ dazu können Instanzenzusammenführungsmodule verwendet werden, um eine Instanzenumgebung zu erzeugen, die dem Herstellen der Verbindung dient. Das SMES kann Sockets oder dergleichen zum Zugreifen auf Datenserver über das Web beinhalten.
  • In Schritt S202 wählt das Computerverarbeitungsmodul 17 Quellendateien gemäß einem vorbestimmten Dateiformat für den regulatorischen Status aus. Dies kann durch Erzeugen von Filtern auf einer Datenquelle ausgeführt werden, wodurch die Menge an Daten reduziert wird, die aus den verfügbaren in den Datenquellen auszuwählen sind. Zum Beispiel können Javascript/jQuery-Grid mit Frameworks wie Angular und ReactJS verwendet werden, um Quellendateien auszuwählen, die einem vorbestimmten Dateiformat des regulatorischen Status entsprechen.
  • In Schritt S203 führt der ontologische Abgleichsalgorithmus ein Mining der Entitäten, die mit durch den Benutzer eingegebenen Abfragen übereinstimmen, basierend auf einem vorbestimmten Wert des F1-Maßes durch. Allgemein wird ein Wert des F1-Maßes so gewählt, dass er so nahe wie möglich an 1 ist. Es können Ontologieabgleichsalgorithmen, zum Beispiel unter anderem formal oder informal ressourcenbasiert, Stringbasiert, sprachbasiert, einschränkungsbasiert, taxonomiebasiret, entwurfsbasiert, instanzbasiert oder modellbasiert oder dergleichen, verwendet werden.
  • In Schritt S204 extrahiert das Computerverarbeitungsmodul 17 einen Datensatz einschließlich Metadaten, die mit der Mining-unterzogenen Entität assoziiert sind. Dies kann unter Verwendung von Web-Scrapping-Werkzeugen oder -Techniken, wie Dokument-Parsing oder Tokenisierung, implementiert werden. Alternativ dazu können Techniken, wie Named Entity Recognition (Eigennamenerkennung), verwendet werden, um wichtige Namen, wie Arzneimittelinhalt, Dosierung, Erkrankung usw., aus dem Text zu erkennen. In Schritt 204 kann das SMES sowohl trainingsbasierte Verfahren/Ortslexikon als auch grammatikbasierte zur Eigennamenerkennung verwenden. Außerdem können Sequenzkennzeichnungsverfahren wie Conditional Random Fields oder verdeckte Markov-Modelle für einen trainingsbasierten Ansatz verwendet werden. Semantisches Parsen kann verwendet werden, um verschiedene Syntaxaspekte und semantische Aspekte in einem Text zu analysieren und verschiedene Worte zu verbinden, die in unstrukturierten Daten vorhanden sind. Es wird für einen Fachmann ersichtlich sein, dass dieser Schritt auch mit eigenständigen Datenextraktionswerkzeugen in Kombination mit dem SMES 10 implementiert werden kann.
  • In Schritt S205a (nicht gezeigt) kann der extrahierte Datensatz lokal zur Wiederverwendung gespeichert werden. Alternativ dazu kann der extrahierte Datensatz direkt zum Verknüpfen des Datensatzes einschließlich Metadaten zum Anreichern eines pharmazeutischen regulatorischen semantischen Modells verwendet werden, das mit einem regulatorischen Status eines pharmazeutischen Produkts assoziiert ist.
  • In Schritt S205 verknüpft das System gemäß der vorliegenden Offenbarung den extrahierten Datensatz einschließlich Metadaten zum Anreichern eines pharmazeutischen regulatorischen semantischen Modells, das mit einem regulatorischen Status eine pharmazeutischen Produkts assoziiert ist. Dies kann durch Erzeugen von Verknüpfungen zwischen einem semantischen Modell und Metadaten, die mit Mining-unterzogenen Entitäten assoziiert sind, implementiert werden. Verknüpfte-Daten-Standards können auf Metadaten, zum Beispiel Resource Description Framework (RDF) für Metadaten, angewandt werden. Verknüpfungen können unter Verwendung eines HTML-Ankers hergestellt werden.
  • Ein Beispiel für ein Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell (SMES) gemäß der vorliegenden Offenbarung könnte in sprachbewusstem Ontologieabgleich vorliegen. Sprachbewusster oder mehrsprachiger Abgleich ist ein Typ eines Ontologieabgleichs, bei dem ein Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell (SMES) Ontologien abgleichen kann, die in mehreren Sprachen ausgedrückt sind. Das Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell gemäß diesem Beispiel der vorliegenden Offenbarung umfasst eine erweiterbare mehrsprachige Wissensbasis als eine Hauptquelle für Hintergrundwissen und einen mehrsprachigen Labelprozessor, der auf neue Sprachen erweiterbar ist. Das Hintergrundwissen ist eine Wissensbasis, die lexikale Datenbanken (z. B. WordNet) für jede unterstützte Sprache enthält, wobei eine sprachenunabhängige Ontologie von Konzepten als eine Interlingua dient. Eine Labelverarbeitung besteht aus einem sprachbewussten Label-Parsing-Schritt. Label-Parsing ist eine mehrsprachige natürliche Sprachverarbeitungsaufgabe, die für die Sprache leichtgewichtiger Ontologielabels optimiert ist, und ist durch sprachenspezifische NLP-Komponenten erweiterbar. Label-Parsing besteht aus den folgenden Schritten: (a) Sprachdetektion, die die Sprache jedes Eingabebaums explizit macht, und Berechnung einer Formelstruktur, die das Label unter Verwendung syntaktischer NLP-Techniken parst, die teilweise verallgemeinert sind und teilweise für jede unterstützte Sprache angepasst sind, Berechnung atomarer Konzepte, die bedeutungsvolle Worte in der Sprache als sprachunabhängige Konzepte formalisieren.
  • Dementsprechend kann ein Mining der mehrsprachigen Quellendatei durchgeführt werden und kann dem Anreichern des pharmazeutischen regulatorischen semantischen Modells dienen.
  • Gemäß einem anderen Beispiel der vorliegenden Offenbarung kann das Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell (SMES) eine überwachte oder nichtüberwachte Maschinenlernvorrichtung beinhalten.
  • Die Maschinenlernvorrichtung arbeitet in zwei Phasen (i) der Lern- oder Trainingsphase und (ii) der Klassifizierungs- oder Abgleichphase. Während der Lernphase werden die Trainingsdaten für den Lernprozess erzeugt, zum Beispiel durch manuellen Abgleich von zwei Ontologien, so dass das System einen Abgleicher (trainierter Ontologieabgleichsalgorithmus) aus diesen Daten lernt. Während der Klassifizierung der Abgleichsphase wird der gelernte Ontologieabgleichsalgorithmus zum Mining der relevanten Metadaten aus den externen Quellendateien verwendet. Die Genauigkeit des Mining-unterzogenen Datensatzes wird zur weiteren Verbesserung an das System zurückgeleitet. Dementsprechend wird das semantische Modell angereichert.
  • Außerdem können die zuvor genannten Beispiele in der Form eines Aufzeichnungsmediums einschließlich Anweisungen ausgeführt werden, die durch einen Computer ausführbar sind, wie etwa ein Programmmodul, das durch einen Computer ausgeführt wird. Das computerlesbare Medium kann ein beliebiges Aufzeichnungsmedium sein, auf das durch einen Computer zugegriffen werden kann und das flüchtige und nichtflüchtige Medien und Wechsel- und Nichtwechselmedien einschließen kann. Das computerlesbare Medium kann ein nichttransitorisches computerlesbares Medium beinhalten, das eine oder mehrere Anweisungen speichert, die bei Ausführung durch einen oder mehrere Prozessoren den einen oder die mehreren Prozessoren zum Durchführen von Vorgängen veranlasst, die mit hier beschriebenen Ausführungsbeispielen assoziiert sind. Außerdem kann das computerlesbare Medium Computerspeicherungsmedien und Kommunikationsmedien einschließen. Die Computerspeicherungsmedien können flüchtige und nichtflüchtige und Wechsel- und Nichtwechselmedien einschließen, die unter Verwendung eines beliebigen Verfahrens oder einer beliebigen Technologie zum Speichern von Informationen, wie etwa computerlesbarer Anweisungen, Datenstrukturen, Programmmodulen oder anderer Daten, implementiert sind. Die Kommunikationsmedien schließen computerlesbare Anweisungen, Datenstrukturen, Programmmodule oder andere Daten in einem modulierten Datensignal oder andere Transportmechanismen ein und beinhalten beliebige Lieferungsmedien.
  • Außerdem kann der Ausdruck „System“ über die Beschreibung hinweg eine Hardwarekomponente, wie etwa ein Mikroprozessor, oder ein Schaltkreis und/oder eine Softwarekomponente sein, die durch die Hardwarekomponente ausgeführt wird, wie etwa ein FPGA.
  • Die obige Beschreibung der vorliegenden Offenbarung ist zu Veranschaulichungszwecken bereitgestellt und es versteht sich für einen Fachmann, dass verschiedene Änderungen und Modifikationen vorgenommen werden können, ohne das technische Konzept und wesentliche Merkmale der vorliegenden Offenbarung zu ändern. Dementsprechend ist es klar, dass die oben beschriebenen veranschaulichenden Ausführungsbeispiele in allen Aspekten veranschaulichend sind und die vorliegende Offenbarung nicht beschränken. Zum Beispiel kann jede Komponente, die als von einem Einzeltyp beschrieben ist, auf eine verteilte Weise implementiert werden. Gleichermaßen können Komponenten, die als verteilt beschrieben sind, auf eine kombinierte Weise implementiert werden.
  • Es versteht sich, dass hier beschriebene Ausführungsbeispiele lediglich in einem beschreibenden Sinn und nicht zu Zwecken der Beschränkung betrachtet werden sollten. Beschreibungen von Merkmalen oder Aspekten innerhalb jedes Ausführungsbeispiels sollten typischerweise als für andere ähnliche Merkmale oder Aspekte in anderen Ausführungsbeispielen verfügbar betrachtet werden.
  • Obwohl ein oder mehrere Ausführungsbeispiele unter Bezugnahme auf die Figuren beschrieben wurden, versteht es sich für einen Durchschnittsfachmann, dass verschiedene Änderungen an Form und Einzelheiten vorgenommen werden können, ohne von dem Gedanken und dem Schutzumfang, wie durch die folgenden Ansprüche definiert, abzuweichen.

Claims (12)

  1. Anreicherungssystem für ein pharmazeutisches regulatorisches semantisches Modell zum Anreichern eines pharmazeutischen semantischen Modells, das mit einem regulatorischen Status eines pharmazeutischen Produkts assoziiert ist, welches Folgendes umfasst: eine Datenvorbereitungseinheit, die zum Zugreifen auf Quellendateien, über ein Kommunikationsnetz, aus mehreren veröffentlichen heterogenen Datenquellen für pharmazeutische regulatorische Informationen ausgebildet ist; und ein Computerverarbeitungsmodul, das zu Folgendem ausgebildet ist: Auswählen der Quellendateien, auf die über die Datenvorbereitungseinheit zugegriffen wird, gemäß einem vorbestimmten Regulierungsstatusdateiformat; Mining wenigstens einer Entität aus den ausgewählten Quellendateien basierend auf einem vorbestimmten F1-Maß-Wert und gemäß einem vorbestimmten Ontologieabgleichsalgorithmus, der mit durch Benutzer eingegebenen Abfragen abgleicht; Extrahieren wenigstens eines Datensatzes einschließlich ontologierelevanter verbundener regulatorischer Metadaten, die mit der Mining-unterzogenen Entität assoziiert sind, Speichern des extrahierten Datensatzes in einer Datenspeicherungseinheit; und Verknüpfen des extrahierten Datensatzes mit einem oder mehreren Knoten des pharmazeutischen regulatorischen semantischen Modells.
  2. System nach Anspruch 1, das ferner das Computerverarbeitungsmodul umfasst, das zum Mining ausgewählter Quellendateien in mehreren Sprachen basierend auf einem vorbestimmten F1-Maß-Wert und gemäß einem vorbestimmten Ontologieabgleichsalgorithmus, der mit durch Benutzer eingegebenen Abfragen abgleicht, ausgebildet ist.
  3. System nach einem der Ansprüche 1 bis 2, das ferner eine Neuronales-Netz-Vorrichtung mit wenigstens zwei Schichten zum Mining wenigstens einer Entität aus den ausgewählten Quellendateien basierend auf einem trainierten Ontologieabgleichsalgorithmus umfasst, der mit durch Benutzer eingegebenen Abfragen abgleicht.
  4. System nach einem der Ansprüche 1 bis 3, das ferner das Computerverarbeitungsmodul umfasst, das zum Auswählen von Datenquellendateien basierend auf einem SmPC(Summary of Product Characteristics - Zusammenfassung der Merkmale des Arzneimittels)- oder einem CMC(Chemistry and Manufacturing Control - Chemie- und Herstellungskontrolle)-Dateiformat ausgebildet ist.
  5. System nach einem der Ansprüche 1 bis 4, wobei die Datenvorbereitungseinheit zum Zugreifen auf Quellendateien bezüglich Organizations Management Services (OMS) oder Referential Management Services (RMS), über ein Kommunikationsnetz, von mehreren veröffentlichen pharmazeutischen regulatorischen heterogenen Datenquellen ausgebildet ist.
  6. Anreicherungsverfahren für ein pharmazeutisches regulatorisches semantisches Modell zum Anreichern eines pharmazeutischen semantischen Modells, das mit einem regulatorischen Status eines pharmazeutischen Produkts assoziiert ist, welches Folgendes umfasst: Zugreifen auf Quellendateien, über ein Kommunikationsnetz, aus mehreren veröffentlichen heterogenen Datenquellen für pharmazeutische regulatorische Informationen; Auswählen von Datenaufzeichnungen aus den Datenquellen, auf die zugegriffen wurde, basierend auf einem vorbestimmten regulatorischen Format; Mining wenigstens einer Entität aus den ausgewählten Quellendateien basierend auf einem vorbestimmten F1-Maß-Wert und gemäß einem vorbestimmten Ontologieabgleichsalgorithmus, der mit durch Benutzer eingegebenen Abfragen abgleicht; Extrahieren wenigstens eines Datensatzes einschließlich ontologierelevanter verbundener regulatorischer Metadaten, die mit der Mining-unterzogenen Entität assoziiert sind, Speichern des extrahierten Datensatzes in einer Datenspeicherungseinheit; und Verknüpfen des extrahierten Datensatzes mit einem oder mehreren Knoten des pharmazeutischen regulatorischen semantischen Modells.
  7. Verfahren nach Anspruch 6, das ferner Mining wenigstens einer Entität aus ausgewählten Quellendateien in mehreren Sprachen basierend auf einem vorbestimmten F1-Maß-Wert und gemäß einem vorbestimmten Ontologieabgleichsalgorithmus umfasst, der mit durch Benutzer eingegebenen Abfragen abgleicht.
  8. Verfahren nach einem der Ansprüche 6 oder 7, das ferner Mining wenigstens einer Entität aus den ausgewählten Quellendateien basierend auf einem trainierten Ontologieabgleichsalgorithmus an einem neuronalen Netz mit wenigstens zwei Schichten umfasst, der mit durch Benutzer eingegebenen Abfragen abgleicht.
  9. Verfahren nach einem der Ansprüche 6 bis 8, das ferner Auswählen von Datenquellendateien basierend auf einem SmPC(Summary of Product Characteristics)- oder einem CMC(Chemistry and Manufacturing Control)-Dateiformat umfasst.
  10. Verfahren nach einem der Ansprüche 6 bis 9, das ferner Zugreifen auf Quellendateien bezüglich Organizations Management Services (OMS) oder Referential Management Services (RMS), über ein Kommunikationsnetz, von mehreren veröffentlichen heterogenen Datenquellen pharmazeutischer regulatorischer Informationen umfasst.
  11. Computerlesbares Medium, das Anweisungen umfasst, die bei Ausführung durch einen Computer den Computer zum Ausführen der Schritte eines der Verfahren nach den Ansprüchen 6 bis 10 veranlassen.
  12. Computerprogramm, das Anweisungen umfasst, die bei Ausführung des Programms durch einen Computer den Computer zum Ausführen der Schritte eines der Verfahren nach den Ansprüchen 6 bis 10 veranlassen.
DE102020002607.9A 2020-04-30 2020-04-30 Pharmazeutischer prozess Ceased DE102020002607A1 (de)

Priority Applications (9)

Application Number Priority Date Filing Date Title
DE102020002607.9A DE102020002607A1 (de) 2020-04-30 2020-04-30 Pharmazeutischer prozess
JP2022565974A JP2023523761A (ja) 2020-04-30 2021-04-29 医薬プロセス
EP21722843.6A EP4143698A1 (de) 2020-04-30 2021-04-29 Pharmazeutisches verfahren
AU2021265189A AU2021265189A1 (en) 2020-04-30 2021-04-29 Pharmaceutical process
CN202180031751.8A CN115398420A (zh) 2020-04-30 2021-04-29 制药过程
PCT/EP2021/061347 WO2021219827A1 (en) 2020-04-30 2021-04-29 Pharmaceutical process
CA3181613A CA3181613A1 (en) 2020-04-30 2021-04-29 Pharmaceutical process
US17/922,085 US20230170099A1 (en) 2020-04-30 2021-04-29 Pharmaceutical process
IL297715A IL297715A (en) 2020-04-30 2022-10-27 pharmaceutical process

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102020002607.9A DE102020002607A1 (de) 2020-04-30 2020-04-30 Pharmazeutischer prozess

Publications (1)

Publication Number Publication Date
DE102020002607A1 true DE102020002607A1 (de) 2021-11-04

Family

ID=75769598

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102020002607.9A Ceased DE102020002607A1 (de) 2020-04-30 2020-04-30 Pharmazeutischer prozess

Country Status (9)

Country Link
US (1) US20230170099A1 (de)
EP (1) EP4143698A1 (de)
JP (1) JP2023523761A (de)
CN (1) CN115398420A (de)
AU (1) AU2021265189A1 (de)
CA (1) CA3181613A1 (de)
DE (1) DE102020002607A1 (de)
IL (1) IL297715A (de)
WO (1) WO2021219827A1 (de)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050071185A1 (en) 2003-08-06 2005-03-31 Thompson Bradley Merrill Regulatory compliance evaluation system and method
US20070198477A1 (en) 2006-02-15 2007-08-23 Alison Lawton Systems and methods for managing regulatory information
US20080256133A1 (en) 2001-03-01 2008-10-16 Richad Frankland Integrated Change Management Unit

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080256133A1 (en) 2001-03-01 2008-10-16 Richad Frankland Integrated Change Management Unit
US20050071185A1 (en) 2003-08-06 2005-03-31 Thompson Bradley Merrill Regulatory compliance evaluation system and method
US20070198477A1 (en) 2006-02-15 2007-08-23 Alison Lawton Systems and methods for managing regulatory information

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Sapkota, K., et.al.: Towards semantic methodologies for automatic regulatory compliance support. In Proceedings of the 4th workshop on Workshop for Ph. D. students in information & knowledge management (pp. 83-86). Oktober, 2011.

Also Published As

Publication number Publication date
WO2021219827A1 (en) 2021-11-04
US20230170099A1 (en) 2023-06-01
JP2023523761A (ja) 2023-06-07
IL297715A (en) 2022-12-01
EP4143698A1 (de) 2023-03-08
CN115398420A (zh) 2022-11-25
CA3181613A1 (en) 2021-11-04
AU2021265189A1 (en) 2022-10-27

Similar Documents

Publication Publication Date Title
US20240152542A1 (en) Ontology mapping method and apparatus
US20210407033A1 (en) Patent mapping
Arora et al. Automated extraction and clustering of requirements glossary terms
US9659071B2 (en) Patent mapping
US20190213407A1 (en) Automated Analysis System and Method for Analyzing at Least One of Scientific, Technological and Business Information
US9836805B2 (en) System for search and customized information updating of new patents and research, and evaluation of new research projects' and current patents' potential
JP2017514256A (ja) オントロジアライナ方法、セマンティックマッチング方法及び装置
DE102019001267A1 (de) Dialogartiges System zur Beantwortung von Anfragen
EP3270303A1 (de) System und verfahren zur automatisierten überwachung und archivierung
DE102012221251A1 (de) Semantisches und kontextbezogenes Durchsuchen von Wissensspeichern
DE112020005268T5 (de) Automatisches erzeugen von schema-annotationsdateien zum umwandeln von abfragen in natürlicher sprache in eine strukturierte abfragesprache
US20060026174A1 (en) Patent mapping
Eid-Sabbagh et al. An open process model library
Beniwal et al. Data mining with linked data: past, present, and future
Tzitzikas et al. CIDOC-CRM and machine learning: a survey and future research
DE102020002607A1 (de) Pharmazeutischer prozess
Boryaev Development of intelligent system of global bibliographic search
Roa-Martínez et al. Digital Image Representation Model Enriched with Semantic Web Technologies: Visual and Non-Visual Information
Park Integrated visual analytics tool for heterogeneous text data
Salgueiro et al. Searching for Researchers: an Ontology-based NoSQL Database System Approach and Practical Implementation
Mirdamadi Tehrani Table extraction for information retrieval
Saha et al. Knowledge Graph Construction for Digital Repositories
Balijepalli Best Practices in Using Semantic Transformation in Data Integration to Address Data Integrity Issues
Harris et al. Semantic technologies in electronic government
CN116069895A (zh) 儿科学科医疗机构知识库系统

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final