DE102008005083A1 - Abrufen einer Information eines fallbasierten Schliessens aus Archivaufzeichnungen - Google Patents

Abrufen einer Information eines fallbasierten Schliessens aus Archivaufzeichnungen Download PDF

Info

Publication number
DE102008005083A1
DE102008005083A1 DE102008005083A DE102008005083A DE102008005083A1 DE 102008005083 A1 DE102008005083 A1 DE 102008005083A1 DE 102008005083 A DE102008005083 A DE 102008005083A DE 102008005083 A DE102008005083 A DE 102008005083A DE 102008005083 A1 DE102008005083 A1 DE 102008005083A1
Authority
DE
Germany
Prior art keywords
records
attributes
values
symptom
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102008005083A
Other languages
English (en)
Inventor
Alexander P. Birmingham Morgan
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GM Global Technology Operations LLC
Original Assignee
GM Global Technology Operations LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GM Global Technology Operations LLC filed Critical GM Global Technology Operations LLC
Publication of DE102008005083A1 publication Critical patent/DE102008005083A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing

Abstract

Es werden Verfahren, Systeme und Computerprogrammprodukte zur Verwendung für Prozesse zum Abrufen eiR-Information), ohne eine Fallbasis zu erzeugen, bereitgestellt. Die Verfahren umfassen, dass auf eite und Lösungsattribute umfasst. Es wird eine Anfrage von einem Anfragesteller empfangen, die einen oder mehrere Werte für eines oder mehrere der Symptomattribute spezifiziert. Die Anfrage wird bearbeitet und die Bearbeitung umfasst, dass eine Datenbank von Archivaufzeichnungen nach den spezifizierten Symptomattributwerten durchsucht wird und eine Teilmenge der Archivaufzeichnungen empfangen wird, die die spezifizierten Werte umfassen.Es werden Werte, die mit einem oder mehreren der Lösungsattribute in Verbindung stehen, für jede der Aufzeichnungen in der Teilmenge ermittelt. Ein Teil dieser "Ermittlung von Werten" kann unter Verwendung eines Informationsextraktions-Werkzeugs an Daten von nicht strukturierten Texten durchgeführt werden, die in den Archivaufzeichnungen enthalten sind. Es wird für jeder der Aufzeichnungen in der Teilmenge eine temporäre Fallaufzeichnung erzeugt. Jede der temporären Fallaufzeichnungen umfasst einen Zeiger auf die entsprechende Aufzeichnung in der Teilmenge und einen Titelteilabschnitt der Folgendes umfasst: die Symptomattribute, die spezifizierten Symptomattributwerte, die Lösungsattribute und die Lösungsattributwerte, die mit der entsprechenden ...

Description

  • HINTERGRUND DER ERFINDUNG
  • Die vorliegende Offenbarung betrifft allgemein ein fallbasiertes Schließen (CBR von case-based reasoning) und insbesondere ein Verfahren zum Verwenden von Archivdaten, um eine fallbasierte Information abzurufen.
  • Das CBR versucht, ein Modell für menschliches Schlussfolgern bzw. Schließen durch Erinnern an vorherige Erfahrungen und Anpassen dieser an eine momentane Situation zu erstellen. Bei dem CBR ist die primäre Wissensquelle ein Speicher mit gespeicherten Fällen, der vorherige spezifische Episoden oder Probleme aufzeichnet. Eine allgemeine Anwendung des CBR liegt in Diagnosesystemen. Die Idee ist, dass ähnliche vorherige Probleme ein nützlicher Startpunkt zum Lösen neuer Probleme sind. Somit hängt der Erfolg eines CBR-Wissenssystems sowohl von der Fallbasis (Speicher) als auch der Fähigkeit des Systems ab, vergangene Fälle zu erkennen und abzurufen, die für das momentane Problem hilfreich sind. Typischerweise wird ein Fall nach dem Lösen eines Problems erzeugt und umfasst ein Fall eine Beschreibung der Symptome (z. B. Fehlercodes, Datendarstellungen, visuelle Inspektionen), eine Beschreibung des Ursprungs des Problems und eine Lösung des Problems (z. B. Reparaturen). Zusätzlich zu strukturierten Fallaufzeichnungen können in Aufzeichnungen, die nicht in strukturierte Fallaufzeichnungen umgewandelt wurden, nützliche Diagnoseinformationen gespeichert sein. Archivaufzeichnungen können aus einer Vielzahl von Gründen nicht umgewandelt worden sein, wie beispielsweise aufgrund der Kosten des Umwandelns im Vergleich zu der erwarteten Anzahl von Zugriffen auf die Aufzeichnungen.
  • Eine Firma, die Diagnosedienste bereitstellt, kann eine große Menge von Archivaufzeichnungen speichern, die Lösungen beschreibende Daten oder "gelöste Probleme" enthalten. Beispielsweise weisen Call Center für gewöhnlich einen Mechanismus zum Protokollieren von Anrufen mit einer Art von Problemzusammenfassung und vorgeschlagenen Lösungen auf. Garantiedatenbanken behalten im Allgemeinen Aufzeichnungen von Arbeitsvorgängen für Garantieprodukte. Krankenkassensysteme behalten auf ähnliche Weise eine Aufzeichnung jedes verrechenbaren medizinischen Aufwands. Aus solchen Archiven und Datenbanken ist es möglich, Probleme und Lösungen zu extrahieren, um eine Fallbasis für ein Diagnose-CBR zu erzeugen. In der Praxis ist es jedoch schwierig, diese historischen Daten (Archive) auf eine effiziente Weise zu verwenden und zu implementieren. Die Archive enthalten oft "schmutzige", unvollständige, inkonsistente und/oder nicht mehr aktuelle Daten. Zusätzlich können die Archivdaten nicht strukturierte Daten umfassen. Diese und andere Probleme erfordern eine Lösung, bevor die Fallbasis erzeugt wird.
  • Eine Datenaufzeichnung ist "schmutzig", wenn die Datenaufzeichnung auf irgendeine Weise fehlerhaft ist. Insbesondere kann eine schmutzige Datenaufzeichnung Felder aufweisen, die leer sind, die ausgefüllt werden sollten, oder weist eine schmutzige Datenaufzeichnung Felder auf, die inkorrekte Daten enthalten und/oder das Format der Datenaufzeichnung selbst ist auf irgendeine Weise beschädigt. Wenn die Aufzeichnung Textblöcke umfasst, werden solche Textblöcke in bestimmten Situationen als "schmutzig" betrachtet, wenn der Text auf irgendeine Weise fehlerhaft ist, was nicht der Norm entsprechende Buchstabierungen und Abkürzungen, inkorrekte Grammatik, Satzteile oder beliebige andere Eigenschaften umfasst, die es erschweren, den Textblock zu lesen oder zu verarbeiten.
  • Das Konzept "schmutziger Daten" (hierin auch als "beschädigte Daten" bezeichnet) ist kontext- und systemabhängig. Schmutzige Daten können gereinigt, repariert oder gefiltert werden. Reinigen und Reparieren sind in diesem Kontext im Wesentlichen Synonyme. Die beiden Begriffe beziehen sich auf ein Füllen leerer Werte, ein Korrigieren inkorrekter Werte und ein Beheben einer fehlerhaften Formatierung. Kurzum ersetzt eine korrekte Aufzeichnung die fehlerhafte Aufzeichnung. Es gibt viele Verfahren zum Reinigen von Daten, wobei einige eine geringe menschliche Überwachung erfordern und andere vollständig von einem Menschen durchgeführt werden. Im Fall von Textblöcken könnte der Block beispielsweise durch eine Rechtschreibprüfung geprüft werden oder durch einen menschlichen Editor editiert werden, oder beides. Beide Verfahren sind jedoch fehleranfällig und nehmen bei ihrer Durchführung einen erheblichen Zeitaufwand in Anspruch.
  • Lazy Learning ist ein Teilgebiet eines Maschinenlernens, das (1) eine Verarbeitung aufschiebt, bis es eine Anforderung bezüglich Informationen gibt, (2) wenn es solch eine Anforderung gibt, die Antwort erzeugt, indem lediglich die gespeicherten Daten verarbeitet werden, die zum Erzeugen der Antwort notwendig sind, und (3) wenn die Anfrage beantwortet wurde, die Antwort verwirft, anstatt sie zu speichern. Die Idee hinter Lazy Learning ist, das Wissen aus rohen Daten "bedarfsorientiert" ("just in time") zu erzeugen, anstatt das Wissen für eine zukünftige Verwendung vorab zu berechnen. Lazy Learning entstand aus der Notwendigkeit, die Rechen- und Speicherbelastungen bei Maschinenlernverfahren zu reduzieren oder rechtzeitig umzuverteilen.
  • Viele Firmen halten große Archive mit "gelösten Problemen" aufrecht, wobei erhebliche Teile von Aufzeichnungen als Text gespeichert werden. In einer Umgebung, in der weder Zeit noch Ressourcen beschränkt sind, können diese großen Archive analysiert werden, um standardmäßigen CBR-Methodologien folgend eine Fallbasis-Datenbank zu erzeugen. Allerdings sind die Ressourcen typischerweise beschränkt. Daher werden Archive mit gelösten Problemen oftmals aufgegeben und werden neue Fälle aus neuen Informationen erzeugt (z. B. könnten analytische Fälle durch Interviews mit Experten erzeugt werden und/oder könnte ein neuer CBR-freundlicher Prozess zum Erfassen von Fällen in dem Arbeitsablauf des Call Centers festgelegt werden). Wertvolle Informationen darüber, wie Probleme in der Vergangenheit gelöst wurden, gehen jedoch verloren, wenn die Archivaufzeichnungen aufgegeben werden. Daher besteht ein Bedarf an einem Prozess zur Verwendung der Informationen über vorherige Probleme (und ihre Symptome und Lösungen), ohne, dass die Umwandlung aller Archivdatenaufzeichnungen in ein CBR-Format erforderlich ist. Dieser Prozess würde ein Zugreifen auf Lösungen, die in der Vergangenheit funktionierten, ermöglichen, während die Kosten eines Umwandelns großer Mengen von Archivaufzeichnungen, auf die möglicherweise selten zugegriffen wird, in ein CBR-Format vermieden werden.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Ausführungsformen umfassen ein Verfahren zum Verwenden von Prozessen zum Abrufen einer Information eines fallbasierten Schließens (CBR-Information), ohne eine Fallbasis zu erzeugen. Es wird ein Datenmodell erzeugt, das Symptomattribute und Lösungsattribute umfasst. Es wird eine Anfrage von einem Anfragesteller empfangen, die einen oder mehrere Werte für eines oder mehrere der Symptomattribute spezifiziert. Die Anfrage wird bearbeitet, wobei die Bearbeitung umfasst, dass eine Daten bank von Archivaufzeichnungen nach den spezifizierten Symptomattributwerten durchsucht wird und eine Teilmenge der Archivaufzeichnungen empfangen wird, die die spezifizierten Werte umfassen. Es werden Werte, die mit einem oder mehreren der Lösungsattribute in Verbindung stehen, für jede der Aufzeichnungen in der Teilmenge ermittelt. Für jede der Aufzeichnungen in der Teilmenge wird eine temporäre Fallaufzeichnung erzeugt. Jede der temporären Fallaufzeichnungen umfasst einen Zeiger auf die entsprechende Aufzeichnung in der Teilmenge und einen Titelteilabschnitt, der folgendes umfasst: die Symptomattribute, die spezifizierten Symptomattributwerte, die Lösungsattribute und die Lösungsattributwerte, die mit der entsprechenden Aufzeichnung in der Teilmenge in Verbindung stehen. Auf diese Weise wird eine temporäre Fallbasis aus Archivaufzeichnungen in Echtzeit in Ansprechen auf die in der Anfrage spezifizierten Werte erzeugt.
  • Andere Ausführungsformen umfassen ein System zum Verwenden von Prozessen zum Abrufen einer CBR-Information, ohne eine Fallbasis zu erzeugen. Das System umfasst ein Datenmodell, eine Datenbank und einen Prozessor. Das Datenmodell steht mit einem Netz in Verbindung und umfasst Symptomattribute und Lösungsattribute. Die Archivaufzeichnungsdatenbank umfasst Archivaufzeichnungen und steht mit dem Netz in Verbindung. Der Prozessor steht mit dem Datenmodell und der Datenbank über das Netz in Verbindung und umfasst Computeranweisungen zum Vereinfachen eines Verfahrens. Das Verfahren umfasst, dass eine Anfrage von einem Anfragesteller empfangen wird, die einen oder mehrere Werte für eines oder mehrere der Symptomattribute spezifiziert. Die Anfrage wird bearbeitet, wobei die Bearbeitung umfasst, dass eine Datenbank von Archivaufzeichnungen nach den spezifizierten Symptomattributwerten durchsucht wird und eine Teilmenge der Archivaufzeichnungen empfangen wird, die die spezifizierten Werte umfassen. Es werden Werte, die mit einem oder mehreren der Lösungsattribute in Verbindung stehen, für jede der Aufzeichnungen in der Teilmenge ermittelt. Für jede der Aufzeichnungen in der Teilmenge wird eine temporäre Fallaufzeichnung erzeugt. Jede der temporären Fallaufzeichnungen umfasst einen Zeiger auf die entsprechende Aufzeichnung in der Teilmenge und einen Titelteilabschnitt, der folgendes umfasst: die Symptomattribute, die spezifizierten Symptomattributwerte, die Lösungsattribute und die Lösungsattributwerte, die mit der entsprechenden Aufzeichnung in der Teilmenge in Verbindung stehen. Auf diese Weise wird eine temporäre Fallbasis aus Archivaufzeichnungen in Echtzeit in Ansprechen auf die in der Anfrage spezifizierten Werte erzeugt.
  • Gemäß einem weiteren Aspekt umfasst ein Computerprogrammprodukt zum Verwenden von Prozessen zum Abrufen einer CBR-Information, ohne eine Fallbasis zu erzeugen, ein Speichermedium, das von einem Verarbeitungsschaltkreis gelesen werden kann und Anweisungen zur Ausführung durch den Verarbeitungsschaltkreis zum Durchführen eines Verfahrens speichert. Das Verfahren umfasst, dass ein Datenmodell erzeugt wird, das Symptomattribute und Lösungsattribute umfasst. Es wird eine Anfrage von einem Anfragesteller empfangen, die einen oder mehrere Werte für eines oder mehrere der Symptomattribute spezifiziert. Die Anfrage wird bearbeitet, wobei die Bearbeitung umfasst, dass eine Datenbank von Archivaufzeichnungen nach den spezifizierten Symptomattributwerten durchsucht wird und eine Teilmenge der Archivaufzeichnungen empfangen wird, die die spezifizierten Werte umfassen. Es werden Werte, die mit einem oder mehreren der Lösungsattribute in Verbindung stehen, für jede der Aufzeichnungen in der Teilmenge ermittelt. Für jede der Aufzeichnungen in der Teilmenge wird eine temporäre Fallaufzeichnung erzeugt. Jede der temporären Fallaufzeichnungen umfasst einen Zeiger auf die entsprechende Aufzeichnung in der Teilmenge und einen Titelteilabschnitt, der folgendes umfasst: die Symptomattribute, die spezifizierten Symptomattributwerte, die Lösungsattribute und die Lösungsattributwerte, die mit der entsprechenden Aufzeichnung in der Teilmenge in Verbindung stehen. Auf diese Weise wird eine temporäre Fallbasis aus Archivaufzeichnungen in Echtzeit in Ansprechen auf die in der Anfrage spezifizierten Werte erzeugt.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • Es wird nun auf die beispielhaften Zeichnungen Bezug genommen, in denen gleiche Elemente gleich bezeichnet sind, und wobei:
  • 1 einen Prozessfluss zeigt, der durch beispielhafte Ausführungsformen zum Verwenden von Prozessen zum Abrufen einer CBR-Information, ohne eine Fallbasis zu erzeugen, realisiert werden kann; und
  • 2 ein Blockdiagramm eines beispielhaften Systems ist, das durch beispielhafte Ausführungsformen zum Verwenden von Prozessen zum Abrufen einer CBR-Information, ohne eine Fallbasis zu erzeugen, realisiert werden kann.
  • DETAILLIERTE BESCHREIBUNG BEISPIELHAFTER AUSFÜHRUNGSFORMEN
  • Beispielhafte Ausführungsformen verwenden Archivaufzeichnungen, um ein Abrufen einer Information eines fallbasierten Schließens (CBR-Information), ohne eine Fallbasis zu erzeugen, zu erreichen. Eine Anfrage löst ein Durchsuchen der Archivaufzeichnungen aus, und Archivaufzeichnungen, die allein für diese Anfrage relevant sind, werden verwendet, um eine lokale oder temporäre Fallbasis aufzubauen. Bei beispielhaften Ausführungsformen werden Informationsextraktions-Werkzeuge (IS-Werkzeuge) verwendet, um die Archivaufzeichnungen zu identifizieren und auszuwählen, die mit der Anfrage übereinstimmen. Die lokale oder temporäre Fallbasis wird gelöscht, wenn der Anfragesteller die Anfrage beendet oder wenn der Anfragesteller das Anfrage-Softwareprogramm verlässt.
  • Bei beispielhaften Ausführungsformen wird darin ein "Lazy Learning"-Ansatz unternommen, dass die Anfrage eine Echtzeitdurchsuchung der Archivaufzeichnungen auslöst und dass die Ergebnisse des Durchsuchens nicht permanent gespeichert werden. In Ansprechen auf die Anfrage werden Aufzeichnungen, die allein für diese Anfrage relevant sind, verwendet, um aus den Archivaufzeichnungen eine "beste Antwort" aufzubauen. Beispielhafte Ausführungsformen sind stabiler und effizienter als ein Erzeugen einer permanenten Fallbasis aus den Archivaufzeichnungen. Beispielhafte Ausführungsformen unterscheiden sich von typischen Datenbankanfragen, da Teile der Fallbasis in Echtzeit unter Verwendung von IE-Werkzeugen erzeugt werden. Die IE kann unter Verwendung von im Handel erhältlichen Werkzeugen durchgeführt werden, wie beispielsweise des Identifinder von BBN und von ANNIE von der University of Sheffield.
  • Eine hierin beschriebene beispielhafte Ausführungsform bezieht sich auf Archivaufzeichnungen, die Call Center-Protokolle enthalten. Es wird angenommen, dass das betrachtete Call Center-Protokoll nicht strukturiert wurde, um das CBR zu vereinfachen. Der Hauptzweck des Call Center-Protokolls ist, eine Anzahl von Anrufen zu dokumentieren und Bedienern zu ermöglichen, sich auf entsprechende Details von vorherigen Anrufen zu beziehen. Es wird angenommen, dass die Call Center-Protokolle eine Anzahl von benannten Attributen und eine Anzahl von Blöcken mit "freiem Text" umfassen. Die benannten Attribute werden automatisch oder über Pulldown-Menüs eingetragen, oder sie können einfach durch Worte oder Phrasen nach dem Urteil eines Benutzers eingetragen werden. Solche Attribute könnten ein Datum eines Anrufs, einen Namen des Bedieners, einige Kontextklassifizierungsattribute (z. B. welches fehlerhafte Gerät diagnostiziert wird) und vielleicht eine Problemtypkategorie (z. B. eine Liste von Symptomkategorien oder eine Liste von Reparaturkategorien) umfassen. Der freie Text kann verwendet werden, um spezifische Details des Problems oder Symptome mit den eigenen Worten des Anrufers und auch die Bedienerinterpretation des Problems zusammen mit Vorschlägen für Lösungen oder Reparaturen zu erfassen.
  • Es sind insbesondere Archive von Interesse, deren Autoren Experten in dem Bereich sind anstatt Bediener mit wenig Wissen in dem Bereich. Wenn Autoren Experten in dem Bereich sind, wird ihnen natürlich eine beträchtliche Freiheit in ihrem Ausdruck gewährt. In dieser Sorte von Archiv ist eine Aufzeichnung im Wesentlichen eine Bemerkung von einer Person für eine kleine Gruppe von Gleichgestellten, um aufzuzeichnen, was vor kurzem geschah, und zwar in einem Kontext, den sie alle komplett verstehen. Gelegentliche Fehler und Unvollständigkeit sind unter solchen Umständen alltäglich, und ein disziplizierter Dateneintrag ist ungewöhnlich. Das Ergebnis ist, dass der freie Text eigenwillige Formulierungen der Problembeschreibungen und der vorgeschlagenen Lösungen enthält. In der Tat wurden in einem Call Center-Archiv fünfundzwanzig verschiedene Buchstabierungen des Worts "intermittierend", einschließlich Abkürzungen, entdeckt.
  • Bei der einfachsten Erscheinungsform eines klassischen CBR besteht der Fall vollständig aus benannten Attributen. Eine Anfrage ist eine Auswahl von Attributwerten, die die Symptome oder das Problem beschreiben. Eine Antwort auf die Anfrage ist ein Satz von Fällen, die der Anfrage ähnlich sind. Eine Ähnlichkeit zwischen Fällen wird definiert, indem zuerst eine Ähnlichkeit für jedes Attribut definiert wird. Jedem Paar von Werten, durch die das Attribut instanziiert wird, wird eine Ähnlichkeit zugeordnet. Diese Ähnlichkeit wird durch eine Zahl numerisch dargestellt, die in einem Bereich zwischen 0,0 (überhaupt nicht ähnlich) und 1,0 (im Wesentlichen identisch) liegt. Dann wird die Fall-zu-Fall-Ähnlichkeit als eine gewichtete Summe der Attributähnlichkeiten definiert.
  • Bei hierin beschriebenen beispielhaften Ausführungsformen bestehen die Archivaufzeichnungen nicht vollständig aus benannten Attributen. Insbesondere weisen einige der benannten Attribute keinen standardmäßigen Satz von Werten auf und liegen einige oder alle der Basisinformationen in den Archivaufzeichnungen in Blöcken mit freiem Text vor. Ferner sind für gewöhnlich Hunderttausende von Aufzeichnungen vorhanden und ist für gewöhnlich ein bestimmter Prozentsatz solcher Daten schmutzig oder beschädigt. Ein Vorhandensein benannter Attribute ohne einen standardmäßigen Satz von Werten kann zu beschädigten Daten führen, während ein Vorhandensein von Blöcken mit freiem Text die Fähigkeit beeinflusst, Schlüsselinformationen aus dem Text zu extrahieren. Eine IE betrachtet Verfahren zum Extrahieren von Wissen aus Text. Sie steht in enger Beziehung zu einem Gewinnen aus Text, weist jedoch auf gewisse Weise einen anderen Schwerpunkt auf. Gewinnungsaktivitäten versuchen, wenige interessante Aufzeichnungen aus einem großen Satz von Aufzeichnungen zu entdecken. Die IE dient dazu, die Blöcke mit freiem Text in jeder Aufzeichnung zusammenzufassen, indem Schlüsselkonzepte in eine vordefinierte Vorlage extrahiert werden, wobei im Wesentlichen für jede Aufzeichnung neue strukturierte Einheiten erzeugt werden. Es ist möglich, jedoch nicht erforderlich, dass die IE ein Zwischenschritt in einem System zur Gewinnung aus Text ist. Das Lazy-Fallerzeugungsverfahren, das durch beispielhafte Ausführungsformen verwendet wird, ist entwor fen, um die Kosten von IE-Werkzeugen beim Beantworten einer Anfrage zu minimieren. Es sei angemerkt, dass die IE-Werkzeuge auch erforderlich sein können, um sich zuerst mit dem Problem des Vorhandenseins benannter Attribute ohne einen standardmäßigen Satz von Werten zu beschäftigen. In diesem Fall können die IE-Werkzeuge verwendet werden, um zu ermitteln, welcher eines Satzes von Standardwerten aus den Daten abgeleitet werden kann.
  • Das Gebiet der IE bringt immer leistungsfähigere und effektivere Werkzeuge hervor, ist jedoch immer noch teuer und erfordert im Allgemeinen eine Überwachung und Überprüfung durch einen Menschen. Beispielsweise, um zu der Erläuterung des Call Center-Protokolls zurückzukehren, hat einer der Autoren in einem Call Center-Archiv durchwegs Text ohne Großbuchstaben und Zeichensetzung eingegeben. Diese "durchgehenden" Textblöcke sind sogar für Menschen schwer zu lesen. Die Herausforderung eines Analysierens ohne klare grammatikalische Hinweise hat ein höheres Schwierigkeitsniveau als ein Analysieren eines Texts mit guter Zeichensetzung.
  • Im Allgemeinen ist ein erster Schritt bei jedem Archiv, die Aufzeichnungen durch jedes mögliche Mittel zu Filtern und zu reinigen. Einige der oder alle unvollständigen und inkonsistenten Aufzeichnungen können in Bezug auf eine weitere Betrachtung beseitigt werden. Außerdem können einige der oder alle unvollständigen oder inkonsistenten Aufzeichnungen repariert werden. Diese Verarbeitung ist in der Technik bekannt und kann unter Verwendung von im Handel erhältlichen Werkzeugen durchgeführt werden, wie beispielsweise von HelpIT Intelligent Data Cleansing, IBM DataJoiner und SAS Data Quality-Cleanse. Bei beispielhaften Ausführungsformen wird angenommen, dass unvollständige oder inkonsistente Aufzeichnungen vor einem Abrufen der CBR-Information von den Archivaufzeichnungen beseitigt oder repariert wurden.
  • In Bezug auf das Call Center-Protokoll-Beispiel umfasst die durch eine Fallaufzeichnung erforderliche Grundinformation Symptome (hierin auch als "Probleme" bezeichnet) und Reparaturen (hierin auch als "Lösungen" bezeichnet). Symptome betreffen ein fehlerhaftes Objekt mit einer Beschreibung eines Problems mit diesem (z. B. die Netzwerkverbindung funktioniert nicht; der Kühlschrank kühlt nicht). Reparaturen betreffen Aktionen, die an fehlerhaften Objekte durchgeführt werden (z. B. die Netzwerkkarte wird ersetzt; die Kühlspule wird repariert und Kühlgas wird nachgefüllt). Diese Information ist bei der Art von Archivaufzeichnungen, die durch beispielhafte Ausführungsformen verwendet werden, nicht "umsonst". Die Information wird durch Verwenden der oben beschriebenen IE-Werkzeuge abgeleitet oder extrahiert.
  • 1 zeigt einen Prozessfluss, der durch beispielhafte Ausführungsformen realisiert werden kann, um CBR-Informationsabrufprozesse zu verwenden, ohne eine Fallbasis zu erzeugen. Die in 1 gezeigte Verarbeitung erzeugt auf der Grundlage von in einer Anfrage spezifizierten Attributwerten in Echtzeit eine temporäre Fallbasis aus Archivaufzeichnungen. In Block 102 wird auf ein Datenmodell zugegriffen, das Symptomattribute und Reparaturattribute umfasst. Alternativ kann das Datenmodell bei beispielhaften Ausführungsformen noch nicht existieren und erzeugt werden.
  • Beispielhafte Symptomattribute für ein Fahrzeug-Call Center umfassen:
    eine Hauptsymptomgruppe zum Spezifizieren einer Klassifikation der Symptome auf hoher Ebene (z. B. Luftausströmen, Geräusch, Geruch etc.); eine Symptomgruppe zum Spezifizieren von mehr Informationen über das Symptom (z. B. vom Motor kommt ein Brandgeruch, die Airbag-Anzeige ist an, etc.); ein Symptom zum Spezifizieren der Kundenbeschwerde (z. B. Geräusch); ein Symptomdetail zum Spezifizieren von Details über das Symptom (z. B. Klappergeräusch); eine funktionale Komponente/ein funktionales System zum Spezifizieren, welcher Teil des Produkts das Symptom aufweist; eine Frequenz zum Spezifizieren, wie oft das Symptom beobachtet oder wahrgenommen wird; einen Umgebungszustand zum Spezifizieren des Zustands der Umgebung, wenn das Symptom auftritt (z. B. Regen, 35 Grad C (95 Grad F), etc.); und einen Fahrzeugzustand zum Spezifizieren von Betriebszuständen des Fahrzeugs, wenn das Symptom auftritt (z. B. gleich nach dem Start, unter Last, etc.).
  • Beispielhafte Lösungsattribute für ein Fahrzeug-Call Center umfassen: eine durchgeführte Aktion zum Spezifizieren der durchgeführten Reparaturaktion; einen Komponentennamen; einen Komponentenort zum Spezifizieren des Orts der Komponente, auf die eingewirkt wird; Arbeitsoperationscodes; und zusätzliche Aktionskommentare zum Spezifizieren einer zusätzlichen Lösungsinformation als Text in freier Form.
  • Die obigen Symptom- und Lösungsattribute sollen Beispielattribute sein, und zusammen mit allen oder einer Teilmenge der Beispielattribute können zusätzliche Attribute realisiert werden. Bei beispielhaften Ausführungsformen sind alle mit allen Symptom- und Lösungsattributen in Verbindung stehenden Werte bekannt. Bei alternativen beispielhaften Ausführungsformen sind nicht alle mit allen Symptom- und Lösungsattributen in Verbindung stehenden Werte bekannt.
  • In Block 104 wird eine Anfrage von einem Anfragesteller empfangen, die einen Wert/Werte für eines oder mehrere der Symptomattribute spezifiziert. Bei beispielhaften Ausführungsformen wird durch Anfragesteller beim Erzeugen der Anfrage eine Schnittstellenbildschirmauflistung aller Symptomattribute verwendet. Außerdem kann, wenn alle Werte eines Symptomattributs bekannt sind, ein Pulldown-Auswahlkasten (der Symptomattribute in dem Datenmodell darstellt) für den Anfragesteller dargestellt werden, um die Anfrage zu erzeugen. Ferner kann der Anfragesteller, wenn einige der Werte eines Symptomattributs bekannt sind, einen bekannten Wert auswählen oder aufgefordert werden, einen Wert einzugeben. Der Anfragesteller kann Werte für eines oder mehrere der Symptomattribute spezifizieren. Zusätzlich kann der Anfragesteller mehr als einen Wert für ein einzelnes Symptomattribut spezifizieren.
  • In Block 106 wird die Anfrage durch Durchsuchen einer Datenbank von Archivaufzeichnungen (z. B. Call Center-Protokollen) nach Archivaufzeichnungen, die die spezifizierten Symptomwerte umfassen, bearbeitet. Bei beispielhaften Ausführungsformen sind, wenn die Archivaufzeichnungen ein oder mehrere formatierte Attributfelder umfassen, einige der Symptomattribute bekannt, ohne dass ein IE-Prozess durchgeführt wird. In diesem Fall werden jene Archivaufzeichnungen, die die Anfrage nach den formatierten Attributfeldern nicht befriedigen, in Bezug auf eine weitere Betrachtung beseitigt. Dann wird die IE an den verbleibenden Archivaufzeichnungen durchgeführt, um zu ermitteln, ob die Attributfelder, die nicht formatierten Daten (z. B. Text in freier Form) in den Archivaufzeichnungen entsprechen, die in der Anfrage spezifizierten Symptomattributwerte enthalten. Bei beispielhaften Ausführungsformen muss die Übereinstimmung nicht exakt sein und sucht das IE-Werkzeug nach Buchstabierungsvariationen, Abkürzungen, etc. bei den spezifizierten Werten. Der Stand der Technik hinsichtlich Berechnungen natürlicher Sprache bietet einen beträchtlichen Entwicklungsgrad hinsichtlich eines Ermittelns syntaktisch in Beziehung stehender Worte über den Prozess des "Stemming". Bei beispielhaften Ausführungsformen wird der IE-Prozess jeweils an einem Attribut durchgeführt, und die Größe des Pools von möglicherweise relevanten Archivaufzeichnungen schrumpft, wenn jedem Attribut ein Wert gegeben wird. Somit werden, wenn jedem Symptomattribut, das mit jeder Archivaufzeichnung in Beziehung steht, ein Wert gegeben wird, die Archivaufzeichnungen, die nicht mit der Anfrage übereinstimmen, in Bezug auf eine weitere Betrachtung beseitigt. Das Ergebnis dieses Prozesses ist eine Teilmenge der Archivaufzeichnungen mit in Verbindung stehenden gegebenen Symptomattributwerten, die mit den in der Anfrage spezifizierten Symptomattributen übereinstimmen.
  • Ein Grund des Organisierens der IE auf diese Weise ist, den Umfang an erforderlichen Ressourcen einzuschränken. Die Wahl der Reihenfolge von zu ermittelnden Symptomattributwerten kann einer Maximum-Entropie-Logik oder einem anderen Schema zum Verbessern der Effizienz folgen. Im Wesentlichen führen beispielhafte Ausführungsformen eine geführte Suche nach Symptomattributwerten durch, bei der anstatt eines Menschen der IE-Mechanismus die spezifizierten Werte bereitstellt.
  • In Block 108 wird jede der Archivaufzeichnungen in der Teilmenge, die in Block 106 ermittelt wurden, analysiert, um jegliche Lösungsattributwerte zu extrahieren, die mit dem einen oder den mehreren Lösungsattributen in Verbindung stehen. Bei beispielhaften Ausführungsformen wird die IE verwendet, um die Lösungsattribute einzupflegen. Bei beispielhaften Ausführungsformen wird nach Werten gesucht, die in dem Datenmodell definiert sind und mit jedem der Lösungsattribute in Verbindung stehen (und Variationen einschließlich Rechtschreibfehlern und Abkürzungen) und werden diese aus jeder der Archivaufzeichnungen in der Teilmenge extrahiert. Es können für jedes der Lösungsattribute kein, ein oder mehrere Werte identifiziert werden.
  • Bei beispielhaften Ausführungsformen werden für jede der Archivaufzeichnungen in die Teilmenge temporäre Fallaufzeichnungen erzeugt. Jede der temporären Fallaufzeichnungen umfasst einen Zeiger auf ihre entsprechende Archivaufzeichnung und einen Titelteilabschnitt. Der Titelteilabschnitt umfasst die Symptomattribute zusammen mit dem/den durch die Anfrage für eines oder mehrere der Symptomattribute spezifizierten Wert(en) und die Lösungsattribute zusammen mit dem/den sich in der Archivaufzeichnung für eines oder mehrere der Lösungsattribute befindenden Wert(en). Die temporären Fallaufzeichnungen können mit jenen gruppiert werden, die die gleichen Reparaturattributwerte aufweisen, und können von größten zu kleinsten Gruppen geordnet werden. Diese Gruppen, die temporäre Fallaufzeichnungen enthalten, werden in Ansprechen auf die Anfrage in Block 110 an den Anfragesteller zurückgegeben, wobei die größte Gruppe die häufigsten Lösungen für die durch die Anfrage spezifizierten Symptome darstellt. Wenn die Werte in den Lösungsattributen nicht genügend Informationen bereitstellen, kann die in Verbindung stehende Archivaufzeichnung geprüft werden, um mehr Details zu erhalten.
  • Bei beispielhaften Ausführungsformen werden die mit der Anfrage in Verbindung stehenden temporären Fallaufzeichnungen gelöscht, sobald der Anfragesteller die Anfrage beendet hat oder sobald der Anfragesteller die Anfrage-Software verlassen hat. Bei alternativen beispielhaften Ausführungsformen können die temporären Fallaufzeichnungen gekennzeichnet werden, um zu einer existierenden Call Center-Fallbasis hinzugefügt zu werden.
  • Bei beispielhaften Ausführungsformen wird in Ansprechen auf die Anfrage auch auf eine Call Center-Fallbasis mit Symptomen und Lösungen zugegriffen. Es werden typische CBR-Techniken verwendet, um Fälle zu identi fizieren, die die Anfrage beantworten. Bei beispielhaften Ausführungsformen wird für sowohl die Archivaufzeichnungen als auch die Fallbasisaufzeichnungen das gleiche Datenmodell definiert. Bei dieser beispielhaften Ausführungsform werden die identifizierten Fälle und die temporären Fallaufzeichnungen beide an den Anfragesteller zurückgegeben. Die identifizierten Fälle und die temporären Fallaufzeichnungen können vor ihrem Senden an den Anfragesteller sortiert werden, wie es in Bezug auf die temporären Fallaufzeichnungen beschrieben ist.
  • Bei weiteren beispielhaften Ausführungsformen wird die Teilmenge von Aufzeichnungen in den Archivaufzeichnungen, die die in der Anfrage spezifizierten Werte umfassen, als auf eine momentane Anfrage anwendbar markiert oder aufgezeichnet. Durch Kennzeichnen von Archivaufzeichnungen, auf die zugegriffen wurde, kann eine Verwaltung der Archivaufzeichnungen durchgeführt werden. Beispielsweise können Archivaufzeichnungen, auf die innerhalb einer spezifizierten Zeitdauer (z. B. ein Jahr, zwei Jahre, fünf Jahre) nicht zugegriffen wurde (d. h. nicht in der Teilmenge von Archivaufzeichnungen, die die durch eine Anfrage spezifizierten Werte umfassen), permanent aus den Archivaufzeichnungen gelöscht werden. Bei einem anderen Beispiel können Archivaufzeichnungen, auf die eine spezifizierte Anzahl von Malen zugegriffen wurde (einmal, fünfmal, zehnmal) zu der Call Center-Fallbasis-Datenbank hinzugefügt werden.
  • Beispielhafte Ausführungsformen können für andere Anwendungen als Call Center-Operationen verwendet werden. Beispielsweise wurde das CBR auf Klassifizierungsaufgaben, wie beispielsweise das Ermitteln des Typs eines Organismus aus beobachteten Attributen, angewandt. Das CBR wurde auch auf Entwurfsaufgaben angewandt, wie beispielsweise eine optimale Anordnung von Elementen. Wie hierin beschrieben, liegt eine Hauptanwendung des CBR in Helpdesks. Insbesondere gibt ein Helpdesk-Berater eine Kundenbeschreibung des Problems, Symptoms (oder Falls) des Kunden in das CBR-System ein. Hierin beschriebene beispielhafte Ausführungsformen konzentrieren sich auf Archivaufzeichnungen, die mit einem Call Center-Protokoll in Beziehung stehen. Die beispielhaften Ausführungsformen sind jedoch keinesfalls auf lediglich solch ein System beschränkt. Fachleute können die beispielhaften Ausführungsformen an verschiedene Systeme anpassen, ohne von dem Schutzumfang dieser Erfindung abzuweichen.
  • 2 ist ein Blockdiagramm eines beispielhaften Systems, das durch beispielhafte Ausführungsformen realisiert werden kann, um CBR-Informationsabrufprozesse zu verwenden, ohne eine Fallbasis zu erzeugen. Das System umfasst ein oder mehrere Benutzersysteme 202, über das oder die Anfragesteller an einem oder mehreren geografischen Orten das Host-System 204 kontaktieren. Das Host-System 204 umfasst einen Prozessor, um Anweisungen zum Vereinfachen der hierin beschriebenen Informationsabrufprozesse auszuführen. Dies umfasst Anweisungen (z. B. ein im Handel erhältliches Software-Werkzeug), um die hierin beschriebenen IE-Aufgaben auszuführen. Die Benutzersysteme 202 sind über ein Netz 206 mit dem Host-System 204 gekoppelt. Jedes Benutzersystem 202 wird unter Verwendung eines Universalcomputers realisiert, der ein Computerprogramm zum Ausführen der hierin beschriebenen Prozesse ausführt. Die Benutzersysteme 202 können Personal Computer (z. B. ein Laptop oder ein persönlicher digitaler Assistent) oder am Host angeordnete Endgeräte sein. Wenn die Benutzersysteme 202 Personal Computer sind, wird die hierin beschriebene Verarbeitung durch ein Benutzersystem 202 und das Host-System 204 geteilt (z. B. durch Bereitstellen eines Applets für das Benutzersystem 202).
  • Das Netz 206 kann jeder Typ von bekanntem Netz sein, der ein Wide Area Network (WAN), ein Local Area Network (LAN), ein globales Netz (z. B. Internet), ein virtuelles privates Netz (VPN) und ein Intranet umfasst, jedoch nicht darauf beschränkt ist. Das Netz 206 kann unter Verwendung eines drahtlosen Netzes oder jeder Art von Realisierung eines physikalischen Netzes, die in der Technik bekannt ist, realisiert werden. Ein Benutzersystem 202 kann über mehrere Netze (z. B. Intranet und Internet) derart mit dem Host-System gekoppelt sein, dass nicht alle Benutzersysteme 202 über dasselbe Netz mit dem Host-System 204 gekoppelt sind. Eines oder mehrere von den Benutzersystemen 202 und dem Host-System 204 können auf eine drahtlose Weise mit dem Netz 206 verbunden sein. Bei einer Ausführungsform ist das Netz das Internet und führen ein oder mehrere Benutzersysteme 202 eine Benutzerschnittstellenanwendung (z. B. einen Webbrowser) aus, um das Host-System 204 über das Netz 206 zu kontaktieren, während ein anderes Benutzersystem 202 direkt mit dem Host-System 204 verbunden ist. Bei einer anderen beispielhaften Ausführungsform ist das Benutzersystem 202 direkt (d. h. nicht über das Netz 206) mit dem Host-System 204 verbunden und ist das Host-System 204 direkt mit der Speichereinrichtung 208 verbunden oder enthält diese. Bei einer anderen beispielhaften Ausführungsform umfasst das Benutzersystem 202 ein unabhängiges Anwendungsprogramm, um die hierin beschriebene Verarbeitung durchzuführen.
  • Die Speichereinrichtung 208 wird unter Verwendung einer Vielzahl von Einrichtungen zum Speichern einer elektronischen Information realisiert. Es ist zu verstehen, dass die Speichereinrichtung 108 unter Verwendung eines in dem Host-System 204 enthaltenen Speichers realisiert werden kann oder eine separate physikalische Einrichtung sein kann. Die Speichereinrichtung 208 kann als vereinigte Datenquelle über einer verteilten Umgebung, die ein Netz 206 umfasst, logisch adressiert werden. Die in der Speichereinrichtung 208 gespeicherte Information wird über das Host-System 204 oder direkt über die Benutzersysteme 202 abgerufen und bearbeitet. Die Speichereinrichtung 208 umfasst das Datenmodell und die Archivaufzeichnungen und optional eine Fallbasis-Datenbank, die dem Datenmodell entspricht. Die Speichereinrichtung 208 kann auch andere Arten von Daten umfassen, wie beispielsweise eine Information bezüglich des Aktualisierens des Datenmodells und IE-bezogene Daten.
  • Das in 2 gezeigte Host-System 204 wird unter Verwendung eines oder mehrerer Server realisiert, die in Ansprechen auf ein in einem Speichermedium, auf das durch den Server zugegriffen werden kann, gespeichertes Computerprogramm arbeiten. Das Host-System 204 arbeitet als ein Netz-Server (z. B. Web-Server), um mit dem Benutzersystem 202 zu kommunizieren. Das Host-System 204 handhabt das Senden und Empfangen von Informationen zu und von dem Benutzersystem 202 und kann in Verbindung stehende Aufgaben ausführen. Das Host-System 204 kann auch eine Firewall umfassen, um einen unberechtigten Zugriff auf das Host-System 204 zu verhindern und jegliche Beschränkungen eines autorisierten Zugriffs durchzusetzen. Beispielsweise kann ein Administrator Zugriff auf das gesamte System haben und die Berechtigung haben, Teile des Systems zu modifizieren. Eine Firewall kann unter Verwendung von herkömmlicher Hardware und/oder Software, wie sie in der Technik bekannt ist, realisiert werden.
  • Das Host-System 204 kann auch als ein Anwendungs-Server arbeiten. Das Host-System 204 führt ein oder mehrere Computerprogramme aus, um die hierin beschriebene Verarbeitung durchzuführen. Die Verarbeitung kann durch das Benutzersystem 202 und das Host-System 204 geteilt werden, indem eine Anwendung (z. B. Java-Applet) für das Benutzersystem 202 bereitgestellt wird. Alternativ kann das Benutzersystem 202 eine unabhängige Software-Anwendung zum Ausführen eines Teils der oder der gesamten hierin beschriebenen Verarbeitung umfassen. Wie zuvor beschrieben, ist zu verstehen, dass separate Server verwendet werden können, um die Netz-Server-Funktionen und die Anwendungs-Server-Funktionen zu realisieren. Alternativ können der Netz-Server, die Firewall und der Anwendungs-Server durch einen einzigen Server realisiert werden, der Computerprogramme ausführt, um die notwendigen Funktionen durchzuführen.
  • Beispielhafte Ausführungsformen weisen verschiedene Vorteile oder technische Auswirkungen gegenüber vorherigen Bestrebungen auf, die gesamte Archivdatenbank auf einmal in eine Fallbasis umzuwandeln. Ein Vorteil ist, dass der IE-Prozess große Mengen an Rechenressourcen erfordert und fehleranfällig ist. Somit erfordert der IE-Prozess oftmals eine Überwachung durch einen Menschen. Durch Verkleinern des Satzes von Archivaufzeichnungen, an dem ein IE-Prozess durchgeführt werden muss, werden die Menge von Computerressourcen und die Arbeitszeit eines Menschen, die erforderlich sind, reduziert. Schließlich ist der Bedarf an diesen Ressourcen zeitlich verteilt, was allgemein bevorzugt ist, insbesondere hinsichtlich Humanressourcen. Der Vorteil wird gesteigert, wenn viele der Symptomattribute mit den ursprünglichen Aufzeichnungen vorliegen. Im ungünstigsten Fall, in dem es in den Archivaufzeichnungen keine benannten Attribute oder strukturierten Felder gibt (d. h. jede Archivaufzeichnung liegt lediglich als ein Textblock vor), würde der hierin beschriebene IE-Prozess immer noch Ressourcen einsparen, da er in einer Sequenz von Durchgangen organisiert ist, und zwar derart, dass zuerst die Symptomattributwerte erzeugt werden und dann die Lösungs- oder Reparaturattributwerte, wie es oben beschrieben ist.
  • Ein zusätzlicher Vorteil tritt auf, wenn das Archiv konstant erweitert wird, da der hierin beschriebene Lazy-Ansatz mehr aktuelle Informationen erzeugt. Ein Ordnen von Lösungen hinsichtlich der Auftrittshäufigkeit liefert eine natürliche Form von Validierung und stellt eine Information der "wahrscheinlichsten Lösung" bereit, wenn die Symptome nicht nur eine Lösung erzeugen. Als eine Form von "automatischer Validierung" werden die Reparaturen mit nur wenigen in Verbindung stehenden Aufzeichnungen ignoriert. Die Möglichkeit eines Übersehens von gültigen Lösungen, die nur bei niedrigen Häufigkeiten erscheinen, würde nur bestehen, wenn ein Symptom/Problem-Typ zu ersten Mal auftritt, oder wenn die gleiche Symptom/Problem-Lösung auf verschiedene Arten "aufgeschrieben" wurde. Diese Situationen sind durch jedes Verfahren schwer handzuhaben, insbesondere in Umgebungen, in denen Daten beschädigt sein können.
  • Ein weiterer Vorteil ist, dass Archivaufzeichnungen, die keinen Anfragen entsprechen, nicht verarbeitet werden. Dies kommt bei nicht mehr aktuellen Aufzeichnungen oder fehlerhaften Aufzeichnungen vor. Diese Aufzeichnungen werden nicht explizit identifiziert. Tatsächlich wird auf die Aufzeichnungen einfach nicht zugegriffen. Im Laufe der Zeit werden jedoch Aufzeichnungen, auf die nicht zugegriffen wird, aus dem Archiv entfernt, wodurch eine saubere Datenbank und genaue Übereinstimmungen des momentanen Falls, der durch den Benutzer eingegeben wird, mit dem Teil der vorherigen Fälle erzeugt werden. Das CBR-System wird gezwungen, in einer beschränkteren oder kleineren Datenbank zu suchen, wodurch die Rechenverarbeitungszeit verringert wird.
  • Wie oben beschrieben, können Ausführungsformen in Form von computerimplementierten Prozessen und Vorrichtungen zum Ausführen jener Prozesse vorliegen. Bei beispielhaften Ausführungsformen liegt die Erfin dung in Form von Computerprogrammcode vor, der durch ein oder mehrere Netzelemente ausgeführt wird. Ausführungsformen umfassen einen Computerprogrammcode, der Anweisungen enthält, die in konkreten Medien, wie beispielsweise Disketten, CD-ROMs, Festplatten, oder jedem anderen von einem Computer lesbaren Speichermedium umfasst sind, wobei, wenn der Computerprogrammcode in einen Computer geladen wird und durch diesen ausgeführt wird, der Computer zu einer Vorrichtung zum Ausführen der Erfindung wird. Ausführungsformen umfassen Computerprogrammcode, der z. B. in einem Speichermedium gespeichert, in einen Computer geladen und/oder durch diesen ausgeführt oder über ein Übertragungsmedium, wie beispielsweise über eine elektrische Verdrahtung oder Verkabelung, über Faseroptik oder über elektromagnetische Strahlung, übertragen wird, wobei, wenn der Computerprogrammcode in einen Computer geladen und durch diesen ausgeführt wird, der Computer zur einer Vorrichtung zum Ausführen der Erfindung wird. Bei einer Realisierung auf einem Universalmikroprozessor konfigurieren die Computerprogrammcodesegmente den Mikroprozessor, um spezifische logische Schaltkreise zu erzeugen.
  • Während die Erfindung in Bezug auf beispielhafte Ausführungsformen beschrieben wurde, wird für Fachleute deutlich, dass verschiedene Änderungen durchgeführt und Elemente durch Äquivalente von diesen ersetzt werden können, ohne vom Schutzumfang der Erfindung abzuweichen. Zusätzlich können viele Abwandlungen vorgenommen werden, um eine bestimmte Situation oder ein bestimmtes Material an die Lehren der Erfindung anzupassen, ohne von dem wesentlichen Schutzumfang dieser abzuweichen. Daher soll die Erfindung nicht auf die bestimmten Ausführungsformen beschränkt sein, die zum Ausführen dieser Erfindung offenbart sind, sondern die Erfindung soll alle Ausführungsformen umfassen, die innerhalb des Schutzumfangs der Ansprüche liegen.

Claims (20)

  1. Verfahren zum Verwenden von Prozessen zum Abrufen einer Information eines fallbasierten Schließens (CBR-Information), ohne eine Fallbasis zu erzeugen, wobei das Verfahren umfasst, dass auf ein Datenmodell zugegriffen wird, das Symptomattribute und Lösungsattribute umfasst; eine Anfrage von einem Anfragesteller empfangen wird, die einen oder mehrere Werte für eines oder mehrere der Symptomattribute spezifiziert; die Anfrage bearbeitet wird, was ein Durchsuchen einer Datenbank von Archivinformationen nach den spezifizierten Symptomattributwerten und ein Empfangen einer Teilmenge der Archivaufzeichnungen, die die spezifizierten Werte umfassen, umfasst; für jede der Aufzeichnungen in der Teilmenge Werte ermittelt werden, die mit einem oder mehreren der Lösungsattribute in Verbindung stehen; und für jede der Aufzeichnungen in der Teilmenge eine temporäre Fallaufzeichnung erzeugt wird, wobei jede der temporären Fallaufzeichnungen einen Zeiger auf die entsprechende Aufzeichnung in der Teilmenge und einen Titelteilabschnitt umfasst, der die Symptomattribute, die spezifizierten Symptomattributwerte, die Lösungsattribute und die Lösungsattributwerte, die mit der entsprechenden Aufzeichnung in der Teilmenge in Verbindung stehen, umfasst, wodurch eine temporäre Fallbasis aus Archivaufzeichnungen in Echtzeit in Ansprechen auf die in der Anfrage spezifizierten Werte erzeugt wird.
  2. Verfahren nach Anspruch 1, das ferner umfasst, dass die temporären Fallaufzeichnungen an den Anfragesteller übertragen werden.
  3. Verfahren nach Anspruch 2, das ferner umfasst, dass die temporären Fallaufzeichnungen nach dem Durchführen der Übertragung gelöscht werden.
  4. Verfahren nach Anspruch 1, das ferner umfasst, dass Fälle in einer Fallbasis-Datenbank identifiziert werden, die die spezifizierten Symptomattributwerte umfassen; und die identifizierten Fälle und die temporären Fallaufzeichnungen an den Anfragesteller übertragen werden.
  5. Verfahren nach Anspruch 4, das ferner umfasst, dass die temporären Fallaufzeichnungen nach dem Durchführen der Übertragung gelöscht werden.
  6. Verfahren nach Anspruch 4, das ferner umfasst, dass die identifizierten Fälle und die temporären Fallaufzeichnungen von der größten Anzahl von Lösungsattributwerten zu der kleinsten Anzahl von Lösungsattributwerten geordnet werden, bevor die Übertragung durchgeführt wird.
  7. Verfahren nach Anspruch 1, wobei das Durchsuchen der Datenbank von Archivaufzeichnungen umfasst, dass Text in freier Form nach den spezifizierten Symptomattributwerten durchsucht wird.
  8. Verfahren nach Anspruch 1, wobei das Ermitteln von Werten umfasst, dass Text in freier Form verarbeitet wird, um die Lösungsattribute zu lokalisieren.
  9. Verfahren nach Anspruch 1, wobei das Bearbeiten der Anfrage ferner umfasst, dass ein Zugriff auf die Archivaufzeichnungen in der Teilmenge aufgezeichnet wird, und wobei das Verfahren ferner umfasst, dass Archivaufzeichnungen, auf die innerhalb einer spezifizierten Zeitdauer nicht zugegriffen wurde, permanent gelöscht werden.
  10. Verfahren nach Anspruch 1, wobei das Durchsuchen der Datenbank und/oder das Ermitteln von Werten unter Verwendung eines Informationsextraktions-Werkzeugs durchgeführt wird.
  11. Verfahren nach Anspruch 1, wobei eines oder mehrere der Symptom- und Lösungsattribute mit einem endlichen Satz von Werten in Verbindung stehen.
  12. Verfahren nach Anspruch 1, wobei das gesamte oder eine Teilmenge des Ermittelns unter Verwendung eines Informationsextraktions-Werkzeugs an Daten von nicht strukturiertem Text, die in den Archivaufzeichnungen enthalten sind, durchgeführt wird.
  13. System zum Verwenden von Prozessen zum Abrufen einer CBR-Information, ohne eine Fallbasis zu erzeugen, wobei das System umfasst: ein Datenmodell, das mit einem Netz in Verbindung steht und Symptomattribute und Lösungsattribute umfasst; eine Datenbank von Archivaufzeichnungen, die mit dem Netz in Verbindung steht; und einen Prozessor, der über das Netz mit dem Datenmodell und der Datenbank in Verbindung steht und Computeranweisungen umfasst, um folgendes zu vereinfachen: Empfangen einer Anfrage von einem Anfragesteller, die einen oder mehrere Werte für eines oder mehrere der Symptomattribute spezifiziert; Bearbeiten der Anfrage, umfassend ein Durchsuchen der Datenbank von Archivaufzeichnungen nach den spezifizierten Symptomattributwerten und ein Empfangen einer Teilmenge der Archivaufzeichnungen, die die spezifizierten Werte umfassen; Ermitteln von Werten, die mit einem oder mehreren der Lösungsattribute in Verbindung stehen, für jede der Aufzeichnungen in der Teilmenge; und Erzeugen einer temporären Fallaufzeichnung für jede der Aufzeichnungen in der Teilmenge, wobei jede der temporären Fallaufzeichnungen einen Zeiger auf die entsprechende Aufzeichnung in der Teilmenge und einen Titelteilabschnitt umfasst, der die Symptomattribute, die spezifizierten Symptomattributwerte, die Lösungsattribute und die Lösungsattributwerte, die mit der entsprechenden Aufzeichnung in der Teilmenge in Verbindung stehen, umfasst, wodurch eine temporäre Fallbasis aus Archivaufzeichnungen in Echtzeit in Ansprechen auf die in der Anfrage spezifizierten Werte erzeugt wird.
  14. System nach Anspruch 13, wobei die Anweisungen ferner ein Übertragen der temporären Fallaufzeichnungen an den Anfragesteller umfassen.
  15. System nach Anspruch 14, wobei die Anweisungen ferner ein Löschen der temporären Fallaufzeichnungen nach dem Durchführen der Übertragung vereinfachen.
  16. System nach Anspruch 14, wobei die Anweisungen ferner folgendes vereinfachen: Identifizieren von Fällen in einer Fallbasis-Datenbank, die die spezifizierten Symptomattributwerte umfassen; und Übertragen der identifizierten Fälle und der temporären Fallaufzeichnungen an den Anfragesteller.
  17. System nach Anspruch 16, wobei die Anweisungen ferner ein Löschen der temporären Fallaufzeichnungen nach dem Durchführen der Übertragung vereinfachen.
  18. System nach Anspruch 13, wobei das Durchsuchen der Datenbank von Archivaufzeichnungen umfasst, dass Text in freier Form nach den spezifizierten Symptomattributwerten durchsucht wird.
  19. Computerprogrammprodukt zum Verwenden von Prozessen zum Abrufen einer CBR-Information, ohne eine Fallbasis zu erzeugen, wobei das Computerprogrammprodukt umfasst: ein Speichermedium, das durch einen Verarbeitungsschaltkreis gelesen werden kann und Anweisungen für eine Ausführung durch den Verarbeitungsschaltkreis zum Vereinfachen eines Verfahrens speichert, das umfasst: Zugreifen auf ein Datenmodell, das Symptomattribute und Lösungsattribute umfasst; Empfangen einer Anfrage von einem Anfragesteller, die einen oder mehrere Werte für eines oder mehrere der Symptomattribute spezifiziert; Bearbeiten der Anfrage, umfassend ein Durchsuchen der Datenbank von Archivaufzeichnungen nach den spezifizierten Symptomattributwerten und ein Empfangen einer Teilmenge der Archivaufzeichnungen, die die spezifizierten Werte umfassen; Ermitteln von Werten, die mit einem oder mehreren der Lösungsattribute in Verbindung stehen, für jede der Aufzeichnungen in der Teilmenge; und Erzeugen einer temporären Fallaufzeichnung für jede von Aufzeichnungen in der Teilmenge, wobei die temporäre Fallaufzeichnung einen Zeiger auf die entsprechende Aufzeichnung in der Teilmenge und einen Titelteilabschnitt umfasst, der die Symptomattribute, die spezifizierten Symptomattributwerte, die Lösungsattribute und die Lösungsattributwerte, die mit der entsprechenden Aufzeichnung in der Teilmenge in Verbindung stehen, umfasst, wodurch eine temporäre Fallbasis aus Archivaufzeichnungen in Echtzeit in Ansprechen auf die in der Anfrage spezifizierten Werte erzeugt wird.
  20. Computerprogrammprodukt nach Anspruch 18, wobei die Anweisungen ferner ein Übertragen der temporären Fallaufzeichnungen an den Anfragesteller und ein Löschen der temporären Fallaufzeichnungen nach dem Durchführen der Übertragung vereinfachen.
DE102008005083A 2007-01-23 2008-01-18 Abrufen einer Information eines fallbasierten Schliessens aus Archivaufzeichnungen Withdrawn DE102008005083A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/625,998 2007-01-23
US11/625,998 US7627551B2 (en) 2007-01-23 2007-01-23 Retrieving case-based reasoning information from archive records

Publications (1)

Publication Number Publication Date
DE102008005083A1 true DE102008005083A1 (de) 2008-09-04

Family

ID=39642235

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102008005083A Withdrawn DE102008005083A1 (de) 2007-01-23 2008-01-18 Abrufen einer Information eines fallbasierten Schliessens aus Archivaufzeichnungen

Country Status (3)

Country Link
US (1) US7627551B2 (de)
JP (1) JP2008262537A (de)
DE (1) DE102008005083A1 (de)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314460B (zh) * 2010-07-07 2014-05-14 阿里巴巴集团控股有限公司 数据分析方法、系统及服务器
US9934218B2 (en) * 2011-12-05 2018-04-03 Infosys Limited Systems and methods for extracting attributes from text content
WO2013096625A1 (en) * 2011-12-22 2013-06-27 Marek Tomaszewski Proximity-based electronic record query system
US8832006B2 (en) * 2012-02-08 2014-09-09 Nec Corporation Discriminant model learning device, method and program
US10528530B2 (en) * 2015-04-08 2020-01-07 Microsoft Technology Licensing, Llc File repair of file stored across multiple data stores
US10585984B2 (en) * 2015-11-10 2020-03-10 International Business Machines Corporation Techniques for improving input text processing in a data processing system that answers questions
US10325021B2 (en) 2017-06-19 2019-06-18 GM Global Technology Operations LLC Phrase extraction text analysis method and system
CN107480292A (zh) * 2017-08-29 2017-12-15 广东电网有限责任公司中山供电局 一种基于模糊算法的安全事故培训方法及系统
US11657102B2 (en) * 2019-04-29 2023-05-23 Ip.Com I, Llc Automating solution prompts based upon semantic representation
CN116821489A (zh) * 2023-06-21 2023-09-29 易方达基金管理有限公司 一种股票筛选方法及系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5224206A (en) * 1989-12-01 1993-06-29 Digital Equipment Corporation System and method for retrieving justifiably relevant cases from a case library
US5528516A (en) * 1994-05-25 1996-06-18 System Management Arts, Inc. Apparatus and method for event correlation and problem reporting
US5715374A (en) * 1994-06-29 1998-02-03 Microsoft Corporation Method and system for case-based reasoning utilizing a belief network
JP3534027B2 (ja) * 1999-12-01 2004-06-07 日本電気株式会社 コンテンツ提供装置及びプログラムを記録した機械読み取り可能な記録媒体
JP2001338095A (ja) * 2000-05-30 2001-12-07 Ok Web Inc コンピュータネットワーク利用によるヘルプデスクシステム
IL137305A (en) * 2000-07-13 2005-08-31 Clicksoftware Technologies Ld Method and system for sharing knowledge
JP2002230005A (ja) * 2001-02-05 2002-08-16 Seiko Epson Corp サポートセンターシステム
JP4715055B2 (ja) * 2001-07-31 2011-07-06 ソニー株式会社 質問/回答システム、及び質問/回答システム対応のサーバ装置
US7136852B1 (en) * 2001-11-27 2006-11-14 Ncr Corp. Case-based reasoning similarity metrics implementation using user defined functions
JP2006065623A (ja) * 2004-08-27 2006-03-09 Toshiba Corp 相談回答サーバ及び相談回答プログラム
JP2006092473A (ja) * 2004-09-27 2006-04-06 Toshiba Corp 回答支援システムおよび装置、回答支援プログラム

Also Published As

Publication number Publication date
US20080177702A1 (en) 2008-07-24
US7627551B2 (en) 2009-12-01
JP2008262537A (ja) 2008-10-30

Similar Documents

Publication Publication Date Title
DE102008005083A1 (de) Abrufen einer Information eines fallbasierten Schliessens aus Archivaufzeichnungen
DE602004003361T2 (de) System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen
DE102019001267A1 (de) Dialogartiges System zur Beantwortung von Anfragen
EP1877932B1 (de) System und verfahren zur aggregation und überwachung von dezentralisiert gespeicherten multimediadaten
DE102013205737A1 (de) System und Verfahren zum automatischen Erkennen und interaktiven Anzeigen von Informationen über Entitäten, Aktivitäten und Ereignisse aus multimodalen natürlichen Sprachquellen
DE10300545B4 (de) Vorrichtung, Verfahren, Speichermedium und Datenstruktur zur Kennzeichnung und Speicherung von Daten
DE112018006345T5 (de) Abrufen von unterstützenden belegen für komplexe antworten
DE112005003157T5 (de) Domainspezifisches Datenelement-Mappingverfahren- und System
DE112007000053T5 (de) System und Verfahren zur intelligenten Informationsgewinnung und -verarbeitung
DE112020000227T5 (de) Maschinelles lernen eines computermodells auf grundlage von korrelationenvon trainingsdaten mit leistungstrends
DE102012221251A1 (de) Semantisches und kontextbezogenes Durchsuchen von Wissensspeichern
DE112013000987T5 (de) Erzeugen von Visualisierungen einer Anzeigegruppe von Tags, die Inhaltsinstanzen in Suchkriterien erfüllenden Objekten darstellen
DE112018005272T5 (de) Suchen von mehrsprachigen dokumenten auf grundlage einer extraktion der dokumentenstruktur
DE102021004157A1 (de) Maschinell lernendes Modellieren zum Schutz gegen die Online-Offenlegung empfindlicher Daten
DE60101668T2 (de) Verfahren und gerät zum erzeugen eines auf einer formatvorlage basierten index für ein strukturiertes dokument
DE202012013725U1 (de) Kontextsensible Suche
DE112020005268T5 (de) Automatisches erzeugen von schema-annotationsdateien zum umwandeln von abfragen in natürlicher sprache in eine strukturierte abfragesprache
DE102014112983A1 (de) Aktive Wissenslenkung beruhend auf Dokumententiefenanalyse
DE102016003850A1 (de) Empfehlen von Formularfragmenten
DE60032258T2 (de) Bestimmen ob eine variable numerisch oder nicht numerisch ist
DE102021209171A1 (de) System zum wählen eines lernenden modells
CN113608955B (zh) 一种日志记录方法、装置、设备及存储介质
DE112018006438T5 (de) Clustering von facetten auf einem zweidimensionalen facettenwürfel für text-mining
DE112018005620T5 (de) Auftragsverwaltung in einem datenverarbeitungssystem
DE112021001743T5 (de) Vektoreinbettungsmodelle für relationale tabellen mit null- oder äquivalenten werten

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8180 Miscellaneous part 1

Free format text: PFANDRECHT

8180 Miscellaneous part 1

Free format text: PFANDRECHT AUFGEHOBEN

8180 Miscellaneous part 1

Free format text: PFANDRECHT

8127 New person/name/address of the applicant

Owner name: GM GLOBAL TECHNOLOGY OPERATIONS LLC , ( N. D. , US

R081 Change of applicant/patentee

Owner name: GM GLOBAL TECHNOLOGY OPERATIONS LLC (N. D. GES, US

Free format text: FORMER OWNER: GM GLOBAL TECHNOLOGY OPERATIONS, INC., DETROIT, US

Effective date: 20110323

Owner name: GM GLOBAL TECHNOLOGY OPERATIONS LLC (N. D. GES, US

Free format text: FORMER OWNER: GM GLOBAL TECHNOLOGY OPERATIONS, INC., DETROIT, MICH., US

Effective date: 20110323

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20130801