DE102016113671A1 - Verfahren zur Unterstützung orthographisch richtiger Texteingabe - Google Patents

Verfahren zur Unterstützung orthographisch richtiger Texteingabe Download PDF

Info

Publication number
DE102016113671A1
DE102016113671A1 DE102016113671.9A DE102016113671A DE102016113671A1 DE 102016113671 A1 DE102016113671 A1 DE 102016113671A1 DE 102016113671 A DE102016113671 A DE 102016113671A DE 102016113671 A1 DE102016113671 A1 DE 102016113671A1
Authority
DE
Germany
Prior art keywords
word
words
lexicon
comparison
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102016113671.9A
Other languages
English (en)
Inventor
Felix Burkhardt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Telekom AG
Original Assignee
Deutsche Telekom AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Telekom AG filed Critical Deutsche Telekom AG
Priority to DE102016113671.9A priority Critical patent/DE102016113671A1/de
Publication of DE102016113671A1 publication Critical patent/DE102016113671A1/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Abstract

Die Erfindung betrifft ein Verfahren zur Unterstützung bei der orthographisch richtigen Eingabe von Text an einem Automaten, einem Computer oder einem sonstigen computerbasierten System durch Vergleich mit in Speichermitteln dieser jeweiligen Computerdomäne gehaltenen Lexika. Dabei werden die Wörter des Eingabetextes mit Wörtern eines spezifischen Lexikons (Domänenlexikons) einer in der Computerdomäne ausgeführten Programmanwendung und mit Wörtern mindestens eines allgemeingültigen Sprachlexikons verglichen sowie für die verglichenen Wörter der Texteingabe aus jedem dieser Lexika jeweils das Wort mit dem höchsten Ähnlichkeitsmaß ermittelt. Kann für ein Wort der Texteingabe in den Lexika kein identisches Wort gefunden werden, wird für dieses das aus den Lexika ermittelte Wort mit dem höchsten Ähnlichkeitsmaß an einer Nutzerschnittstelle als Ersetzungsvorschlag ausgegeben oder das betreffende Wort der Texteingabe automatisiert direkt durch das ermittelte Wort ersetzt. Sofern dabei ein aus dem Domänenlexikon ermitteltes Wort dasselbe Ähnlichkeitsmaß aufweist wie ein aus dem oder den anderen Lexika ermitteltes, erhält das Wort aus dem Domänenlexikon den Vorrang.

Description

  • Die Erfindung betrifft ein Verfahren zur Unterstützung bei der orthographisch richtigen Eingabe von Text an einem Automaten, einem Computer oder einem sonstigen computerbasierten System. In Abhängigkeit vom jeweiligen Anwendungsfall ist dabei eine Unterstützung nicht nur unmittelbar für den Nutzer gegeben, welcher Text an einer entsprechenden Einrichtung oder einem entsprechenden System mittels einer computerbasierten Nutzerschnittstelle eingibt, sondern gegebenenfalls auch für den Betreiber eines solchen Systems oder für einen Dritten (als natürliche Person, Unternehmen oder Institution), welcher bei einem die Eingabe tätigenden Nutzer Informationen oder Angaben abfragt. Hierbei bezieht sich das Verfahren nicht auf eine Liveunterstützung während des unmittelbaren Editiervorgangs zur Texteingabe, sondern auf eine Unterstützung durch eine orthographische Bewertung einer vorzugsweise mehrere Wörter, Angaben oder gar Sätze umfassenden, durch ein entsprechendes Steuerzeichen abgeschlossenen textlichen Eingabe.
  • Computerbasierte Systeme zur Rechtschreibprüfung beziehungsweise entsprechende, auf solchen Computersystemen ablaufende Programme, so genannte Spell Checker, sind bereits seit längerem bekannt. Je nach Anwendungsfall und Gestaltung einer von einem computerbasierten System verarbeiteten Programmanwendung wird der Nutzer des entsprechenden Systems entweder live, nämlich unmittelbar während des Editierens beziehungsweise während der eigentlichen Eingabe von Text, oder nach dem Empfang eines die Eingabe abschließenden Steuerzeichens durch das betreffende System bei der orthographisch richtigen Eingabe von Text unterstützt. Vom System erhält er dabei im Falle einer orthographisch fehlerhaften Eingabe Vorschläge mit orthographisch korrekten Wörtern, von denen er eines vermutlich einzugeben wünschte, oder es erfolgt eine unmittelbare automatisierte Korrektur des von ihm eingegebenen Textes durch eine Ersetzung falsch geschriebener Wörter mit richtig geschriebenen. Die erstgenannte Variante mit Vorschlägen zu orthographisch richtigen Wörtern wird im Zusammenhang mit dem Austausch von Textnachrichten, beispielsweise im Bereich der Telekommunikation, seit einiger Zeit auch dafür genutzt, zum Beispiel den Nutzer eines Smartphones beim schnelleren Verfassen von Textnachrichten zu unterstützen.
  • Bereits seit langem bekannt ist die Einbeziehung entsprechender Verfahren zur Rechtschreibprüfung und Rechtschreibunterstützung im Zusammenhang mit Computerprogrammen für die Erstellung von Textdokumenten und zur Textverarbeitung. Eine solche Lösung wird beispielsweise in der US 5,604,897 beschrieben. Gemäß dem in der Druckschrift beschriebenen Verfahren erfolgt die Rechtschreibprüfung und gegebenenfalls eine Korrektur von Einzelwörtern dadurch, dass die betreffenden Einzelwörter mit Wortlisten (Dictionarys) verglichen werden.
  • In Weiterbildung dieses Verfahrens werden bei in der Praxis anzutreffenden Lösungen Wörter im Hinblick auf ihre orthographische Richtigkeit zumeist durch einen Vergleich mit der Wortliste eines allgemeingültigen Sprachlexikons (im Deutschen vergleichbar einer Art digitalem Duden, wobei Inhaber der Marke[n] „Duden“ die Bibliographisches Institut GmbH ist) und mit einem durch den Nutzer des Programms in Ergänzung dazu angelegten Nutzerwörterbuch (Nutzerlexikon) verglichen. Vorrang bei den insoweit bekannt gewordenen Lösungen hat dabei das allgemeingültige Sprachlexikon, typischerweise ein (digitalisiertes) Wörterbuch der jeweiligen Landessprache, für welche die betreffende Lösung implementiert ist.
  • Abweichend hiervon wird in der EP 1 733 320 A2 ein Spell Checker in Form eines computergestützten Hilfsmittels zur Erstellung von Dokumenten beschrieben, bei dem gemäß einer bevorzugten Ausbildungsform als (alleiniges) Referenzmaterial für die Prüfung ein den Inhalt des zu prüfenden Dokumentes thematisch zugeordnetes Wörterbuch beziehungsweise Lexikon verwendet wird.
  • In der Praxis kommen für einen Korrekturvorschlag oder für die Ersetzung eines (vermeintlich) orthographisch nicht korrekt geschriebenen Wortes aufgrund sprachlicher Doppeldeutigkeiten oder Mehrdeutigkeiten häufiger mehrere Möglichkeiten in Betracht. So kann sich beispielsweise der falsch geschriebene Ausdruck „rechung“ auf das Wort „Rechnung“ oder aber auf das Wort „Brechung“ (Letzteres aus dem Bereich der Optik) beziehen. Die Wörter beider möglichen Alternativen weisen hierbei aus rein wortbezogener sprachlicher Sicht dieselbe Ähnlichkeit im Verhältnis zu dem zu prüfenden Ausdruck „rechung“ auf, so dass es gegebenenfalls auf den Kontext des jeweiligen Einsatzfalls ankommt, welche dieser Möglichkeiten die bessere darstellt.
  • Aufgabe der Erfindung ist es, ein Verfahren zur Unterstützung einer orthographisch richtigen Texteingabe anzugeben, welches eine im Hinblick auf den jeweiligen Anwendungsfall flexiblere Unterstützung bietet. Vorzugsweise soll das Verfahren darüber hinaus eine Unterstützung bieten, welche sich nicht lediglich an einer Einzelwortprüfung orientiert und somit gegebenenfalls zumindest teilweise indirekt den Kontext des eingegebenen Textes berücksichtigt.
  • Die Erfindung wird durch ein Verfahren mit den Merkmalen des Patentanspruchs 1 gelöst. Vorteilhafte Aus- beziehungsweise Weiterbildungen der Erfindung sind durch die Unteransprüche gegeben.
  • Gemäß dem zur Lösung der Aufgabe vorgeschlagenen Verfahren zur Unterstützung orthographisch richtiger Texteingabe an einer computerbasierten Nutzerschnittstelle wird der Text einer mit der Eingabe eines Steuerzeichens beendeten Texteingabe, welcher an eine im Kontext einer Computerdomäne verarbeitete Programmanwendung zu übergeben ist, mit Wörtern mindestens zweier unterschiedlicher, in Speichermitteln der vorgenannten Computerdomäne gehaltener Lexika verglichen. Die vorstehend angesprochene Computerdomäne kann dabei in Abhängigkeit des jeweiligen Anwendungsfalles sehr unterschiedliche Ausprägungen haben. Entsprechendes gilt für die Programmanwendung, an welche die Texteingabe nach ihrer Überprüfung auf eine orthographisch korrekte Schreibweise des eingegebenen Textes übergeben wird.
  • So kann es sich beispielsweise bei der Computerdomäne um den einzelnen Computer eines Nutzers handeln, auf welchem ein Programm abläuft, an welches ein durch den Nutzer eingegebener Text übergeben wird. Grundsätzlich kann es sich insoweit bei dem vorgenannten Programm beispielsweise auch um ein Textverarbeitungsprogramm handeln, wenngleich bei Textverarbeitungsprogrammen eine Rechtschreibprüfung, wie bereits ausgeführt, üblicherweise gewissermaßen live, das heißt parallel zur Eingabe des Textes beziehungsweise unmittelbar beim Editieren erfolgt, ohne dass es dazu der Eingabe eines Steuerzeichens bedarf, durch welches die eigentliche Texteingabe (jedenfalls vorerst) abgeschlossen wird. Jedoch ist eine Konstellation denkbar, bei der im Rahmen eines Textverarbeitungsprogramms immer erst nach der Eingabe eines Zeilenumbruchs oder eines Seitenumbruchs die eigentliche Texteingabe als vorübergehend beendet angesehen und der im Rahmen dieser Eingabe eingegebene Text der Rechtschreibprüfung unterzogen wird.
  • Darüber hinaus kann die Überprüfung einer Texteingabe aber auch im Kontext anderer von dem hier als Computerdomäne angesehenen Einzelcomputer eines Nutzers verarbeiteter Programmanwendungen erfolgen. So ist es zum Beispiel denkbar, dass der Nutzer eines Computers von einer solchen Programmanwendung jeweils zur Eingabe bestimmter Angaben aufgefordert wird, welche dann von der betreffenden Programmanwendung verarbeitet werden, bevor der Nutzer eine Response beziehungsweise eine Systemantwort erhält oder zur Eingabe weiterer Angaben aufgefordert wird. In diesem Fall erfolgt beim Einsatz des erfindungsgemäßen Verfahrens jeweils vor der Übergabe einer Texteingabe an eine solche sie weiterverarbeitende Programmanwendung zunächst eines Überprüfung der beispielsweise jeweils mit der Entertaste abgeschlossenen Eingabe, welche schließlich im Ergebnis dieser Überprüfung gegebenenfalls in geänderter, nämlich orthographisch korrigierter Form, an die Programmanwendung übergeben wird.
  • Mit Bezug auf die vorstehend gegebenen Beispiele für eine Computerdomäne in Form eines durch einen Nutzer verwendeten Einzelcomputers ist es beispielsweise im Rahmen von Programmen für die Textverarbeitung üblich, dem Nutzer die Möglichkeit zu geben, für die Rechtschreibprüfung ein eigenes Wörterbuch als gewissermaßen nutzerspezifisches Lexikon anzulegen. In dieses Lexikon kann der Nutzer häufig verwendete Begriffe aufnehmen, welche einem typischerweise ohnehin vorhandenen, für die Rechtschreibprüfung genutzten allgemeingültigen Sprachlexikon nicht bekannt sind. Auf diese Weise kann der Nutzer die Rechtschreibprüfung im Kontext der Nutzung der betreffenden Programmanwendung beispielsweise auf die Prüfung spezieller Fachbegriffe erweitern beziehungsweise – wie durch die weiteren Erläuterungen zum Verfahren noch erkennbar werden wird – die Rechtschreibprüfung im Hinblick auf solche Fachbegriffe priorisieren.
  • Nach dem der Erläuterung des hier vorgestellten Verfahrens zugrundeliegenden Verständnis kann es sich bei der wiederholt angesprochenen Computerdomäne aber auch um ein komplexeres computerbasiertes System handeln. Beispielhaft hierfür seien Anwendungsfälle genannt, bei denen ein Nutzer an einem Computer Texteingaben in eine Bildschirmmaske macht, welche ihm von einem Dienstleister über das Internet in einer Browseranwendung zum Zweck der Abfrage bestimmter Angaben präsentiert wird. Bezogen auf diesen Falle handelt es sich bei der Programmanwendung, in deren Kontext die Rechtschreibprüfung erfolgt, beispielsweise um eine auf Backendeinrichtungen des vorgenannten Dienstleisters zur Auswertung von Kundeneingaben (Nutzereingaben) ablaufende Programmanwendung. Insoweit wird hierbei im Grunde nicht nur der die Eingabe tätigende Nutzer unterstützt, sondern ebenso der Dienstleister, dessen Systemen möglicherweise eine sinnvolle Auswertung der Nutzereingaben nur im Falle dessen ermöglicht ist, dass entsprechende Texteingaben (zumindest weitgehend) orthographisch korrekt sind.
  • Die Implementierung des vorgestellten Verfahren zur Unterstützung bei der orthographisch richtigen Texteingabe wird im letztgenannten Fall vorzugsweise in Form einer auf den Systemen des Dienstleisters ablaufenden Programmanwendung erfolgen, kann aber grundsätzlich auch durch eine zur Nutzung der Angebote des Dienstleisters auf dem System (Computer) des Nutzers zu installierende Programmanwendung bewerkstelligt werden. Unabhängig davon geht aber das erfindungsgemäße Verfahren davon aus, dass neben zumindest einem allgemeingültigen Sprachlexikon (beispielsweise einem digitalen Wörterbuch der deutschen Sprache) ein sich auf den Kontext des Anwendungsfalles beziehendes spezifisches Wörterbuch zur Unterstützung einer orthographisch richtigen Texteingabe herangezogen wird.
  • Insoweit muss es sich im Hinblick auf das zuletzt erläuterte Beispiel bei dem spezifischen Lexikon nicht um ein nutzerspezifisches Lexikon im eigentlichen Sinne, also um ein von einem Nutzer erstelltes Lexikon, handeln. Vielmehr kann es sich gerade in diesem Fall vorzugsweise um ein durch den genannten Dienstleister für den Zweck der Abfrage von in einem ganz bestimmten Kontext stehenden Angaben erstelltes spezifisches Lexikon handeln. Daher wird auch im Kontext der Erläuterungen zur Erfindung sowie in den Patentansprüchen nicht von einem Nutzerlexikon, sondern verallgemeinernd von einem Domänenlexikon gesprochen, nämlich von einem Lexikon, welches in einem Kontext zu einer ganz bestimmten, innerhalb einer (gegebenenfalls auch nur temporär bestehenden) Computerdomäne ablaufenden Programmanwendung steht.
  • Das erfindungsgemäße Verfahren umfasst die nachfolgend angegebenen Schritte, wobei diese Verfahrensschritte im Zuge der Verarbeitung einer entsprechenden Programmanwendung durch eine Verarbeitungseinheit der schon mehrfach genannten Computerdomäne ausgeführt werden. Die letztgenannte Programmanwendung kann dabei ein Teil der bereits angesprochenen, die Eingabe über die Rechtschreibprüfung hinaus weiter verarbeitenden Programmanwendung oder (mit ihr interagierend) dieser Programmanwendung vorgeschaltet beziehungsweise als deren Plugin ausgebildet sein. Hierbei vollziehen sich folgende Verfahrensschritte, deren Darstellung vor dem Hintergrund der vorstehend gegebenen Erläuterung erfolgt.
    • a) Der an Eingabemitteln einer Nutzerschnittstelle im Rahmen der mit einem dazu vorgesehenen Steuerzeichen beendeten Eingabe eingegebene und an eine Programmanwendung zu übergebende Text wird mindestens mit den Wörtern eines Domänenlexikons, nämlich eines spezifischen Lexikons der von beziehungsweise innerhalb der Computerdomäne ausgeführten Programmanwendung, verglichen sowie mit den Wörtern wenigstens eines allgemeingültigen Sprachlexikons. Hierbei wird für die jeweils verglichenen Wörter der Texteingabe aus jedem der vorgenannten Lexika jeweils das Wort mit dem höchsten Ähnlichkeitsmaß ermittelt. Üblicherweise wird der entsprechende Vergleich mit zwei Lexika, nämlich dem schon genannten Domänenlexikon und einem allgemeingültigen Sprachlexikon erfolgen, wobei es sich bei Letzterem in der Regel um ein digitalisiertes Wörterbuch der jeweiligen Landessprache handelt, in Bezug auf welche die orthographische Überprüfung erfolgt. Im Hinblick darauf, dass aber gegebenenfalls auch mehrere allgemeingültige Sprachlexika im Rahmen des Verfahrens zum Einsatz gelangen können, sei darauf verwiesen, dass beispielsweise in Österreich die Landessprache Deutsch ist, es aber über die hochdeutsche Sprache hinaus spezielle, nur in Österreich in dieser Form gebräuchliche Wörter gibt, die beispielsweise in einem zweiten beziehungsweise gesonderten (für Österreich) allgemeingültigen Sprachlexikon erfasst sein können.
    • b) Für die Wörter des eingegebenen Textes beziehungsweise der Texteingabe, für die in keinem der für den Vergleich herangezogenen Lexika ein Wort mit einem einer Wortidentität entsprechendem Ähnlichkeitsmaß ermittelt werden kann, erfolgt die Ausgabe eines Wortvorschlags an Ausgabemitteln der Nutzerschnittstelle oder diese Wörter werden in einem automatisierten Vorgang unmittelbar durch ein als orthographisch richtig unterstelltes Wort ersetzt. Hierbei erfolgt die Ausgabe eines Wortvorschlags oder die automatisierte Ersetzung mit der Maßgabe, dass (i.) für den Wortvorschlag oder die Ersetzung jeweils das aus den Lexika ermittelte Wort mit dem höchsten Ähnlichkeitsmaß verwendet wird und (ii.) für den Wortvorschlag oder die Ersetzung das aus dem Domänenlexikon ermittelte Wort verwendet wird, sofern dieses Wort dasselbe Ähnlichkeitsmaß aufweist wie ein mit dem höchstens Ähnlichkeitsmaß aus dem allgemeingültigen Sprachlexikon oder den allgemeingültigen Sprachlexika ermitteltes Wort.
  • Abweichend vom Stand der Technik wird also das spezifische, hier als Domänenlexikon bezeichnete Lexikon, bei welchem es sich im Falle einer Computerdomäne mit einem Einzelcomputer und einer von diesem Einzelcomputer verarbeiteten Programmanwendung um ein Nutzerlexikon handeln kann, für die Rechtschreibprüfung nicht lediglich ergänzend herangezogen. Vielmehr erfolgt die Rechtschreibprüfung primär unter Heranziehung des genannten, vorzugsweise in einer Datenbank der jeweiligen Computerdomäne (Automat, Einzelcomputer oder aus mehreren Einheiten/Einrichtungen bestehendes computerbasiertes System) gespeicherten Domänenlexikons und wird durch den Vergleich mit einem oder mehreren allgemeingültigen Sprachlexika ergänzend unterstützt.
  • Gemäß den vorstehenden Ausführungen wird bei dem Vergleich von Wörtern der zu prüfenden Texteingabe mit den für die Prüfung herangezogenen Lexika jeweils das Wort mit dem höchsten Ähnlichkeitsmaß ermittelt. Für ein solches Ähnlichkeitsmaß sind unterschiedliche Definitionen und demgemäß unterschiedliche Möglichkeiten seiner Ermittlung denkbar. Entsprechend einer bevorzugten Ausgestaltung des erfindungsgemäßen Verfahrens wird als Ähnlichkeitsmaß die Levenshtein-Distanz herangezogen. Zur jeweiligen Ermittlung des Wortes mit dem höchsten Ähnlichkeitsmaß wird demnach ein die Levenshtein-Distanz ermittelnder Algorithmus verwendet. Die Levenshtein-Distanz ist ein Maß für die Ähnlichkeit zweier Wörter und gibt an, wie viele Buchstaben bei einem dieser Wörter gestrichen oder durch andere ersetzt oder hinzugefügt werden müssen um das betreffende Wort in das jeweils andere zu überführen. Dabei steigt das Ähnlichkeitsmaß mit abnehmender Levenshtein-Distanz, wobei eine Levenshtein-Distanz von 0 eine Wortidentität kennzeichnet.
  • Bei einer Umsetzung des Verfahrens gemäß der die Levenshtein-Distanz als Ähnlichkeitsmaß heranziehenden Ausgestaltung ist es vorgesehen, dass im Rahmen des Verfahrens eine maximale Levenshtein-Distanz festgelegt wird, bei der ein aus einem der Lexika ermitteltes Wort überhaupt für einen Wortvorschlag oder eine Ersetzung als verwendbar angesehen wird. Da mit steigender Levenshtein-Distanz das Ähnlichkeitsmaß abnimmt, ist es sinnvoll ist, eine maximale Levenshtein-Distanz festzulegen, für welche ein aus einem Lexikon ermitteltes Wort im Rahmen der orthographischen Überprüfung des eingegebenen Textes für einen Wortvorschlag beziehungsweise eine Ersetzung sinnvollerweise in Betracht zu ziehen ist. Hiervon kann sicherlich bei einer Levenshtein-Distanz von 5 oder höher, also im Falle dessen, dass das ermittelte Wort hinsichtlich 5 seiner Buchstaben durch Hinzufügen, Streichen oder Verändern in den verglichenen Text beziehungsweise das verglichene Wort zu überführen ist, nicht mehr ausgegangen werden. In Versuchen hat sich insoweit gezeigt, dass, allerdings sicherlich jeweils wieder abhängig vom Einsatzfall, eine Levenshtein-Distanz von höchstens 3 noch als sinnvoll angesehen werden kann.
  • Der vorstehend dargestellte grundsätzliche Ablauf des erfindungsgemäßen Verfahrens geht von der denkbaren Annahme aus, dass bei jedem Vergleich der Wörter des eingegebenen Textes mit den Wörtern der Lexika in jedem der Lexika genau immer ein Wort mit einem höchsten Ähnlichkeitsmaß gefunden wird. Tatsächlich ist es aber nicht unwahrscheinlich, dass bei einem solchen Vergleich in ein und demselben Lexikon mehrere für den Wortvorschlag oder die automatisierte Ersetzung in Betracht kommende Wörter mit demselben, bezogen auf das jeweilige Lexikon höchsten Ähnlichkeitsmaß ermittelt werden. Für diesen Fall ist es in spezieller Ausbildung des Verfahrens vorgesehen, dass jeweils das erste mit diesem höchsten Ähnlichkeitsmaß in einem Lexikon ermittelte Wort als das aus diesem Lexikon ermittelte Wort mit dem höchsten Ähnlichkeitsmaß angesehen wird. Dies steht natürlich nicht der Möglichkeit entgegen, dass aus dem oder den anderen Lexika ermittelte Wörter ein noch höheres Ähnlichkeitsmaß aufweisen und daher schließlich für den Wortvorschlag beziehungsweise die Ersetzung verwendet werden. Dabei gilt das zuvor für den Fall des Vorliegens von Wörtern mit demselben Ähnlichkeitsmaß Gesagte selbstverständlich auch im Hinblick auf das oder diese zuletzt genannten Lexika, also für die Lexika aus denen zumindest ein Wort gegebenenfalls aber auch mehrere Wörter mit einem höheren Ähnlichkeitsmaß ermittelt werden. Zudem gilt auch hierbei gewissermaßen der Vorrang des Domänenlexikons.
  • Die zuvor beschriebene Ausbildungsform des Verfahrens kommt insbesondere für den Fall einer automatisierten Ersetzung falschgeschriebener Wörter in Betracht, wohingegen es im Falle lediglich einer Unterbreitung von Wortvorschlägen sicherlich auch denkbar ist, mehrere aus einem Lexikon ermittelte Wörter mit gleichem Ähnlichkeitsmaß als Wortvorschlag auszugeben. Aber auch im letztgenannten Fall bleibt, dem Grundansatz der Erfindung folgend, wiederum der Vorrang des Domänenlexikons erhalten
  • Wie bereits ausgeführt, können bei dem vorgestellten Verfahren zur Unterstützung einer orthographisch richtigen Texteingabe neben dem Domänenlexikon gegebenenfalls auch mehrere allgemeingültige Sprachlexika zur Prüfung des eingegebenen Textes im Wege des Vergleichs herangezogen werden. Insoweit sei an dieser Stelle nochmals an das Beispiel der Verwendung eines allgemeingültigen Sprachlexikons der deutschen Sprache sowie eines ergänzend herangezogenen Sprachlexikons der deutschen Sprache mit speziell beziehungsweise ausschließlich in Österreich verwendeten Wörtern erinnert. In diesem Fall wird das Verfahren zumindest, sofern eine automatisierte Ersetzung falsch geschriebener Wörter vorgesehenen ist, vorzugsweise so gestaltet beziehungsweise so implementiert, dass die allgemeingültigen Sprachlexika eine unterschiedliche Gewichtung erhalten. Wird nun bei einem Vergleich für mehrere Wörter aus verschiedenen dieser Lexika das (vermeintlich) höchste Ähnlichkeitsmaß ermittelt, so wird in Bezug auf den mit diesen Lexika durchgeführten Vergleich das aus dem allgemeingültigen Sprachlexikon mit der höchsten Gewichtung ermittelte Wort als das Wort mit dem höchsten Ähnlichkeitsmaß angesehen. Dies ändert allerdings nicht daran, das entsprechend dem grundsätzlichen Gedanken der Erfindung, dem Domänenlexikon gewissermaßen der absolute Vorrang zukommt, so dass für den Wortvorschlag oder die automatische Ersetzung – sofern vorhanden – ein Wort aus dem Domänenlexikon mit demselben oder einem niedrigeren Ähnlichkeitsmaß verwendet wird.
  • In Bezug auf den Vergleich mit den beiden allgemeingültigen Sprachlexika würde bei dem zuvor nochmals zitierten Beispiel das Lexikon mit den speziellen Wörtern der österreichischen Mundart eine gegenüber dem allgemeinen deutschen Sprachlexikon höhere Gewichtung erhalten, sofern das Verfahren für den Einsatz in Österreich implementiert wird. Für den Fall einer Implementierung in Deutschland, bei welcher aber dennoch die eventuelle Berücksichtigung der österreichischen Mundart gewünscht ist, würde jedoch sicherlich für die beiden allgemeingültigen Sprachlexika eine umgekehrte Gewichtung gewählt werden.
  • Entsprechend einer vorgesehenen Weiterbildung des erfindungsgemäßen Verfahrens erfolgt zur Unterstützung der orthographisch richtigen Texteingabe eine Prüfung der Wörter des eingegebenen Textes unter Berücksichtigung ihres sprachlichen Kontextes. Hierbei erfolgt nicht lediglich ein 1:1-Vergleich (Wort-zu-Wort-Vergleich) von Wörtern des eingegebenen Textes mit den jeweils im Rahmen der Ausgestaltung des Verfahrens herangezogenen Lexika, sondern es werden vielmehr darüber hinaus mehrere durch ein Leerzeichen getrennte Wörter des eingegebenen Textes als Wortgruppe jeweils mit einzelnen in den Lexika enthaltenen Wörtern verglichen. Mehrere durch Leerzeichen voneinander getrennte Teile des im Rahmen einer durch ein Sonderzeichen (Enter) beendeten Eingabe eingegebenen Textes werden in diesem Zusammenhang als mehrere Wörter angesehen, auch wenn sie dies bei orthographisch richtiger Betrachtung möglicherweise gar nicht sind. Dies eröffnet die Möglichkeit, ein aus mehreren irrtümlich beziehungsweise fehlerhaft auseinandergeschriebenen Teilen bestehendes Wort durch dessen richtige, zusammengeschriebene Schreibweise zu ersetzen beziehungsweise einer den Text eingebenden Person über Ausgabemittel der Nutzerschnittstelle entsprechende Vorschläge zu unterbreiten. Im Hinblick auf eine Verwendung der Levenshtein-Distanz als Ähnlichkeitsmaß werden demnach gewissermaßen Leerzeichen (zumindest in einer Richtung, nämlich Leerzeichen des Eingabetextes) hinsichtlich der Möglichkeit ihrer (zum Zweck der Überführung mehrerer Wörter der Eingabe in ein anderes Wort aus einem der Lexika) sinnvollen Ersetzung durch einen Buchstaben einbezogen.
  • Zur näheren Erläuterung der zuletzt dargestellten Ausbildungsform in einem entsprechenden Ablauf wird nachfolgend vereinfachend auch ein einzelnes Wort als eine Wortgruppe, nämlich als eine Wortgruppe aus einem Bestandteil beziehungsweise einem Wort, angesehen. Der Ablauf des Verfahrens gestaltet sich dann so, dass der eingangs angegebene Verfahrensschritt a), nämlich der Verfahrensschritt des Vergleichens der eingegebenen Wörter mit den Lexika, in mehreren Vergleichsdurchläufen erfolgt. Ausgehend von Wortgruppen mit einer festgelegten maximalen Anzahl von Wörtern, welche jeweils mit einzelnen Wörtern der Lexika verglichen werden, wird die Anzahl der als eine Wortgruppe betrachteten Wörter in jedem Vergleichsdurchgang um 1 reduziert. In jedem dieser Vergleichsdurchgänge werden dabei allerdings alle theoretisch möglichen Wortgruppen des eingegebenen Textes, welche jeweils aus der für den Vergleichsdurchgang festgelegten Anzahl aufeinanderfolgender (noch als zu prüfen anzusehender) Wörter bestehen, mit Einzelwörtern der Lexika verglichen. Bezogen auf einen Vergleichsdurchgang, bei dem theoretisch mögliche Wortgruppen aus jeweils drei aufeinanderfolgenden Wörtern betrachtet werden, heißt dies, dass also zunächst eine aus den Wörtern 1 bis 3 des eingegebenen Textes bestehende Wortgruppe, danach eine aus den Wörtern 2 bis 4 des eingegebenen Textes bestehende Wortgruppe sowie nachfolgend eine aus den Wörtern 3 bis 5 bestehende Wortgruppe des eingegebenen Textes und gegebenenfalls in entsprechender weiterer Fortsetzung gebildete Wortgruppen mit den Einzelwörtern der Lexika verglichen werden. Sofern bei einem solchen Vergleich aus einem der Lexika ein Wort mit einem festgelegten Mindestähnlichkeitsmaß beziehungsweise mit einer festgelegten maximalen Levenshtein-Distanz ermittelt wird, wird die betreffende Wortgruppe für einen Wortvorschlag oder die automatische Ersetzung auf der Basis des aus dem betreffenden Lexikon ermittelten Wortes vorgemerkt und bleibt daher bei dem nächsten sich anschließenden Vergleichsdurchgang außer Betracht (gilt nicht mehr als noch zu vergleichen). Der zuvor geschilderte Ablauf endet mit einem Vergleichsdurchgang, bei welchem die Wortgruppen eine Länge von 1 haben, also aus jeweils einem Wort bestehen.
  • In der Art von Ausführungsbeispielen sollen anhand von Zeichnungen nachfolgend nochmals einzelnen Aspekte des erfindungsgemäßen Verfahrens erläutert werden. In den zughörigen Zeichnungen zeigen:
  • 1: einen grundsätzlichen groben Ablaufplan des Verfahrens,
  • 2: einen groben Ablaufplan der Verfahrensgestaltung bei der Berücksichtigung von Wortgruppen einer Texteingabe.
  • Die 1 zeigt den grundsätzlichen Ablauf des erfindungsgemäßen Verfahrens in Form eines groben Ablaufplanes. Beispielhaft sei angenommen, dass das Verfahren in einer von einem Backendserver eines Dienstleiters verarbeiteten Programmanwendung implementiert ist. Durch den Dienstleister, werden beispielsweise über ein Webportal Angaben von einem Nutzer abgefragt. Der Backendserver und gegebenenfalls weitere computerbasierte Einrichtungen des Dienstleisters, eine Programmanwendung des Dienstleisters zur weiteren Verarbeitung von dem Nutzer über das Webportal abgefragter Angaben sowie ein Computer des Nutzers, mit welchem dieser die Eingaben zur Übermittlung der von ihm abgefragten Angaben an den Dienstleister tätigt, bilden zusammen die (in dieser Konfiguration möglicherweise nur temporär bestehende) bereits vielfach angesprochene Computerdomäne aus, wobei der Computer die Nutzerschnittstelle mit Ein- und Ausgabemitteln darstellt. Im Kontext dieser Computerdomäne, also der in zuvor beispielhaft beschriebenen Weise beschaffenen Computerumgebung, sind die von dem Nutzer zur Beantwortung von Fragen des Dienstleisters beziehungsweise zur Mitteilung der erfragten Angaben getätigten Eingaben zu bewerten. Die in der 1 genannten Lexika werden dabei in Speichermitteln der Computerdomäne, gemäß dem Beispiel in einer oder mehreren Datenbanken in den computerbasierten Einrichtungen des Dienstleisters gehalten. Im Hinblick darauf, dass die Unterstützung bei der orthographisch richtigen Eingabe des Textes betreffend die abgefragten Angaben auch dazu dient, sicherzustellen, dass die entsprechenden Angaben durch den Dienstleisters computertechnisch weiter verarbeitet werden können, unterstützt das Verfahren vorliegend den die Eingaben tätigenden Nutzer und den Dienstleister im Grunde gleichermaßen. Sinnvollerweise wird dabei das spezifische Lexikon, also das Domänenlexikon, durch den Dienstleister erstellt und in dessen Systemen gehalten.
  • In dem zur Erläuterung dieses Ablaufs gewählten Beispiel erfolgt zunächst keine Berücksichtigung von eventuell jeweils zu einem Wort zusammenzufassenden Wortgruppen, wie sie entsprechend einer möglichen Weiterbildung des Verfahrens und gemäß dem Beispiel nach der 2 vorgesehen ist. Der Ablauf bezieht sich vielmehr auf eine Verfahrensgestaltung, gemäß welcher nur eine wortweise Prüfung eines eingegebenen Textes erfolgt. Es wird demnach jedes Wort des eingegebenen Textes einzeln mit jeweils allen der vorgesehenen Lexika – in dem Beispiel sind es zwei, nämlich ein Domänenlexikon und ein allgemeingültiges Sprachlexikon – verglichen.
  • Für das Beispiel sei ferner angenommen, dass die durch ein an einer Tastatur eingegebenes Steuerzeichen, wie zum Beispiel das Steuerzeichen für die Entertaste, beendete und vor der Übergabe an eine Programmanwendung mit den Lexika verglichene Texteingabe das falsch geschriebene Wort „rechung“ enthält. Bei einem Vergleich dieses falsch geschriebenen Wortes mit dem allgemeingültigen Sprachlexikon (Sprachlexikon der deutschen Sprache) wird beispielsweise das Wort „Brechung“ (aus der Optik) als erstes Wort mit dem in Bezug auf dieses Lexikon höchsten Ähnlichkeitsmaß, nämlich mit einer Levenshtein-Distanz von 1, ermittelt. Außer dem Vergleich mit dem allgemeingültigen Sprachlexikon erfolgt aber ferner ein hinsichtlich seines Ergebnisses zu priorisierender Vergleich mit einem spezifischen Domänenlexikon. Im Rahmen des Beispiels sei angenommen, dass die an der betrachteten Stelle getätigte Texteingabe zur Übergabe an eine Programmanwendung des Dienstleister für die Fakturierung oder dergleichen vorgesehen ist.
  • Aus dem vom Dienstleister erstellten Domänenlexikon wird nun beim Vergleich des falsch eingegebenen Wortes „rechung“ (bei Außerbetrachtlassung der Groß- und Kleinschreibung) das orthographisch korrekte Wort „Rechnung“ als das nach den vorstehend erläuterten Grundsätzen ähnlichste Wort, also als das Wort mit dem höchsten Ähnlichkeitsmaß, ermittelt. Auch dieses Wort weist gegenüber dem verglichenen, falsch geschriebenen Wort eine Levenshtein-Distanz von 1 auf. Gemäß dem grundsätzlichen Ansatz, wonach dem Domänenlexikon jeweils der Vorrang eingeräumt und das allgemeingültige deutsche Sprachlexikon lediglich ergänzend herangezogen wird, gibt ein das erfindungsgemäße Verfahren implementierendes Programm daher das Wort „Rechnung“ zurück, durch welches das falsch geschriebene Wort „rechung“ entweder unmittelbar in einem automatisierten Vorgang ersetzt wird oder welches einer eingebenden Person zur Ersetzung über entsprechende Ausgabemittel der für die Eingabe verwendeten Nutzerschnittstelle vorgeschlagen wird.
  • Die 2 zeigt in einem ebenfalls groben Ablaufschema den Ablauf des Verfahrens entsprechend einer Ausgestaltung, bei welchem der zwischen den Wörtern einer Texteingabe bestehende Kontext dadurch Berücksichtigung findet, dass möglicherweise versehentlich oder irrtümlich auseinandergeschriebene Wörter durch ein Wort aus einem der Lexika ersetzt werden oder einer die Eingabe tätigenden Person ein Vorschlag für eine solche Ersetzung unterbreitet wird. In einem ersten Vergleichsdurchgang (a) werden hierbei jeweils drei aufeinanderfolgende Wörter des Eingabetextes als Wortgruppe, als ein sogenanntes Trigramm, mit den im Rahmen des entsprechenden Anwendungsfalls vorgesehenen Lexika (hier wieder ein Domänenlexikon und ein allgemeingültiges Sprachlexikon) verglichen.
  • Der Vergleich erfolgt dabei für jedes aus aufeinanderfolgenden Wörtern des eingegebenen Textes zu bildende Trigramm. Wurde also beispielsweise im Rahmen einer Eingabe der Text „möchte rechung ab buch en“ eingegeben, so werden in einem ersten Vergleichsdurchgang die Trigramme „möchte rechung ab“, „rechung ab buch“ und „ab buch en“ mit den beiden Lexika verglichen. Im Ergebnis des entsprechenden Vergleichsdurchgangs würde hierbei beispielsweise mittels des Domänenlexikons das Wort „abbuchen“ als mögliche Ersetzung für das Trigramm „ab buch en“ gefunden. Diese mögliche Ersetzung würde bei dem sich anschließenden zweiten Vergleichsdurchlauf außer Betracht bleiben.
  • Für den zweiten Durchlauf (b), bei welchem die für den Vergleich verbleibenden Wörter der Texteingabe jeweils zu Wortgruppen aus zwei Wörtern, zu sogenannten Bigrammen zusammengefasst werden, würde somit lediglich noch das Bigramm „möchte rechung“ für einen Vergleich mit Einzelwörtern der Lexika verbleiben. Vorliegend würde hierbei wohl in keinem der Lexika ein Wort gefunden werden, welches als sinnvoller Ersatz für das verbliebene Bigramm anzusehen wäre. Folglich würde sich in einem dritten, hier nicht dargestellten Vergleichsdurchlauf ein Einzelwortvergleich anschließen, bei dem jedes der verbliebenen Wörter (die ursprünglichen Wörter „ab buch en“ der Texteingabe bleiben außer Betracht, da sie bereits im Zusammenhang mit der Überprüfung der Trigramme bearbeitet wurden) „möchte“ und „rechung“ mit den beiden Lexika verglichen wird. Im Ergebnis dieses Durchlaufs würde dann analog zu dem ersten Beispiel wiederum „rechung“ durch „Rechnung“ ersetzt beziehungsweise das letztgenannte Wort für eine Ersetzung der eingebenden Person vorgeschlagen werden. Im Gesamtergebnis des Vergleich würden nach durchlaufen aller Vergleichsdurchgänge der Text "Möchte Rechnung abbuchen" als Eingabevorschlag an der Nutzerschnittstelle, beispielsweise auf einem Bildschirm eines Computers, mit dem der Nutzer über ein Webinterface mit Systemen des Dienstleister kommuniziert ausgegeben. Alternativ könnte aber auch sofort eine automatisierte Ersetzung des von dem Nutzer in orthographisch falscher Schreibweise eingegeben Textes durch den über den im Wege des Vergleichs mit den Lexika richtig gestellten Text erfolgen.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 5604897 [0003]
    • EP 1733320 A2 [0005]

Claims (7)

  1. Verfahren zur Unterstützung orthographisch richtiger Texteingabe, wobei ein Text, welcher zur Übergabe an eine Programmanwendung an einer computerbasierten Nutzerschnittstelle eingegeben wird, nach seiner mit einem Steuerzeichen beendeten Eingabe für eine orthographische Überprüfung im Kontext dieser in einer Computerdomäne verarbeiteten Programmanwendung mit Wörtern mindestens zweier unterschiedlicher, in Speichermitteln der Computerdomäne gehaltener Lexika verglichen wird, gekennzeichnet durch die Schritte a.) Vergleich der Wörter des eingegebenen Textes mit den Wörtern eines Domänenlexikons, nämlich eines spezifischen Lexikons der in der Computerdomäne ausgeführten Programmanwendung, sowie mit den Wörtern mindestens eines allgemeingültigen Sprachlexikons, wobei für die verglichenen Wörter der Texteingabe aus jedem dieser Lexika jeweils das Wort mit dem höchsten Ähnlichkeitsmaß ermittelt wird, b.) Ausgabe eines Wortvorschlags an Ausgabemitteln der Nutzerschnittstelle für Wörter des eingegebenen Textes oder Ersetzen von Wörtern des eingegebenen Textes, für die in keinem der für den Vergleich herangezogenen Lexika ein Wort mit einem Wortidentität entsprechendem Ähnlichkeitsmaß ermittelt werden kann, mit der Maßgabe, dass i.) für den Wortvorschlag oder die Ersetzung jeweils das aus den Lexika ermittelte Wort mit dem höchsten Ähnlichkeitsmaß verwendet wird und ii.) für den Wortvorschlag oder die Ersetzung das aus dem Domänenlexikon ermittelte Wort verwendet wird, sofern dieses Wort dasselbe Ähnlichkeitsmaß aufweist wie ein mit dem höchsten Ähnlichkeitsmaß aus dem oder den allgemeingültigen Sprachlexika ermitteltes Wort.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass, sofern bei einem Vergleich mit einem Lexikon ein dem höchsten bei diesem Vergleich ermittelten Ähnlichkeitsmaß entsprechendes Ähnlichkeitsmaß für mehrere Wörter desselben Lexikons festgestellt wird, in Bezug auf diesen Vergleich das erste mit diesem Ähnlichkeitsmaß ermittelte Wort als das aus diesem Lexikon ermittelte Wort mit dem höchsten Ähnlichkeitsmaß angesehen wird.
  3. Verfahren nach einem der Ansprüche 1 oder 2, wobei zur orthographischen Überprüfung des eingegebenen Textes neben dem Domänenlexikon mehrere allgemeingültige Sprachlexika herangezogen werden, dadurch gekennzeichnet, dass die allgemeingültigen Sprachlexika eine sie voneinander unterscheidende Gewichtung aufweisen und dass, sofern bei einem Vergleich mit den allgemeingültigen Sprachlexika ein dem höchsten ermittelten Ähnlichkeitsmaß entsprechendes Ähnlichkeitsmaß für mehrere Wörter aus verschiedenen dieser Lexika festgestellt wird, in Bezug auf den mit diesen Lexika durchgeführten Vergleich das aus dem allgemeinen Sprachlexikon mit der höchsten Gewichtung ermittelte Wort als das Wort mit dem höchsten Ähnlichkeitsmaß angesehen wird.
  4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass als Ähnlichkeitsmaß die durch die Verarbeitung eines Algorithmus ermittelte Levenshtein-Distanz verwendet wird, wobei das Ähnlichkeitsmaß mit abnehmender Levenshtein-Distanz steigt und bei Wortidentität eine Levenshtein-Distanz von Null ermittelt wird.
  5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass eine maximale Levenshtein-Distanz festgelegt wird, bei der ein aus einem der Lexika ermitteltes Wort für einen Wortvorschlag oder eine Ersetzung verwendbar ist.
  6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass die Festlegung der maximalen Levenshtein-Distanz dynamisch während des Vergleichs, jeweils in Abhängigkeit der Wortlänge eines verglichenen Wortes erfolgt.
  7. Verfahren nach Anspruch 5 oder 6, dadurch gekennzeichnet, dass der Vergleich der Wörter des eingegebenen Textes in mehreren Vergleichsdurchläufen erfolgt, wobei a.) abgesehen von dem letzten der Vergleichsdurchläufe, in welchem einzelne Wörter des eingegebenen Textes Wort für Wort mit einzelnen Wörtern de Lexika verglichen werden, in den Vergleichsdurchläufen Wortgruppen des eingegebenen Textes mit einzelnen Wörtern der Lexika verglichen werden und b.) beginnend mit Wortgruppen aus einer festgelegten maximalen Anzahl von Wörtern in jedem Vergleichsdurchlauf die Anzahl der Wörter in den Wortgruppen, welche mit einzelnen Wörtern der Lexika verglichenen werden, um jeweils 1 reduziert wird und c.) in jedem den Vergleich von Wortgruppen betreffenden Vergleichsdurchlauf jeweils alle, aus aufeinanderfolgenden und noch zu vergleichenden Wörtern des eingegebenen Textes mit der für den jeweiligen Vergleichsdurchlauf festgelegten Anzahl von Wörtern bildbaren Wortgruppen mit den Lexika verglichen werden und d.) die Wörter von Wortgruppen, für welche in einem Vergleichsdurchlauf unter Berücksichtigung einer statisch oder dynamisch festgelegten maximalen Levenshtein-Distanz ein Wortvorschlag oder ein für eine Ersetzung verwendbares Wort aus mindestens einem der Lexika ermittelt wird, bei dem im nächsten Vergleichsdurchlauf erfolgenden Vergleich außer Betracht bleiben, also nicht mehr als noch zu vergleichen angesehen werden.
DE102016113671.9A 2016-07-25 2016-07-25 Verfahren zur Unterstützung orthographisch richtiger Texteingabe Withdrawn DE102016113671A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102016113671.9A DE102016113671A1 (de) 2016-07-25 2016-07-25 Verfahren zur Unterstützung orthographisch richtiger Texteingabe

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102016113671.9A DE102016113671A1 (de) 2016-07-25 2016-07-25 Verfahren zur Unterstützung orthographisch richtiger Texteingabe

Publications (1)

Publication Number Publication Date
DE102016113671A1 true DE102016113671A1 (de) 2018-01-25

Family

ID=60890164

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102016113671.9A Withdrawn DE102016113671A1 (de) 2016-07-25 2016-07-25 Verfahren zur Unterstützung orthographisch richtiger Texteingabe

Country Status (1)

Country Link
DE (1) DE102016113671A1 (de)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5604897A (en) 1990-05-18 1997-02-18 Microsoft Corporation Method and system for correcting the spelling of misspelled words
EP1733320A2 (de) 2004-04-03 2006-12-20 Star AG Computergestütztes hilfsmittel (ref-spell-checker) für ein verfahren zur erstellung von dokumenten

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5604897A (en) 1990-05-18 1997-02-18 Microsoft Corporation Method and system for correcting the spelling of misspelled words
EP1733320A2 (de) 2004-04-03 2006-12-20 Star AG Computergestütztes hilfsmittel (ref-spell-checker) für ein verfahren zur erstellung von dokumenten

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KUKICH, Karen. Techniques for automatically correcting words in text. ACM Computing Surveys (CSUR), 1992, 24. Jg., Nr. 4, S. 377-439. doi: 10.1145/146370.146380

Similar Documents

Publication Publication Date Title
DE10342594B4 (de) Verfahren und System zum Erfassen von Daten aus mehreren maschinell lesbaren Dokumenten
WO2020148046A1 (de) Verfahren zur automatisierten erstellung eines an eine vorgegebene person gerichteten phishing-dokuments
DE602005001840T2 (de) System und Verfahren zur Verdeutlichung nicht diakritisierter arabischer Wörter in einem Text
DE112013005742T5 (de) Absichtsabschätzungsvorrichtung und Absichtsabschätzungsverfahren
DE102005030380B4 (de) Verfahren zur Ermittlung einer Hypothesenliste aus einem Vokabular eines Spracherkennungssystems
DE112016006512T5 (de) Absichtseinschätzungsvorrichtung und Absichtseinschätzungsverfahren
EP2250464A1 (de) Verfahren zum betrieb eines navigationssystems
DE102006008221A1 (de) Verfahren zur Eingabe von Eingabedaten in ein Fahrzeugnavigationsgerät
DE102016113671A1 (de) Verfahren zur Unterstützung orthographisch richtiger Texteingabe
WO2018073635A1 (de) Verfahren zum zumindest teilweise maschinellen transferieren in einer quellsprache abgefassten wortfolge in eine wortfolge einer zielsprache
DE102009031872A1 (de) Verfahren und Vorrichtung zur automatischen Suche nach Dokumenten in einem Datenspeicher
DE102020205394A1 (de) Computerimplementiertes Verfahren und Vorrichtung zum Erstellen eines Knowledge Graph
EP1184838A2 (de) Phonetische Übersetzung für die Sprachsynthese
Simon Das unerwartete< u> in der altassyrischen Nebenüberlieferung hethitischer Wörter
DE202015006393U1 (de) System zur Identifizierung und Kennzeichnung eines mathematischen Ausdrucks in einem elektronischen Text-Dokument
DE102021121116B4 (de) Verfahren und vorrichtung zur eingabe einer zeichenfolge
DE102016125162A1 (de) Verfahren und Vorrichtung zum maschinellen Verarbeiten von Texten
Hennig Goethe's translation of Scott's criticism of Hoffmann
BOJAXHİ The problematique of collocations in the papers of Albanian students of German language
DE4311211A1 (de) Computersystem und Verfahren zur automatisierten Analyse eines Textes
Marzouk Sprachkontrolle im Spiegel der Maschinellen Übersetzung: Untersuchung zur Wechselwirkung ausgewählter Regeln der Kontrollierten Sprache mit verschiedenen Ansätzen der Maschinellen Übersetzung
WO2010091674A2 (de) Verfahren und ein system zum übersetzen eines textes aus einer ersten sprache in zumindest eine weitere sprache sowie ein computer-programm-produkt
DE102017008079A1 (de) Verfahren zum Übersetzen einer ersten Wortfolge in eine zweite Wortfolge
DE102022128157A1 (de) Computerimplementiertes Verfahren zur Standardisierung von Teilenamen
DE10253786B4 (de) Verfahren zur rechnergestützten Ermittlung einer Ähnlichkeit eines elektronisch erfassten ersten Kennzeichens zu mindestens einem elektronisch erfassten zweiten Kennzeichen sowie Vorrichtung und Computerprogramm zur Durchführung desselben

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee