DE69633639T2 - Rufsystem mit automatischer Zusammenfassung von Texten - Google Patents

Rufsystem mit automatischer Zusammenfassung von Texten Download PDF

Info

Publication number
DE69633639T2
DE69633639T2 DE69633639T DE69633639T DE69633639T2 DE 69633639 T2 DE69633639 T2 DE 69633639T2 DE 69633639 T DE69633639 T DE 69633639T DE 69633639 T DE69633639 T DE 69633639T DE 69633639 T2 DE69633639 T2 DE 69633639T2
Authority
DE
Germany
Prior art keywords
text
words
blocks
block
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69633639T
Other languages
English (en)
Other versions
DE69633639D1 (de
Inventor
Edward M. Batchelder
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Application granted granted Critical
Publication of DE69633639D1 publication Critical patent/DE69633639D1/de
Publication of DE69633639T2 publication Critical patent/DE69633639T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Communication Control (AREA)

Description

  • GEBIET DER ERFINDUNG
  • Die vorliegende Erfindung betrifft allgemein Textverarbeitungssysteme und insbesondere die Verarbeitung von Mitteilungen zur Verwendung zum Beispiel in Funk-Pagingsystemen.
  • HINTERGRUND DER ERFINDUNG
  • Es gibt heute viele System zur Verarbeitung von Textmitteilungen. Funk-Pagingsysteme stellen hierfür ein spezielles Beispiel dar. Funk-Pagingsysteme sind gut bekannt und werden in großem Umfang eingesetzt. Ein bei Pagingsystemen verwendetes spezielles Format ist die Textübertragung. Bei diesen Systemen wird eine aus einer Zeichenfolge bestehende Mitteilung an einen Pagingempfänger übertragen, um sie dort auf einem Anzeigebildschirm anzuzeigen. Viele Pagingempfänger weisen jedoch den bedauerlichen Nachteil auf, dass sie nur eine Mitteilung von begrenzter Länge anzeigen können. Zum Beispiel sind viele gegenwärtig verwendete Pagingempfänger insofern beschränkt, als sie nur eine Mitteilung anzeigen können, die nicht mehr als 240 Textzeichen umfasst. Wenn also ein Benutzer eine Mitteilung mit mehr als 240 Zeichen an einen solchen Pagingempfänger übertragen will, kann nicht die komplette Mitteilung angezeigt werden. Darauf kann der Pagingempfänger so reagieren, dass er überhaupt keine Mitteilung anzeigt. Meist wird jedoch eine Mitteilung, welche die Maximallänge überschreitet, bei Erreichen der Maximallänge abgeschnitten, wodurch das Ende der Mitteilung verloren geht. Es ist leicht einzusehen, dass eine solche Situation nicht wünschenswert ist, da eine gekürzte Mitteilung für den Leser unverständlich sein kann und/oder in ihr wichtige Informationen fehlen können.
  • In der US-Patentschrift 5 396 228 werden Verfahren und eine Vorrichtung zum Komprimieren und Dekomprimieren von Pagingdaten beschrieben. In einem Wörterbuch aufgefundene Wörter werden mittels eines Komprimierungscodes komprimiert. Ein Kopfdatensatz (Header) dient zur Kennzeichnung des verwendeten Wörterbuchs. Wenn eine Telefonnummer oder eine ganze Zahl vorkommen werden außerdem ein Kopfdatensatz und ein Komprimierungsformat verwendet, das für Telefonnummern oder ganze Zahlen optimiert ist.
  • Die europäische Patentanmeldung Nr. 0 361 464 legt ein Verfahren und eine Vorrichtung zum Herstellen einer Zusammenfassung eines Dokuments offen. Bei einer Ausführungsart des Verfahrens wird eine Liste vorher ausgewählter Hinweiswörter eingegeben, die auf wichtige Ausdrücke in dem Dokument verweisen, und ein Teil des Textes, dem gegenüber anderen Textteilen für dasselbe Hinweiswort eine höhere Priorität zugewiesen werden soll, wird einem oder mehreren der eingegebenen Hinweiswörter zugeordnet. Dann werden alle Sätze des Dokuments, die ein Hinweiswort enthalten, aus dem Dokument entnommen und einer Sprachanalyseeinrichtung zugeführt, die einem Wort, das mit dem zugeordneten Textteil übereinstimmt, fünf Punkte, aber Hinweiswörtern, die einem anderen als dem zugeordneten Textteil entsprechen, einen Punkt zuordnet. Dann werden aus den Sätzen, die ein Hinweiswort enthalten, Sätze mit mehr als einer Mindestpunktzahl ausgewählt. Abschließend wird eine Zusammenfassung erstellt, indem durch Ändern der Hinweiswörter der ausgewählten Sätze, die dem zugeordneten Textteil entsprechen, neue Sätze erzeugt werden.
  • ÜBERBLICK ÜBER DIE ERFINDUNG
  • Angesichts des oben Gesagten besteht eine Aufgabe der vorliegenden Erfindung darin, diese sowie weitere Nachteile in heutigen Textverarbeitungssystemen zu beseitigen.
  • Eine weitere Aufgabe der vorliegenden Erfindung besteht darin, die Textdaten vor dem Senden und/oder Speichern zu komprimieren.
  • Eine andere Aufgabe der vorliegenden Erfindung besteht darin, eine flexible Steuerung der Textzusammenfassung durch einen Satz von Befehlen bereitzustellen, die einem Systemadministrator oder einer anderen berechtigten Person zugänglich sind.
  • Eine weitere Aufgabe der vorliegenden Erfindung besteht darin, ein System und ein Verfahren zum Senden von Textmitteilungen in der Weise bereitzustellen, dass alle wichtigen Informationen zum gewählten Empfänger auf einen Pagingempfänger übertragen werden können.
  • Noch eine weitere Aufgabe der vorliegenden Erfindung besteht darin, einen Mitteilungstext so zusammenzufassen, dass der wesentliche Gehalt des Mitteilungstextes zu einer Empfangseinheit mit einem Pagingempfänger übertragen werden kann, der nicht in der Lage ist, einen Mitteilungstext über die vorgegebene maximale Zeichenzahl hinaus anzuzeigen.
  • Zum Lösen der obigen sowie weiterer Probleme stellt die vorliegende Erfindung ein Pagingsystem nach Anspruch 1 bereit.
  • Weitere Merkmale, Aufgaben und Vorteile der vorliegenden Erfindung werden aus der folgenden detaillierten Beschreibung in Verbindung mit den beiliegenden Zeichnungen klar.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein Blockschaltbild der bevorzugten Ausführungsart eines Pagingsystems, das ein System zur Textzusammenfassung gemäß den Lehren der vorliegenden Erfindung;
  • 2 ist ein Blockschaltbild eines Pagingempfängers gemäß einer bevorzugten Ausführungsart der vorliegenden Erfindung;
  • 3 ist ein Flussdiagramm, das den Prozess der Textzusammenfassung gemäß einer bevorzugten Ausführungsart der vorliegenden Erfindung beschreibt;
  • 4(a), 4(b) und 4(c) sind Flussdiagramme, die die Verarbeitung eines bestimmten Befehlssatzes während des Zusammenfassungsprozesses der bevorzugten Ausführungsart der vorliegenden Erfindung beschreiben.
  • DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
  • 1 ist ein Blockschaltbild des Paging-Steuersystems 50 der vorliegenden Erfindung. Das in 1 dargestellte Paging- Steuersystem 50 enthält sämtliche erforderlichen Funktionalitäten zum Empfangen einer Textmitteilung zum Übertragen und zum Zusammenfassen der Mitteilung sowie zum Übertragen der zusammengefassten Mitteilung zum Anzeigen auf einem Pagingempfänger. Der Pagingempfänger zum Empfangen der zusammengefassten Mitteilung ist in 2 veranschaulicht und kann auf das Anzeigen einer bestimmten maximalen Anzahl von Zeichen beschränkt sein.
  • Bei dem in 1 dargestellten Paging-Steuersystem 50 wird von einer externen Eingabequelle 10 eine Textmitteilung an das Paging-Steuersystem 50 übertragen. Die externe Eingabequelle 10 kann beliebig viele aus einer Vielzahl gut bekannter Eingabequellen umfassen, wie sie gegenwärtig bei Pagingsystemen verwendet werden. Zum Beispiel kann die externe Eingabequelle 10 einen Telefonapparat umfassen, wobei der Telefonapparat über ein Telefonnetz mit dem Paging-Steuersystem 50 verbunden ist. In diesem Fall kann sich eine Person, die eine Mitteilung zu übertragen wünscht, über die Telefontastatur einwählen, wobei eine Reihe von Ziffern beispielsweise eine Telefonnummer darstellt, unter der eine Person erreicht werden kann.
  • Um die Übertragung einer Textmitteilung zu ermöglichen, ist üblicherweise außer einer einfachen sieben- oder zehnstelligen Telefonnummer die Verwendung einer anderen Eingabequelle als des Telefonapparates erforderlich. Textmitteilungen, die bis zu 240 Zeichen umfassen, können zu einem Pagingempfänger übertragen werden, wenn sie in speziell aufgebauten Eingabequellen erzeugt werden. Zum Beispiel kann als Eingabequelle 10 ein tragbares „Terminal" (Endgerät) bereitgestellt werden, in das der Benutzer den zu übertragenden Text eintippen kann. Dieses Terminal ist mit einem herkömmlichen Modem zur Übertragung zu dem Paging-Steuersystem 50 verbunden, um so die Funkübertragung zu dem Pagingempfänger 110 zu gewährleisten. Alternativ kann ein Benutzer eine Mitteilung per Telefon auch einer Vermittlungsperson übermitteln, welche die per Telefon übermittelte Mitteilung dann in ein solches Terminal eintippt. Die durch die Vermittlungsperson eingetippte Mitteilung wird dann zum Paging-Steuersystem 50 übermittelt und schließlich zum Pagingempfänger 110 übertragen. Die vorliegende Erfindung konzentriert sich in erster Linie auf die Übertragung längerer Mitteilungen (d. h. solcher Mitteilungen, die über ein „Terminal" eingegeben wurden), kann jedoch auch die Übertragung von Kurzmitteilungen umfassen (d. h. Telefonnummern, die über eine Telefontastatur eingegeben wurden).
  • Das in 1 gezeigte Paging-Steuersystem 50 umfasst ferner einen Speicher 40 und eine Paging-Schnittstellensteuereinheit 70. Im Speicher 40 wird die von der Eingabequelle 10 empfangene Textmitteilung gespeichert. Die Paging-Schnittstellensteuereinheit 70 tauscht Daten mit der Textzusammenfassungseinheit 90, dem Befehlsterminal 45, dem Speicher 40 und der Funkübertragungseinheit 80 aus, um die Gesamtfunktion des Paging-Steuersystems 50 zu steuern. Die Aufgabe der Textzusammenfassungseinheit 90 besteht darin, die von der Eingabequelle 10 empfangene Textmitteilung so zu bearbeiten, dass sie im Rahmen der durch den Pagingempfänger 110 auferlegten Einschränkungen ohne Verlust von wichtigen Informationen übertragen werden kann. Die Funktionsweise der Textzusammenfassungseinheit 90 wird im Folgenden eingehend erörtert. Der Puffer 25 enthält, wie ebenfalls im Folgenden erörtert wird, den zusammengefassten Text als Ergebnis der Verarbeitung durch die Textzusammenfassungseinheit 90. Es ist möglich, dass der Puffer 25 und der Speicher 70 denselben Speicher umfassen. Die Funkübertragungseinheit 80 liest aus dem Puffer 25 den zusammengefassten Text und sendet die zusammengefasste Textmitteilung zum Pagingempfänger 110. vor der Übertragung kann die Funkübertragungseinheit 80 ferner die Daten der zusammengefassten Mitteilung mittels verschiedener in der Technik bekannter Verfahren codieren oder bearbeiten. Das Befehlsterminal 45 steht auch für die Eingabe diverser Befehle zur Verfügung, darunter Befehle zur Steuerung der Funktion der Textzusammenfassungseinheit 90.
  • Man beachte, dass sich die vorliegende Erfindung nicht allein auf die in 1 veranschaulichte spezielle Struktur des Paging-Steuersystems beschränkt. Beispielsweise kann eine alternative Ausführungsart eines Paging-Steuersystems eine in einem lokalen Netzwerk befindliche Anwendung umfassen, durch welche Benutzer unter ihrer jeweiligen Addresse in einem solchen lokalen Netzwerk elektronische Mitteilungen (E-Mails) empfangen können. In diesem Fall kann die E-Mail gemäß den Lehren der vorliegenden Erfindung zusammengefasst und dann durch das Netzwerk zu einer Funkübertragungseinheit innerhalb oder außerhalb dieses Netzwerkes weitergeleitet werden. Dadurch könnten zum Beispiel Internetmitteilungen automatisch einem Benutzer auf dessen Pager weitergeleitet werden, wenn sich dieser gerade nicht im Netzwerk befindet. Dem Fachmann ist klar, dass die Lehren der vorliegenden Erfindung nicht nur auf Pager, sondern auch auf andere Geräte zutreffen. Die vorliegende Erfindung kann, wie deutlich wird, immer dann angewendet werden, wenn es erforderlich ist, Text in einer kompakten Form zu übertragen oder zu speichern.
  • 2 veranschaulicht einen Pager, der in dem durch die vorliegende Erfindung beschriebenen Pagingsystem verwendet werden kann. Der Pagercontroller 140 dient der Steuerung der Gesamtfunktion des Funk-Pagingempfängers 110. Der Pagercontroller 140 kann einen handelsüblichen Mikroprozessor wie beispielsweise einen von der Intel Corporation hergestellten i486TM Mikroprozessor umfassen. Der Funk-Pagingempfänger 110 umfasst vorzugsweise einen Standard-Funk-Pagingempfänger, der einen Pager-Anzeigebildschirm 160 enthält. Üblicherweise ist der Pager-Anzeigebildschirm 160 eine Flüssigkristallanzeige (liquid crystal display, LCD), die Textinformationen anzeigen kann. Der Funk-Pagingempfänger 110 kann durch Rundfunk (HF) übertragene Pagingsignale empfangen, die Textinformationen beinhalten. Die durch das Paging-Steuersystem 50 übertragenen Textinformationen können in einer Vielzahl von in der Technik gut bekannten Formaten und/oder Codierschemata dargestellt werden. Die Form der durch den Funk-Pagingempfänger 110 empfangenen Textinformationen ist für die vorliegende Erfindung nicht entscheidend, da der Funk-Pagingempfänger 110 beliebige Formen von Funksignalen zur Verarbeitung gemäß den Lehren der vorliegenden Erfindung empfangen kann. Die Funk-Pagingsignale werden durch den Funkempfänger 130 empfangen, der mit einer zu dem Funk-Pagingempfänger 110 gehörenden Außen- oder Innenantenne verbunden sein kann. Nach dem Empfang werden die Pagingsignale erforderlichenfalls durch den Decodierer 120 beispielsweise in normale ASCII-Textdaten decodiert und vorübergehend im Mitteilungs-RAM 190 gespeichert. Alternativ kann der Decodierer dazu dienen, die Pagingmitteilung in einer durch den Anzeigetreiber 170 erkennbaren und darstellbaren Form auf den Pager-Anzeigebildschirm 160 zu bringen.
  • Im Folgenden wird die Funktion der in dem Paging-Steuersystem 50 enthaltenen Textzusammenfassungseinheit 90 in Verbindung mit 3 genauer beschrieben. Die Textzusammenfassungseinheit 90 empfängt allgemein gesagt, als Eingabe eine oder mehrere zusammenzufassende Textmitteilungen, einen Befehlssatz, der anzeigt, wie die Zusammenfassung zu erfolgen hat, und einen Wert für die maximal zulässige Länge des zusammengefassten Textes. Die folgende Beschreibung geht davon aus, dass die zusammenzufassende und zu übertragende Mitteilung eine E-Mail-Mitteilung ist. Die Funktion der Textzusammenfassungseinheit und damit der vorliegenden Erfindung ist jedoch nicht darauf beschränkt. Die Textzusammenfassungseinheit kann beliebige Formen von Textinformationen wie beispielsweise Dokumente, Briefe, Bücher, Artikel oder Telefaxe verarbeiten.
  • Der erste Schritt des Zusammenfassungsprozesses besteht darin, die Textmitteilung in Blöcke einzuteilen. Die verbreitetste und bevorzugte Form eines Blocks ist ein Satz, obwohl andere Formen von Blöcken, wie beispielsweise Wörter oder Absätze, verwendet werden können. Jeder Block wird als einer von drei Typen markiert: MAIL HEADER (SENDEKOPF), TEXT (TEXT) oder PUNCTUATION (INTERPUNKTION). Außer bei E-Mails können sich diese Typen von Mitteilungen insoweit unterscheiden, wie es der Form der Textinformation angemessen ist. Ungeachtet dessen werden in der E-Mail-Umgebung MAIL HEADER-Daten ferner als SIGNIFICANT (WESENTLICH) oder INSIGNIFICANT (UNWESENTLICH) klassifiziert. Eine solche weitergehende Klassifizierung wird als Klassifizierung in „Untertypen" bezeichnet. TEXT-Typen werden ferner entsprechend ihrer Stellung in einem Absatz nach den Untertypen FIRST (ZUERST), LAST (ZULETZT), ONLY (LEDIGLICH) oder OTHER (SONSTIGE) klassifiziert. Wenn also beispielsweise ein einzelner Satz (Block) einen Absatz bildet, wird dieser Satz (Block) durch den Typ TEXT und den Untertyp ONLY markiert. Wenn der Satz (Block) der erste Satz eines mehrere Sätze (Blöcke) enthaltenden Absatzes ist, wird der Satz durch den Typ TEXT und den Untertyp FIRST markiert. PUNCTUATION-Blöcke sind Blöcke, die keine Buchstaben oder Ziffern enthalten. Bei der bevorzugten Ausführungsart gibt es für den Typ PUNCTUATION keine Untertypen.
  • MAIL HEADER-Typen werden durch die Textzusammenfassungseinheit 90 vorzugsweise über eine Liste von Sendekopfnamen wie beispielsweise „Betreff", „Von", „An" usw. erkannt, die aus einer externen Datei gelesen werden. Diese externe Datei kann so erstellt werden, dass sie beliebige Schlüsselwörter enthält, die zum Feststellen von MAIL HEADER-Daten wünschenswert sind und durch einen Benutzer oder Systemadministrator vorgegeben werden. Bei der bevorzugten Ausführungsart heißt diese Datei header.txt. Mit einem Stern (oder ein anderes Markierungszeichen) endende Wörter in der Datei header.txt werden als wichtige Kopfdaten angesehen und lösen die Klassifizierung durch den Untertyp MAIL HEADER SIGNIFICANT aus.
  • Bei einer bevorzugten Ausführungsart der vorliegenden Erfindung nimmt die Textzusammenfassungseinheit 90 an, dass Wörter in einer „Betreff"-Zeile eines MAIL HEADERs SIGNIFICANT sind, ungeachtet der Tatsache, dass die Wörter ansonsten durch die Datei header.txt als INSIGNIFICANT eingestuft würden. Dadurch erhält der Empfänger der Mitteilung mit Sicherheit die komplette im MAIL HEADER enthaltene Betreffzeile. Ferner kann das System so eingerichtet (oder durch einen Benutzer oder Systemadministrator konfiguriert) werden, dass dieses den Empfängernamen (der nach der Kennung „An:" angegeben wird) unabhängig davon als wichtig ansieht, ob der Name in der Datei header.txt als INSIGNIFICANT erscheint. Außerdem kann das System so eingerichtet werden, dass es Zahlen (und Uhrzeiten und Daten) als wichtig einstuft, unabhängig davon, ob sie im MAIL HEADER oder im TEXT-Teil vorkommen. Es können zahlreiche dem Fachmann leicht verständliche Kombinationen gewählt werden, um bestimmte Zeichenfolgen (z. B. Wörter und Zahlen) entweder als SIGNIFICANT oder INSIGNIFICANT einzustufen.
  • Man beachte, dass bei einer bevorzugten Ausführungsart der Erfindung die Textzusammenfassungseinheit 90 so vorgehen kann, dass in einem einzigen Dokument mehrere MAIL HEADER gemäß einem definierten Kriterium verarbeitet werden können. Das tritt üblicherweise bei einer Antwort-Mail auf, wenn ein Empfänger dem ursprünglichen Absender antwortet oder wenn eine Mitteilung an einen dritten Teilnehmer weitergeleitet wird. Bei vielen gegenwärtig gebräuchlichen E-Mail-Umgebungen lässt sich die ursprüngliche Mitteilung (einschließlich des ursprünglichen MAIL HEADERs) in die Antwort- bzw. die weitergeleitete Mitteilung einbinden. In solchen Fällen kommen in einem einzigen Dokument mehrere MAIL HEADER vor. Die Textzusammenfassungseinheit 90 kann so konfiguriert werden, dass sämtliche Informationen in allen MAIL HEADERn außer dem ersten MAIL HEADER ignoriert werden. Dann werden alle Informationen (d. h. Wörter, Zahlen und Zeichen) in der Mailmitteilung außer der ersten Mailmitteilung als unwichtig behandelt.
  • Alternativ kann die Textzusammenfassungseinheit 90 den ersten MAIL HEADER aufteilen, um den(die) Namen Der erste Schritt des Zusammenfassungsprozesses besteht darin, die Textmitteilung in Blöcke einzuteilen. Die verbreitetste und bevorzugte Form eines Blocks ist ein Satz, obwohl andere Formen von Blöcken, wie beispielsweise Wörter oder Absätze, verwendet werden können. Jeder Block wird als einer von drei Typen markiert: MAIL HEADER (SENDEKOPF), TEXT (TEXT) oder PUNCTUATION (INTERPUNKTION). Außer bei E-Mails können sich diese Typen von Mitteilungen insoweit unterscheiden, wie es der Form der Textinformation angemessen ist. Ungeachtet dessen werden in der E-Mail-Umgebung MAIL HEADER-Daten ferner als SIGNIFICANT (WESENTLICH) oder INSIGNIFICANT (UNWESENTLICH) klassifiziert. Eine solche weitergehende Klassifizierung wird als Klassifizierung in „Untertypen" bezeichnet. TEXT-Typen werden ferner entsprechend ihrer Stellung in einem Absatz nach den Untertypen FIRST (ZUERST), LAST (ZULETZT), ONLY (LEDIGLICH) oder OTHER (SONSTIGE) klassifiziert. Wenn also beispielsweise ein einzelner Satz (Block) einen Absatz bildet, wird dieser Satz (Block) durch den Typ TEXT und den Untertyp ONLY markiert. Wenn der Satz (Block) der erste Satz eines mehrere Sätze (Blöcke) enthaltenden Absatzes ist, wird der Satz durch den Typ TEXT und den Untertyp FIRST markiert. PUNCTUATION-Blöcke sind Blöcke, die keine Buchstaben oder Ziffern enthalten. Bei der bevorzugten Ausführungsart gibt es für den Typ PUNCTUATION keine Untertypen.
  • MAIL HEADER-Typen werden durch die Textzusammenfassungseinheit 90 vorzugsweise über eine Liste von Sendekopfnamen wie beispielsweise „Betreff", „Von", „An" usw. erkannt, die aus einer externen Datei gelesen werden. Diese externe Datei kann so erstellt werden, dass sie beliebige Schlüsselwörter enthält, die zum Feststellen von MAIL HEADER-Daten wünschenswert sind und durch einen Benutzer oder Systemadministrator vorgegeben werden. Bei der bevorzugten Ausführungsart heißt diese Datei header.txt. Mit einem Stern (oder ein anderes Markierungszeichen) endende Wörter in der Datei header.txt werden als wichtige Kopfdaten angesehen und lösen die Klassifizierung durch den Untertyp MAIL HEADER SIGNIFICANT aus.
  • Bei einer bevorzugten Ausführungsart der vorliegenden Erfindung nimmt die Textzusammenfassungseinheit 90 an, dass Wörter in einer „Betreff"-Zeile eines MAIL HEADERs SIGNIFICANT sind, ungeachtet der Tatsache, dass die Wörter ansonsten durch die Datei header.txt als INSIGNIFICANT eingestuft würden. Dadurch erhält der Empfänger der Mitteilung mit Sicherheit die komplette im MAIL HEADER enthaltene Betreffzeile. Ferner kann das System so eingerichtet (oder durch einen Benutzer oder Systemadministrator konfiguriert) werden, dass dieses den Empfängernamen (der nach der Kennung „An:" angegeben wird) unabhängig davon als wichtig ansieht, ob der Name in der Datei header.txt als INSIGNIFICANT erscheint. Außerdem kann das System so eingerichtet werden, dass es Zahlen (und Uhrzeiten und Daten) als wichtig einstuft, unabhängig davon, ob sie im MAIL HEADER oder im TEXT-Teil vorkommen. Es können zahlreiche dem Fachmann leicht verständliche Kombinationen gewählt werden, um bestimmte Zeichenfolgen (z. B. Wörter und Zahlen) entweder als SIGNIFICANT oder INSIGNIFICANT einzustufen.
  • Man beachte, dass bei einer bevorzugten Ausführungsart der Erfindung die Textzusammenfassungseinheit 90 so vorgehen kann, dass in einem einzigen Dokument mehrere MAIL HEADER gemäß einem definierten Kriterium verarbeitet werden können. Das tritt üblicherweise bei einer Antwort-Mail auf, wenn ein Empfänger dem ursprünglichen Absender antwortet oder wenn eine Mitteilung an einen dritten Teilnehmer weitergeleitet wird. Bei vielen gegenwärtig gebräuchlichen E-Mail-Umgebungen lässt sich die ursprüngliche Mitteilung (einschließlich des ursprünglichen MAIL HEADERs) in die Antwort- bzw. die weitergeleitete Mitteilung einbinden. In solchen Fällen kommen in einem einzigen Dokument mehrere MAIL HEADER vor. Die Textzusammenfassungseinheit 90 kann so konfiguriert werden, dass sämtliche Informationen in allen MAIL HEADERn außer dem ersten MAIL HEADER ignoriert werden. Dann werden alle Informationen (d. h. Wörter, Zahlen und Zeichen) in der Mailmitteilung außer der ersten Mailmitteilung als unwichtig behandelt.
  • Alternativ kann die Textzusammenfassungseinheit 90 den ersten MAIL HEADER aufteilen, um den(die) Namen der Empfängerseite der Mitteilung (d. h. des Teilnehmers „An:") zu ermitteln. Die Textzusammenfassungseinheit 90 kann dann alle weiteren Wörter in MAIL HEADERn, die den Namen des Teilnehmers „An:" (und eventuell den darauf folgenden TEXT) enthalten, als unwichtig klassifizieren. Diese Operation beruht auf der Annahme, dass der Empfänger der vorliegenden zusammengefassten Mitteilung die vorige Mitteilung (als Absender oder Empfänger) zuvor bereits gesehen hat, da sein Name in einem „Sekundär"-MAIL HEADER erscheint. Bei verschiedenen alternativen Ausführungsarten kann der Name des Teilnehmers „Von:" eine Anzeige auslösen, dass die folgenden Wörter unwichtig sind, oder das Vorliegen eines Teilnehmers „Von:" oder „An:" in einem Sekundär-MAIL HEADER kann zu der Festlegung verwendet werden, dass alle Wörter in einem MAIL HEADER und/oder in dem darauf folgenden TEXT unwichtig sind. Die Behandlung unwichtiger Wörter wird im Folgenden eingehend erörtert.
  • Nachdem die Mitteilung in dem Prozess in Blöcke aufgeteilt worden ist und die Blöcke nach ihrem Typ und Untertyp markiert wurden, führt die Textzusammenfassungseinheit 90 seriell die ihr zur Verfügung stehenden Befehle aus. Befehle können der Textzusammenfassungseinheit 90 interaktiv erteilt werden oder zur Ausführung im Stapelbetrieb in einer Datei enthalten sein. Befehle bestehen aus Einzelwörtern, die durch ein Leerzeichen voneinander getrennt sind. Parameterzuordnungen bestehen aus einem Namen und einem Wert, die durch ein Gleichheitszeichen voneinander getrennt sind. Zum Beispiel zeigt der Befehl:
    ChunkBegin = A*
    einen Einzelbefehl an, der dem Zeichenfolgenparameter ChunkBegin den Wert A* zuordnet. Bei einer bevorzugten Ausführungsart sind alle Befehle und Parameternamen fallunabhängig, wobei dies auf die Parameterwerte jedoch nicht zutrifft. Booleschen Parametern können die Werte „wahr", „falsch", „ja", „nein", „0" oder „1" zugewiesen werden. Wenn ein Boolescher Parameter einen Namen, aber keinen Wert zugewiesen erhält, entspricht dies dem Wert „wahr".
  • Nachdem alle Befehle ausgeführt worden sind oder (durch einen Befehl TRYFIT (GRÖSSE PRÜFEN), siehe unten) festgestellt wurde, dass die Mitteilung beim derzeitigen Verarbeitungsstand die Bedingung der Maximallänge erfüllt, wird der zusammengefasste Text in den Puffer 25 geschrieben. Zuerst wird der Wert des Zeichenfolgenparameters ChunkBegin in den Puffer 25 geschrieben. Der Parameter ChunkBegin zeigt den Anfang eines Blocks an, wie er im Puffer 25 erscheint. Bei einer bevorzugten Ausführungsart kann der Parameter ChunkBegin in der der Textzusammenfassungseinheit 90 zur Verfügung stehenden Befehlsfolge geändert werden, so dass der Empfänger der Mitteilung erfährt, wie stark und auf welche Weise das ursprüngliche Dokument zusammengefasst wurde. Wenn festgestellt wird, dass die Blöcke so verarbeitet worden sind, dass sie für die Ausgabe bereit sind, wird jeder Block mit dem Wert des zwischen je zwei Blöcken geschriebenen Zeichenfolgenparameters ChunkSep in den Puffer 25 geschrieben. Bei einer bevorzugten Ausführungsart wird für das ChunkSep-Zeichen ein Leerzeichen („ ") gesetzt. Alternativ können andere Zeichen verwendet oder der Wert durch den Benutzer gesetzt werden. Nachdem alle Blöcke in den Puffer 25 geschrieben worden sind, wird abschließend der Zeichenfolgeparameter ChunkEnd geschrieben. Der Parameter ChunkEnd zeigt das Ende der in dem Puffer 25 erscheinenden Mitteilung an.
  • Bei der bevorzugten Ausführungsart werden sowohl für ChunkBegin als auch für ChunkEnd leere Zeichenfolgen als Standardwerte vorgegeben. Der Standardwert für ChunkSep ist ein einzelnes Leerzeichen. Durch Befehle kann diesen Variablen ein beliebiger Zeichenfolgenwert zugewiesen werden, da der Wert jedoch durch Leerzeichen begrenzt wird, darf er kein Leerzeichen enthalten. Der Zeichenfolgenparameter ChunkSep wird einer speziellen Behandlung unterworfen: Die Werte „Leerzeichen", „lf" und „crlf" können zum Anzeigen eines einzelnen Leerzeichens, eines Zeilenvorschubs bzw. eines Zeilenvorschubs mit gleichzeitigem Rücklauf verwendet werden.
  • Die Textzusammenfassungseinheit 90 fungiert wie oben beschrieben gemäß einer Liste von Befehlen, die sie entweder interaktiv über das Befehlsterminal 45 oder über eine Stapeldatei erhält. Die Lehren der vorliegenden Erfindung werden dem Fachmann durch die Beschreibung der einzelnen für die Funktion der Textzusammenfassungseinheit 90 verfügbaren Befehle verständlich. Eine solche Auflistung und Beschreibung der bei der bevorzugten Ausführungsart der vorliegenden Erfindung verfügbaren Befehle folgt nun.
  • Befehl: TEXTONLY (NURTEXT)
  • Dieser Befehl löscht alle Nicht-TEXT-Blöcke aus dem Dokument. Daraus folgt, dass alle nachfolgenden durch die Textzusammenfassungseinheit 90 ausgeführten Operationen mit der Mitteilung nur die verbleibenden TEXT-Blöcke betreffen.
  • Befehl: COUNTWORDS (WÖRTERZÄHLEN)
  • Die Wörter in dem Dokument werden gezählt und die Wichtigkeit jedes Wortes ermittelt. Die Wichtigkeit eines Wortes hängt von einer Anzahl im Folgenden beschriebener Faktoren ab.
  • Befehl: SAVE (SPEICHERN)
  • Dieser Befehl kann zum Speichern des aktuellen Status der Textzusammenfassungseinheit 90 verwendet werden. Die gespeicherte Information beinhaltet die gesamte zusammenzufassende Textinformation (d. h. das Dokument) und die Werte aller gewählten Parameter sowie die Anzahl der Wörter im Text. Außerdem können Wörterverzeichnisse gespeichert werden, die STOP-Wörter (HALT) und/oder INSIGNIFICANT-Wörter anzeigen. Die Information wird gespeichert, indem sie in einem vorbestimmten Format auf einen Stapel geschoben wird. Die Statusinformation SAVEd (GESPEICHERT) kann mittels des nachfolgenden Befehls „RESTORE" (WIEDERHERSTELLEN) wiederhergestellt werden.
  • Befehl: RESTORE (WIEDERHERSTELLEN)
  • Dieser Befehl bewirkt das Löschen des aktuellen Status der Textzusammenfassungseinheit 90 und stellt den Status SAVEd (GESPEICHERT) am oberen Stapelende wieder her. Bei einer bevorzugten Ausführungsart wird der Stapel geöffnet, wenn RESTORE aktiviert wird. Somit kann ein Status SAVEd nur einmal wiederhergestellt werden, obwohl nach dem RESTORE sofort wieder GESPEICHERT werden kann. Wenn der Stapel leer ist, ist der Befehl RESTORE wirkungslos.
  • Befehl: TRYFIT (GRÖSSEPRÜFEN)
  • Dieser Befehl ermittelt, ob das Dokument beim derzeitigen Verarbeitungsstand in den maximal zugewiesenen Speicherplatz passt. Wenn dies der Fall ist, wird das gesamte Dokument in den Ausgabepuffer 25 geschrieben. Zu diesem Zeitpunkt werden alle übrigen Befehle ignoriert. Außerdem kann der zusammengefasste Text nach der Speicherung im Ausgabepuffer 25 durch die Funkübertragungseinheit 80 übertragen werden.
  • Beim Ermitteln, ob das Dokument in den maximal zugewiesenen Speicherplatz passt, berücksichtigt TRYFIT die Zeichenfolgen ChunkBegin, ChunkSep und ChunkEnd. Als Beispiel werde angenommen, dass der Pagerspeicher ebenso wie der Ausgabepuffer 25 80 Zeichen enthält. Da die Mitteilung bei der Übertragung die Zeichenfolgen ChunkBegin, ChunkSep und ChunkEnd enthält, darf der eigentliche Text zusammen mit diesen Zeichenfolgen den Umfang von 80 Zeichen nicht übersteigen. Wenn also beispielsweise eine zusammengefasste Mitteilung eine Zeichenfolge ChunkBegin und 5 Zeichenfolgen ChunkSep enthält, die jeweils ein Einzelzeichen umfassen, verbleiben für den eigentlichen Mitteilungstext nur noch 74 Zeichen. In diesem Fall begrenzt der Befehl TRYFIT den Text auf 74 Zeichen.
  • Befehl: ABBREV (ABKÜRZEN)
  • Dieser Befehl dient dem Abkürzen des Dokumenttextes. Der Prozess wird durch fünf im Folgenden erörterte Parameter gesteuert.
  • Befehl: SORTCHUNKS (BLÖCKESORTIEREN)
  • Wenn dieser Befehl ausgeführt wird, werden die Blöcke des Dokuments entsprechend ihrer Wichtigkeit sortiert. Die Wichtigkeit eines Blocks basiert auf einer Reihe von Faktoren, darunter die Wichtigkeit der Wörter in dem Block, die Anzahl von Wörtern in dem Block sowie die Art und die Position des Blocks. Die Ausführung dieses Befehls wird im Folgenden eingehend beschrieben.
  • Befehl: NOSTOPLIST (KEINEHALTLISTE)
  • Dieser Befehl setzt die Verwendung der STOP-Liste außer Kraft, welche diejenigen Wörter enthält, die durch einen Benutzer oder den Systemadministrator als ständig INSIGNIFICANT eingestuft wurden. Diese Wörter sind von der Berechnung der Wichtigkeit ausgeschlossen, wie im Folgenden erklärt wird. Zu den in der STOP-Liste enthaltenen Wörtern gehören beispielsweise „der", „und" und „von". Die STOP-Liste wird aus einer Datei (vorzugsweise aus der Datei stoplist.txt) gelesen, die eine formlose Liste von STOP-Wörtern enthält.
  • Befehl: NOSIGLIST (KEINEWICHTIGKEITSLISTE)
  • Dieser Befehl setzt die Verwendung der Liste wichtiger Wörter (SIGNIFICANT) außer Kraft, welche diejenigen Wörter enthält, die als ständig wichtig (SIGNIFICANT) angesehen werden. Zu solchen Wörtern gehören beispielsweise „dringend", „wichtig" und „Vorrang". Die Wortliste SIGNIFICANT dient standardmäßig dazu, während der Berechnung der Wichtigkeit die Wichtigkeit dieser Wörter hervorzuheben. Die Wortliste SIGNIFICANT ist vorzugsweise in einer Datei mit der Bezeichnung siglist.txt enthalten, welche eine formlose Liste durch einen Benutzer oder einen Systemadministrator gewählter wichtiger Wörter darstellt.
  • Nachdem die Bedeutung der obigen Befehle bekannt ist, wird nun die Textzusammenfassungseinheit 90 gemäß einer bevorzugten Ausführungsart der vorliegenden Erfindung beschrieben.
  • Zuerst wird wie oben beschrieben ein Dokument verarbeitet, indem es in Blöcke eingeteilt wird. Nach dem Einteilen in Blöcke kann ein Befehl COUNTWORDS (WÖRTERZÄHLEN) ausgeführt werden. Es gibt sechs Kombinationen von Blocktyp/-untertyp, in denen Wörter auftreten können:
    • 1) MAIL HEADER/INSIGNIFICANT
    • 2) MAIL HEADER/INSIGNIFICANT
    • 3) TEXT/FIRST
    • 4) TEXT/LAST
    • 5) TEXT/ONLY
    • 6) TEXT/OTHER
  • Diese Kombinationen stellen alle Blocktypen und -untertypen außer dem Blocktyp PUNCTUATION dar. Somit würde ein Befehl COUNTWORDS alle Blöcke mit einer der obigen sechs Kombinationen von Blocktyp/-untertyp aufteilen. Bei einer bevorzugten Ausführungsart ist ein Befehl TEXTONLY (NURTEXT) enthalten, so dass alle PUNCTUATION-Daten sofort entfernt werden. Da die Blöcke als Reaktion auf den Befehl COUNTWORDS aufgeteilt werden, wird für jedes in dem Dokument auftauchende Wort dessen Wichtigkeit ermittelt. Dies ist, wie später erörtert wird, sowohl für das Ordnen der Blöcke als auch für das Entfernen bestimmter Wörter aus der Mitteilung vor der Übertragung erforderlich.
  • Die Wichtigkeit der Wörter wird anhand der folgenden sechs Parameter ermittelt:
    • 1) cw-FirstInPar;
    • 2) cw-LastInPar;
    • 3) cw-OnlyInPar;
    • 4) cw-OtherInPar;
    • 5) cw-Header; und
    • 6) cw-SigHeader.
  • Jedem der Parameter wird ein Standardwert zugewiesen, obwohl dieser Wert durch einen Benutzer und/oder Systemadministrator geändert werden kann. Bei der bevorzugten Ausführungsart werden die folgenden Standardwerte verwendet:
    cw-FirstInPar = 2;
    cw-LastInPar = 2;
    cw-OnlyInPar = 2;
    cw-OtherInPar = 1;
    cw-Header = 0; und
    cw-SigHeader = 3.
  • Jedes Mal, wenn ein bestimmtes Wort an einer Stelle erscheint, die einem der obigen Parameter entspricht, werden diesem Wort auf Basis des zugeordneten Parameterwerts „Punkte" zugeordnet. Zum Beispiel erhält jedes Mal, wenn das Wort „FOOTBALL" (FUSSBALL) in einem Block erscheint, der der erste Block in einem Absatz ist (FirstInPar), das Wort „FOOTBALL" zwei Punkte (ausgehend von den obigen Standardwerten). Jedes weitere Auftreten des Wortes „FOOTBALL" führt auf Basis seiner Stellung in einem anderen Block zu einigen weiteren Punkten. Der Parameter cw-OtherInPar entspricht Wörtern, die in TEXT-Blöcken vorkommen, welche weder die ersten noch die letzten Sätze in einem Absatz sind. Der Parameter cw-OnlyInPar entspricht Wörtern, die in Blöcken vorkommen, welche den einzigen Satz eines bestimmten Absatzes ausmachen. Der Parameter cw-Header entspricht Wörtern, die in MAIL HEADER/INSIGNIFICANT-Blöcken (SENDEKOPF/UNWESENTLICH) vorkommen. Und schließlich entspricht der Parameter cw-SigHeader Wörtern, die in MAIL HEADER/SIGNIFICANT-Blöcken (SENDEKOPF/WESENTLICH) vorkommen.
  • Nach Summieren aller auf Basis dieser Parameter für ein Wort erhaltenen Punkte wird dieser Gesamtwert mit dem Parameter cw-MinPoints verglichen. Bei der bevorzugten Ausführungsart beträgt der Standardwert für cw-MinPoints 3, obwohl dieser Wert durch einen Benutzer oder Systemadministrator geändert oder auf einen anderen Standardwert gesetzt werden kann. Wenn das Wort den Schwellenwert cw-MinPoints nicht erreicht, wird seiner Wichtigkeit der wert von cw-InfreqSig zugewiesen. Bei der bevorzugten Ausführungsart ist der Standardwert von cw-InfrequSig gleich 0, obwohl dieser Wert durch einen Benutzer oder Systemadministrator geändert oder auf einen anderen Standardwert gesetzt werden kann. Wenn die Mindestpunktzahl erreicht wurde, wird die den Mindestwert übersteigende Punktzahl mit dem Wert cw-Factor multipliziert und das Ergebnis zu dem wert cw-BaseValue addiert. Bei der bevorzugten Ausführungsart ist der Standardwert von cw-Factor gleich 1 und der Standardwert von cw-BaseValue gleich 0, obwohl diese Werte durch einen Benutzer oder Systemadministrator geändert oder auf einen anderen Standardwert gesetzt werden können. Der sich aus den obigen Berechnungen ergebende Wert ergibt die Wichtigkeit für dieses Wort.
  • Man beachte, dass der obige Prozess mit einem Wort nicht durchgeführt wird, wenn sich dieses bestimmte Wort in der STOP-Liste (ständig INSIGNIFICANT) befindet und der Befehl NOSTOPLIST nicht aktiv ist. Wenn der Befehl NOSTOPLIST nicht aktiv ist und ein Wort in der STOP-Liste enthalten ist, wird dem Wort sofort ein Wichtigkeitswert von cw-StopSig zugewiesen. Der Standardwert von cw-StopSig ist vorzugsweise gleich null.
  • Als Nächstes wird der Befehl ABBREV (ABKÜRZEN) erörtert. Dieser Befehl bewirkt wie oben beschrieben, dass der Dokumenttext vor dem Speichern im Puffer 25 abgekürzt wird. Der Prozess wird durch fünf Parameter gesteuert. Der erste Parameter ist ab-UseDict. Wenn dieser Parameter wahr ist (Standardeinstellung), wird aus einer vorzugsweise abbrev.txt genannten Datei eine Abkürzungstabelle gelesen. Jedes Wort des Dokumentes, das in dieser Abkürzungstabelle vorkommt, wird durch die entsprechende in der Tabelle enthaltene Abkürzung ersetzt. Bei einer bevorzugten Ausführungsart enthält jede Zeile von abbrev.txt zwei Wörter. Das erste Wort ist das ursprüngliche Wort und das zweite Wort dessen entsprechende Abkürzung. Bei einer bevorzugten Ausführungsart ersetzt die Textzusammenfassungseinheit 90, wenn der Ersatz vorgenommen wird, das ursprüngliche, nicht abgekürzte Wort durch das Ersatzwort.
  • Ein weiteres wünschenswertes Merkmal der Funktion ABBREV besteht darin, dass Ausdrücke abgekürzt werden können (d. h., eine Abkürzung ersetzt mehr als ein Wort). Zum Beispiel können in der Datei abbrev.txt verschiedene Ausdrücke wie beispielsweise „New York" mit der entsprechenden Abkürzung „NY" enthalten sein.
  • Der zweite Parameter ist ab-DropVowels (Vokale weglassen). Wenn dieser Parameter wahr (nicht der Standardwert) ist, wird jedes Wort, das in der Datei abbrev.txt nicht für eine Abkürzung vorgesehen ist, in der zusammengefassten Mitteilung dadurch abgekürzt, dass alle Vokale aus dem Wort entfernt werden. Der dritte Parameter ist ab-DropFirstVowels (erste Vokale weglassen). Wenn dieser Parameter wahr (nicht der Standardwert) ist, werden Vokale auch dann weggelassen, wenn sie der erste Buchstabe in einem Wort sind, ansonsten bleiben sie erhalten.
  • Der vierte Parameter ist ab-TrimWhite (Leerzeichen reduzieren). Wenn dieser Parameter wahr (der Standardwert) ist, werden mehrere Leerzeichen durch ein einziges Leerzeichen ersetzt. Und schließlich ist der letzte Parameter ab-TrimPunct (Interpunktionsleerzeichen reduzieren). Wenn dieser Parameter wahr (nicht der Standardwert) ist, werden alle Leerzeichen neben Interpunktionszeichen entfernt.
  • Als Nächstes wird der Befehl SORTCHUNKS (Blöcke ordnen) erörtert. Bei einer bevorzugten Ausführungsart werden wie oben erörtert die Blöcke in dem zusammengefassten Dokument gegenüber dem ursprünglichen Dokument nach ihrer Wichtigkeit neu geordnet. Bei einer bevorzugten Ausführungsart wird das zusammengefasste Dokument so geordnet, dass die wichtigsten Blöcke zuerst erscheinen. Die Wichtigkeit der Blöcke wird aus der Gesamtwichtigkeit der in dem Block enthaltenen Wörter, der Anzahl der Wörter in dem Block sowie dem Typ und dem Untertyp des Blocks ermittelt. Wenn ein Block weniger Wörter als sc-MinLength besitzt, wird seine Wichtigkeit auf sc-ShortSig gesetzt. Der bevorzugte Standardwert für sc-MinLength ist 4, und der Standardwert für sc-ShortSig ist 0.
  • Nimmt man an, dass ein Block den Schwellenwert sc-MinLength erreicht, wird seine Wichtigkeit ausgehend von einem Wichtigkeitsgrundwert ermittelt. Der zugewiesene Wichtigkeitsgrundwert wird anhand der Blockposition ermittelt. Der Parameter sc-FirstInPar zeigt einen Block an, der der erste Satz in einem Absatz ist, der Parameter sc-LastInPar zeigt einen Block an, der der letzte Satz in einem Absatz ist, der Parameter sc-OnlyInPar zeigt einen Block an, der der einzige Satz eines Absatzes ist, und der Parameter sc-OtherInPar zeigt einen Block an, der ein „mittlerer" Block in einem Absatz ist. Die Standardwerte für jeden dieser Parameter sind:
    sc-FirstInPar = 0;
    sc-LastInPar = 0;
    sc-OnlyInPar = 0; und
    sc-OtherInPar = 0.
  • Wenn der Befehl COUNTWORDS zuvor ausgeführt worden ist, wird außerdem die Summe der Wichtigkeiten der in dem Block enthaltenen Wörter gebildet und zu dem Wichtigkeitsgrundwert für den Block addiert, um den Wichtigkeitsgesamtwert für den Block zu erhalten. Jeder der Blöcke kann dann in der Reihenfolge der Wichtigkeiten in den Ausgabepuffer 25 verschoben werden.
  • Ein weiteres Merkmal, das im Zusammenfassungsprozess wünschenswert ist, ist die Fähigkeit, bestimmte Wörter ganz zu entfernen (OMIT WORDS). In diesem Fall erscheinen die in einer Datei (z. B. omitwds.txt) enthaltenen zu entfernenden Wörter überhaupt nicht in dem zusammengefassten Text, selbst wenn sie in einem Block vorkommen, der ansonsten wichtig genug ist, dass er in den Ausgabepuffer 25 verschoben wird. Durch Entfernen dieser Wörter kann in dem Ausgabepuffer 25 zusätzlicher Platz für weniger wichtige Blöcke geschaffen werden, die sonst nicht in den Ausgabepuffer 25 kämen.
  • Ein weiteres Merkmal, das in der Textzusammenfassungseinheit 90 realisiert werden kann, sind Klammerausdrücke. Solche Ausdrücke lassen sich verarbeiten, indem man den Gesamtwert für den Block ermittelt, in dem der Klammerausdruck enthalten ist. Dies wird wie oben erörtert erreicht, indem man die Gesamtwichtigkeit aller in dem Block enthaltenen Wörter einschließlich der in dem Klammerausdruck enthaltenen Wörter ermittelt. Dann wird die Gesamtwichtigkeit des Blocks ohne die Wörter in dem Klammerausdruck ermittelt. Es wird ein Differenzschwellenwert festgelegt, und wenn die einzelnen Wichtigkeiten kleiner als der Schwellenwert sind, kann der Klammerausdruck im zusammengefassten Text weggelassen werden, da sich dann kein großer Unterschied ergibt. Wenn jedoch die Differenz der Wichtigkeiten den Schwellenwert erreicht oder übersteigt, bleibt der Klammerausdruck erhalten.
  • In den 4(a), 4(b) und 4(c) sind Beispiele von Befehlssätzen angegeben, und die durch die Textzusammenfassungseinheit auf Basis der Befehlssätze ausgeführte Verarbeitung wird beschrieben.
  • Figure 00260001
  • Figure 00270001
  • Der Befehl TEXTONLY (NURTEXT) wird zum Entfernen aller Sendeköpfe und Interpunktionszeilen verwendet. Nach dessen Ausführung ermittelt der Befehl TRYFIT, ob das Dokument kurz genug ist. Man beachte, dass es keine Rolle spielt, ob das Dokument bereits mit den Sendeköpfen kurz genug war; die Länge wird erst nach dem Entfernen der Sendeköpfe geprüft. Als Nächstes werden die Parameter ab-trimwhite und ab-trimpunct auf wahr gesetzt, um die Vorbereitung für den späteren Befehl ABBREV zu treffen.
  • Der Befehl SAVE speichert alle Statusinformationen bis zum nächsten Befehl RESTORE. Er wird hier verwendet, da es wünschenswert ist zu versuchen, das Dokument abzukürzen, bevor die Blöcke anhand deren Wichtigkeit neu geordnet werden. Die Befehle SAVE und RESTORE ermöglichen, das Dokument abzukürzen und dennoch in den nicht abgekürzten Zustand zurückzukehren, wenn sich herausstellt, dass das Dokument trotz des Abkürzens nicht in den erforderlichen Speicherplatz passt. Man kann nicht ohne Verwendung der Befehle SAVE und RESTORE abkürzen und die Wichtigkeiten berechnen, da die abgekürzten Wörter wahrscheinlich nicht richtig erkannt werden, wenn die Berechnung der Wichtigkeit erneut durchgeführt wird.
  • ChunkBegin wird auf a* (für „nur abgekürzt") gesetzt, so dass der übertragene Text als Zeichen für den Empfänger des Dokuments am Anfang durch ein „a*" markiert wird, wenn das Abkürzen ausreicht, dass das Dokument in den Speicherplatz passt. Wenn das Abkürzen allein nicht ausreicht, wird ChunkBegin später auf „s*" gesetzt, um anzuzeigen, dass der Text entsprechend der Wichtigkeit geordnet und ausgewählt wurde. Wenn man mit den wichtigsten Blöcken beginnt und mit den weniger wichtigen Blöcken fortfährt, kann es somit vorkommen, dass einige der weniger wichtigen Blöcke von der Übertragung ausgeschlossen werden, wenn der Puffer 25 mit wichtigeren Blöcken gefüllt wird.
  • Der Befehl ABBREV kürzt dann den Text ab, und der Befehl TRYFIT prüft, ob das Dokument jetzt kurz genug ist. Wenn dies der Fall ist, schreibt die Textzusammenfassungseinheit 90 den Text in den Puffer 25, und die Mitteilung wird durch die Funkübertragungseinheit 80 übertragen. Ansonsten setzt die Textzusammenfassungseinheit 90 ihre Arbeit mit dem Befehl RESTORE fort, der auf den früheren Status SAVE, das heißt vor dem Abkürzen, zurücksetzt.
  • ChunkBegin wird auf „s*" gesetzt, um anzuzeigen, dass das Ordnen und Auswählen erfolgt ist, und ChunkSep wird in eine Befehlskette eingebunden, um dem Empfänger der Mitteilung ferner anzuzeigen, dass Teile der Mitteilung neu geordnet worden sind. Dann wird der Befehl COUNTWORDS ausgeführt, um die Wichtigkeit der Wörter und Blöcke zu berechnen, und dann wird der Text anhand der Wichtigkeit der Blöcke neu geordnet. Abschließend wird der Text durch den Befehl ABBREV ein wenig verkleinert, und die Ausführung der Befehle wird abgeschlossen. Die Textzusammenfassungseinheit 90 schreibt dann den Text, sofern er für die Übertragung durch die Funkübertragungseinheit 80 geeignet ist, in den Puffer 25.
  • Durch eine alternative bevorzugte Ausführungsart ist auch eine noch weitere Komprimierung des Dokumentgröße möglich. Bei einer solchen alternativen bevorzugten Ausführungsart werden alle oben beschriebenen Verarbeitungsschritte durchgeführt. Insbesondere können das Abkürzen, das Neuordnen der Blöcke und das Entfernen der Sendeköpfe durchgeführt werden. Außerdem wird bei dieser alternativen bevorzugten Ausführungsart eine zusätzliche Komprimierung des Dokuments erreicht, indem ausgewählte Wörter aus dem Dokument entfernt werden. Dies kann entweder vor oder nach dem obigen Prozess geschehen. Zum Beispiel können vor dem Abkürzungsschritt und/oder vor dem Neuordnen der Blöcke relativ unbedeutende Wörter entfernt werden. Alternativ können nach dem Abkürzungsschritt und/oder vor dem Neuordnen der Blöcke relativ unbedeutende Wörter entfernt werden.
  • Bei dieser Ausführungsart wird der Befehl COUNTWORDS zu einem wünschenswerten Zeitpunkt innerhalb des Befehlsscripts ausgeführt. Die Ausführung des Befehls COUNTWORDS hat so zu erfolgen, dass jedem Wort in dem Dokument ein Wichtigkeitswert zugewiesen werden kann. wenn dies erfolgt ist, können Wörter mit einem Wichtigkeitswert unterhalb eines bestimmten vorgegebenen Schwellenwertes aus der zusammengefassten Mitteilung entfernt werden. Wenn das Neuordnen der Blöcke vor dem Entfernen von Wörtern erfolgt, können Wörter während der Entfernungsphase auf Basis ihrer relativ hohen Wichtigkeit ausgewählt werden, damit sie in der zusammengefassten Mitteilung verbleiben. Wenn zum Beispiel der verfügbar Speicherplatz 80 Zeichen umfasst und nach dem Neuordnen der Blöcke (und eventuell nach dem Abkürzungsschritt) alle Wörter 90 Zeichen umfassen, können anstelle des unwichtigsten Blocks Wörter bis zu einem Umfang von insgesamt zehn Zeichen aus der Mitteilung entfernt werden. Die entfernten Wörter können von mehreren Blöcken stammen. Durch Entfernen der unwichtigen Wörter kann es sich erübrigen, den unwichtigsten Block insgesamt zu entfernen.
  • Die Erfindung ist in Verbindung mit den bevorzugten Ausführungsarten eingehend beschrieben worden. Diese Ausführungsarten stellen jedoch lediglich ein Beispiel dar, und die Erfindung ist nicht darauf beschränkt. Dem Fachmann ist klar, dass im Rahmen des durch die beigefügten Ansprüche definierten Geltungsbereichs der vorliegenden Erfindung weitere Abwandlungen und Änderungen einfach vorgenommen werden können.
  • der Empfängerseite der Mitteilung (d. h. des Teilnehmers „An:") zu ermitteln. Die Textzusammenfassungseinheit 90 kann dann alle weiteren Wörter in MAIL HERDERn, die den Namen des Teilnehmers „An:" (und eventuell den darauf folgenden TEXT) enthalten, als unwichtig klassifizieren. Diese Operation beruht auf der Annahme, dass der Empfänger der vorliegenden zusammengefassten Mitteilung die vorige Mitteilung (als Absender oder Empfänger) zuvor bereits gesehen hat, da sein Name in einem „Sekundär"-MAIL HEADER erscheint. Bei verschiedenen alternativen Ausführungsarten kann der Name des Teilnehmers „Von:" eine Anzeige auslösen, dass die folgenden Wörter unwichtig sind, oder das Vorliegen eines Teilnehmers „Von:" oder „An:" in einem Sekundär-MAIL HEADER kann zu der Festlegung verwendet werden, dass alle Wörter in einem MAIL HEADER und/oder in dem darauf folgenden TEXT unwichtig sind. Die Behandlung unwichtiger Wörter wird im Folgenden eingehend erörtert.
  • Nachdem die Mitteilung in dem Prozess in Blöcke aufgeteilt worden ist und die Blöcke nach ihrem Typ und Untertyp markiert wurden, führt die Textzusammenfassungseinheit 90 seriell die ihr zur Verfügung stehenden Befehle aus. Befehle können der Textzusammenfassungseinheit 90 interaktiv erteilt werden oder zur Ausführung im Stapelbetrieb in einer Datei enthalten sein. Befehle bestehen aus Einzelwörtern, die durch ein Leerzeichen voneinander getrennt sind. Parameterzuordnungen bestehen aus einem Namen und einem Wert, die durch ein Gleichheitszeichen voneinander getrennt sind. Zum Beispiel zeigt der Befehl:
    ChunkBegin = A*
    einen Einzelbefehl an, der dem Zeichenfolgenparameter ChunkBegin den Wert A* zuordnet. Bei einer bevorzugten Ausführungsart sind alle Befehle und Parameternamen fallunabhängig, wobei dies auf die Parameterwerte jedoch nicht zutrifft. Boolesche Parametern können die Werte „wahr", „falsch", „ja", „nein", „0" oder „1" zugewiesen werden. Wenn ein Boolescher Parameter einen Namen, aber keinen Wert zugewiesen erhält, entspricht dies dem Wert „wahr".
  • Nachdem alle Befehle ausgeführt worden sind oder (durch einen Befehl TRYFIT (GRÖSSE PRÜFEN), siehe unten) festgestellt wurde, dass die Mitteilung beim derzeitigen Verarbeitungsstand die Bedingung der Maximallänge erfüllt, wird der zusammengefasste Text in den Puffer 25 geschrieben. Zuerst wird der wert des Zeichenfolgenparameters ChunkBegin in den Puffer 25 geschrieben. Der Parameter ChunkBegin zeigt den Anfang eines Blocks an, wie er im Puffer 25 erscheint. Bei einer bevorzugten Ausführungsart kann der Parameter ChunkBegin in der der Textzusammenfassungseinheit 90 zur Verfügung stehenden Befehlsfolge geändert werden, so dass der Empfänger der Mitteilung erfährt, wie stark und auf welche Weise das ursprüngliche Dokument zusammengefasst wurde. Wenn festgestellt wird, dass die Blöcke so verarbeitet worden sind, dass sie für die Ausgabe bereit sind, wird jeder Block mit dem Wert des zwischen je zwei Blöcken geschriebenen Zeichenfolgenparameters ChunkSep in den Puffer 25 geschrieben. Bei einer bevorzugten Ausführungsart wird für das ChunkSep-Zeichen ein Leerzeichen („ ") gesetzt. Alternativ können andere Zeichen verwendet oder der Wert durch den Benutzer gesetzt werden. Nachdem alle Blöcke in den Puffer 25 geschrieben worden sind, wird abschließend der Zeichenfolgeparameter ChunkEnd geschrieben. Der Parameter ChunkEnd zeigt das Ende der in dem Puffer 25 erscheinenden Mitteilung an.
  • Bei der bevorzugten Ausführungsart werden sowohl für ChunkBegin als auch für ChunkEnd leere Zeichenfolgen als Standardwerte vorgegeben. Der Standardwert für ChunkSep ist ein einzelnes Leerzeichen. Durch Befehle kann diesen Variablen ein beliebiger Zeichenfolgenwert zugewiesen werden, da der wert jedoch durch Leerzeichen begrenzt wird, darf er kein Leerzeichen enthalten. Der Zeichenfolgenparameter ChunkSep wird einer speziellen Behandlung unterworfen: Die Werte „Leerzeichen", „lf" und „crlf" können zum Anzeigen eines einzelnen Leerzeichens, eines Zeilenvorschubs bzw. eines Zeilenvorschubs mit gleichzeitigem Rücklauf verwendet werden.
  • Die Textzusammenfassungseinheit 90 fungiert wie oben beschrieben gemäß einer Liste von Befehlen, die sie entweder interaktiv über das Befehlsterminal 45 oder über eine Stapeldatei erhält. Die Lehren der vorliegenden Erfindung werden dem Fachmann durch die Beschreibung der einzelnen für die Funktion der Textzusammenfassungseinheit 90 verfügbaren Befehle verständlich. Eine solche Auslistung und Beschreibung der bei der bevorzugten Ausführungsart der vorliegenden Erfindung verfügbaren Befehle folgt nun.
  • Befehl: TEXTONLY (NURTEXT)
  • Dieser Befehl löscht alle Nicht-TEXT-Blöcke aus dem Dokument. Daraus folgt, dass alle nachfolgenden durch die Textzusammenfassungseinheit 90 ausgeführten Operationen mit der Mitteilung nur die verbleibenden TEXT-Blöcke betreffen.
  • Befehl: COUNTWORDS (WÖRTERZÄHLEN)
  • Die Wörter in dem Dokument werden gezählt und die Wichtigkeit jedes Wortes ermittelt. Die Wichtigkeit eines Wortes hängt von einer Anzahl im Folgenden beschriebener Faktoren ab.
  • Befehl: SAVE (SPEICHERN)
  • Dieser Befehl kann zum Speichern des aktuellen Status der Textzusammenfassungseinheit 90 verwendet werden. Die gespeicherte Information beinhaltet die gesamte zusammenzufassende Textinformation (d. h. das Dokument) und die Werte aller gewählten Parameter sowie die Anzahl der Wörter im Text. Außerdem können Wörterverzeichnisse gespeichert werden, die STOP-Wörter (HALT) und/oder INSIGNIFICANT-Wörter anzeigen. Die Information wird gespeichert, indem sie in einem vorbestimmten Format auf einen Stapel geschoben wird. Die Statusinformation SAVEd (GESPEICHERT) kann mittels des nachfolgenden Befehls „RESTORE" (WIEDERHERSTELLEN) wiederhergestellt werden.
  • Befehl: RESTORE (WIEDERHERSTELLEN)
  • Dieser Befehl bewirkt das Löschen des aktuellen Status der Textzusammenfassungseinheit 90 und stellt den Status SAVEd (GESPEICHERT) am oberen Stapelende wieder her. Bei einer bevorzugten Ausführungsart wird der Stapel geöffnet, wenn RESTORE aktiviert wird. Somit kann ein Status SAVEd nur einmal wiederhergestellt werden, obwohl nach dem RESTORE sofort wieder GESPEICHERT werden kann. Wenn der Stapel leer ist, ist der Befehl RESTORE wirkungslos.
  • Befehl: TRYFIT (GRÖSSEPRÜFEN)
  • Dieser Befehl ermittelt, ob das Dokument beim derzeitigen Verarbeitungsstand in den maximal zugewiesenen Speicherplatz passt. Wenn dies der Fall ist, wird das gesamte Dokument in den Ausgabepuffer 25 geschrieben. Zu diesem Zeitpunkt werden alle übrigen Befehle ignoriert. Außerdem kann der zusammengefasste Text nach der Speicherung im Ausgabepuffer 25 durch die Funkübertragungseinheit 80 übertragen werden.
  • Beim Ermitteln, ob das Dokument in den maximal zugewiesenen Speicherplatz passt, berücksichtigt TRYFIT die Zeichenfolgen ChunkBegin, ChunkSep und ChunkEnd. Als Beispiel werde angenommen, dass der Pagerspeicher ebenso wie der Ausgabepuffer 25 80 Zeichen enthält. Da die Mitteilung bei der Übertragung die Zeichenfolgen ChunkBegin, ChunkSep und ChunkEnd enthält, darf der eigentliche Text zusammen mit diesen Zeichenfolgen den Umfang von 80 Zeichen nicht übersteigen. Wenn also beispielsweise eine zusammengefasste Mitteilung eine Zeichenfolge ChunkBegin und 5 Zeichenfolgen ChunkSep enthält, die jeweils ein Einzelzeichen umfassen, verbleiben für den eigentlichen Mitteilungstext nur noch 74 Zeichen. In diesem Fall begrenzt der Befehl TRYFIT den Text auf 74 Zeichen.
  • Befehl: ABBREV (ABKÜRZEN)
  • Dieser Befehl dient dem Abkürzen des Dokumenttextes. Der Prozess wird durch fünf im Folgenden erörterter Parameter gesteuert.
  • Befehl: SORTCHUNKS (BLÖCKESORTIEREN)
  • Wenn dieser Befehl ausgeführt wird, werden die Blöcke des Dokuments entsprechend ihrer Wichtigkeit sortiert. Die Wichtigkeit eines Blocks basiert auf einer Reihe von Faktoren, darunter die Wichtigkeit der Wörter in dem Block, die Anzahl von Wörtern in dem Block sowie die Art und die Position des Blocks. Die Ausführung dieses Befehls wird im Folgenden eingehend beschrieben.
  • Befehl: NOSTOPLIST (KEINEHALTLISTE)
  • Dieser Befehl setzt die Verwendung der STOP-Liste außer Kraft, welche diejenigen Wörter enthält, die durch einen Benutzer oder den Systemadministrator als ständig INSIGNIFICANT eingestuft wurden. Diese Wörter sind von der Berechnung der Wichtigkeit ausgeschlossen, wie im Folgenden erklärt wird. Zu den in der STOP-Liste enthaltenen Wörtern gehören beispielsweise „der", „und" und „von". Die STOP-Liste wird aus einer Datei (vorzugsweise aus der Datei stoplist.txt) gelesen, die eine formlose Liste von STOP-Wörtern enthält.
  • Befehl: NOSIGLIST (KEINEWICHTIGKEITSLISTE)
  • Dieser Befehl setzt die Verwendung der Liste wichtiger Wörter (SIGNIFICANT) außer Kraft, welche diejenigen Wörter enthält, die als ständig wichtig (SIGNIFICANT) angesehen werden. Zu solchen Wörtern gehören beispielsweise „dringend", „wichtig" und „Vorrang". Die Wortliste SIGNIFICANT dient standardmäßig dazu, während der Berechnung der Wichtigkeit die Wichtigkeit dieser Wörter hervorzuheben. Die Wortliste SIGNIFICANT ist vorzugsweise in einer Datei mit der Bezeichnung siglist.txt enthalten, welche eine formlose Liste durch einen Benutzer oder einen Systemadministrator gewählter wichtiger Wörter darstellt.
  • Nachdem die Bedeutung der obigen Befehle bekannt ist, wird nun die Textzusammenfassungseinheit 90 gemäß einer bevorzugten Ausführungsart der vorliegenden Erfindung beschrieben.
  • Zuerst wird wie oben beschrieben ein Dokument verarbeitet, indem es in Blöcke eingeteilt wird. Nach dem Einteilen in Blöcke kann ein Befehl COUNTWORDS (WÖRTERZÄHLEN) ausgeführt werden. Es gibt sechs Kombinationen von Blocktyp/-untertyp, in denen Wörter auftreten können:
    • 1) MAIL HEADER/INSIGNIFICANT
    • 2) MAIL HEADER/INSIGNIFICANT
    • 3) TEXT/FIRST
    • 4) TEXT/LAST
    • 5) TEXT/ONLY
    • 6) TEXT/OTHER
  • Diese Kombinationen stellen alle Blocktypen und -untertypen außer dem Blocktyp PUNCTUATION dar. Somit würde ein Befehl COUNTWORDS alle Blöcke mit einer der obigen sechs Kombinationen von Blocktyp/-untertyp aufteilen. Bei einer bevorzugten Ausführungsart ist ein Befehl TEXTONLY (NURTEXT) enthalten, so dass alle PUNCTUATION-Daten sofort entfernt werden. Da die Blöcke als Reaktion auf den Befehl COUNTWORDS aufgeteilt werden, wird für jedes in dem Dokument auftauchende Wort dessen Wichtigkeit ermittelt. Dies ist, wie später erörtert wird, sowohl für das Ordnen der Blöcke als auch für das Entfernen bestimmter Wörter aus der Mitteilung vor der Übertragung erforderlich.
  • Die Wichtigkeit der Wörter wird anhand der folgenden sechs Parameter ermittelt:
    • 1) cw-FirstInPar;
    • 2) cw-LastInPar;
    • 3) cw-OnlyInPar;
    • 4) cw-OtherInPar;
    • 5) cw-Header; und
    • 6) cw-SigHeader.
  • Jedem der Parameter wird ein Standardwert zugewiesen, obwohl dieser Wert durch einen Benutzer und/oder Systemadministrator geändert werden kann. Bei der bevorzugten Ausführungsart werden die folgenden Standardwerte verwendet:
    cw-FirstInPar = 2;
    cw-LastInPar = 2;
    cw-OnlyInPar = 2;
    cw-OtherInPar = 1;
    cw-Header = 0; und
    cw-SigHeader = 3.
  • Jedes Mal, wenn ein bestimmtes Wort an einer Stelle erscheint, die einem der obigen Parameter entspricht, werden diesem Wort auf Basis des zugeordneten Parameterwerts „Punkte" zugeordnet. Zum Beispiel erhält jedes Mal, wenn das Wort „FOOTBALL" (FUSSBALL) in einem Block erscheint, der der erste Block in einem Absatz ist (FirstInPar), das Wort „FOOTBALL" zwei Punkte (ausgehend von den obigen Standardwerten). Jedes weitere Auftreten des Wortes „FOOTBALL" führt auf Basis seiner Stellung in einem anderen Block zu einigen weiteren Punkten. Der Parameter cw-OtherInPar entspricht Wörtern, die in TEXT-Blöcken vorkommen, welche weder die ersten noch die letzten Sätze in einem Absatz sind. Der Parameter cw-OnlyInPar entspricht Wörtern, die in Blöcken vorkommen, welche den einzigen Satz eines bestimmten Absatzes ausmachen. Der Parameter cw-Header entspricht Wörtern, die in MAIL HEADER/INSIGNIFICANT-Blöcken (SENDEKOPF/UNWESENTLICH) vorkommen. Und schließlich entspricht der Parameter cw-SigHeader Wörtern, die in MAIL HEADER/SIGNIFICANT-Blöcken (SENDEKOPF/WESENTLICH) vorkommen.
  • Nach Summieren aller auf Basis dieser Parameter für ein Wort erhaltenen Punkte wird dieser Gesamtwert mit dem Parameter cw-MinPoints verglichen. Bei der bevorzugten Ausführungsart beträgt der Standardwert für cw-MinPoints 3, obwohl dieser Wert durch einen Benutzer oder Systemadministrator geändert oder auf einen anderen Standardwert gesetzt werden kann. Wenn das Wort den Schwellenwert cw-MinPoints nicht erreicht, wird seiner Wichtigkeit der Wert von cw-InfreqSig zugewiesen. Bei der bevorzugten Ausführungsart ist der Standardwert von cw-InfrequSig gleich 0, obwohl dieser Wert durch einen Benutzer oder Systemadministrator geändert oder auf einen anderen Standardwert gesetzt werden kann. Wenn die Mindestpunktzahl erreicht wurde, wird die den Mindestwert übersteigende Punktzahl mit dem Wert cw-Factor multipliziert und das Ergebnis zu dem Wert cw-BaseValue addiert. Bei der bevorzugten Ausführungsart ist der Standardwert von cw-Factor gleich 1 und der Standardwert von cw-BaseValue gleich 0, obwohl diese Werte durch einen Benutzer oder Systemadministrator geändert oder auf einen anderen Standardwert gesetzt werden können. Der sich aus den obigen Berechnungen ergebende Wert ergibt die Wichtigkeit für dieses Wort.
  • Man beachte, dass der obige Prozess mit diesem Wort nicht durchgeführt wird, wenn sich ein bestimmtes Wort in der STOP-Liste (ständig INSIGNIFICANT) befindet und der Befehl NOSTOPLIST nicht aktiv ist. Wenn der Befehl NOSTOPLIST nicht aktiv ist und ein Wort in der STOP-Liste enthalten ist, wird dem Wort sofort ein Wichtigkeitswert von cw-StopSig zugewiesen. Der Standardwert von cw-StopSig ist vorzugsweise gleich null.
  • Als Nächstes wird der Befehl ABBREV (ABKÜRZEN) erörtert. Dieser Befehl bewirkt wie oben beschrieben, dass der Dokumenttext vor dem Speichern im Puffer 25 abgekürzt wird. Der Prozess wird durch fünf Parameter gesteuert. Der erste Parameter ist ab-UseDict. Wenn dieser Parameter wahr ist (Standardeinstellung), wird aus einer vorzugsweise abbrev.txt genannten Datei eine Abkürzungstabelle gelesen. Jedes Wort des Dokumentes, das in dieser Abkürzungstabelle vorkommt, wird durch die entsprechende in der Tabelle enthaltene Abkürzung ersetzt. Bei einer bevorzugten Ausführungsart enthält jede Zeile von abbrev.txt zwei Wörter. Das erste Wort ist das ursprüngliche Wort und das zweite Wort dessen entsprechende Abkürzung. Bei einer bevorzugten Ausführungsart ersetzt die Textzusammenfassungseinheit 90, wenn der Ersatz vorgenommen wird, das ursprüngliche, nicht abgekürzte Wort durch das Ersatzwort.
  • Ein weiteres wünschenswertes Merkmal der Funktion ABBREV besteht darin, dass Ausdrücke abgekürzt werden können (d. h., eine Abkürzung ersetzt mehr als ein Wort). Zum Beispiel können in der Datei abbrev.txt verschiedene Ausdrücke wie beispielsweise „New York" mit der entsprechenden Abkürzung „NY" enthalten sein.
  • Der zweite Parameter ist ab-DropVowels (Vokale weglassen). Wenn dieser Parameter wahr (nicht der Standardwert) ist, wird jedes Wort, das in der Datei abbrev.txt nicht für eine Abkürzung vorgesehen ist, in der zusammengefassten Mitteilung dadurch abgekürzt, dass alle Vokale aus dem Wort entfernt werden. Der dritte Parameter ist ab-DropFirstVowels (erste Vokale weglassen). Wenn dieser Parameter wahr (nicht der Standardwert) ist, werden Vokale auch dann weggelassen, wenn sie der erste Buchstabe in einem Wort sind, ansonsten bleiben sie erhalten.
  • Der vierte Parameter ist ab-TrimWhite (Leerzeichen reduzieren). Wenn dieser Parameter wahr (der Standardwert) ist, werden mehrere Leerzeichen durch ein einziges Leerzeichen ersetzt. Und schließlich ist der letzte Parameter ab-TrimPunct (Interpunktionsleerzeichen reduzieren). Wenn dieser Parameter wahr (nicht der Standardwert) ist, werden alle Leerzeichen neben Interpunktionszeichen entfernt.
  • Als Nächstes wird der Befehl SORTCHUNKS (Blöcke ordnen) erörtert. Bei einer bevorzugten Ausführungsart werden wie oben erörtert die Blöcke in dem zusammengefassten Dokument gegenüber dem ursprünglichen Dokument nach ihrer Wichtigkeit neu geordnet. Bei einer bevorzugten Ausführungsart wird das zusammengefasste Dokument so geordnet, dass die wichtigsten Blöcke zuerst erscheinen. Die Wichtigkeit der Blöcke wird aus der Gesamtwichtigkeit der in dem Block enthaltenen Wörter, der Anzahl der Wörter in dem Block sowie dem Typ und dem Untertyp des Blocks ermittelt. Wenn ein Block weniger Wörter als sc-MinLength besitzt, wird seine Wichtigkeit auf sc-ShortSig gesetzt. Der bevorzugte Standardwert für sc-MinLength ist 4, und der Standardwert für sc-ShortSig ist 0.
  • Nimmt man an, dass ein Block den Schwellenwert sc-MinLength erreicht, wird seine Wichtigkeit ausgehend von einem Wichtigkeitsgrundwert ermittelt. Der zugewiesene Wichtigkeitsgrundwert wird anhand der Blockposition ermittelt. Der Parameter sc-FirstInPar zeigt einen Block an, der der erste Satz in einem Absatz ist, der Parameter sc-LastInPar zeigt einen Block an, der der letzte Satz in einem Absatz ist, der Parameter sc-OnlyInPar zeigt einen Block an, der der einzige Satz eines Absatzes ist, und der Parameter sc-OtherInPar zeigt einen Block an, der ein „mittlerer" Block in einem Absatz ist. Die Standardwerte für jeden dieser Parameter sind:
    sc-FirstInPar = 0;
    sc-LastInPar = 0;
    sc-OnlyInPar = 0; und
    sc-OtherInPar = 0.
  • Wenn der Befehl COUNTWORDS zuvor ausgeführt worden ist, wird außerdem die Summe der Wichtigkeiten der in dem Block enthaltenen Wörter gebildet und zu dem Wichtigkeitsgrundwert für den Block addiert, um den Wichtigkeitsgesamtwert für den Block zu erhalten. Jeder der Blöcke kann dann in der Reihenfolge der Wichtigkeiten in den Ausgabepuffer 25 verschoben werden.
  • Ein weiteres Merkmal, das im Zusammenfassungsprozess wünschenswert ist, ist die Fähigkeit, bestimmte Wörter ganz zu entfernen (OMIT WORDS). In diesem Fall erscheinen die in einer Datei (z. B. omitwds.txt) enthaltenen zu entfernenden Wörter überhaupt nicht in dem zusammengefassten Text, selbst wenn sie in einem Block vorkommen, der ansonsten wichtig genug ist, dass er in den Ausgabepuffer 25 verschoben wird. Durch Entfernen dieser Wörter kann in dem Ausgabepuffer 25 zusätzlicher Platz für weniger wichtige Blöcke geschaffen werden, die sonst nicht in den Ausgabepuffer 25 kämen.
  • Ein weiteres Merkmal, das in der Textzusammenfassungseinheit 90 realisiert werden kann, sind Klammerausdrücke. Solche Ausdrücke lassen sich verarbeiten, indem man den Gesamtwert für den Block ermittelt, in dem der Klammerausdruck enthalten ist. Dies wird wie oben erörtert erreicht, indem man die Gesamtwichtigkeit aller in dem Block enthaltenen Wörter einschließlich der in dem Klammerausdruck enthaltenen Wörter ermittelt. Dann wird die Gesamtwichtigkeit des Blocks ohne die Wörter in dem Klammerausdruck ermittelt. Es wird ein Differenzschwellenwert festgelegt, und wenn die einzelnen Wichtigkeiten kleiner als der Schwellenwert sind, kann der Klammerausdruck im zusammengefassten Text weggelassen werden, da sich dann kein großer Unterschied ergibt. Wenn jedoch die Differenz der Wichtigkeiten den Schwellenwert erreicht oder übersteigt, bleibt der Klammerausdruck erhalten.
  • In den 4(a), 4(b) und 4(c) sind Beispiele von Befehlssätzen angegeben, und die durch die Textzusammenfassungseinheit auf Basis der Befehlssätze ausgeführte Verarbeitung wird beschrieben.
  • Figure 00430001
  • Der Befehl TEXTONLY (NURTEXT) wird zum Entfernen aller Sendeköpfe und Interpunktionszeilen verwendet. Nach dessen Ausführung ermittelt der Befehl TRYFIT, ob das Dokument kurz genug ist. Man beachte, dass es keine Rolle spielt, ob das Dokument bereits mit den Sendeköpfen kurz genug war; die Länge wird erst nach dem Entfernen der Sendeköpfe geprüft. Als Nächstes werden die Parameter ab-trimwhite und ab-trimpunct auf wahr gesetzt, um die Vorbereitung für den späteren Befehl ABBREV zu treffen.
  • Der Befehl SAVE speichert alle Statusinformationen bis zum nächsten Befehl RESTORE. Er wird hier verwendet, da es wünschenswert ist zu versuchen, das Dokument abzukürzen, bevor die Blöcke anhand deren Wichtigkeit neu geordnet werden. Die Befehle SAVE und RESTORE ermöglichen, das Dokument abzukürzen und dennoch in den nicht abgekürzten Zustand zurückzukehren, wenn sich herausstellt, dass das Dokument trotz des Abkürzens nicht in den erforderlichen Speicherplatz passt. Man kann nicht ohne Verwendung der Befehle SAVE und RESTORE abkürzen und die Wichtigkeiten berechnen, da die abgekürzten Wörter wahrscheinlich nicht richtig erkannt werden, wenn die Berechnung der Wichtigkeit erneut durchgeführt wird.
  • ChunkBegin wird auf a* (für „nur abgekürzt") gesetzt, so dass der übertragene Text als Zeichen für den Empfänger des Dokuments am Anfang durch ein „a*" markiert wird, wenn das Abkürzen ausreicht, dass das Dokument in den Speicherplatz passt. Wenn das Abkürzen allein nicht ausreicht, wird ChunkBegin später auf „s*" gesetzt, um anzuzeigen, dass der Text entsprechend der Wichtigkeit geordnet und ausgewählt wurde. Wenn man mit den wichtigsten Blöcken beginnt und mit den weniger wichtigen Blöcken fortfährt, kann es somit vorkommen, dass einige der weniger wichtigen Blöcke von der Übertragung ausgeschlossen werden, wenn der Puffer 25 mit wichtigeren Blöcken gefüllt wird.
  • Der Befehl ABBREV kürzt dann den Text ab, und der Befehl TRYFIT prüft, ob das Dokument jetzt kurz genug ist. Wenn dies der Fall ist, schreibt die Textzusammenfassungseinheit 90 den Text in den Puffer 25, und die Mitteilung wird durch die Funkübertragungseinheit 80 übertragen. Ansonsten setzt die Textzusammenfassungseinheit 90 ihre Arbeit mit dem Befehl RESTORE fort, der auf den früheren Status SAVE, das heißt vor dem Abkürzen, zurücksetzt.
  • ChunkBegin wird auf „s*" gesetzt, um anzuzeigen, dass das Ordnen und Auswählen erfolgt ist, und ChunkSep wird in eine Befehlskette eingebunden, um dem Empfänger der Mitteilung ferner anzuzeigen, dass Teile der Mitteilung neu geordnet worden sind. Dann wird der Befehl COUNTWORDS ausgeführt, um die Wichtigkeit der Wörter und Blöcke zu berechnen, und dann wird der Text anhand der Wichtigkeit der Blöcke neu geordnet. Abschließend wird der Text durch den Befehl ABBREV ein wenig verkleinert, und die Ausführung der Befehle wird abgeschlossen. Die Textzusammenfassungseinheit 90 schreibt dann den Text, sofern er für die Übertragung durch die Funkübertragungseinheit 80 geeignet ist, in den Puffer 25.
  • Durch eine alternative bevorzugte Ausführungsart ist auch eine noch weitere Komprimierung des Dokumentgröße möglich. Bei einer solchen alternativen bevorzugten Ausführungsart werden alle oben beschriebenen Verarbeitungsschritte durchgeführt. Insbesondere können das Abkürzen, das Neuordnen der Blöcke und das Entfernen der Sendeköpfe durchgeführt werden. Außerdem wird bei dieser alternativen bevorzugten Ausführungsart eine zusätzliche Komprimierung des Dokuments erreicht, indem ausgewählte Wörter aus dem Dokument entfernt werden. Dies kann entweder vor oder nach dem obigen Prozess geschehen. Zum Beispiel können vor dem Abkürzungsschritt und/oder vor dem Neuordnen der Blöcke relativ unbedeutende Wörter entfernt werden. Alternativ können nach dem Abkürzungsschritt und/oder vor dem Neuordnen der Blöcke relativ unbedeutende Wörter entfernt werden.
  • Bei dieser Ausführungsart wird der Befehl COUNTWORDS zu einem wünschenswerten Zeitpunkt innerhalb des Befehlsscripts ausgeführt. Die Ausführung des Befehls COUNTWORDS hat so zu erfolgen, dass jedem Wort in dem Dokument ein Wichtigkeitswert zugewiesen werden kann. Wenn dies erfolgt ist, können Wörter mit einem Wichtigkeitswert unterhalb eines bestimmten vorgegebenen Schwellenwertes aus der zusammengefassten Mitteilung entfernt werden. Wenn das Neuordnen der Blöcke vor dem Entfernen von Wörtern erfolgt, können Wörter während der Entfernungsphase auf Basis ihrer relativ hohen Wichtigkeit ausgewählt werden, damit sie in der zusammengefassten Mitteilung verbleiben. Wenn zum Beispiel der verfügbare Speicherplatz 80 Zeichen umfasst und nach dem Neuordnen der Blöcke (und eventuell nach dem Abkürzungsschritt) alle Wörter 90 Zeichen umfassen, können anstelle des unwichtigsten Blocks Wörter bis zu einem Umfang von insgesamt zehn Zeichen aus der Mitteilung entfernt werden. Die entfernten Wörter können von mehreren Blöcken stammen. Durch Entfernen der unwichtigen Wörter kann es sich erübrigen, den unwichtigsten Block insgesamt zu entfernen.
  • Die Erfindung ist in Verbindung mit den bevorzugten Ausführungsarten eingehend beschrieben worden. Diese Ausführungsarten stellen jedoch lediglich ein Beispiel dar, und die Erfindung ist nicht darauf beschränkt. Dem Fachmann ist klar, dass im Rahmen des durch die beigefügten Ansprüche definierten Geltungsbereichs der vorliegenden Erfindung weitere Abwandlungen und Änderungen einfach vorgenommen werden können.

Claims (3)

  1. Pagingsystem (50), welches Folgendes umfasst: eine Eingabequelle (10) zum Empfangen von Textinformationen, wobei die Textinformationen eine Vielzahl von Wörtern enthalten; einen funktionell mit der Eingabequelle (10) verbundenen Speicher (40) zum Speichern der empfangenen Textinformationen; dadurch gekennzeichnet, dass das Pagingsystem ferner Folgendes umfasst: eine mit dem Speicher und einem Textzusammenfassungsmittel (90) kommunizierende Steuereinheit (70) zur Steuerung der Funktion des Pagingsystems; einen Ausgabepuffer (25) zum Speichern der zusammengefassten Textinformationen; ein Textzusammenfassungsmittel zum Zusammenfassen der empfangenen Textinformationen, wobei dieses Textzusammenfassungsmittel ferner Folgendes umfasst: ein Teilungsmittel zum Aufteilen der empfangenen Textinformationen in Blöcke; ein Mittel zum Klassifizieren jedes Blocks nach einer oder mehreren Klassifikationen entsprechend der Stellung dieses Blocks innerhalb der empfangenen Textinformationen; ein Mittel zum Zuweisen eines Wichtigkeitswertes für jedes Wort entsprechend der Klassifikation des ein solches Wort enthaltenden Blocks; ein Mittel zum Zuweisen eines Wichtigkeitswertes für jedes der Wörter entsprechend dem Klassifikationswert des jedes der Wörter enthaltenden Blocks; ein Mittel zum Zuweisen eines Wichtigkeitswertes für jeden der Blöcke entsprechend den gemeinsamen Wichtigkeitswerten der in jedem der Blöcke enthaltenen Wörter; ein Auswahlmittel zum Auswählen der Blöcke in der Reihenfolge der den Blöcken zugewiesenen Wichtigkeitswerte, wobei die Blöcke beginnend bei dem Block mit dem höchsten Wichtigkeitswert bis zu dem Block mit dem niedrigsten Wichtigkeitswert so lange zum Speichern im Ausgabepuffer ausgewählt werden, bis man eine Textinformation einer vorgegebenen maximalen Länge erhält; und ein Mittel zum Schreiben der ausgewählten Blöcke in den Ausgabepufferspeicher.
  2. Pagingsystem (50) nach Anspruch 1, welches ferner eine HF-Sendeeinheit (80) zum Senden der zusammengefassten Textinformationen und einen Pagingempfänger (130) zum Empfangen der zusammengefassten Textinformationen umfasst.
  3. Pagingsystem (50) nach Anspruch 1 oder 2, bei welchem der Wichtigkeitswert jedes Blocks ferner entsprechend der Stellung dieses Blocks in der jeweils empfangenen Textinformation ermittelt wird.
DE69633639T 1995-08-14 1996-08-14 Rufsystem mit automatischer Zusammenfassung von Texten Expired - Lifetime DE69633639T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/514,809 US5691708A (en) 1995-08-14 1995-08-14 Text abstraction method and apparatus
US514809 1995-08-14

Publications (2)

Publication Number Publication Date
DE69633639D1 DE69633639D1 (de) 2004-11-18
DE69633639T2 true DE69633639T2 (de) 2005-10-20

Family

ID=24048786

Family Applications (2)

Application Number Title Priority Date Filing Date
DE69626271T Expired - Lifetime DE69626271T2 (de) 1995-08-14 1996-08-14 Verfahren und gerät zum automatischen zusammenfassen von texten
DE69633639T Expired - Lifetime DE69633639T2 (de) 1995-08-14 1996-08-14 Rufsystem mit automatischer Zusammenfassung von Texten

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE69626271T Expired - Lifetime DE69626271T2 (de) 1995-08-14 1996-08-14 Verfahren und gerät zum automatischen zusammenfassen von texten

Country Status (6)

Country Link
US (1) US5691708A (de)
EP (2) EP0915438B1 (de)
KR (1) KR100530709B1 (de)
AT (2) ATE233003T1 (de)
DE (2) DE69626271T2 (de)
WO (1) WO1997007469A2 (de)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998053624A1 (en) * 1997-05-22 1998-11-26 Seiko Communications Of America, Inc. Electronic mail notification and access
JP4214598B2 (ja) * 1998-04-02 2009-01-28 ソニー株式会社 文書処理方法および装置ならびに記録媒体
US7168039B2 (en) * 1998-06-02 2007-01-23 International Business Machines Corporation Method and system for reducing the horizontal space required for displaying a column containing text data
US6249675B1 (en) 1998-08-07 2001-06-19 At&T Corporation Method and apparatus for network paging
US6279018B1 (en) 1998-12-21 2001-08-21 Kudrollis Software Inventions Pvt. Ltd. Abbreviating and compacting text to cope with display space constraint in computer software
US7475343B1 (en) * 1999-05-11 2009-01-06 Mielenhausen Thomas C Data processing apparatus and method for converting words to abbreviations, converting abbreviations to words, and selecting abbreviations for insertion into text
US6772346B1 (en) * 1999-07-16 2004-08-03 International Business Machines Corporation System and method for managing files in a distributed system using filtering
US20060288298A1 (en) * 1999-08-12 2006-12-21 Robert Haitani System, method and technique for enabling users to interact with address fields of messaging applications
US6452597B1 (en) * 1999-08-24 2002-09-17 Microsoft Corporation Displaying text on a limited-area display surface
JP2002041404A (ja) * 2000-07-24 2002-02-08 Canon Inc 情報提供システム及び装置とその方法
JP4521943B2 (ja) * 2000-07-24 2010-08-11 キヤノン株式会社 情報提供装置及び情報提供方法、コンピュータ読み取り可能な記憶媒体
JP4536225B2 (ja) * 2000-07-28 2010-09-01 富士通株式会社 メッセージ送受信システムにおけるキーワードとその重要度の動的決定
US20020087985A1 (en) * 2000-12-01 2002-07-04 Yakov Kamen Methods and apparatuses for displaying meaningful abbreviated program titles
GB0107772D0 (en) * 2001-03-28 2001-05-16 Hewlett Packard Co Improvements relating to data delivery
US8001465B2 (en) * 2001-06-26 2011-08-16 Kudrollis Software Inventions Pvt. Ltd. Compacting an information array display to cope with two dimensional display space constraint
KR100435442B1 (ko) * 2001-11-13 2004-06-10 주식회사 포스코 문서 요약 방법 및 시스템
US7315902B2 (en) * 2002-12-19 2008-01-01 International Business Machines Corporation Compression and abbreviation for fixed length messaging
JP4236630B2 (ja) * 2004-11-30 2009-03-11 三洋電機株式会社 コンテンツデータ記録媒体
KR100834293B1 (ko) * 2006-11-06 2008-05-30 엔에이치엔(주) 문서 처리 시스템 및 방법
US8458252B2 (en) * 2006-12-15 2013-06-04 International Business Machines Corporation Minimizing the time required to initiate and terminate an instant messaging session
CN101286154B (zh) * 2007-04-09 2016-08-10 谷歌股份有限公司 输入法编辑器用户档案
CN104605970A (zh) 2008-05-29 2015-05-13 瑞思迈有限公司 医用头带
US20100145676A1 (en) * 2008-12-09 2010-06-10 Qualcomm Incorporated Method and apparatus for adjusting the length of text strings to fit display sizes
US20110313756A1 (en) * 2010-06-21 2011-12-22 Connor Robert A Text sizer (TM)
KR101766484B1 (ko) * 2011-06-17 2017-08-09 네이버 주식회사 청크를 이용한 메일 관리 방법 및 장치
US8972512B2 (en) * 2011-09-30 2015-03-03 Mail Bypass, Inc. Message delivery systems and methods
WO2015133714A1 (ko) * 2014-03-07 2015-09-11 에스케이플래닛 주식회사 메시지 전송 방법, 이를 위한 장치 및 시스템
US11327640B2 (en) 2015-06-05 2022-05-10 Apple Inc. Providing complications on an electronic device
US10572571B2 (en) * 2015-06-05 2020-02-25 Apple Inc. API for specifying display of complication on an electronic watch
US10175866B2 (en) 2015-06-05 2019-01-08 Apple Inc. Providing complications on an electronic watch
US11115359B2 (en) 2016-11-03 2021-09-07 Samsung Electronics Co., Ltd. Method and apparatus for importance filtering a plurality of messages
US11188710B2 (en) * 2016-12-30 2021-11-30 Dropbox, Inc. Inline content item editor commands
US20190065446A1 (en) * 2017-08-22 2019-02-28 Microsoft Technology Licensing, Llc Reducing text length while preserving meaning

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4713808A (en) * 1985-11-27 1987-12-15 A T & E Corporation Watch pager system and communication protocol
CA1306290C (en) * 1988-09-20 1992-08-11 Kazuhiro Shimura Selective paging system and paging receiver therefor
JP2783558B2 (ja) * 1988-09-30 1998-08-06 株式会社東芝 要約生成方法および要約生成装置
JP2676554B2 (ja) * 1989-07-10 1997-11-17 ティーオーエー株式会社 短縮機能付きポケット・ページャ
US4955066A (en) * 1989-10-13 1990-09-04 Microsoft Corporation Compressing and decompressing text files
US5258739A (en) * 1989-11-09 1993-11-02 Motorola, Inc. Efficient message storage within a selective call receiver
US5257307A (en) * 1990-02-07 1993-10-26 Sharp Kabushiki Kaisha Radio pager system which transmits secret coded messages from a caller to a pager terminal apparatus
US5367452A (en) * 1990-10-05 1994-11-22 Carts Of Colorado, Inc. Mobile merchandising business management system which provides comprehensive support services for transportable business operations
JP2827630B2 (ja) * 1991-10-24 1998-11-25 日本電気株式会社 選択呼出受信機
US5396228A (en) * 1992-01-16 1995-03-07 Mobile Telecommunications Technologies Methods and apparatus for compressing and decompressing paging data
JP2682407B2 (ja) * 1993-10-22 1997-11-26 日本電気株式会社 ページングシステム制御装置

Also Published As

Publication number Publication date
EP0786116A2 (de) 1997-07-30
EP0915438B1 (de) 2004-10-13
US5691708A (en) 1997-11-25
KR970707499A (ko) 1997-12-01
DE69626271T2 (de) 2003-10-30
ATE233003T1 (de) 2003-03-15
EP0786116B1 (de) 2003-02-19
EP0915438A3 (de) 2000-04-05
KR100530709B1 (ko) 2006-01-27
EP0915438A2 (de) 1999-05-12
WO1997007469A2 (en) 1997-02-27
ATE279752T1 (de) 2004-10-15
DE69633639D1 (de) 2004-11-18
DE69626271D1 (de) 2003-03-27
WO1997007469A3 (en) 1997-05-15

Similar Documents

Publication Publication Date Title
DE69633639T2 (de) Rufsystem mit automatischer Zusammenfassung von Texten
DE68924525T2 (de) Gemeinschaftsobjektszustandsanzeige.
DE69531577T2 (de) Verfahren in einem Druckersystem, um Pakete einschliesslich Vielfach-Dokumente zu erzeugen und zu verwalten
DE69031384T2 (de) Vorrichtung zur umsetzung von text eines graphischen faksimilebildes in sprache
DE10064627B4 (de) Verfahren und System für die Verarbeitung von E-Mail-Nachrichten in einem Datenübertragungssystem
EP1113420B1 (de) Verfahren zur Spracherkennung und Kontrolle einer Sprachsyntheseneinheit oder Kommunikationssystem
DE69025117T2 (de) Benutzer wählbares elektronisches Postverwaltungsverfahren
DE69724360T2 (de) Methode und System zur Erleichterung der Informationsanzeige an einen Rechnerbenutzer
EP0056948B1 (de) Bürokommunikationssystem
DE60217241T2 (de) Fokussierte Sprachmodelle zur Verbesserung der Spracheingabe von strukturierten Dokumenten
DE69216130T2 (de) Verfahren und Vorrichtung zur verbesserten Verteilung von elektronischen Mitteilungen
DE68927396T2 (de) Schriftzeichendaten-Steuerung
DE68924403T2 (de) Einschränkung von elektronischem Mitteilungsverkehr.
DE69906604T2 (de) Rechnersystem und Verfahren zur Zuordnung von Speicherraum zu Kommunikationsportpuffern
DE60219992T2 (de) Verfahren und Vorrichtung zur Multimedianachrichtenübertragung
DE60314251T2 (de) Verfahren zur veränderung des inhalts von einer zwischen zwei telefonen ausgetauschten nachricht
DE60126896T2 (de) Verfahren zur anzeige von informationen auf einem endgerät mit geringem anzeigevermögen
DE60107964T2 (de) Vorrichtung zur kodierung und dekodierung von strukturierten dokumenten
DE3129760A1 (de) Terminal mit tastenfeld und anzeigeeinrichtungen zur verbindung mit einem rechner, insbesondere ueber telefonleitungen
DE19730112A1 (de) Empfangs- und Speichervorrichtung für Übertragungseinheiten
DE3727756A1 (de) Verfahren zum aufbereiten von kennsignalen
DE19621768B4 (de) Telefon mit Aufnahmevorrichtung für eine Telefonspeicherkarte und Verfahren zum Übertragen von Daten einer Telefonspeicherkarte
DE10340587A1 (de) System und Verfahren zum Verarbeiten von Information und Daten in Mobiltelefonen
DE202017105979U1 (de) Systeme und Computerprogrammprodukte zur Handhabung von Formalität in Übersetzungen von Text
EP1246100A2 (de) Verfahren, Vorrichtung und E-Mailserver zum Erkennen einer unerwünschten E-Mail

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)
8328 Change in the person/name/address of the agent

Representative=s name: DUSCHER, R., DIPL.-PHYS. DR.RER.NAT., PAT.-ANW., 7